avcodecmap: Add mapping for Opus audio decoder
[platform/upstream/gst-libav.git] / ext / libav / gstavcodecmap.c
1 /* GStreamer
2  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
3  * This file:
4  * Copyright (c) 2002-2004 Ronald Bultje <rbultje@ronald.bitfreak.net>
5  *
6  * This library is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Library General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Library General Public License for more details.
15  *
16  * You should have received a copy of the GNU Library General Public
17  * License along with this library; if not, write to the
18  * Free Software Foundation, Inc., 51 Franklin St, Fifth Floor,
19  * Boston, MA 02110-1301, USA.
20  */
21
22 #ifdef HAVE_CONFIG_H
23 #include "config.h"
24 #endif
25
26 #include <string.h>
27
28 #include <gst/gst.h>
29 #include <libavcodec/avcodec.h>
30 #include <libavutil/channel_layout.h>
31
32 #include "gstav.h"
33 #include "gstavcodecmap.h"
34
35 #include <gst/video/video.h>
36 #include <gst/audio/audio.h>
37 #include <gst/pbutils/codec-utils.h>
38
39 /* IMPORTANT: Keep this sorted by the ffmpeg channel masks */
40 static const struct
41 {
42   guint64 ff;
43   GstAudioChannelPosition gst;
44 } _ff_to_gst_layout[] = {
45   {
46   AV_CH_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
47   AV_CH_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}, {
48   AV_CH_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_CENTER}, {
49   AV_CH_LOW_FREQUENCY, GST_AUDIO_CHANNEL_POSITION_LFE1}, {
50   AV_CH_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_REAR_LEFT}, {
51   AV_CH_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_REAR_RIGHT}, {
52   AV_CH_FRONT_LEFT_OF_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT_OF_CENTER}, {
53   AV_CH_FRONT_RIGHT_OF_CENTER,
54         GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT_OF_CENTER}, {
55   AV_CH_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_REAR_CENTER}, {
56   AV_CH_SIDE_LEFT, GST_AUDIO_CHANNEL_POSITION_SIDE_LEFT}, {
57   AV_CH_SIDE_RIGHT, GST_AUDIO_CHANNEL_POSITION_SIDE_RIGHT}, {
58   AV_CH_TOP_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_CENTER}, {
59   AV_CH_TOP_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_LEFT}, {
60   AV_CH_TOP_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_CENTER}, {
61   AV_CH_TOP_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_RIGHT}, {
62   AV_CH_TOP_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_LEFT}, {
63   AV_CH_TOP_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_CENTER}, {
64   AV_CH_TOP_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_RIGHT}, {
65   AV_CH_STEREO_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
66   AV_CH_STEREO_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}
67 };
68
69 GType
70 gst_ffmpeg_compliance_get_type (void)
71 {
72   static GType ffmpeg_compliance_type = 0;
73   static const GEnumValue compliance_types[] = {
74     {GST_FFMPEG_VERY_STRICT, "Strictly conform to older spec",
75         "verystrict"},
76     {GST_FFMPEG_STRICT, "Strictly conform to current spec", "strict"},
77     {GST_FFMPEG_NORMAL, "Normal behavior", "normal"},
78     {GST_FFMPEG_UNOFFICIAL, "Allow unofficial extensions", "unofficial"},
79     {GST_FFMPEG_EXPERIMENTAL, "Allow nonstandardized experimental things",
80         "experimental"},
81     {0, NULL, NULL}
82   };
83
84   if (!ffmpeg_compliance_type) {
85     ffmpeg_compliance_type =
86         g_enum_register_static ("GstFFMpegCompliance", compliance_types);
87   }
88   return ffmpeg_compliance_type;
89 }
90
91 static guint64
92 gst_ffmpeg_channel_positions_to_layout (GstAudioChannelPosition * pos,
93     gint channels)
94 {
95   gint i, j;
96   guint64 ret = 0;
97   gint channels_found = 0;
98
99   if (!pos)
100     return 0;
101
102   if (channels == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
103     return AV_CH_LAYOUT_MONO;
104
105   for (i = 0; i < channels; i++) {
106     for (j = 0; j < G_N_ELEMENTS (_ff_to_gst_layout); j++) {
107       if (_ff_to_gst_layout[j].gst == pos[i]) {
108         ret |= _ff_to_gst_layout[j].ff;
109         channels_found++;
110         break;
111       }
112     }
113   }
114
115   if (channels_found != channels)
116     return 0;
117   return ret;
118 }
119
120 gboolean
121 gst_ffmpeg_channel_layout_to_gst (guint64 channel_layout, gint channels,
122     GstAudioChannelPosition * pos)
123 {
124   guint nchannels = 0;
125   gboolean none_layout = FALSE;
126
127   if (channel_layout == 0) {
128     nchannels = channels;
129     none_layout = TRUE;
130   } else {
131     guint i, j;
132
133     /* Special path for mono, as AV_CH_LAYOUT_MONO is the same
134      * as FRONT_CENTER but we distinguish between the two in
135      * GStreamer
136      */
137     if (channels == 1 && channel_layout == AV_CH_LAYOUT_MONO) {
138       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
139       return TRUE;
140     }
141
142     for (i = 0; i < 64; i++) {
143       if ((channel_layout & (G_GUINT64_CONSTANT (1) << i)) != 0) {
144         nchannels++;
145       }
146     }
147
148     if (nchannels != channels) {
149       GST_ERROR ("Number of channels is different (%u != %u)", channels,
150           nchannels);
151       nchannels = channels;
152       none_layout = TRUE;
153     } else {
154
155       for (i = 0, j = 0; i < G_N_ELEMENTS (_ff_to_gst_layout); i++) {
156         if ((channel_layout & _ff_to_gst_layout[i].ff) != 0) {
157           pos[j++] = _ff_to_gst_layout[i].gst;
158
159           if (_ff_to_gst_layout[i].gst == GST_AUDIO_CHANNEL_POSITION_NONE)
160             none_layout = TRUE;
161         }
162       }
163
164       if (j != nchannels) {
165         GST_WARNING
166             ("Unknown channels in channel layout - assuming NONE layout");
167         none_layout = TRUE;
168       }
169     }
170   }
171
172   if (!none_layout
173       && !gst_audio_check_valid_channel_positions (pos, nchannels, FALSE)) {
174     GST_ERROR ("Invalid channel layout %" G_GUINT64_FORMAT
175         " - assuming NONE layout", channel_layout);
176     none_layout = TRUE;
177   }
178
179   if (none_layout) {
180     if (nchannels == 1) {
181       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
182     } else if (nchannels == 2) {
183       pos[0] = GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT;
184       pos[1] = GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT;
185     } else {
186       guint i;
187
188       for (i = 0; i < nchannels; i++)
189         pos[i] = GST_AUDIO_CHANNEL_POSITION_NONE;
190     }
191   }
192
193   return TRUE;
194 }
195
196 static gboolean
197 _gst_value_list_contains (const GValue * list, const GValue * value)
198 {
199   guint i, n;
200   const GValue *tmp;
201
202   n = gst_value_list_get_size (list);
203   for (i = 0; i < n; i++) {
204     tmp = gst_value_list_get_value (list, i);
205     if (gst_value_compare (value, tmp) == GST_VALUE_EQUAL)
206       return TRUE;
207   }
208
209   return FALSE;
210 }
211
212 static void
213 gst_ffmpeg_video_set_pix_fmts (GstCaps * caps, const enum AVPixelFormat *fmts)
214 {
215   GValue va = { 0, };
216   GValue v = { 0, };
217   GstVideoFormat format;
218
219   if (!fmts || fmts[0] == -1) {
220     gint i;
221
222     g_value_init (&va, GST_TYPE_LIST);
223     g_value_init (&v, G_TYPE_STRING);
224     for (i = 0; i <= AV_PIX_FMT_NB; i++) {
225       format = gst_ffmpeg_pixfmt_to_videoformat (i);
226       if (format == GST_VIDEO_FORMAT_UNKNOWN)
227         continue;
228       g_value_set_string (&v, gst_video_format_to_string (format));
229       gst_value_list_append_value (&va, &v);
230     }
231     gst_caps_set_value (caps, "format", &va);
232     g_value_unset (&v);
233     g_value_unset (&va);
234     return;
235   }
236
237   /* Only a single format */
238   g_value_init (&va, GST_TYPE_LIST);
239   g_value_init (&v, G_TYPE_STRING);
240   while (*fmts != -1) {
241     format = gst_ffmpeg_pixfmt_to_videoformat (*fmts);
242     if (format != GST_VIDEO_FORMAT_UNKNOWN) {
243       g_value_set_string (&v, gst_video_format_to_string (format));
244       /* Only append values we don't have yet */
245       if (!_gst_value_list_contains (&va, &v))
246         gst_value_list_append_value (&va, &v);
247     }
248     fmts++;
249   }
250   if (gst_value_list_get_size (&va) == 1) {
251     /* The single value is still in v */
252     gst_caps_set_value (caps, "format", &v);
253   } else if (gst_value_list_get_size (&va) > 1) {
254     gst_caps_set_value (caps, "format", &va);
255   }
256   g_value_unset (&v);
257   g_value_unset (&va);
258 }
259
260 /* this macro makes a caps width fixed or unfixed width/height
261  * properties depending on whether we've got a context.
262  *
263  * See below for why we use this.
264  *
265  * We should actually do this stuff at the end, like in riff-media.c,
266  * but I'm too lazy today. Maybe later.
267  */
268 static GstCaps *
269 gst_ff_vid_caps_new (AVCodecContext * context, AVCodec * codec,
270     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
271     const char *fieldname, ...)
272 {
273   GstCaps *caps = NULL;
274   va_list var_args;
275   gint i;
276
277   GST_LOG ("context:%p, codec_id:%d, mimetype:%s", context, codec_id, mimetype);
278
279   /* fixed, non probing context */
280   if (context != NULL && context->width != -1) {
281     gint num, denom;
282
283     caps = gst_caps_new_simple (mimetype,
284         "width", G_TYPE_INT, context->width,
285         "height", G_TYPE_INT, context->height, NULL);
286
287     num = context->time_base.den / context->ticks_per_frame;
288     denom = context->time_base.num;
289
290     if (!denom) {
291       GST_LOG ("invalid framerate: %d/0, -> %d/1", num, num);
292       denom = 1;
293     }
294     if (gst_util_fraction_compare (num, denom, 1000, 1) > 0) {
295       GST_LOG ("excessive framerate: %d/%d, -> 0/1", num, denom);
296       num = 0;
297       denom = 1;
298     }
299     GST_LOG ("setting framerate: %d/%d", num, denom);
300     gst_caps_set_simple (caps,
301         "framerate", GST_TYPE_FRACTION, num, denom, NULL);
302   } else if (encode) {
303     /* so we are after restricted caps in this case */
304     switch (codec_id) {
305       case AV_CODEC_ID_H261:
306       {
307         caps = gst_caps_new_simple (mimetype,
308             "width", G_TYPE_INT, 352,
309             "height", G_TYPE_INT, 288,
310             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
311         gst_caps_append (caps, gst_caps_new_simple (mimetype,
312                 "width", G_TYPE_INT, 176,
313                 "height", G_TYPE_INT, 144,
314                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
315         break;
316       }
317       case AV_CODEC_ID_H263:
318       {
319         /* 128x96, 176x144, 352x288, 704x576, and 1408x1152. slightly reordered
320          * because we want automatic negotiation to go as close to 320x240 as
321          * possible. */
322         const static gint widths[] = { 352, 704, 176, 1408, 128 };
323         const static gint heights[] = { 288, 576, 144, 1152, 96 };
324         GstCaps *temp;
325         gint n_sizes = G_N_ELEMENTS (widths);
326
327         caps = gst_caps_new_empty ();
328         for (i = 0; i < n_sizes; i++) {
329           temp = gst_caps_new_simple (mimetype,
330               "width", G_TYPE_INT, widths[i],
331               "height", G_TYPE_INT, heights[i],
332               "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
333
334           gst_caps_append (caps, temp);
335         }
336         break;
337       }
338       case AV_CODEC_ID_DVVIDEO:
339       {
340         static struct
341         {
342           const gchar *csp;
343           gint width, height;
344           gint par_n, par_d;
345           gint framerate_n, framerate_d;
346         } profiles[] = {
347           {
348           "Y41B", 720, 480, 8, 9, 30000, 1001}, {
349           "Y41B", 720, 480, 32, 27, 30000, 1001}, {
350           "Y42B", 720, 480, 8, 9, 30000, 1001}, {
351           "Y42B", 720, 480, 32, 27, 30000, 1001}, {
352           "I420", 720, 576, 16, 15, 25, 1}, {
353           "I420", 720, 576, 64, 45, 25, 1}, {
354           "Y41B", 720, 576, 16, 15, 25, 1}, {
355           "Y41B", 720, 576, 64, 45, 25, 1}, {
356           "Y42B", 720, 576, 16, 15, 25, 1}, {
357           "Y42B", 720, 576, 64, 45, 25, 1}, {
358           "Y42B", 1280, 1080, 1, 1, 30000, 1001}, {
359           "Y42B", 1280, 1080, 3, 2, 30000, 1001}, {
360           "Y42B", 1440, 1080, 1, 1, 25, 1}, {
361           "Y42B", 1440, 1080, 4, 3, 25, 1}, {
362           "Y42B", 960, 720, 1, 1, 60000, 1001}, {
363           "Y42B", 960, 720, 4, 3, 60000, 1001}, {
364           "Y42B", 960, 720, 1, 1, 50, 1}, {
365         "Y42B", 960, 720, 4, 3, 50, 1},};
366         GstCaps *temp;
367         gint n_sizes = G_N_ELEMENTS (profiles);
368
369         if (strcmp (mimetype, "video/x-raw") == 0) {
370           caps = gst_caps_new_empty ();
371           for (i = 0; i < n_sizes; i++) {
372             temp = gst_caps_new_simple (mimetype,
373                 "format", G_TYPE_STRING, profiles[i].csp,
374                 "width", G_TYPE_INT, profiles[i].width,
375                 "height", G_TYPE_INT, profiles[i].height,
376                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
377                 profiles[i].framerate_d, "pixel-aspect-ratio",
378                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
379
380             gst_caps_append (caps, temp);
381           }
382         } else {
383           caps = gst_caps_new_empty ();
384           for (i = 0; i < n_sizes; i++) {
385             temp = gst_caps_new_simple (mimetype,
386                 "width", G_TYPE_INT, profiles[i].width,
387                 "height", G_TYPE_INT, profiles[i].height,
388                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
389                 profiles[i].framerate_d, "pixel-aspect-ratio",
390                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
391
392             gst_caps_append (caps, temp);
393           }
394         }
395         break;
396       }
397       case AV_CODEC_ID_DNXHD:
398       {
399         caps = gst_caps_new_simple (mimetype,
400             "width", G_TYPE_INT, 1920,
401             "height", G_TYPE_INT, 1080,
402             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
403         gst_caps_append (caps, gst_caps_new_simple (mimetype,
404                 "width", G_TYPE_INT, 1280,
405                 "height", G_TYPE_INT, 720,
406                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
407         break;
408       }
409       default:
410       {
411         if (codec && codec->supported_framerates
412             && codec->supported_framerates[0].num != 0
413             && codec->supported_framerates[0].den != 0) {
414           GValue va = { 0, };
415           GValue v = { 0, };
416           const AVRational *rates = codec->supported_framerates;
417
418           if (rates[1].num == 0 && rates[1].den == 0) {
419             caps =
420                 gst_caps_new_simple (mimetype, "framerate", GST_TYPE_FRACTION,
421                 rates[0].num, rates[0].den, NULL);
422           } else {
423             g_value_init (&va, GST_TYPE_LIST);
424             g_value_init (&v, GST_TYPE_FRACTION);
425
426             while (rates->num != 0 && rates->den != 0) {
427               gst_value_set_fraction (&v, rates->num, rates->den);
428               gst_value_list_append_value (&va, &v);
429               rates++;
430             }
431
432             caps = gst_caps_new_simple (mimetype, NULL, NULL, NULL);
433             gst_caps_set_value (caps, "framerate", &va);
434             g_value_unset (&va);
435             g_value_unset (&v);
436           }
437
438         } else {
439           caps = gst_caps_new_empty_simple (mimetype);
440         }
441
442         break;
443       }
444     }
445   }
446
447   /* no fixed caps or special restrictions applied;
448    * default unfixed setting */
449   if (!caps) {
450     GST_DEBUG ("Creating default caps");
451     caps = gst_caps_new_empty_simple (mimetype);
452   }
453
454   va_start (var_args, fieldname);
455   gst_caps_set_simple_valist (caps, fieldname, var_args);
456   va_end (var_args);
457
458   return caps;
459 }
460
461 static gint
462 get_nbits_set (guint64 n)
463 {
464   gint i, x;
465
466   x = 0;
467   for (i = 0; i < 64; i++) {
468     if ((n & (G_GUINT64_CONSTANT (1) << i)))
469       x++;
470   }
471
472   return x;
473 }
474
475 static void
476 gst_ffmpeg_audio_set_sample_fmts (GstCaps * caps,
477     const enum AVSampleFormat *fmts)
478 {
479   GValue va = { 0, };
480   GValue v = { 0, };
481   GstAudioFormat format;
482
483   if (!fmts || fmts[0] == -1) {
484     gint i;
485
486     g_value_init (&va, GST_TYPE_LIST);
487     g_value_init (&v, G_TYPE_STRING);
488     for (i = 0; i <= AV_SAMPLE_FMT_DBL; i++) {
489       format = gst_ffmpeg_smpfmt_to_audioformat (i);
490       if (format == GST_AUDIO_FORMAT_UNKNOWN)
491         continue;
492       g_value_set_string (&v, gst_audio_format_to_string (format));
493       gst_value_list_append_value (&va, &v);
494     }
495     gst_caps_set_value (caps, "format", &va);
496     g_value_unset (&v);
497     g_value_unset (&va);
498     return;
499   }
500
501   g_value_init (&va, GST_TYPE_LIST);
502   g_value_init (&v, G_TYPE_STRING);
503   while (*fmts != -1) {
504     format = gst_ffmpeg_smpfmt_to_audioformat (*fmts);
505     if (format != GST_AUDIO_FORMAT_UNKNOWN) {
506       g_value_set_string (&v, gst_audio_format_to_string (format));
507       /* Only append values we don't have yet */
508       if (!_gst_value_list_contains (&va, &v))
509         gst_value_list_append_value (&va, &v);
510     }
511     fmts++;
512   }
513   if (gst_value_list_get_size (&va) == 1) {
514     /* The single value is still in v */
515     gst_caps_set_value (caps, "format", &v);
516   } else if (gst_value_list_get_size (&va) > 1) {
517     gst_caps_set_value (caps, "format", &va);
518   }
519   g_value_unset (&v);
520   g_value_unset (&va);
521 }
522
523 /* same for audio - now with channels/sample rate
524  */
525 static GstCaps *
526 gst_ff_aud_caps_new (AVCodecContext * context, AVCodec * codec,
527     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
528     const char *fieldname, ...)
529 {
530   GstCaps *caps = NULL;
531   gint i;
532   va_list var_args;
533
534   /* fixed, non-probing context */
535   if (context != NULL && context->channels != -1) {
536     GstAudioChannelPosition pos[64];
537     guint64 mask;
538
539     caps = gst_caps_new_simple (mimetype,
540         "rate", G_TYPE_INT, context->sample_rate,
541         "channels", G_TYPE_INT, context->channels, NULL);
542
543     if (context->channels > 1 &&
544         gst_ffmpeg_channel_layout_to_gst (context->channel_layout,
545             context->channels, pos) &&
546         gst_audio_channel_positions_to_mask (pos, context->channels, FALSE,
547             &mask)) {
548       gst_caps_set_simple (caps, "channel-mask", GST_TYPE_BITMASK, mask, NULL);
549     }
550   } else if (encode) {
551     gint maxchannels = 2;
552     const gint *rates = NULL;
553     gint n_rates = 0;
554
555     /* so we must be after restricted caps in this case */
556     switch (codec_id) {
557       case AV_CODEC_ID_AAC:
558       case AV_CODEC_ID_AAC_LATM:
559       case AV_CODEC_ID_DTS:
560         maxchannels = 6;
561         break;
562       case AV_CODEC_ID_MP2:
563       {
564         const static gint l_rates[] =
565             { 48000, 44100, 32000, 24000, 22050, 16000 };
566         n_rates = G_N_ELEMENTS (l_rates);
567         rates = l_rates;
568         break;
569       }
570       case AV_CODEC_ID_EAC3:
571       case AV_CODEC_ID_AC3:
572       {
573         const static gint l_rates[] = { 48000, 44100, 32000 };
574         maxchannels = 6;
575         n_rates = G_N_ELEMENTS (l_rates);
576         rates = l_rates;
577         break;
578       }
579       case AV_CODEC_ID_ADPCM_G722:
580       {
581         const static gint l_rates[] = { 16000 };
582         n_rates = G_N_ELEMENTS (l_rates);
583         rates = l_rates;
584         maxchannels = 1;
585         break;
586       }
587       case AV_CODEC_ID_ADPCM_G726:
588       {
589         const static gint l_rates[] = { 8000 };
590         n_rates = G_N_ELEMENTS (l_rates);
591         rates = l_rates;
592         maxchannels = 1;
593         break;
594       }
595       case AV_CODEC_ID_ADPCM_SWF:
596       {
597         const static gint l_rates[] = { 11025, 22050, 44100 };
598         n_rates = G_N_ELEMENTS (l_rates);
599         rates = l_rates;
600         break;
601       }
602       case AV_CODEC_ID_ROQ_DPCM:
603       {
604         const static gint l_rates[] = { 22050 };
605         n_rates = G_N_ELEMENTS (l_rates);
606         rates = l_rates;
607         break;
608       }
609       case AV_CODEC_ID_AMR_NB:
610       {
611         const static gint l_rates[] = { 8000 };
612         maxchannels = 1;
613         n_rates = G_N_ELEMENTS (l_rates);
614         rates = l_rates;
615         break;
616       }
617       case AV_CODEC_ID_AMR_WB:
618       {
619         const static gint l_rates[] = { 16000 };
620         maxchannels = 1;
621         n_rates = G_N_ELEMENTS (l_rates);
622         rates = l_rates;
623         break;
624       }
625       default:
626         break;
627     }
628
629     /* regardless of encode/decode, open up channels if applicable */
630     /* Until decoders/encoders expose the maximum number of channels
631      * they support, we whitelist them here. */
632     switch (codec_id) {
633       case AV_CODEC_ID_WMAPRO:
634       case AV_CODEC_ID_TRUEHD:
635         maxchannels = 8;
636         break;
637       default:
638         break;
639     }
640
641     if (codec && codec->channel_layouts) {
642       const uint64_t *layouts = codec->channel_layouts;
643       GstAudioChannelPosition pos[64];
644
645       caps = gst_caps_new_empty ();
646       while (*layouts) {
647         gint nbits_set = get_nbits_set (*layouts);
648
649         if (gst_ffmpeg_channel_layout_to_gst (*layouts, nbits_set, pos)) {
650           guint64 mask;
651
652           if (gst_audio_channel_positions_to_mask (pos, nbits_set, FALSE,
653                   &mask)) {
654             GstCaps *tmp =
655                 gst_caps_new_simple (mimetype, "channel-mask", GST_TYPE_BITMASK,
656                 mask,
657                 "channels", G_TYPE_INT, nbits_set, NULL);
658
659             gst_caps_append (caps, tmp);
660           }
661         }
662         layouts++;
663       }
664     } else {
665       if (maxchannels == 1)
666         caps = gst_caps_new_simple (mimetype,
667             "channels", G_TYPE_INT, maxchannels, NULL);
668       else
669         caps = gst_caps_new_simple (mimetype,
670             "channels", GST_TYPE_INT_RANGE, 1, maxchannels, NULL);
671     }
672
673     if (n_rates) {
674       GValue list = { 0, };
675
676       g_value_init (&list, GST_TYPE_LIST);
677       for (i = 0; i < n_rates; i++) {
678         GValue v = { 0, };
679
680         g_value_init (&v, G_TYPE_INT);
681         g_value_set_int (&v, rates[i]);
682         gst_value_list_append_value (&list, &v);
683         g_value_unset (&v);
684       }
685       gst_caps_set_value (caps, "rate", &list);
686       g_value_unset (&list);
687     } else if (codec && codec->supported_samplerates
688         && codec->supported_samplerates[0]) {
689       GValue va = { 0, };
690       GValue v = { 0, };
691
692       if (!codec->supported_samplerates[1]) {
693         gst_caps_set_simple (caps, "rate", G_TYPE_INT,
694             codec->supported_samplerates[0], NULL);
695       } else {
696         const int *rates = codec->supported_samplerates;
697
698         g_value_init (&va, GST_TYPE_LIST);
699         g_value_init (&v, G_TYPE_INT);
700
701         while (*rates) {
702           g_value_set_int (&v, *rates);
703           gst_value_list_append_value (&va, &v);
704           rates++;
705         }
706         gst_caps_set_value (caps, "rate", &va);
707         g_value_unset (&va);
708         g_value_unset (&v);
709       }
710     } else {
711       gst_caps_set_simple (caps, "rate", GST_TYPE_INT_RANGE, 4000, 96000, NULL);
712     }
713   } else {
714     caps = gst_caps_new_empty_simple (mimetype);
715   }
716
717   va_start (var_args, fieldname);
718   gst_caps_set_simple_valist (caps, fieldname, var_args);
719   va_end (var_args);
720
721   return caps;
722 }
723
724 /* Convert a FFMPEG codec ID and optional AVCodecContext
725  * to a GstCaps. If the context is ommitted, no fixed values
726  * for video/audio size will be included in the GstCaps
727  *
728  * CodecID is primarily meant for compressed data GstCaps!
729  *
730  * encode is a special parameter. gstffmpegdec will say
731  * FALSE, gstffmpegenc will say TRUE. The output caps
732  * depends on this, in such a way that it will be very
733  * specific, defined, fixed and correct caps for encoders,
734  * yet very wide, "forgiving" caps for decoders. Example
735  * for mp3: decode: audio/mpeg,mpegversion=1,layer=[1-3]
736  * but encode: audio/mpeg,mpegversion=1,layer=3,bitrate=x,
737  * rate=x,channels=x.
738  */
739
740 GstCaps *
741 gst_ffmpeg_codecid_to_caps (enum AVCodecID codec_id,
742     AVCodecContext * context, gboolean encode)
743 {
744   GstCaps *caps = NULL;
745   gboolean buildcaps = FALSE;
746
747   GST_LOG ("codec_id:%d, context:%p, encode:%d", codec_id, context, encode);
748
749   switch (codec_id) {
750     case AV_CODEC_ID_MPEG1VIDEO:
751       /* FIXME: bitrate */
752       caps = gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
753           "mpegversion", G_TYPE_INT, 1,
754           "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
755       break;
756
757     case AV_CODEC_ID_MPEG2VIDEO:
758       if (encode) {
759         /* FIXME: bitrate */
760         caps =
761             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
762             "mpegversion", G_TYPE_INT, 2, "systemstream", G_TYPE_BOOLEAN, FALSE,
763             NULL);
764       } else {
765         /* decode both MPEG-1 and MPEG-2; width/height/fps are all in
766          * the MPEG video stream headers, so may be omitted from caps. */
767         caps = gst_caps_new_simple ("video/mpeg",
768             "mpegversion", GST_TYPE_INT_RANGE, 1, 2,
769             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
770       }
771       break;
772
773     case AV_CODEC_ID_H263:
774       if (encode) {
775         caps =
776             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
777             "video/x-h263", "variant", G_TYPE_STRING, "itu", "h263version",
778             G_TYPE_STRING, "h263", NULL);
779       } else {
780         /* don't pass codec_id, we can decode other variants with the H263
781          * decoder that don't have specific size requirements
782          */
783         caps =
784             gst_ff_vid_caps_new (context, NULL, AV_CODEC_ID_NONE, encode,
785             "video/x-h263", "variant", G_TYPE_STRING, "itu", NULL);
786       }
787       break;
788
789     case AV_CODEC_ID_H263P:
790       caps =
791           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h263",
792           "variant", G_TYPE_STRING, "itu", "h263version", G_TYPE_STRING,
793           "h263p", NULL);
794       if (encode && context) {
795
796         gst_caps_set_simple (caps,
797             "annex-f", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_4MV,
798             "annex-j", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_LOOP_FILTER,
799             "annex-i", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
800             "annex-t", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
801             NULL);
802       }
803       break;
804
805     case AV_CODEC_ID_H263I:
806       caps =
807           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
808           "video/x-intel-h263", "variant", G_TYPE_STRING, "intel", NULL);
809       break;
810
811     case AV_CODEC_ID_H261:
812       caps =
813           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h261",
814           NULL);
815       break;
816
817     case AV_CODEC_ID_RV10:
818     case AV_CODEC_ID_RV20:
819     case AV_CODEC_ID_RV30:
820     case AV_CODEC_ID_RV40:
821     {
822       gint version;
823
824       switch (codec_id) {
825         case AV_CODEC_ID_RV40:
826           version = 4;
827           break;
828         case AV_CODEC_ID_RV30:
829           version = 3;
830           break;
831         case AV_CODEC_ID_RV20:
832           version = 2;
833           break;
834         default:
835           version = 1;
836           break;
837       }
838
839       caps =
840           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
841           "video/x-pn-realvideo", "rmversion", G_TYPE_INT, version, NULL);
842       if (context) {
843         if (context->extradata_size >= 8) {
844           gst_caps_set_simple (caps,
845               "subformat", G_TYPE_INT, GST_READ_UINT32_BE (context->extradata),
846               NULL);
847         }
848       }
849     }
850       break;
851
852     case AV_CODEC_ID_MP1:
853       /* FIXME: bitrate */
854       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
855           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 1, NULL);
856       break;
857
858     case AV_CODEC_ID_MP2:
859       /* FIXME: bitrate */
860       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
861           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 2, NULL);
862       break;
863
864     case AV_CODEC_ID_MP3:
865       if (encode) {
866         /* FIXME: bitrate */
867         caps =
868             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
869             "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 3, NULL);
870       } else {
871         /* Decodes MPEG-1 layer 1/2/3. Samplerate, channels et al are
872          * in the MPEG audio header, so may be omitted from caps. */
873         caps = gst_caps_new_simple ("audio/mpeg",
874             "mpegversion", G_TYPE_INT, 1,
875             "layer", GST_TYPE_INT_RANGE, 1, 3, NULL);
876       }
877       break;
878
879     case AV_CODEC_ID_MUSEPACK7:
880       caps =
881           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
882           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 7,
883           NULL);
884       break;
885
886     case AV_CODEC_ID_MUSEPACK8:
887       caps =
888           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
889           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 8,
890           NULL);
891       break;
892
893     case AV_CODEC_ID_AC3:
894       /* FIXME: bitrate */
895       caps =
896           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-ac3",
897           NULL);
898       break;
899
900     case AV_CODEC_ID_EAC3:
901       /* FIXME: bitrate */
902       caps =
903           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-eac3",
904           NULL);
905       break;
906
907     case AV_CODEC_ID_TRUEHD:
908       caps =
909           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
910           "audio/x-true-hd", NULL);
911       break;
912
913     case AV_CODEC_ID_ATRAC1:
914       caps =
915           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
916           "audio/x-vnd.sony.atrac1", NULL);
917       break;
918
919     case AV_CODEC_ID_ATRAC3:
920       caps =
921           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
922           "audio/x-vnd.sony.atrac3", NULL);
923       break;
924
925     case AV_CODEC_ID_DTS:
926       caps =
927           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dts",
928           NULL);
929       break;
930
931     case AV_CODEC_ID_APE:
932       caps =
933           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
934           "audio/x-ffmpeg-parsed-ape", NULL);
935       if (context) {
936         gst_caps_set_simple (caps,
937             "depth", G_TYPE_INT, context->bits_per_coded_sample, NULL);
938       }
939       break;
940
941     case AV_CODEC_ID_MLP:
942       caps =
943           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mlp",
944           NULL);
945       break;
946
947     case AV_CODEC_ID_IMC:
948       caps =
949           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-imc",
950           NULL);
951       break;
952
953       /* MJPEG is normal JPEG, Motion-JPEG and Quicktime MJPEG-A. MJPEGB
954        * is Quicktime's MJPEG-B. LJPEG is lossless JPEG. I don't know what
955        * sp5x is, but it's apparently something JPEG... We don't separate
956        * between those in GStreamer. Should we (at least between MJPEG,
957        * MJPEG-B and sp5x decoding...)? */
958     case AV_CODEC_ID_MJPEG:
959     case AV_CODEC_ID_LJPEG:
960       caps =
961           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/jpeg",
962           "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
963       break;
964
965     case AV_CODEC_ID_JPEG2000:
966       caps =
967           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-j2c",
968           NULL);
969       if (!encode) {
970         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
971                 encode, "image/x-jpc", NULL));
972         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
973                 encode, "image/jp2", NULL));
974       }
975       break;
976
977     case AV_CODEC_ID_SP5X:
978       caps =
979           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/sp5x",
980           NULL);
981       break;
982
983     case AV_CODEC_ID_MJPEGB:
984       caps =
985           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
986           "video/x-mjpeg-b", NULL);
987       break;
988
989     case AV_CODEC_ID_MPEG4:
990       if (encode && context != NULL) {
991         /* I'm not exactly sure what ffmpeg outputs... ffmpeg itself uses
992          * the AVI fourcc 'DIVX', but 'mp4v' for Quicktime... */
993         switch (context->codec_tag) {
994           case GST_MAKE_FOURCC ('D', 'I', 'V', 'X'):
995             caps =
996                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
997                 "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL);
998             break;
999           case GST_MAKE_FOURCC ('m', 'p', '4', 'v'):
1000           default:
1001             /* FIXME: bitrate. libav doesn't expose the used profile and level */
1002             caps =
1003                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1004                 "video/mpeg", "systemstream", G_TYPE_BOOLEAN, FALSE,
1005                 "mpegversion", G_TYPE_INT, 4, NULL);
1006             break;
1007         }
1008       } else {
1009         /* The trick here is to separate xvid, divx, mpeg4, 3ivx et al */
1010         caps =
1011             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
1012             "mpegversion", G_TYPE_INT, 4, "systemstream", G_TYPE_BOOLEAN, FALSE,
1013             NULL);
1014
1015         if (encode) {
1016           GValue arr = { 0, };
1017           GValue item = { 0, };
1018
1019           g_value_init (&arr, GST_TYPE_LIST);
1020           g_value_init (&item, G_TYPE_STRING);
1021           g_value_set_string (&item, "simple");
1022           gst_value_list_append_value (&arr, &item);
1023           g_value_set_string (&item, "advanced-simple");
1024           gst_value_list_append_value (&arr, &item);
1025           g_value_unset (&item);
1026
1027           gst_caps_set_value (caps, "profile", &arr);
1028           g_value_unset (&arr);
1029
1030           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1031                   encode, "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL));
1032         } else {
1033           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1034                   encode, "video/x-divx", "divxversion", GST_TYPE_INT_RANGE, 4,
1035                   5, NULL));
1036         }
1037       }
1038       break;
1039
1040     case AV_CODEC_ID_RAWVIDEO:
1041       caps =
1042           gst_ffmpeg_codectype_to_video_caps (context, codec_id, encode, NULL);
1043       break;
1044
1045     case AV_CODEC_ID_MSMPEG4V1:
1046     case AV_CODEC_ID_MSMPEG4V2:
1047     case AV_CODEC_ID_MSMPEG4V3:
1048     {
1049       gint version = 41 + codec_id - AV_CODEC_ID_MSMPEG4V1;
1050
1051       /* encode-FIXME: bitrate */
1052       caps =
1053           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1054           "video/x-msmpeg", "msmpegversion", G_TYPE_INT, version, NULL);
1055       if (!encode && codec_id == AV_CODEC_ID_MSMPEG4V3) {
1056         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1057                 encode, "video/x-divx", "divxversion", G_TYPE_INT, 3, NULL));
1058       }
1059     }
1060       break;
1061
1062     case AV_CODEC_ID_WMV1:
1063     case AV_CODEC_ID_WMV2:
1064     {
1065       gint version = (codec_id == AV_CODEC_ID_WMV1) ? 1 : 2;
1066
1067       caps =
1068           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1069           "wmvversion", G_TYPE_INT, version, NULL);
1070     }
1071       break;
1072
1073     case AV_CODEC_ID_FLV1:
1074       caps =
1075           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1076           "video/x-flash-video", "flvversion", G_TYPE_INT, 1, NULL);
1077       break;
1078
1079     case AV_CODEC_ID_SVQ1:
1080       caps =
1081           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1082           "svqversion", G_TYPE_INT, 1, NULL);
1083       break;
1084
1085     case AV_CODEC_ID_SVQ3:
1086       caps =
1087           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1088           "svqversion", G_TYPE_INT, 3, NULL);
1089       break;
1090
1091     case AV_CODEC_ID_DVAUDIO:
1092       caps =
1093           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dv",
1094           NULL);
1095       break;
1096
1097     case AV_CODEC_ID_DVVIDEO:
1098     {
1099       if (encode && context) {
1100         const gchar *format;
1101
1102         switch (context->pix_fmt) {
1103           case AV_PIX_FMT_YUYV422:
1104             format = "YUY2";
1105             break;
1106           case AV_PIX_FMT_YUV420P:
1107             format = "I420";
1108             break;
1109           case AV_PIX_FMT_YUVA420P:
1110             format = "A420";
1111             break;
1112           case AV_PIX_FMT_YUV411P:
1113             format = "Y41B";
1114             break;
1115           case AV_PIX_FMT_YUV422P:
1116             format = "Y42B";
1117             break;
1118           case AV_PIX_FMT_YUV410P:
1119             format = "YUV9";
1120             break;
1121           default:
1122             GST_WARNING
1123                 ("Couldnt' find format for pixfmt %d, defaulting to I420",
1124                 context->pix_fmt);
1125             format = "I420";
1126             break;
1127         }
1128         caps =
1129             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1130             "systemstream", G_TYPE_BOOLEAN, FALSE, "format", G_TYPE_STRING,
1131             format, NULL);
1132       } else {
1133         caps =
1134             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1135             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
1136       }
1137     }
1138       break;
1139
1140     case AV_CODEC_ID_WMAV1:
1141     case AV_CODEC_ID_WMAV2:
1142     {
1143       gint version = (codec_id == AV_CODEC_ID_WMAV1) ? 1 : 2;
1144
1145       if (context) {
1146         caps =
1147             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1148             "wmaversion", G_TYPE_INT, version, "block_align", G_TYPE_INT,
1149             context->block_align, "bitrate", G_TYPE_INT,
1150             (guint) context->bit_rate, NULL);
1151       } else {
1152         caps =
1153             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1154             "wmaversion", G_TYPE_INT, version, "block_align",
1155             GST_TYPE_INT_RANGE, 0, G_MAXINT, "bitrate", GST_TYPE_INT_RANGE, 0,
1156             G_MAXINT, NULL);
1157       }
1158     }
1159       break;
1160     case AV_CODEC_ID_WMAPRO:
1161     {
1162       caps =
1163           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1164           "wmaversion", G_TYPE_INT, 3, NULL);
1165       break;
1166     }
1167     case AV_CODEC_ID_WMALOSSLESS:
1168     {
1169       /* libav only supports a depth of 16 at the moment */
1170       caps =
1171           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1172           "wmaversion", G_TYPE_INT, 4, "depth", G_TYPE_INT, 16, NULL);
1173       break;
1174     }
1175     case AV_CODEC_ID_WMAVOICE:
1176     {
1177       caps =
1178           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wms",
1179           NULL);
1180       break;
1181     }
1182
1183     case AV_CODEC_ID_MACE3:
1184     case AV_CODEC_ID_MACE6:
1185     {
1186       gint version = (codec_id == AV_CODEC_ID_MACE3) ? 3 : 6;
1187
1188       caps =
1189           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mace",
1190           "maceversion", G_TYPE_INT, version, NULL);
1191     }
1192       break;
1193
1194     case AV_CODEC_ID_HUFFYUV:
1195       caps =
1196           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1197           "video/x-huffyuv", NULL);
1198       if (context) {
1199         gst_caps_set_simple (caps,
1200             "bpp", G_TYPE_INT, context->bits_per_coded_sample, NULL);
1201       }
1202       break;
1203
1204     case AV_CODEC_ID_CYUV:
1205       caps =
1206           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1207           "video/x-compressed-yuv", NULL);
1208       break;
1209
1210     case AV_CODEC_ID_H264:
1211       caps =
1212           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h264",
1213           "alignment", G_TYPE_STRING, "au", NULL);
1214       if (!encode) {
1215         GValue arr = { 0, };
1216         GValue item = { 0, };
1217         g_value_init (&arr, GST_TYPE_LIST);
1218         g_value_init (&item, G_TYPE_STRING);
1219         g_value_set_string (&item, "avc");
1220         gst_value_list_append_value (&arr, &item);
1221         g_value_set_string (&item, "byte-stream");
1222         gst_value_list_append_value (&arr, &item);
1223         g_value_unset (&item);
1224         gst_caps_set_value (caps, "stream-format", &arr);
1225         g_value_unset (&arr);
1226       }
1227       break;
1228
1229     case AV_CODEC_ID_HEVC:
1230       caps =
1231           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h265",
1232           "alignment", G_TYPE_STRING, "au", NULL);
1233       if (!encode) {
1234         GValue arr = { 0, };
1235         GValue item = { 0, };
1236         g_value_init (&arr, GST_TYPE_LIST);
1237         g_value_init (&item, G_TYPE_STRING);
1238         g_value_set_string (&item, "hvc1");
1239         gst_value_list_append_value (&arr, &item);
1240         g_value_set_string (&item, "hev1");
1241         gst_value_list_append_value (&arr, &item);
1242         g_value_set_string (&item, "byte-stream");
1243         gst_value_list_append_value (&arr, &item);
1244         g_value_unset (&item);
1245         gst_caps_set_value (caps, "stream-format", &arr);
1246         g_value_unset (&arr);
1247       }
1248       break;
1249
1250     case AV_CODEC_ID_INDEO5:
1251       caps =
1252           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1253           "indeoversion", G_TYPE_INT, 5, NULL);
1254       break;
1255
1256     case AV_CODEC_ID_INDEO4:
1257       caps =
1258           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1259           "indeoversion", G_TYPE_INT, 4, NULL);
1260       break;
1261
1262     case AV_CODEC_ID_INDEO3:
1263       caps =
1264           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1265           "indeoversion", G_TYPE_INT, 3, NULL);
1266       break;
1267
1268     case AV_CODEC_ID_INDEO2:
1269       caps =
1270           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1271           "indeoversion", G_TYPE_INT, 2, NULL);
1272       break;
1273
1274     case AV_CODEC_ID_FLASHSV:
1275       caps =
1276           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1277           "video/x-flash-screen", NULL);
1278       break;
1279
1280     case AV_CODEC_ID_VP3:
1281       caps =
1282           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp3",
1283           NULL);
1284       break;
1285
1286     case AV_CODEC_ID_VP5:
1287       caps =
1288           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp5",
1289           NULL);
1290       break;
1291
1292     case AV_CODEC_ID_VP6:
1293       caps =
1294           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp6",
1295           NULL);
1296       break;
1297
1298     case AV_CODEC_ID_VP6F:
1299       caps =
1300           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1301           "video/x-vp6-flash", NULL);
1302       break;
1303
1304     case AV_CODEC_ID_VP6A:
1305       caps =
1306           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1307           "video/x-vp6-alpha", NULL);
1308       break;
1309
1310     case AV_CODEC_ID_VP8:
1311       caps =
1312           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp8",
1313           NULL);
1314       break;
1315
1316     case AV_CODEC_ID_VP9:
1317       caps =
1318           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp9",
1319           NULL);
1320       break;
1321
1322     case AV_CODEC_ID_THEORA:
1323       caps =
1324           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1325           "video/x-theora", NULL);
1326       break;
1327
1328     case AV_CODEC_ID_AAC:
1329     {
1330       caps =
1331           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1332           NULL);
1333
1334       if (!encode) {
1335         GValue arr = { 0, };
1336         GValue item = { 0, };
1337
1338         g_value_init (&arr, GST_TYPE_LIST);
1339         g_value_init (&item, G_TYPE_INT);
1340         g_value_set_int (&item, 2);
1341         gst_value_list_append_value (&arr, &item);
1342         g_value_set_int (&item, 4);
1343         gst_value_list_append_value (&arr, &item);
1344         g_value_unset (&item);
1345
1346         gst_caps_set_value (caps, "mpegversion", &arr);
1347         g_value_unset (&arr);
1348
1349         g_value_init (&arr, GST_TYPE_LIST);
1350         g_value_init (&item, G_TYPE_STRING);
1351         g_value_set_string (&item, "raw");
1352         gst_value_list_append_value (&arr, &item);
1353         g_value_set_string (&item, "adts");
1354         gst_value_list_append_value (&arr, &item);
1355         g_value_set_string (&item, "adif");
1356         gst_value_list_append_value (&arr, &item);
1357         g_value_unset (&item);
1358
1359         gst_caps_set_value (caps, "stream-format", &arr);
1360         g_value_unset (&arr);
1361       } else {
1362         gst_caps_set_simple (caps, "mpegversion", G_TYPE_INT, 4,
1363             "stream-format", G_TYPE_STRING, "raw",
1364             "base-profile", G_TYPE_STRING, "lc", NULL);
1365
1366         if (context && context->extradata_size > 0)
1367           gst_codec_utils_aac_caps_set_level_and_profile (caps,
1368               context->extradata, context->extradata_size);
1369       }
1370
1371       break;
1372     }
1373     case AV_CODEC_ID_AAC_LATM: /* LATM/LOAS AAC syntax */
1374       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1375           "mpegversion", G_TYPE_INT, 4, "stream-format", G_TYPE_STRING, "loas",
1376           NULL);
1377       break;
1378
1379     case AV_CODEC_ID_ASV1:
1380       caps =
1381           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1382           "asusversion", G_TYPE_INT, 1, NULL);
1383       break;
1384     case AV_CODEC_ID_ASV2:
1385       caps =
1386           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1387           "asusversion", G_TYPE_INT, 2, NULL);
1388       break;
1389
1390     case AV_CODEC_ID_FFV1:
1391       caps =
1392           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-ffv",
1393           "ffvversion", G_TYPE_INT, 1, NULL);
1394       break;
1395
1396     case AV_CODEC_ID_4XM:
1397       caps =
1398           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-4xm",
1399           NULL);
1400       break;
1401
1402     case AV_CODEC_ID_XAN_WC3:
1403     case AV_CODEC_ID_XAN_WC4:
1404       caps =
1405           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-xan",
1406           "wcversion", G_TYPE_INT, 3 - AV_CODEC_ID_XAN_WC3 + codec_id, NULL);
1407       break;
1408
1409     case AV_CODEC_ID_CLJR:
1410       caps =
1411           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1412           "video/x-cirrus-logic-accupak", NULL);
1413       break;
1414
1415     case AV_CODEC_ID_FRAPS:
1416       caps =
1417           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-fraps",
1418           NULL);
1419       break;
1420
1421     case AV_CODEC_ID_MDEC:
1422     case AV_CODEC_ID_ROQ:
1423     case AV_CODEC_ID_INTERPLAY_VIDEO:
1424       buildcaps = TRUE;
1425       break;
1426
1427     case AV_CODEC_ID_VCR1:
1428       caps =
1429           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1430           "video/x-ati-vcr", "vcrversion", G_TYPE_INT, 1, NULL);
1431       break;
1432
1433     case AV_CODEC_ID_RPZA:
1434       caps =
1435           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1436           "video/x-apple-video", NULL);
1437       break;
1438
1439     case AV_CODEC_ID_CINEPAK:
1440       caps =
1441           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1442           "video/x-cinepak", NULL);
1443       break;
1444
1445       /* WS_VQA belogns here (order) */
1446
1447     case AV_CODEC_ID_MSRLE:
1448       caps =
1449           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1450           "layout", G_TYPE_STRING, "microsoft", NULL);
1451       if (context) {
1452         gst_caps_set_simple (caps,
1453             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1454       } else {
1455         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1456       }
1457       break;
1458
1459     case AV_CODEC_ID_QTRLE:
1460       caps =
1461           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1462           "layout", G_TYPE_STRING, "quicktime", NULL);
1463       if (context) {
1464         gst_caps_set_simple (caps,
1465             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1466       } else {
1467         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1468       }
1469       break;
1470
1471     case AV_CODEC_ID_MSVIDEO1:
1472       caps =
1473           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1474           "video/x-msvideocodec", "msvideoversion", G_TYPE_INT, 1, NULL);
1475       break;
1476
1477     case AV_CODEC_ID_MSS1:
1478       caps =
1479           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1480           "wmvversion", G_TYPE_INT, 1, "format", G_TYPE_STRING, "MSS1", NULL);
1481       break;
1482
1483     case AV_CODEC_ID_MSS2:
1484       caps =
1485           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1486           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "MSS2", NULL);
1487       break;
1488
1489     case AV_CODEC_ID_WMV3:
1490       caps =
1491           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1492           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "WMV3", NULL);
1493       break;
1494     case AV_CODEC_ID_VC1:
1495       caps =
1496           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1497           "wmvversion", G_TYPE_INT, 3, NULL);
1498       if (!context && !encode) {
1499         GValue arr = { 0, };
1500         GValue item = { 0, };
1501
1502         g_value_init (&arr, GST_TYPE_LIST);
1503         g_value_init (&item, G_TYPE_STRING);
1504         g_value_set_string (&item, "WVC1");
1505         gst_value_list_append_value (&arr, &item);
1506         g_value_set_string (&item, "WMVA");
1507         gst_value_list_append_and_take_value (&arr, &item);
1508         gst_caps_set_value (caps, "format", &arr);
1509         g_value_unset (&arr);
1510       } else {
1511         gst_caps_set_simple (caps, "format", G_TYPE_STRING, "WVC1", NULL);
1512       }
1513       break;
1514     case AV_CODEC_ID_QDM2:
1515       caps =
1516           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-qdm2",
1517           NULL);
1518       break;
1519
1520     case AV_CODEC_ID_MSZH:
1521       caps =
1522           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mszh",
1523           NULL);
1524       break;
1525
1526     case AV_CODEC_ID_ZLIB:
1527       caps =
1528           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zlib",
1529           NULL);
1530       break;
1531
1532     case AV_CODEC_ID_TRUEMOTION1:
1533       caps =
1534           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1535           "video/x-truemotion", "trueversion", G_TYPE_INT, 1, NULL);
1536       break;
1537     case AV_CODEC_ID_TRUEMOTION2:
1538       caps =
1539           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1540           "video/x-truemotion", "trueversion", G_TYPE_INT, 2, NULL);
1541       break;
1542
1543     case AV_CODEC_ID_ULTI:
1544       caps =
1545           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1546           "video/x-ultimotion", NULL);
1547       break;
1548
1549     case AV_CODEC_ID_TSCC:
1550       caps =
1551           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1552           "video/x-camtasia", NULL);
1553       if (context) {
1554         gst_caps_set_simple (caps,
1555             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1556       } else {
1557         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1558       }
1559       break;
1560
1561     case AV_CODEC_ID_TSCC2:
1562       caps =
1563           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1564           "video/x-tscc", "tsccversion", G_TYPE_INT, 2, NULL);
1565       break;
1566
1567     case AV_CODEC_ID_KMVC:
1568       caps =
1569           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-kmvc",
1570           NULL);
1571       break;
1572
1573     case AV_CODEC_ID_NUV:
1574       caps =
1575           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-nuv",
1576           NULL);
1577       break;
1578
1579     case AV_CODEC_ID_GIF:
1580       caps =
1581           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/gif",
1582           NULL);
1583       break;
1584
1585     case AV_CODEC_ID_PNG:
1586       caps =
1587           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/png",
1588           NULL);
1589       break;
1590
1591     case AV_CODEC_ID_PPM:
1592       caps =
1593           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/ppm",
1594           NULL);
1595       break;
1596
1597     case AV_CODEC_ID_PBM:
1598       caps =
1599           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/pbm",
1600           NULL);
1601       break;
1602
1603     case AV_CODEC_ID_PAM:
1604       caps =
1605           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1606           "image/x-portable-anymap", NULL);
1607       break;
1608
1609     case AV_CODEC_ID_PGM:
1610       caps =
1611           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1612           "image/x-portable-graymap", NULL);
1613       break;
1614
1615     case AV_CODEC_ID_PCX:
1616       caps =
1617           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-pcx",
1618           NULL);
1619       break;
1620
1621     case AV_CODEC_ID_SGI:
1622       caps =
1623           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-sgi",
1624           NULL);
1625       break;
1626
1627     case AV_CODEC_ID_TARGA:
1628       caps =
1629           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-tga",
1630           NULL);
1631       break;
1632
1633     case AV_CODEC_ID_TIFF:
1634       caps =
1635           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/tiff",
1636           NULL);
1637       break;
1638
1639     case AV_CODEC_ID_SUNRAST:
1640       caps =
1641           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1642           "image/x-sun-raster", NULL);
1643       break;
1644
1645     case AV_CODEC_ID_SMC:
1646       caps =
1647           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-smc",
1648           NULL);
1649       break;
1650
1651     case AV_CODEC_ID_QDRAW:
1652       caps =
1653           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-qdrw",
1654           NULL);
1655       break;
1656
1657     case AV_CODEC_ID_DNXHD:
1658       caps =
1659           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dnxhd",
1660           NULL);
1661       break;
1662
1663     case AV_CODEC_ID_PRORES:
1664       caps =
1665           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1666           "video/x-prores", NULL);
1667       break;
1668
1669     case AV_CODEC_ID_MIMIC:
1670       caps =
1671           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mimic",
1672           NULL);
1673       break;
1674
1675     case AV_CODEC_ID_VMNC:
1676       caps =
1677           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vmnc",
1678           NULL);
1679       break;
1680
1681     case AV_CODEC_ID_TRUESPEECH:
1682       caps =
1683           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
1684           "audio/x-truespeech", NULL);
1685       break;
1686
1687     case AV_CODEC_ID_QCELP:
1688       caps =
1689           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/qcelp",
1690           NULL);
1691       break;
1692
1693     case AV_CODEC_ID_AMV:
1694       caps =
1695           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-amv",
1696           NULL);
1697       break;
1698
1699     case AV_CODEC_ID_AASC:
1700       caps =
1701           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-aasc",
1702           NULL);
1703       break;
1704
1705     case AV_CODEC_ID_LOCO:
1706       caps =
1707           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-loco",
1708           NULL);
1709       break;
1710
1711     case AV_CODEC_ID_ZMBV:
1712       caps =
1713           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zmbv",
1714           NULL);
1715       break;
1716
1717     case AV_CODEC_ID_LAGARITH:
1718       caps =
1719           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1720           "video/x-lagarith", NULL);
1721       break;
1722
1723     case AV_CODEC_ID_CSCD:
1724       caps =
1725           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1726           "video/x-camstudio", NULL);
1727       if (context) {
1728         gst_caps_set_simple (caps,
1729             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1730       } else {
1731         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1732       }
1733       break;
1734
1735     case AV_CODEC_ID_AIC:
1736       caps =
1737           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1738           "video/x-apple-intermediate-codec", NULL);
1739       break;
1740
1741     case AV_CODEC_ID_CAVS:
1742       caps =
1743           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1744           "video/x-cavs", NULL);
1745       break;
1746
1747     case AV_CODEC_ID_WS_VQA:
1748     case AV_CODEC_ID_IDCIN:
1749     case AV_CODEC_ID_8BPS:
1750     case AV_CODEC_ID_FLIC:
1751     case AV_CODEC_ID_VMDVIDEO:
1752     case AV_CODEC_ID_VMDAUDIO:
1753     case AV_CODEC_ID_VIXL:
1754     case AV_CODEC_ID_QPEG:
1755     case AV_CODEC_ID_PGMYUV:
1756     case AV_CODEC_ID_FFVHUFF:
1757     case AV_CODEC_ID_WNV1:
1758     case AV_CODEC_ID_MP3ADU:
1759     case AV_CODEC_ID_MP3ON4:
1760     case AV_CODEC_ID_WESTWOOD_SND1:
1761     case AV_CODEC_ID_MMVIDEO:
1762     case AV_CODEC_ID_AVS:
1763       buildcaps = TRUE;
1764       break;
1765
1766       /* weird quasi-codecs for the demuxers only */
1767     case AV_CODEC_ID_PCM_S16LE:
1768     case AV_CODEC_ID_PCM_S16BE:
1769     case AV_CODEC_ID_PCM_U16LE:
1770     case AV_CODEC_ID_PCM_U16BE:
1771     case AV_CODEC_ID_PCM_S8:
1772     case AV_CODEC_ID_PCM_U8:
1773     {
1774       GstAudioFormat format;
1775
1776       switch (codec_id) {
1777         case AV_CODEC_ID_PCM_S16LE:
1778           format = GST_AUDIO_FORMAT_S16LE;
1779           break;
1780         case AV_CODEC_ID_PCM_S16BE:
1781           format = GST_AUDIO_FORMAT_S16BE;
1782           break;
1783         case AV_CODEC_ID_PCM_U16LE:
1784           format = GST_AUDIO_FORMAT_U16LE;
1785           break;
1786         case AV_CODEC_ID_PCM_U16BE:
1787           format = GST_AUDIO_FORMAT_U16BE;
1788           break;
1789         case AV_CODEC_ID_PCM_S8:
1790           format = GST_AUDIO_FORMAT_S8;
1791           break;
1792         case AV_CODEC_ID_PCM_U8:
1793           format = GST_AUDIO_FORMAT_U8;
1794           break;
1795         default:
1796           format = 0;
1797           g_assert (0);         /* don't worry, we never get here */
1798           break;
1799       }
1800
1801       caps =
1802           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-raw",
1803           "format", G_TYPE_STRING, gst_audio_format_to_string (format),
1804           "layout", G_TYPE_STRING, "interleaved", NULL);
1805     }
1806       break;
1807
1808     case AV_CODEC_ID_PCM_MULAW:
1809       caps =
1810           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mulaw",
1811           NULL);
1812       break;
1813
1814     case AV_CODEC_ID_PCM_ALAW:
1815       caps =
1816           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alaw",
1817           NULL);
1818       break;
1819
1820     case AV_CODEC_ID_ADPCM_G722:
1821       caps =
1822           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G722",
1823           NULL);
1824       if (context)
1825         gst_caps_set_simple (caps,
1826             "block_align", G_TYPE_INT, context->block_align,
1827             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1828       break;
1829
1830     case AV_CODEC_ID_ADPCM_G726:
1831     {
1832       /* the G726 decoder can also handle G721 */
1833       caps =
1834           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1835           "layout", G_TYPE_STRING, "g726", NULL);
1836       if (context)
1837         gst_caps_set_simple (caps,
1838             "block_align", G_TYPE_INT, context->block_align,
1839             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1840
1841       if (!encode) {
1842         gst_caps_append (caps, gst_caps_new_simple ("audio/x-adpcm",
1843                 "layout", G_TYPE_STRING, "g721",
1844                 "channels", G_TYPE_INT, 1, "rate", G_TYPE_INT, 8000, NULL));
1845       }
1846       break;
1847     }
1848     case AV_CODEC_ID_ADPCM_IMA_QT:
1849     case AV_CODEC_ID_ADPCM_IMA_WAV:
1850     case AV_CODEC_ID_ADPCM_IMA_DK3:
1851     case AV_CODEC_ID_ADPCM_IMA_DK4:
1852     case AV_CODEC_ID_ADPCM_IMA_WS:
1853     case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1854     case AV_CODEC_ID_ADPCM_IMA_AMV:
1855     case AV_CODEC_ID_ADPCM_IMA_ISS:
1856     case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1857     case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1858     case AV_CODEC_ID_ADPCM_MS:
1859     case AV_CODEC_ID_ADPCM_4XM:
1860     case AV_CODEC_ID_ADPCM_XA:
1861     case AV_CODEC_ID_ADPCM_ADX:
1862     case AV_CODEC_ID_ADPCM_EA:
1863     case AV_CODEC_ID_ADPCM_CT:
1864     case AV_CODEC_ID_ADPCM_SWF:
1865     case AV_CODEC_ID_ADPCM_YAMAHA:
1866     case AV_CODEC_ID_ADPCM_SBPRO_2:
1867     case AV_CODEC_ID_ADPCM_SBPRO_3:
1868     case AV_CODEC_ID_ADPCM_SBPRO_4:
1869     case AV_CODEC_ID_ADPCM_EA_R1:
1870     case AV_CODEC_ID_ADPCM_EA_R2:
1871     case AV_CODEC_ID_ADPCM_EA_R3:
1872     case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
1873     case AV_CODEC_ID_ADPCM_EA_XAS:
1874     case AV_CODEC_ID_ADPCM_THP:
1875     {
1876       const gchar *layout = NULL;
1877
1878       switch (codec_id) {
1879         case AV_CODEC_ID_ADPCM_IMA_QT:
1880           layout = "quicktime";
1881           break;
1882         case AV_CODEC_ID_ADPCM_IMA_WAV:
1883           layout = "dvi";
1884           break;
1885         case AV_CODEC_ID_ADPCM_IMA_DK3:
1886           layout = "dk3";
1887           break;
1888         case AV_CODEC_ID_ADPCM_IMA_DK4:
1889           layout = "dk4";
1890           break;
1891         case AV_CODEC_ID_ADPCM_IMA_WS:
1892           layout = "westwood";
1893           break;
1894         case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1895           layout = "smjpeg";
1896           break;
1897         case AV_CODEC_ID_ADPCM_IMA_AMV:
1898           layout = "amv";
1899           break;
1900         case AV_CODEC_ID_ADPCM_IMA_ISS:
1901           layout = "iss";
1902           break;
1903         case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1904           layout = "ea-eacs";
1905           break;
1906         case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1907           layout = "ea-sead";
1908           break;
1909         case AV_CODEC_ID_ADPCM_MS:
1910           layout = "microsoft";
1911           break;
1912         case AV_CODEC_ID_ADPCM_4XM:
1913           layout = "4xm";
1914           break;
1915         case AV_CODEC_ID_ADPCM_XA:
1916           layout = "xa";
1917           break;
1918         case AV_CODEC_ID_ADPCM_ADX:
1919           layout = "adx";
1920           break;
1921         case AV_CODEC_ID_ADPCM_EA:
1922           layout = "ea";
1923           break;
1924         case AV_CODEC_ID_ADPCM_CT:
1925           layout = "ct";
1926           break;
1927         case AV_CODEC_ID_ADPCM_SWF:
1928           layout = "swf";
1929           break;
1930         case AV_CODEC_ID_ADPCM_YAMAHA:
1931           layout = "yamaha";
1932           break;
1933         case AV_CODEC_ID_ADPCM_SBPRO_2:
1934           layout = "sbpro2";
1935           break;
1936         case AV_CODEC_ID_ADPCM_SBPRO_3:
1937           layout = "sbpro3";
1938           break;
1939         case AV_CODEC_ID_ADPCM_SBPRO_4:
1940           layout = "sbpro4";
1941           break;
1942         case AV_CODEC_ID_ADPCM_EA_R1:
1943           layout = "ea-r1";
1944           break;
1945         case AV_CODEC_ID_ADPCM_EA_R2:
1946           layout = "ea-r3";
1947           break;
1948         case AV_CODEC_ID_ADPCM_EA_R3:
1949           layout = "ea-r3";
1950           break;
1951         case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
1952           layout = "ea-maxis-xa";
1953           break;
1954         case AV_CODEC_ID_ADPCM_EA_XAS:
1955           layout = "ea-xas";
1956           break;
1957         case AV_CODEC_ID_ADPCM_THP:
1958           layout = "thp";
1959           break;
1960         default:
1961           g_assert (0);         /* don't worry, we never get here */
1962           break;
1963       }
1964
1965       /* FIXME: someone please check whether we need additional properties
1966        * in this caps definition. */
1967       caps =
1968           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1969           "layout", G_TYPE_STRING, layout, NULL);
1970       if (context)
1971         gst_caps_set_simple (caps,
1972             "block_align", G_TYPE_INT, context->block_align,
1973             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1974     }
1975       break;
1976
1977     case AV_CODEC_ID_AMR_NB:
1978       caps =
1979           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR",
1980           NULL);
1981       break;
1982
1983     case AV_CODEC_ID_AMR_WB:
1984       caps =
1985           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR-WB",
1986           NULL);
1987       break;
1988
1989     case AV_CODEC_ID_GSM:
1990       caps =
1991           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-gsm",
1992           NULL);
1993       break;
1994
1995     case AV_CODEC_ID_GSM_MS:
1996       caps =
1997           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/ms-gsm",
1998           NULL);
1999       break;
2000
2001     case AV_CODEC_ID_NELLYMOSER:
2002       caps =
2003           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2004           "audio/x-nellymoser", NULL);
2005       break;
2006
2007     case AV_CODEC_ID_SIPR:
2008     {
2009       caps =
2010           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-sipro",
2011           NULL);
2012       if (context) {
2013         gst_caps_set_simple (caps,
2014             "leaf_size", G_TYPE_INT, context->block_align,
2015             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2016       }
2017     }
2018       break;
2019
2020     case AV_CODEC_ID_RA_144:
2021     case AV_CODEC_ID_RA_288:
2022     case AV_CODEC_ID_COOK:
2023     {
2024       gint version = 0;
2025
2026       switch (codec_id) {
2027         case AV_CODEC_ID_RA_144:
2028           version = 1;
2029           break;
2030         case AV_CODEC_ID_RA_288:
2031           version = 2;
2032           break;
2033         case AV_CODEC_ID_COOK:
2034           version = 8;
2035           break;
2036         default:
2037           break;
2038       }
2039
2040       /* FIXME: properties? */
2041       caps =
2042           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2043           "audio/x-pn-realaudio", "raversion", G_TYPE_INT, version, NULL);
2044       if (context) {
2045         gst_caps_set_simple (caps,
2046             "leaf_size", G_TYPE_INT, context->block_align,
2047             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2048       }
2049     }
2050       break;
2051
2052     case AV_CODEC_ID_ROQ_DPCM:
2053     case AV_CODEC_ID_INTERPLAY_DPCM:
2054     case AV_CODEC_ID_XAN_DPCM:
2055     case AV_CODEC_ID_SOL_DPCM:
2056     {
2057       const gchar *layout = NULL;
2058
2059       switch (codec_id) {
2060         case AV_CODEC_ID_ROQ_DPCM:
2061           layout = "roq";
2062           break;
2063         case AV_CODEC_ID_INTERPLAY_DPCM:
2064           layout = "interplay";
2065           break;
2066         case AV_CODEC_ID_XAN_DPCM:
2067           layout = "xan";
2068           break;
2069         case AV_CODEC_ID_SOL_DPCM:
2070           layout = "sol";
2071           break;
2072         default:
2073           g_assert (0);         /* don't worry, we never get here */
2074           break;
2075       }
2076
2077       /* FIXME: someone please check whether we need additional properties
2078        * in this caps definition. */
2079       caps =
2080           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dpcm",
2081           "layout", G_TYPE_STRING, layout, NULL);
2082       if (context)
2083         gst_caps_set_simple (caps,
2084             "block_align", G_TYPE_INT, context->block_align,
2085             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2086     }
2087       break;
2088
2089     case AV_CODEC_ID_SHORTEN:
2090       caps = gst_caps_new_empty_simple ("audio/x-shorten");
2091       break;
2092
2093     case AV_CODEC_ID_ALAC:
2094       caps =
2095           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alac",
2096           NULL);
2097       if (context) {
2098         gst_caps_set_simple (caps,
2099             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2100       }
2101       break;
2102
2103     case AV_CODEC_ID_FLAC:
2104       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2105        * encoder case, we want to add things like samplerate, channels... */
2106       if (!encode) {
2107         caps = gst_caps_new_empty_simple ("audio/x-flac");
2108       }
2109       break;
2110
2111     case AV_CODEC_ID_OPUS:
2112       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2113        * encoder case, we want to add things like samplerate, channels... */
2114       if (!encode) {
2115         /* FIXME: can ffmpeg handle multichannel Opus? */
2116         caps = gst_caps_new_simple ("audio/x-opus",
2117             "channel-mapping-family", G_TYPE_INT, 0, NULL);
2118       }
2119       break;
2120
2121     case AV_CODEC_ID_S302M:
2122       caps = gst_caps_new_empty_simple ("audio/x-smpte-302m");
2123       break;
2124
2125     case AV_CODEC_ID_DVD_SUBTITLE:
2126     case AV_CODEC_ID_DVB_SUBTITLE:
2127       caps = NULL;
2128       break;
2129     case AV_CODEC_ID_BMP:
2130       caps = gst_caps_new_empty_simple ("image/bmp");
2131       break;
2132     case AV_CODEC_ID_TTA:
2133       caps =
2134           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-tta",
2135           NULL);
2136       if (context) {
2137         gst_caps_set_simple (caps,
2138             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2139       }
2140       break;
2141     case AV_CODEC_ID_TWINVQ:
2142       caps =
2143           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2144           "audio/x-twin-vq", NULL);
2145       break;
2146     case AV_CODEC_ID_G729:
2147       caps =
2148           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G729",
2149           NULL);
2150       break;
2151     default:
2152       GST_DEBUG ("Unknown codec ID %d, please add mapping here", codec_id);
2153       break;
2154   }
2155
2156   if (buildcaps) {
2157     AVCodec *codec;
2158
2159     if ((codec = avcodec_find_decoder (codec_id)) ||
2160         (codec = avcodec_find_encoder (codec_id))) {
2161       gchar *mime = NULL;
2162
2163       GST_LOG ("Could not create stream format caps for %s", codec->name);
2164
2165       switch (codec->type) {
2166         case AVMEDIA_TYPE_VIDEO:
2167           mime = g_strdup_printf ("video/x-gst-av-%s", codec->name);
2168           caps =
2169               gst_ff_vid_caps_new (context, NULL, codec_id, encode, mime, NULL);
2170           g_free (mime);
2171           break;
2172         case AVMEDIA_TYPE_AUDIO:
2173           mime = g_strdup_printf ("audio/x-gst-av-%s", codec->name);
2174           caps =
2175               gst_ff_aud_caps_new (context, NULL, codec_id, encode, mime, NULL);
2176           if (context)
2177             gst_caps_set_simple (caps,
2178                 "block_align", G_TYPE_INT, context->block_align,
2179                 "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2180           g_free (mime);
2181           break;
2182         default:
2183           break;
2184       }
2185     }
2186   }
2187
2188   if (caps != NULL) {
2189
2190     /* set private data */
2191     if (context && context->extradata_size > 0) {
2192       GstBuffer *data = gst_buffer_new_and_alloc (context->extradata_size);
2193
2194       gst_buffer_fill (data, 0, context->extradata, context->extradata_size);
2195       gst_caps_set_simple (caps, "codec_data", GST_TYPE_BUFFER, data, NULL);
2196       gst_buffer_unref (data);
2197     }
2198
2199     GST_LOG ("caps for codec_id=%d: %" GST_PTR_FORMAT, codec_id, caps);
2200
2201   } else {
2202     GST_LOG ("No caps found for codec_id=%d", codec_id);
2203   }
2204
2205   return caps;
2206 }
2207
2208 /* Convert a FFMPEG Pixel Format and optional AVCodecContext
2209  * to a GstCaps. If the context is ommitted, no fixed values
2210  * for video/audio size will be included in the GstCaps
2211  *
2212  * See below for usefullness
2213  */
2214
2215 static GstCaps *
2216 gst_ffmpeg_pixfmt_to_caps (enum AVPixelFormat pix_fmt, AVCodecContext * context,
2217     enum AVCodecID codec_id)
2218 {
2219   GstCaps *caps = NULL;
2220   GstVideoFormat format;
2221
2222   format = gst_ffmpeg_pixfmt_to_videoformat (pix_fmt);
2223
2224   if (format != GST_VIDEO_FORMAT_UNKNOWN) {
2225     caps = gst_ff_vid_caps_new (context, NULL, codec_id, TRUE, "video/x-raw",
2226         "format", G_TYPE_STRING, gst_video_format_to_string (format), NULL);
2227   }
2228
2229   if (caps != NULL) {
2230     GST_DEBUG ("caps for pix_fmt=%d: %" GST_PTR_FORMAT, pix_fmt, caps);
2231   } else {
2232     GST_LOG ("No caps found for pix_fmt=%d", pix_fmt);
2233   }
2234
2235   return caps;
2236 }
2237
2238 GstAudioFormat
2239 gst_ffmpeg_smpfmt_to_audioformat (enum AVSampleFormat sample_fmt)
2240 {
2241   switch (sample_fmt) {
2242     case AV_SAMPLE_FMT_U8:
2243     case AV_SAMPLE_FMT_U8P:
2244       return GST_AUDIO_FORMAT_U8;
2245       break;
2246     case AV_SAMPLE_FMT_S16:
2247     case AV_SAMPLE_FMT_S16P:
2248       return GST_AUDIO_FORMAT_S16;
2249       break;
2250     case AV_SAMPLE_FMT_S32:
2251     case AV_SAMPLE_FMT_S32P:
2252       return GST_AUDIO_FORMAT_S32;
2253       break;
2254     case AV_SAMPLE_FMT_FLT:
2255     case AV_SAMPLE_FMT_FLTP:
2256       return GST_AUDIO_FORMAT_F32;
2257       break;
2258     case AV_SAMPLE_FMT_DBL:
2259     case AV_SAMPLE_FMT_DBLP:
2260       return GST_AUDIO_FORMAT_F64;
2261       break;
2262     default:
2263       /* .. */
2264       return GST_AUDIO_FORMAT_UNKNOWN;
2265       break;
2266   }
2267 }
2268
2269 /* Convert a FFMPEG Sample Format and optional AVCodecContext
2270  * to a GstCaps. If the context is ommitted, no fixed values
2271  * for video/audio size will be included in the GstCaps
2272  *
2273  * See below for usefullness
2274  */
2275
2276 static GstCaps *
2277 gst_ffmpeg_smpfmt_to_caps (enum AVSampleFormat sample_fmt,
2278     AVCodecContext * context, AVCodec * codec, enum AVCodecID codec_id)
2279 {
2280   GstCaps *caps = NULL;
2281   GstAudioFormat format;
2282
2283   format = gst_ffmpeg_smpfmt_to_audioformat (sample_fmt);
2284
2285   if (format != GST_AUDIO_FORMAT_UNKNOWN) {
2286     caps = gst_ff_aud_caps_new (context, codec, codec_id, TRUE, "audio/x-raw",
2287         "format", G_TYPE_STRING, gst_audio_format_to_string (format),
2288         "layout", G_TYPE_STRING, "interleaved", NULL);
2289     GST_LOG ("caps for sample_fmt=%d: %" GST_PTR_FORMAT, sample_fmt, caps);
2290   } else {
2291     GST_LOG ("No caps found for sample_fmt=%d", sample_fmt);
2292   }
2293
2294   return caps;
2295 }
2296
2297 static gboolean
2298 caps_has_field (GstCaps * caps, const gchar * field)
2299 {
2300   guint i, n;
2301
2302   n = gst_caps_get_size (caps);
2303   for (i = 0; i < n; i++) {
2304     GstStructure *s = gst_caps_get_structure (caps, i);
2305
2306     if (gst_structure_has_field (s, field))
2307       return TRUE;
2308   }
2309
2310   return FALSE;
2311 }
2312
2313 GstCaps *
2314 gst_ffmpeg_codectype_to_audio_caps (AVCodecContext * context,
2315     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2316 {
2317   GstCaps *caps = NULL;
2318
2319   GST_DEBUG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2320       context, codec_id, encode, codec);
2321   if (codec)
2322     GST_DEBUG ("sample_fmts:%p, samplerates:%p",
2323         codec->sample_fmts, codec->supported_samplerates);
2324
2325   if (context) {
2326     /* Specific codec context */
2327     caps =
2328         gst_ffmpeg_smpfmt_to_caps (context->sample_fmt, context, codec,
2329         codec_id);
2330   } else {
2331     caps = gst_ff_aud_caps_new (context, codec, codec_id, encode, "audio/x-raw",
2332         "layout", G_TYPE_STRING, "interleaved", NULL);
2333     if (!caps_has_field (caps, "format"))
2334       gst_ffmpeg_audio_set_sample_fmts (caps,
2335           codec ? codec->sample_fmts : NULL);
2336   }
2337
2338   return caps;
2339 }
2340
2341 GstCaps *
2342 gst_ffmpeg_codectype_to_video_caps (AVCodecContext * context,
2343     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2344 {
2345   GstCaps *caps;
2346
2347   GST_LOG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2348       context, codec_id, encode, codec);
2349
2350   if (context) {
2351     caps = gst_ffmpeg_pixfmt_to_caps (context->pix_fmt, context, codec_id);
2352   } else {
2353     caps =
2354         gst_ff_vid_caps_new (context, codec, codec_id, encode, "video/x-raw",
2355         NULL);
2356     if (!caps_has_field (caps, "format"))
2357       gst_ffmpeg_video_set_pix_fmts (caps, codec ? codec->pix_fmts : NULL);
2358   }
2359   return caps;
2360 }
2361
2362 /* Convert a GstCaps (audio/raw) to a FFMPEG SampleFmt
2363  * and other audio properties in a AVCodecContext.
2364  *
2365  * For usefullness, see below
2366  */
2367
2368 static void
2369 gst_ffmpeg_caps_to_smpfmt (const GstCaps * caps,
2370     AVCodecContext * context, gboolean raw)
2371 {
2372   GstStructure *structure;
2373   const gchar *fmt;
2374   GstAudioFormat format = GST_AUDIO_FORMAT_UNKNOWN;
2375   gint bitrate;
2376
2377   g_return_if_fail (gst_caps_get_size (caps) == 1);
2378
2379   structure = gst_caps_get_structure (caps, 0);
2380
2381   gst_structure_get_int (structure, "channels", &context->channels);
2382   gst_structure_get_int (structure, "rate", &context->sample_rate);
2383   gst_structure_get_int (structure, "block_align", &context->block_align);
2384   if (gst_structure_get_int (structure, "bitrate", &bitrate))
2385     context->bit_rate = bitrate;
2386
2387   if (!raw)
2388     return;
2389
2390   if (gst_structure_has_name (structure, "audio/x-raw")) {
2391     if ((fmt = gst_structure_get_string (structure, "format"))) {
2392       format = gst_audio_format_from_string (fmt);
2393     }
2394   }
2395
2396   switch (format) {
2397     case GST_AUDIO_FORMAT_F32:
2398       context->sample_fmt = AV_SAMPLE_FMT_FLT;
2399       break;
2400     case GST_AUDIO_FORMAT_F64:
2401       context->sample_fmt = AV_SAMPLE_FMT_DBL;
2402       break;
2403     case GST_AUDIO_FORMAT_S32:
2404       context->sample_fmt = AV_SAMPLE_FMT_S32;
2405       break;
2406     case GST_AUDIO_FORMAT_S16:
2407       context->sample_fmt = AV_SAMPLE_FMT_S16;
2408       break;
2409     default:
2410       break;
2411   }
2412 }
2413
2414 /* Convert a GstCaps (video/raw) to a FFMPEG PixFmt
2415  * and other video properties in a AVCodecContext.
2416  *
2417  * For usefullness, see below
2418  */
2419
2420 static void
2421 gst_ffmpeg_caps_to_pixfmt (const GstCaps * caps,
2422     AVCodecContext * context, gboolean raw)
2423 {
2424   GstStructure *structure;
2425   const GValue *fps;
2426   const GValue *par = NULL;
2427   const gchar *fmt;
2428   GstVideoFormat format = GST_VIDEO_FORMAT_UNKNOWN;
2429
2430   GST_DEBUG ("converting caps %" GST_PTR_FORMAT, caps);
2431   g_return_if_fail (gst_caps_get_size (caps) == 1);
2432   structure = gst_caps_get_structure (caps, 0);
2433
2434   gst_structure_get_int (structure, "width", &context->width);
2435   gst_structure_get_int (structure, "height", &context->height);
2436   gst_structure_get_int (structure, "bpp", &context->bits_per_coded_sample);
2437
2438   fps = gst_structure_get_value (structure, "framerate");
2439   if (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps)) {
2440
2441     int num = gst_value_get_fraction_numerator (fps);
2442     int den = gst_value_get_fraction_denominator (fps);
2443
2444     if (num > 0 && den > 0) {
2445       /* somehow these seem mixed up.. */
2446       /* they're fine, this is because it does period=1/frequency */
2447       context->time_base.den = gst_value_get_fraction_numerator (fps);
2448       context->time_base.num = gst_value_get_fraction_denominator (fps);
2449       context->ticks_per_frame = 1;
2450
2451       GST_DEBUG ("setting framerate %d/%d = %lf",
2452           context->time_base.den, context->time_base.num,
2453           1. * context->time_base.den / context->time_base.num);
2454     } else {
2455       GST_INFO ("ignoring framerate %d/%d (probably variable framerate)",
2456           context->time_base.num, context->time_base.den);
2457     }
2458   }
2459
2460   par = gst_structure_get_value (structure, "pixel-aspect-ratio");
2461   if (par && GST_VALUE_HOLDS_FRACTION (par)) {
2462
2463     int num = gst_value_get_fraction_numerator (par);
2464     int den = gst_value_get_fraction_denominator (par);
2465
2466     if (num > 0 && den > 0) {
2467       context->sample_aspect_ratio.num = num;
2468       context->sample_aspect_ratio.den = den;
2469
2470       GST_DEBUG ("setting pixel-aspect-ratio %d/%d = %lf",
2471           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den,
2472           1. * context->sample_aspect_ratio.num /
2473           context->sample_aspect_ratio.den);
2474     } else {
2475       GST_WARNING ("ignoring insane pixel-aspect-ratio %d/%d",
2476           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den);
2477     }
2478   }
2479
2480   if (!raw)
2481     return;
2482
2483   g_return_if_fail (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps));
2484
2485   if (gst_structure_has_name (structure, "video/x-raw")) {
2486     if ((fmt = gst_structure_get_string (structure, "format"))) {
2487       format = gst_video_format_from_string (fmt);
2488     }
2489   }
2490
2491   switch (format) {
2492     case GST_VIDEO_FORMAT_YUY2:
2493       context->pix_fmt = AV_PIX_FMT_YUYV422;
2494       break;
2495     case GST_VIDEO_FORMAT_I420:
2496       context->pix_fmt = AV_PIX_FMT_YUV420P;
2497       break;
2498     case GST_VIDEO_FORMAT_A420:
2499       context->pix_fmt = AV_PIX_FMT_YUVA420P;
2500       break;
2501     case GST_VIDEO_FORMAT_Y41B:
2502       context->pix_fmt = AV_PIX_FMT_YUV411P;
2503       break;
2504     case GST_VIDEO_FORMAT_Y42B:
2505       context->pix_fmt = AV_PIX_FMT_YUV422P;
2506       break;
2507     case GST_VIDEO_FORMAT_YUV9:
2508       context->pix_fmt = AV_PIX_FMT_YUV410P;
2509       break;
2510     case GST_VIDEO_FORMAT_Y444:
2511       context->pix_fmt = AV_PIX_FMT_YUV444P;
2512       break;
2513     case GST_VIDEO_FORMAT_GRAY8:
2514       context->pix_fmt = AV_PIX_FMT_GRAY8;
2515       break;
2516     case GST_VIDEO_FORMAT_xRGB:
2517 #if (G_BYTE_ORDER == G_BIG_ENDIAN)
2518       context->pix_fmt = AV_PIX_FMT_RGB32;
2519 #endif
2520       break;
2521     case GST_VIDEO_FORMAT_BGRx:
2522 #if (G_BYTE_ORDER == G_LITTLE_ENDIAN)
2523       context->pix_fmt = AV_PIX_FMT_RGB32;
2524 #endif
2525       break;
2526     case GST_VIDEO_FORMAT_RGB:
2527       context->pix_fmt = AV_PIX_FMT_RGB24;
2528       break;
2529     case GST_VIDEO_FORMAT_BGR:
2530       context->pix_fmt = AV_PIX_FMT_BGR24;
2531       break;
2532     case GST_VIDEO_FORMAT_RGB16:
2533       context->pix_fmt = AV_PIX_FMT_RGB565;
2534       break;
2535     case GST_VIDEO_FORMAT_RGB15:
2536       context->pix_fmt = AV_PIX_FMT_RGB555;
2537       break;
2538     case GST_VIDEO_FORMAT_RGB8P:
2539       context->pix_fmt = AV_PIX_FMT_PAL8;
2540       break;
2541     default:
2542       break;
2543   }
2544 }
2545
2546 typedef struct
2547 {
2548   GstVideoFormat format;
2549   enum AVPixelFormat pixfmt;
2550 } PixToFmt;
2551
2552 /* FIXME : FILLME */
2553 static const PixToFmt pixtofmttable[] = {
2554   /* GST_VIDEO_FORMAT_I420, */
2555   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUV420P},
2556   /* Note : this should use a different chroma placement */
2557   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUVJ420P},
2558
2559   /* GST_VIDEO_FORMAT_YV12, */
2560   /* GST_VIDEO_FORMAT_YUY2, */
2561   {GST_VIDEO_FORMAT_YUY2, AV_PIX_FMT_YUYV422},
2562   /* GST_VIDEO_FORMAT_UYVY, */
2563   {GST_VIDEO_FORMAT_UYVY, AV_PIX_FMT_UYVY422},
2564   /* GST_VIDEO_FORMAT_AYUV, */
2565   /* GST_VIDEO_FORMAT_RGBx, */
2566   /* GST_VIDEO_FORMAT_BGRx, */
2567   /* GST_VIDEO_FORMAT_xRGB, */
2568   /* GST_VIDEO_FORMAT_xBGR, */
2569   /* GST_VIDEO_FORMAT_RGBA, */
2570   {GST_VIDEO_FORMAT_RGBA, AV_PIX_FMT_RGBA},
2571   /* GST_VIDEO_FORMAT_BGRA, */
2572   {GST_VIDEO_FORMAT_BGRA, AV_PIX_FMT_BGRA},
2573   /* GST_VIDEO_FORMAT_ARGB, */
2574   {GST_VIDEO_FORMAT_ARGB, AV_PIX_FMT_ARGB},
2575   /* GST_VIDEO_FORMAT_ABGR, */
2576   {GST_VIDEO_FORMAT_ABGR, AV_PIX_FMT_ABGR},
2577   /* GST_VIDEO_FORMAT_RGB, */
2578   {GST_VIDEO_FORMAT_RGB, AV_PIX_FMT_RGB24},
2579   /* GST_VIDEO_FORMAT_BGR, */
2580   {GST_VIDEO_FORMAT_BGR, AV_PIX_FMT_BGR24},
2581   /* GST_VIDEO_FORMAT_Y41B, */
2582   {GST_VIDEO_FORMAT_Y41B, AV_PIX_FMT_YUV411P},
2583   /* GST_VIDEO_FORMAT_Y42B, */
2584   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUV422P},
2585   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUVJ422P},
2586   /* GST_VIDEO_FORMAT_YVYU, */
2587   /* GST_VIDEO_FORMAT_Y444, */
2588   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUV444P},
2589   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUVJ444P},
2590   /* GST_VIDEO_FORMAT_v210, */
2591   /* GST_VIDEO_FORMAT_v216, */
2592   /* GST_VIDEO_FORMAT_NV12, */
2593   {GST_VIDEO_FORMAT_NV12, AV_PIX_FMT_NV12},
2594   /* GST_VIDEO_FORMAT_NV21, */
2595   {GST_VIDEO_FORMAT_NV21, AV_PIX_FMT_NV21},
2596   /* GST_VIDEO_FORMAT_GRAY8, */
2597   {GST_VIDEO_FORMAT_GRAY8, AV_PIX_FMT_GRAY8},
2598   /* GST_VIDEO_FORMAT_GRAY16_BE, */
2599   {GST_VIDEO_FORMAT_GRAY16_BE, AV_PIX_FMT_GRAY16BE},
2600   /* GST_VIDEO_FORMAT_GRAY16_LE, */
2601   {GST_VIDEO_FORMAT_GRAY16_LE, AV_PIX_FMT_GRAY16LE},
2602   /* GST_VIDEO_FORMAT_v308, */
2603   /* GST_VIDEO_FORMAT_Y800, */
2604   /* GST_VIDEO_FORMAT_Y16, */
2605   /* GST_VIDEO_FORMAT_RGB16, */
2606   {GST_VIDEO_FORMAT_RGB16, AV_PIX_FMT_RGB565},
2607   /* GST_VIDEO_FORMAT_BGR16, */
2608   /* GST_VIDEO_FORMAT_RGB15, */
2609   {GST_VIDEO_FORMAT_RGB15, AV_PIX_FMT_RGB555},
2610   /* GST_VIDEO_FORMAT_BGR15, */
2611   /* GST_VIDEO_FORMAT_UYVP, */
2612   /* GST_VIDEO_FORMAT_A420, */
2613   {GST_VIDEO_FORMAT_A420, AV_PIX_FMT_YUVA420P},
2614   /* GST_VIDEO_FORMAT_RGB8_PALETTED, */
2615   {GST_VIDEO_FORMAT_RGB8P, AV_PIX_FMT_PAL8},
2616   /* GST_VIDEO_FORMAT_YUV9, */
2617   {GST_VIDEO_FORMAT_YUV9, AV_PIX_FMT_YUV410P},
2618   /* GST_VIDEO_FORMAT_YVU9, */
2619   /* GST_VIDEO_FORMAT_IYU1, */
2620   /* GST_VIDEO_FORMAT_ARGB64, */
2621   /* GST_VIDEO_FORMAT_AYUV64, */
2622   /* GST_VIDEO_FORMAT_r210, */
2623   {GST_VIDEO_FORMAT_I420_10LE, AV_PIX_FMT_YUV420P10LE},
2624   {GST_VIDEO_FORMAT_I420_10BE, AV_PIX_FMT_YUV420P10BE},
2625   {GST_VIDEO_FORMAT_I422_10LE, AV_PIX_FMT_YUV422P10LE},
2626   {GST_VIDEO_FORMAT_I422_10BE, AV_PIX_FMT_YUV422P10BE},
2627   {GST_VIDEO_FORMAT_Y444_10LE, AV_PIX_FMT_YUV444P10LE},
2628   {GST_VIDEO_FORMAT_Y444_10BE, AV_PIX_FMT_YUV444P10BE},
2629   {GST_VIDEO_FORMAT_GBR, AV_PIX_FMT_GBRP},
2630   {GST_VIDEO_FORMAT_GBR_10LE, AV_PIX_FMT_GBRP10LE},
2631   {GST_VIDEO_FORMAT_GBR_10BE, AV_PIX_FMT_GBRP10BE},
2632   {GST_VIDEO_FORMAT_A420_10LE, AV_PIX_FMT_YUVA420P10LE},
2633   {GST_VIDEO_FORMAT_A420_10BE, AV_PIX_FMT_YUVA420P10BE},
2634   {GST_VIDEO_FORMAT_A422_10LE, AV_PIX_FMT_YUVA422P10LE},
2635   {GST_VIDEO_FORMAT_A422_10BE, AV_PIX_FMT_YUVA422P10BE},
2636   {GST_VIDEO_FORMAT_A444_10LE, AV_PIX_FMT_YUVA444P10LE},
2637   {GST_VIDEO_FORMAT_A444_10BE, AV_PIX_FMT_YUVA444P10BE},
2638 };
2639
2640 GstVideoFormat
2641 gst_ffmpeg_pixfmt_to_videoformat (enum AVPixelFormat pixfmt)
2642 {
2643   guint i;
2644
2645   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++)
2646     if (pixtofmttable[i].pixfmt == pixfmt)
2647       return pixtofmttable[i].format;
2648
2649   GST_DEBUG ("Unknown pixel format %d", pixfmt);
2650   return GST_VIDEO_FORMAT_UNKNOWN;
2651 }
2652
2653 static enum AVPixelFormat
2654 gst_ffmpeg_videoformat_to_pixfmt_for_codec (GstVideoFormat format,
2655     const AVCodec * codec)
2656 {
2657   guint i;
2658
2659   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++) {
2660     if (pixtofmttable[i].format == format) {
2661       gint j;
2662
2663       if (codec && codec->pix_fmts) {
2664         for (j = 0; codec->pix_fmts[j] != -1; j++) {
2665           if (pixtofmttable[i].pixfmt == codec->pix_fmts[j])
2666             return pixtofmttable[i].pixfmt;
2667         }
2668       } else {
2669         return pixtofmttable[i].pixfmt;
2670       }
2671     }
2672   }
2673
2674   return AV_PIX_FMT_NONE;
2675 }
2676
2677 enum AVPixelFormat
2678 gst_ffmpeg_videoformat_to_pixfmt (GstVideoFormat format)
2679 {
2680   return gst_ffmpeg_videoformat_to_pixfmt_for_codec (format, NULL);
2681 }
2682
2683 void
2684 gst_ffmpeg_videoinfo_to_context (GstVideoInfo * info, AVCodecContext * context)
2685 {
2686   gint i, bpp = 0;
2687
2688   context->width = GST_VIDEO_INFO_WIDTH (info);
2689   context->height = GST_VIDEO_INFO_HEIGHT (info);
2690   for (i = 0; i < GST_VIDEO_INFO_N_COMPONENTS (info); i++)
2691     bpp += GST_VIDEO_INFO_COMP_DEPTH (info, i);
2692   context->bits_per_coded_sample = bpp;
2693
2694   context->ticks_per_frame = 1;
2695   if (GST_VIDEO_INFO_FPS_N (info) == 0) {
2696     GST_DEBUG ("Using 25/1 framerate");
2697     context->time_base.den = 25;
2698     context->time_base.num = 1;
2699   } else {
2700     context->time_base.den = GST_VIDEO_INFO_FPS_N (info);
2701     context->time_base.num = GST_VIDEO_INFO_FPS_D (info);
2702   }
2703
2704   context->sample_aspect_ratio.num = GST_VIDEO_INFO_PAR_N (info);
2705   context->sample_aspect_ratio.den = GST_VIDEO_INFO_PAR_D (info);
2706
2707   context->pix_fmt =
2708       gst_ffmpeg_videoformat_to_pixfmt_for_codec (GST_VIDEO_INFO_FORMAT (info),
2709       context->codec);
2710 }
2711
2712 void
2713 gst_ffmpeg_audioinfo_to_context (GstAudioInfo * info, AVCodecContext * context)
2714 {
2715   const AVCodec *codec;
2716   const enum AVSampleFormat *smpl_fmts;
2717   enum AVSampleFormat smpl_fmt = -1;
2718
2719   context->channels = info->channels;
2720   context->sample_rate = info->rate;
2721   context->channel_layout =
2722       gst_ffmpeg_channel_positions_to_layout (info->position, info->channels);
2723
2724   codec = context->codec;
2725
2726   smpl_fmts = codec->sample_fmts;
2727
2728   switch (info->finfo->format) {
2729     case GST_AUDIO_FORMAT_F32:
2730       if (smpl_fmts) {
2731         while (*smpl_fmts != -1) {
2732           if (*smpl_fmts == AV_SAMPLE_FMT_FLT) {
2733             smpl_fmt = *smpl_fmts;
2734             break;
2735           } else if (*smpl_fmts == AV_SAMPLE_FMT_FLTP) {
2736             smpl_fmt = *smpl_fmts;
2737           }
2738
2739           smpl_fmts++;
2740         }
2741       } else {
2742         smpl_fmt = AV_SAMPLE_FMT_FLT;
2743       }
2744       break;
2745     case GST_AUDIO_FORMAT_F64:
2746       if (smpl_fmts) {
2747         while (*smpl_fmts != -1) {
2748           if (*smpl_fmts == AV_SAMPLE_FMT_DBL) {
2749             smpl_fmt = *smpl_fmts;
2750             break;
2751           } else if (*smpl_fmts == AV_SAMPLE_FMT_DBLP) {
2752             smpl_fmt = *smpl_fmts;
2753           }
2754
2755           smpl_fmts++;
2756         }
2757       } else {
2758         smpl_fmt = AV_SAMPLE_FMT_DBL;
2759       }
2760       break;
2761     case GST_AUDIO_FORMAT_S32:
2762       if (smpl_fmts) {
2763         while (*smpl_fmts != -1) {
2764           if (*smpl_fmts == AV_SAMPLE_FMT_S32) {
2765             smpl_fmt = *smpl_fmts;
2766             break;
2767           } else if (*smpl_fmts == AV_SAMPLE_FMT_S32P) {
2768             smpl_fmt = *smpl_fmts;
2769           }
2770
2771           smpl_fmts++;
2772         }
2773       } else {
2774         smpl_fmt = AV_SAMPLE_FMT_S32;
2775       }
2776       break;
2777     case GST_AUDIO_FORMAT_S16:
2778       if (smpl_fmts) {
2779         while (*smpl_fmts != -1) {
2780           if (*smpl_fmts == AV_SAMPLE_FMT_S16) {
2781             smpl_fmt = *smpl_fmts;
2782             break;
2783           } else if (*smpl_fmts == AV_SAMPLE_FMT_S16P) {
2784             smpl_fmt = *smpl_fmts;
2785           }
2786
2787           smpl_fmts++;
2788         }
2789       } else {
2790         smpl_fmt = AV_SAMPLE_FMT_S16;
2791       }
2792       break;
2793     case GST_AUDIO_FORMAT_U8:
2794       if (smpl_fmts) {
2795         while (*smpl_fmts != -1) {
2796           if (*smpl_fmts == AV_SAMPLE_FMT_U8) {
2797             smpl_fmt = *smpl_fmts;
2798             break;
2799           } else if (*smpl_fmts == AV_SAMPLE_FMT_U8P) {
2800             smpl_fmt = *smpl_fmts;
2801           }
2802
2803           smpl_fmts++;
2804         }
2805       } else {
2806         smpl_fmt = AV_SAMPLE_FMT_U8;
2807       }
2808       break;
2809     default:
2810       break;
2811   }
2812
2813   g_assert (smpl_fmt != -1);
2814
2815   context->sample_fmt = smpl_fmt;
2816 }
2817
2818 /* Convert a GstCaps and a FFMPEG codec Type to a
2819  * AVCodecContext. If the context is ommitted, no fixed values
2820  * for video/audio size will be included in the context
2821  *
2822  * AVMediaType is primarily meant for uncompressed data GstCaps!
2823  */
2824
2825 void
2826 gst_ffmpeg_caps_with_codectype (enum AVMediaType type,
2827     const GstCaps * caps, AVCodecContext * context)
2828 {
2829   if (context == NULL)
2830     return;
2831
2832   switch (type) {
2833     case AVMEDIA_TYPE_VIDEO:
2834       gst_ffmpeg_caps_to_pixfmt (caps, context, TRUE);
2835       break;
2836
2837     case AVMEDIA_TYPE_AUDIO:
2838       gst_ffmpeg_caps_to_smpfmt (caps, context, TRUE);
2839       break;
2840
2841     default:
2842       /* unknown */
2843       break;
2844   }
2845 }
2846
2847 #if 0
2848 static void
2849 nal_escape (guint8 * dst, guint8 * src, guint size, guint * destsize)
2850 {
2851   guint8 *dstp = dst;
2852   guint8 *srcp = src;
2853   guint8 *end = src + size;
2854   gint count = 0;
2855
2856   while (srcp < end) {
2857     if (count == 2 && *srcp <= 0x03) {
2858       GST_DEBUG ("added escape code");
2859       *dstp++ = 0x03;
2860       count = 0;
2861     }
2862     if (*srcp == 0)
2863       count++;
2864     else
2865       count = 0;
2866
2867     GST_DEBUG ("copy %02x, count %d", *srcp, count);
2868     *dstp++ = *srcp++;
2869   }
2870   *destsize = dstp - dst;
2871 }
2872
2873 /* copy the config, escaping NAL units as we iterate them, if something fails we
2874  * copy everything and hope for the best. */
2875 static void
2876 copy_config (guint8 * dst, guint8 * src, guint size, guint * destsize)
2877 {
2878   guint8 *dstp = dst;
2879   guint8 *srcp = src;
2880   gint cnt, i;
2881   guint nalsize, esize;
2882
2883   /* check size */
2884   if (size < 7)
2885     goto full_copy;
2886
2887   /* check version */
2888   if (*srcp != 1)
2889     goto full_copy;
2890
2891   cnt = *(srcp + 5) & 0x1f;     /* Number of sps */
2892
2893   GST_DEBUG ("num SPS %d", cnt);
2894
2895   memcpy (dstp, srcp, 6);
2896   srcp += 6;
2897   dstp += 6;
2898
2899   for (i = 0; i < cnt; i++) {
2900     GST_DEBUG ("copy SPS %d", i);
2901     nalsize = (srcp[0] << 8) | srcp[1];
2902     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
2903     dstp[0] = esize >> 8;
2904     dstp[1] = esize & 0xff;
2905     dstp += esize + 2;
2906     srcp += nalsize + 2;
2907   }
2908
2909   cnt = *(dstp++) = *(srcp++);  /* Number of pps */
2910
2911   GST_DEBUG ("num PPS %d", cnt);
2912
2913   for (i = 0; i < cnt; i++) {
2914     GST_DEBUG ("copy PPS %d", i);
2915     nalsize = (srcp[0] << 8) | srcp[1];
2916     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
2917     dstp[0] = esize >> 8;
2918     dstp[1] = esize & 0xff;
2919     dstp += esize + 2;
2920     srcp += nalsize + 2;
2921   }
2922   *destsize = dstp - dst;
2923
2924   return;
2925
2926 full_copy:
2927   {
2928     GST_DEBUG ("something unexpected, doing full copy");
2929     memcpy (dst, src, size);
2930     *destsize = size;
2931     return;
2932   }
2933 }
2934 #endif
2935
2936 /*
2937  * caps_with_codecid () transforms a GstCaps for a known codec
2938  * ID into a filled-in context.
2939  * codec_data from caps will override possible extradata already in the context
2940  */
2941
2942 void
2943 gst_ffmpeg_caps_with_codecid (enum AVCodecID codec_id,
2944     enum AVMediaType codec_type, const GstCaps * caps, AVCodecContext * context)
2945 {
2946   GstStructure *str;
2947   const GValue *value;
2948   GstBuffer *buf;
2949
2950   GST_LOG ("codec_id:%d, codec_type:%d, caps:%" GST_PTR_FORMAT " context:%p",
2951       codec_id, codec_type, caps, context);
2952
2953   if (!context || !gst_caps_get_size (caps))
2954     return;
2955
2956   str = gst_caps_get_structure (caps, 0);
2957
2958   /* extradata parsing (esds [mpeg4], wma/wmv, msmpeg4v1/2/3, etc.) */
2959   if ((value = gst_structure_get_value (str, "codec_data"))) {
2960     GstMapInfo map;
2961
2962     buf = gst_value_get_buffer (value);
2963     gst_buffer_map (buf, &map, GST_MAP_READ);
2964
2965     /* free the old one if it is there */
2966     if (context->extradata)
2967       av_free (context->extradata);
2968
2969 #if 0
2970     if (codec_id == AV_CODEC_ID_H264) {
2971       guint extrasize;
2972
2973       GST_DEBUG ("copy, escaping codec_data %d", size);
2974       /* ffmpeg h264 expects the codec_data to be escaped, there is no real
2975        * reason for this but let's just escape it for now. Start by allocating
2976        * enough space, x2 is more than enough.
2977        *
2978        * FIXME, we disabled escaping because some file already contain escaped
2979        * codec_data and then we escape twice and fail. It's better to leave it
2980        * as is, as that is what most players do. */
2981       context->extradata =
2982           av_mallocz (GST_ROUND_UP_16 (size * 2 +
2983               FF_INPUT_BUFFER_PADDING_SIZE));
2984       copy_config (context->extradata, data, size, &extrasize);
2985       GST_DEBUG ("escaped size: %d", extrasize);
2986       context->extradata_size = extrasize;
2987     } else
2988 #endif
2989     {
2990       /* allocate with enough padding */
2991       GST_DEBUG ("copy codec_data");
2992       context->extradata =
2993           av_mallocz (GST_ROUND_UP_16 (map.size +
2994               FF_INPUT_BUFFER_PADDING_SIZE));
2995       memcpy (context->extradata, map.data, map.size);
2996       context->extradata_size = map.size;
2997     }
2998
2999     /* Hack for VC1. Sometimes the first (length) byte is 0 for some files */
3000     if (codec_id == AV_CODEC_ID_VC1 && map.size > 0 && map.data[0] == 0) {
3001       context->extradata[0] = (guint8) map.size;
3002     }
3003
3004     GST_DEBUG ("have codec data of size %" G_GSIZE_FORMAT, map.size);
3005
3006     gst_buffer_unmap (buf, &map);
3007   } else {
3008     context->extradata = NULL;
3009     context->extradata_size = 0;
3010     GST_DEBUG ("no codec data");
3011   }
3012
3013   switch (codec_id) {
3014     case AV_CODEC_ID_MPEG4:
3015     {
3016       const gchar *mime = gst_structure_get_name (str);
3017
3018       context->flags |= CODEC_FLAG_4MV;
3019
3020       if (!strcmp (mime, "video/x-divx"))
3021         context->codec_tag = GST_MAKE_FOURCC ('D', 'I', 'V', 'X');
3022       else if (!strcmp (mime, "video/mpeg")) {
3023         const gchar *profile;
3024
3025         context->codec_tag = GST_MAKE_FOURCC ('m', 'p', '4', 'v');
3026
3027         profile = gst_structure_get_string (str, "profile");
3028         if (profile) {
3029           if (g_strcmp0 (profile, "advanced-simple") == 0)
3030             context->flags |= CODEC_FLAG_GMC | CODEC_FLAG_QPEL;
3031         }
3032       }
3033       break;
3034     }
3035
3036     case AV_CODEC_ID_SVQ3:
3037       /* FIXME: this is a workaround for older gst-plugins releases
3038        * (<= 0.8.9). This should be removed at some point, because
3039        * it causes wrong decoded frame order. */
3040       if (!context->extradata) {
3041         gint halfpel_flag, thirdpel_flag, low_delay, unknown_svq3_flag;
3042         guint16 flags;
3043
3044         if (gst_structure_get_int (str, "halfpel_flag", &halfpel_flag) &&
3045             gst_structure_get_int (str, "thirdpel_flag", &thirdpel_flag) &&
3046             gst_structure_get_int (str, "low_delay", &low_delay) &&
3047             gst_structure_get_int (str, "unknown_svq3_flag",
3048                 &unknown_svq3_flag)) {
3049           context->extradata = (guint8 *) av_mallocz (0x64);
3050           g_stpcpy ((gchar *) context->extradata, "SVQ3");
3051           flags = 1 << 3;
3052           flags |= low_delay;
3053           flags = flags << 2;
3054           flags |= unknown_svq3_flag;
3055           flags = flags << 6;
3056           flags |= halfpel_flag;
3057           flags = flags << 1;
3058           flags |= thirdpel_flag;
3059           flags = flags << 3;
3060
3061           flags = GUINT16_FROM_LE (flags);
3062
3063           memcpy ((gchar *) context->extradata + 0x62, &flags, 2);
3064           context->extradata_size = 0x64;
3065         }
3066       }
3067       break;
3068
3069     case AV_CODEC_ID_MSRLE:
3070     case AV_CODEC_ID_QTRLE:
3071     case AV_CODEC_ID_TSCC:
3072     case AV_CODEC_ID_CSCD:
3073     case AV_CODEC_ID_APE:
3074     {
3075       gint depth;
3076
3077       if (gst_structure_get_int (str, "depth", &depth)) {
3078         context->bits_per_coded_sample = depth;
3079       } else {
3080         GST_WARNING ("No depth field in caps %" GST_PTR_FORMAT, caps);
3081       }
3082
3083     }
3084       break;
3085
3086     case AV_CODEC_ID_COOK:
3087     case AV_CODEC_ID_RA_288:
3088     case AV_CODEC_ID_RA_144:
3089     case AV_CODEC_ID_SIPR:
3090     {
3091       gint leaf_size;
3092       gint bitrate;
3093
3094       if (gst_structure_get_int (str, "leaf_size", &leaf_size))
3095         context->block_align = leaf_size;
3096       if (gst_structure_get_int (str, "bitrate", &bitrate))
3097         context->bit_rate = bitrate;
3098     }
3099       break;
3100     case AV_CODEC_ID_ALAC:
3101       gst_structure_get_int (str, "samplesize",
3102           &context->bits_per_coded_sample);
3103       break;
3104
3105     case AV_CODEC_ID_DVVIDEO:
3106     {
3107       const gchar *format;
3108
3109       if ((format = gst_structure_get_string (str, "format"))) {
3110
3111         if (g_str_equal (format, "YUY2"))
3112           context->pix_fmt = AV_PIX_FMT_YUYV422;
3113         else if (g_str_equal (format, "I420"))
3114           context->pix_fmt = AV_PIX_FMT_YUV420P;
3115         else if (g_str_equal (format, "A420"))
3116           context->pix_fmt = AV_PIX_FMT_YUVA420P;
3117         else if (g_str_equal (format, "Y41B"))
3118           context->pix_fmt = AV_PIX_FMT_YUV411P;
3119         else if (g_str_equal (format, "Y42B"))
3120           context->pix_fmt = AV_PIX_FMT_YUV422P;
3121         else if (g_str_equal (format, "YUV9"))
3122           context->pix_fmt = AV_PIX_FMT_YUV410P;
3123         else {
3124           GST_WARNING ("couldn't convert format %s" " to a pixel format",
3125               format);
3126         }
3127       } else
3128         GST_WARNING ("No specified format");
3129       break;
3130     }
3131     case AV_CODEC_ID_H263P:
3132     {
3133       gboolean val;
3134
3135       if (!gst_structure_get_boolean (str, "annex-f", &val) || val)
3136         context->flags |= CODEC_FLAG_4MV;
3137       else
3138         context->flags &= ~CODEC_FLAG_4MV;
3139       if ((!gst_structure_get_boolean (str, "annex-i", &val) || val) &&
3140           (!gst_structure_get_boolean (str, "annex-t", &val) || val))
3141         context->flags |= CODEC_FLAG_AC_PRED;
3142       else
3143         context->flags &= ~CODEC_FLAG_AC_PRED;
3144       if (!gst_structure_get_boolean (str, "annex-j", &val) || val)
3145         context->flags |= CODEC_FLAG_LOOP_FILTER;
3146       else
3147         context->flags &= ~CODEC_FLAG_LOOP_FILTER;
3148       break;
3149     }
3150     case AV_CODEC_ID_ADPCM_G726:
3151     {
3152       const gchar *layout;
3153
3154       if ((layout = gst_structure_get_string (str, "layout"))) {
3155         if (!strcmp (layout, "g721")) {
3156           context->sample_rate = 8000;
3157           context->channels = 1;
3158           context->bit_rate = 32000;
3159         }
3160       }
3161       break;
3162     }
3163     default:
3164       break;
3165   }
3166
3167   if (!gst_caps_is_fixed (caps))
3168     return;
3169
3170   /* common properties (width, height, fps) */
3171   switch (codec_type) {
3172     case AVMEDIA_TYPE_VIDEO:
3173       gst_ffmpeg_caps_to_pixfmt (caps, context,
3174           codec_id == AV_CODEC_ID_RAWVIDEO);
3175       break;
3176     case AVMEDIA_TYPE_AUDIO:
3177       gst_ffmpeg_caps_to_smpfmt (caps, context, FALSE);
3178       break;
3179     default:
3180       break;
3181   }
3182
3183   /* fixup of default settings */
3184   switch (codec_id) {
3185     case AV_CODEC_ID_QCELP:
3186       /* QCELP is always mono, no matter what the caps say */
3187       context->channels = 1;
3188       break;
3189     case AV_CODEC_ID_ADPCM_G726:
3190       if (context->sample_rate && context->bit_rate)
3191         context->bits_per_coded_sample =
3192             context->bit_rate / context->sample_rate;
3193       break;
3194     default:
3195       break;
3196   }
3197 }
3198
3199 /* _formatid_to_caps () is meant for muxers/demuxers, it
3200  * transforms a name (ffmpeg way of ID'ing these, why don't
3201  * they have unique numerical IDs?) to the corresponding
3202  * caps belonging to that mux-format
3203  *
3204  * Note: we don't need any additional info because the caps
3205  * isn't supposed to contain any useful info besides the
3206  * media type anyway
3207  */
3208
3209 GstCaps *
3210 gst_ffmpeg_formatid_to_caps (const gchar * format_name)
3211 {
3212   GstCaps *caps = NULL;
3213
3214   if (!strcmp (format_name, "mpeg")) {
3215     caps = gst_caps_new_simple ("video/mpeg",
3216         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3217   } else if (!strcmp (format_name, "mpegts")) {
3218     caps = gst_caps_new_simple ("video/mpegts",
3219         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3220   } else if (!strcmp (format_name, "rm")) {
3221     caps = gst_caps_new_simple ("application/x-pn-realmedia",
3222         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3223   } else if (!strcmp (format_name, "asf")) {
3224     caps = gst_caps_new_empty_simple ("video/x-ms-asf");
3225   } else if (!strcmp (format_name, "avi")) {
3226     caps = gst_caps_new_empty_simple ("video/x-msvideo");
3227   } else if (!strcmp (format_name, "wav")) {
3228     caps = gst_caps_new_empty_simple ("audio/x-wav");
3229   } else if (!strcmp (format_name, "ape")) {
3230     caps = gst_caps_new_empty_simple ("application/x-ape");
3231   } else if (!strcmp (format_name, "swf")) {
3232     caps = gst_caps_new_empty_simple ("application/x-shockwave-flash");
3233   } else if (!strcmp (format_name, "au")) {
3234     caps = gst_caps_new_empty_simple ("audio/x-au");
3235   } else if (!strcmp (format_name, "dv")) {
3236     caps = gst_caps_new_simple ("video/x-dv",
3237         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3238   } else if (!strcmp (format_name, "4xm")) {
3239     caps = gst_caps_new_empty_simple ("video/x-4xm");
3240   } else if (!strcmp (format_name, "matroska")) {
3241     caps = gst_caps_new_empty_simple ("video/x-matroska");
3242   } else if (!strcmp (format_name, "mp3")) {
3243     caps = gst_caps_new_empty_simple ("application/x-id3");
3244   } else if (!strcmp (format_name, "flic")) {
3245     caps = gst_caps_new_empty_simple ("video/x-fli");
3246   } else if (!strcmp (format_name, "flv")) {
3247     caps = gst_caps_new_empty_simple ("video/x-flv");
3248   } else if (!strcmp (format_name, "tta")) {
3249     caps = gst_caps_new_empty_simple ("audio/x-ttafile");
3250   } else if (!strcmp (format_name, "aiff")) {
3251     caps = gst_caps_new_empty_simple ("audio/x-aiff");
3252   } else if (!strcmp (format_name, "mov_mp4_m4a_3gp_3g2")) {
3253     caps =
3254         gst_caps_from_string
3255         ("application/x-3gp; video/quicktime; audio/x-m4a");
3256   } else if (!strcmp (format_name, "mov")) {
3257     caps = gst_caps_from_string ("video/quicktime,variant=(string)apple");
3258   } else if (!strcmp (format_name, "mp4")) {
3259     caps = gst_caps_from_string ("video/quicktime,variant=(string)iso");
3260   } else if (!strcmp (format_name, "3gp")) {
3261     caps = gst_caps_from_string ("video/quicktime,variant=(string)3gpp");
3262   } else if (!strcmp (format_name, "3g2")) {
3263     caps = gst_caps_from_string ("video/quicktime,variant=(string)3g2");
3264   } else if (!strcmp (format_name, "psp")) {
3265     caps = gst_caps_from_string ("video/quicktime,variant=(string)psp");
3266   } else if (!strcmp (format_name, "ipod")) {
3267     caps = gst_caps_from_string ("video/quicktime,variant=(string)ipod");
3268   } else if (!strcmp (format_name, "aac")) {
3269     caps = gst_caps_new_simple ("audio/mpeg",
3270         "mpegversion", G_TYPE_INT, 4, NULL);
3271   } else if (!strcmp (format_name, "gif")) {
3272     caps = gst_caps_from_string ("image/gif");
3273   } else if (!strcmp (format_name, "ogg")) {
3274     caps = gst_caps_from_string ("application/ogg");
3275   } else if (!strcmp (format_name, "mxf") || !strcmp (format_name, "mxf_d10")) {
3276     caps = gst_caps_from_string ("application/mxf");
3277   } else if (!strcmp (format_name, "gxf")) {
3278     caps = gst_caps_from_string ("application/gxf");
3279   } else if (!strcmp (format_name, "yuv4mpegpipe")) {
3280     caps = gst_caps_new_simple ("application/x-yuv4mpeg",
3281         "y4mversion", G_TYPE_INT, 2, NULL);
3282   } else if (!strcmp (format_name, "mpc")) {
3283     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 7");
3284   } else if (!strcmp (format_name, "mpc8")) {
3285     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 8");
3286   } else if (!strcmp (format_name, "vqf")) {
3287     caps = gst_caps_from_string ("audio/x-vqf");
3288   } else if (!strcmp (format_name, "nsv")) {
3289     caps = gst_caps_from_string ("video/x-nsv");
3290   } else if (!strcmp (format_name, "amr")) {
3291     caps = gst_caps_from_string ("audio/x-amr-nb-sh");
3292   } else if (!strcmp (format_name, "webm")) {
3293     caps = gst_caps_from_string ("video/webm");
3294   } else if (!strcmp (format_name, "voc")) {
3295     caps = gst_caps_from_string ("audio/x-voc");
3296   } else if (!strcmp (format_name, "pva")) {
3297     caps = gst_caps_from_string ("video/x-pva");
3298   } else {
3299     gchar *name;
3300
3301     GST_LOG ("Could not create stream format caps for %s", format_name);
3302     name = g_strdup_printf ("application/x-gst-av-%s", format_name);
3303     caps = gst_caps_new_empty_simple (name);
3304     g_free (name);
3305   }
3306
3307   return caps;
3308 }
3309
3310 gboolean
3311 gst_ffmpeg_formatid_get_codecids (const gchar * format_name,
3312     enum AVCodecID ** video_codec_list, enum AVCodecID ** audio_codec_list,
3313     AVOutputFormat * plugin)
3314 {
3315   static enum AVCodecID tmp_vlist[] = {
3316     AV_CODEC_ID_NONE,
3317     AV_CODEC_ID_NONE
3318   };
3319   static enum AVCodecID tmp_alist[] = {
3320     AV_CODEC_ID_NONE,
3321     AV_CODEC_ID_NONE
3322   };
3323
3324   GST_LOG ("format_name : %s", format_name);
3325
3326   if (!strcmp (format_name, "mp4")) {
3327     static enum AVCodecID mp4_video_list[] = {
3328       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H264,
3329       AV_CODEC_ID_MJPEG,
3330       AV_CODEC_ID_NONE
3331     };
3332     static enum AVCodecID mp4_audio_list[] = {
3333       AV_CODEC_ID_AAC, AV_CODEC_ID_MP3,
3334       AV_CODEC_ID_NONE
3335     };
3336
3337     *video_codec_list = mp4_video_list;
3338     *audio_codec_list = mp4_audio_list;
3339   } else if (!strcmp (format_name, "mpeg")) {
3340     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3341       AV_CODEC_ID_MPEG2VIDEO,
3342       AV_CODEC_ID_H264,
3343       AV_CODEC_ID_NONE
3344     };
3345     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP1,
3346       AV_CODEC_ID_MP2,
3347       AV_CODEC_ID_MP3,
3348       AV_CODEC_ID_NONE
3349     };
3350
3351     *video_codec_list = mpeg_video_list;
3352     *audio_codec_list = mpeg_audio_list;
3353   } else if (!strcmp (format_name, "dvd")) {
3354     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG2VIDEO,
3355       AV_CODEC_ID_NONE
3356     };
3357     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP2,
3358       AV_CODEC_ID_AC3,
3359       AV_CODEC_ID_DTS,
3360       AV_CODEC_ID_PCM_S16BE,
3361       AV_CODEC_ID_NONE
3362     };
3363
3364     *video_codec_list = mpeg_video_list;
3365     *audio_codec_list = mpeg_audio_list;
3366   } else if (!strcmp (format_name, "mpegts")) {
3367     static enum AVCodecID mpegts_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3368       AV_CODEC_ID_MPEG2VIDEO,
3369       AV_CODEC_ID_H264,
3370       AV_CODEC_ID_NONE
3371     };
3372     static enum AVCodecID mpegts_audio_list[] = { AV_CODEC_ID_MP2,
3373       AV_CODEC_ID_MP3,
3374       AV_CODEC_ID_AC3,
3375       AV_CODEC_ID_DTS,
3376       AV_CODEC_ID_AAC,
3377       AV_CODEC_ID_NONE
3378     };
3379
3380     *video_codec_list = mpegts_video_list;
3381     *audio_codec_list = mpegts_audio_list;
3382   } else if (!strcmp (format_name, "vob")) {
3383     static enum AVCodecID vob_video_list[] =
3384         { AV_CODEC_ID_MPEG2VIDEO, AV_CODEC_ID_NONE };
3385     static enum AVCodecID vob_audio_list[] = { AV_CODEC_ID_MP2, AV_CODEC_ID_AC3,
3386       AV_CODEC_ID_DTS, AV_CODEC_ID_NONE
3387     };
3388
3389     *video_codec_list = vob_video_list;
3390     *audio_codec_list = vob_audio_list;
3391   } else if (!strcmp (format_name, "flv")) {
3392     static enum AVCodecID flv_video_list[] =
3393         { AV_CODEC_ID_FLV1, AV_CODEC_ID_NONE };
3394     static enum AVCodecID flv_audio_list[] =
3395         { AV_CODEC_ID_MP3, AV_CODEC_ID_NONE };
3396
3397     *video_codec_list = flv_video_list;
3398     *audio_codec_list = flv_audio_list;
3399   } else if (!strcmp (format_name, "asf")) {
3400     static enum AVCodecID asf_video_list[] =
3401         { AV_CODEC_ID_WMV1, AV_CODEC_ID_WMV2, AV_CODEC_ID_MSMPEG4V3,
3402       AV_CODEC_ID_NONE
3403     };
3404     static enum AVCodecID asf_audio_list[] =
3405         { AV_CODEC_ID_WMAV1, AV_CODEC_ID_WMAV2, AV_CODEC_ID_MP3,
3406       AV_CODEC_ID_NONE
3407     };
3408
3409     *video_codec_list = asf_video_list;
3410     *audio_codec_list = asf_audio_list;
3411   } else if (!strcmp (format_name, "dv")) {
3412     static enum AVCodecID dv_video_list[] =
3413         { AV_CODEC_ID_DVVIDEO, AV_CODEC_ID_NONE };
3414     static enum AVCodecID dv_audio_list[] =
3415         { AV_CODEC_ID_PCM_S16LE, AV_CODEC_ID_NONE };
3416
3417     *video_codec_list = dv_video_list;
3418     *audio_codec_list = dv_audio_list;
3419   } else if (!strcmp (format_name, "mov")) {
3420     static enum AVCodecID mov_video_list[] = {
3421       AV_CODEC_ID_SVQ1, AV_CODEC_ID_SVQ3, AV_CODEC_ID_MPEG4,
3422       AV_CODEC_ID_H263, AV_CODEC_ID_H263P,
3423       AV_CODEC_ID_H264, AV_CODEC_ID_DVVIDEO,
3424       AV_CODEC_ID_MJPEG,
3425       AV_CODEC_ID_NONE
3426     };
3427     static enum AVCodecID mov_audio_list[] = {
3428       AV_CODEC_ID_PCM_MULAW, AV_CODEC_ID_PCM_ALAW, AV_CODEC_ID_ADPCM_IMA_QT,
3429       AV_CODEC_ID_MACE3, AV_CODEC_ID_MACE6, AV_CODEC_ID_AAC,
3430       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3431       AV_CODEC_ID_PCM_S16BE, AV_CODEC_ID_PCM_S16LE,
3432       AV_CODEC_ID_MP3, AV_CODEC_ID_NONE
3433     };
3434
3435     *video_codec_list = mov_video_list;
3436     *audio_codec_list = mov_audio_list;
3437   } else if ((!strcmp (format_name, "3gp") || !strcmp (format_name, "3g2"))) {
3438     static enum AVCodecID tgp_video_list[] = {
3439       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H263, AV_CODEC_ID_H263P, AV_CODEC_ID_H264,
3440       AV_CODEC_ID_NONE
3441     };
3442     static enum AVCodecID tgp_audio_list[] = {
3443       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3444       AV_CODEC_ID_AAC,
3445       AV_CODEC_ID_NONE
3446     };
3447
3448     *video_codec_list = tgp_video_list;
3449     *audio_codec_list = tgp_audio_list;
3450   } else if (!strcmp (format_name, "mmf")) {
3451     static enum AVCodecID mmf_audio_list[] = {
3452       AV_CODEC_ID_ADPCM_YAMAHA, AV_CODEC_ID_NONE
3453     };
3454     *video_codec_list = NULL;
3455     *audio_codec_list = mmf_audio_list;
3456   } else if (!strcmp (format_name, "amr")) {
3457     static enum AVCodecID amr_audio_list[] = {
3458       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3459       AV_CODEC_ID_NONE
3460     };
3461     *video_codec_list = NULL;
3462     *audio_codec_list = amr_audio_list;
3463   } else if (!strcmp (format_name, "gif")) {
3464     static enum AVCodecID gif_image_list[] = {
3465       AV_CODEC_ID_RAWVIDEO, AV_CODEC_ID_NONE
3466     };
3467     *video_codec_list = gif_image_list;
3468     *audio_codec_list = NULL;
3469   } else if ((plugin->audio_codec != AV_CODEC_ID_NONE) ||
3470       (plugin->video_codec != AV_CODEC_ID_NONE)) {
3471     tmp_vlist[0] = plugin->video_codec;
3472     tmp_alist[0] = plugin->audio_codec;
3473
3474     *video_codec_list = tmp_vlist;
3475     *audio_codec_list = tmp_alist;
3476   } else if ((!strcmp (format_name, "pva"))) {
3477     static enum AVCodecID tgp_video_list[] = {
3478       AV_CODEC_ID_MPEG2VIDEO,
3479       AV_CODEC_ID_NONE
3480     };
3481     static enum AVCodecID tgp_audio_list[] = {
3482       AV_CODEC_ID_MP2,
3483       AV_CODEC_ID_NONE
3484     };
3485
3486     *video_codec_list = tgp_video_list;
3487     *audio_codec_list = tgp_audio_list;
3488   } else {
3489     GST_LOG ("Format %s not found", format_name);
3490     return FALSE;
3491   }
3492
3493   return TRUE;
3494 }
3495
3496 /* Convert a GstCaps to a FFMPEG codec ID. Size et all
3497  * are omitted, that can be queried by the user itself,
3498  * we're not eating the GstCaps or anything
3499  * A pointer to an allocated context is also needed for
3500  * optional extra info
3501  */
3502
3503 enum AVCodecID
3504 gst_ffmpeg_caps_to_codecid (const GstCaps * caps, AVCodecContext * context)
3505 {
3506   enum AVCodecID id = AV_CODEC_ID_NONE;
3507   const gchar *mimetype;
3508   const GstStructure *structure;
3509   gboolean video = FALSE, audio = FALSE;        /* we want to be sure! */
3510
3511   g_return_val_if_fail (caps != NULL, AV_CODEC_ID_NONE);
3512   g_return_val_if_fail (gst_caps_get_size (caps) == 1, AV_CODEC_ID_NONE);
3513   structure = gst_caps_get_structure (caps, 0);
3514
3515   mimetype = gst_structure_get_name (structure);
3516
3517   if (!strcmp (mimetype, "video/x-raw")) {
3518     id = AV_CODEC_ID_RAWVIDEO;
3519     video = TRUE;
3520   } else if (!strcmp (mimetype, "audio/x-raw")) {
3521     GstAudioInfo info;
3522
3523     if (gst_audio_info_from_caps (&info, caps)) {
3524       switch (GST_AUDIO_INFO_FORMAT (&info)) {
3525         case GST_AUDIO_FORMAT_S8:
3526           id = AV_CODEC_ID_PCM_S8;
3527           break;
3528         case GST_AUDIO_FORMAT_U8:
3529           id = AV_CODEC_ID_PCM_U8;
3530           break;
3531         case GST_AUDIO_FORMAT_S16LE:
3532           id = AV_CODEC_ID_PCM_S16LE;
3533           break;
3534         case GST_AUDIO_FORMAT_S16BE:
3535           id = AV_CODEC_ID_PCM_S16BE;
3536           break;
3537         case GST_AUDIO_FORMAT_U16LE:
3538           id = AV_CODEC_ID_PCM_U16LE;
3539           break;
3540         case GST_AUDIO_FORMAT_U16BE:
3541           id = AV_CODEC_ID_PCM_U16BE;
3542           break;
3543         default:
3544           break;
3545       }
3546       if (id != AV_CODEC_ID_NONE)
3547         audio = TRUE;
3548     }
3549   } else if (!strcmp (mimetype, "audio/x-mulaw")) {
3550     id = AV_CODEC_ID_PCM_MULAW;
3551     audio = TRUE;
3552   } else if (!strcmp (mimetype, "audio/x-alaw")) {
3553     id = AV_CODEC_ID_PCM_ALAW;
3554     audio = TRUE;
3555   } else if (!strcmp (mimetype, "video/x-dv")) {
3556     gboolean sys_strm;
3557
3558     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3559         !sys_strm) {
3560       id = AV_CODEC_ID_DVVIDEO;
3561       video = TRUE;
3562     }
3563   } else if (!strcmp (mimetype, "audio/x-dv")) {        /* ??? */
3564     id = AV_CODEC_ID_DVAUDIO;
3565     audio = TRUE;
3566   } else if (!strcmp (mimetype, "video/x-h263")) {
3567     const gchar *h263version =
3568         gst_structure_get_string (structure, "h263version");
3569     if (h263version && !strcmp (h263version, "h263p"))
3570       id = AV_CODEC_ID_H263P;
3571     else
3572       id = AV_CODEC_ID_H263;
3573     video = TRUE;
3574   } else if (!strcmp (mimetype, "video/x-intel-h263")) {
3575     id = AV_CODEC_ID_H263I;
3576     video = TRUE;
3577   } else if (!strcmp (mimetype, "video/x-h261")) {
3578     id = AV_CODEC_ID_H261;
3579     video = TRUE;
3580   } else if (!strcmp (mimetype, "video/mpeg")) {
3581     gboolean sys_strm;
3582     gint mpegversion;
3583
3584     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3585         gst_structure_get_int (structure, "mpegversion", &mpegversion) &&
3586         !sys_strm) {
3587       switch (mpegversion) {
3588         case 1:
3589           id = AV_CODEC_ID_MPEG1VIDEO;
3590           break;
3591         case 2:
3592           id = AV_CODEC_ID_MPEG2VIDEO;
3593           break;
3594         case 4:
3595           id = AV_CODEC_ID_MPEG4;
3596           break;
3597       }
3598     }
3599     if (id != AV_CODEC_ID_NONE)
3600       video = TRUE;
3601   } else if (!strcmp (mimetype, "image/jpeg")) {
3602     id = AV_CODEC_ID_MJPEG;     /* A... B... */
3603     video = TRUE;
3604   } else if (!strcmp (mimetype, "video/x-jpeg-b")) {
3605     id = AV_CODEC_ID_MJPEGB;
3606     video = TRUE;
3607   } else if (!strcmp (mimetype, "video/x-wmv")) {
3608     gint wmvversion = 0;
3609
3610     if (gst_structure_get_int (structure, "wmvversion", &wmvversion)) {
3611       switch (wmvversion) {
3612         case 1:
3613           id = AV_CODEC_ID_WMV1;
3614           break;
3615         case 2:
3616           id = AV_CODEC_ID_WMV2;
3617           break;
3618         case 3:
3619         {
3620           const gchar *format;
3621
3622           /* WMV3 unless the fourcc exists and says otherwise */
3623           id = AV_CODEC_ID_WMV3;
3624
3625           if ((format = gst_structure_get_string (structure, "format")) &&
3626               (g_str_equal (format, "WVC1") || g_str_equal (format, "WMVA")))
3627             id = AV_CODEC_ID_VC1;
3628
3629           break;
3630         }
3631       }
3632     }
3633     if (id != AV_CODEC_ID_NONE)
3634       video = TRUE;
3635   } else if (!strcmp (mimetype, "audio/x-vorbis")) {
3636     id = AV_CODEC_ID_VORBIS;
3637     audio = TRUE;
3638   } else if (!strcmp (mimetype, "audio/x-qdm2")) {
3639     id = AV_CODEC_ID_QDM2;
3640     audio = TRUE;
3641   } else if (!strcmp (mimetype, "audio/mpeg")) {
3642     gint layer = 0;
3643     gint mpegversion = 0;
3644
3645     if (gst_structure_get_int (structure, "mpegversion", &mpegversion)) {
3646       switch (mpegversion) {
3647         case 2:                /* ffmpeg uses faad for both... */
3648         case 4:
3649           id = AV_CODEC_ID_AAC;
3650           break;
3651         case 1:
3652           if (gst_structure_get_int (structure, "layer", &layer)) {
3653             switch (layer) {
3654               case 1:
3655                 id = AV_CODEC_ID_MP1;
3656                 break;
3657               case 2:
3658                 id = AV_CODEC_ID_MP2;
3659                 break;
3660               case 3:
3661                 id = AV_CODEC_ID_MP3;
3662                 break;
3663             }
3664           }
3665       }
3666     }
3667     if (id != AV_CODEC_ID_NONE)
3668       audio = TRUE;
3669   } else if (!strcmp (mimetype, "audio/x-musepack")) {
3670     gint streamversion = -1;
3671
3672     if (gst_structure_get_int (structure, "streamversion", &streamversion)) {
3673       if (streamversion == 7)
3674         id = AV_CODEC_ID_MUSEPACK7;
3675     } else {
3676       id = AV_CODEC_ID_MUSEPACK7;
3677     }
3678   } else if (!strcmp (mimetype, "audio/x-wma")) {
3679     gint wmaversion = 0;
3680
3681     if (gst_structure_get_int (structure, "wmaversion", &wmaversion)) {
3682       switch (wmaversion) {
3683         case 1:
3684           id = AV_CODEC_ID_WMAV1;
3685           break;
3686         case 2:
3687           id = AV_CODEC_ID_WMAV2;
3688           break;
3689         case 3:
3690           id = AV_CODEC_ID_WMAPRO;
3691           break;
3692       }
3693     }
3694     if (id != AV_CODEC_ID_NONE)
3695       audio = TRUE;
3696   } else if (!strcmp (mimetype, "audio/x-wms")) {
3697     id = AV_CODEC_ID_WMAVOICE;
3698     audio = TRUE;
3699   } else if (!strcmp (mimetype, "audio/x-ac3")) {
3700     id = AV_CODEC_ID_AC3;
3701     audio = TRUE;
3702   } else if (!strcmp (mimetype, "audio/x-eac3")) {
3703     id = AV_CODEC_ID_EAC3;
3704     audio = TRUE;
3705   } else if (!strcmp (mimetype, "audio/x-vnd.sony.atrac3") ||
3706       !strcmp (mimetype, "audio/atrac3")) {
3707     id = AV_CODEC_ID_ATRAC3;
3708     audio = TRUE;
3709   } else if (!strcmp (mimetype, "audio/x-dts")) {
3710     id = AV_CODEC_ID_DTS;
3711     audio = TRUE;
3712   } else if (!strcmp (mimetype, "application/x-ape")) {
3713     id = AV_CODEC_ID_APE;
3714     audio = TRUE;
3715   } else if (!strcmp (mimetype, "video/x-msmpeg")) {
3716     gint msmpegversion = 0;
3717
3718     if (gst_structure_get_int (structure, "msmpegversion", &msmpegversion)) {
3719       switch (msmpegversion) {
3720         case 41:
3721           id = AV_CODEC_ID_MSMPEG4V1;
3722           break;
3723         case 42:
3724           id = AV_CODEC_ID_MSMPEG4V2;
3725           break;
3726         case 43:
3727           id = AV_CODEC_ID_MSMPEG4V3;
3728           break;
3729       }
3730     }
3731     if (id != AV_CODEC_ID_NONE)
3732       video = TRUE;
3733   } else if (!strcmp (mimetype, "video/x-svq")) {
3734     gint svqversion = 0;
3735
3736     if (gst_structure_get_int (structure, "svqversion", &svqversion)) {
3737       switch (svqversion) {
3738         case 1:
3739           id = AV_CODEC_ID_SVQ1;
3740           break;
3741         case 3:
3742           id = AV_CODEC_ID_SVQ3;
3743           break;
3744       }
3745     }
3746     if (id != AV_CODEC_ID_NONE)
3747       video = TRUE;
3748   } else if (!strcmp (mimetype, "video/x-huffyuv")) {
3749     id = AV_CODEC_ID_HUFFYUV;
3750     video = TRUE;
3751   } else if (!strcmp (mimetype, "audio/x-mace")) {
3752     gint maceversion = 0;
3753
3754     if (gst_structure_get_int (structure, "maceversion", &maceversion)) {
3755       switch (maceversion) {
3756         case 3:
3757           id = AV_CODEC_ID_MACE3;
3758           break;
3759         case 6:
3760           id = AV_CODEC_ID_MACE6;
3761           break;
3762       }
3763     }
3764     if (id != AV_CODEC_ID_NONE)
3765       audio = TRUE;
3766   } else if (!strcmp (mimetype, "video/x-theora")) {
3767     id = AV_CODEC_ID_THEORA;
3768     video = TRUE;
3769   } else if (!strcmp (mimetype, "video/x-vp3")) {
3770     id = AV_CODEC_ID_VP3;
3771     video = TRUE;
3772   } else if (!strcmp (mimetype, "video/x-vp5")) {
3773     id = AV_CODEC_ID_VP5;
3774     video = TRUE;
3775   } else if (!strcmp (mimetype, "video/x-vp6")) {
3776     id = AV_CODEC_ID_VP6;
3777     video = TRUE;
3778   } else if (!strcmp (mimetype, "video/x-vp6-flash")) {
3779     id = AV_CODEC_ID_VP6F;
3780     video = TRUE;
3781   } else if (!strcmp (mimetype, "video/x-vp6-alpha")) {
3782     id = AV_CODEC_ID_VP6A;
3783     video = TRUE;
3784   } else if (!strcmp (mimetype, "video/x-vp8")) {
3785     id = AV_CODEC_ID_VP8;
3786     video = TRUE;
3787   } else if (!strcmp (mimetype, "video/x-vp9")) {
3788     id = AV_CODEC_ID_VP9;
3789     video = TRUE;
3790   } else if (!strcmp (mimetype, "video/x-flash-screen")) {
3791     id = AV_CODEC_ID_FLASHSV;
3792     video = TRUE;
3793   } else if (!strcmp (mimetype, "video/x-indeo")) {
3794     gint indeoversion = 0;
3795
3796     if (gst_structure_get_int (structure, "indeoversion", &indeoversion)) {
3797       switch (indeoversion) {
3798         case 5:
3799           id = AV_CODEC_ID_INDEO5;
3800           break;
3801         case 4:
3802           id = AV_CODEC_ID_INDEO4;
3803           break;
3804         case 3:
3805           id = AV_CODEC_ID_INDEO3;
3806           break;
3807         case 2:
3808           id = AV_CODEC_ID_INDEO2;
3809           break;
3810       }
3811       if (id != AV_CODEC_ID_NONE)
3812         video = TRUE;
3813     }
3814   } else if (!strcmp (mimetype, "video/x-divx")) {
3815     gint divxversion = 0;
3816
3817     if (gst_structure_get_int (structure, "divxversion", &divxversion)) {
3818       switch (divxversion) {
3819         case 3:
3820           id = AV_CODEC_ID_MSMPEG4V3;
3821           break;
3822         case 4:
3823         case 5:
3824           id = AV_CODEC_ID_MPEG4;
3825           break;
3826       }
3827     }
3828     if (id != AV_CODEC_ID_NONE)
3829       video = TRUE;
3830   } else if (!strcmp (mimetype, "video/x-ffv")) {
3831     gint ffvversion = 0;
3832
3833     if (gst_structure_get_int (structure, "ffvversion", &ffvversion) &&
3834         ffvversion == 1) {
3835       id = AV_CODEC_ID_FFV1;
3836       video = TRUE;
3837     }
3838   } else if (!strcmp (mimetype, "video/x-apple-intermediate-codec")) {
3839     id = AV_CODEC_ID_AIC;
3840     video = TRUE;
3841   } else if (!strcmp (mimetype, "audio/x-adpcm")) {
3842     const gchar *layout;
3843
3844     layout = gst_structure_get_string (structure, "layout");
3845     if (layout == NULL) {
3846       /* break */
3847     } else if (!strcmp (layout, "quicktime")) {
3848       id = AV_CODEC_ID_ADPCM_IMA_QT;
3849     } else if (!strcmp (layout, "microsoft")) {
3850       id = AV_CODEC_ID_ADPCM_MS;
3851     } else if (!strcmp (layout, "dvi")) {
3852       id = AV_CODEC_ID_ADPCM_IMA_WAV;
3853     } else if (!strcmp (layout, "4xm")) {
3854       id = AV_CODEC_ID_ADPCM_4XM;
3855     } else if (!strcmp (layout, "smjpeg")) {
3856       id = AV_CODEC_ID_ADPCM_IMA_SMJPEG;
3857     } else if (!strcmp (layout, "dk3")) {
3858       id = AV_CODEC_ID_ADPCM_IMA_DK3;
3859     } else if (!strcmp (layout, "dk4")) {
3860       id = AV_CODEC_ID_ADPCM_IMA_DK4;
3861     } else if (!strcmp (layout, "westwood")) {
3862       id = AV_CODEC_ID_ADPCM_IMA_WS;
3863     } else if (!strcmp (layout, "iss")) {
3864       id = AV_CODEC_ID_ADPCM_IMA_ISS;
3865     } else if (!strcmp (layout, "xa")) {
3866       id = AV_CODEC_ID_ADPCM_XA;
3867     } else if (!strcmp (layout, "adx")) {
3868       id = AV_CODEC_ID_ADPCM_ADX;
3869     } else if (!strcmp (layout, "ea")) {
3870       id = AV_CODEC_ID_ADPCM_EA;
3871     } else if (!strcmp (layout, "g726")) {
3872       id = AV_CODEC_ID_ADPCM_G726;
3873     } else if (!strcmp (layout, "g721")) {
3874       id = AV_CODEC_ID_ADPCM_G726;
3875     } else if (!strcmp (layout, "ct")) {
3876       id = AV_CODEC_ID_ADPCM_CT;
3877     } else if (!strcmp (layout, "swf")) {
3878       id = AV_CODEC_ID_ADPCM_SWF;
3879     } else if (!strcmp (layout, "yamaha")) {
3880       id = AV_CODEC_ID_ADPCM_YAMAHA;
3881     } else if (!strcmp (layout, "sbpro2")) {
3882       id = AV_CODEC_ID_ADPCM_SBPRO_2;
3883     } else if (!strcmp (layout, "sbpro3")) {
3884       id = AV_CODEC_ID_ADPCM_SBPRO_3;
3885     } else if (!strcmp (layout, "sbpro4")) {
3886       id = AV_CODEC_ID_ADPCM_SBPRO_4;
3887     }
3888     if (id != AV_CODEC_ID_NONE)
3889       audio = TRUE;
3890   } else if (!strcmp (mimetype, "video/x-4xm")) {
3891     id = AV_CODEC_ID_4XM;
3892     video = TRUE;
3893   } else if (!strcmp (mimetype, "audio/x-dpcm")) {
3894     const gchar *layout;
3895
3896     layout = gst_structure_get_string (structure, "layout");
3897     if (!layout) {
3898       /* .. */
3899     } else if (!strcmp (layout, "roq")) {
3900       id = AV_CODEC_ID_ROQ_DPCM;
3901     } else if (!strcmp (layout, "interplay")) {
3902       id = AV_CODEC_ID_INTERPLAY_DPCM;
3903     } else if (!strcmp (layout, "xan")) {
3904       id = AV_CODEC_ID_XAN_DPCM;
3905     } else if (!strcmp (layout, "sol")) {
3906       id = AV_CODEC_ID_SOL_DPCM;
3907     }
3908     if (id != AV_CODEC_ID_NONE)
3909       audio = TRUE;
3910   } else if (!strcmp (mimetype, "audio/x-flac")) {
3911     id = AV_CODEC_ID_FLAC;
3912     audio = TRUE;
3913   } else if (!strcmp (mimetype, "audio/x-shorten")) {
3914     id = AV_CODEC_ID_SHORTEN;
3915     audio = TRUE;
3916   } else if (!strcmp (mimetype, "audio/x-alac")) {
3917     id = AV_CODEC_ID_ALAC;
3918     audio = TRUE;
3919   } else if (!strcmp (mimetype, "video/x-cinepak")) {
3920     id = AV_CODEC_ID_CINEPAK;
3921     video = TRUE;
3922   } else if (!strcmp (mimetype, "video/x-pn-realvideo")) {
3923     gint rmversion;
3924
3925     if (gst_structure_get_int (structure, "rmversion", &rmversion)) {
3926       switch (rmversion) {
3927         case 1:
3928           id = AV_CODEC_ID_RV10;
3929           break;
3930         case 2:
3931           id = AV_CODEC_ID_RV20;
3932           break;
3933         case 3:
3934           id = AV_CODEC_ID_RV30;
3935           break;
3936         case 4:
3937           id = AV_CODEC_ID_RV40;
3938           break;
3939       }
3940     }
3941     if (id != AV_CODEC_ID_NONE)
3942       video = TRUE;
3943   } else if (!strcmp (mimetype, "audio/x-sipro")) {
3944     id = AV_CODEC_ID_SIPR;
3945     audio = TRUE;
3946   } else if (!strcmp (mimetype, "audio/x-pn-realaudio")) {
3947     gint raversion;
3948
3949     if (gst_structure_get_int (structure, "raversion", &raversion)) {
3950       switch (raversion) {
3951         case 1:
3952           id = AV_CODEC_ID_RA_144;
3953           break;
3954         case 2:
3955           id = AV_CODEC_ID_RA_288;
3956           break;
3957         case 8:
3958           id = AV_CODEC_ID_COOK;
3959           break;
3960       }
3961     }
3962     if (id != AV_CODEC_ID_NONE)
3963       audio = TRUE;
3964   } else if (!strcmp (mimetype, "video/x-rle")) {
3965     const gchar *layout;
3966
3967     if ((layout = gst_structure_get_string (structure, "layout"))) {
3968       if (!strcmp (layout, "microsoft")) {
3969         id = AV_CODEC_ID_MSRLE;
3970         video = TRUE;
3971       }
3972     }
3973   } else if (!strcmp (mimetype, "video/x-xan")) {
3974     gint wcversion = 0;
3975
3976     if ((gst_structure_get_int (structure, "wcversion", &wcversion))) {
3977       switch (wcversion) {
3978         case 3:
3979           id = AV_CODEC_ID_XAN_WC3;
3980           video = TRUE;
3981           break;
3982         case 4:
3983           id = AV_CODEC_ID_XAN_WC4;
3984           video = TRUE;
3985           break;
3986         default:
3987           break;
3988       }
3989     }
3990   } else if (!strcmp (mimetype, "audio/AMR")) {
3991     audio = TRUE;
3992     id = AV_CODEC_ID_AMR_NB;
3993   } else if (!strcmp (mimetype, "audio/AMR-WB")) {
3994     id = AV_CODEC_ID_AMR_WB;
3995     audio = TRUE;
3996   } else if (!strcmp (mimetype, "audio/qcelp")) {
3997     id = AV_CODEC_ID_QCELP;
3998     audio = TRUE;
3999   } else if (!strcmp (mimetype, "video/x-h264")) {
4000     id = AV_CODEC_ID_H264;
4001     video = TRUE;
4002   } else if (!strcmp (mimetype, "video/x-h265")) {
4003     id = AV_CODEC_ID_HEVC;
4004     video = TRUE;
4005   } else if (!strcmp (mimetype, "video/x-flash-video")) {
4006     gint flvversion = 0;
4007
4008     if ((gst_structure_get_int (structure, "flvversion", &flvversion))) {
4009       switch (flvversion) {
4010         case 1:
4011           id = AV_CODEC_ID_FLV1;
4012           video = TRUE;
4013           break;
4014         default:
4015           break;
4016       }
4017     }
4018
4019   } else if (!strcmp (mimetype, "audio/x-nellymoser")) {
4020     id = AV_CODEC_ID_NELLYMOSER;
4021     audio = TRUE;
4022   } else if (!strncmp (mimetype, "audio/x-gst-av-", 15)) {
4023     gchar ext[16];
4024     AVCodec *codec;
4025
4026     if (strlen (mimetype) <= 30 &&
4027         sscanf (mimetype, "audio/x-gst-av-%s", ext) == 1) {
4028       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4029           (codec = avcodec_find_encoder_by_name (ext))) {
4030         id = codec->id;
4031         audio = TRUE;
4032       }
4033     }
4034   } else if (!strncmp (mimetype, "video/x-gst-av-", 15)) {
4035     gchar ext[16];
4036     AVCodec *codec;
4037
4038     if (strlen (mimetype) <= 30 &&
4039         sscanf (mimetype, "video/x-gst-av-%s", ext) == 1) {
4040       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4041           (codec = avcodec_find_encoder_by_name (ext))) {
4042         id = codec->id;
4043         video = TRUE;
4044       }
4045     }
4046   }
4047
4048   if (context != NULL) {
4049     if (video == TRUE) {
4050       context->codec_type = AVMEDIA_TYPE_VIDEO;
4051     } else if (audio == TRUE) {
4052       context->codec_type = AVMEDIA_TYPE_AUDIO;
4053     } else {
4054       context->codec_type = AVMEDIA_TYPE_UNKNOWN;
4055     }
4056     context->codec_id = id;
4057     gst_ffmpeg_caps_with_codecid (id, context->codec_type, caps, context);
4058   }
4059
4060   if (id != AV_CODEC_ID_NONE) {
4061     GST_DEBUG ("The id=%d belongs to the caps %" GST_PTR_FORMAT, id, caps);
4062   } else {
4063     GST_WARNING ("Couldn't figure out the id for caps %" GST_PTR_FORMAT, caps);
4064   }
4065
4066   return id;
4067 }