avcodecmap: Only set the bitrate if we actually got it from the caps
[platform/upstream/gst-libav.git] / ext / libav / gstavcodecmap.c
1 /* GStreamer
2  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
3  * This file:
4  * Copyright (c) 2002-2004 Ronald Bultje <rbultje@ronald.bitfreak.net>
5  *
6  * This library is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Library General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Library General Public License for more details.
15  *
16  * You should have received a copy of the GNU Library General Public
17  * License along with this library; if not, write to the
18  * Free Software Foundation, Inc., 51 Franklin St, Fifth Floor,
19  * Boston, MA 02110-1301, USA.
20  */
21
22 #ifdef HAVE_CONFIG_H
23 #include "config.h"
24 #endif
25
26 #include <string.h>
27
28 #include <gst/gst.h>
29 #include <libavcodec/avcodec.h>
30 #include <libavutil/channel_layout.h>
31
32 #include "gstav.h"
33 #include "gstavcodecmap.h"
34
35 #include <gst/video/video.h>
36 #include <gst/audio/audio.h>
37 #include <gst/pbutils/codec-utils.h>
38
39 /* IMPORTANT: Keep this sorted by the ffmpeg channel masks */
40 static const struct
41 {
42   guint64 ff;
43   GstAudioChannelPosition gst;
44 } _ff_to_gst_layout[] = {
45   {
46   AV_CH_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
47   AV_CH_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}, {
48   AV_CH_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_CENTER}, {
49   AV_CH_LOW_FREQUENCY, GST_AUDIO_CHANNEL_POSITION_LFE1}, {
50   AV_CH_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_REAR_LEFT}, {
51   AV_CH_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_REAR_RIGHT}, {
52   AV_CH_FRONT_LEFT_OF_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT_OF_CENTER}, {
53   AV_CH_FRONT_RIGHT_OF_CENTER,
54         GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT_OF_CENTER}, {
55   AV_CH_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_REAR_CENTER}, {
56   AV_CH_SIDE_LEFT, GST_AUDIO_CHANNEL_POSITION_SIDE_LEFT}, {
57   AV_CH_SIDE_RIGHT, GST_AUDIO_CHANNEL_POSITION_SIDE_RIGHT}, {
58   AV_CH_TOP_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_CENTER}, {
59   AV_CH_TOP_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_LEFT}, {
60   AV_CH_TOP_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_CENTER}, {
61   AV_CH_TOP_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_RIGHT}, {
62   AV_CH_TOP_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_LEFT}, {
63   AV_CH_TOP_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_CENTER}, {
64   AV_CH_TOP_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_RIGHT}, {
65   AV_CH_STEREO_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
66   AV_CH_STEREO_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}
67 };
68
69 GType
70 gst_ffmpeg_compliance_get_type (void)
71 {
72   static GType ffmpeg_compliance_type = 0;
73   static const GEnumValue compliance_types[] = {
74     {GST_FFMPEG_VERY_STRICT, "Strictly conform to older spec",
75         "verystrict"},
76     {GST_FFMPEG_STRICT, "Strictly conform to current spec", "strict"},
77     {GST_FFMPEG_NORMAL, "Normal behavior", "normal"},
78     {GST_FFMPEG_UNOFFICIAL, "Allow unofficial extensions", "unofficial"},
79     {GST_FFMPEG_EXPERIMENTAL, "Allow nonstandardized experimental things",
80         "experimental"},
81     {0, NULL, NULL}
82   };
83
84   if (!ffmpeg_compliance_type) {
85     ffmpeg_compliance_type =
86         g_enum_register_static ("GstFFMpegCompliance", compliance_types);
87   }
88   return ffmpeg_compliance_type;
89 }
90
91 static guint64
92 gst_ffmpeg_channel_positions_to_layout (GstAudioChannelPosition * pos,
93     gint channels)
94 {
95   gint i, j;
96   guint64 ret = 0;
97   gint channels_found = 0;
98
99   if (!pos)
100     return 0;
101
102   if (channels == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
103     return AV_CH_LAYOUT_MONO;
104
105   for (i = 0; i < channels; i++) {
106     for (j = 0; j < G_N_ELEMENTS (_ff_to_gst_layout); j++) {
107       if (_ff_to_gst_layout[j].gst == pos[i]) {
108         ret |= _ff_to_gst_layout[j].ff;
109         channels_found++;
110         break;
111       }
112     }
113   }
114
115   if (channels_found != channels)
116     return 0;
117   return ret;
118 }
119
120 gboolean
121 gst_ffmpeg_channel_layout_to_gst (guint64 channel_layout, gint channels,
122     GstAudioChannelPosition * pos)
123 {
124   guint nchannels = 0;
125   gboolean none_layout = FALSE;
126
127   if (channel_layout == 0) {
128     nchannels = channels;
129     none_layout = TRUE;
130   } else {
131     guint i, j;
132
133     /* Special path for mono, as AV_CH_LAYOUT_MONO is the same
134      * as FRONT_CENTER but we distinguish between the two in
135      * GStreamer
136      */
137     if (channels == 1 && channel_layout == AV_CH_LAYOUT_MONO) {
138       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
139       return TRUE;
140     }
141
142     for (i = 0; i < 64; i++) {
143       if ((channel_layout & (G_GUINT64_CONSTANT (1) << i)) != 0) {
144         nchannels++;
145       }
146     }
147
148     if (nchannels != channels) {
149       GST_ERROR ("Number of channels is different (%u != %u)", channels,
150           nchannels);
151       nchannels = channels;
152       none_layout = TRUE;
153     } else {
154
155       for (i = 0, j = 0; i < G_N_ELEMENTS (_ff_to_gst_layout); i++) {
156         if ((channel_layout & _ff_to_gst_layout[i].ff) != 0) {
157           pos[j++] = _ff_to_gst_layout[i].gst;
158
159           if (_ff_to_gst_layout[i].gst == GST_AUDIO_CHANNEL_POSITION_NONE)
160             none_layout = TRUE;
161         }
162       }
163
164       if (j != nchannels) {
165         GST_WARNING
166             ("Unknown channels in channel layout - assuming NONE layout");
167         none_layout = TRUE;
168       }
169     }
170   }
171
172   if (!none_layout
173       && !gst_audio_check_valid_channel_positions (pos, nchannels, FALSE)) {
174     GST_ERROR ("Invalid channel layout %" G_GUINT64_FORMAT
175         " - assuming NONE layout", channel_layout);
176     none_layout = TRUE;
177   }
178
179   if (none_layout) {
180     if (nchannels == 1) {
181       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
182     } else if (nchannels == 2) {
183       pos[0] = GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT;
184       pos[1] = GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT;
185     } else {
186       guint i;
187
188       for (i = 0; i < nchannels; i++)
189         pos[i] = GST_AUDIO_CHANNEL_POSITION_NONE;
190     }
191   }
192
193   return TRUE;
194 }
195
196 static gboolean
197 _gst_value_list_contains (const GValue * list, const GValue * value)
198 {
199   guint i, n;
200   const GValue *tmp;
201
202   n = gst_value_list_get_size (list);
203   for (i = 0; i < n; i++) {
204     tmp = gst_value_list_get_value (list, i);
205     if (gst_value_compare (value, tmp) == GST_VALUE_EQUAL)
206       return TRUE;
207   }
208
209   return FALSE;
210 }
211
212 static void
213 gst_ffmpeg_video_set_pix_fmts (GstCaps * caps, const enum AVPixelFormat *fmts)
214 {
215   GValue va = { 0, };
216   GValue v = { 0, };
217   GstVideoFormat format;
218
219   if (!fmts || fmts[0] == -1) {
220     gint i;
221
222     g_value_init (&va, GST_TYPE_LIST);
223     g_value_init (&v, G_TYPE_STRING);
224     for (i = 0; i <= AV_PIX_FMT_NB; i++) {
225       format = gst_ffmpeg_pixfmt_to_videoformat (i);
226       if (format == GST_VIDEO_FORMAT_UNKNOWN)
227         continue;
228       g_value_set_string (&v, gst_video_format_to_string (format));
229       gst_value_list_append_value (&va, &v);
230     }
231     gst_caps_set_value (caps, "format", &va);
232     g_value_unset (&v);
233     g_value_unset (&va);
234     return;
235   }
236
237   /* Only a single format */
238   g_value_init (&va, GST_TYPE_LIST);
239   g_value_init (&v, G_TYPE_STRING);
240   while (*fmts != -1) {
241     format = gst_ffmpeg_pixfmt_to_videoformat (*fmts);
242     if (format != GST_VIDEO_FORMAT_UNKNOWN) {
243       g_value_set_string (&v, gst_video_format_to_string (format));
244       /* Only append values we don't have yet */
245       if (!_gst_value_list_contains (&va, &v))
246         gst_value_list_append_value (&va, &v);
247     }
248     fmts++;
249   }
250   if (gst_value_list_get_size (&va) == 1) {
251     /* The single value is still in v */
252     gst_caps_set_value (caps, "format", &v);
253   } else if (gst_value_list_get_size (&va) > 1) {
254     gst_caps_set_value (caps, "format", &va);
255   }
256   g_value_unset (&v);
257   g_value_unset (&va);
258 }
259
260 /* this macro makes a caps width fixed or unfixed width/height
261  * properties depending on whether we've got a context.
262  *
263  * See below for why we use this.
264  *
265  * We should actually do this stuff at the end, like in riff-media.c,
266  * but I'm too lazy today. Maybe later.
267  */
268 static GstCaps *
269 gst_ff_vid_caps_new (AVCodecContext * context, AVCodec * codec,
270     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
271     const char *fieldname, ...)
272 {
273   GstCaps *caps = NULL;
274   va_list var_args;
275   gint i;
276
277   GST_LOG ("context:%p, codec_id:%d, mimetype:%s", context, codec_id, mimetype);
278
279   /* fixed, non probing context */
280   if (context != NULL && context->width != -1) {
281     gint num, denom;
282
283     caps = gst_caps_new_simple (mimetype,
284         "width", G_TYPE_INT, context->width,
285         "height", G_TYPE_INT, context->height, NULL);
286
287     num = context->time_base.den / context->ticks_per_frame;
288     denom = context->time_base.num;
289
290     if (!denom) {
291       GST_LOG ("invalid framerate: %d/0, -> %d/1", num, num);
292       denom = 1;
293     }
294     if (gst_util_fraction_compare (num, denom, 1000, 1) > 0) {
295       GST_LOG ("excessive framerate: %d/%d, -> 0/1", num, denom);
296       num = 0;
297       denom = 1;
298     }
299     GST_LOG ("setting framerate: %d/%d", num, denom);
300     gst_caps_set_simple (caps,
301         "framerate", GST_TYPE_FRACTION, num, denom, NULL);
302   } else if (encode) {
303     /* so we are after restricted caps in this case */
304     switch (codec_id) {
305       case AV_CODEC_ID_H261:
306       {
307         caps = gst_caps_new_simple (mimetype,
308             "width", G_TYPE_INT, 352,
309             "height", G_TYPE_INT, 288,
310             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
311         gst_caps_append (caps, gst_caps_new_simple (mimetype,
312                 "width", G_TYPE_INT, 176,
313                 "height", G_TYPE_INT, 144,
314                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
315         break;
316       }
317       case AV_CODEC_ID_H263:
318       {
319         /* 128x96, 176x144, 352x288, 704x576, and 1408x1152. slightly reordered
320          * because we want automatic negotiation to go as close to 320x240 as
321          * possible. */
322         const static gint widths[] = { 352, 704, 176, 1408, 128 };
323         const static gint heights[] = { 288, 576, 144, 1152, 96 };
324         GstCaps *temp;
325         gint n_sizes = G_N_ELEMENTS (widths);
326
327         caps = gst_caps_new_empty ();
328         for (i = 0; i < n_sizes; i++) {
329           temp = gst_caps_new_simple (mimetype,
330               "width", G_TYPE_INT, widths[i],
331               "height", G_TYPE_INT, heights[i],
332               "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
333
334           gst_caps_append (caps, temp);
335         }
336         break;
337       }
338       case AV_CODEC_ID_DVVIDEO:
339       {
340         static struct
341         {
342           const gchar *csp;
343           gint width, height;
344           gint par_n, par_d;
345           gint framerate_n, framerate_d;
346         } profiles[] = {
347           {
348           "Y41B", 720, 480, 8, 9, 30000, 1001}, {
349           "Y41B", 720, 480, 32, 27, 30000, 1001}, {
350           "Y42B", 720, 480, 8, 9, 30000, 1001}, {
351           "Y42B", 720, 480, 32, 27, 30000, 1001}, {
352           "I420", 720, 576, 16, 15, 25, 1}, {
353           "I420", 720, 576, 64, 45, 25, 1}, {
354           "Y41B", 720, 576, 16, 15, 25, 1}, {
355           "Y41B", 720, 576, 64, 45, 25, 1}, {
356           "Y42B", 720, 576, 16, 15, 25, 1}, {
357           "Y42B", 720, 576, 64, 45, 25, 1}, {
358           "Y42B", 1280, 1080, 1, 1, 30000, 1001}, {
359           "Y42B", 1280, 1080, 3, 2, 30000, 1001}, {
360           "Y42B", 1440, 1080, 1, 1, 25, 1}, {
361           "Y42B", 1440, 1080, 4, 3, 25, 1}, {
362           "Y42B", 960, 720, 1, 1, 60000, 1001}, {
363           "Y42B", 960, 720, 4, 3, 60000, 1001}, {
364           "Y42B", 960, 720, 1, 1, 50, 1}, {
365         "Y42B", 960, 720, 4, 3, 50, 1},};
366         GstCaps *temp;
367         gint n_sizes = G_N_ELEMENTS (profiles);
368
369         if (strcmp (mimetype, "video/x-raw") == 0) {
370           caps = gst_caps_new_empty ();
371           for (i = 0; i < n_sizes; i++) {
372             temp = gst_caps_new_simple (mimetype,
373                 "format", G_TYPE_STRING, profiles[i].csp,
374                 "width", G_TYPE_INT, profiles[i].width,
375                 "height", G_TYPE_INT, profiles[i].height,
376                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
377                 profiles[i].framerate_d, "pixel-aspect-ratio",
378                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
379
380             gst_caps_append (caps, temp);
381           }
382         } else {
383           caps = gst_caps_new_empty ();
384           for (i = 0; i < n_sizes; i++) {
385             temp = gst_caps_new_simple (mimetype,
386                 "width", G_TYPE_INT, profiles[i].width,
387                 "height", G_TYPE_INT, profiles[i].height,
388                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
389                 profiles[i].framerate_d, "pixel-aspect-ratio",
390                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
391
392             gst_caps_append (caps, temp);
393           }
394         }
395         break;
396       }
397       case AV_CODEC_ID_DNXHD:
398       {
399         caps = gst_caps_new_simple (mimetype,
400             "width", G_TYPE_INT, 1920,
401             "height", G_TYPE_INT, 1080,
402             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
403         gst_caps_append (caps, gst_caps_new_simple (mimetype,
404                 "width", G_TYPE_INT, 1280,
405                 "height", G_TYPE_INT, 720,
406                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
407         break;
408       }
409       default:
410       {
411         if (codec && codec->supported_framerates
412             && codec->supported_framerates[0].num != 0
413             && codec->supported_framerates[0].den != 0) {
414           GValue va = { 0, };
415           GValue v = { 0, };
416           const AVRational *rates = codec->supported_framerates;
417
418           if (rates[1].num == 0 && rates[1].den == 0) {
419             caps =
420                 gst_caps_new_simple (mimetype, "framerate", GST_TYPE_FRACTION,
421                 rates[0].num, rates[0].den, NULL);
422           } else {
423             g_value_init (&va, GST_TYPE_LIST);
424             g_value_init (&v, GST_TYPE_FRACTION);
425
426             while (rates->num != 0 && rates->den != 0) {
427               gst_value_set_fraction (&v, rates->num, rates->den);
428               gst_value_list_append_value (&va, &v);
429               rates++;
430             }
431
432             caps = gst_caps_new_simple (mimetype, NULL, NULL, NULL);
433             gst_caps_set_value (caps, "framerate", &va);
434             g_value_unset (&va);
435             g_value_unset (&v);
436           }
437
438         } else {
439           caps = gst_caps_new_empty_simple (mimetype);
440         }
441
442         break;
443       }
444     }
445   }
446
447   /* no fixed caps or special restrictions applied;
448    * default unfixed setting */
449   if (!caps) {
450     GST_DEBUG ("Creating default caps");
451     caps = gst_caps_new_empty_simple (mimetype);
452   }
453
454   va_start (var_args, fieldname);
455   gst_caps_set_simple_valist (caps, fieldname, var_args);
456   va_end (var_args);
457
458   return caps;
459 }
460
461 static gint
462 get_nbits_set (guint64 n)
463 {
464   gint i, x;
465
466   x = 0;
467   for (i = 0; i < 64; i++) {
468     if ((n & (G_GUINT64_CONSTANT (1) << i)))
469       x++;
470   }
471
472   return x;
473 }
474
475 static void
476 gst_ffmpeg_audio_set_sample_fmts (GstCaps * caps,
477     const enum AVSampleFormat *fmts)
478 {
479   GValue va = { 0, };
480   GValue v = { 0, };
481   GstAudioFormat format;
482
483   if (!fmts || fmts[0] == -1) {
484     gint i;
485
486     g_value_init (&va, GST_TYPE_LIST);
487     g_value_init (&v, G_TYPE_STRING);
488     for (i = 0; i <= AV_SAMPLE_FMT_DBL; i++) {
489       format = gst_ffmpeg_smpfmt_to_audioformat (i);
490       if (format == GST_AUDIO_FORMAT_UNKNOWN)
491         continue;
492       g_value_set_string (&v, gst_audio_format_to_string (format));
493       gst_value_list_append_value (&va, &v);
494     }
495     gst_caps_set_value (caps, "format", &va);
496     g_value_unset (&v);
497     g_value_unset (&va);
498     return;
499   }
500
501   g_value_init (&va, GST_TYPE_LIST);
502   g_value_init (&v, G_TYPE_STRING);
503   while (*fmts != -1) {
504     format = gst_ffmpeg_smpfmt_to_audioformat (*fmts);
505     if (format != GST_AUDIO_FORMAT_UNKNOWN) {
506       g_value_set_string (&v, gst_audio_format_to_string (format));
507       /* Only append values we don't have yet */
508       if (!_gst_value_list_contains (&va, &v))
509         gst_value_list_append_value (&va, &v);
510     }
511     fmts++;
512   }
513   if (gst_value_list_get_size (&va) == 1) {
514     /* The single value is still in v */
515     gst_caps_set_value (caps, "format", &v);
516   } else if (gst_value_list_get_size (&va) > 1) {
517     gst_caps_set_value (caps, "format", &va);
518   }
519   g_value_unset (&v);
520   g_value_unset (&va);
521 }
522
523 /* same for audio - now with channels/sample rate
524  */
525 static GstCaps *
526 gst_ff_aud_caps_new (AVCodecContext * context, AVCodec * codec,
527     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
528     const char *fieldname, ...)
529 {
530   GstCaps *caps = NULL;
531   gint i;
532   va_list var_args;
533
534   /* fixed, non-probing context */
535   if (context != NULL && context->channels != -1) {
536     GstAudioChannelPosition pos[64];
537     guint64 mask;
538
539     caps = gst_caps_new_simple (mimetype,
540         "rate", G_TYPE_INT, context->sample_rate,
541         "channels", G_TYPE_INT, context->channels, NULL);
542
543     if (context->channels > 1 &&
544         gst_ffmpeg_channel_layout_to_gst (context->channel_layout,
545             context->channels, pos) &&
546         gst_audio_channel_positions_to_mask (pos, context->channels, FALSE,
547             &mask)) {
548       gst_caps_set_simple (caps, "channel-mask", GST_TYPE_BITMASK, mask, NULL);
549     }
550   } else if (encode) {
551     gint maxchannels = 2;
552     const gint *rates = NULL;
553     gint n_rates = 0;
554
555     /* so we must be after restricted caps in this case */
556     switch (codec_id) {
557       case AV_CODEC_ID_AAC:
558       case AV_CODEC_ID_AAC_LATM:
559       case AV_CODEC_ID_DTS:
560         maxchannels = 6;
561         break;
562       case AV_CODEC_ID_MP2:
563       {
564         const static gint l_rates[] =
565             { 48000, 44100, 32000, 24000, 22050, 16000 };
566         n_rates = G_N_ELEMENTS (l_rates);
567         rates = l_rates;
568         break;
569       }
570       case AV_CODEC_ID_EAC3:
571       case AV_CODEC_ID_AC3:
572       {
573         const static gint l_rates[] = { 48000, 44100, 32000 };
574         maxchannels = 6;
575         n_rates = G_N_ELEMENTS (l_rates);
576         rates = l_rates;
577         break;
578       }
579       case AV_CODEC_ID_ADPCM_G722:
580       {
581         const static gint l_rates[] = { 16000 };
582         n_rates = G_N_ELEMENTS (l_rates);
583         rates = l_rates;
584         maxchannels = 1;
585         break;
586       }
587       case AV_CODEC_ID_ADPCM_G726:
588       {
589         const static gint l_rates[] = { 8000 };
590         n_rates = G_N_ELEMENTS (l_rates);
591         rates = l_rates;
592         maxchannels = 1;
593         break;
594       }
595       case AV_CODEC_ID_ADPCM_SWF:
596       {
597         const static gint l_rates[] = { 11025, 22050, 44100 };
598         n_rates = G_N_ELEMENTS (l_rates);
599         rates = l_rates;
600         break;
601       }
602       case AV_CODEC_ID_ROQ_DPCM:
603       {
604         const static gint l_rates[] = { 22050 };
605         n_rates = G_N_ELEMENTS (l_rates);
606         rates = l_rates;
607         break;
608       }
609       case AV_CODEC_ID_AMR_NB:
610       {
611         const static gint l_rates[] = { 8000 };
612         maxchannels = 1;
613         n_rates = G_N_ELEMENTS (l_rates);
614         rates = l_rates;
615         break;
616       }
617       case AV_CODEC_ID_AMR_WB:
618       {
619         const static gint l_rates[] = { 16000 };
620         maxchannels = 1;
621         n_rates = G_N_ELEMENTS (l_rates);
622         rates = l_rates;
623         break;
624       }
625       default:
626         break;
627     }
628
629     /* regardless of encode/decode, open up channels if applicable */
630     /* Until decoders/encoders expose the maximum number of channels
631      * they support, we whitelist them here. */
632     switch (codec_id) {
633       case AV_CODEC_ID_WMAPRO:
634       case AV_CODEC_ID_TRUEHD:
635         maxchannels = 8;
636         break;
637       default:
638         break;
639     }
640
641     if (codec && codec->channel_layouts) {
642       const uint64_t *layouts = codec->channel_layouts;
643       GstAudioChannelPosition pos[64];
644
645       caps = gst_caps_new_empty ();
646       while (*layouts) {
647         gint nbits_set = get_nbits_set (*layouts);
648
649         if (gst_ffmpeg_channel_layout_to_gst (*layouts, nbits_set, pos)) {
650           guint64 mask;
651
652           if (gst_audio_channel_positions_to_mask (pos, nbits_set, FALSE,
653                   &mask)) {
654             GstCaps *tmp =
655                 gst_caps_new_simple (mimetype, "channel-mask", GST_TYPE_BITMASK,
656                 mask,
657                 "channels", G_TYPE_INT, nbits_set, NULL);
658
659             gst_caps_append (caps, tmp);
660           }
661         }
662         layouts++;
663       }
664     } else {
665       if (maxchannels == 1)
666         caps = gst_caps_new_simple (mimetype,
667             "channels", G_TYPE_INT, maxchannels, NULL);
668       else
669         caps = gst_caps_new_simple (mimetype,
670             "channels", GST_TYPE_INT_RANGE, 1, maxchannels, NULL);
671     }
672
673     if (n_rates) {
674       GValue list = { 0, };
675
676       g_value_init (&list, GST_TYPE_LIST);
677       for (i = 0; i < n_rates; i++) {
678         GValue v = { 0, };
679
680         g_value_init (&v, G_TYPE_INT);
681         g_value_set_int (&v, rates[i]);
682         gst_value_list_append_value (&list, &v);
683         g_value_unset (&v);
684       }
685       gst_caps_set_value (caps, "rate", &list);
686       g_value_unset (&list);
687     } else if (codec && codec->supported_samplerates
688         && codec->supported_samplerates[0]) {
689       GValue va = { 0, };
690       GValue v = { 0, };
691
692       if (!codec->supported_samplerates[1]) {
693         gst_caps_set_simple (caps, "rate", G_TYPE_INT,
694             codec->supported_samplerates[0], NULL);
695       } else {
696         const int *rates = codec->supported_samplerates;
697
698         g_value_init (&va, GST_TYPE_LIST);
699         g_value_init (&v, G_TYPE_INT);
700
701         while (*rates) {
702           g_value_set_int (&v, *rates);
703           gst_value_list_append_value (&va, &v);
704           rates++;
705         }
706         gst_caps_set_value (caps, "rate", &va);
707         g_value_unset (&va);
708         g_value_unset (&v);
709       }
710     } else {
711       gst_caps_set_simple (caps, "rate", GST_TYPE_INT_RANGE, 4000, 96000, NULL);
712     }
713   } else {
714     caps = gst_caps_new_empty_simple (mimetype);
715   }
716
717   va_start (var_args, fieldname);
718   gst_caps_set_simple_valist (caps, fieldname, var_args);
719   va_end (var_args);
720
721   return caps;
722 }
723
724 /* Convert a FFMPEG codec ID and optional AVCodecContext
725  * to a GstCaps. If the context is ommitted, no fixed values
726  * for video/audio size will be included in the GstCaps
727  *
728  * CodecID is primarily meant for compressed data GstCaps!
729  *
730  * encode is a special parameter. gstffmpegdec will say
731  * FALSE, gstffmpegenc will say TRUE. The output caps
732  * depends on this, in such a way that it will be very
733  * specific, defined, fixed and correct caps for encoders,
734  * yet very wide, "forgiving" caps for decoders. Example
735  * for mp3: decode: audio/mpeg,mpegversion=1,layer=[1-3]
736  * but encode: audio/mpeg,mpegversion=1,layer=3,bitrate=x,
737  * rate=x,channels=x.
738  */
739
740 GstCaps *
741 gst_ffmpeg_codecid_to_caps (enum AVCodecID codec_id,
742     AVCodecContext * context, gboolean encode)
743 {
744   GstCaps *caps = NULL;
745   gboolean buildcaps = FALSE;
746
747   GST_LOG ("codec_id:%d, context:%p, encode:%d", codec_id, context, encode);
748
749   switch (codec_id) {
750     case AV_CODEC_ID_MPEG1VIDEO:
751       /* FIXME: bitrate */
752       caps = gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
753           "mpegversion", G_TYPE_INT, 1,
754           "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
755       break;
756
757     case AV_CODEC_ID_MPEG2VIDEO:
758       if (encode) {
759         /* FIXME: bitrate */
760         caps =
761             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
762             "mpegversion", G_TYPE_INT, 2, "systemstream", G_TYPE_BOOLEAN, FALSE,
763             NULL);
764       } else {
765         /* decode both MPEG-1 and MPEG-2; width/height/fps are all in
766          * the MPEG video stream headers, so may be omitted from caps. */
767         caps = gst_caps_new_simple ("video/mpeg",
768             "mpegversion", GST_TYPE_INT_RANGE, 1, 2,
769             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
770       }
771       break;
772
773     case AV_CODEC_ID_H263:
774       if (encode) {
775         caps =
776             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
777             "video/x-h263", "variant", G_TYPE_STRING, "itu", "h263version",
778             G_TYPE_STRING, "h263", NULL);
779       } else {
780         /* don't pass codec_id, we can decode other variants with the H263
781          * decoder that don't have specific size requirements
782          */
783         caps =
784             gst_ff_vid_caps_new (context, NULL, AV_CODEC_ID_NONE, encode,
785             "video/x-h263", "variant", G_TYPE_STRING, "itu", NULL);
786       }
787       break;
788
789     case AV_CODEC_ID_H263P:
790       caps =
791           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h263",
792           "variant", G_TYPE_STRING, "itu", "h263version", G_TYPE_STRING,
793           "h263p", NULL);
794       if (encode && context) {
795
796         gst_caps_set_simple (caps,
797             "annex-f", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_4MV,
798             "annex-j", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_LOOP_FILTER,
799             "annex-i", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
800             "annex-t", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
801             NULL);
802       }
803       break;
804
805     case AV_CODEC_ID_H263I:
806       caps =
807           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
808           "video/x-intel-h263", "variant", G_TYPE_STRING, "intel", NULL);
809       break;
810
811     case AV_CODEC_ID_H261:
812       caps =
813           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h261",
814           NULL);
815       break;
816
817     case AV_CODEC_ID_RV10:
818     case AV_CODEC_ID_RV20:
819     case AV_CODEC_ID_RV30:
820     case AV_CODEC_ID_RV40:
821     {
822       gint version;
823
824       switch (codec_id) {
825         case AV_CODEC_ID_RV40:
826           version = 4;
827           break;
828         case AV_CODEC_ID_RV30:
829           version = 3;
830           break;
831         case AV_CODEC_ID_RV20:
832           version = 2;
833           break;
834         default:
835           version = 1;
836           break;
837       }
838
839       caps =
840           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
841           "video/x-pn-realvideo", "rmversion", G_TYPE_INT, version, NULL);
842       if (context) {
843         if (context->extradata_size >= 8) {
844           gst_caps_set_simple (caps,
845               "subformat", G_TYPE_INT, GST_READ_UINT32_BE (context->extradata),
846               NULL);
847         }
848       }
849     }
850       break;
851
852     case AV_CODEC_ID_MP1:
853       /* FIXME: bitrate */
854       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
855           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 1, NULL);
856       break;
857
858     case AV_CODEC_ID_MP2:
859       /* FIXME: bitrate */
860       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
861           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 2, NULL);
862       break;
863
864     case AV_CODEC_ID_MP3:
865       if (encode) {
866         /* FIXME: bitrate */
867         caps =
868             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
869             "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 3, NULL);
870       } else {
871         /* Decodes MPEG-1 layer 1/2/3. Samplerate, channels et al are
872          * in the MPEG audio header, so may be omitted from caps. */
873         caps = gst_caps_new_simple ("audio/mpeg",
874             "mpegversion", G_TYPE_INT, 1,
875             "layer", GST_TYPE_INT_RANGE, 1, 3, NULL);
876       }
877       break;
878
879     case AV_CODEC_ID_MUSEPACK7:
880       caps =
881           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
882           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 7,
883           NULL);
884       break;
885
886     case AV_CODEC_ID_MUSEPACK8:
887       caps =
888           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
889           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 8,
890           NULL);
891       break;
892
893     case AV_CODEC_ID_AC3:
894       /* FIXME: bitrate */
895       caps =
896           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-ac3",
897           NULL);
898       break;
899
900     case AV_CODEC_ID_EAC3:
901       /* FIXME: bitrate */
902       caps =
903           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-eac3",
904           NULL);
905       break;
906
907     case AV_CODEC_ID_TRUEHD:
908       caps =
909           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
910           "audio/x-true-hd", NULL);
911       break;
912
913     case AV_CODEC_ID_ATRAC1:
914       caps =
915           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
916           "audio/x-vnd.sony.atrac1", NULL);
917       break;
918
919     case AV_CODEC_ID_ATRAC3:
920       caps =
921           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
922           "audio/x-vnd.sony.atrac3", NULL);
923       break;
924
925     case AV_CODEC_ID_DTS:
926       caps =
927           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dts",
928           NULL);
929       break;
930
931     case AV_CODEC_ID_APE:
932       caps =
933           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
934           "audio/x-ffmpeg-parsed-ape", NULL);
935       if (context) {
936         gst_caps_set_simple (caps,
937             "depth", G_TYPE_INT, context->bits_per_coded_sample, NULL);
938       }
939       break;
940
941     case AV_CODEC_ID_MLP:
942       caps =
943           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mlp",
944           NULL);
945       break;
946
947     case AV_CODEC_ID_IMC:
948       caps =
949           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-imc",
950           NULL);
951       break;
952
953       /* MJPEG is normal JPEG, Motion-JPEG and Quicktime MJPEG-A. MJPEGB
954        * is Quicktime's MJPEG-B. LJPEG is lossless JPEG. I don't know what
955        * sp5x is, but it's apparently something JPEG... We don't separate
956        * between those in GStreamer. Should we (at least between MJPEG,
957        * MJPEG-B and sp5x decoding...)? */
958     case AV_CODEC_ID_MJPEG:
959     case AV_CODEC_ID_LJPEG:
960       caps =
961           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/jpeg",
962           "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
963       break;
964
965     case AV_CODEC_ID_JPEG2000:
966       caps =
967           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-j2c",
968           NULL);
969       if (!encode) {
970         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
971                 encode, "image/x-jpc", NULL));
972         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
973                 encode, "image/jp2", NULL));
974       }
975       break;
976
977     case AV_CODEC_ID_SP5X:
978       caps =
979           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/sp5x",
980           NULL);
981       break;
982
983     case AV_CODEC_ID_MJPEGB:
984       caps =
985           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
986           "video/x-mjpeg-b", NULL);
987       break;
988
989     case AV_CODEC_ID_MPEG4:
990       if (encode && context != NULL) {
991         /* I'm not exactly sure what ffmpeg outputs... ffmpeg itself uses
992          * the AVI fourcc 'DIVX', but 'mp4v' for Quicktime... */
993         switch (context->codec_tag) {
994           case GST_MAKE_FOURCC ('D', 'I', 'V', 'X'):
995             caps =
996                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
997                 "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL);
998             break;
999           case GST_MAKE_FOURCC ('m', 'p', '4', 'v'):
1000           default:
1001             /* FIXME: bitrate. libav doesn't expose the used profile and level */
1002             caps =
1003                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1004                 "video/mpeg", "systemstream", G_TYPE_BOOLEAN, FALSE,
1005                 "mpegversion", G_TYPE_INT, 4, NULL);
1006             break;
1007         }
1008       } else {
1009         /* The trick here is to separate xvid, divx, mpeg4, 3ivx et al */
1010         caps =
1011             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
1012             "mpegversion", G_TYPE_INT, 4, "systemstream", G_TYPE_BOOLEAN, FALSE,
1013             NULL);
1014
1015         if (encode) {
1016           GValue arr = { 0, };
1017           GValue item = { 0, };
1018
1019           g_value_init (&arr, GST_TYPE_LIST);
1020           g_value_init (&item, G_TYPE_STRING);
1021           g_value_set_string (&item, "simple");
1022           gst_value_list_append_value (&arr, &item);
1023           g_value_set_string (&item, "advanced-simple");
1024           gst_value_list_append_value (&arr, &item);
1025           g_value_unset (&item);
1026
1027           gst_caps_set_value (caps, "profile", &arr);
1028           g_value_unset (&arr);
1029
1030           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1031                   encode, "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL));
1032         } else {
1033           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1034                   encode, "video/x-divx", "divxversion", GST_TYPE_INT_RANGE, 4,
1035                   5, NULL));
1036         }
1037       }
1038       break;
1039
1040     case AV_CODEC_ID_RAWVIDEO:
1041       caps =
1042           gst_ffmpeg_codectype_to_video_caps (context, codec_id, encode, NULL);
1043       break;
1044
1045     case AV_CODEC_ID_MSMPEG4V1:
1046     case AV_CODEC_ID_MSMPEG4V2:
1047     case AV_CODEC_ID_MSMPEG4V3:
1048     {
1049       gint version = 41 + codec_id - AV_CODEC_ID_MSMPEG4V1;
1050
1051       /* encode-FIXME: bitrate */
1052       caps =
1053           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1054           "video/x-msmpeg", "msmpegversion", G_TYPE_INT, version, NULL);
1055       if (!encode && codec_id == AV_CODEC_ID_MSMPEG4V3) {
1056         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1057                 encode, "video/x-divx", "divxversion", G_TYPE_INT, 3, NULL));
1058       }
1059     }
1060       break;
1061
1062     case AV_CODEC_ID_WMV1:
1063     case AV_CODEC_ID_WMV2:
1064     {
1065       gint version = (codec_id == AV_CODEC_ID_WMV1) ? 1 : 2;
1066
1067       caps =
1068           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1069           "wmvversion", G_TYPE_INT, version, NULL);
1070     }
1071       break;
1072
1073     case AV_CODEC_ID_FLV1:
1074       caps =
1075           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1076           "video/x-flash-video", "flvversion", G_TYPE_INT, 1, NULL);
1077       break;
1078
1079     case AV_CODEC_ID_SVQ1:
1080       caps =
1081           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1082           "svqversion", G_TYPE_INT, 1, NULL);
1083       break;
1084
1085     case AV_CODEC_ID_SVQ3:
1086       caps =
1087           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1088           "svqversion", G_TYPE_INT, 3, NULL);
1089       break;
1090
1091     case AV_CODEC_ID_DVAUDIO:
1092       caps =
1093           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dv",
1094           NULL);
1095       break;
1096
1097     case AV_CODEC_ID_DVVIDEO:
1098     {
1099       if (encode && context) {
1100         const gchar *format;
1101
1102         switch (context->pix_fmt) {
1103           case AV_PIX_FMT_YUYV422:
1104             format = "YUY2";
1105             break;
1106           case AV_PIX_FMT_YUV420P:
1107             format = "I420";
1108             break;
1109           case AV_PIX_FMT_YUVA420P:
1110             format = "A420";
1111             break;
1112           case AV_PIX_FMT_YUV411P:
1113             format = "Y41B";
1114             break;
1115           case AV_PIX_FMT_YUV422P:
1116             format = "Y42B";
1117             break;
1118           case AV_PIX_FMT_YUV410P:
1119             format = "YUV9";
1120             break;
1121           default:
1122             GST_WARNING
1123                 ("Couldnt' find format for pixfmt %d, defaulting to I420",
1124                 context->pix_fmt);
1125             format = "I420";
1126             break;
1127         }
1128         caps =
1129             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1130             "systemstream", G_TYPE_BOOLEAN, FALSE, "format", G_TYPE_STRING,
1131             format, NULL);
1132       } else {
1133         caps =
1134             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1135             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
1136       }
1137     }
1138       break;
1139
1140     case AV_CODEC_ID_WMAV1:
1141     case AV_CODEC_ID_WMAV2:
1142     {
1143       gint version = (codec_id == AV_CODEC_ID_WMAV1) ? 1 : 2;
1144
1145       if (context) {
1146         caps =
1147             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1148             "wmaversion", G_TYPE_INT, version, "block_align", G_TYPE_INT,
1149             context->block_align, "bitrate", G_TYPE_INT, context->bit_rate,
1150             NULL);
1151       } else {
1152         caps =
1153             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1154             "wmaversion", G_TYPE_INT, version, "block_align",
1155             GST_TYPE_INT_RANGE, 0, G_MAXINT, "bitrate", GST_TYPE_INT_RANGE, 0,
1156             G_MAXINT, NULL);
1157       }
1158     }
1159       break;
1160     case AV_CODEC_ID_WMAPRO:
1161     {
1162       caps =
1163           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1164           "wmaversion", G_TYPE_INT, 3, NULL);
1165       break;
1166     }
1167     case AV_CODEC_ID_WMALOSSLESS:
1168     {
1169       /* libav only supports a depth of 16 at the moment */
1170       caps =
1171           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1172           "wmaversion", G_TYPE_INT, 4, "depth", G_TYPE_INT, 16, NULL);
1173       break;
1174     }
1175     case AV_CODEC_ID_WMAVOICE:
1176     {
1177       caps =
1178           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wms",
1179           NULL);
1180       break;
1181     }
1182
1183     case AV_CODEC_ID_MACE3:
1184     case AV_CODEC_ID_MACE6:
1185     {
1186       gint version = (codec_id == AV_CODEC_ID_MACE3) ? 3 : 6;
1187
1188       caps =
1189           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mace",
1190           "maceversion", G_TYPE_INT, version, NULL);
1191     }
1192       break;
1193
1194     case AV_CODEC_ID_HUFFYUV:
1195       caps =
1196           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1197           "video/x-huffyuv", NULL);
1198       if (context) {
1199         gst_caps_set_simple (caps,
1200             "bpp", G_TYPE_INT, context->bits_per_coded_sample, NULL);
1201       }
1202       break;
1203
1204     case AV_CODEC_ID_CYUV:
1205       caps =
1206           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1207           "video/x-compressed-yuv", NULL);
1208       break;
1209
1210     case AV_CODEC_ID_H264:
1211       caps =
1212           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h264",
1213           "alignment", G_TYPE_STRING, "au", NULL);
1214       if (!encode) {
1215         GValue arr = { 0, };
1216         GValue item = { 0, };
1217         g_value_init (&arr, GST_TYPE_LIST);
1218         g_value_init (&item, G_TYPE_STRING);
1219         g_value_set_string (&item, "avc");
1220         gst_value_list_append_value (&arr, &item);
1221         g_value_set_string (&item, "byte-stream");
1222         gst_value_list_append_value (&arr, &item);
1223         g_value_unset (&item);
1224         gst_caps_set_value (caps, "stream-format", &arr);
1225         g_value_unset (&arr);
1226       }
1227       break;
1228
1229     case AV_CODEC_ID_HEVC:
1230       caps =
1231           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h265",
1232           "alignment", G_TYPE_STRING, "au", NULL);
1233       if (!encode) {
1234         GValue arr = { 0, };
1235         GValue item = { 0, };
1236         g_value_init (&arr, GST_TYPE_LIST);
1237         g_value_init (&item, G_TYPE_STRING);
1238         g_value_set_string (&item, "hvc1");
1239         gst_value_list_append_value (&arr, &item);
1240         g_value_set_string (&item, "hev1");
1241         gst_value_list_append_value (&arr, &item);
1242         g_value_set_string (&item, "byte-stream");
1243         gst_value_list_append_value (&arr, &item);
1244         g_value_unset (&item);
1245         gst_caps_set_value (caps, "stream-format", &arr);
1246         g_value_unset (&arr);
1247       }
1248       break;
1249
1250     case AV_CODEC_ID_INDEO5:
1251       caps =
1252           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1253           "indeoversion", G_TYPE_INT, 5, NULL);
1254       break;
1255
1256     case AV_CODEC_ID_INDEO4:
1257       caps =
1258           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1259           "indeoversion", G_TYPE_INT, 4, NULL);
1260       break;
1261
1262     case AV_CODEC_ID_INDEO3:
1263       caps =
1264           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1265           "indeoversion", G_TYPE_INT, 3, NULL);
1266       break;
1267
1268     case AV_CODEC_ID_INDEO2:
1269       caps =
1270           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1271           "indeoversion", G_TYPE_INT, 2, NULL);
1272       break;
1273
1274     case AV_CODEC_ID_FLASHSV:
1275       caps =
1276           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1277           "video/x-flash-screen", NULL);
1278       break;
1279
1280     case AV_CODEC_ID_VP3:
1281       caps =
1282           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp3",
1283           NULL);
1284       break;
1285
1286     case AV_CODEC_ID_VP5:
1287       caps =
1288           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp5",
1289           NULL);
1290       break;
1291
1292     case AV_CODEC_ID_VP6:
1293       caps =
1294           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp6",
1295           NULL);
1296       break;
1297
1298     case AV_CODEC_ID_VP6F:
1299       caps =
1300           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1301           "video/x-vp6-flash", NULL);
1302       break;
1303
1304     case AV_CODEC_ID_VP6A:
1305       caps =
1306           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1307           "video/x-vp6-alpha", NULL);
1308       break;
1309
1310     case AV_CODEC_ID_VP8:
1311       caps =
1312           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp8",
1313           NULL);
1314       break;
1315
1316     case AV_CODEC_ID_VP9:
1317       caps =
1318           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp9",
1319           NULL);
1320       break;
1321
1322     case AV_CODEC_ID_THEORA:
1323       caps =
1324           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1325           "video/x-theora", NULL);
1326       break;
1327
1328     case AV_CODEC_ID_AAC:
1329     {
1330       caps =
1331           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1332           NULL);
1333
1334       if (!encode) {
1335         GValue arr = { 0, };
1336         GValue item = { 0, };
1337
1338         g_value_init (&arr, GST_TYPE_LIST);
1339         g_value_init (&item, G_TYPE_INT);
1340         g_value_set_int (&item, 2);
1341         gst_value_list_append_value (&arr, &item);
1342         g_value_set_int (&item, 4);
1343         gst_value_list_append_value (&arr, &item);
1344         g_value_unset (&item);
1345
1346         gst_caps_set_value (caps, "mpegversion", &arr);
1347         g_value_unset (&arr);
1348
1349         g_value_init (&arr, GST_TYPE_LIST);
1350         g_value_init (&item, G_TYPE_STRING);
1351         g_value_set_string (&item, "raw");
1352         gst_value_list_append_value (&arr, &item);
1353         g_value_set_string (&item, "adts");
1354         gst_value_list_append_value (&arr, &item);
1355         g_value_set_string (&item, "adif");
1356         gst_value_list_append_value (&arr, &item);
1357         g_value_unset (&item);
1358
1359         gst_caps_set_value (caps, "stream-format", &arr);
1360         g_value_unset (&arr);
1361       } else {
1362         gst_caps_set_simple (caps, "mpegversion", G_TYPE_INT, 4,
1363             "stream-format", G_TYPE_STRING, "raw",
1364             "base-profile", G_TYPE_STRING, "lc", NULL);
1365
1366         if (context && context->extradata_size > 0)
1367           gst_codec_utils_aac_caps_set_level_and_profile (caps,
1368               context->extradata, context->extradata_size);
1369       }
1370
1371       break;
1372     }
1373     case AV_CODEC_ID_AAC_LATM: /* LATM/LOAS AAC syntax */
1374       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1375           "mpegversion", G_TYPE_INT, 4, "stream-format", G_TYPE_STRING, "loas",
1376           NULL);
1377       break;
1378
1379     case AV_CODEC_ID_ASV1:
1380       caps =
1381           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1382           "asusversion", G_TYPE_INT, 1, NULL);
1383       break;
1384     case AV_CODEC_ID_ASV2:
1385       caps =
1386           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1387           "asusversion", G_TYPE_INT, 2, NULL);
1388       break;
1389
1390     case AV_CODEC_ID_FFV1:
1391       caps =
1392           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-ffv",
1393           "ffvversion", G_TYPE_INT, 1, NULL);
1394       break;
1395
1396     case AV_CODEC_ID_4XM:
1397       caps =
1398           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-4xm",
1399           NULL);
1400       break;
1401
1402     case AV_CODEC_ID_XAN_WC3:
1403     case AV_CODEC_ID_XAN_WC4:
1404       caps =
1405           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-xan",
1406           "wcversion", G_TYPE_INT, 3 - AV_CODEC_ID_XAN_WC3 + codec_id, NULL);
1407       break;
1408
1409     case AV_CODEC_ID_CLJR:
1410       caps =
1411           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1412           "video/x-cirrus-logic-accupak", NULL);
1413       break;
1414
1415     case AV_CODEC_ID_FRAPS:
1416       caps =
1417           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-fraps",
1418           NULL);
1419       break;
1420
1421     case AV_CODEC_ID_MDEC:
1422     case AV_CODEC_ID_ROQ:
1423     case AV_CODEC_ID_INTERPLAY_VIDEO:
1424       buildcaps = TRUE;
1425       break;
1426
1427     case AV_CODEC_ID_VCR1:
1428       caps =
1429           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1430           "video/x-ati-vcr", "vcrversion", G_TYPE_INT, 1, NULL);
1431       break;
1432
1433     case AV_CODEC_ID_RPZA:
1434       caps =
1435           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1436           "video/x-apple-video", NULL);
1437       break;
1438
1439     case AV_CODEC_ID_CINEPAK:
1440       caps =
1441           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1442           "video/x-cinepak", NULL);
1443       break;
1444
1445       /* WS_VQA belogns here (order) */
1446
1447     case AV_CODEC_ID_MSRLE:
1448       caps =
1449           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1450           "layout", G_TYPE_STRING, "microsoft", NULL);
1451       if (context) {
1452         gst_caps_set_simple (caps,
1453             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1454       } else {
1455         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1456       }
1457       break;
1458
1459     case AV_CODEC_ID_QTRLE:
1460       caps =
1461           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1462           "layout", G_TYPE_STRING, "quicktime", NULL);
1463       if (context) {
1464         gst_caps_set_simple (caps,
1465             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1466       } else {
1467         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1468       }
1469       break;
1470
1471     case AV_CODEC_ID_MSVIDEO1:
1472       caps =
1473           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1474           "video/x-msvideocodec", "msvideoversion", G_TYPE_INT, 1, NULL);
1475       break;
1476
1477     case AV_CODEC_ID_MSS1:
1478       caps =
1479           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1480           "wmvversion", G_TYPE_INT, 1, "format", G_TYPE_STRING, "MSS1", NULL);
1481       break;
1482
1483     case AV_CODEC_ID_MSS2:
1484       caps =
1485           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1486           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "MSS2", NULL);
1487       break;
1488
1489     case AV_CODEC_ID_WMV3:
1490       caps =
1491           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1492           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "WMV3", NULL);
1493       break;
1494     case AV_CODEC_ID_VC1:
1495       caps =
1496           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1497           "wmvversion", G_TYPE_INT, 3, NULL);
1498       if (!context && !encode) {
1499         GValue arr = { 0, };
1500         GValue item = { 0, };
1501
1502         g_value_init (&arr, GST_TYPE_LIST);
1503         g_value_init (&item, G_TYPE_STRING);
1504         g_value_set_string (&item, "WVC1");
1505         gst_value_list_append_value (&arr, &item);
1506         g_value_set_string (&item, "WMVA");
1507         gst_value_list_append_and_take_value (&arr, &item);
1508         gst_caps_set_value (caps, "format", &arr);
1509         g_value_unset (&arr);
1510       } else {
1511         gst_caps_set_simple (caps, "format", G_TYPE_STRING, "WVC1", NULL);
1512       }
1513       break;
1514     case AV_CODEC_ID_QDM2:
1515       caps =
1516           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-qdm2",
1517           NULL);
1518       break;
1519
1520     case AV_CODEC_ID_MSZH:
1521       caps =
1522           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mszh",
1523           NULL);
1524       break;
1525
1526     case AV_CODEC_ID_ZLIB:
1527       caps =
1528           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zlib",
1529           NULL);
1530       break;
1531
1532     case AV_CODEC_ID_TRUEMOTION1:
1533       caps =
1534           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1535           "video/x-truemotion", "trueversion", G_TYPE_INT, 1, NULL);
1536       break;
1537     case AV_CODEC_ID_TRUEMOTION2:
1538       caps =
1539           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1540           "video/x-truemotion", "trueversion", G_TYPE_INT, 2, NULL);
1541       break;
1542
1543     case AV_CODEC_ID_ULTI:
1544       caps =
1545           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1546           "video/x-ultimotion", NULL);
1547       break;
1548
1549     case AV_CODEC_ID_TSCC:
1550       caps =
1551           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1552           "video/x-camtasia", NULL);
1553       if (context) {
1554         gst_caps_set_simple (caps,
1555             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1556       } else {
1557         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1558       }
1559       break;
1560
1561     case AV_CODEC_ID_TSCC2:
1562       caps =
1563           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1564           "video/x-tscc", "tsccversion", G_TYPE_INT, 2, NULL);
1565       break;
1566
1567     case AV_CODEC_ID_KMVC:
1568       caps =
1569           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-kmvc",
1570           NULL);
1571       break;
1572
1573     case AV_CODEC_ID_NUV:
1574       caps =
1575           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-nuv",
1576           NULL);
1577       break;
1578
1579     case AV_CODEC_ID_GIF:
1580       caps =
1581           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/gif",
1582           NULL);
1583       break;
1584
1585     case AV_CODEC_ID_PNG:
1586       caps =
1587           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/png",
1588           NULL);
1589       break;
1590
1591     case AV_CODEC_ID_PPM:
1592       caps =
1593           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/ppm",
1594           NULL);
1595       break;
1596
1597     case AV_CODEC_ID_PBM:
1598       caps =
1599           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/pbm",
1600           NULL);
1601       break;
1602
1603     case AV_CODEC_ID_PAM:
1604       caps =
1605           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1606           "image/x-portable-anymap", NULL);
1607       break;
1608
1609     case AV_CODEC_ID_PGM:
1610       caps =
1611           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1612           "image/x-portable-graymap", NULL);
1613       break;
1614
1615     case AV_CODEC_ID_PCX:
1616       caps =
1617           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-pcx",
1618           NULL);
1619       break;
1620
1621     case AV_CODEC_ID_SGI:
1622       caps =
1623           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-sgi",
1624           NULL);
1625       break;
1626
1627     case AV_CODEC_ID_TARGA:
1628       caps =
1629           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-tga",
1630           NULL);
1631       break;
1632
1633     case AV_CODEC_ID_TIFF:
1634       caps =
1635           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/tiff",
1636           NULL);
1637       break;
1638
1639     case AV_CODEC_ID_SUNRAST:
1640       caps =
1641           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1642           "image/x-sun-raster", NULL);
1643       break;
1644
1645     case AV_CODEC_ID_SMC:
1646       caps =
1647           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-smc",
1648           NULL);
1649       break;
1650
1651     case AV_CODEC_ID_QDRAW:
1652       caps =
1653           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-qdrw",
1654           NULL);
1655       break;
1656
1657     case AV_CODEC_ID_DNXHD:
1658       caps =
1659           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dnxhd",
1660           NULL);
1661       break;
1662
1663     case AV_CODEC_ID_PRORES:
1664       caps =
1665           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1666           "video/x-prores", NULL);
1667       break;
1668
1669     case AV_CODEC_ID_MIMIC:
1670       caps =
1671           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mimic",
1672           NULL);
1673       break;
1674
1675     case AV_CODEC_ID_VMNC:
1676       caps =
1677           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vmnc",
1678           NULL);
1679       break;
1680
1681     case AV_CODEC_ID_TRUESPEECH:
1682       caps =
1683           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
1684           "audio/x-truespeech", NULL);
1685       break;
1686
1687     case AV_CODEC_ID_QCELP:
1688       caps =
1689           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/qcelp",
1690           NULL);
1691       break;
1692
1693     case AV_CODEC_ID_AMV:
1694       caps =
1695           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-amv",
1696           NULL);
1697       break;
1698
1699     case AV_CODEC_ID_AASC:
1700       caps =
1701           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-aasc",
1702           NULL);
1703       break;
1704
1705     case AV_CODEC_ID_LOCO:
1706       caps =
1707           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-loco",
1708           NULL);
1709       break;
1710
1711     case AV_CODEC_ID_ZMBV:
1712       caps =
1713           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zmbv",
1714           NULL);
1715       break;
1716
1717     case AV_CODEC_ID_LAGARITH:
1718       caps =
1719           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1720           "video/x-lagarith", NULL);
1721       break;
1722
1723     case AV_CODEC_ID_CSCD:
1724       caps =
1725           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1726           "video/x-camstudio", NULL);
1727       if (context) {
1728         gst_caps_set_simple (caps,
1729             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1730       } else {
1731         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1732       }
1733       break;
1734
1735     case AV_CODEC_ID_AIC:
1736       caps =
1737           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1738           "video/x-apple-intermediate-codec", NULL);
1739       break;
1740
1741     case AV_CODEC_ID_CAVS:
1742       caps =
1743           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1744           "video/x-cavs", NULL);
1745       break;
1746
1747     case AV_CODEC_ID_WS_VQA:
1748     case AV_CODEC_ID_IDCIN:
1749     case AV_CODEC_ID_8BPS:
1750     case AV_CODEC_ID_FLIC:
1751     case AV_CODEC_ID_VMDVIDEO:
1752     case AV_CODEC_ID_VMDAUDIO:
1753     case AV_CODEC_ID_VIXL:
1754     case AV_CODEC_ID_QPEG:
1755     case AV_CODEC_ID_PGMYUV:
1756     case AV_CODEC_ID_FFVHUFF:
1757     case AV_CODEC_ID_WNV1:
1758     case AV_CODEC_ID_MP3ADU:
1759     case AV_CODEC_ID_MP3ON4:
1760     case AV_CODEC_ID_WESTWOOD_SND1:
1761     case AV_CODEC_ID_MMVIDEO:
1762     case AV_CODEC_ID_AVS:
1763       buildcaps = TRUE;
1764       break;
1765
1766       /* weird quasi-codecs for the demuxers only */
1767     case AV_CODEC_ID_PCM_S16LE:
1768     case AV_CODEC_ID_PCM_S16BE:
1769     case AV_CODEC_ID_PCM_U16LE:
1770     case AV_CODEC_ID_PCM_U16BE:
1771     case AV_CODEC_ID_PCM_S8:
1772     case AV_CODEC_ID_PCM_U8:
1773     {
1774       GstAudioFormat format;
1775
1776       switch (codec_id) {
1777         case AV_CODEC_ID_PCM_S16LE:
1778           format = GST_AUDIO_FORMAT_S16LE;
1779           break;
1780         case AV_CODEC_ID_PCM_S16BE:
1781           format = GST_AUDIO_FORMAT_S16BE;
1782           break;
1783         case AV_CODEC_ID_PCM_U16LE:
1784           format = GST_AUDIO_FORMAT_U16LE;
1785           break;
1786         case AV_CODEC_ID_PCM_U16BE:
1787           format = GST_AUDIO_FORMAT_U16BE;
1788           break;
1789         case AV_CODEC_ID_PCM_S8:
1790           format = GST_AUDIO_FORMAT_S8;
1791           break;
1792         case AV_CODEC_ID_PCM_U8:
1793           format = GST_AUDIO_FORMAT_U8;
1794           break;
1795         default:
1796           format = 0;
1797           g_assert (0);         /* don't worry, we never get here */
1798           break;
1799       }
1800
1801       caps =
1802           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-raw",
1803           "format", G_TYPE_STRING, gst_audio_format_to_string (format),
1804           "layout", G_TYPE_STRING, "interleaved", NULL);
1805     }
1806       break;
1807
1808     case AV_CODEC_ID_PCM_MULAW:
1809       caps =
1810           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mulaw",
1811           NULL);
1812       break;
1813
1814     case AV_CODEC_ID_PCM_ALAW:
1815       caps =
1816           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alaw",
1817           NULL);
1818       break;
1819
1820     case AV_CODEC_ID_ADPCM_G722:
1821       caps =
1822           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G722",
1823           NULL);
1824       if (context)
1825         gst_caps_set_simple (caps,
1826             "block_align", G_TYPE_INT, context->block_align,
1827             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
1828       break;
1829
1830     case AV_CODEC_ID_ADPCM_G726:
1831     {
1832       /* the G726 decoder can also handle G721 */
1833       caps =
1834           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1835           "layout", G_TYPE_STRING, "g726", NULL);
1836       if (context)
1837         gst_caps_set_simple (caps,
1838             "block_align", G_TYPE_INT, context->block_align,
1839             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
1840
1841       if (!encode) {
1842         gst_caps_append (caps, gst_caps_new_simple ("audio/x-adpcm",
1843                 "layout", G_TYPE_STRING, "g721",
1844                 "channels", G_TYPE_INT, 1, "rate", G_TYPE_INT, 8000, NULL));
1845       }
1846       break;
1847     }
1848     case AV_CODEC_ID_ADPCM_IMA_QT:
1849     case AV_CODEC_ID_ADPCM_IMA_WAV:
1850     case AV_CODEC_ID_ADPCM_IMA_DK3:
1851     case AV_CODEC_ID_ADPCM_IMA_DK4:
1852     case AV_CODEC_ID_ADPCM_IMA_WS:
1853     case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1854     case AV_CODEC_ID_ADPCM_IMA_AMV:
1855     case AV_CODEC_ID_ADPCM_IMA_ISS:
1856     case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1857     case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1858     case AV_CODEC_ID_ADPCM_MS:
1859     case AV_CODEC_ID_ADPCM_4XM:
1860     case AV_CODEC_ID_ADPCM_XA:
1861     case AV_CODEC_ID_ADPCM_ADX:
1862     case AV_CODEC_ID_ADPCM_EA:
1863     case AV_CODEC_ID_ADPCM_CT:
1864     case AV_CODEC_ID_ADPCM_SWF:
1865     case AV_CODEC_ID_ADPCM_YAMAHA:
1866     case AV_CODEC_ID_ADPCM_SBPRO_2:
1867     case AV_CODEC_ID_ADPCM_SBPRO_3:
1868     case AV_CODEC_ID_ADPCM_SBPRO_4:
1869     case AV_CODEC_ID_ADPCM_EA_R1:
1870     case AV_CODEC_ID_ADPCM_EA_R2:
1871     case AV_CODEC_ID_ADPCM_EA_R3:
1872     case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
1873     case AV_CODEC_ID_ADPCM_EA_XAS:
1874     case AV_CODEC_ID_ADPCM_THP:
1875     {
1876       const gchar *layout = NULL;
1877
1878       switch (codec_id) {
1879         case AV_CODEC_ID_ADPCM_IMA_QT:
1880           layout = "quicktime";
1881           break;
1882         case AV_CODEC_ID_ADPCM_IMA_WAV:
1883           layout = "dvi";
1884           break;
1885         case AV_CODEC_ID_ADPCM_IMA_DK3:
1886           layout = "dk3";
1887           break;
1888         case AV_CODEC_ID_ADPCM_IMA_DK4:
1889           layout = "dk4";
1890           break;
1891         case AV_CODEC_ID_ADPCM_IMA_WS:
1892           layout = "westwood";
1893           break;
1894         case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1895           layout = "smjpeg";
1896           break;
1897         case AV_CODEC_ID_ADPCM_IMA_AMV:
1898           layout = "amv";
1899           break;
1900         case AV_CODEC_ID_ADPCM_IMA_ISS:
1901           layout = "iss";
1902           break;
1903         case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1904           layout = "ea-eacs";
1905           break;
1906         case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1907           layout = "ea-sead";
1908           break;
1909         case AV_CODEC_ID_ADPCM_MS:
1910           layout = "microsoft";
1911           break;
1912         case AV_CODEC_ID_ADPCM_4XM:
1913           layout = "4xm";
1914           break;
1915         case AV_CODEC_ID_ADPCM_XA:
1916           layout = "xa";
1917           break;
1918         case AV_CODEC_ID_ADPCM_ADX:
1919           layout = "adx";
1920           break;
1921         case AV_CODEC_ID_ADPCM_EA:
1922           layout = "ea";
1923           break;
1924         case AV_CODEC_ID_ADPCM_CT:
1925           layout = "ct";
1926           break;
1927         case AV_CODEC_ID_ADPCM_SWF:
1928           layout = "swf";
1929           break;
1930         case AV_CODEC_ID_ADPCM_YAMAHA:
1931           layout = "yamaha";
1932           break;
1933         case AV_CODEC_ID_ADPCM_SBPRO_2:
1934           layout = "sbpro2";
1935           break;
1936         case AV_CODEC_ID_ADPCM_SBPRO_3:
1937           layout = "sbpro3";
1938           break;
1939         case AV_CODEC_ID_ADPCM_SBPRO_4:
1940           layout = "sbpro4";
1941           break;
1942         case AV_CODEC_ID_ADPCM_EA_R1:
1943           layout = "ea-r1";
1944           break;
1945         case AV_CODEC_ID_ADPCM_EA_R2:
1946           layout = "ea-r3";
1947           break;
1948         case AV_CODEC_ID_ADPCM_EA_R3:
1949           layout = "ea-r3";
1950           break;
1951         case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
1952           layout = "ea-maxis-xa";
1953           break;
1954         case AV_CODEC_ID_ADPCM_EA_XAS:
1955           layout = "ea-xas";
1956           break;
1957         case AV_CODEC_ID_ADPCM_THP:
1958           layout = "thp";
1959           break;
1960         default:
1961           g_assert (0);         /* don't worry, we never get here */
1962           break;
1963       }
1964
1965       /* FIXME: someone please check whether we need additional properties
1966        * in this caps definition. */
1967       caps =
1968           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1969           "layout", G_TYPE_STRING, layout, NULL);
1970       if (context)
1971         gst_caps_set_simple (caps,
1972             "block_align", G_TYPE_INT, context->block_align,
1973             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
1974     }
1975       break;
1976
1977     case AV_CODEC_ID_AMR_NB:
1978       caps =
1979           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR",
1980           NULL);
1981       break;
1982
1983     case AV_CODEC_ID_AMR_WB:
1984       caps =
1985           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR-WB",
1986           NULL);
1987       break;
1988
1989     case AV_CODEC_ID_GSM:
1990       caps =
1991           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-gsm",
1992           NULL);
1993       break;
1994
1995     case AV_CODEC_ID_GSM_MS:
1996       caps =
1997           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/ms-gsm",
1998           NULL);
1999       break;
2000
2001     case AV_CODEC_ID_NELLYMOSER:
2002       caps =
2003           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2004           "audio/x-nellymoser", NULL);
2005       break;
2006
2007     case AV_CODEC_ID_SIPR:
2008     {
2009       caps =
2010           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-sipro",
2011           NULL);
2012       if (context) {
2013         gst_caps_set_simple (caps,
2014             "leaf_size", G_TYPE_INT, context->block_align,
2015             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
2016       }
2017     }
2018       break;
2019
2020     case AV_CODEC_ID_RA_144:
2021     case AV_CODEC_ID_RA_288:
2022     case AV_CODEC_ID_COOK:
2023     {
2024       gint version = 0;
2025
2026       switch (codec_id) {
2027         case AV_CODEC_ID_RA_144:
2028           version = 1;
2029           break;
2030         case AV_CODEC_ID_RA_288:
2031           version = 2;
2032           break;
2033         case AV_CODEC_ID_COOK:
2034           version = 8;
2035           break;
2036         default:
2037           break;
2038       }
2039
2040       /* FIXME: properties? */
2041       caps =
2042           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2043           "audio/x-pn-realaudio", "raversion", G_TYPE_INT, version, NULL);
2044       if (context) {
2045         gst_caps_set_simple (caps,
2046             "leaf_size", G_TYPE_INT, context->block_align,
2047             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
2048       }
2049     }
2050       break;
2051
2052     case AV_CODEC_ID_ROQ_DPCM:
2053     case AV_CODEC_ID_INTERPLAY_DPCM:
2054     case AV_CODEC_ID_XAN_DPCM:
2055     case AV_CODEC_ID_SOL_DPCM:
2056     {
2057       const gchar *layout = NULL;
2058
2059       switch (codec_id) {
2060         case AV_CODEC_ID_ROQ_DPCM:
2061           layout = "roq";
2062           break;
2063         case AV_CODEC_ID_INTERPLAY_DPCM:
2064           layout = "interplay";
2065           break;
2066         case AV_CODEC_ID_XAN_DPCM:
2067           layout = "xan";
2068           break;
2069         case AV_CODEC_ID_SOL_DPCM:
2070           layout = "sol";
2071           break;
2072         default:
2073           g_assert (0);         /* don't worry, we never get here */
2074           break;
2075       }
2076
2077       /* FIXME: someone please check whether we need additional properties
2078        * in this caps definition. */
2079       caps =
2080           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dpcm",
2081           "layout", G_TYPE_STRING, layout, NULL);
2082       if (context)
2083         gst_caps_set_simple (caps,
2084             "block_align", G_TYPE_INT, context->block_align,
2085             "bitrate", G_TYPE_INT, context->bit_rate, NULL);
2086     }
2087       break;
2088
2089     case AV_CODEC_ID_SHORTEN:
2090       caps = gst_caps_new_empty_simple ("audio/x-shorten");
2091       break;
2092
2093     case AV_CODEC_ID_ALAC:
2094       caps =
2095           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alac",
2096           NULL);
2097       if (context) {
2098         gst_caps_set_simple (caps,
2099             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2100       }
2101       break;
2102
2103     case AV_CODEC_ID_FLAC:
2104       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2105        * encoder case, we want to add things like samplerate, channels... */
2106       if (!encode) {
2107         caps = gst_caps_new_empty_simple ("audio/x-flac");
2108       }
2109       break;
2110
2111     case AV_CODEC_ID_S302M:
2112       caps = gst_caps_new_empty_simple ("audio/x-smpte-302m");
2113       break;
2114
2115     case AV_CODEC_ID_DVD_SUBTITLE:
2116     case AV_CODEC_ID_DVB_SUBTITLE:
2117       caps = NULL;
2118       break;
2119     case AV_CODEC_ID_BMP:
2120       caps = gst_caps_new_empty_simple ("image/bmp");
2121       break;
2122     case AV_CODEC_ID_TTA:
2123       caps =
2124           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-tta",
2125           NULL);
2126       if (context) {
2127         gst_caps_set_simple (caps,
2128             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2129       }
2130       break;
2131     case AV_CODEC_ID_TWINVQ:
2132       caps =
2133           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2134           "audio/x-twin-vq", NULL);
2135       break;
2136     default:
2137       GST_DEBUG ("Unknown codec ID %d, please add mapping here", codec_id);
2138       break;
2139   }
2140
2141   if (buildcaps) {
2142     AVCodec *codec;
2143
2144     if ((codec = avcodec_find_decoder (codec_id)) ||
2145         (codec = avcodec_find_encoder (codec_id))) {
2146       gchar *mime = NULL;
2147
2148       GST_LOG ("Could not create stream format caps for %s", codec->name);
2149
2150       switch (codec->type) {
2151         case AVMEDIA_TYPE_VIDEO:
2152           mime = g_strdup_printf ("video/x-gst-av-%s", codec->name);
2153           caps =
2154               gst_ff_vid_caps_new (context, NULL, codec_id, encode, mime, NULL);
2155           g_free (mime);
2156           break;
2157         case AVMEDIA_TYPE_AUDIO:
2158           mime = g_strdup_printf ("audio/x-gst-av-%s", codec->name);
2159           caps =
2160               gst_ff_aud_caps_new (context, NULL, codec_id, encode, mime, NULL);
2161           if (context)
2162             gst_caps_set_simple (caps,
2163                 "block_align", G_TYPE_INT, context->block_align,
2164                 "bitrate", G_TYPE_INT, context->bit_rate, NULL);
2165           g_free (mime);
2166           break;
2167         default:
2168           break;
2169       }
2170     }
2171   }
2172
2173   if (caps != NULL) {
2174
2175     /* set private data */
2176     if (context && context->extradata_size > 0) {
2177       GstBuffer *data = gst_buffer_new_and_alloc (context->extradata_size);
2178
2179       gst_buffer_fill (data, 0, context->extradata, context->extradata_size);
2180       gst_caps_set_simple (caps, "codec_data", GST_TYPE_BUFFER, data, NULL);
2181       gst_buffer_unref (data);
2182     }
2183
2184     GST_LOG ("caps for codec_id=%d: %" GST_PTR_FORMAT, codec_id, caps);
2185
2186   } else {
2187     GST_LOG ("No caps found for codec_id=%d", codec_id);
2188   }
2189
2190   return caps;
2191 }
2192
2193 /* Convert a FFMPEG Pixel Format and optional AVCodecContext
2194  * to a GstCaps. If the context is ommitted, no fixed values
2195  * for video/audio size will be included in the GstCaps
2196  *
2197  * See below for usefullness
2198  */
2199
2200 static GstCaps *
2201 gst_ffmpeg_pixfmt_to_caps (enum AVPixelFormat pix_fmt, AVCodecContext * context,
2202     enum AVCodecID codec_id)
2203 {
2204   GstCaps *caps = NULL;
2205   GstVideoFormat format;
2206
2207   format = gst_ffmpeg_pixfmt_to_videoformat (pix_fmt);
2208
2209   if (format != GST_VIDEO_FORMAT_UNKNOWN) {
2210     caps = gst_ff_vid_caps_new (context, NULL, codec_id, TRUE, "video/x-raw",
2211         "format", G_TYPE_STRING, gst_video_format_to_string (format), NULL);
2212   }
2213
2214   if (caps != NULL) {
2215     GST_DEBUG ("caps for pix_fmt=%d: %" GST_PTR_FORMAT, pix_fmt, caps);
2216   } else {
2217     GST_LOG ("No caps found for pix_fmt=%d", pix_fmt);
2218   }
2219
2220   return caps;
2221 }
2222
2223 GstAudioFormat
2224 gst_ffmpeg_smpfmt_to_audioformat (enum AVSampleFormat sample_fmt)
2225 {
2226   switch (sample_fmt) {
2227     case AV_SAMPLE_FMT_U8:
2228     case AV_SAMPLE_FMT_U8P:
2229       return GST_AUDIO_FORMAT_U8;
2230       break;
2231     case AV_SAMPLE_FMT_S16:
2232     case AV_SAMPLE_FMT_S16P:
2233       return GST_AUDIO_FORMAT_S16;
2234       break;
2235     case AV_SAMPLE_FMT_S32:
2236     case AV_SAMPLE_FMT_S32P:
2237       return GST_AUDIO_FORMAT_S32;
2238       break;
2239     case AV_SAMPLE_FMT_FLT:
2240     case AV_SAMPLE_FMT_FLTP:
2241       return GST_AUDIO_FORMAT_F32;
2242       break;
2243     case AV_SAMPLE_FMT_DBL:
2244     case AV_SAMPLE_FMT_DBLP:
2245       return GST_AUDIO_FORMAT_F64;
2246       break;
2247     default:
2248       /* .. */
2249       return GST_AUDIO_FORMAT_UNKNOWN;
2250       break;
2251   }
2252 }
2253
2254 /* Convert a FFMPEG Sample Format and optional AVCodecContext
2255  * to a GstCaps. If the context is ommitted, no fixed values
2256  * for video/audio size will be included in the GstCaps
2257  *
2258  * See below for usefullness
2259  */
2260
2261 static GstCaps *
2262 gst_ffmpeg_smpfmt_to_caps (enum AVSampleFormat sample_fmt,
2263     AVCodecContext * context, AVCodec * codec, enum AVCodecID codec_id)
2264 {
2265   GstCaps *caps = NULL;
2266   GstAudioFormat format;
2267
2268   format = gst_ffmpeg_smpfmt_to_audioformat (sample_fmt);
2269
2270   if (format != GST_AUDIO_FORMAT_UNKNOWN) {
2271     caps = gst_ff_aud_caps_new (context, codec, codec_id, TRUE, "audio/x-raw",
2272         "format", G_TYPE_STRING, gst_audio_format_to_string (format),
2273         "layout", G_TYPE_STRING, "interleaved", NULL);
2274     GST_LOG ("caps for sample_fmt=%d: %" GST_PTR_FORMAT, sample_fmt, caps);
2275   } else {
2276     GST_LOG ("No caps found for sample_fmt=%d", sample_fmt);
2277   }
2278
2279   return caps;
2280 }
2281
2282 static gboolean
2283 caps_has_field (GstCaps * caps, const gchar * field)
2284 {
2285   guint i, n;
2286
2287   n = gst_caps_get_size (caps);
2288   for (i = 0; i < n; i++) {
2289     GstStructure *s = gst_caps_get_structure (caps, i);
2290
2291     if (gst_structure_has_field (s, field))
2292       return TRUE;
2293   }
2294
2295   return FALSE;
2296 }
2297
2298 GstCaps *
2299 gst_ffmpeg_codectype_to_audio_caps (AVCodecContext * context,
2300     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2301 {
2302   GstCaps *caps = NULL;
2303
2304   GST_DEBUG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2305       context, codec_id, encode, codec);
2306   if (codec)
2307     GST_DEBUG ("sample_fmts:%p, samplerates:%p",
2308         codec->sample_fmts, codec->supported_samplerates);
2309
2310   if (context) {
2311     /* Specific codec context */
2312     caps =
2313         gst_ffmpeg_smpfmt_to_caps (context->sample_fmt, context, codec,
2314         codec_id);
2315   } else {
2316     caps = gst_ff_aud_caps_new (context, codec, codec_id, encode, "audio/x-raw",
2317         "layout", G_TYPE_STRING, "interleaved", NULL);
2318     if (!caps_has_field (caps, "format"))
2319       gst_ffmpeg_audio_set_sample_fmts (caps,
2320           codec ? codec->sample_fmts : NULL);
2321   }
2322
2323   return caps;
2324 }
2325
2326 GstCaps *
2327 gst_ffmpeg_codectype_to_video_caps (AVCodecContext * context,
2328     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2329 {
2330   GstCaps *caps;
2331
2332   GST_LOG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2333       context, codec_id, encode, codec);
2334
2335   if (context) {
2336     caps = gst_ffmpeg_pixfmt_to_caps (context->pix_fmt, context, codec_id);
2337   } else {
2338     caps =
2339         gst_ff_vid_caps_new (context, codec, codec_id, encode, "video/x-raw",
2340         NULL);
2341     if (!caps_has_field (caps, "format"))
2342       gst_ffmpeg_video_set_pix_fmts (caps, codec ? codec->pix_fmts : NULL);
2343   }
2344   return caps;
2345 }
2346
2347 /* Convert a GstCaps (audio/raw) to a FFMPEG SampleFmt
2348  * and other audio properties in a AVCodecContext.
2349  *
2350  * For usefullness, see below
2351  */
2352
2353 static void
2354 gst_ffmpeg_caps_to_smpfmt (const GstCaps * caps,
2355     AVCodecContext * context, gboolean raw)
2356 {
2357   GstStructure *structure;
2358   const gchar *fmt;
2359   GstAudioFormat format = GST_AUDIO_FORMAT_UNKNOWN;
2360   gint bitrate;
2361
2362   g_return_if_fail (gst_caps_get_size (caps) == 1);
2363
2364   structure = gst_caps_get_structure (caps, 0);
2365
2366   gst_structure_get_int (structure, "channels", &context->channels);
2367   gst_structure_get_int (structure, "rate", &context->sample_rate);
2368   gst_structure_get_int (structure, "block_align", &context->block_align);
2369   if (gst_structure_get_int (structure, "bitrate", &bitrate))
2370     context->bit_rate = bitrate;
2371
2372   if (!raw)
2373     return;
2374
2375   if (gst_structure_has_name (structure, "audio/x-raw")) {
2376     if ((fmt = gst_structure_get_string (structure, "format"))) {
2377       format = gst_audio_format_from_string (fmt);
2378     }
2379   }
2380
2381   switch (format) {
2382     case GST_AUDIO_FORMAT_F32:
2383       context->sample_fmt = AV_SAMPLE_FMT_FLT;
2384       break;
2385     case GST_AUDIO_FORMAT_F64:
2386       context->sample_fmt = AV_SAMPLE_FMT_DBL;
2387       break;
2388     case GST_AUDIO_FORMAT_S32:
2389       context->sample_fmt = AV_SAMPLE_FMT_S32;
2390       break;
2391     case GST_AUDIO_FORMAT_S16:
2392       context->sample_fmt = AV_SAMPLE_FMT_S16;
2393       break;
2394     default:
2395       break;
2396   }
2397 }
2398
2399 /* Convert a GstCaps (video/raw) to a FFMPEG PixFmt
2400  * and other video properties in a AVCodecContext.
2401  *
2402  * For usefullness, see below
2403  */
2404
2405 static void
2406 gst_ffmpeg_caps_to_pixfmt (const GstCaps * caps,
2407     AVCodecContext * context, gboolean raw)
2408 {
2409   GstStructure *structure;
2410   const GValue *fps;
2411   const GValue *par = NULL;
2412   const gchar *fmt;
2413   GstVideoFormat format = GST_VIDEO_FORMAT_UNKNOWN;
2414
2415   GST_DEBUG ("converting caps %" GST_PTR_FORMAT, caps);
2416   g_return_if_fail (gst_caps_get_size (caps) == 1);
2417   structure = gst_caps_get_structure (caps, 0);
2418
2419   gst_structure_get_int (structure, "width", &context->width);
2420   gst_structure_get_int (structure, "height", &context->height);
2421   gst_structure_get_int (structure, "bpp", &context->bits_per_coded_sample);
2422
2423   fps = gst_structure_get_value (structure, "framerate");
2424   if (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps)) {
2425
2426     int num = gst_value_get_fraction_numerator (fps);
2427     int den = gst_value_get_fraction_denominator (fps);
2428
2429     if (num > 0 && den > 0) {
2430       /* somehow these seem mixed up.. */
2431       /* they're fine, this is because it does period=1/frequency */
2432       context->time_base.den = gst_value_get_fraction_numerator (fps);
2433       context->time_base.num = gst_value_get_fraction_denominator (fps);
2434       context->ticks_per_frame = 1;
2435
2436       GST_DEBUG ("setting framerate %d/%d = %lf",
2437           context->time_base.den, context->time_base.num,
2438           1. * context->time_base.den / context->time_base.num);
2439     } else {
2440       GST_WARNING ("ignoring insane framerate %d/%d",
2441           context->time_base.den, context->time_base.num);
2442     }
2443   }
2444
2445   par = gst_structure_get_value (structure, "pixel-aspect-ratio");
2446   if (par && GST_VALUE_HOLDS_FRACTION (par)) {
2447
2448     int num = gst_value_get_fraction_numerator (par);
2449     int den = gst_value_get_fraction_denominator (par);
2450
2451     if (num > 0 && den > 0) {
2452       context->sample_aspect_ratio.num = num;
2453       context->sample_aspect_ratio.den = den;
2454
2455       GST_DEBUG ("setting pixel-aspect-ratio %d/%d = %lf",
2456           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den,
2457           1. * context->sample_aspect_ratio.num /
2458           context->sample_aspect_ratio.den);
2459     } else {
2460       GST_WARNING ("ignoring insane pixel-aspect-ratio %d/%d",
2461           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den);
2462     }
2463   }
2464
2465   if (!raw)
2466     return;
2467
2468   g_return_if_fail (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps));
2469
2470   if (gst_structure_has_name (structure, "video/x-raw")) {
2471     if ((fmt = gst_structure_get_string (structure, "format"))) {
2472       format = gst_video_format_from_string (fmt);
2473     }
2474   }
2475
2476   switch (format) {
2477     case GST_VIDEO_FORMAT_YUY2:
2478       context->pix_fmt = AV_PIX_FMT_YUYV422;
2479       break;
2480     case GST_VIDEO_FORMAT_I420:
2481       context->pix_fmt = AV_PIX_FMT_YUV420P;
2482       break;
2483     case GST_VIDEO_FORMAT_A420:
2484       context->pix_fmt = AV_PIX_FMT_YUVA420P;
2485       break;
2486     case GST_VIDEO_FORMAT_Y41B:
2487       context->pix_fmt = AV_PIX_FMT_YUV411P;
2488       break;
2489     case GST_VIDEO_FORMAT_Y42B:
2490       context->pix_fmt = AV_PIX_FMT_YUV422P;
2491       break;
2492     case GST_VIDEO_FORMAT_YUV9:
2493       context->pix_fmt = AV_PIX_FMT_YUV410P;
2494       break;
2495     case GST_VIDEO_FORMAT_Y444:
2496       context->pix_fmt = AV_PIX_FMT_YUV444P;
2497       break;
2498     case GST_VIDEO_FORMAT_GRAY8:
2499       context->pix_fmt = AV_PIX_FMT_GRAY8;
2500       break;
2501     case GST_VIDEO_FORMAT_xRGB:
2502 #if (G_BYTE_ORDER == G_BIG_ENDIAN)
2503       context->pix_fmt = AV_PIX_FMT_RGB32;
2504 #endif
2505       break;
2506     case GST_VIDEO_FORMAT_BGRx:
2507 #if (G_BYTE_ORDER == G_LITTLE_ENDIAN)
2508       context->pix_fmt = AV_PIX_FMT_RGB32;
2509 #endif
2510       break;
2511     case GST_VIDEO_FORMAT_RGB:
2512       context->pix_fmt = AV_PIX_FMT_RGB24;
2513       break;
2514     case GST_VIDEO_FORMAT_BGR:
2515       context->pix_fmt = AV_PIX_FMT_BGR24;
2516       break;
2517     case GST_VIDEO_FORMAT_RGB16:
2518       context->pix_fmt = AV_PIX_FMT_RGB565;
2519       break;
2520     case GST_VIDEO_FORMAT_RGB15:
2521       context->pix_fmt = AV_PIX_FMT_RGB555;
2522       break;
2523     case GST_VIDEO_FORMAT_RGB8P:
2524       context->pix_fmt = AV_PIX_FMT_PAL8;
2525       break;
2526     default:
2527       break;
2528   }
2529 }
2530
2531 typedef struct
2532 {
2533   GstVideoFormat format;
2534   enum AVPixelFormat pixfmt;
2535 } PixToFmt;
2536
2537 /* FIXME : FILLME */
2538 static const PixToFmt pixtofmttable[] = {
2539   /* GST_VIDEO_FORMAT_I420, */
2540   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUV420P},
2541   /* Note : this should use a different chroma placement */
2542   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUVJ420P},
2543
2544   /* GST_VIDEO_FORMAT_YV12, */
2545   /* GST_VIDEO_FORMAT_YUY2, */
2546   {GST_VIDEO_FORMAT_YUY2, AV_PIX_FMT_YUYV422},
2547   /* GST_VIDEO_FORMAT_UYVY, */
2548   {GST_VIDEO_FORMAT_UYVY, AV_PIX_FMT_UYVY422},
2549   /* GST_VIDEO_FORMAT_AYUV, */
2550   /* GST_VIDEO_FORMAT_RGBx, */
2551   /* GST_VIDEO_FORMAT_BGRx, */
2552   /* GST_VIDEO_FORMAT_xRGB, */
2553   /* GST_VIDEO_FORMAT_xBGR, */
2554   /* GST_VIDEO_FORMAT_RGBA, */
2555   {GST_VIDEO_FORMAT_RGBA, AV_PIX_FMT_RGBA},
2556   /* GST_VIDEO_FORMAT_BGRA, */
2557   {GST_VIDEO_FORMAT_BGRA, AV_PIX_FMT_BGRA},
2558   /* GST_VIDEO_FORMAT_ARGB, */
2559   {GST_VIDEO_FORMAT_ARGB, AV_PIX_FMT_ARGB},
2560   /* GST_VIDEO_FORMAT_ABGR, */
2561   {GST_VIDEO_FORMAT_ABGR, AV_PIX_FMT_ABGR},
2562   /* GST_VIDEO_FORMAT_RGB, */
2563   {GST_VIDEO_FORMAT_RGB, AV_PIX_FMT_RGB24},
2564   /* GST_VIDEO_FORMAT_BGR, */
2565   {GST_VIDEO_FORMAT_BGR, AV_PIX_FMT_BGR24},
2566   /* GST_VIDEO_FORMAT_Y41B, */
2567   {GST_VIDEO_FORMAT_Y41B, AV_PIX_FMT_YUV411P},
2568   /* GST_VIDEO_FORMAT_Y42B, */
2569   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUV422P},
2570   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUVJ422P},
2571   /* GST_VIDEO_FORMAT_YVYU, */
2572   /* GST_VIDEO_FORMAT_Y444, */
2573   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUV444P},
2574   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUVJ444P},
2575   /* GST_VIDEO_FORMAT_v210, */
2576   /* GST_VIDEO_FORMAT_v216, */
2577   /* GST_VIDEO_FORMAT_NV12, */
2578   {GST_VIDEO_FORMAT_NV12, AV_PIX_FMT_NV12},
2579   /* GST_VIDEO_FORMAT_NV21, */
2580   {GST_VIDEO_FORMAT_NV21, AV_PIX_FMT_NV21},
2581   /* GST_VIDEO_FORMAT_GRAY8, */
2582   {GST_VIDEO_FORMAT_GRAY8, AV_PIX_FMT_GRAY8},
2583   /* GST_VIDEO_FORMAT_GRAY16_BE, */
2584   {GST_VIDEO_FORMAT_GRAY16_BE, AV_PIX_FMT_GRAY16BE},
2585   /* GST_VIDEO_FORMAT_GRAY16_LE, */
2586   {GST_VIDEO_FORMAT_GRAY16_LE, AV_PIX_FMT_GRAY16LE},
2587   /* GST_VIDEO_FORMAT_v308, */
2588   /* GST_VIDEO_FORMAT_Y800, */
2589   /* GST_VIDEO_FORMAT_Y16, */
2590   /* GST_VIDEO_FORMAT_RGB16, */
2591   {GST_VIDEO_FORMAT_RGB16, AV_PIX_FMT_RGB565},
2592   /* GST_VIDEO_FORMAT_BGR16, */
2593   /* GST_VIDEO_FORMAT_RGB15, */
2594   {GST_VIDEO_FORMAT_RGB15, AV_PIX_FMT_RGB555},
2595   /* GST_VIDEO_FORMAT_BGR15, */
2596   /* GST_VIDEO_FORMAT_UYVP, */
2597   /* GST_VIDEO_FORMAT_A420, */
2598   {GST_VIDEO_FORMAT_A420, AV_PIX_FMT_YUVA420P},
2599   /* GST_VIDEO_FORMAT_RGB8_PALETTED, */
2600   {GST_VIDEO_FORMAT_RGB8P, AV_PIX_FMT_PAL8},
2601   /* GST_VIDEO_FORMAT_YUV9, */
2602   {GST_VIDEO_FORMAT_YUV9, AV_PIX_FMT_YUV410P},
2603   /* GST_VIDEO_FORMAT_YVU9, */
2604   /* GST_VIDEO_FORMAT_IYU1, */
2605   /* GST_VIDEO_FORMAT_ARGB64, */
2606   /* GST_VIDEO_FORMAT_AYUV64, */
2607   /* GST_VIDEO_FORMAT_r210, */
2608   {GST_VIDEO_FORMAT_I420_10LE, AV_PIX_FMT_YUV420P10LE},
2609   {GST_VIDEO_FORMAT_I420_10BE, AV_PIX_FMT_YUV420P10BE},
2610   {GST_VIDEO_FORMAT_I422_10LE, AV_PIX_FMT_YUV422P10LE},
2611   {GST_VIDEO_FORMAT_I422_10BE, AV_PIX_FMT_YUV422P10BE},
2612   {GST_VIDEO_FORMAT_Y444_10LE, AV_PIX_FMT_YUV444P10LE},
2613   {GST_VIDEO_FORMAT_Y444_10BE, AV_PIX_FMT_YUV444P10BE},
2614   {GST_VIDEO_FORMAT_GBR, AV_PIX_FMT_GBRP},
2615   {GST_VIDEO_FORMAT_GBR_10LE, AV_PIX_FMT_GBRP10LE},
2616   {GST_VIDEO_FORMAT_GBR_10BE, AV_PIX_FMT_GBRP10BE},
2617   {GST_VIDEO_FORMAT_A420_10LE, AV_PIX_FMT_YUVA420P10LE},
2618   {GST_VIDEO_FORMAT_A420_10BE, AV_PIX_FMT_YUVA420P10BE},
2619   {GST_VIDEO_FORMAT_A422_10LE, AV_PIX_FMT_YUVA422P10LE},
2620   {GST_VIDEO_FORMAT_A422_10BE, AV_PIX_FMT_YUVA422P10BE},
2621   {GST_VIDEO_FORMAT_A444_10LE, AV_PIX_FMT_YUVA444P10LE},
2622   {GST_VIDEO_FORMAT_A444_10BE, AV_PIX_FMT_YUVA444P10BE},
2623 };
2624
2625 GstVideoFormat
2626 gst_ffmpeg_pixfmt_to_videoformat (enum AVPixelFormat pixfmt)
2627 {
2628   guint i;
2629
2630   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++)
2631     if (pixtofmttable[i].pixfmt == pixfmt)
2632       return pixtofmttable[i].format;
2633
2634   GST_DEBUG ("Unknown pixel format %d", pixfmt);
2635   return GST_VIDEO_FORMAT_UNKNOWN;
2636 }
2637
2638 static enum AVPixelFormat
2639 gst_ffmpeg_videoformat_to_pixfmt_for_codec (GstVideoFormat format,
2640     const AVCodec * codec)
2641 {
2642   guint i;
2643
2644   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++) {
2645     if (pixtofmttable[i].format == format) {
2646       gint j;
2647
2648       if (codec && codec->pix_fmts) {
2649         for (j = 0; codec->pix_fmts[j] != -1; j++) {
2650           if (pixtofmttable[i].pixfmt == codec->pix_fmts[j])
2651             return pixtofmttable[i].pixfmt;
2652         }
2653       } else {
2654         return pixtofmttable[i].pixfmt;
2655       }
2656     }
2657   }
2658
2659   return AV_PIX_FMT_NONE;
2660 }
2661
2662 enum AVPixelFormat
2663 gst_ffmpeg_videoformat_to_pixfmt (GstVideoFormat format)
2664 {
2665   return gst_ffmpeg_videoformat_to_pixfmt_for_codec (format, NULL);
2666 }
2667
2668 void
2669 gst_ffmpeg_videoinfo_to_context (GstVideoInfo * info, AVCodecContext * context)
2670 {
2671   gint i, bpp = 0;
2672
2673   context->width = GST_VIDEO_INFO_WIDTH (info);
2674   context->height = GST_VIDEO_INFO_HEIGHT (info);
2675   for (i = 0; i < GST_VIDEO_INFO_N_COMPONENTS (info); i++)
2676     bpp += GST_VIDEO_INFO_COMP_DEPTH (info, i);
2677   context->bits_per_coded_sample = bpp;
2678
2679   context->ticks_per_frame = 1;
2680   if (GST_VIDEO_INFO_FPS_N (info) == 0) {
2681     GST_DEBUG ("Using 25/1 framerate");
2682     context->time_base.den = 25;
2683     context->time_base.num = 1;
2684   } else {
2685     context->time_base.den = GST_VIDEO_INFO_FPS_N (info);
2686     context->time_base.num = GST_VIDEO_INFO_FPS_D (info);
2687   }
2688
2689   context->sample_aspect_ratio.num = GST_VIDEO_INFO_PAR_N (info);
2690   context->sample_aspect_ratio.den = GST_VIDEO_INFO_PAR_D (info);
2691
2692   context->pix_fmt =
2693       gst_ffmpeg_videoformat_to_pixfmt_for_codec (GST_VIDEO_INFO_FORMAT (info),
2694       context->codec);
2695 }
2696
2697 void
2698 gst_ffmpeg_audioinfo_to_context (GstAudioInfo * info, AVCodecContext * context)
2699 {
2700   const AVCodec *codec;
2701   const enum AVSampleFormat *smpl_fmts;
2702   enum AVSampleFormat smpl_fmt = -1;
2703
2704   context->channels = info->channels;
2705   context->sample_rate = info->rate;
2706   context->channel_layout =
2707       gst_ffmpeg_channel_positions_to_layout (info->position, info->channels);
2708
2709   codec = context->codec;
2710
2711   smpl_fmts = codec->sample_fmts;
2712
2713   switch (info->finfo->format) {
2714     case GST_AUDIO_FORMAT_F32:
2715       if (smpl_fmts) {
2716         while (*smpl_fmts != -1) {
2717           if (*smpl_fmts == AV_SAMPLE_FMT_FLT) {
2718             smpl_fmt = *smpl_fmts;
2719             break;
2720           } else if (*smpl_fmts == AV_SAMPLE_FMT_FLTP) {
2721             smpl_fmt = *smpl_fmts;
2722           }
2723
2724           smpl_fmts++;
2725         }
2726       } else {
2727         smpl_fmt = AV_SAMPLE_FMT_FLT;
2728       }
2729       break;
2730     case GST_AUDIO_FORMAT_F64:
2731       if (smpl_fmts) {
2732         while (*smpl_fmts != -1) {
2733           if (*smpl_fmts == AV_SAMPLE_FMT_DBL) {
2734             smpl_fmt = *smpl_fmts;
2735             break;
2736           } else if (*smpl_fmts == AV_SAMPLE_FMT_DBLP) {
2737             smpl_fmt = *smpl_fmts;
2738           }
2739
2740           smpl_fmts++;
2741         }
2742       } else {
2743         smpl_fmt = AV_SAMPLE_FMT_DBL;
2744       }
2745       break;
2746     case GST_AUDIO_FORMAT_S32:
2747       if (smpl_fmts) {
2748         while (*smpl_fmts != -1) {
2749           if (*smpl_fmts == AV_SAMPLE_FMT_S32) {
2750             smpl_fmt = *smpl_fmts;
2751             break;
2752           } else if (*smpl_fmts == AV_SAMPLE_FMT_S32P) {
2753             smpl_fmt = *smpl_fmts;
2754           }
2755
2756           smpl_fmts++;
2757         }
2758       } else {
2759         smpl_fmt = AV_SAMPLE_FMT_S32;
2760       }
2761       break;
2762     case GST_AUDIO_FORMAT_S16:
2763       if (smpl_fmts) {
2764         while (*smpl_fmts != -1) {
2765           if (*smpl_fmts == AV_SAMPLE_FMT_S16) {
2766             smpl_fmt = *smpl_fmts;
2767             break;
2768           } else if (*smpl_fmts == AV_SAMPLE_FMT_S16P) {
2769             smpl_fmt = *smpl_fmts;
2770           }
2771
2772           smpl_fmts++;
2773         }
2774       } else {
2775         smpl_fmt = AV_SAMPLE_FMT_S16;
2776       }
2777       break;
2778     case GST_AUDIO_FORMAT_U8:
2779       if (smpl_fmts) {
2780         while (*smpl_fmts != -1) {
2781           if (*smpl_fmts == AV_SAMPLE_FMT_U8) {
2782             smpl_fmt = *smpl_fmts;
2783             break;
2784           } else if (*smpl_fmts == AV_SAMPLE_FMT_U8P) {
2785             smpl_fmt = *smpl_fmts;
2786           }
2787
2788           smpl_fmts++;
2789         }
2790       } else {
2791         smpl_fmt = AV_SAMPLE_FMT_U8;
2792       }
2793       break;
2794     default:
2795       break;
2796   }
2797
2798   g_assert (smpl_fmt != -1);
2799
2800   context->sample_fmt = smpl_fmt;
2801 }
2802
2803 /* Convert a GstCaps and a FFMPEG codec Type to a
2804  * AVCodecContext. If the context is ommitted, no fixed values
2805  * for video/audio size will be included in the context
2806  *
2807  * AVMediaType is primarily meant for uncompressed data GstCaps!
2808  */
2809
2810 void
2811 gst_ffmpeg_caps_with_codectype (enum AVMediaType type,
2812     const GstCaps * caps, AVCodecContext * context)
2813 {
2814   if (context == NULL)
2815     return;
2816
2817   switch (type) {
2818     case AVMEDIA_TYPE_VIDEO:
2819       gst_ffmpeg_caps_to_pixfmt (caps, context, TRUE);
2820       break;
2821
2822     case AVMEDIA_TYPE_AUDIO:
2823       gst_ffmpeg_caps_to_smpfmt (caps, context, TRUE);
2824       break;
2825
2826     default:
2827       /* unknown */
2828       break;
2829   }
2830 }
2831
2832 #if 0
2833 static void
2834 nal_escape (guint8 * dst, guint8 * src, guint size, guint * destsize)
2835 {
2836   guint8 *dstp = dst;
2837   guint8 *srcp = src;
2838   guint8 *end = src + size;
2839   gint count = 0;
2840
2841   while (srcp < end) {
2842     if (count == 2 && *srcp <= 0x03) {
2843       GST_DEBUG ("added escape code");
2844       *dstp++ = 0x03;
2845       count = 0;
2846     }
2847     if (*srcp == 0)
2848       count++;
2849     else
2850       count = 0;
2851
2852     GST_DEBUG ("copy %02x, count %d", *srcp, count);
2853     *dstp++ = *srcp++;
2854   }
2855   *destsize = dstp - dst;
2856 }
2857
2858 /* copy the config, escaping NAL units as we iterate them, if something fails we
2859  * copy everything and hope for the best. */
2860 static void
2861 copy_config (guint8 * dst, guint8 * src, guint size, guint * destsize)
2862 {
2863   guint8 *dstp = dst;
2864   guint8 *srcp = src;
2865   gint cnt, i;
2866   guint nalsize, esize;
2867
2868   /* check size */
2869   if (size < 7)
2870     goto full_copy;
2871
2872   /* check version */
2873   if (*srcp != 1)
2874     goto full_copy;
2875
2876   cnt = *(srcp + 5) & 0x1f;     /* Number of sps */
2877
2878   GST_DEBUG ("num SPS %d", cnt);
2879
2880   memcpy (dstp, srcp, 6);
2881   srcp += 6;
2882   dstp += 6;
2883
2884   for (i = 0; i < cnt; i++) {
2885     GST_DEBUG ("copy SPS %d", i);
2886     nalsize = (srcp[0] << 8) | srcp[1];
2887     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
2888     dstp[0] = esize >> 8;
2889     dstp[1] = esize & 0xff;
2890     dstp += esize + 2;
2891     srcp += nalsize + 2;
2892   }
2893
2894   cnt = *(dstp++) = *(srcp++);  /* Number of pps */
2895
2896   GST_DEBUG ("num PPS %d", cnt);
2897
2898   for (i = 0; i < cnt; i++) {
2899     GST_DEBUG ("copy PPS %d", i);
2900     nalsize = (srcp[0] << 8) | srcp[1];
2901     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
2902     dstp[0] = esize >> 8;
2903     dstp[1] = esize & 0xff;
2904     dstp += esize + 2;
2905     srcp += nalsize + 2;
2906   }
2907   *destsize = dstp - dst;
2908
2909   return;
2910
2911 full_copy:
2912   {
2913     GST_DEBUG ("something unexpected, doing full copy");
2914     memcpy (dst, src, size);
2915     *destsize = size;
2916     return;
2917   }
2918 }
2919 #endif
2920
2921 /*
2922  * caps_with_codecid () transforms a GstCaps for a known codec
2923  * ID into a filled-in context.
2924  * codec_data from caps will override possible extradata already in the context
2925  */
2926
2927 void
2928 gst_ffmpeg_caps_with_codecid (enum AVCodecID codec_id,
2929     enum AVMediaType codec_type, const GstCaps * caps, AVCodecContext * context)
2930 {
2931   GstStructure *str;
2932   const GValue *value;
2933   GstBuffer *buf;
2934
2935   GST_LOG ("codec_id:%d, codec_type:%d, caps:%" GST_PTR_FORMAT " context:%p",
2936       codec_id, codec_type, caps, context);
2937
2938   if (!context || !gst_caps_get_size (caps))
2939     return;
2940
2941   str = gst_caps_get_structure (caps, 0);
2942
2943   /* extradata parsing (esds [mpeg4], wma/wmv, msmpeg4v1/2/3, etc.) */
2944   if ((value = gst_structure_get_value (str, "codec_data"))) {
2945     GstMapInfo map;
2946
2947     buf = gst_value_get_buffer (value);
2948     gst_buffer_map (buf, &map, GST_MAP_READ);
2949
2950     /* free the old one if it is there */
2951     if (context->extradata)
2952       av_free (context->extradata);
2953
2954 #if 0
2955     if (codec_id == AV_CODEC_ID_H264) {
2956       guint extrasize;
2957
2958       GST_DEBUG ("copy, escaping codec_data %d", size);
2959       /* ffmpeg h264 expects the codec_data to be escaped, there is no real
2960        * reason for this but let's just escape it for now. Start by allocating
2961        * enough space, x2 is more than enough.
2962        *
2963        * FIXME, we disabled escaping because some file already contain escaped
2964        * codec_data and then we escape twice and fail. It's better to leave it
2965        * as is, as that is what most players do. */
2966       context->extradata =
2967           av_mallocz (GST_ROUND_UP_16 (size * 2 +
2968               FF_INPUT_BUFFER_PADDING_SIZE));
2969       copy_config (context->extradata, data, size, &extrasize);
2970       GST_DEBUG ("escaped size: %d", extrasize);
2971       context->extradata_size = extrasize;
2972     } else
2973 #endif
2974     {
2975       /* allocate with enough padding */
2976       GST_DEBUG ("copy codec_data");
2977       context->extradata =
2978           av_mallocz (GST_ROUND_UP_16 (map.size +
2979               FF_INPUT_BUFFER_PADDING_SIZE));
2980       memcpy (context->extradata, map.data, map.size);
2981       context->extradata_size = map.size;
2982     }
2983
2984     /* Hack for VC1. Sometimes the first (length) byte is 0 for some files */
2985     if (codec_id == AV_CODEC_ID_VC1 && map.size > 0 && map.data[0] == 0) {
2986       context->extradata[0] = (guint8) map.size;
2987     }
2988
2989     GST_DEBUG ("have codec data of size %" G_GSIZE_FORMAT, map.size);
2990
2991     gst_buffer_unmap (buf, &map);
2992   } else {
2993     context->extradata = NULL;
2994     context->extradata_size = 0;
2995     GST_DEBUG ("no codec data");
2996   }
2997
2998   switch (codec_id) {
2999     case AV_CODEC_ID_MPEG4:
3000     {
3001       const gchar *mime = gst_structure_get_name (str);
3002
3003       context->flags |= CODEC_FLAG_4MV;
3004
3005       if (!strcmp (mime, "video/x-divx"))
3006         context->codec_tag = GST_MAKE_FOURCC ('D', 'I', 'V', 'X');
3007       else if (!strcmp (mime, "video/mpeg")) {
3008         const gchar *profile;
3009
3010         context->codec_tag = GST_MAKE_FOURCC ('m', 'p', '4', 'v');
3011
3012         profile = gst_structure_get_string (str, "profile");
3013         if (profile) {
3014           if (g_strcmp0 (profile, "advanced-simple") == 0)
3015             context->flags |= CODEC_FLAG_GMC | CODEC_FLAG_QPEL;
3016         }
3017       }
3018       break;
3019     }
3020
3021     case AV_CODEC_ID_SVQ3:
3022       /* FIXME: this is a workaround for older gst-plugins releases
3023        * (<= 0.8.9). This should be removed at some point, because
3024        * it causes wrong decoded frame order. */
3025       if (!context->extradata) {
3026         gint halfpel_flag, thirdpel_flag, low_delay, unknown_svq3_flag;
3027         guint16 flags;
3028
3029         if (gst_structure_get_int (str, "halfpel_flag", &halfpel_flag) &&
3030             gst_structure_get_int (str, "thirdpel_flag", &thirdpel_flag) &&
3031             gst_structure_get_int (str, "low_delay", &low_delay) &&
3032             gst_structure_get_int (str, "unknown_svq3_flag",
3033                 &unknown_svq3_flag)) {
3034           context->extradata = (guint8 *) av_mallocz (0x64);
3035           g_stpcpy ((gchar *) context->extradata, "SVQ3");
3036           flags = 1 << 3;
3037           flags |= low_delay;
3038           flags = flags << 2;
3039           flags |= unknown_svq3_flag;
3040           flags = flags << 6;
3041           flags |= halfpel_flag;
3042           flags = flags << 1;
3043           flags |= thirdpel_flag;
3044           flags = flags << 3;
3045
3046           flags = GUINT16_FROM_LE (flags);
3047
3048           memcpy ((gchar *) context->extradata + 0x62, &flags, 2);
3049           context->extradata_size = 0x64;
3050         }
3051       }
3052       break;
3053
3054     case AV_CODEC_ID_MSRLE:
3055     case AV_CODEC_ID_QTRLE:
3056     case AV_CODEC_ID_TSCC:
3057     case AV_CODEC_ID_CSCD:
3058     case AV_CODEC_ID_APE:
3059     {
3060       gint depth;
3061
3062       if (gst_structure_get_int (str, "depth", &depth)) {
3063         context->bits_per_coded_sample = depth;
3064       } else {
3065         GST_WARNING ("No depth field in caps %" GST_PTR_FORMAT, caps);
3066       }
3067
3068     }
3069       break;
3070
3071     case AV_CODEC_ID_COOK:
3072     case AV_CODEC_ID_RA_288:
3073     case AV_CODEC_ID_RA_144:
3074     case AV_CODEC_ID_SIPR:
3075     {
3076       gint leaf_size;
3077       gint bitrate;
3078
3079       if (gst_structure_get_int (str, "leaf_size", &leaf_size))
3080         context->block_align = leaf_size;
3081       if (gst_structure_get_int (str, "bitrate", &bitrate))
3082         context->bit_rate = bitrate;
3083     }
3084       break;
3085     case AV_CODEC_ID_ALAC:
3086       gst_structure_get_int (str, "samplesize",
3087           &context->bits_per_coded_sample);
3088       break;
3089
3090     case AV_CODEC_ID_DVVIDEO:
3091     {
3092       const gchar *format;
3093
3094       if ((format = gst_structure_get_string (str, "format"))) {
3095
3096         if (g_str_equal (format, "YUY2"))
3097           context->pix_fmt = AV_PIX_FMT_YUYV422;
3098         else if (g_str_equal (format, "I420"))
3099           context->pix_fmt = AV_PIX_FMT_YUV420P;
3100         else if (g_str_equal (format, "A420"))
3101           context->pix_fmt = AV_PIX_FMT_YUVA420P;
3102         else if (g_str_equal (format, "Y41B"))
3103           context->pix_fmt = AV_PIX_FMT_YUV411P;
3104         else if (g_str_equal (format, "Y42B"))
3105           context->pix_fmt = AV_PIX_FMT_YUV422P;
3106         else if (g_str_equal (format, "YUV9"))
3107           context->pix_fmt = AV_PIX_FMT_YUV410P;
3108         else {
3109           GST_WARNING ("couldn't convert format %s" " to a pixel format",
3110               format);
3111         }
3112       } else
3113         GST_WARNING ("No specified format");
3114       break;
3115     }
3116     case AV_CODEC_ID_H263P:
3117     {
3118       gboolean val;
3119
3120       if (!gst_structure_get_boolean (str, "annex-f", &val) || val)
3121         context->flags |= CODEC_FLAG_4MV;
3122       else
3123         context->flags &= ~CODEC_FLAG_4MV;
3124       if ((!gst_structure_get_boolean (str, "annex-i", &val) || val) &&
3125           (!gst_structure_get_boolean (str, "annex-t", &val) || val))
3126         context->flags |= CODEC_FLAG_AC_PRED;
3127       else
3128         context->flags &= ~CODEC_FLAG_AC_PRED;
3129       if (!gst_structure_get_boolean (str, "annex-j", &val) || val)
3130         context->flags |= CODEC_FLAG_LOOP_FILTER;
3131       else
3132         context->flags &= ~CODEC_FLAG_LOOP_FILTER;
3133       break;
3134     }
3135     case AV_CODEC_ID_ADPCM_G726:
3136     {
3137       const gchar *layout;
3138
3139       if ((layout = gst_structure_get_string (str, "layout"))) {
3140         if (!strcmp (layout, "g721")) {
3141           context->sample_rate = 8000;
3142           context->channels = 1;
3143           context->bit_rate = 32000;
3144         }
3145       }
3146       break;
3147     }
3148     default:
3149       break;
3150   }
3151
3152   if (!gst_caps_is_fixed (caps))
3153     return;
3154
3155   /* common properties (width, height, fps) */
3156   switch (codec_type) {
3157     case AVMEDIA_TYPE_VIDEO:
3158       gst_ffmpeg_caps_to_pixfmt (caps, context,
3159           codec_id == AV_CODEC_ID_RAWVIDEO);
3160       break;
3161     case AVMEDIA_TYPE_AUDIO:
3162       gst_ffmpeg_caps_to_smpfmt (caps, context, FALSE);
3163       break;
3164     default:
3165       break;
3166   }
3167
3168   /* fixup of default settings */
3169   switch (codec_id) {
3170     case AV_CODEC_ID_QCELP:
3171       /* QCELP is always mono, no matter what the caps say */
3172       context->channels = 1;
3173       break;
3174     case AV_CODEC_ID_ADPCM_G726:
3175       if (context->sample_rate && context->bit_rate)
3176         context->bits_per_coded_sample =
3177             context->bit_rate / context->sample_rate;
3178       break;
3179     default:
3180       break;
3181   }
3182 }
3183
3184 /* _formatid_to_caps () is meant for muxers/demuxers, it
3185  * transforms a name (ffmpeg way of ID'ing these, why don't
3186  * they have unique numerical IDs?) to the corresponding
3187  * caps belonging to that mux-format
3188  *
3189  * Note: we don't need any additional info because the caps
3190  * isn't supposed to contain any useful info besides the
3191  * media type anyway
3192  */
3193
3194 GstCaps *
3195 gst_ffmpeg_formatid_to_caps (const gchar * format_name)
3196 {
3197   GstCaps *caps = NULL;
3198
3199   if (!strcmp (format_name, "mpeg")) {
3200     caps = gst_caps_new_simple ("video/mpeg",
3201         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3202   } else if (!strcmp (format_name, "mpegts")) {
3203     caps = gst_caps_new_simple ("video/mpegts",
3204         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3205   } else if (!strcmp (format_name, "rm")) {
3206     caps = gst_caps_new_simple ("application/x-pn-realmedia",
3207         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3208   } else if (!strcmp (format_name, "asf")) {
3209     caps = gst_caps_new_empty_simple ("video/x-ms-asf");
3210   } else if (!strcmp (format_name, "avi")) {
3211     caps = gst_caps_new_empty_simple ("video/x-msvideo");
3212   } else if (!strcmp (format_name, "wav")) {
3213     caps = gst_caps_new_empty_simple ("audio/x-wav");
3214   } else if (!strcmp (format_name, "ape")) {
3215     caps = gst_caps_new_empty_simple ("application/x-ape");
3216   } else if (!strcmp (format_name, "swf")) {
3217     caps = gst_caps_new_empty_simple ("application/x-shockwave-flash");
3218   } else if (!strcmp (format_name, "au")) {
3219     caps = gst_caps_new_empty_simple ("audio/x-au");
3220   } else if (!strcmp (format_name, "dv")) {
3221     caps = gst_caps_new_simple ("video/x-dv",
3222         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3223   } else if (!strcmp (format_name, "4xm")) {
3224     caps = gst_caps_new_empty_simple ("video/x-4xm");
3225   } else if (!strcmp (format_name, "matroska")) {
3226     caps = gst_caps_new_empty_simple ("video/x-matroska");
3227   } else if (!strcmp (format_name, "mp3")) {
3228     caps = gst_caps_new_empty_simple ("application/x-id3");
3229   } else if (!strcmp (format_name, "flic")) {
3230     caps = gst_caps_new_empty_simple ("video/x-fli");
3231   } else if (!strcmp (format_name, "flv")) {
3232     caps = gst_caps_new_empty_simple ("video/x-flv");
3233   } else if (!strcmp (format_name, "tta")) {
3234     caps = gst_caps_new_empty_simple ("audio/x-ttafile");
3235   } else if (!strcmp (format_name, "aiff")) {
3236     caps = gst_caps_new_empty_simple ("audio/x-aiff");
3237   } else if (!strcmp (format_name, "mov_mp4_m4a_3gp_3g2")) {
3238     caps =
3239         gst_caps_from_string
3240         ("application/x-3gp; video/quicktime; audio/x-m4a");
3241   } else if (!strcmp (format_name, "mov")) {
3242     caps = gst_caps_from_string ("video/quicktime,variant=(string)apple");
3243   } else if (!strcmp (format_name, "mp4")) {
3244     caps = gst_caps_from_string ("video/quicktime,variant=(string)iso");
3245   } else if (!strcmp (format_name, "3gp")) {
3246     caps = gst_caps_from_string ("video/quicktime,variant=(string)3gpp");
3247   } else if (!strcmp (format_name, "3g2")) {
3248     caps = gst_caps_from_string ("video/quicktime,variant=(string)3g2");
3249   } else if (!strcmp (format_name, "psp")) {
3250     caps = gst_caps_from_string ("video/quicktime,variant=(string)psp");
3251   } else if (!strcmp (format_name, "ipod")) {
3252     caps = gst_caps_from_string ("video/quicktime,variant=(string)ipod");
3253   } else if (!strcmp (format_name, "aac")) {
3254     caps = gst_caps_new_simple ("audio/mpeg",
3255         "mpegversion", G_TYPE_INT, 4, NULL);
3256   } else if (!strcmp (format_name, "gif")) {
3257     caps = gst_caps_from_string ("image/gif");
3258   } else if (!strcmp (format_name, "ogg")) {
3259     caps = gst_caps_from_string ("application/ogg");
3260   } else if (!strcmp (format_name, "mxf") || !strcmp (format_name, "mxf_d10")) {
3261     caps = gst_caps_from_string ("application/mxf");
3262   } else if (!strcmp (format_name, "gxf")) {
3263     caps = gst_caps_from_string ("application/gxf");
3264   } else if (!strcmp (format_name, "yuv4mpegpipe")) {
3265     caps = gst_caps_new_simple ("application/x-yuv4mpeg",
3266         "y4mversion", G_TYPE_INT, 2, NULL);
3267   } else if (!strcmp (format_name, "mpc")) {
3268     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 7");
3269   } else if (!strcmp (format_name, "mpc8")) {
3270     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 8");
3271   } else if (!strcmp (format_name, "vqf")) {
3272     caps = gst_caps_from_string ("audio/x-vqf");
3273   } else if (!strcmp (format_name, "nsv")) {
3274     caps = gst_caps_from_string ("video/x-nsv");
3275   } else if (!strcmp (format_name, "amr")) {
3276     caps = gst_caps_from_string ("audio/x-amr-nb-sh");
3277   } else if (!strcmp (format_name, "webm")) {
3278     caps = gst_caps_from_string ("video/webm");
3279   } else if (!strcmp (format_name, "voc")) {
3280     caps = gst_caps_from_string ("audio/x-voc");
3281   } else if (!strcmp (format_name, "pva")) {
3282     caps = gst_caps_from_string ("video/x-pva");
3283   } else {
3284     gchar *name;
3285
3286     GST_LOG ("Could not create stream format caps for %s", format_name);
3287     name = g_strdup_printf ("application/x-gst-av-%s", format_name);
3288     caps = gst_caps_new_empty_simple (name);
3289     g_free (name);
3290   }
3291
3292   return caps;
3293 }
3294
3295 gboolean
3296 gst_ffmpeg_formatid_get_codecids (const gchar * format_name,
3297     enum AVCodecID ** video_codec_list, enum AVCodecID ** audio_codec_list,
3298     AVOutputFormat * plugin)
3299 {
3300   static enum AVCodecID tmp_vlist[] = {
3301     AV_CODEC_ID_NONE,
3302     AV_CODEC_ID_NONE
3303   };
3304   static enum AVCodecID tmp_alist[] = {
3305     AV_CODEC_ID_NONE,
3306     AV_CODEC_ID_NONE
3307   };
3308
3309   GST_LOG ("format_name : %s", format_name);
3310
3311   if (!strcmp (format_name, "mp4")) {
3312     static enum AVCodecID mp4_video_list[] = {
3313       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H264,
3314       AV_CODEC_ID_MJPEG,
3315       AV_CODEC_ID_NONE
3316     };
3317     static enum AVCodecID mp4_audio_list[] = {
3318       AV_CODEC_ID_AAC, AV_CODEC_ID_MP3,
3319       AV_CODEC_ID_NONE
3320     };
3321
3322     *video_codec_list = mp4_video_list;
3323     *audio_codec_list = mp4_audio_list;
3324   } else if (!strcmp (format_name, "mpeg")) {
3325     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3326       AV_CODEC_ID_MPEG2VIDEO,
3327       AV_CODEC_ID_H264,
3328       AV_CODEC_ID_NONE
3329     };
3330     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP1,
3331       AV_CODEC_ID_MP2,
3332       AV_CODEC_ID_MP3,
3333       AV_CODEC_ID_NONE
3334     };
3335
3336     *video_codec_list = mpeg_video_list;
3337     *audio_codec_list = mpeg_audio_list;
3338   } else if (!strcmp (format_name, "dvd")) {
3339     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG2VIDEO,
3340       AV_CODEC_ID_NONE
3341     };
3342     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP2,
3343       AV_CODEC_ID_AC3,
3344       AV_CODEC_ID_DTS,
3345       AV_CODEC_ID_PCM_S16BE,
3346       AV_CODEC_ID_NONE
3347     };
3348
3349     *video_codec_list = mpeg_video_list;
3350     *audio_codec_list = mpeg_audio_list;
3351   } else if (!strcmp (format_name, "mpegts")) {
3352     static enum AVCodecID mpegts_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3353       AV_CODEC_ID_MPEG2VIDEO,
3354       AV_CODEC_ID_H264,
3355       AV_CODEC_ID_NONE
3356     };
3357     static enum AVCodecID mpegts_audio_list[] = { AV_CODEC_ID_MP2,
3358       AV_CODEC_ID_MP3,
3359       AV_CODEC_ID_AC3,
3360       AV_CODEC_ID_DTS,
3361       AV_CODEC_ID_AAC,
3362       AV_CODEC_ID_NONE
3363     };
3364
3365     *video_codec_list = mpegts_video_list;
3366     *audio_codec_list = mpegts_audio_list;
3367   } else if (!strcmp (format_name, "vob")) {
3368     static enum AVCodecID vob_video_list[] =
3369         { AV_CODEC_ID_MPEG2VIDEO, AV_CODEC_ID_NONE };
3370     static enum AVCodecID vob_audio_list[] = { AV_CODEC_ID_MP2, AV_CODEC_ID_AC3,
3371       AV_CODEC_ID_DTS, AV_CODEC_ID_NONE
3372     };
3373
3374     *video_codec_list = vob_video_list;
3375     *audio_codec_list = vob_audio_list;
3376   } else if (!strcmp (format_name, "flv")) {
3377     static enum AVCodecID flv_video_list[] =
3378         { AV_CODEC_ID_FLV1, AV_CODEC_ID_NONE };
3379     static enum AVCodecID flv_audio_list[] =
3380         { AV_CODEC_ID_MP3, AV_CODEC_ID_NONE };
3381
3382     *video_codec_list = flv_video_list;
3383     *audio_codec_list = flv_audio_list;
3384   } else if (!strcmp (format_name, "asf")) {
3385     static enum AVCodecID asf_video_list[] =
3386         { AV_CODEC_ID_WMV1, AV_CODEC_ID_WMV2, AV_CODEC_ID_MSMPEG4V3,
3387       AV_CODEC_ID_NONE
3388     };
3389     static enum AVCodecID asf_audio_list[] =
3390         { AV_CODEC_ID_WMAV1, AV_CODEC_ID_WMAV2, AV_CODEC_ID_MP3,
3391       AV_CODEC_ID_NONE
3392     };
3393
3394     *video_codec_list = asf_video_list;
3395     *audio_codec_list = asf_audio_list;
3396   } else if (!strcmp (format_name, "dv")) {
3397     static enum AVCodecID dv_video_list[] =
3398         { AV_CODEC_ID_DVVIDEO, AV_CODEC_ID_NONE };
3399     static enum AVCodecID dv_audio_list[] =
3400         { AV_CODEC_ID_PCM_S16LE, AV_CODEC_ID_NONE };
3401
3402     *video_codec_list = dv_video_list;
3403     *audio_codec_list = dv_audio_list;
3404   } else if (!strcmp (format_name, "mov")) {
3405     static enum AVCodecID mov_video_list[] = {
3406       AV_CODEC_ID_SVQ1, AV_CODEC_ID_SVQ3, AV_CODEC_ID_MPEG4,
3407       AV_CODEC_ID_H263, AV_CODEC_ID_H263P,
3408       AV_CODEC_ID_H264, AV_CODEC_ID_DVVIDEO,
3409       AV_CODEC_ID_MJPEG,
3410       AV_CODEC_ID_NONE
3411     };
3412     static enum AVCodecID mov_audio_list[] = {
3413       AV_CODEC_ID_PCM_MULAW, AV_CODEC_ID_PCM_ALAW, AV_CODEC_ID_ADPCM_IMA_QT,
3414       AV_CODEC_ID_MACE3, AV_CODEC_ID_MACE6, AV_CODEC_ID_AAC,
3415       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3416       AV_CODEC_ID_PCM_S16BE, AV_CODEC_ID_PCM_S16LE,
3417       AV_CODEC_ID_MP3, AV_CODEC_ID_NONE
3418     };
3419
3420     *video_codec_list = mov_video_list;
3421     *audio_codec_list = mov_audio_list;
3422   } else if ((!strcmp (format_name, "3gp") || !strcmp (format_name, "3g2"))) {
3423     static enum AVCodecID tgp_video_list[] = {
3424       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H263, AV_CODEC_ID_H263P, AV_CODEC_ID_H264,
3425       AV_CODEC_ID_NONE
3426     };
3427     static enum AVCodecID tgp_audio_list[] = {
3428       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3429       AV_CODEC_ID_AAC,
3430       AV_CODEC_ID_NONE
3431     };
3432
3433     *video_codec_list = tgp_video_list;
3434     *audio_codec_list = tgp_audio_list;
3435   } else if (!strcmp (format_name, "mmf")) {
3436     static enum AVCodecID mmf_audio_list[] = {
3437       AV_CODEC_ID_ADPCM_YAMAHA, AV_CODEC_ID_NONE
3438     };
3439     *video_codec_list = NULL;
3440     *audio_codec_list = mmf_audio_list;
3441   } else if (!strcmp (format_name, "amr")) {
3442     static enum AVCodecID amr_audio_list[] = {
3443       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3444       AV_CODEC_ID_NONE
3445     };
3446     *video_codec_list = NULL;
3447     *audio_codec_list = amr_audio_list;
3448   } else if (!strcmp (format_name, "gif")) {
3449     static enum AVCodecID gif_image_list[] = {
3450       AV_CODEC_ID_RAWVIDEO, AV_CODEC_ID_NONE
3451     };
3452     *video_codec_list = gif_image_list;
3453     *audio_codec_list = NULL;
3454   } else if ((plugin->audio_codec != AV_CODEC_ID_NONE) ||
3455       (plugin->video_codec != AV_CODEC_ID_NONE)) {
3456     tmp_vlist[0] = plugin->video_codec;
3457     tmp_alist[0] = plugin->audio_codec;
3458
3459     *video_codec_list = tmp_vlist;
3460     *audio_codec_list = tmp_alist;
3461   } else if ((!strcmp (format_name, "pva"))) {
3462     static enum AVCodecID tgp_video_list[] = {
3463       AV_CODEC_ID_MPEG2VIDEO,
3464       AV_CODEC_ID_NONE
3465     };
3466     static enum AVCodecID tgp_audio_list[] = {
3467       AV_CODEC_ID_MP2,
3468       AV_CODEC_ID_NONE
3469     };
3470
3471     *video_codec_list = tgp_video_list;
3472     *audio_codec_list = tgp_audio_list;
3473   } else {
3474     GST_LOG ("Format %s not found", format_name);
3475     return FALSE;
3476   }
3477
3478   return TRUE;
3479 }
3480
3481 /* Convert a GstCaps to a FFMPEG codec ID. Size et all
3482  * are omitted, that can be queried by the user itself,
3483  * we're not eating the GstCaps or anything
3484  * A pointer to an allocated context is also needed for
3485  * optional extra info
3486  */
3487
3488 enum AVCodecID
3489 gst_ffmpeg_caps_to_codecid (const GstCaps * caps, AVCodecContext * context)
3490 {
3491   enum AVCodecID id = AV_CODEC_ID_NONE;
3492   const gchar *mimetype;
3493   const GstStructure *structure;
3494   gboolean video = FALSE, audio = FALSE;        /* we want to be sure! */
3495
3496   g_return_val_if_fail (caps != NULL, AV_CODEC_ID_NONE);
3497   g_return_val_if_fail (gst_caps_get_size (caps) == 1, AV_CODEC_ID_NONE);
3498   structure = gst_caps_get_structure (caps, 0);
3499
3500   mimetype = gst_structure_get_name (structure);
3501
3502   if (!strcmp (mimetype, "video/x-raw")) {
3503     id = AV_CODEC_ID_RAWVIDEO;
3504     video = TRUE;
3505   } else if (!strcmp (mimetype, "audio/x-raw")) {
3506     GstAudioInfo info;
3507
3508     if (gst_audio_info_from_caps (&info, caps)) {
3509       switch (GST_AUDIO_INFO_FORMAT (&info)) {
3510         case GST_AUDIO_FORMAT_S8:
3511           id = AV_CODEC_ID_PCM_S8;
3512           break;
3513         case GST_AUDIO_FORMAT_U8:
3514           id = AV_CODEC_ID_PCM_U8;
3515           break;
3516         case GST_AUDIO_FORMAT_S16LE:
3517           id = AV_CODEC_ID_PCM_S16LE;
3518           break;
3519         case GST_AUDIO_FORMAT_S16BE:
3520           id = AV_CODEC_ID_PCM_S16BE;
3521           break;
3522         case GST_AUDIO_FORMAT_U16LE:
3523           id = AV_CODEC_ID_PCM_U16LE;
3524           break;
3525         case GST_AUDIO_FORMAT_U16BE:
3526           id = AV_CODEC_ID_PCM_U16BE;
3527           break;
3528         default:
3529           break;
3530       }
3531       if (id != AV_CODEC_ID_NONE)
3532         audio = TRUE;
3533     }
3534   } else if (!strcmp (mimetype, "audio/x-mulaw")) {
3535     id = AV_CODEC_ID_PCM_MULAW;
3536     audio = TRUE;
3537   } else if (!strcmp (mimetype, "audio/x-alaw")) {
3538     id = AV_CODEC_ID_PCM_ALAW;
3539     audio = TRUE;
3540   } else if (!strcmp (mimetype, "video/x-dv")) {
3541     gboolean sys_strm;
3542
3543     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3544         !sys_strm) {
3545       id = AV_CODEC_ID_DVVIDEO;
3546       video = TRUE;
3547     }
3548   } else if (!strcmp (mimetype, "audio/x-dv")) {        /* ??? */
3549     id = AV_CODEC_ID_DVAUDIO;
3550     audio = TRUE;
3551   } else if (!strcmp (mimetype, "video/x-h263")) {
3552     const gchar *h263version =
3553         gst_structure_get_string (structure, "h263version");
3554     if (h263version && !strcmp (h263version, "h263p"))
3555       id = AV_CODEC_ID_H263P;
3556     else
3557       id = AV_CODEC_ID_H263;
3558     video = TRUE;
3559   } else if (!strcmp (mimetype, "video/x-intel-h263")) {
3560     id = AV_CODEC_ID_H263I;
3561     video = TRUE;
3562   } else if (!strcmp (mimetype, "video/x-h261")) {
3563     id = AV_CODEC_ID_H261;
3564     video = TRUE;
3565   } else if (!strcmp (mimetype, "video/mpeg")) {
3566     gboolean sys_strm;
3567     gint mpegversion;
3568
3569     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3570         gst_structure_get_int (structure, "mpegversion", &mpegversion) &&
3571         !sys_strm) {
3572       switch (mpegversion) {
3573         case 1:
3574           id = AV_CODEC_ID_MPEG1VIDEO;
3575           break;
3576         case 2:
3577           id = AV_CODEC_ID_MPEG2VIDEO;
3578           break;
3579         case 4:
3580           id = AV_CODEC_ID_MPEG4;
3581           break;
3582       }
3583     }
3584     if (id != AV_CODEC_ID_NONE)
3585       video = TRUE;
3586   } else if (!strcmp (mimetype, "image/jpeg")) {
3587     id = AV_CODEC_ID_MJPEG;     /* A... B... */
3588     video = TRUE;
3589   } else if (!strcmp (mimetype, "video/x-jpeg-b")) {
3590     id = AV_CODEC_ID_MJPEGB;
3591     video = TRUE;
3592   } else if (!strcmp (mimetype, "video/x-wmv")) {
3593     gint wmvversion = 0;
3594
3595     if (gst_structure_get_int (structure, "wmvversion", &wmvversion)) {
3596       switch (wmvversion) {
3597         case 1:
3598           id = AV_CODEC_ID_WMV1;
3599           break;
3600         case 2:
3601           id = AV_CODEC_ID_WMV2;
3602           break;
3603         case 3:
3604         {
3605           const gchar *format;
3606
3607           /* WMV3 unless the fourcc exists and says otherwise */
3608           id = AV_CODEC_ID_WMV3;
3609
3610           if ((format = gst_structure_get_string (structure, "format")) &&
3611               (g_str_equal (format, "WVC1") || g_str_equal (format, "WMVA")))
3612             id = AV_CODEC_ID_VC1;
3613
3614           break;
3615         }
3616       }
3617     }
3618     if (id != AV_CODEC_ID_NONE)
3619       video = TRUE;
3620   } else if (!strcmp (mimetype, "audio/x-vorbis")) {
3621     id = AV_CODEC_ID_VORBIS;
3622     audio = TRUE;
3623   } else if (!strcmp (mimetype, "audio/x-qdm2")) {
3624     id = AV_CODEC_ID_QDM2;
3625     audio = TRUE;
3626   } else if (!strcmp (mimetype, "audio/mpeg")) {
3627     gint layer = 0;
3628     gint mpegversion = 0;
3629
3630     if (gst_structure_get_int (structure, "mpegversion", &mpegversion)) {
3631       switch (mpegversion) {
3632         case 2:                /* ffmpeg uses faad for both... */
3633         case 4:
3634           id = AV_CODEC_ID_AAC;
3635           break;
3636         case 1:
3637           if (gst_structure_get_int (structure, "layer", &layer)) {
3638             switch (layer) {
3639               case 1:
3640                 id = AV_CODEC_ID_MP1;
3641                 break;
3642               case 2:
3643                 id = AV_CODEC_ID_MP2;
3644                 break;
3645               case 3:
3646                 id = AV_CODEC_ID_MP3;
3647                 break;
3648             }
3649           }
3650       }
3651     }
3652     if (id != AV_CODEC_ID_NONE)
3653       audio = TRUE;
3654   } else if (!strcmp (mimetype, "audio/x-musepack")) {
3655     gint streamversion = -1;
3656
3657     if (gst_structure_get_int (structure, "streamversion", &streamversion)) {
3658       if (streamversion == 7)
3659         id = AV_CODEC_ID_MUSEPACK7;
3660     } else {
3661       id = AV_CODEC_ID_MUSEPACK7;
3662     }
3663   } else if (!strcmp (mimetype, "audio/x-wma")) {
3664     gint wmaversion = 0;
3665
3666     if (gst_structure_get_int (structure, "wmaversion", &wmaversion)) {
3667       switch (wmaversion) {
3668         case 1:
3669           id = AV_CODEC_ID_WMAV1;
3670           break;
3671         case 2:
3672           id = AV_CODEC_ID_WMAV2;
3673           break;
3674         case 3:
3675           id = AV_CODEC_ID_WMAPRO;
3676           break;
3677       }
3678     }
3679     if (id != AV_CODEC_ID_NONE)
3680       audio = TRUE;
3681   } else if (!strcmp (mimetype, "audio/x-wms")) {
3682     id = AV_CODEC_ID_WMAVOICE;
3683     audio = TRUE;
3684   } else if (!strcmp (mimetype, "audio/x-ac3")) {
3685     id = AV_CODEC_ID_AC3;
3686     audio = TRUE;
3687   } else if (!strcmp (mimetype, "audio/x-eac3")) {
3688     id = AV_CODEC_ID_EAC3;
3689     audio = TRUE;
3690   } else if (!strcmp (mimetype, "audio/x-vnd.sony.atrac3") ||
3691       !strcmp (mimetype, "audio/atrac3")) {
3692     id = AV_CODEC_ID_ATRAC3;
3693     audio = TRUE;
3694   } else if (!strcmp (mimetype, "audio/x-dts")) {
3695     id = AV_CODEC_ID_DTS;
3696     audio = TRUE;
3697   } else if (!strcmp (mimetype, "application/x-ape")) {
3698     id = AV_CODEC_ID_APE;
3699     audio = TRUE;
3700   } else if (!strcmp (mimetype, "video/x-msmpeg")) {
3701     gint msmpegversion = 0;
3702
3703     if (gst_structure_get_int (structure, "msmpegversion", &msmpegversion)) {
3704       switch (msmpegversion) {
3705         case 41:
3706           id = AV_CODEC_ID_MSMPEG4V1;
3707           break;
3708         case 42:
3709           id = AV_CODEC_ID_MSMPEG4V2;
3710           break;
3711         case 43:
3712           id = AV_CODEC_ID_MSMPEG4V3;
3713           break;
3714       }
3715     }
3716     if (id != AV_CODEC_ID_NONE)
3717       video = TRUE;
3718   } else if (!strcmp (mimetype, "video/x-svq")) {
3719     gint svqversion = 0;
3720
3721     if (gst_structure_get_int (structure, "svqversion", &svqversion)) {
3722       switch (svqversion) {
3723         case 1:
3724           id = AV_CODEC_ID_SVQ1;
3725           break;
3726         case 3:
3727           id = AV_CODEC_ID_SVQ3;
3728           break;
3729       }
3730     }
3731     if (id != AV_CODEC_ID_NONE)
3732       video = TRUE;
3733   } else if (!strcmp (mimetype, "video/x-huffyuv")) {
3734     id = AV_CODEC_ID_HUFFYUV;
3735     video = TRUE;
3736   } else if (!strcmp (mimetype, "audio/x-mace")) {
3737     gint maceversion = 0;
3738
3739     if (gst_structure_get_int (structure, "maceversion", &maceversion)) {
3740       switch (maceversion) {
3741         case 3:
3742           id = AV_CODEC_ID_MACE3;
3743           break;
3744         case 6:
3745           id = AV_CODEC_ID_MACE6;
3746           break;
3747       }
3748     }
3749     if (id != AV_CODEC_ID_NONE)
3750       audio = TRUE;
3751   } else if (!strcmp (mimetype, "video/x-theora")) {
3752     id = AV_CODEC_ID_THEORA;
3753     video = TRUE;
3754   } else if (!strcmp (mimetype, "video/x-vp3")) {
3755     id = AV_CODEC_ID_VP3;
3756     video = TRUE;
3757   } else if (!strcmp (mimetype, "video/x-vp5")) {
3758     id = AV_CODEC_ID_VP5;
3759     video = TRUE;
3760   } else if (!strcmp (mimetype, "video/x-vp6")) {
3761     id = AV_CODEC_ID_VP6;
3762     video = TRUE;
3763   } else if (!strcmp (mimetype, "video/x-vp6-flash")) {
3764     id = AV_CODEC_ID_VP6F;
3765     video = TRUE;
3766   } else if (!strcmp (mimetype, "video/x-vp6-alpha")) {
3767     id = AV_CODEC_ID_VP6A;
3768     video = TRUE;
3769   } else if (!strcmp (mimetype, "video/x-vp8")) {
3770     id = AV_CODEC_ID_VP8;
3771     video = TRUE;
3772   } else if (!strcmp (mimetype, "video/x-vp9")) {
3773     id = AV_CODEC_ID_VP9;
3774     video = TRUE;
3775   } else if (!strcmp (mimetype, "video/x-flash-screen")) {
3776     id = AV_CODEC_ID_FLASHSV;
3777     video = TRUE;
3778   } else if (!strcmp (mimetype, "video/x-indeo")) {
3779     gint indeoversion = 0;
3780
3781     if (gst_structure_get_int (structure, "indeoversion", &indeoversion)) {
3782       switch (indeoversion) {
3783         case 5:
3784           id = AV_CODEC_ID_INDEO5;
3785           break;
3786         case 4:
3787           id = AV_CODEC_ID_INDEO4;
3788           break;
3789         case 3:
3790           id = AV_CODEC_ID_INDEO3;
3791           break;
3792         case 2:
3793           id = AV_CODEC_ID_INDEO2;
3794           break;
3795       }
3796       if (id != AV_CODEC_ID_NONE)
3797         video = TRUE;
3798     }
3799   } else if (!strcmp (mimetype, "video/x-divx")) {
3800     gint divxversion = 0;
3801
3802     if (gst_structure_get_int (structure, "divxversion", &divxversion)) {
3803       switch (divxversion) {
3804         case 3:
3805           id = AV_CODEC_ID_MSMPEG4V3;
3806           break;
3807         case 4:
3808         case 5:
3809           id = AV_CODEC_ID_MPEG4;
3810           break;
3811       }
3812     }
3813     if (id != AV_CODEC_ID_NONE)
3814       video = TRUE;
3815   } else if (!strcmp (mimetype, "video/x-ffv")) {
3816     gint ffvversion = 0;
3817
3818     if (gst_structure_get_int (structure, "ffvversion", &ffvversion) &&
3819         ffvversion == 1) {
3820       id = AV_CODEC_ID_FFV1;
3821       video = TRUE;
3822     }
3823   } else if (!strcmp (mimetype, "video/x-apple-intermediate-codec")) {
3824     id = AV_CODEC_ID_AIC;
3825     video = TRUE;
3826   } else if (!strcmp (mimetype, "audio/x-adpcm")) {
3827     const gchar *layout;
3828
3829     layout = gst_structure_get_string (structure, "layout");
3830     if (layout == NULL) {
3831       /* break */
3832     } else if (!strcmp (layout, "quicktime")) {
3833       id = AV_CODEC_ID_ADPCM_IMA_QT;
3834     } else if (!strcmp (layout, "microsoft")) {
3835       id = AV_CODEC_ID_ADPCM_MS;
3836     } else if (!strcmp (layout, "dvi")) {
3837       id = AV_CODEC_ID_ADPCM_IMA_WAV;
3838     } else if (!strcmp (layout, "4xm")) {
3839       id = AV_CODEC_ID_ADPCM_4XM;
3840     } else if (!strcmp (layout, "smjpeg")) {
3841       id = AV_CODEC_ID_ADPCM_IMA_SMJPEG;
3842     } else if (!strcmp (layout, "dk3")) {
3843       id = AV_CODEC_ID_ADPCM_IMA_DK3;
3844     } else if (!strcmp (layout, "dk4")) {
3845       id = AV_CODEC_ID_ADPCM_IMA_DK4;
3846     } else if (!strcmp (layout, "westwood")) {
3847       id = AV_CODEC_ID_ADPCM_IMA_WS;
3848     } else if (!strcmp (layout, "iss")) {
3849       id = AV_CODEC_ID_ADPCM_IMA_ISS;
3850     } else if (!strcmp (layout, "xa")) {
3851       id = AV_CODEC_ID_ADPCM_XA;
3852     } else if (!strcmp (layout, "adx")) {
3853       id = AV_CODEC_ID_ADPCM_ADX;
3854     } else if (!strcmp (layout, "ea")) {
3855       id = AV_CODEC_ID_ADPCM_EA;
3856     } else if (!strcmp (layout, "g726")) {
3857       id = AV_CODEC_ID_ADPCM_G726;
3858     } else if (!strcmp (layout, "g721")) {
3859       id = AV_CODEC_ID_ADPCM_G726;
3860     } else if (!strcmp (layout, "ct")) {
3861       id = AV_CODEC_ID_ADPCM_CT;
3862     } else if (!strcmp (layout, "swf")) {
3863       id = AV_CODEC_ID_ADPCM_SWF;
3864     } else if (!strcmp (layout, "yamaha")) {
3865       id = AV_CODEC_ID_ADPCM_YAMAHA;
3866     } else if (!strcmp (layout, "sbpro2")) {
3867       id = AV_CODEC_ID_ADPCM_SBPRO_2;
3868     } else if (!strcmp (layout, "sbpro3")) {
3869       id = AV_CODEC_ID_ADPCM_SBPRO_3;
3870     } else if (!strcmp (layout, "sbpro4")) {
3871       id = AV_CODEC_ID_ADPCM_SBPRO_4;
3872     }
3873     if (id != AV_CODEC_ID_NONE)
3874       audio = TRUE;
3875   } else if (!strcmp (mimetype, "video/x-4xm")) {
3876     id = AV_CODEC_ID_4XM;
3877     video = TRUE;
3878   } else if (!strcmp (mimetype, "audio/x-dpcm")) {
3879     const gchar *layout;
3880
3881     layout = gst_structure_get_string (structure, "layout");
3882     if (!layout) {
3883       /* .. */
3884     } else if (!strcmp (layout, "roq")) {
3885       id = AV_CODEC_ID_ROQ_DPCM;
3886     } else if (!strcmp (layout, "interplay")) {
3887       id = AV_CODEC_ID_INTERPLAY_DPCM;
3888     } else if (!strcmp (layout, "xan")) {
3889       id = AV_CODEC_ID_XAN_DPCM;
3890     } else if (!strcmp (layout, "sol")) {
3891       id = AV_CODEC_ID_SOL_DPCM;
3892     }
3893     if (id != AV_CODEC_ID_NONE)
3894       audio = TRUE;
3895   } else if (!strcmp (mimetype, "audio/x-flac")) {
3896     id = AV_CODEC_ID_FLAC;
3897     audio = TRUE;
3898   } else if (!strcmp (mimetype, "audio/x-shorten")) {
3899     id = AV_CODEC_ID_SHORTEN;
3900     audio = TRUE;
3901   } else if (!strcmp (mimetype, "audio/x-alac")) {
3902     id = AV_CODEC_ID_ALAC;
3903     audio = TRUE;
3904   } else if (!strcmp (mimetype, "video/x-cinepak")) {
3905     id = AV_CODEC_ID_CINEPAK;
3906     video = TRUE;
3907   } else if (!strcmp (mimetype, "video/x-pn-realvideo")) {
3908     gint rmversion;
3909
3910     if (gst_structure_get_int (structure, "rmversion", &rmversion)) {
3911       switch (rmversion) {
3912         case 1:
3913           id = AV_CODEC_ID_RV10;
3914           break;
3915         case 2:
3916           id = AV_CODEC_ID_RV20;
3917           break;
3918         case 3:
3919           id = AV_CODEC_ID_RV30;
3920           break;
3921         case 4:
3922           id = AV_CODEC_ID_RV40;
3923           break;
3924       }
3925     }
3926     if (id != AV_CODEC_ID_NONE)
3927       video = TRUE;
3928   } else if (!strcmp (mimetype, "audio/x-sipro")) {
3929     id = AV_CODEC_ID_SIPR;
3930     audio = TRUE;
3931   } else if (!strcmp (mimetype, "audio/x-pn-realaudio")) {
3932     gint raversion;
3933
3934     if (gst_structure_get_int (structure, "raversion", &raversion)) {
3935       switch (raversion) {
3936         case 1:
3937           id = AV_CODEC_ID_RA_144;
3938           break;
3939         case 2:
3940           id = AV_CODEC_ID_RA_288;
3941           break;
3942         case 8:
3943           id = AV_CODEC_ID_COOK;
3944           break;
3945       }
3946     }
3947     if (id != AV_CODEC_ID_NONE)
3948       audio = TRUE;
3949   } else if (!strcmp (mimetype, "video/x-rle")) {
3950     const gchar *layout;
3951
3952     if ((layout = gst_structure_get_string (structure, "layout"))) {
3953       if (!strcmp (layout, "microsoft")) {
3954         id = AV_CODEC_ID_MSRLE;
3955         video = TRUE;
3956       }
3957     }
3958   } else if (!strcmp (mimetype, "video/x-xan")) {
3959     gint wcversion = 0;
3960
3961     if ((gst_structure_get_int (structure, "wcversion", &wcversion))) {
3962       switch (wcversion) {
3963         case 3:
3964           id = AV_CODEC_ID_XAN_WC3;
3965           video = TRUE;
3966           break;
3967         case 4:
3968           id = AV_CODEC_ID_XAN_WC4;
3969           video = TRUE;
3970           break;
3971         default:
3972           break;
3973       }
3974     }
3975   } else if (!strcmp (mimetype, "audio/AMR")) {
3976     audio = TRUE;
3977     id = AV_CODEC_ID_AMR_NB;
3978   } else if (!strcmp (mimetype, "audio/AMR-WB")) {
3979     id = AV_CODEC_ID_AMR_WB;
3980     audio = TRUE;
3981   } else if (!strcmp (mimetype, "audio/qcelp")) {
3982     id = AV_CODEC_ID_QCELP;
3983     audio = TRUE;
3984   } else if (!strcmp (mimetype, "video/x-h264")) {
3985     id = AV_CODEC_ID_H264;
3986     video = TRUE;
3987   } else if (!strcmp (mimetype, "video/x-h265")) {
3988     id = AV_CODEC_ID_HEVC;
3989     video = TRUE;
3990   } else if (!strcmp (mimetype, "video/x-flash-video")) {
3991     gint flvversion = 0;
3992
3993     if ((gst_structure_get_int (structure, "flvversion", &flvversion))) {
3994       switch (flvversion) {
3995         case 1:
3996           id = AV_CODEC_ID_FLV1;
3997           video = TRUE;
3998           break;
3999         default:
4000           break;
4001       }
4002     }
4003
4004   } else if (!strcmp (mimetype, "audio/x-nellymoser")) {
4005     id = AV_CODEC_ID_NELLYMOSER;
4006     audio = TRUE;
4007   } else if (!strncmp (mimetype, "audio/x-gst-av-", 15)) {
4008     gchar ext[16];
4009     AVCodec *codec;
4010
4011     if (strlen (mimetype) <= 30 &&
4012         sscanf (mimetype, "audio/x-gst-av-%s", ext) == 1) {
4013       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4014           (codec = avcodec_find_encoder_by_name (ext))) {
4015         id = codec->id;
4016         audio = TRUE;
4017       }
4018     }
4019   } else if (!strncmp (mimetype, "video/x-gst-av-", 15)) {
4020     gchar ext[16];
4021     AVCodec *codec;
4022
4023     if (strlen (mimetype) <= 30 &&
4024         sscanf (mimetype, "video/x-gst-av-%s", ext) == 1) {
4025       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4026           (codec = avcodec_find_encoder_by_name (ext))) {
4027         id = codec->id;
4028         video = TRUE;
4029       }
4030     }
4031   }
4032
4033   if (context != NULL) {
4034     if (video == TRUE) {
4035       context->codec_type = AVMEDIA_TYPE_VIDEO;
4036     } else if (audio == TRUE) {
4037       context->codec_type = AVMEDIA_TYPE_AUDIO;
4038     } else {
4039       context->codec_type = AVMEDIA_TYPE_UNKNOWN;
4040     }
4041     context->codec_id = id;
4042     gst_ffmpeg_caps_with_codecid (id, context->codec_type, caps, context);
4043   }
4044
4045   if (id != AV_CODEC_ID_NONE) {
4046     GST_DEBUG ("The id=%d belongs to the caps %" GST_PTR_FORMAT, id, caps);
4047   } else {
4048     GST_WARNING ("Couldn't figure out the id for caps %" GST_PTR_FORMAT, caps);
4049   }
4050
4051   return id;
4052 }