aa9ced2cadfd95703701813c496097874cdc72bf
[platform/upstream/gstreamer.git] / ext / libav / gstavcodecmap.c
1 /* GStreamer
2  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
3  * This file:
4  * Copyright (c) 2002-2004 Ronald Bultje <rbultje@ronald.bitfreak.net>
5  *
6  * This library is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Library General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Library General Public License for more details.
15  *
16  * You should have received a copy of the GNU Library General Public
17  * License along with this library; if not, write to the
18  * Free Software Foundation, Inc., 51 Franklin St, Fifth Floor,
19  * Boston, MA 02110-1301, USA.
20  */
21
22 #ifdef HAVE_CONFIG_H
23 #include "config.h"
24 #endif
25
26 #include <string.h>
27
28 #include <gst/gst.h>
29 #include <libavcodec/avcodec.h>
30 #include <libavutil/channel_layout.h>
31
32 #include "gstav.h"
33 #include "gstavcodecmap.h"
34
35 #include <gst/video/video.h>
36 #include <gst/audio/audio.h>
37 #include <gst/pbutils/codec-utils.h>
38
39 /* IMPORTANT: Keep this sorted by the ffmpeg channel masks */
40 static const struct
41 {
42   guint64 ff;
43   GstAudioChannelPosition gst;
44 } _ff_to_gst_layout[] = {
45   {
46   AV_CH_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
47   AV_CH_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}, {
48   AV_CH_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_CENTER}, {
49   AV_CH_LOW_FREQUENCY, GST_AUDIO_CHANNEL_POSITION_LFE1}, {
50   AV_CH_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_REAR_LEFT}, {
51   AV_CH_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_REAR_RIGHT}, {
52   AV_CH_FRONT_LEFT_OF_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT_OF_CENTER}, {
53   AV_CH_FRONT_RIGHT_OF_CENTER,
54         GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT_OF_CENTER}, {
55   AV_CH_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_REAR_CENTER}, {
56   AV_CH_SIDE_LEFT, GST_AUDIO_CHANNEL_POSITION_SIDE_LEFT}, {
57   AV_CH_SIDE_RIGHT, GST_AUDIO_CHANNEL_POSITION_SIDE_RIGHT}, {
58   AV_CH_TOP_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_CENTER}, {
59   AV_CH_TOP_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_LEFT}, {
60   AV_CH_TOP_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_CENTER}, {
61   AV_CH_TOP_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_RIGHT}, {
62   AV_CH_TOP_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_LEFT}, {
63   AV_CH_TOP_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_CENTER}, {
64   AV_CH_TOP_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_RIGHT}, {
65   AV_CH_STEREO_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
66   AV_CH_STEREO_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}
67 };
68
69 GType
70 gst_ffmpeg_compliance_get_type (void)
71 {
72   static GType ffmpeg_compliance_type = 0;
73   static const GEnumValue compliance_types[] = {
74     {GST_FFMPEG_VERY_STRICT, "Strictly conform to older spec",
75         "verystrict"},
76     {GST_FFMPEG_STRICT, "Strictly conform to current spec", "strict"},
77     {GST_FFMPEG_NORMAL, "Normal behavior", "normal"},
78     {GST_FFMPEG_UNOFFICIAL, "Allow unofficial extensions", "unofficial"},
79     {GST_FFMPEG_EXPERIMENTAL, "Allow nonstandardized experimental things",
80         "experimental"},
81     {0, NULL, NULL}
82   };
83
84   if (!ffmpeg_compliance_type) {
85     ffmpeg_compliance_type =
86         g_enum_register_static ("GstFFMpegCompliance", compliance_types);
87   }
88   return ffmpeg_compliance_type;
89 }
90
91 static guint64
92 gst_ffmpeg_channel_positions_to_layout (GstAudioChannelPosition * pos,
93     gint channels)
94 {
95   gint i, j;
96   guint64 ret = 0;
97   gint channels_found = 0;
98
99   if (!pos)
100     return 0;
101
102   if (channels == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
103     return AV_CH_LAYOUT_MONO;
104
105   for (i = 0; i < channels; i++) {
106     for (j = 0; j < G_N_ELEMENTS (_ff_to_gst_layout); j++) {
107       if (_ff_to_gst_layout[j].gst == pos[i]) {
108         ret |= _ff_to_gst_layout[j].ff;
109         channels_found++;
110         break;
111       }
112     }
113   }
114
115   if (channels_found != channels)
116     return 0;
117   return ret;
118 }
119
120 gboolean
121 gst_ffmpeg_channel_layout_to_gst (guint64 channel_layout, gint channels,
122     GstAudioChannelPosition * pos)
123 {
124   guint nchannels = 0;
125   gboolean none_layout = FALSE;
126
127   if (channel_layout == 0) {
128     nchannels = channels;
129     none_layout = TRUE;
130   } else {
131     guint i, j;
132
133     /* Special path for mono, as AV_CH_LAYOUT_MONO is the same
134      * as FRONT_CENTER but we distinguish between the two in
135      * GStreamer
136      */
137     if (channels == 1 && channel_layout == AV_CH_LAYOUT_MONO) {
138       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
139       return TRUE;
140     }
141
142     for (i = 0; i < 64; i++) {
143       if ((channel_layout & (G_GUINT64_CONSTANT (1) << i)) != 0) {
144         nchannels++;
145       }
146     }
147
148     if (nchannels != channels) {
149       GST_ERROR ("Number of channels is different (%u != %u)", channels,
150           nchannels);
151       nchannels = channels;
152       none_layout = TRUE;
153     } else {
154
155       for (i = 0, j = 0; i < G_N_ELEMENTS (_ff_to_gst_layout); i++) {
156         if ((channel_layout & _ff_to_gst_layout[i].ff) != 0) {
157           pos[j++] = _ff_to_gst_layout[i].gst;
158
159           if (_ff_to_gst_layout[i].gst == GST_AUDIO_CHANNEL_POSITION_NONE)
160             none_layout = TRUE;
161         }
162       }
163
164       if (j != nchannels) {
165         GST_WARNING
166             ("Unknown channels in channel layout - assuming NONE layout");
167         none_layout = TRUE;
168       }
169     }
170   }
171
172   if (!none_layout
173       && !gst_audio_check_valid_channel_positions (pos, nchannels, FALSE)) {
174     GST_ERROR ("Invalid channel layout %" G_GUINT64_FORMAT
175         " - assuming NONE layout", channel_layout);
176     none_layout = TRUE;
177   }
178
179   if (none_layout) {
180     if (nchannels == 1) {
181       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
182     } else if (nchannels == 2) {
183       pos[0] = GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT;
184       pos[1] = GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT;
185     } else {
186       guint i;
187
188       for (i = 0; i < nchannels; i++)
189         pos[i] = GST_AUDIO_CHANNEL_POSITION_NONE;
190     }
191   }
192
193   return TRUE;
194 }
195
196 static gboolean
197 _gst_value_list_contains (const GValue * list, const GValue * value)
198 {
199   guint i, n;
200   const GValue *tmp;
201
202   n = gst_value_list_get_size (list);
203   for (i = 0; i < n; i++) {
204     tmp = gst_value_list_get_value (list, i);
205     if (gst_value_compare (value, tmp) == GST_VALUE_EQUAL)
206       return TRUE;
207   }
208
209   return FALSE;
210 }
211
212 static void
213 gst_ffmpeg_video_set_pix_fmts (GstCaps * caps, const enum AVPixelFormat *fmts)
214 {
215   GValue va = { 0, };
216   GValue v = { 0, };
217   GstVideoFormat format;
218
219   if (!fmts || fmts[0] == -1) {
220     gint i;
221
222     g_value_init (&va, GST_TYPE_LIST);
223     g_value_init (&v, G_TYPE_STRING);
224     for (i = 0; i <= AV_PIX_FMT_NB; i++) {
225       format = gst_ffmpeg_pixfmt_to_videoformat (i);
226       if (format == GST_VIDEO_FORMAT_UNKNOWN)
227         continue;
228       g_value_set_string (&v, gst_video_format_to_string (format));
229       gst_value_list_append_value (&va, &v);
230     }
231     gst_caps_set_value (caps, "format", &va);
232     g_value_unset (&v);
233     g_value_unset (&va);
234     return;
235   }
236
237   /* Only a single format */
238   g_value_init (&va, GST_TYPE_LIST);
239   g_value_init (&v, G_TYPE_STRING);
240   while (*fmts != -1) {
241     format = gst_ffmpeg_pixfmt_to_videoformat (*fmts);
242     if (format != GST_VIDEO_FORMAT_UNKNOWN) {
243       g_value_set_string (&v, gst_video_format_to_string (format));
244       /* Only append values we don't have yet */
245       if (!_gst_value_list_contains (&va, &v))
246         gst_value_list_append_value (&va, &v);
247     }
248     fmts++;
249   }
250   if (gst_value_list_get_size (&va) == 1) {
251     /* The single value is still in v */
252     gst_caps_set_value (caps, "format", &v);
253   } else if (gst_value_list_get_size (&va) > 1) {
254     gst_caps_set_value (caps, "format", &va);
255   }
256   g_value_unset (&v);
257   g_value_unset (&va);
258 }
259
260 /* this macro makes a caps width fixed or unfixed width/height
261  * properties depending on whether we've got a context.
262  *
263  * See below for why we use this.
264  *
265  * We should actually do this stuff at the end, like in riff-media.c,
266  * but I'm too lazy today. Maybe later.
267  */
268 static GstCaps *
269 gst_ff_vid_caps_new (AVCodecContext * context, AVCodec * codec,
270     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
271     const char *fieldname, ...)
272 {
273   GstCaps *caps = NULL;
274   va_list var_args;
275   gint i;
276
277   GST_LOG ("context:%p, codec_id:%d, mimetype:%s", context, codec_id, mimetype);
278
279   /* fixed, non probing context */
280   if (context != NULL && context->width != -1) {
281     gint num, denom;
282
283     caps = gst_caps_new_simple (mimetype,
284         "width", G_TYPE_INT, context->width,
285         "height", G_TYPE_INT, context->height, NULL);
286
287     num = context->time_base.den / context->ticks_per_frame;
288     denom = context->time_base.num;
289
290     if (!denom) {
291       GST_LOG ("invalid framerate: %d/0, -> %d/1", num, num);
292       denom = 1;
293     }
294     if (gst_util_fraction_compare (num, denom, 1000, 1) > 0) {
295       GST_LOG ("excessive framerate: %d/%d, -> 0/1", num, denom);
296       num = 0;
297       denom = 1;
298     }
299     GST_LOG ("setting framerate: %d/%d", num, denom);
300     gst_caps_set_simple (caps,
301         "framerate", GST_TYPE_FRACTION, num, denom, NULL);
302   } else if (encode) {
303     /* so we are after restricted caps in this case */
304     switch (codec_id) {
305       case AV_CODEC_ID_H261:
306       {
307         caps = gst_caps_new_simple (mimetype,
308             "width", G_TYPE_INT, 352,
309             "height", G_TYPE_INT, 288,
310             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
311         gst_caps_append (caps, gst_caps_new_simple (mimetype,
312                 "width", G_TYPE_INT, 176,
313                 "height", G_TYPE_INT, 144,
314                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
315         break;
316       }
317       case AV_CODEC_ID_H263:
318       {
319         /* 128x96, 176x144, 352x288, 704x576, and 1408x1152. slightly reordered
320          * because we want automatic negotiation to go as close to 320x240 as
321          * possible. */
322         const static gint widths[] = { 352, 704, 176, 1408, 128 };
323         const static gint heights[] = { 288, 576, 144, 1152, 96 };
324         GstCaps *temp;
325         gint n_sizes = G_N_ELEMENTS (widths);
326
327         caps = gst_caps_new_empty ();
328         for (i = 0; i < n_sizes; i++) {
329           temp = gst_caps_new_simple (mimetype,
330               "width", G_TYPE_INT, widths[i],
331               "height", G_TYPE_INT, heights[i],
332               "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
333
334           gst_caps_append (caps, temp);
335         }
336         break;
337       }
338       case AV_CODEC_ID_DVVIDEO:
339       {
340         static struct
341         {
342           const gchar *csp;
343           gint width, height;
344           gint par_n, par_d;
345           gint framerate_n, framerate_d;
346         } profiles[] = {
347           {
348           "Y41B", 720, 480, 8, 9, 30000, 1001}, {
349           "Y41B", 720, 480, 32, 27, 30000, 1001}, {
350           "Y42B", 720, 480, 8, 9, 30000, 1001}, {
351           "Y42B", 720, 480, 32, 27, 30000, 1001}, {
352           "I420", 720, 576, 16, 15, 25, 1}, {
353           "I420", 720, 576, 64, 45, 25, 1}, {
354           "Y41B", 720, 576, 16, 15, 25, 1}, {
355           "Y41B", 720, 576, 64, 45, 25, 1}, {
356           "Y42B", 720, 576, 16, 15, 25, 1}, {
357           "Y42B", 720, 576, 64, 45, 25, 1}, {
358           "Y42B", 1280, 1080, 1, 1, 30000, 1001}, {
359           "Y42B", 1280, 1080, 3, 2, 30000, 1001}, {
360           "Y42B", 1440, 1080, 1, 1, 25, 1}, {
361           "Y42B", 1440, 1080, 4, 3, 25, 1}, {
362           "Y42B", 960, 720, 1, 1, 60000, 1001}, {
363           "Y42B", 960, 720, 4, 3, 60000, 1001}, {
364           "Y42B", 960, 720, 1, 1, 50, 1}, {
365         "Y42B", 960, 720, 4, 3, 50, 1},};
366         GstCaps *temp;
367         gint n_sizes = G_N_ELEMENTS (profiles);
368
369         if (strcmp (mimetype, "video/x-raw") == 0) {
370           caps = gst_caps_new_empty ();
371           for (i = 0; i < n_sizes; i++) {
372             temp = gst_caps_new_simple (mimetype,
373                 "format", G_TYPE_STRING, profiles[i].csp,
374                 "width", G_TYPE_INT, profiles[i].width,
375                 "height", G_TYPE_INT, profiles[i].height,
376                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
377                 profiles[i].framerate_d, "pixel-aspect-ratio",
378                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
379
380             gst_caps_append (caps, temp);
381           }
382         } else {
383           caps = gst_caps_new_empty ();
384           for (i = 0; i < n_sizes; i++) {
385             temp = gst_caps_new_simple (mimetype,
386                 "width", G_TYPE_INT, profiles[i].width,
387                 "height", G_TYPE_INT, profiles[i].height,
388                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
389                 profiles[i].framerate_d, "pixel-aspect-ratio",
390                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
391
392             gst_caps_append (caps, temp);
393           }
394         }
395         break;
396       }
397       case AV_CODEC_ID_DNXHD:
398       {
399         caps = gst_caps_new_simple (mimetype,
400             "width", G_TYPE_INT, 1920,
401             "height", G_TYPE_INT, 1080,
402             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
403         gst_caps_append (caps, gst_caps_new_simple (mimetype,
404                 "width", G_TYPE_INT, 1280,
405                 "height", G_TYPE_INT, 720,
406                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
407         break;
408       }
409       default:
410       {
411         if (codec && codec->supported_framerates
412             && codec->supported_framerates[0].num != 0
413             && codec->supported_framerates[0].den != 0) {
414           GValue va = { 0, };
415           GValue v = { 0, };
416           const AVRational *rates = codec->supported_framerates;
417
418           if (rates[1].num == 0 && rates[1].den == 0) {
419             caps =
420                 gst_caps_new_simple (mimetype, "framerate", GST_TYPE_FRACTION,
421                 rates[0].num, rates[0].den, NULL);
422           } else {
423             g_value_init (&va, GST_TYPE_LIST);
424             g_value_init (&v, GST_TYPE_FRACTION);
425
426             while (rates->num != 0 && rates->den != 0) {
427               gst_value_set_fraction (&v, rates->num, rates->den);
428               gst_value_list_append_value (&va, &v);
429               rates++;
430             }
431
432             caps = gst_caps_new_simple (mimetype, NULL, NULL, NULL);
433             gst_caps_set_value (caps, "framerate", &va);
434             g_value_unset (&va);
435             g_value_unset (&v);
436           }
437
438         } else {
439           caps = gst_caps_new_empty_simple (mimetype);
440         }
441
442         break;
443       }
444     }
445   }
446
447   /* no fixed caps or special restrictions applied;
448    * default unfixed setting */
449   if (!caps) {
450     GST_DEBUG ("Creating default caps");
451     caps = gst_caps_new_empty_simple (mimetype);
452   }
453
454   va_start (var_args, fieldname);
455   gst_caps_set_simple_valist (caps, fieldname, var_args);
456   va_end (var_args);
457
458   return caps;
459 }
460
461 static gint
462 get_nbits_set (guint64 n)
463 {
464   gint i, x;
465
466   x = 0;
467   for (i = 0; i < 64; i++) {
468     if ((n & (G_GUINT64_CONSTANT (1) << i)))
469       x++;
470   }
471
472   return x;
473 }
474
475 static void
476 gst_ffmpeg_audio_set_sample_fmts (GstCaps * caps,
477     const enum AVSampleFormat *fmts)
478 {
479   GValue va = { 0, };
480   GValue v = { 0, };
481   GstAudioFormat format;
482
483   if (!fmts || fmts[0] == -1) {
484     gint i;
485
486     g_value_init (&va, GST_TYPE_LIST);
487     g_value_init (&v, G_TYPE_STRING);
488     for (i = 0; i <= AV_SAMPLE_FMT_DBL; i++) {
489       format = gst_ffmpeg_smpfmt_to_audioformat (i);
490       if (format == GST_AUDIO_FORMAT_UNKNOWN)
491         continue;
492       g_value_set_string (&v, gst_audio_format_to_string (format));
493       gst_value_list_append_value (&va, &v);
494     }
495     gst_caps_set_value (caps, "format", &va);
496     g_value_unset (&v);
497     g_value_unset (&va);
498     return;
499   }
500
501   g_value_init (&va, GST_TYPE_LIST);
502   g_value_init (&v, G_TYPE_STRING);
503   while (*fmts != -1) {
504     format = gst_ffmpeg_smpfmt_to_audioformat (*fmts);
505     if (format != GST_AUDIO_FORMAT_UNKNOWN) {
506       g_value_set_string (&v, gst_audio_format_to_string (format));
507       /* Only append values we don't have yet */
508       if (!_gst_value_list_contains (&va, &v))
509         gst_value_list_append_value (&va, &v);
510     }
511     fmts++;
512   }
513   if (gst_value_list_get_size (&va) == 1) {
514     /* The single value is still in v */
515     gst_caps_set_value (caps, "format", &v);
516   } else if (gst_value_list_get_size (&va) > 1) {
517     gst_caps_set_value (caps, "format", &va);
518   }
519   g_value_unset (&v);
520   g_value_unset (&va);
521 }
522
523 /* same for audio - now with channels/sample rate
524  */
525 static GstCaps *
526 gst_ff_aud_caps_new (AVCodecContext * context, AVCodec * codec,
527     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
528     const char *fieldname, ...)
529 {
530   GstCaps *caps = NULL;
531   gint i;
532   va_list var_args;
533
534   /* fixed, non-probing context */
535   if (context != NULL && context->channels != -1) {
536     GstAudioChannelPosition pos[64];
537     guint64 mask;
538
539     caps = gst_caps_new_simple (mimetype,
540         "rate", G_TYPE_INT, context->sample_rate,
541         "channels", G_TYPE_INT, context->channels, NULL);
542
543     if (context->channels > 1 &&
544         gst_ffmpeg_channel_layout_to_gst (context->channel_layout,
545             context->channels, pos) &&
546         gst_audio_channel_positions_to_mask (pos, context->channels, FALSE,
547             &mask)) {
548       gst_caps_set_simple (caps, "channel-mask", GST_TYPE_BITMASK, mask, NULL);
549     }
550   } else if (encode) {
551     gint maxchannels = 2;
552     const gint *rates = NULL;
553     gint n_rates = 0;
554
555     /* so we must be after restricted caps in this case */
556     switch (codec_id) {
557       case AV_CODEC_ID_AAC:
558       case AV_CODEC_ID_AAC_LATM:
559       case AV_CODEC_ID_DTS:
560         maxchannels = 6;
561         break;
562       case AV_CODEC_ID_MP2:
563       {
564         const static gint l_rates[] =
565             { 48000, 44100, 32000, 24000, 22050, 16000 };
566         n_rates = G_N_ELEMENTS (l_rates);
567         rates = l_rates;
568         break;
569       }
570       case AV_CODEC_ID_EAC3:
571       case AV_CODEC_ID_AC3:
572       {
573         const static gint l_rates[] = { 48000, 44100, 32000 };
574         maxchannels = 6;
575         n_rates = G_N_ELEMENTS (l_rates);
576         rates = l_rates;
577         break;
578       }
579       case AV_CODEC_ID_ADPCM_G722:
580       {
581         const static gint l_rates[] = { 16000 };
582         n_rates = G_N_ELEMENTS (l_rates);
583         rates = l_rates;
584         maxchannels = 1;
585         break;
586       }
587       case AV_CODEC_ID_ADPCM_G726:
588       {
589         const static gint l_rates[] = { 8000 };
590         n_rates = G_N_ELEMENTS (l_rates);
591         rates = l_rates;
592         maxchannels = 1;
593         break;
594       }
595       case AV_CODEC_ID_ADPCM_SWF:
596       {
597         const static gint l_rates[] = { 11025, 22050, 44100 };
598         n_rates = G_N_ELEMENTS (l_rates);
599         rates = l_rates;
600         break;
601       }
602       case AV_CODEC_ID_ROQ_DPCM:
603       {
604         const static gint l_rates[] = { 22050 };
605         n_rates = G_N_ELEMENTS (l_rates);
606         rates = l_rates;
607         break;
608       }
609       case AV_CODEC_ID_AMR_NB:
610       {
611         const static gint l_rates[] = { 8000 };
612         maxchannels = 1;
613         n_rates = G_N_ELEMENTS (l_rates);
614         rates = l_rates;
615         break;
616       }
617       case AV_CODEC_ID_AMR_WB:
618       {
619         const static gint l_rates[] = { 16000 };
620         maxchannels = 1;
621         n_rates = G_N_ELEMENTS (l_rates);
622         rates = l_rates;
623         break;
624       }
625       default:
626         break;
627     }
628
629     /* regardless of encode/decode, open up channels if applicable */
630     /* Until decoders/encoders expose the maximum number of channels
631      * they support, we whitelist them here. */
632     switch (codec_id) {
633       case AV_CODEC_ID_WMAPRO:
634       case AV_CODEC_ID_TRUEHD:
635         maxchannels = 8;
636         break;
637       default:
638         break;
639     }
640
641     if (codec && codec->channel_layouts) {
642       const uint64_t *layouts = codec->channel_layouts;
643       GstAudioChannelPosition pos[64];
644
645       caps = gst_caps_new_empty ();
646       while (*layouts) {
647         gint nbits_set = get_nbits_set (*layouts);
648
649         if (gst_ffmpeg_channel_layout_to_gst (*layouts, nbits_set, pos)) {
650           guint64 mask;
651
652           if (gst_audio_channel_positions_to_mask (pos, nbits_set, FALSE,
653                   &mask)) {
654             GstStructure *s =
655                 gst_structure_new (mimetype, "channels", G_TYPE_INT, nbits_set,
656                 NULL);
657
658             /* No need to require a channel mask for mono or stereo */
659             if (!(nbits_set == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
660                 && !(nbits_set == 2
661                     && pos[0] == GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT
662                     && pos[1] == GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT))
663               gst_structure_set (s, "channel-mask", GST_TYPE_BITMASK, mask,
664                   NULL);
665
666             gst_caps_append_structure (caps, s);
667           }
668         }
669         layouts++;
670       }
671     } else {
672       if (maxchannels == 1)
673         caps = gst_caps_new_simple (mimetype,
674             "channels", G_TYPE_INT, maxchannels, NULL);
675       else
676         caps = gst_caps_new_simple (mimetype,
677             "channels", GST_TYPE_INT_RANGE, 1, maxchannels, NULL);
678     }
679
680     if (n_rates) {
681       GValue list = { 0, };
682
683       g_value_init (&list, GST_TYPE_LIST);
684       for (i = 0; i < n_rates; i++) {
685         GValue v = { 0, };
686
687         g_value_init (&v, G_TYPE_INT);
688         g_value_set_int (&v, rates[i]);
689         gst_value_list_append_value (&list, &v);
690         g_value_unset (&v);
691       }
692       gst_caps_set_value (caps, "rate", &list);
693       g_value_unset (&list);
694     } else if (codec && codec->supported_samplerates
695         && codec->supported_samplerates[0]) {
696       GValue va = { 0, };
697       GValue v = { 0, };
698
699       if (!codec->supported_samplerates[1]) {
700         gst_caps_set_simple (caps, "rate", G_TYPE_INT,
701             codec->supported_samplerates[0], NULL);
702       } else {
703         const int *rates = codec->supported_samplerates;
704
705         g_value_init (&va, GST_TYPE_LIST);
706         g_value_init (&v, G_TYPE_INT);
707
708         while (*rates) {
709           g_value_set_int (&v, *rates);
710           gst_value_list_append_value (&va, &v);
711           rates++;
712         }
713         gst_caps_set_value (caps, "rate", &va);
714         g_value_unset (&va);
715         g_value_unset (&v);
716       }
717     } else {
718       gst_caps_set_simple (caps, "rate", GST_TYPE_INT_RANGE, 4000, 96000, NULL);
719     }
720   } else {
721     caps = gst_caps_new_empty_simple (mimetype);
722   }
723
724   va_start (var_args, fieldname);
725   gst_caps_set_simple_valist (caps, fieldname, var_args);
726   va_end (var_args);
727
728   return caps;
729 }
730
731 /* Check if the given codec ID is an image format -- for now this is just
732  * anything whose caps is image/... */
733 gboolean
734 gst_ffmpeg_codecid_is_image (enum AVCodecID codec_id)
735 {
736   switch (codec_id) {
737     case AV_CODEC_ID_MJPEG:
738     case AV_CODEC_ID_LJPEG:
739     case AV_CODEC_ID_GIF:
740     case AV_CODEC_ID_PPM:
741     case AV_CODEC_ID_PBM:
742     case AV_CODEC_ID_PCX:
743     case AV_CODEC_ID_SGI:
744     case AV_CODEC_ID_TARGA:
745     case AV_CODEC_ID_TIFF:
746     case AV_CODEC_ID_SUNRAST:
747     case AV_CODEC_ID_BMP:
748       return TRUE;
749
750     default:
751       return FALSE;
752   }
753 }
754
755 /* Convert a FFMPEG codec ID and optional AVCodecContext
756  * to a GstCaps. If the context is ommitted, no fixed values
757  * for video/audio size will be included in the GstCaps
758  *
759  * CodecID is primarily meant for compressed data GstCaps!
760  *
761  * encode is a special parameter. gstffmpegdec will say
762  * FALSE, gstffmpegenc will say TRUE. The output caps
763  * depends on this, in such a way that it will be very
764  * specific, defined, fixed and correct caps for encoders,
765  * yet very wide, "forgiving" caps for decoders. Example
766  * for mp3: decode: audio/mpeg,mpegversion=1,layer=[1-3]
767  * but encode: audio/mpeg,mpegversion=1,layer=3,bitrate=x,
768  * rate=x,channels=x.
769  */
770
771 GstCaps *
772 gst_ffmpeg_codecid_to_caps (enum AVCodecID codec_id,
773     AVCodecContext * context, gboolean encode)
774 {
775   GstCaps *caps = NULL;
776   gboolean buildcaps = FALSE;
777
778   GST_LOG ("codec_id:%d, context:%p, encode:%d", codec_id, context, encode);
779
780   switch (codec_id) {
781     case AV_CODEC_ID_MPEG1VIDEO:
782       /* FIXME: bitrate */
783       caps = gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
784           "mpegversion", G_TYPE_INT, 1,
785           "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
786       break;
787
788     case AV_CODEC_ID_MPEG2VIDEO:
789       if (encode) {
790         /* FIXME: bitrate */
791         caps =
792             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
793             "mpegversion", G_TYPE_INT, 2, "systemstream", G_TYPE_BOOLEAN, FALSE,
794             NULL);
795       } else {
796         /* decode both MPEG-1 and MPEG-2; width/height/fps are all in
797          * the MPEG video stream headers, so may be omitted from caps. */
798         caps = gst_caps_new_simple ("video/mpeg",
799             "mpegversion", GST_TYPE_INT_RANGE, 1, 2,
800             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
801       }
802       break;
803
804     case AV_CODEC_ID_H263:
805       if (encode) {
806         caps =
807             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
808             "video/x-h263", "variant", G_TYPE_STRING, "itu", "h263version",
809             G_TYPE_STRING, "h263", NULL);
810       } else {
811         /* don't pass codec_id, we can decode other variants with the H263
812          * decoder that don't have specific size requirements
813          */
814         caps =
815             gst_ff_vid_caps_new (context, NULL, AV_CODEC_ID_NONE, encode,
816             "video/x-h263", "variant", G_TYPE_STRING, "itu", NULL);
817       }
818       break;
819
820     case AV_CODEC_ID_H263P:
821       caps =
822           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h263",
823           "variant", G_TYPE_STRING, "itu", "h263version", G_TYPE_STRING,
824           "h263p", NULL);
825       if (encode && context) {
826
827         gst_caps_set_simple (caps,
828             "annex-f", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_4MV,
829             "annex-j", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_LOOP_FILTER,
830             "annex-i", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
831             "annex-t", G_TYPE_BOOLEAN, context->flags & CODEC_FLAG_AC_PRED,
832             NULL);
833       }
834       break;
835
836     case AV_CODEC_ID_H263I:
837       caps =
838           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
839           "video/x-intel-h263", "variant", G_TYPE_STRING, "intel", NULL);
840       break;
841
842     case AV_CODEC_ID_H261:
843       caps =
844           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h261",
845           NULL);
846       break;
847
848     case AV_CODEC_ID_RV10:
849     case AV_CODEC_ID_RV20:
850     case AV_CODEC_ID_RV30:
851     case AV_CODEC_ID_RV40:
852     {
853       gint version;
854
855       switch (codec_id) {
856         case AV_CODEC_ID_RV40:
857           version = 4;
858           break;
859         case AV_CODEC_ID_RV30:
860           version = 3;
861           break;
862         case AV_CODEC_ID_RV20:
863           version = 2;
864           break;
865         default:
866           version = 1;
867           break;
868       }
869
870       caps =
871           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
872           "video/x-pn-realvideo", "rmversion", G_TYPE_INT, version, NULL);
873       if (context) {
874         if (context->extradata_size >= 8) {
875           gst_caps_set_simple (caps,
876               "subformat", G_TYPE_INT, GST_READ_UINT32_BE (context->extradata),
877               NULL);
878         }
879       }
880     }
881       break;
882
883     case AV_CODEC_ID_MP1:
884       /* FIXME: bitrate */
885       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
886           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 1, NULL);
887       break;
888
889     case AV_CODEC_ID_MP2:
890       /* FIXME: bitrate */
891       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
892           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 2, NULL);
893       break;
894
895     case AV_CODEC_ID_MP3:
896       if (encode) {
897         /* FIXME: bitrate */
898         caps =
899             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
900             "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 3, NULL);
901       } else {
902         /* Decodes MPEG-1 layer 1/2/3. Samplerate, channels et al are
903          * in the MPEG audio header, so may be omitted from caps. */
904         caps = gst_caps_new_simple ("audio/mpeg",
905             "mpegversion", G_TYPE_INT, 1,
906             "layer", GST_TYPE_INT_RANGE, 1, 3, NULL);
907       }
908       break;
909
910     case AV_CODEC_ID_MUSEPACK7:
911       caps =
912           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
913           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 7,
914           NULL);
915       break;
916
917     case AV_CODEC_ID_MUSEPACK8:
918       caps =
919           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
920           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 8,
921           NULL);
922       break;
923
924     case AV_CODEC_ID_AC3:
925       /* FIXME: bitrate */
926       caps =
927           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-ac3",
928           NULL);
929       break;
930
931     case AV_CODEC_ID_EAC3:
932       /* FIXME: bitrate */
933       caps =
934           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-eac3",
935           NULL);
936       break;
937
938     case AV_CODEC_ID_TRUEHD:
939       caps =
940           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
941           "audio/x-true-hd", NULL);
942       break;
943
944     case AV_CODEC_ID_ATRAC1:
945       caps =
946           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
947           "audio/x-vnd.sony.atrac1", NULL);
948       break;
949
950     case AV_CODEC_ID_ATRAC3:
951       caps =
952           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
953           "audio/x-vnd.sony.atrac3", NULL);
954       break;
955
956     case AV_CODEC_ID_DTS:
957       caps =
958           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dts",
959           NULL);
960       break;
961
962     case AV_CODEC_ID_APE:
963       caps =
964           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
965           "audio/x-ffmpeg-parsed-ape", NULL);
966       if (context) {
967         gst_caps_set_simple (caps,
968             "depth", G_TYPE_INT, context->bits_per_coded_sample, NULL);
969       }
970       break;
971
972     case AV_CODEC_ID_MLP:
973       caps =
974           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mlp",
975           NULL);
976       break;
977
978     case AV_CODEC_ID_IMC:
979       caps =
980           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-imc",
981           NULL);
982       break;
983
984       /* MJPEG is normal JPEG, Motion-JPEG and Quicktime MJPEG-A. MJPEGB
985        * is Quicktime's MJPEG-B. LJPEG is lossless JPEG. I don't know what
986        * sp5x is, but it's apparently something JPEG... We don't separate
987        * between those in GStreamer. Should we (at least between MJPEG,
988        * MJPEG-B and sp5x decoding...)? */
989     case AV_CODEC_ID_MJPEG:
990     case AV_CODEC_ID_LJPEG:
991       caps =
992           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/jpeg",
993           "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
994       break;
995
996     case AV_CODEC_ID_JPEG2000:
997       caps =
998           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-j2c",
999           NULL);
1000       if (!encode) {
1001         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1002                 encode, "image/x-jpc", NULL));
1003         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1004                 encode, "image/jp2", NULL));
1005       }
1006       break;
1007
1008     case AV_CODEC_ID_SP5X:
1009       caps =
1010           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/sp5x",
1011           NULL);
1012       break;
1013
1014     case AV_CODEC_ID_MJPEGB:
1015       caps =
1016           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1017           "video/x-mjpeg-b", NULL);
1018       break;
1019
1020     case AV_CODEC_ID_MPEG4:
1021       if (encode && context != NULL) {
1022         /* I'm not exactly sure what ffmpeg outputs... ffmpeg itself uses
1023          * the AVI fourcc 'DIVX', but 'mp4v' for Quicktime... */
1024         switch (context->codec_tag) {
1025           case GST_MAKE_FOURCC ('D', 'I', 'V', 'X'):
1026             caps =
1027                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1028                 "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL);
1029             break;
1030           case GST_MAKE_FOURCC ('m', 'p', '4', 'v'):
1031           default:
1032             /* FIXME: bitrate. libav doesn't expose the used profile and level */
1033             caps =
1034                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1035                 "video/mpeg", "systemstream", G_TYPE_BOOLEAN, FALSE,
1036                 "mpegversion", G_TYPE_INT, 4, NULL);
1037             break;
1038         }
1039       } else {
1040         /* The trick here is to separate xvid, divx, mpeg4, 3ivx et al */
1041         caps =
1042             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
1043             "mpegversion", G_TYPE_INT, 4, "systemstream", G_TYPE_BOOLEAN, FALSE,
1044             NULL);
1045
1046         if (encode) {
1047           GValue arr = { 0, };
1048           GValue item = { 0, };
1049
1050           g_value_init (&arr, GST_TYPE_LIST);
1051           g_value_init (&item, G_TYPE_STRING);
1052           g_value_set_string (&item, "simple");
1053           gst_value_list_append_value (&arr, &item);
1054           g_value_set_string (&item, "advanced-simple");
1055           gst_value_list_append_value (&arr, &item);
1056           g_value_unset (&item);
1057
1058           gst_caps_set_value (caps, "profile", &arr);
1059           g_value_unset (&arr);
1060
1061           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1062                   encode, "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL));
1063         } else {
1064           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1065                   encode, "video/x-divx", "divxversion", GST_TYPE_INT_RANGE, 4,
1066                   5, NULL));
1067         }
1068       }
1069       break;
1070
1071     case AV_CODEC_ID_RAWVIDEO:
1072       caps =
1073           gst_ffmpeg_codectype_to_video_caps (context, codec_id, encode, NULL);
1074       break;
1075
1076     case AV_CODEC_ID_MSMPEG4V1:
1077     case AV_CODEC_ID_MSMPEG4V2:
1078     case AV_CODEC_ID_MSMPEG4V3:
1079     {
1080       gint version = 41 + codec_id - AV_CODEC_ID_MSMPEG4V1;
1081
1082       /* encode-FIXME: bitrate */
1083       caps =
1084           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1085           "video/x-msmpeg", "msmpegversion", G_TYPE_INT, version, NULL);
1086       if (!encode && codec_id == AV_CODEC_ID_MSMPEG4V3) {
1087         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1088                 encode, "video/x-divx", "divxversion", G_TYPE_INT, 3, NULL));
1089       }
1090     }
1091       break;
1092
1093     case AV_CODEC_ID_WMV1:
1094     case AV_CODEC_ID_WMV2:
1095     {
1096       gint version = (codec_id == AV_CODEC_ID_WMV1) ? 1 : 2;
1097
1098       caps =
1099           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1100           "wmvversion", G_TYPE_INT, version, NULL);
1101     }
1102       break;
1103
1104     case AV_CODEC_ID_FLV1:
1105       caps =
1106           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1107           "video/x-flash-video", "flvversion", G_TYPE_INT, 1, NULL);
1108       break;
1109
1110     case AV_CODEC_ID_SVQ1:
1111       caps =
1112           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1113           "svqversion", G_TYPE_INT, 1, NULL);
1114       break;
1115
1116     case AV_CODEC_ID_SVQ3:
1117       caps =
1118           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1119           "svqversion", G_TYPE_INT, 3, NULL);
1120       break;
1121
1122     case AV_CODEC_ID_DVAUDIO:
1123       caps =
1124           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dv",
1125           NULL);
1126       break;
1127
1128     case AV_CODEC_ID_DVVIDEO:
1129     {
1130       if (encode && context) {
1131         const gchar *format;
1132
1133         switch (context->pix_fmt) {
1134           case AV_PIX_FMT_YUYV422:
1135             format = "YUY2";
1136             break;
1137           case AV_PIX_FMT_YUV420P:
1138             format = "I420";
1139             break;
1140           case AV_PIX_FMT_YUVA420P:
1141             format = "A420";
1142             break;
1143           case AV_PIX_FMT_YUV411P:
1144             format = "Y41B";
1145             break;
1146           case AV_PIX_FMT_YUV422P:
1147             format = "Y42B";
1148             break;
1149           case AV_PIX_FMT_YUV410P:
1150             format = "YUV9";
1151             break;
1152           default:
1153             GST_WARNING
1154                 ("Couldnt' find format for pixfmt %d, defaulting to I420",
1155                 context->pix_fmt);
1156             format = "I420";
1157             break;
1158         }
1159         caps =
1160             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1161             "systemstream", G_TYPE_BOOLEAN, FALSE, "format", G_TYPE_STRING,
1162             format, NULL);
1163       } else {
1164         caps =
1165             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1166             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
1167       }
1168     }
1169       break;
1170
1171     case AV_CODEC_ID_WMAV1:
1172     case AV_CODEC_ID_WMAV2:
1173     {
1174       gint version = (codec_id == AV_CODEC_ID_WMAV1) ? 1 : 2;
1175
1176       if (context) {
1177         caps =
1178             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1179             "wmaversion", G_TYPE_INT, version, "block_align", G_TYPE_INT,
1180             context->block_align, "bitrate", G_TYPE_INT,
1181             (guint) context->bit_rate, NULL);
1182       } else {
1183         caps =
1184             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1185             "wmaversion", G_TYPE_INT, version, "block_align",
1186             GST_TYPE_INT_RANGE, 0, G_MAXINT, "bitrate", GST_TYPE_INT_RANGE, 0,
1187             G_MAXINT, NULL);
1188       }
1189     }
1190       break;
1191     case AV_CODEC_ID_WMAPRO:
1192     {
1193       caps =
1194           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1195           "wmaversion", G_TYPE_INT, 3, NULL);
1196       break;
1197     }
1198     case AV_CODEC_ID_WMALOSSLESS:
1199     {
1200       /* libav only supports a depth of 16 at the moment */
1201       caps =
1202           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1203           "wmaversion", G_TYPE_INT, 4, "depth", G_TYPE_INT, 16, NULL);
1204       break;
1205     }
1206     case AV_CODEC_ID_WMAVOICE:
1207     {
1208       caps =
1209           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wms",
1210           NULL);
1211       break;
1212     }
1213
1214     case AV_CODEC_ID_MACE3:
1215     case AV_CODEC_ID_MACE6:
1216     {
1217       gint version = (codec_id == AV_CODEC_ID_MACE3) ? 3 : 6;
1218
1219       caps =
1220           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mace",
1221           "maceversion", G_TYPE_INT, version, NULL);
1222     }
1223       break;
1224
1225     case AV_CODEC_ID_HUFFYUV:
1226       caps =
1227           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1228           "video/x-huffyuv", NULL);
1229       if (context) {
1230         gst_caps_set_simple (caps,
1231             "bpp", G_TYPE_INT, context->bits_per_coded_sample, NULL);
1232       }
1233       break;
1234
1235     case AV_CODEC_ID_CYUV:
1236       caps =
1237           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1238           "video/x-compressed-yuv", NULL);
1239       break;
1240
1241     case AV_CODEC_ID_H264:
1242       caps =
1243           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h264",
1244           "alignment", G_TYPE_STRING, "au", NULL);
1245       if (!encode) {
1246         GValue arr = { 0, };
1247         GValue item = { 0, };
1248         g_value_init (&arr, GST_TYPE_LIST);
1249         g_value_init (&item, G_TYPE_STRING);
1250         g_value_set_string (&item, "avc");
1251         gst_value_list_append_value (&arr, &item);
1252         g_value_set_string (&item, "byte-stream");
1253         gst_value_list_append_value (&arr, &item);
1254         g_value_unset (&item);
1255         gst_caps_set_value (caps, "stream-format", &arr);
1256         g_value_unset (&arr);
1257       }
1258       break;
1259
1260     case AV_CODEC_ID_HEVC:
1261       caps =
1262           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h265",
1263           "alignment", G_TYPE_STRING, "au", NULL);
1264       if (!encode) {
1265         GValue arr = { 0, };
1266         GValue item = { 0, };
1267         g_value_init (&arr, GST_TYPE_LIST);
1268         g_value_init (&item, G_TYPE_STRING);
1269         g_value_set_string (&item, "hvc1");
1270         gst_value_list_append_value (&arr, &item);
1271         g_value_set_string (&item, "hev1");
1272         gst_value_list_append_value (&arr, &item);
1273         g_value_set_string (&item, "byte-stream");
1274         gst_value_list_append_value (&arr, &item);
1275         g_value_unset (&item);
1276         gst_caps_set_value (caps, "stream-format", &arr);
1277         g_value_unset (&arr);
1278       }
1279       break;
1280
1281     case AV_CODEC_ID_INDEO5:
1282       caps =
1283           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1284           "indeoversion", G_TYPE_INT, 5, NULL);
1285       break;
1286
1287     case AV_CODEC_ID_INDEO4:
1288       caps =
1289           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1290           "indeoversion", G_TYPE_INT, 4, NULL);
1291       break;
1292
1293     case AV_CODEC_ID_INDEO3:
1294       caps =
1295           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1296           "indeoversion", G_TYPE_INT, 3, NULL);
1297       break;
1298
1299     case AV_CODEC_ID_INDEO2:
1300       caps =
1301           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1302           "indeoversion", G_TYPE_INT, 2, NULL);
1303       break;
1304
1305     case AV_CODEC_ID_FLASHSV:
1306       caps =
1307           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1308           "video/x-flash-screen", NULL);
1309       break;
1310
1311     case AV_CODEC_ID_FLASHSV2:
1312       caps =
1313           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1314           "video/x-flash-screen2", NULL);
1315       break;
1316
1317     case AV_CODEC_ID_VP3:
1318       caps =
1319           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp3",
1320           NULL);
1321       break;
1322
1323     case AV_CODEC_ID_VP5:
1324       caps =
1325           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp5",
1326           NULL);
1327       break;
1328
1329     case AV_CODEC_ID_VP6:
1330       caps =
1331           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp6",
1332           NULL);
1333       break;
1334
1335     case AV_CODEC_ID_VP6F:
1336       caps =
1337           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1338           "video/x-vp6-flash", NULL);
1339       break;
1340
1341     case AV_CODEC_ID_VP6A:
1342       caps =
1343           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1344           "video/x-vp6-alpha", NULL);
1345       break;
1346
1347     case AV_CODEC_ID_VP8:
1348       caps =
1349           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp8",
1350           NULL);
1351       break;
1352
1353     case AV_CODEC_ID_VP9:
1354       caps =
1355           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp9",
1356           NULL);
1357       break;
1358
1359     case AV_CODEC_ID_THEORA:
1360       caps =
1361           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1362           "video/x-theora", NULL);
1363       break;
1364
1365     case AV_CODEC_ID_CFHD:
1366       caps =
1367           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1368           "video/x-cineform", NULL);
1369       break;
1370
1371     case AV_CODEC_ID_AAC:
1372     {
1373       caps =
1374           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1375           NULL);
1376
1377       if (!encode) {
1378         GValue arr = { 0, };
1379         GValue item = { 0, };
1380
1381         g_value_init (&arr, GST_TYPE_LIST);
1382         g_value_init (&item, G_TYPE_INT);
1383         g_value_set_int (&item, 2);
1384         gst_value_list_append_value (&arr, &item);
1385         g_value_set_int (&item, 4);
1386         gst_value_list_append_value (&arr, &item);
1387         g_value_unset (&item);
1388
1389         gst_caps_set_value (caps, "mpegversion", &arr);
1390         g_value_unset (&arr);
1391
1392         g_value_init (&arr, GST_TYPE_LIST);
1393         g_value_init (&item, G_TYPE_STRING);
1394         g_value_set_string (&item, "raw");
1395         gst_value_list_append_value (&arr, &item);
1396         g_value_set_string (&item, "adts");
1397         gst_value_list_append_value (&arr, &item);
1398         g_value_set_string (&item, "adif");
1399         gst_value_list_append_value (&arr, &item);
1400         g_value_unset (&item);
1401
1402         gst_caps_set_value (caps, "stream-format", &arr);
1403         g_value_unset (&arr);
1404       } else {
1405         gst_caps_set_simple (caps, "mpegversion", G_TYPE_INT, 4,
1406             "stream-format", G_TYPE_STRING, "raw",
1407             "base-profile", G_TYPE_STRING, "lc", NULL);
1408
1409         if (context && context->extradata_size > 0)
1410           gst_codec_utils_aac_caps_set_level_and_profile (caps,
1411               context->extradata, context->extradata_size);
1412       }
1413
1414       break;
1415     }
1416     case AV_CODEC_ID_AAC_LATM: /* LATM/LOAS AAC syntax */
1417       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1418           "mpegversion", G_TYPE_INT, 4, "stream-format", G_TYPE_STRING, "loas",
1419           NULL);
1420       break;
1421
1422     case AV_CODEC_ID_ASV1:
1423       caps =
1424           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1425           "asusversion", G_TYPE_INT, 1, NULL);
1426       break;
1427     case AV_CODEC_ID_ASV2:
1428       caps =
1429           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1430           "asusversion", G_TYPE_INT, 2, NULL);
1431       break;
1432
1433     case AV_CODEC_ID_FFV1:
1434       caps =
1435           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-ffv",
1436           "ffvversion", G_TYPE_INT, 1, NULL);
1437       break;
1438
1439     case AV_CODEC_ID_4XM:
1440       caps =
1441           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-4xm",
1442           NULL);
1443       break;
1444
1445     case AV_CODEC_ID_XAN_WC3:
1446     case AV_CODEC_ID_XAN_WC4:
1447       caps =
1448           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-xan",
1449           "wcversion", G_TYPE_INT, 3 - AV_CODEC_ID_XAN_WC3 + codec_id, NULL);
1450       break;
1451
1452     case AV_CODEC_ID_CLJR:
1453       caps =
1454           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1455           "video/x-cirrus-logic-accupak", NULL);
1456       break;
1457
1458     case AV_CODEC_ID_FRAPS:
1459       caps =
1460           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-fraps",
1461           NULL);
1462       break;
1463
1464     case AV_CODEC_ID_MDEC:
1465     case AV_CODEC_ID_ROQ:
1466     case AV_CODEC_ID_INTERPLAY_VIDEO:
1467       buildcaps = TRUE;
1468       break;
1469
1470     case AV_CODEC_ID_VCR1:
1471       caps =
1472           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1473           "video/x-ati-vcr", "vcrversion", G_TYPE_INT, 1, NULL);
1474       break;
1475
1476     case AV_CODEC_ID_RPZA:
1477       caps =
1478           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1479           "video/x-apple-video", NULL);
1480       break;
1481
1482     case AV_CODEC_ID_CINEPAK:
1483       caps =
1484           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1485           "video/x-cinepak", NULL);
1486       break;
1487
1488       /* WS_VQA belogns here (order) */
1489
1490     case AV_CODEC_ID_MSRLE:
1491       caps =
1492           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1493           "layout", G_TYPE_STRING, "microsoft", NULL);
1494       if (context) {
1495         gst_caps_set_simple (caps,
1496             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1497       } else {
1498         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1499       }
1500       break;
1501
1502     case AV_CODEC_ID_QTRLE:
1503       caps =
1504           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1505           "layout", G_TYPE_STRING, "quicktime", NULL);
1506       if (context) {
1507         gst_caps_set_simple (caps,
1508             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1509       } else {
1510         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1511       }
1512       break;
1513
1514     case AV_CODEC_ID_MSVIDEO1:
1515       caps =
1516           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1517           "video/x-msvideocodec", "msvideoversion", G_TYPE_INT, 1, NULL);
1518       break;
1519
1520     case AV_CODEC_ID_MSS1:
1521       caps =
1522           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1523           "wmvversion", G_TYPE_INT, 1, "format", G_TYPE_STRING, "MSS1", NULL);
1524       break;
1525
1526     case AV_CODEC_ID_MSS2:
1527       caps =
1528           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1529           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "MSS2", NULL);
1530       break;
1531
1532     case AV_CODEC_ID_WMV3:
1533       caps =
1534           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1535           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "WMV3", NULL);
1536       break;
1537     case AV_CODEC_ID_VC1:
1538       caps =
1539           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1540           "wmvversion", G_TYPE_INT, 3, NULL);
1541       if (!context && !encode) {
1542         GValue arr = { 0, };
1543         GValue item = { 0, };
1544
1545         g_value_init (&arr, GST_TYPE_LIST);
1546         g_value_init (&item, G_TYPE_STRING);
1547         g_value_set_string (&item, "WVC1");
1548         gst_value_list_append_value (&arr, &item);
1549         g_value_set_string (&item, "WMVA");
1550         gst_value_list_append_and_take_value (&arr, &item);
1551         gst_caps_set_value (caps, "format", &arr);
1552         g_value_unset (&arr);
1553       } else {
1554         gst_caps_set_simple (caps, "format", G_TYPE_STRING, "WVC1", NULL);
1555       }
1556       break;
1557     case AV_CODEC_ID_QDM2:
1558       caps =
1559           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-qdm2",
1560           NULL);
1561       break;
1562
1563     case AV_CODEC_ID_MSZH:
1564       caps =
1565           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mszh",
1566           NULL);
1567       break;
1568
1569     case AV_CODEC_ID_ZLIB:
1570       caps =
1571           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zlib",
1572           NULL);
1573       break;
1574
1575     case AV_CODEC_ID_TRUEMOTION1:
1576       caps =
1577           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1578           "video/x-truemotion", "trueversion", G_TYPE_INT, 1, NULL);
1579       break;
1580     case AV_CODEC_ID_TRUEMOTION2:
1581       caps =
1582           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1583           "video/x-truemotion", "trueversion", G_TYPE_INT, 2, NULL);
1584       break;
1585
1586     case AV_CODEC_ID_ULTI:
1587       caps =
1588           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1589           "video/x-ultimotion", NULL);
1590       break;
1591
1592     case AV_CODEC_ID_TSCC:
1593       caps =
1594           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1595           "video/x-camtasia", NULL);
1596       if (context) {
1597         gst_caps_set_simple (caps,
1598             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1599       } else {
1600         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1601       }
1602       break;
1603
1604     case AV_CODEC_ID_TSCC2:
1605       caps =
1606           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1607           "video/x-tscc", "tsccversion", G_TYPE_INT, 2, NULL);
1608       break;
1609
1610     case AV_CODEC_ID_KMVC:
1611       caps =
1612           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-kmvc",
1613           NULL);
1614       break;
1615
1616     case AV_CODEC_ID_NUV:
1617       caps =
1618           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-nuv",
1619           NULL);
1620       break;
1621
1622     case AV_CODEC_ID_GIF:
1623       caps =
1624           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1625           "image/gst-libav-gif", "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
1626       break;
1627
1628     case AV_CODEC_ID_PNG:
1629       caps =
1630           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/png",
1631           NULL);
1632       break;
1633
1634     case AV_CODEC_ID_PPM:
1635       caps =
1636           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/ppm",
1637           NULL);
1638       break;
1639
1640     case AV_CODEC_ID_PBM:
1641       caps =
1642           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/pbm",
1643           NULL);
1644       break;
1645
1646     case AV_CODEC_ID_PAM:
1647       caps =
1648           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1649           "image/x-portable-anymap", NULL);
1650       break;
1651
1652     case AV_CODEC_ID_PGM:
1653       caps =
1654           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1655           "image/x-portable-graymap", NULL);
1656       break;
1657
1658     case AV_CODEC_ID_PCX:
1659       caps =
1660           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-pcx",
1661           NULL);
1662       break;
1663
1664     case AV_CODEC_ID_SGI:
1665       caps =
1666           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-sgi",
1667           NULL);
1668       break;
1669
1670     case AV_CODEC_ID_TARGA:
1671       caps =
1672           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-tga",
1673           NULL);
1674       break;
1675
1676     case AV_CODEC_ID_TIFF:
1677       caps =
1678           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/tiff",
1679           NULL);
1680       break;
1681
1682     case AV_CODEC_ID_SUNRAST:
1683       caps =
1684           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1685           "image/x-sun-raster", NULL);
1686       break;
1687
1688     case AV_CODEC_ID_SMC:
1689       caps =
1690           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-smc",
1691           NULL);
1692       break;
1693
1694     case AV_CODEC_ID_QDRAW:
1695       caps =
1696           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-qdrw",
1697           NULL);
1698       break;
1699
1700     case AV_CODEC_ID_DNXHD:
1701       caps =
1702           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dnxhd",
1703           NULL);
1704       break;
1705
1706     case AV_CODEC_ID_PRORES:
1707       caps =
1708           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1709           "video/x-prores", NULL);
1710       if (context) {
1711         switch (context->codec_tag) {
1712           case GST_MAKE_FOURCC ('a', 'p', 'c', 'o'):
1713             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "proxy", NULL);
1714             break;
1715           case GST_MAKE_FOURCC ('a', 'p', 'c', 's'):
1716             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "lt", NULL);
1717             break;
1718           default:
1719           case GST_MAKE_FOURCC ('a', 'p', 'c', 'n'):
1720             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "standard",
1721                 NULL);
1722             break;
1723           case GST_MAKE_FOURCC ('a', 'p', 'c', 'h'):
1724             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "hq", NULL);
1725             break;
1726           case GST_MAKE_FOURCC ('a', 'p', '4', 'h'):
1727             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444", NULL);
1728             break;
1729           case GST_MAKE_FOURCC ('a', 'p', '4', 'x'):
1730             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444xq",
1731                 NULL);
1732             break;
1733         }
1734       }
1735       break;
1736
1737     case AV_CODEC_ID_MIMIC:
1738       caps =
1739           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mimic",
1740           NULL);
1741       break;
1742
1743     case AV_CODEC_ID_VMNC:
1744       caps =
1745           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vmnc",
1746           NULL);
1747       break;
1748
1749     case AV_CODEC_ID_TRUESPEECH:
1750       caps =
1751           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
1752           "audio/x-truespeech", NULL);
1753       break;
1754
1755     case AV_CODEC_ID_QCELP:
1756       caps =
1757           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/qcelp",
1758           NULL);
1759       break;
1760
1761     case AV_CODEC_ID_AMV:
1762       caps =
1763           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-amv",
1764           NULL);
1765       break;
1766
1767     case AV_CODEC_ID_AASC:
1768       caps =
1769           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-aasc",
1770           NULL);
1771       break;
1772
1773     case AV_CODEC_ID_LOCO:
1774       caps =
1775           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-loco",
1776           NULL);
1777       break;
1778
1779     case AV_CODEC_ID_ZMBV:
1780       caps =
1781           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zmbv",
1782           NULL);
1783       break;
1784
1785     case AV_CODEC_ID_LAGARITH:
1786       caps =
1787           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1788           "video/x-lagarith", NULL);
1789       break;
1790
1791     case AV_CODEC_ID_CSCD:
1792       caps =
1793           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1794           "video/x-camstudio", NULL);
1795       if (context) {
1796         gst_caps_set_simple (caps,
1797             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1798       } else {
1799         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1800       }
1801       break;
1802
1803     case AV_CODEC_ID_AIC:
1804       caps =
1805           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1806           "video/x-apple-intermediate-codec", NULL);
1807       break;
1808
1809     case AV_CODEC_ID_CAVS:
1810       caps =
1811           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1812           "video/x-cavs", NULL);
1813       break;
1814
1815     case AV_CODEC_ID_WS_VQA:
1816     case AV_CODEC_ID_IDCIN:
1817     case AV_CODEC_ID_8BPS:
1818     case AV_CODEC_ID_FLIC:
1819     case AV_CODEC_ID_VMDVIDEO:
1820     case AV_CODEC_ID_VMDAUDIO:
1821     case AV_CODEC_ID_VIXL:
1822     case AV_CODEC_ID_QPEG:
1823     case AV_CODEC_ID_PGMYUV:
1824     case AV_CODEC_ID_FFVHUFF:
1825     case AV_CODEC_ID_WNV1:
1826     case AV_CODEC_ID_MP3ADU:
1827     case AV_CODEC_ID_MP3ON4:
1828     case AV_CODEC_ID_WESTWOOD_SND1:
1829     case AV_CODEC_ID_MMVIDEO:
1830     case AV_CODEC_ID_AVS:
1831       buildcaps = TRUE;
1832       break;
1833
1834       /* weird quasi-codecs for the demuxers only */
1835     case AV_CODEC_ID_PCM_S16LE:
1836     case AV_CODEC_ID_PCM_S16BE:
1837     case AV_CODEC_ID_PCM_U16LE:
1838     case AV_CODEC_ID_PCM_U16BE:
1839     case AV_CODEC_ID_PCM_S8:
1840     case AV_CODEC_ID_PCM_U8:
1841     {
1842       GstAudioFormat format;
1843
1844       switch (codec_id) {
1845         case AV_CODEC_ID_PCM_S16LE:
1846           format = GST_AUDIO_FORMAT_S16LE;
1847           break;
1848         case AV_CODEC_ID_PCM_S16BE:
1849           format = GST_AUDIO_FORMAT_S16BE;
1850           break;
1851         case AV_CODEC_ID_PCM_U16LE:
1852           format = GST_AUDIO_FORMAT_U16LE;
1853           break;
1854         case AV_CODEC_ID_PCM_U16BE:
1855           format = GST_AUDIO_FORMAT_U16BE;
1856           break;
1857         case AV_CODEC_ID_PCM_S8:
1858           format = GST_AUDIO_FORMAT_S8;
1859           break;
1860         case AV_CODEC_ID_PCM_U8:
1861           format = GST_AUDIO_FORMAT_U8;
1862           break;
1863         default:
1864           format = 0;
1865           g_assert (0);         /* don't worry, we never get here */
1866           break;
1867       }
1868
1869       caps =
1870           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-raw",
1871           "format", G_TYPE_STRING, gst_audio_format_to_string (format),
1872           "layout", G_TYPE_STRING, "interleaved", NULL);
1873     }
1874       break;
1875
1876     case AV_CODEC_ID_PCM_MULAW:
1877       caps =
1878           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mulaw",
1879           NULL);
1880       break;
1881
1882     case AV_CODEC_ID_PCM_ALAW:
1883       caps =
1884           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alaw",
1885           NULL);
1886       break;
1887
1888     case AV_CODEC_ID_ADPCM_G722:
1889       caps =
1890           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G722",
1891           NULL);
1892       if (context)
1893         gst_caps_set_simple (caps,
1894             "block_align", G_TYPE_INT, context->block_align,
1895             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1896       break;
1897
1898     case AV_CODEC_ID_ADPCM_G726:
1899     {
1900       /* the G726 decoder can also handle G721 */
1901       caps =
1902           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1903           "layout", G_TYPE_STRING, "g726", NULL);
1904       if (context)
1905         gst_caps_set_simple (caps,
1906             "block_align", G_TYPE_INT, context->block_align,
1907             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1908
1909       if (!encode) {
1910         gst_caps_append (caps, gst_caps_new_simple ("audio/x-adpcm",
1911                 "layout", G_TYPE_STRING, "g721",
1912                 "channels", G_TYPE_INT, 1, "rate", G_TYPE_INT, 8000, NULL));
1913       }
1914       break;
1915     }
1916     case AV_CODEC_ID_ADPCM_IMA_QT:
1917     case AV_CODEC_ID_ADPCM_IMA_WAV:
1918     case AV_CODEC_ID_ADPCM_IMA_DK3:
1919     case AV_CODEC_ID_ADPCM_IMA_DK4:
1920     case AV_CODEC_ID_ADPCM_IMA_WS:
1921     case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1922     case AV_CODEC_ID_ADPCM_IMA_AMV:
1923     case AV_CODEC_ID_ADPCM_IMA_ISS:
1924     case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1925     case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1926     case AV_CODEC_ID_ADPCM_MS:
1927     case AV_CODEC_ID_ADPCM_4XM:
1928     case AV_CODEC_ID_ADPCM_XA:
1929     case AV_CODEC_ID_ADPCM_ADX:
1930     case AV_CODEC_ID_ADPCM_EA:
1931     case AV_CODEC_ID_ADPCM_CT:
1932     case AV_CODEC_ID_ADPCM_SWF:
1933     case AV_CODEC_ID_ADPCM_YAMAHA:
1934     case AV_CODEC_ID_ADPCM_SBPRO_2:
1935     case AV_CODEC_ID_ADPCM_SBPRO_3:
1936     case AV_CODEC_ID_ADPCM_SBPRO_4:
1937     case AV_CODEC_ID_ADPCM_EA_R1:
1938     case AV_CODEC_ID_ADPCM_EA_R2:
1939     case AV_CODEC_ID_ADPCM_EA_R3:
1940     case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
1941     case AV_CODEC_ID_ADPCM_EA_XAS:
1942     case AV_CODEC_ID_ADPCM_THP:
1943     {
1944       const gchar *layout = NULL;
1945
1946       switch (codec_id) {
1947         case AV_CODEC_ID_ADPCM_IMA_QT:
1948           layout = "quicktime";
1949           break;
1950         case AV_CODEC_ID_ADPCM_IMA_WAV:
1951           layout = "dvi";
1952           break;
1953         case AV_CODEC_ID_ADPCM_IMA_DK3:
1954           layout = "dk3";
1955           break;
1956         case AV_CODEC_ID_ADPCM_IMA_DK4:
1957           layout = "dk4";
1958           break;
1959         case AV_CODEC_ID_ADPCM_IMA_WS:
1960           layout = "westwood";
1961           break;
1962         case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
1963           layout = "smjpeg";
1964           break;
1965         case AV_CODEC_ID_ADPCM_IMA_AMV:
1966           layout = "amv";
1967           break;
1968         case AV_CODEC_ID_ADPCM_IMA_ISS:
1969           layout = "iss";
1970           break;
1971         case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
1972           layout = "ea-eacs";
1973           break;
1974         case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
1975           layout = "ea-sead";
1976           break;
1977         case AV_CODEC_ID_ADPCM_MS:
1978           layout = "microsoft";
1979           break;
1980         case AV_CODEC_ID_ADPCM_4XM:
1981           layout = "4xm";
1982           break;
1983         case AV_CODEC_ID_ADPCM_XA:
1984           layout = "xa";
1985           break;
1986         case AV_CODEC_ID_ADPCM_ADX:
1987           layout = "adx";
1988           break;
1989         case AV_CODEC_ID_ADPCM_EA:
1990           layout = "ea";
1991           break;
1992         case AV_CODEC_ID_ADPCM_CT:
1993           layout = "ct";
1994           break;
1995         case AV_CODEC_ID_ADPCM_SWF:
1996           layout = "swf";
1997           break;
1998         case AV_CODEC_ID_ADPCM_YAMAHA:
1999           layout = "yamaha";
2000           break;
2001         case AV_CODEC_ID_ADPCM_SBPRO_2:
2002           layout = "sbpro2";
2003           break;
2004         case AV_CODEC_ID_ADPCM_SBPRO_3:
2005           layout = "sbpro3";
2006           break;
2007         case AV_CODEC_ID_ADPCM_SBPRO_4:
2008           layout = "sbpro4";
2009           break;
2010         case AV_CODEC_ID_ADPCM_EA_R1:
2011           layout = "ea-r1";
2012           break;
2013         case AV_CODEC_ID_ADPCM_EA_R2:
2014           layout = "ea-r3";
2015           break;
2016         case AV_CODEC_ID_ADPCM_EA_R3:
2017           layout = "ea-r3";
2018           break;
2019         case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
2020           layout = "ea-maxis-xa";
2021           break;
2022         case AV_CODEC_ID_ADPCM_EA_XAS:
2023           layout = "ea-xas";
2024           break;
2025         case AV_CODEC_ID_ADPCM_THP:
2026           layout = "thp";
2027           break;
2028         default:
2029           g_assert (0);         /* don't worry, we never get here */
2030           break;
2031       }
2032
2033       /* FIXME: someone please check whether we need additional properties
2034        * in this caps definition. */
2035       caps =
2036           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
2037           "layout", G_TYPE_STRING, layout, NULL);
2038       if (context)
2039         gst_caps_set_simple (caps,
2040             "block_align", G_TYPE_INT, context->block_align,
2041             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2042     }
2043       break;
2044
2045     case AV_CODEC_ID_AMR_NB:
2046       caps =
2047           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR",
2048           NULL);
2049       break;
2050
2051     case AV_CODEC_ID_AMR_WB:
2052       caps =
2053           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR-WB",
2054           NULL);
2055       break;
2056
2057     case AV_CODEC_ID_GSM:
2058       caps =
2059           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-gsm",
2060           NULL);
2061       break;
2062
2063     case AV_CODEC_ID_GSM_MS:
2064       caps =
2065           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/ms-gsm",
2066           NULL);
2067       break;
2068
2069     case AV_CODEC_ID_NELLYMOSER:
2070       caps =
2071           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2072           "audio/x-nellymoser", NULL);
2073       break;
2074
2075     case AV_CODEC_ID_SIPR:
2076     {
2077       caps =
2078           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-sipro",
2079           NULL);
2080       if (context) {
2081         gst_caps_set_simple (caps,
2082             "leaf_size", G_TYPE_INT, context->block_align,
2083             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2084       }
2085     }
2086       break;
2087
2088     case AV_CODEC_ID_RA_144:
2089     case AV_CODEC_ID_RA_288:
2090     case AV_CODEC_ID_COOK:
2091     {
2092       gint version = 0;
2093
2094       switch (codec_id) {
2095         case AV_CODEC_ID_RA_144:
2096           version = 1;
2097           break;
2098         case AV_CODEC_ID_RA_288:
2099           version = 2;
2100           break;
2101         case AV_CODEC_ID_COOK:
2102           version = 8;
2103           break;
2104         default:
2105           break;
2106       }
2107
2108       /* FIXME: properties? */
2109       caps =
2110           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2111           "audio/x-pn-realaudio", "raversion", G_TYPE_INT, version, NULL);
2112       if (context) {
2113         gst_caps_set_simple (caps,
2114             "leaf_size", G_TYPE_INT, context->block_align,
2115             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2116       }
2117     }
2118       break;
2119
2120     case AV_CODEC_ID_ROQ_DPCM:
2121     case AV_CODEC_ID_INTERPLAY_DPCM:
2122     case AV_CODEC_ID_XAN_DPCM:
2123     case AV_CODEC_ID_SOL_DPCM:
2124     {
2125       const gchar *layout = NULL;
2126
2127       switch (codec_id) {
2128         case AV_CODEC_ID_ROQ_DPCM:
2129           layout = "roq";
2130           break;
2131         case AV_CODEC_ID_INTERPLAY_DPCM:
2132           layout = "interplay";
2133           break;
2134         case AV_CODEC_ID_XAN_DPCM:
2135           layout = "xan";
2136           break;
2137         case AV_CODEC_ID_SOL_DPCM:
2138           layout = "sol";
2139           break;
2140         default:
2141           g_assert (0);         /* don't worry, we never get here */
2142           break;
2143       }
2144
2145       /* FIXME: someone please check whether we need additional properties
2146        * in this caps definition. */
2147       caps =
2148           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dpcm",
2149           "layout", G_TYPE_STRING, layout, NULL);
2150       if (context)
2151         gst_caps_set_simple (caps,
2152             "block_align", G_TYPE_INT, context->block_align,
2153             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2154     }
2155       break;
2156
2157     case AV_CODEC_ID_SHORTEN:
2158       caps = gst_caps_new_empty_simple ("audio/x-shorten");
2159       break;
2160
2161     case AV_CODEC_ID_ALAC:
2162       caps =
2163           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alac",
2164           NULL);
2165       if (context) {
2166         gst_caps_set_simple (caps,
2167             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2168       }
2169       break;
2170
2171     case AV_CODEC_ID_FLAC:
2172       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2173        * encoder case, we want to add things like samplerate, channels... */
2174       if (!encode) {
2175         caps = gst_caps_new_empty_simple ("audio/x-flac");
2176       }
2177       break;
2178
2179     case AV_CODEC_ID_OPUS:
2180       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2181        * encoder case, we want to add things like samplerate, channels... */
2182       if (!encode) {
2183         /* FIXME: can ffmpeg handle multichannel Opus? */
2184         caps = gst_caps_new_simple ("audio/x-opus",
2185             "channel-mapping-family", G_TYPE_INT, 0, NULL);
2186       }
2187       break;
2188
2189     case AV_CODEC_ID_S302M:
2190       caps = gst_caps_new_empty_simple ("audio/x-smpte-302m");
2191       break;
2192
2193     case AV_CODEC_ID_DVD_SUBTITLE:
2194     case AV_CODEC_ID_DVB_SUBTITLE:
2195       caps = NULL;
2196       break;
2197     case AV_CODEC_ID_BMP:
2198       caps = gst_caps_new_empty_simple ("image/bmp");
2199       break;
2200     case AV_CODEC_ID_TTA:
2201       caps =
2202           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-tta",
2203           NULL);
2204       if (context) {
2205         gst_caps_set_simple (caps,
2206             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2207       }
2208       break;
2209     case AV_CODEC_ID_TWINVQ:
2210       caps =
2211           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2212           "audio/x-twin-vq", NULL);
2213       break;
2214     case AV_CODEC_ID_G729:
2215       caps =
2216           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G729",
2217           NULL);
2218       break;
2219     case AV_CODEC_ID_DSD_LSBF:
2220       caps =
2221           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2222           NULL);
2223       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2224           TRUE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2225       break;
2226     case AV_CODEC_ID_DSD_MSBF:
2227       caps =
2228           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2229           NULL);
2230       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2231           FALSE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2232       break;
2233     case AV_CODEC_ID_DSD_LSBF_PLANAR:
2234       caps =
2235           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2236           NULL);
2237       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2238           TRUE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2239       break;
2240     case AV_CODEC_ID_DSD_MSBF_PLANAR:
2241       caps =
2242           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2243           NULL);
2244       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2245           FALSE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2246       break;
2247     default:
2248       GST_DEBUG ("Unknown codec ID %d, please add mapping here", codec_id);
2249       break;
2250   }
2251
2252   if (buildcaps) {
2253     AVCodec *codec;
2254
2255     if ((codec = avcodec_find_decoder (codec_id)) ||
2256         (codec = avcodec_find_encoder (codec_id))) {
2257       gchar *mime = NULL;
2258
2259       GST_LOG ("Could not create stream format caps for %s", codec->name);
2260
2261       switch (codec->type) {
2262         case AVMEDIA_TYPE_VIDEO:
2263           mime = g_strdup_printf ("video/x-gst-av-%s", codec->name);
2264           caps =
2265               gst_ff_vid_caps_new (context, NULL, codec_id, encode, mime, NULL);
2266           g_free (mime);
2267           break;
2268         case AVMEDIA_TYPE_AUDIO:
2269           mime = g_strdup_printf ("audio/x-gst-av-%s", codec->name);
2270           caps =
2271               gst_ff_aud_caps_new (context, NULL, codec_id, encode, mime, NULL);
2272           if (context)
2273             gst_caps_set_simple (caps,
2274                 "block_align", G_TYPE_INT, context->block_align,
2275                 "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2276           g_free (mime);
2277           break;
2278         default:
2279           break;
2280       }
2281     }
2282   }
2283
2284   if (caps != NULL) {
2285
2286     /* set private data */
2287     if (context && context->extradata_size > 0) {
2288       GstBuffer *data = gst_buffer_new_and_alloc (context->extradata_size);
2289
2290       gst_buffer_fill (data, 0, context->extradata, context->extradata_size);
2291       gst_caps_set_simple (caps, "codec_data", GST_TYPE_BUFFER, data, NULL);
2292       gst_buffer_unref (data);
2293     }
2294
2295     GST_LOG ("caps for codec_id=%d: %" GST_PTR_FORMAT, codec_id, caps);
2296
2297   } else {
2298     GST_LOG ("No caps found for codec_id=%d", codec_id);
2299   }
2300
2301   return caps;
2302 }
2303
2304 /* Convert a FFMPEG Pixel Format and optional AVCodecContext
2305  * to a GstCaps. If the context is ommitted, no fixed values
2306  * for video/audio size will be included in the GstCaps
2307  *
2308  * See below for usefullness
2309  */
2310
2311 static GstCaps *
2312 gst_ffmpeg_pixfmt_to_caps (enum AVPixelFormat pix_fmt, AVCodecContext * context,
2313     enum AVCodecID codec_id)
2314 {
2315   GstCaps *caps = NULL;
2316   GstVideoFormat format;
2317
2318   format = gst_ffmpeg_pixfmt_to_videoformat (pix_fmt);
2319
2320   if (format != GST_VIDEO_FORMAT_UNKNOWN) {
2321     caps = gst_ff_vid_caps_new (context, NULL, codec_id, TRUE, "video/x-raw",
2322         "format", G_TYPE_STRING, gst_video_format_to_string (format), NULL);
2323   }
2324
2325   if (caps != NULL) {
2326     GST_DEBUG ("caps for pix_fmt=%d: %" GST_PTR_FORMAT, pix_fmt, caps);
2327   } else {
2328     GST_LOG ("No caps found for pix_fmt=%d", pix_fmt);
2329   }
2330
2331   return caps;
2332 }
2333
2334 GstAudioFormat
2335 gst_ffmpeg_smpfmt_to_audioformat (enum AVSampleFormat sample_fmt)
2336 {
2337   switch (sample_fmt) {
2338     case AV_SAMPLE_FMT_U8:
2339     case AV_SAMPLE_FMT_U8P:
2340       return GST_AUDIO_FORMAT_U8;
2341       break;
2342     case AV_SAMPLE_FMT_S16:
2343     case AV_SAMPLE_FMT_S16P:
2344       return GST_AUDIO_FORMAT_S16;
2345       break;
2346     case AV_SAMPLE_FMT_S32:
2347     case AV_SAMPLE_FMT_S32P:
2348       return GST_AUDIO_FORMAT_S32;
2349       break;
2350     case AV_SAMPLE_FMT_FLT:
2351     case AV_SAMPLE_FMT_FLTP:
2352       return GST_AUDIO_FORMAT_F32;
2353       break;
2354     case AV_SAMPLE_FMT_DBL:
2355     case AV_SAMPLE_FMT_DBLP:
2356       return GST_AUDIO_FORMAT_F64;
2357       break;
2358     default:
2359       /* .. */
2360       return GST_AUDIO_FORMAT_UNKNOWN;
2361       break;
2362   }
2363 }
2364
2365 /* Convert a FFMPEG Sample Format and optional AVCodecContext
2366  * to a GstCaps. If the context is ommitted, no fixed values
2367  * for video/audio size will be included in the GstCaps
2368  *
2369  * See below for usefullness
2370  */
2371
2372 static GstCaps *
2373 gst_ffmpeg_smpfmt_to_caps (enum AVSampleFormat sample_fmt,
2374     AVCodecContext * context, AVCodec * codec, enum AVCodecID codec_id)
2375 {
2376   GstCaps *caps = NULL;
2377   GstAudioFormat format;
2378
2379   format = gst_ffmpeg_smpfmt_to_audioformat (sample_fmt);
2380
2381   if (format != GST_AUDIO_FORMAT_UNKNOWN) {
2382     caps = gst_ff_aud_caps_new (context, codec, codec_id, TRUE, "audio/x-raw",
2383         "format", G_TYPE_STRING, gst_audio_format_to_string (format),
2384         "layout", G_TYPE_STRING, "interleaved", NULL);
2385     GST_LOG ("caps for sample_fmt=%d: %" GST_PTR_FORMAT, sample_fmt, caps);
2386   } else {
2387     GST_LOG ("No caps found for sample_fmt=%d", sample_fmt);
2388   }
2389
2390   return caps;
2391 }
2392
2393 static gboolean
2394 caps_has_field (GstCaps * caps, const gchar * field)
2395 {
2396   guint i, n;
2397
2398   n = gst_caps_get_size (caps);
2399   for (i = 0; i < n; i++) {
2400     GstStructure *s = gst_caps_get_structure (caps, i);
2401
2402     if (gst_structure_has_field (s, field))
2403       return TRUE;
2404   }
2405
2406   return FALSE;
2407 }
2408
2409 GstCaps *
2410 gst_ffmpeg_codectype_to_audio_caps (AVCodecContext * context,
2411     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2412 {
2413   GstCaps *caps = NULL;
2414
2415   GST_DEBUG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2416       context, codec_id, encode, codec);
2417   if (codec)
2418     GST_DEBUG ("sample_fmts:%p, samplerates:%p",
2419         codec->sample_fmts, codec->supported_samplerates);
2420
2421   if (context) {
2422     /* Specific codec context */
2423     caps =
2424         gst_ffmpeg_smpfmt_to_caps (context->sample_fmt, context, codec,
2425         codec_id);
2426   } else {
2427     caps = gst_ff_aud_caps_new (context, codec, codec_id, encode, "audio/x-raw",
2428         "layout", G_TYPE_STRING, "interleaved", NULL);
2429     if (!caps_has_field (caps, "format"))
2430       gst_ffmpeg_audio_set_sample_fmts (caps,
2431           codec ? codec->sample_fmts : NULL);
2432   }
2433
2434   return caps;
2435 }
2436
2437 GstCaps *
2438 gst_ffmpeg_codectype_to_video_caps (AVCodecContext * context,
2439     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2440 {
2441   GstCaps *caps;
2442
2443   GST_LOG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2444       context, codec_id, encode, codec);
2445
2446   if (context) {
2447     caps = gst_ffmpeg_pixfmt_to_caps (context->pix_fmt, context, codec_id);
2448   } else {
2449     caps =
2450         gst_ff_vid_caps_new (context, codec, codec_id, encode, "video/x-raw",
2451         NULL);
2452     if (!caps_has_field (caps, "format"))
2453       gst_ffmpeg_video_set_pix_fmts (caps, codec ? codec->pix_fmts : NULL);
2454   }
2455   return caps;
2456 }
2457
2458 /* Convert a GstCaps (audio/raw) to a FFMPEG SampleFmt
2459  * and other audio properties in a AVCodecContext.
2460  *
2461  * For usefullness, see below
2462  */
2463
2464 static void
2465 gst_ffmpeg_caps_to_smpfmt (const GstCaps * caps,
2466     AVCodecContext * context, gboolean raw)
2467 {
2468   GstStructure *structure;
2469   const gchar *fmt;
2470   GstAudioFormat format = GST_AUDIO_FORMAT_UNKNOWN;
2471   gint bitrate;
2472
2473   g_return_if_fail (gst_caps_get_size (caps) == 1);
2474
2475   structure = gst_caps_get_structure (caps, 0);
2476
2477   gst_structure_get_int (structure, "channels", &context->channels);
2478   gst_structure_get_int (structure, "rate", &context->sample_rate);
2479   gst_structure_get_int (structure, "block_align", &context->block_align);
2480   if (gst_structure_get_int (structure, "bitrate", &bitrate))
2481     context->bit_rate = bitrate;
2482
2483   if (!raw)
2484     return;
2485
2486   if (gst_structure_has_name (structure, "audio/x-raw")) {
2487     if ((fmt = gst_structure_get_string (structure, "format"))) {
2488       format = gst_audio_format_from_string (fmt);
2489     }
2490   }
2491
2492   switch (format) {
2493     case GST_AUDIO_FORMAT_F32:
2494       context->sample_fmt = AV_SAMPLE_FMT_FLT;
2495       break;
2496     case GST_AUDIO_FORMAT_F64:
2497       context->sample_fmt = AV_SAMPLE_FMT_DBL;
2498       break;
2499     case GST_AUDIO_FORMAT_S32:
2500       context->sample_fmt = AV_SAMPLE_FMT_S32;
2501       break;
2502     case GST_AUDIO_FORMAT_S16:
2503       context->sample_fmt = AV_SAMPLE_FMT_S16;
2504       break;
2505     default:
2506       break;
2507   }
2508 }
2509
2510 /* Convert a GstCaps (video/raw) to a FFMPEG PixFmt
2511  * and other video properties in a AVCodecContext.
2512  *
2513  * For usefullness, see below
2514  */
2515
2516 static void
2517 gst_ffmpeg_caps_to_pixfmt (const GstCaps * caps,
2518     AVCodecContext * context, gboolean raw)
2519 {
2520   GstStructure *structure;
2521   const GValue *fps;
2522   const GValue *par = NULL;
2523   const gchar *fmt;
2524   GstVideoFormat format = GST_VIDEO_FORMAT_UNKNOWN;
2525   const gchar *s;
2526
2527   GST_DEBUG ("converting caps %" GST_PTR_FORMAT, caps);
2528   g_return_if_fail (gst_caps_get_size (caps) == 1);
2529   structure = gst_caps_get_structure (caps, 0);
2530
2531   gst_structure_get_int (structure, "width", &context->width);
2532   gst_structure_get_int (structure, "height", &context->height);
2533   gst_structure_get_int (structure, "bpp", &context->bits_per_coded_sample);
2534
2535   fps = gst_structure_get_value (structure, "framerate");
2536   if (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps)) {
2537
2538     int num = gst_value_get_fraction_numerator (fps);
2539     int den = gst_value_get_fraction_denominator (fps);
2540
2541     if (num > 0 && den > 0) {
2542       /* somehow these seem mixed up.. */
2543       /* they're fine, this is because it does period=1/frequency */
2544       context->time_base.den = gst_value_get_fraction_numerator (fps);
2545       context->time_base.num = gst_value_get_fraction_denominator (fps);
2546       context->ticks_per_frame = 1;
2547
2548       GST_DEBUG ("setting framerate %d/%d = %lf",
2549           context->time_base.den, context->time_base.num,
2550           1. * context->time_base.den / context->time_base.num);
2551     } else {
2552       GST_INFO ("ignoring framerate %d/%d (probably variable framerate)",
2553           context->time_base.num, context->time_base.den);
2554     }
2555   }
2556
2557   par = gst_structure_get_value (structure, "pixel-aspect-ratio");
2558   if (par && GST_VALUE_HOLDS_FRACTION (par)) {
2559
2560     int num = gst_value_get_fraction_numerator (par);
2561     int den = gst_value_get_fraction_denominator (par);
2562
2563     if (num > 0 && den > 0) {
2564       context->sample_aspect_ratio.num = num;
2565       context->sample_aspect_ratio.den = den;
2566
2567       GST_DEBUG ("setting pixel-aspect-ratio %d/%d = %lf",
2568           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den,
2569           1. * context->sample_aspect_ratio.num /
2570           context->sample_aspect_ratio.den);
2571     } else {
2572       GST_WARNING ("ignoring insane pixel-aspect-ratio %d/%d",
2573           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den);
2574     }
2575   }
2576
2577   if (!raw)
2578     return;
2579
2580   g_return_if_fail (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps));
2581
2582   if (gst_structure_has_name (structure, "video/x-raw")) {
2583     if ((fmt = gst_structure_get_string (structure, "format"))) {
2584       format = gst_video_format_from_string (fmt);
2585     }
2586   }
2587
2588   switch (format) {
2589     case GST_VIDEO_FORMAT_YUY2:
2590       context->pix_fmt = AV_PIX_FMT_YUYV422;
2591       break;
2592     case GST_VIDEO_FORMAT_I420:
2593       context->pix_fmt = AV_PIX_FMT_YUV420P;
2594       break;
2595     case GST_VIDEO_FORMAT_A420:
2596       context->pix_fmt = AV_PIX_FMT_YUVA420P;
2597       break;
2598     case GST_VIDEO_FORMAT_Y41B:
2599       context->pix_fmt = AV_PIX_FMT_YUV411P;
2600       break;
2601     case GST_VIDEO_FORMAT_Y42B:
2602       context->pix_fmt = AV_PIX_FMT_YUV422P;
2603       break;
2604     case GST_VIDEO_FORMAT_YUV9:
2605       context->pix_fmt = AV_PIX_FMT_YUV410P;
2606       break;
2607     case GST_VIDEO_FORMAT_Y444:
2608       context->pix_fmt = AV_PIX_FMT_YUV444P;
2609       break;
2610     case GST_VIDEO_FORMAT_GRAY8:
2611       context->pix_fmt = AV_PIX_FMT_GRAY8;
2612       break;
2613     case GST_VIDEO_FORMAT_xRGB:
2614 #if (G_BYTE_ORDER == G_BIG_ENDIAN)
2615       context->pix_fmt = AV_PIX_FMT_RGB32;
2616 #endif
2617       break;
2618     case GST_VIDEO_FORMAT_BGRx:
2619 #if (G_BYTE_ORDER == G_LITTLE_ENDIAN)
2620       context->pix_fmt = AV_PIX_FMT_RGB32;
2621 #endif
2622       break;
2623     case GST_VIDEO_FORMAT_RGB:
2624       context->pix_fmt = AV_PIX_FMT_RGB24;
2625       break;
2626     case GST_VIDEO_FORMAT_BGR:
2627       context->pix_fmt = AV_PIX_FMT_BGR24;
2628       break;
2629     case GST_VIDEO_FORMAT_RGB16:
2630       context->pix_fmt = AV_PIX_FMT_RGB565;
2631       break;
2632     case GST_VIDEO_FORMAT_RGB15:
2633       context->pix_fmt = AV_PIX_FMT_RGB555;
2634       break;
2635     case GST_VIDEO_FORMAT_RGB8P:
2636       context->pix_fmt = AV_PIX_FMT_PAL8;
2637       break;
2638     default:
2639       break;
2640   }
2641
2642   s = gst_structure_get_string (structure, "interlace-mode");
2643   if (s) {
2644     if (strcmp (s, "progressive") == 0) {
2645       context->field_order = AV_FIELD_PROGRESSIVE;
2646     } else if (strcmp (s, "interleaved") == 0) {
2647       s = gst_structure_get_string (structure, "field-order");
2648       if (s) {
2649         if (strcmp (s, "top-field-first") == 0) {
2650           context->field_order = AV_FIELD_TT;
2651         } else if (strcmp (s, "bottom-field-first") == 0) {
2652           context->field_order = AV_FIELD_TB;
2653         }
2654       }
2655     }
2656   }
2657 }
2658
2659 typedef struct
2660 {
2661   GstVideoFormat format;
2662   enum AVPixelFormat pixfmt;
2663 } PixToFmt;
2664
2665 /* FIXME : FILLME */
2666 static const PixToFmt pixtofmttable[] = {
2667   /* GST_VIDEO_FORMAT_I420, */
2668   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUV420P},
2669   /* Note : this should use a different chroma placement */
2670   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUVJ420P},
2671
2672   /* GST_VIDEO_FORMAT_YV12, */
2673   /* GST_VIDEO_FORMAT_YUY2, */
2674   {GST_VIDEO_FORMAT_YUY2, AV_PIX_FMT_YUYV422},
2675   /* GST_VIDEO_FORMAT_UYVY, */
2676   {GST_VIDEO_FORMAT_UYVY, AV_PIX_FMT_UYVY422},
2677   /* GST_VIDEO_FORMAT_AYUV, */
2678   /* GST_VIDEO_FORMAT_RGBx, */
2679   {GST_VIDEO_FORMAT_RGBx, AV_PIX_FMT_RGB0},
2680   /* GST_VIDEO_FORMAT_BGRx, */
2681   {GST_VIDEO_FORMAT_BGRx, AV_PIX_FMT_BGR0},
2682   /* GST_VIDEO_FORMAT_xRGB, */
2683   {GST_VIDEO_FORMAT_xRGB, AV_PIX_FMT_0RGB},
2684   /* GST_VIDEO_FORMAT_xBGR, */
2685   {GST_VIDEO_FORMAT_xBGR, AV_PIX_FMT_0BGR},
2686   /* GST_VIDEO_FORMAT_RGBA, */
2687   {GST_VIDEO_FORMAT_RGBA, AV_PIX_FMT_RGBA},
2688   /* GST_VIDEO_FORMAT_BGRA, */
2689   {GST_VIDEO_FORMAT_BGRA, AV_PIX_FMT_BGRA},
2690   /* GST_VIDEO_FORMAT_ARGB, */
2691   {GST_VIDEO_FORMAT_ARGB, AV_PIX_FMT_ARGB},
2692   /* GST_VIDEO_FORMAT_ABGR, */
2693   {GST_VIDEO_FORMAT_ABGR, AV_PIX_FMT_ABGR},
2694   /* GST_VIDEO_FORMAT_RGB, */
2695   {GST_VIDEO_FORMAT_RGB, AV_PIX_FMT_RGB24},
2696   /* GST_VIDEO_FORMAT_BGR, */
2697   {GST_VIDEO_FORMAT_BGR, AV_PIX_FMT_BGR24},
2698   /* GST_VIDEO_FORMAT_Y41B, */
2699   {GST_VIDEO_FORMAT_Y41B, AV_PIX_FMT_YUV411P},
2700   /* GST_VIDEO_FORMAT_Y42B, */
2701   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUV422P},
2702   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUVJ422P},
2703   /* GST_VIDEO_FORMAT_YVYU, */
2704   /* GST_VIDEO_FORMAT_Y444, */
2705   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUV444P},
2706   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUVJ444P},
2707   /* GST_VIDEO_FORMAT_v210, */
2708   /* GST_VIDEO_FORMAT_v216, */
2709   /* GST_VIDEO_FORMAT_NV12, */
2710   {GST_VIDEO_FORMAT_NV12, AV_PIX_FMT_NV12},
2711   /* GST_VIDEO_FORMAT_NV21, */
2712   {GST_VIDEO_FORMAT_NV21, AV_PIX_FMT_NV21},
2713   /* GST_VIDEO_FORMAT_GRAY8, */
2714   {GST_VIDEO_FORMAT_GRAY8, AV_PIX_FMT_GRAY8},
2715   /* GST_VIDEO_FORMAT_GRAY16_BE, */
2716   {GST_VIDEO_FORMAT_GRAY16_BE, AV_PIX_FMT_GRAY16BE},
2717   /* GST_VIDEO_FORMAT_GRAY16_LE, */
2718   {GST_VIDEO_FORMAT_GRAY16_LE, AV_PIX_FMT_GRAY16LE},
2719   /* GST_VIDEO_FORMAT_v308, */
2720   /* GST_VIDEO_FORMAT_Y800, */
2721   /* GST_VIDEO_FORMAT_Y16, */
2722   /* GST_VIDEO_FORMAT_RGB16, */
2723   {GST_VIDEO_FORMAT_RGB16, AV_PIX_FMT_RGB565},
2724   /* GST_VIDEO_FORMAT_BGR16, */
2725   /* GST_VIDEO_FORMAT_RGB15, */
2726   {GST_VIDEO_FORMAT_RGB15, AV_PIX_FMT_RGB555},
2727   /* GST_VIDEO_FORMAT_BGR15, */
2728   /* GST_VIDEO_FORMAT_UYVP, */
2729   /* GST_VIDEO_FORMAT_A420, */
2730   {GST_VIDEO_FORMAT_A420, AV_PIX_FMT_YUVA420P},
2731   /* GST_VIDEO_FORMAT_RGB8_PALETTED, */
2732   {GST_VIDEO_FORMAT_RGB8P, AV_PIX_FMT_PAL8},
2733   /* GST_VIDEO_FORMAT_YUV9, */
2734   {GST_VIDEO_FORMAT_YUV9, AV_PIX_FMT_YUV410P},
2735   /* GST_VIDEO_FORMAT_YVU9, */
2736   /* GST_VIDEO_FORMAT_IYU1, */
2737   /* GST_VIDEO_FORMAT_ARGB64, */
2738   /* GST_VIDEO_FORMAT_AYUV64, */
2739   /* GST_VIDEO_FORMAT_r210, */
2740   {GST_VIDEO_FORMAT_I420_10LE, AV_PIX_FMT_YUV420P10LE},
2741   {GST_VIDEO_FORMAT_I420_10BE, AV_PIX_FMT_YUV420P10BE},
2742   {GST_VIDEO_FORMAT_I422_10LE, AV_PIX_FMT_YUV422P10LE},
2743   {GST_VIDEO_FORMAT_I422_10BE, AV_PIX_FMT_YUV422P10BE},
2744   {GST_VIDEO_FORMAT_Y444_10LE, AV_PIX_FMT_YUV444P10LE},
2745   {GST_VIDEO_FORMAT_Y444_10BE, AV_PIX_FMT_YUV444P10BE},
2746   {GST_VIDEO_FORMAT_GBR, AV_PIX_FMT_GBRP},
2747   {GST_VIDEO_FORMAT_GBRA, AV_PIX_FMT_GBRAP},
2748   {GST_VIDEO_FORMAT_GBR_10LE, AV_PIX_FMT_GBRP10LE},
2749   {GST_VIDEO_FORMAT_GBR_10BE, AV_PIX_FMT_GBRP10BE},
2750   {GST_VIDEO_FORMAT_GBR_12LE, AV_PIX_FMT_GBRP12LE},
2751   {GST_VIDEO_FORMAT_GBR_12BE, AV_PIX_FMT_GBRP12BE},
2752   {GST_VIDEO_FORMAT_GBRA_12LE, AV_PIX_FMT_GBRAP12LE},
2753   {GST_VIDEO_FORMAT_GBRA_12BE, AV_PIX_FMT_GBRAP12BE},
2754   {GST_VIDEO_FORMAT_A420_10LE, AV_PIX_FMT_YUVA420P10LE},
2755   {GST_VIDEO_FORMAT_A420_10BE, AV_PIX_FMT_YUVA420P10BE},
2756   {GST_VIDEO_FORMAT_A422_10LE, AV_PIX_FMT_YUVA422P10LE},
2757   {GST_VIDEO_FORMAT_A422_10BE, AV_PIX_FMT_YUVA422P10BE},
2758   {GST_VIDEO_FORMAT_A444_10LE, AV_PIX_FMT_YUVA444P10LE},
2759   {GST_VIDEO_FORMAT_A444_10BE, AV_PIX_FMT_YUVA444P10BE},
2760   {GST_VIDEO_FORMAT_I420_12LE, AV_PIX_FMT_YUV420P12LE},
2761   {GST_VIDEO_FORMAT_I420_12BE, AV_PIX_FMT_YUV420P12BE},
2762   {GST_VIDEO_FORMAT_I422_12LE, AV_PIX_FMT_YUV422P12LE},
2763   {GST_VIDEO_FORMAT_I422_12BE, AV_PIX_FMT_YUV422P12BE},
2764   {GST_VIDEO_FORMAT_Y444_12LE, AV_PIX_FMT_YUV444P12LE},
2765   {GST_VIDEO_FORMAT_Y444_12BE, AV_PIX_FMT_YUV444P12BE},
2766 };
2767
2768 GstVideoFormat
2769 gst_ffmpeg_pixfmt_to_videoformat (enum AVPixelFormat pixfmt)
2770 {
2771   guint i;
2772
2773   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++)
2774     if (pixtofmttable[i].pixfmt == pixfmt)
2775       return pixtofmttable[i].format;
2776
2777   GST_DEBUG ("Unknown pixel format %d", pixfmt);
2778   return GST_VIDEO_FORMAT_UNKNOWN;
2779 }
2780
2781 static enum AVPixelFormat
2782 gst_ffmpeg_videoformat_to_pixfmt_for_codec (GstVideoFormat format,
2783     const AVCodec * codec)
2784 {
2785   guint i;
2786
2787   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++) {
2788     if (pixtofmttable[i].format == format) {
2789       gint j;
2790
2791       if (codec && codec->pix_fmts) {
2792         for (j = 0; codec->pix_fmts[j] != -1; j++) {
2793           if (pixtofmttable[i].pixfmt == codec->pix_fmts[j])
2794             return pixtofmttable[i].pixfmt;
2795         }
2796       } else {
2797         return pixtofmttable[i].pixfmt;
2798       }
2799     }
2800   }
2801
2802   return AV_PIX_FMT_NONE;
2803 }
2804
2805 enum AVPixelFormat
2806 gst_ffmpeg_videoformat_to_pixfmt (GstVideoFormat format)
2807 {
2808   return gst_ffmpeg_videoformat_to_pixfmt_for_codec (format, NULL);
2809 }
2810
2811 void
2812 gst_ffmpeg_videoinfo_to_context (GstVideoInfo * info, AVCodecContext * context)
2813 {
2814   gint i, bpp = 0;
2815
2816   context->width = GST_VIDEO_INFO_WIDTH (info);
2817   context->height = GST_VIDEO_INFO_HEIGHT (info);
2818   for (i = 0; i < GST_VIDEO_INFO_N_COMPONENTS (info); i++)
2819     bpp += GST_VIDEO_INFO_COMP_DEPTH (info, i);
2820   context->bits_per_coded_sample = bpp;
2821
2822   context->ticks_per_frame = 1;
2823   if (GST_VIDEO_INFO_FPS_N (info) == 0) {
2824     GST_DEBUG ("Using 25/1 framerate");
2825     context->time_base.den = 25;
2826     context->time_base.num = 1;
2827   } else {
2828     context->time_base.den = GST_VIDEO_INFO_FPS_N (info);
2829     context->time_base.num = GST_VIDEO_INFO_FPS_D (info);
2830   }
2831
2832   context->sample_aspect_ratio.num = GST_VIDEO_INFO_PAR_N (info);
2833   context->sample_aspect_ratio.den = GST_VIDEO_INFO_PAR_D (info);
2834
2835   context->pix_fmt =
2836       gst_ffmpeg_videoformat_to_pixfmt_for_codec (GST_VIDEO_INFO_FORMAT (info),
2837       context->codec);
2838
2839   switch (info->chroma_site) {
2840     case GST_VIDEO_CHROMA_SITE_MPEG2:
2841       context->chroma_sample_location = AVCHROMA_LOC_LEFT;
2842       break;
2843     case GST_VIDEO_CHROMA_SITE_JPEG:
2844       context->chroma_sample_location = AVCHROMA_LOC_CENTER;
2845       break;
2846     case GST_VIDEO_CHROMA_SITE_DV:
2847       context->chroma_sample_location = AVCHROMA_LOC_TOPLEFT;
2848       break;
2849     case GST_VIDEO_CHROMA_SITE_V_COSITED:
2850       context->chroma_sample_location = AVCHROMA_LOC_TOP;
2851       break;
2852     default:
2853       break;
2854   }
2855
2856   switch (info->colorimetry.primaries) {
2857     case GST_VIDEO_COLOR_PRIMARIES_BT709:
2858       context->color_primaries = AVCOL_PRI_BT709;
2859       break;
2860     case GST_VIDEO_COLOR_PRIMARIES_BT470M:
2861       context->color_primaries = AVCOL_PRI_BT470M;
2862       break;
2863     case GST_VIDEO_COLOR_PRIMARIES_BT470BG:
2864       context->color_primaries = AVCOL_PRI_BT470BG;
2865       break;
2866     case GST_VIDEO_COLOR_PRIMARIES_SMPTE170M:
2867       context->color_primaries = AVCOL_PRI_SMPTE170M;
2868       break;
2869     case GST_VIDEO_COLOR_PRIMARIES_SMPTE240M:
2870       context->color_primaries = AVCOL_PRI_SMPTE240M;
2871       break;
2872     case GST_VIDEO_COLOR_PRIMARIES_FILM:
2873       context->color_primaries = AVCOL_PRI_FILM;
2874       break;
2875     case GST_VIDEO_COLOR_PRIMARIES_BT2020:
2876       context->color_primaries = AVCOL_PRI_BT2020;
2877       break;
2878     default:
2879       break;
2880   }
2881
2882   switch (info->colorimetry.transfer) {
2883     case GST_VIDEO_TRANSFER_BT709:
2884       context->color_trc = AVCOL_TRC_BT709;
2885       break;
2886     case GST_VIDEO_TRANSFER_GAMMA22:
2887       context->color_trc = AVCOL_TRC_GAMMA22;
2888       break;
2889     case GST_VIDEO_TRANSFER_GAMMA28:
2890       context->color_trc = AVCOL_TRC_GAMMA28;
2891       break;
2892     case GST_VIDEO_TRANSFER_SMPTE240M:
2893       context->color_trc = AVCOL_TRC_SMPTE240M;
2894       break;
2895     case GST_VIDEO_TRANSFER_GAMMA10:
2896       context->color_trc = AVCOL_TRC_LINEAR;
2897       break;
2898     case GST_VIDEO_TRANSFER_LOG100:
2899       context->color_trc = AVCOL_TRC_LOG;
2900       break;
2901     case GST_VIDEO_TRANSFER_LOG316:
2902       context->color_trc = AVCOL_TRC_LOG_SQRT;
2903       break;
2904     case GST_VIDEO_TRANSFER_BT2020_12:
2905       context->color_trc = AVCOL_TRC_BT2020_12;
2906       break;
2907     default:
2908       break;
2909   }
2910
2911   switch (info->colorimetry.matrix) {
2912     case GST_VIDEO_COLOR_MATRIX_RGB:
2913       context->colorspace = AVCOL_SPC_RGB;
2914       break;
2915     case GST_VIDEO_COLOR_MATRIX_BT709:
2916       context->colorspace = AVCOL_SPC_BT709;
2917       break;
2918     case GST_VIDEO_COLOR_MATRIX_FCC:
2919       context->colorspace = AVCOL_SPC_FCC;
2920       break;
2921     case GST_VIDEO_COLOR_MATRIX_BT601:
2922       context->colorspace = AVCOL_SPC_BT470BG;
2923       break;
2924     case GST_VIDEO_COLOR_MATRIX_SMPTE240M:
2925       context->colorspace = AVCOL_SPC_SMPTE240M;
2926       break;
2927     case GST_VIDEO_COLOR_MATRIX_BT2020:
2928       context->colorspace = AVCOL_SPC_BT2020_NCL;
2929       break;
2930     default:
2931       break;
2932   }
2933
2934   if (info->colorimetry.range == GST_VIDEO_COLOR_RANGE_0_255) {
2935     context->color_range = AVCOL_RANGE_JPEG;
2936   } else {
2937     context->color_range = AVCOL_RANGE_MPEG;
2938   }
2939 }
2940
2941 void
2942 gst_ffmpeg_audioinfo_to_context (GstAudioInfo * info, AVCodecContext * context)
2943 {
2944   const AVCodec *codec;
2945   const enum AVSampleFormat *smpl_fmts;
2946   enum AVSampleFormat smpl_fmt = -1;
2947
2948   context->channels = info->channels;
2949   context->sample_rate = info->rate;
2950   context->channel_layout =
2951       gst_ffmpeg_channel_positions_to_layout (info->position, info->channels);
2952
2953   codec = context->codec;
2954
2955   smpl_fmts = codec->sample_fmts;
2956
2957   switch (info->finfo->format) {
2958     case GST_AUDIO_FORMAT_F32:
2959       if (smpl_fmts) {
2960         while (*smpl_fmts != -1) {
2961           if (*smpl_fmts == AV_SAMPLE_FMT_FLT) {
2962             smpl_fmt = *smpl_fmts;
2963             break;
2964           } else if (*smpl_fmts == AV_SAMPLE_FMT_FLTP) {
2965             smpl_fmt = *smpl_fmts;
2966           }
2967
2968           smpl_fmts++;
2969         }
2970       } else {
2971         smpl_fmt = AV_SAMPLE_FMT_FLT;
2972       }
2973       break;
2974     case GST_AUDIO_FORMAT_F64:
2975       if (smpl_fmts) {
2976         while (*smpl_fmts != -1) {
2977           if (*smpl_fmts == AV_SAMPLE_FMT_DBL) {
2978             smpl_fmt = *smpl_fmts;
2979             break;
2980           } else if (*smpl_fmts == AV_SAMPLE_FMT_DBLP) {
2981             smpl_fmt = *smpl_fmts;
2982           }
2983
2984           smpl_fmts++;
2985         }
2986       } else {
2987         smpl_fmt = AV_SAMPLE_FMT_DBL;
2988       }
2989       break;
2990     case GST_AUDIO_FORMAT_S32:
2991       if (smpl_fmts) {
2992         while (*smpl_fmts != -1) {
2993           if (*smpl_fmts == AV_SAMPLE_FMT_S32) {
2994             smpl_fmt = *smpl_fmts;
2995             break;
2996           } else if (*smpl_fmts == AV_SAMPLE_FMT_S32P) {
2997             smpl_fmt = *smpl_fmts;
2998           }
2999
3000           smpl_fmts++;
3001         }
3002       } else {
3003         smpl_fmt = AV_SAMPLE_FMT_S32;
3004       }
3005       break;
3006     case GST_AUDIO_FORMAT_S16:
3007       if (smpl_fmts) {
3008         while (*smpl_fmts != -1) {
3009           if (*smpl_fmts == AV_SAMPLE_FMT_S16) {
3010             smpl_fmt = *smpl_fmts;
3011             break;
3012           } else if (*smpl_fmts == AV_SAMPLE_FMT_S16P) {
3013             smpl_fmt = *smpl_fmts;
3014           }
3015
3016           smpl_fmts++;
3017         }
3018       } else {
3019         smpl_fmt = AV_SAMPLE_FMT_S16;
3020       }
3021       break;
3022     case GST_AUDIO_FORMAT_U8:
3023       if (smpl_fmts) {
3024         while (*smpl_fmts != -1) {
3025           if (*smpl_fmts == AV_SAMPLE_FMT_U8) {
3026             smpl_fmt = *smpl_fmts;
3027             break;
3028           } else if (*smpl_fmts == AV_SAMPLE_FMT_U8P) {
3029             smpl_fmt = *smpl_fmts;
3030           }
3031
3032           smpl_fmts++;
3033         }
3034       } else {
3035         smpl_fmt = AV_SAMPLE_FMT_U8;
3036       }
3037       break;
3038     default:
3039       break;
3040   }
3041
3042   g_assert (smpl_fmt != -1);
3043
3044   context->sample_fmt = smpl_fmt;
3045 }
3046
3047 /* Convert a GstCaps and a FFMPEG codec Type to a
3048  * AVCodecContext. If the context is ommitted, no fixed values
3049  * for video/audio size will be included in the context
3050  *
3051  * AVMediaType is primarily meant for uncompressed data GstCaps!
3052  */
3053
3054 void
3055 gst_ffmpeg_caps_with_codectype (enum AVMediaType type,
3056     const GstCaps * caps, AVCodecContext * context)
3057 {
3058   if (context == NULL)
3059     return;
3060
3061   switch (type) {
3062     case AVMEDIA_TYPE_VIDEO:
3063       gst_ffmpeg_caps_to_pixfmt (caps, context, TRUE);
3064       break;
3065
3066     case AVMEDIA_TYPE_AUDIO:
3067       gst_ffmpeg_caps_to_smpfmt (caps, context, TRUE);
3068       break;
3069
3070     default:
3071       /* unknown */
3072       break;
3073   }
3074 }
3075
3076 #if 0
3077 static void
3078 nal_escape (guint8 * dst, guint8 * src, guint size, guint * destsize)
3079 {
3080   guint8 *dstp = dst;
3081   guint8 *srcp = src;
3082   guint8 *end = src + size;
3083   gint count = 0;
3084
3085   while (srcp < end) {
3086     if (count == 2 && *srcp <= 0x03) {
3087       GST_DEBUG ("added escape code");
3088       *dstp++ = 0x03;
3089       count = 0;
3090     }
3091     if (*srcp == 0)
3092       count++;
3093     else
3094       count = 0;
3095
3096     GST_DEBUG ("copy %02x, count %d", *srcp, count);
3097     *dstp++ = *srcp++;
3098   }
3099   *destsize = dstp - dst;
3100 }
3101
3102 /* copy the config, escaping NAL units as we iterate them, if something fails we
3103  * copy everything and hope for the best. */
3104 static void
3105 copy_config (guint8 * dst, guint8 * src, guint size, guint * destsize)
3106 {
3107   guint8 *dstp = dst;
3108   guint8 *srcp = src;
3109   gint cnt, i;
3110   guint nalsize, esize;
3111
3112   /* check size */
3113   if (size < 7)
3114     goto full_copy;
3115
3116   /* check version */
3117   if (*srcp != 1)
3118     goto full_copy;
3119
3120   cnt = *(srcp + 5) & 0x1f;     /* Number of sps */
3121
3122   GST_DEBUG ("num SPS %d", cnt);
3123
3124   memcpy (dstp, srcp, 6);
3125   srcp += 6;
3126   dstp += 6;
3127
3128   for (i = 0; i < cnt; i++) {
3129     GST_DEBUG ("copy SPS %d", i);
3130     nalsize = (srcp[0] << 8) | srcp[1];
3131     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3132     dstp[0] = esize >> 8;
3133     dstp[1] = esize & 0xff;
3134     dstp += esize + 2;
3135     srcp += nalsize + 2;
3136   }
3137
3138   cnt = *(dstp++) = *(srcp++);  /* Number of pps */
3139
3140   GST_DEBUG ("num PPS %d", cnt);
3141
3142   for (i = 0; i < cnt; i++) {
3143     GST_DEBUG ("copy PPS %d", i);
3144     nalsize = (srcp[0] << 8) | srcp[1];
3145     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3146     dstp[0] = esize >> 8;
3147     dstp[1] = esize & 0xff;
3148     dstp += esize + 2;
3149     srcp += nalsize + 2;
3150   }
3151   *destsize = dstp - dst;
3152
3153   return;
3154
3155 full_copy:
3156   {
3157     GST_DEBUG ("something unexpected, doing full copy");
3158     memcpy (dst, src, size);
3159     *destsize = size;
3160     return;
3161   }
3162 }
3163 #endif
3164
3165 /*
3166  * caps_with_codecid () transforms a GstCaps for a known codec
3167  * ID into a filled-in context.
3168  * codec_data from caps will override possible extradata already in the context
3169  */
3170
3171 void
3172 gst_ffmpeg_caps_with_codecid (enum AVCodecID codec_id,
3173     enum AVMediaType codec_type, const GstCaps * caps, AVCodecContext * context)
3174 {
3175   GstStructure *str;
3176   const GValue *value;
3177   GstBuffer *buf;
3178
3179   GST_LOG ("codec_id:%d, codec_type:%d, caps:%" GST_PTR_FORMAT " context:%p",
3180       codec_id, codec_type, caps, context);
3181
3182   if (!context || !gst_caps_get_size (caps))
3183     return;
3184
3185   str = gst_caps_get_structure (caps, 0);
3186
3187   /* extradata parsing (esds [mpeg4], wma/wmv, msmpeg4v1/2/3, etc.) */
3188   if ((value = gst_structure_get_value (str, "codec_data"))) {
3189     GstMapInfo map;
3190
3191     buf = gst_value_get_buffer (value);
3192     gst_buffer_map (buf, &map, GST_MAP_READ);
3193
3194     /* free the old one if it is there */
3195     if (context->extradata)
3196       av_free (context->extradata);
3197
3198 #if 0
3199     if (codec_id == AV_CODEC_ID_H264) {
3200       guint extrasize;
3201
3202       GST_DEBUG ("copy, escaping codec_data %d", size);
3203       /* ffmpeg h264 expects the codec_data to be escaped, there is no real
3204        * reason for this but let's just escape it for now. Start by allocating
3205        * enough space, x2 is more than enough.
3206        *
3207        * FIXME, we disabled escaping because some file already contain escaped
3208        * codec_data and then we escape twice and fail. It's better to leave it
3209        * as is, as that is what most players do. */
3210       context->extradata =
3211           av_mallocz (GST_ROUND_UP_16 (size * 2 +
3212               AV_INPUT_BUFFER_PADDING_SIZE));
3213       copy_config (context->extradata, data, size, &extrasize);
3214       GST_DEBUG ("escaped size: %d", extrasize);
3215       context->extradata_size = extrasize;
3216     } else
3217 #endif
3218     {
3219       /* allocate with enough padding */
3220       GST_DEBUG ("copy codec_data");
3221       context->extradata =
3222           av_mallocz (GST_ROUND_UP_16 (map.size +
3223               AV_INPUT_BUFFER_PADDING_SIZE));
3224       memcpy (context->extradata, map.data, map.size);
3225       context->extradata_size = map.size;
3226     }
3227
3228     /* Hack for VC1. Sometimes the first (length) byte is 0 for some files */
3229     if (codec_id == AV_CODEC_ID_VC1 && map.size > 0 && map.data[0] == 0) {
3230       context->extradata[0] = (guint8) map.size;
3231     }
3232
3233     GST_DEBUG ("have codec data of size %" G_GSIZE_FORMAT, map.size);
3234
3235     gst_buffer_unmap (buf, &map);
3236   } else {
3237     context->extradata = NULL;
3238     context->extradata_size = 0;
3239     GST_DEBUG ("no codec data");
3240   }
3241
3242   switch (codec_id) {
3243     case AV_CODEC_ID_MPEG4:
3244     {
3245       const gchar *mime = gst_structure_get_name (str);
3246
3247       context->flags |= CODEC_FLAG_4MV;
3248
3249       if (!strcmp (mime, "video/x-divx"))
3250         context->codec_tag = GST_MAKE_FOURCC ('D', 'I', 'V', 'X');
3251       else if (!strcmp (mime, "video/mpeg")) {
3252         const gchar *profile;
3253
3254         context->codec_tag = GST_MAKE_FOURCC ('m', 'p', '4', 'v');
3255
3256         profile = gst_structure_get_string (str, "profile");
3257         if (profile) {
3258           if (g_strcmp0 (profile, "advanced-simple") == 0)
3259             context->flags |= CODEC_FLAG_GMC | CODEC_FLAG_QPEL;
3260         }
3261       }
3262       break;
3263     }
3264
3265     case AV_CODEC_ID_SVQ3:
3266       /* FIXME: this is a workaround for older gst-plugins releases
3267        * (<= 0.8.9). This should be removed at some point, because
3268        * it causes wrong decoded frame order. */
3269       if (!context->extradata) {
3270         gint halfpel_flag, thirdpel_flag, low_delay, unknown_svq3_flag;
3271         guint16 flags;
3272
3273         if (gst_structure_get_int (str, "halfpel_flag", &halfpel_flag) &&
3274             gst_structure_get_int (str, "thirdpel_flag", &thirdpel_flag) &&
3275             gst_structure_get_int (str, "low_delay", &low_delay) &&
3276             gst_structure_get_int (str, "unknown_svq3_flag",
3277                 &unknown_svq3_flag)) {
3278           context->extradata = (guint8 *) av_mallocz (0x64);
3279           g_stpcpy ((gchar *) context->extradata, "SVQ3");
3280           flags = 1 << 3;
3281           flags |= low_delay;
3282           flags = flags << 2;
3283           flags |= unknown_svq3_flag;
3284           flags = flags << 6;
3285           flags |= halfpel_flag;
3286           flags = flags << 1;
3287           flags |= thirdpel_flag;
3288           flags = flags << 3;
3289
3290           flags = GUINT16_FROM_LE (flags);
3291
3292           memcpy ((gchar *) context->extradata + 0x62, &flags, 2);
3293           context->extradata_size = 0x64;
3294         }
3295       }
3296       break;
3297
3298     case AV_CODEC_ID_MSRLE:
3299     case AV_CODEC_ID_QTRLE:
3300     case AV_CODEC_ID_TSCC:
3301     case AV_CODEC_ID_CSCD:
3302     case AV_CODEC_ID_APE:
3303     {
3304       gint depth;
3305
3306       if (gst_structure_get_int (str, "depth", &depth)) {
3307         context->bits_per_coded_sample = depth;
3308       } else {
3309         GST_WARNING ("No depth field in caps %" GST_PTR_FORMAT, caps);
3310       }
3311
3312     }
3313       break;
3314
3315     case AV_CODEC_ID_COOK:
3316     case AV_CODEC_ID_RA_288:
3317     case AV_CODEC_ID_RA_144:
3318     case AV_CODEC_ID_SIPR:
3319     {
3320       gint leaf_size;
3321       gint bitrate;
3322
3323       if (gst_structure_get_int (str, "leaf_size", &leaf_size))
3324         context->block_align = leaf_size;
3325       if (gst_structure_get_int (str, "bitrate", &bitrate))
3326         context->bit_rate = bitrate;
3327     }
3328       break;
3329     case AV_CODEC_ID_ALAC:
3330       gst_structure_get_int (str, "samplesize",
3331           &context->bits_per_coded_sample);
3332       break;
3333
3334     case AV_CODEC_ID_DVVIDEO:
3335     {
3336       const gchar *format;
3337
3338       if ((format = gst_structure_get_string (str, "format"))) {
3339
3340         if (g_str_equal (format, "YUY2"))
3341           context->pix_fmt = AV_PIX_FMT_YUYV422;
3342         else if (g_str_equal (format, "I420"))
3343           context->pix_fmt = AV_PIX_FMT_YUV420P;
3344         else if (g_str_equal (format, "A420"))
3345           context->pix_fmt = AV_PIX_FMT_YUVA420P;
3346         else if (g_str_equal (format, "Y41B"))
3347           context->pix_fmt = AV_PIX_FMT_YUV411P;
3348         else if (g_str_equal (format, "Y42B"))
3349           context->pix_fmt = AV_PIX_FMT_YUV422P;
3350         else if (g_str_equal (format, "YUV9"))
3351           context->pix_fmt = AV_PIX_FMT_YUV410P;
3352         else {
3353           GST_WARNING ("couldn't convert format %s" " to a pixel format",
3354               format);
3355         }
3356       } else
3357         GST_WARNING ("No specified format");
3358       break;
3359     }
3360     case AV_CODEC_ID_H263P:
3361     {
3362       gboolean val;
3363
3364       if (!gst_structure_get_boolean (str, "annex-f", &val) || val)
3365         context->flags |= CODEC_FLAG_4MV;
3366       else
3367         context->flags &= ~CODEC_FLAG_4MV;
3368       if ((!gst_structure_get_boolean (str, "annex-i", &val) || val) &&
3369           (!gst_structure_get_boolean (str, "annex-t", &val) || val))
3370         context->flags |= CODEC_FLAG_AC_PRED;
3371       else
3372         context->flags &= ~CODEC_FLAG_AC_PRED;
3373       if (!gst_structure_get_boolean (str, "annex-j", &val) || val)
3374         context->flags |= CODEC_FLAG_LOOP_FILTER;
3375       else
3376         context->flags &= ~CODEC_FLAG_LOOP_FILTER;
3377       break;
3378     }
3379     case AV_CODEC_ID_ADPCM_G726:
3380     {
3381       const gchar *layout;
3382
3383       if ((layout = gst_structure_get_string (str, "layout"))) {
3384         if (!strcmp (layout, "g721")) {
3385           context->sample_rate = 8000;
3386           context->channels = 1;
3387           context->bit_rate = 32000;
3388         }
3389       }
3390       break;
3391     }
3392     default:
3393       break;
3394   }
3395
3396   if (!gst_caps_is_fixed (caps))
3397     return;
3398
3399   /* common properties (width, height, fps) */
3400   switch (codec_type) {
3401     case AVMEDIA_TYPE_VIDEO:
3402       gst_ffmpeg_caps_to_pixfmt (caps, context,
3403           codec_id == AV_CODEC_ID_RAWVIDEO);
3404       break;
3405     case AVMEDIA_TYPE_AUDIO:
3406       gst_ffmpeg_caps_to_smpfmt (caps, context, FALSE);
3407       break;
3408     default:
3409       break;
3410   }
3411
3412   /* fixup of default settings */
3413   switch (codec_id) {
3414     case AV_CODEC_ID_QCELP:
3415       /* QCELP is always mono, no matter what the caps say */
3416       context->channels = 1;
3417       break;
3418     case AV_CODEC_ID_ADPCM_G726:
3419       if (context->sample_rate && context->bit_rate)
3420         context->bits_per_coded_sample =
3421             context->bit_rate / context->sample_rate;
3422       break;
3423     default:
3424       break;
3425   }
3426 }
3427
3428 /* _formatid_to_caps () is meant for muxers/demuxers, it
3429  * transforms a name (ffmpeg way of ID'ing these, why don't
3430  * they have unique numerical IDs?) to the corresponding
3431  * caps belonging to that mux-format
3432  *
3433  * Note: we don't need any additional info because the caps
3434  * isn't supposed to contain any useful info besides the
3435  * media type anyway
3436  */
3437
3438 GstCaps *
3439 gst_ffmpeg_formatid_to_caps (const gchar * format_name)
3440 {
3441   GstCaps *caps = NULL;
3442
3443   if (!strcmp (format_name, "mpeg")) {
3444     caps = gst_caps_new_simple ("video/mpeg",
3445         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3446   } else if (!strcmp (format_name, "mpegts")) {
3447     caps = gst_caps_new_simple ("video/mpegts",
3448         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3449   } else if (!strcmp (format_name, "rm")) {
3450     caps = gst_caps_new_simple ("application/x-pn-realmedia",
3451         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3452   } else if (!strcmp (format_name, "asf")) {
3453     caps = gst_caps_new_empty_simple ("video/x-ms-asf");
3454   } else if (!strcmp (format_name, "avi")) {
3455     caps = gst_caps_new_empty_simple ("video/x-msvideo");
3456   } else if (!strcmp (format_name, "wav")) {
3457     caps = gst_caps_new_empty_simple ("audio/x-wav");
3458   } else if (!strcmp (format_name, "ape")) {
3459     caps = gst_caps_new_empty_simple ("application/x-ape");
3460   } else if (!strcmp (format_name, "swf")) {
3461     caps = gst_caps_new_empty_simple ("application/x-shockwave-flash");
3462   } else if (!strcmp (format_name, "au")) {
3463     caps = gst_caps_new_empty_simple ("audio/x-au");
3464   } else if (!strcmp (format_name, "dv")) {
3465     caps = gst_caps_new_simple ("video/x-dv",
3466         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3467   } else if (!strcmp (format_name, "4xm")) {
3468     caps = gst_caps_new_empty_simple ("video/x-4xm");
3469   } else if (!strcmp (format_name, "matroska")) {
3470     caps = gst_caps_new_empty_simple ("video/x-matroska");
3471   } else if (!strcmp (format_name, "ivf")) {
3472     caps = gst_caps_new_empty_simple ("video/x-ivf");
3473   } else if (!strcmp (format_name, "mp3")) {
3474     caps = gst_caps_new_empty_simple ("application/x-id3");
3475   } else if (!strcmp (format_name, "flic")) {
3476     caps = gst_caps_new_empty_simple ("video/x-fli");
3477   } else if (!strcmp (format_name, "flv")) {
3478     caps = gst_caps_new_empty_simple ("video/x-flv");
3479   } else if (!strcmp (format_name, "tta")) {
3480     caps = gst_caps_new_empty_simple ("audio/x-ttafile");
3481   } else if (!strcmp (format_name, "aiff")) {
3482     caps = gst_caps_new_empty_simple ("audio/x-aiff");
3483   } else if (!strcmp (format_name, "mov_mp4_m4a_3gp_3g2")) {
3484     caps =
3485         gst_caps_from_string
3486         ("application/x-3gp; video/quicktime; audio/x-m4a");
3487   } else if (!strcmp (format_name, "mov")) {
3488     caps = gst_caps_from_string ("video/quicktime,variant=(string)apple");
3489   } else if (!strcmp (format_name, "mp4")) {
3490     caps = gst_caps_from_string ("video/quicktime,variant=(string)iso");
3491   } else if (!strcmp (format_name, "3gp")) {
3492     caps = gst_caps_from_string ("video/quicktime,variant=(string)3gpp");
3493   } else if (!strcmp (format_name, "3g2")) {
3494     caps = gst_caps_from_string ("video/quicktime,variant=(string)3g2");
3495   } else if (!strcmp (format_name, "psp")) {
3496     caps = gst_caps_from_string ("video/quicktime,variant=(string)psp");
3497   } else if (!strcmp (format_name, "ipod")) {
3498     caps = gst_caps_from_string ("video/quicktime,variant=(string)ipod");
3499   } else if (!strcmp (format_name, "aac")) {
3500     caps = gst_caps_new_simple ("audio/mpeg",
3501         "mpegversion", G_TYPE_INT, 4, NULL);
3502   } else if (!strcmp (format_name, "gif")) {
3503     caps = gst_caps_from_string ("image/gif");
3504   } else if (!strcmp (format_name, "ogg")) {
3505     caps = gst_caps_from_string ("application/ogg");
3506   } else if (!strcmp (format_name, "mxf") || !strcmp (format_name, "mxf_d10")) {
3507     caps = gst_caps_from_string ("application/mxf");
3508   } else if (!strcmp (format_name, "gxf")) {
3509     caps = gst_caps_from_string ("application/gxf");
3510   } else if (!strcmp (format_name, "yuv4mpegpipe")) {
3511     caps = gst_caps_new_simple ("application/x-yuv4mpeg",
3512         "y4mversion", G_TYPE_INT, 2, NULL);
3513   } else if (!strcmp (format_name, "mpc")) {
3514     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 7");
3515   } else if (!strcmp (format_name, "mpc8")) {
3516     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 8");
3517   } else if (!strcmp (format_name, "vqf")) {
3518     caps = gst_caps_from_string ("audio/x-vqf");
3519   } else if (!strcmp (format_name, "nsv")) {
3520     caps = gst_caps_from_string ("video/x-nsv");
3521   } else if (!strcmp (format_name, "amr")) {
3522     caps = gst_caps_from_string ("audio/x-amr-nb-sh");
3523   } else if (!strcmp (format_name, "webm")) {
3524     caps = gst_caps_from_string ("video/webm");
3525   } else if (!strcmp (format_name, "voc")) {
3526     caps = gst_caps_from_string ("audio/x-voc");
3527   } else if (!strcmp (format_name, "pva")) {
3528     caps = gst_caps_from_string ("video/x-pva");
3529   } else if (!strcmp (format_name, "brstm")) {
3530     caps = gst_caps_from_string ("audio/x-brstm");
3531   } else if (!strcmp (format_name, "bfstm")) {
3532     caps = gst_caps_from_string ("audio/x-bfstm");
3533   } else {
3534     gchar *name;
3535
3536     GST_LOG ("Could not create stream format caps for %s", format_name);
3537     name = g_strdup_printf ("application/x-gst-av-%s", format_name);
3538     caps = gst_caps_new_empty_simple (name);
3539     g_free (name);
3540   }
3541
3542   return caps;
3543 }
3544
3545 gboolean
3546 gst_ffmpeg_formatid_get_codecids (const gchar * format_name,
3547     enum AVCodecID ** video_codec_list, enum AVCodecID ** audio_codec_list,
3548     AVOutputFormat * plugin)
3549 {
3550   static enum AVCodecID tmp_vlist[] = {
3551     AV_CODEC_ID_NONE,
3552     AV_CODEC_ID_NONE
3553   };
3554   static enum AVCodecID tmp_alist[] = {
3555     AV_CODEC_ID_NONE,
3556     AV_CODEC_ID_NONE
3557   };
3558
3559   GST_LOG ("format_name : %s", format_name);
3560
3561   if (!strcmp (format_name, "mp4")) {
3562     static enum AVCodecID mp4_video_list[] = {
3563       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H264,
3564       AV_CODEC_ID_MJPEG,
3565       AV_CODEC_ID_NONE
3566     };
3567     static enum AVCodecID mp4_audio_list[] = {
3568       AV_CODEC_ID_AAC, AV_CODEC_ID_MP3,
3569       AV_CODEC_ID_NONE
3570     };
3571
3572     *video_codec_list = mp4_video_list;
3573     *audio_codec_list = mp4_audio_list;
3574   } else if (!strcmp (format_name, "mpeg")) {
3575     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3576       AV_CODEC_ID_MPEG2VIDEO,
3577       AV_CODEC_ID_H264,
3578       AV_CODEC_ID_NONE
3579     };
3580     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP1,
3581       AV_CODEC_ID_MP2,
3582       AV_CODEC_ID_MP3,
3583       AV_CODEC_ID_NONE
3584     };
3585
3586     *video_codec_list = mpeg_video_list;
3587     *audio_codec_list = mpeg_audio_list;
3588   } else if (!strcmp (format_name, "dvd")) {
3589     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG2VIDEO,
3590       AV_CODEC_ID_NONE
3591     };
3592     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP2,
3593       AV_CODEC_ID_AC3,
3594       AV_CODEC_ID_DTS,
3595       AV_CODEC_ID_PCM_S16BE,
3596       AV_CODEC_ID_NONE
3597     };
3598
3599     *video_codec_list = mpeg_video_list;
3600     *audio_codec_list = mpeg_audio_list;
3601   } else if (!strcmp (format_name, "mpegts")) {
3602     static enum AVCodecID mpegts_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3603       AV_CODEC_ID_MPEG2VIDEO,
3604       AV_CODEC_ID_H264,
3605       AV_CODEC_ID_NONE
3606     };
3607     static enum AVCodecID mpegts_audio_list[] = { AV_CODEC_ID_MP2,
3608       AV_CODEC_ID_MP3,
3609       AV_CODEC_ID_AC3,
3610       AV_CODEC_ID_DTS,
3611       AV_CODEC_ID_AAC,
3612       AV_CODEC_ID_NONE
3613     };
3614
3615     *video_codec_list = mpegts_video_list;
3616     *audio_codec_list = mpegts_audio_list;
3617   } else if (!strcmp (format_name, "vob")) {
3618     static enum AVCodecID vob_video_list[] =
3619         { AV_CODEC_ID_MPEG2VIDEO, AV_CODEC_ID_NONE };
3620     static enum AVCodecID vob_audio_list[] = { AV_CODEC_ID_MP2, AV_CODEC_ID_AC3,
3621       AV_CODEC_ID_DTS, AV_CODEC_ID_NONE
3622     };
3623
3624     *video_codec_list = vob_video_list;
3625     *audio_codec_list = vob_audio_list;
3626   } else if (!strcmp (format_name, "flv")) {
3627     static enum AVCodecID flv_video_list[] =
3628         { AV_CODEC_ID_FLV1, AV_CODEC_ID_NONE };
3629     static enum AVCodecID flv_audio_list[] =
3630         { AV_CODEC_ID_MP3, AV_CODEC_ID_NONE };
3631
3632     *video_codec_list = flv_video_list;
3633     *audio_codec_list = flv_audio_list;
3634   } else if (!strcmp (format_name, "asf")) {
3635     static enum AVCodecID asf_video_list[] =
3636         { AV_CODEC_ID_WMV1, AV_CODEC_ID_WMV2, AV_CODEC_ID_MSMPEG4V3,
3637       AV_CODEC_ID_NONE
3638     };
3639     static enum AVCodecID asf_audio_list[] =
3640         { AV_CODEC_ID_WMAV1, AV_CODEC_ID_WMAV2, AV_CODEC_ID_MP3,
3641       AV_CODEC_ID_NONE
3642     };
3643
3644     *video_codec_list = asf_video_list;
3645     *audio_codec_list = asf_audio_list;
3646   } else if (!strcmp (format_name, "dv")) {
3647     static enum AVCodecID dv_video_list[] =
3648         { AV_CODEC_ID_DVVIDEO, AV_CODEC_ID_NONE };
3649     static enum AVCodecID dv_audio_list[] =
3650         { AV_CODEC_ID_PCM_S16LE, AV_CODEC_ID_NONE };
3651
3652     *video_codec_list = dv_video_list;
3653     *audio_codec_list = dv_audio_list;
3654   } else if (!strcmp (format_name, "mov")) {
3655     static enum AVCodecID mov_video_list[] = {
3656       AV_CODEC_ID_SVQ1, AV_CODEC_ID_SVQ3, AV_CODEC_ID_MPEG4,
3657       AV_CODEC_ID_H263, AV_CODEC_ID_H263P,
3658       AV_CODEC_ID_H264, AV_CODEC_ID_DVVIDEO,
3659       AV_CODEC_ID_MJPEG,
3660       AV_CODEC_ID_NONE
3661     };
3662     static enum AVCodecID mov_audio_list[] = {
3663       AV_CODEC_ID_PCM_MULAW, AV_CODEC_ID_PCM_ALAW, AV_CODEC_ID_ADPCM_IMA_QT,
3664       AV_CODEC_ID_MACE3, AV_CODEC_ID_MACE6, AV_CODEC_ID_AAC,
3665       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3666       AV_CODEC_ID_PCM_S16BE, AV_CODEC_ID_PCM_S16LE,
3667       AV_CODEC_ID_MP3, AV_CODEC_ID_NONE
3668     };
3669
3670     *video_codec_list = mov_video_list;
3671     *audio_codec_list = mov_audio_list;
3672   } else if ((!strcmp (format_name, "3gp") || !strcmp (format_name, "3g2"))) {
3673     static enum AVCodecID tgp_video_list[] = {
3674       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H263, AV_CODEC_ID_H263P, AV_CODEC_ID_H264,
3675       AV_CODEC_ID_NONE
3676     };
3677     static enum AVCodecID tgp_audio_list[] = {
3678       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3679       AV_CODEC_ID_AAC,
3680       AV_CODEC_ID_NONE
3681     };
3682
3683     *video_codec_list = tgp_video_list;
3684     *audio_codec_list = tgp_audio_list;
3685   } else if (!strcmp (format_name, "mmf")) {
3686     static enum AVCodecID mmf_audio_list[] = {
3687       AV_CODEC_ID_ADPCM_YAMAHA, AV_CODEC_ID_NONE
3688     };
3689     *video_codec_list = NULL;
3690     *audio_codec_list = mmf_audio_list;
3691   } else if (!strcmp (format_name, "amr")) {
3692     static enum AVCodecID amr_audio_list[] = {
3693       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3694       AV_CODEC_ID_NONE
3695     };
3696     *video_codec_list = NULL;
3697     *audio_codec_list = amr_audio_list;
3698   } else if (!strcmp (format_name, "gif")) {
3699     static enum AVCodecID gif_image_list[] = {
3700       AV_CODEC_ID_RAWVIDEO, AV_CODEC_ID_NONE
3701     };
3702     *video_codec_list = gif_image_list;
3703     *audio_codec_list = NULL;
3704   } else if ((plugin->audio_codec != AV_CODEC_ID_NONE) ||
3705       (plugin->video_codec != AV_CODEC_ID_NONE)) {
3706     tmp_vlist[0] = plugin->video_codec;
3707     tmp_alist[0] = plugin->audio_codec;
3708
3709     *video_codec_list = tmp_vlist;
3710     *audio_codec_list = tmp_alist;
3711   } else if ((!strcmp (format_name, "pva"))) {
3712     static enum AVCodecID tgp_video_list[] = {
3713       AV_CODEC_ID_MPEG2VIDEO,
3714       AV_CODEC_ID_NONE
3715     };
3716     static enum AVCodecID tgp_audio_list[] = {
3717       AV_CODEC_ID_MP2,
3718       AV_CODEC_ID_NONE
3719     };
3720
3721     *video_codec_list = tgp_video_list;
3722     *audio_codec_list = tgp_audio_list;
3723   } else {
3724     GST_LOG ("Format %s not found", format_name);
3725     return FALSE;
3726   }
3727
3728   return TRUE;
3729 }
3730
3731 /* Convert a GstCaps to a FFMPEG codec ID. Size et all
3732  * are omitted, that can be queried by the user itself,
3733  * we're not eating the GstCaps or anything
3734  * A pointer to an allocated context is also needed for
3735  * optional extra info
3736  */
3737
3738 enum AVCodecID
3739 gst_ffmpeg_caps_to_codecid (const GstCaps * caps, AVCodecContext * context)
3740 {
3741   enum AVCodecID id = AV_CODEC_ID_NONE;
3742   const gchar *mimetype;
3743   const GstStructure *structure;
3744   gboolean video = FALSE, audio = FALSE;        /* we want to be sure! */
3745
3746   g_return_val_if_fail (caps != NULL, AV_CODEC_ID_NONE);
3747   g_return_val_if_fail (gst_caps_get_size (caps) == 1, AV_CODEC_ID_NONE);
3748   structure = gst_caps_get_structure (caps, 0);
3749
3750   mimetype = gst_structure_get_name (structure);
3751
3752   if (!strcmp (mimetype, "video/x-raw")) {
3753     id = AV_CODEC_ID_RAWVIDEO;
3754     video = TRUE;
3755   } else if (!strcmp (mimetype, "audio/x-raw")) {
3756     GstAudioInfo info;
3757
3758     if (gst_audio_info_from_caps (&info, caps)) {
3759       switch (GST_AUDIO_INFO_FORMAT (&info)) {
3760         case GST_AUDIO_FORMAT_S8:
3761           id = AV_CODEC_ID_PCM_S8;
3762           break;
3763         case GST_AUDIO_FORMAT_U8:
3764           id = AV_CODEC_ID_PCM_U8;
3765           break;
3766         case GST_AUDIO_FORMAT_S16LE:
3767           id = AV_CODEC_ID_PCM_S16LE;
3768           break;
3769         case GST_AUDIO_FORMAT_S16BE:
3770           id = AV_CODEC_ID_PCM_S16BE;
3771           break;
3772         case GST_AUDIO_FORMAT_U16LE:
3773           id = AV_CODEC_ID_PCM_U16LE;
3774           break;
3775         case GST_AUDIO_FORMAT_U16BE:
3776           id = AV_CODEC_ID_PCM_U16BE;
3777           break;
3778         default:
3779           break;
3780       }
3781       if (id != AV_CODEC_ID_NONE)
3782         audio = TRUE;
3783     }
3784   } else if (!strcmp (mimetype, "audio/x-mulaw")) {
3785     id = AV_CODEC_ID_PCM_MULAW;
3786     audio = TRUE;
3787   } else if (!strcmp (mimetype, "audio/x-alaw")) {
3788     id = AV_CODEC_ID_PCM_ALAW;
3789     audio = TRUE;
3790   } else if (!strcmp (mimetype, "video/x-dv")) {
3791     gboolean sys_strm;
3792
3793     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3794         !sys_strm) {
3795       id = AV_CODEC_ID_DVVIDEO;
3796       video = TRUE;
3797     }
3798   } else if (!strcmp (mimetype, "audio/x-dv")) {        /* ??? */
3799     id = AV_CODEC_ID_DVAUDIO;
3800     audio = TRUE;
3801   } else if (!strcmp (mimetype, "video/x-h263")) {
3802     const gchar *h263version =
3803         gst_structure_get_string (structure, "h263version");
3804     if (h263version && !strcmp (h263version, "h263p"))
3805       id = AV_CODEC_ID_H263P;
3806     else
3807       id = AV_CODEC_ID_H263;
3808     video = TRUE;
3809   } else if (!strcmp (mimetype, "video/x-intel-h263")) {
3810     id = AV_CODEC_ID_H263I;
3811     video = TRUE;
3812   } else if (!strcmp (mimetype, "video/x-h261")) {
3813     id = AV_CODEC_ID_H261;
3814     video = TRUE;
3815   } else if (!strcmp (mimetype, "video/mpeg")) {
3816     gboolean sys_strm;
3817     gint mpegversion;
3818
3819     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3820         gst_structure_get_int (structure, "mpegversion", &mpegversion) &&
3821         !sys_strm) {
3822       switch (mpegversion) {
3823         case 1:
3824           id = AV_CODEC_ID_MPEG1VIDEO;
3825           break;
3826         case 2:
3827           id = AV_CODEC_ID_MPEG2VIDEO;
3828           break;
3829         case 4:
3830           id = AV_CODEC_ID_MPEG4;
3831           break;
3832       }
3833     }
3834     if (id != AV_CODEC_ID_NONE)
3835       video = TRUE;
3836   } else if (!strcmp (mimetype, "image/jpeg")) {
3837     id = AV_CODEC_ID_MJPEG;     /* A... B... */
3838     video = TRUE;
3839   } else if (!strcmp (mimetype, "video/x-jpeg-b")) {
3840     id = AV_CODEC_ID_MJPEGB;
3841     video = TRUE;
3842   } else if (!strcmp (mimetype, "video/x-wmv")) {
3843     gint wmvversion = 0;
3844
3845     if (gst_structure_get_int (structure, "wmvversion", &wmvversion)) {
3846       switch (wmvversion) {
3847         case 1:
3848           id = AV_CODEC_ID_WMV1;
3849           break;
3850         case 2:
3851           id = AV_CODEC_ID_WMV2;
3852           break;
3853         case 3:
3854         {
3855           const gchar *format;
3856
3857           /* WMV3 unless the fourcc exists and says otherwise */
3858           id = AV_CODEC_ID_WMV3;
3859
3860           if ((format = gst_structure_get_string (structure, "format")) &&
3861               (g_str_equal (format, "WVC1") || g_str_equal (format, "WMVA")))
3862             id = AV_CODEC_ID_VC1;
3863
3864           break;
3865         }
3866       }
3867     }
3868     if (id != AV_CODEC_ID_NONE)
3869       video = TRUE;
3870   } else if (!strcmp (mimetype, "audio/x-vorbis")) {
3871     id = AV_CODEC_ID_VORBIS;
3872     audio = TRUE;
3873   } else if (!strcmp (mimetype, "audio/x-qdm2")) {
3874     id = AV_CODEC_ID_QDM2;
3875     audio = TRUE;
3876   } else if (!strcmp (mimetype, "audio/mpeg")) {
3877     gint layer = 0;
3878     gint mpegversion = 0;
3879
3880     if (gst_structure_get_int (structure, "mpegversion", &mpegversion)) {
3881       switch (mpegversion) {
3882         case 2:                /* ffmpeg uses faad for both... */
3883         case 4:
3884           id = AV_CODEC_ID_AAC;
3885           break;
3886         case 1:
3887           if (gst_structure_get_int (structure, "layer", &layer)) {
3888             switch (layer) {
3889               case 1:
3890                 id = AV_CODEC_ID_MP1;
3891                 break;
3892               case 2:
3893                 id = AV_CODEC_ID_MP2;
3894                 break;
3895               case 3:
3896                 id = AV_CODEC_ID_MP3;
3897                 break;
3898             }
3899           }
3900       }
3901     }
3902     if (id != AV_CODEC_ID_NONE)
3903       audio = TRUE;
3904   } else if (!strcmp (mimetype, "audio/x-musepack")) {
3905     gint streamversion = -1;
3906
3907     if (gst_structure_get_int (structure, "streamversion", &streamversion)) {
3908       if (streamversion == 7)
3909         id = AV_CODEC_ID_MUSEPACK7;
3910     } else {
3911       id = AV_CODEC_ID_MUSEPACK7;
3912     }
3913   } else if (!strcmp (mimetype, "audio/x-wma")) {
3914     gint wmaversion = 0;
3915
3916     if (gst_structure_get_int (structure, "wmaversion", &wmaversion)) {
3917       switch (wmaversion) {
3918         case 1:
3919           id = AV_CODEC_ID_WMAV1;
3920           break;
3921         case 2:
3922           id = AV_CODEC_ID_WMAV2;
3923           break;
3924         case 3:
3925           id = AV_CODEC_ID_WMAPRO;
3926           break;
3927       }
3928     }
3929     if (id != AV_CODEC_ID_NONE)
3930       audio = TRUE;
3931   } else if (!strcmp (mimetype, "audio/x-wms")) {
3932     id = AV_CODEC_ID_WMAVOICE;
3933     audio = TRUE;
3934   } else if (!strcmp (mimetype, "audio/x-ac3")) {
3935     id = AV_CODEC_ID_AC3;
3936     audio = TRUE;
3937   } else if (!strcmp (mimetype, "audio/x-eac3")) {
3938     id = AV_CODEC_ID_EAC3;
3939     audio = TRUE;
3940   } else if (!strcmp (mimetype, "audio/x-vnd.sony.atrac3") ||
3941       !strcmp (mimetype, "audio/atrac3")) {
3942     id = AV_CODEC_ID_ATRAC3;
3943     audio = TRUE;
3944   } else if (!strcmp (mimetype, "audio/x-dts")) {
3945     id = AV_CODEC_ID_DTS;
3946     audio = TRUE;
3947   } else if (!strcmp (mimetype, "application/x-ape")) {
3948     id = AV_CODEC_ID_APE;
3949     audio = TRUE;
3950   } else if (!strcmp (mimetype, "video/x-msmpeg")) {
3951     gint msmpegversion = 0;
3952
3953     if (gst_structure_get_int (structure, "msmpegversion", &msmpegversion)) {
3954       switch (msmpegversion) {
3955         case 41:
3956           id = AV_CODEC_ID_MSMPEG4V1;
3957           break;
3958         case 42:
3959           id = AV_CODEC_ID_MSMPEG4V2;
3960           break;
3961         case 43:
3962           id = AV_CODEC_ID_MSMPEG4V3;
3963           break;
3964       }
3965     }
3966     if (id != AV_CODEC_ID_NONE)
3967       video = TRUE;
3968   } else if (!strcmp (mimetype, "video/x-svq")) {
3969     gint svqversion = 0;
3970
3971     if (gst_structure_get_int (structure, "svqversion", &svqversion)) {
3972       switch (svqversion) {
3973         case 1:
3974           id = AV_CODEC_ID_SVQ1;
3975           break;
3976         case 3:
3977           id = AV_CODEC_ID_SVQ3;
3978           break;
3979       }
3980     }
3981     if (id != AV_CODEC_ID_NONE)
3982       video = TRUE;
3983   } else if (!strcmp (mimetype, "video/x-huffyuv")) {
3984     id = AV_CODEC_ID_HUFFYUV;
3985     video = TRUE;
3986   } else if (!strcmp (mimetype, "audio/x-mace")) {
3987     gint maceversion = 0;
3988
3989     if (gst_structure_get_int (structure, "maceversion", &maceversion)) {
3990       switch (maceversion) {
3991         case 3:
3992           id = AV_CODEC_ID_MACE3;
3993           break;
3994         case 6:
3995           id = AV_CODEC_ID_MACE6;
3996           break;
3997       }
3998     }
3999     if (id != AV_CODEC_ID_NONE)
4000       audio = TRUE;
4001   } else if (!strcmp (mimetype, "video/x-theora")) {
4002     id = AV_CODEC_ID_THEORA;
4003     video = TRUE;
4004   } else if (!strcmp (mimetype, "video/x-vp3")) {
4005     id = AV_CODEC_ID_VP3;
4006     video = TRUE;
4007   } else if (!strcmp (mimetype, "video/x-vp5")) {
4008     id = AV_CODEC_ID_VP5;
4009     video = TRUE;
4010   } else if (!strcmp (mimetype, "video/x-vp6")) {
4011     id = AV_CODEC_ID_VP6;
4012     video = TRUE;
4013   } else if (!strcmp (mimetype, "video/x-vp6-flash")) {
4014     id = AV_CODEC_ID_VP6F;
4015     video = TRUE;
4016   } else if (!strcmp (mimetype, "video/x-vp6-alpha")) {
4017     id = AV_CODEC_ID_VP6A;
4018     video = TRUE;
4019   } else if (!strcmp (mimetype, "video/x-vp8")) {
4020     id = AV_CODEC_ID_VP8;
4021     video = TRUE;
4022   } else if (!strcmp (mimetype, "video/x-vp9")) {
4023     id = AV_CODEC_ID_VP9;
4024     video = TRUE;
4025   } else if (!strcmp (mimetype, "video/x-flash-screen")) {
4026     id = AV_CODEC_ID_FLASHSV;
4027     video = TRUE;
4028   } else if (!strcmp (mimetype, "video/x-flash-screen2")) {
4029     id = AV_CODEC_ID_FLASHSV2;
4030     video = TRUE;
4031   } else if (!strcmp (mimetype, "video/x-cineform")) {
4032     id = AV_CODEC_ID_CFHD;
4033     video = TRUE;
4034   } else if (!strcmp (mimetype, "video/x-indeo")) {
4035     gint indeoversion = 0;
4036
4037     if (gst_structure_get_int (structure, "indeoversion", &indeoversion)) {
4038       switch (indeoversion) {
4039         case 5:
4040           id = AV_CODEC_ID_INDEO5;
4041           break;
4042         case 4:
4043           id = AV_CODEC_ID_INDEO4;
4044           break;
4045         case 3:
4046           id = AV_CODEC_ID_INDEO3;
4047           break;
4048         case 2:
4049           id = AV_CODEC_ID_INDEO2;
4050           break;
4051       }
4052       if (id != AV_CODEC_ID_NONE)
4053         video = TRUE;
4054     }
4055   } else if (!strcmp (mimetype, "video/x-divx")) {
4056     gint divxversion = 0;
4057
4058     if (gst_structure_get_int (structure, "divxversion", &divxversion)) {
4059       switch (divxversion) {
4060         case 3:
4061           id = AV_CODEC_ID_MSMPEG4V3;
4062           break;
4063         case 4:
4064         case 5:
4065           id = AV_CODEC_ID_MPEG4;
4066           break;
4067       }
4068     }
4069     if (id != AV_CODEC_ID_NONE)
4070       video = TRUE;
4071   } else if (!strcmp (mimetype, "video/x-ffv")) {
4072     gint ffvversion = 0;
4073
4074     if (gst_structure_get_int (structure, "ffvversion", &ffvversion) &&
4075         ffvversion == 1) {
4076       id = AV_CODEC_ID_FFV1;
4077       video = TRUE;
4078     }
4079   } else if (!strcmp (mimetype, "video/x-apple-intermediate-codec")) {
4080     id = AV_CODEC_ID_AIC;
4081     video = TRUE;
4082   } else if (!strcmp (mimetype, "audio/x-adpcm")) {
4083     const gchar *layout;
4084
4085     layout = gst_structure_get_string (structure, "layout");
4086     if (layout == NULL) {
4087       /* break */
4088     } else if (!strcmp (layout, "quicktime")) {
4089       id = AV_CODEC_ID_ADPCM_IMA_QT;
4090     } else if (!strcmp (layout, "microsoft")) {
4091       id = AV_CODEC_ID_ADPCM_MS;
4092     } else if (!strcmp (layout, "dvi")) {
4093       id = AV_CODEC_ID_ADPCM_IMA_WAV;
4094     } else if (!strcmp (layout, "4xm")) {
4095       id = AV_CODEC_ID_ADPCM_4XM;
4096     } else if (!strcmp (layout, "smjpeg")) {
4097       id = AV_CODEC_ID_ADPCM_IMA_SMJPEG;
4098     } else if (!strcmp (layout, "dk3")) {
4099       id = AV_CODEC_ID_ADPCM_IMA_DK3;
4100     } else if (!strcmp (layout, "dk4")) {
4101       id = AV_CODEC_ID_ADPCM_IMA_DK4;
4102     } else if (!strcmp (layout, "westwood")) {
4103       id = AV_CODEC_ID_ADPCM_IMA_WS;
4104     } else if (!strcmp (layout, "iss")) {
4105       id = AV_CODEC_ID_ADPCM_IMA_ISS;
4106     } else if (!strcmp (layout, "xa")) {
4107       id = AV_CODEC_ID_ADPCM_XA;
4108     } else if (!strcmp (layout, "adx")) {
4109       id = AV_CODEC_ID_ADPCM_ADX;
4110     } else if (!strcmp (layout, "ea")) {
4111       id = AV_CODEC_ID_ADPCM_EA;
4112     } else if (!strcmp (layout, "g726")) {
4113       id = AV_CODEC_ID_ADPCM_G726;
4114     } else if (!strcmp (layout, "g721")) {
4115       id = AV_CODEC_ID_ADPCM_G726;
4116     } else if (!strcmp (layout, "ct")) {
4117       id = AV_CODEC_ID_ADPCM_CT;
4118     } else if (!strcmp (layout, "swf")) {
4119       id = AV_CODEC_ID_ADPCM_SWF;
4120     } else if (!strcmp (layout, "yamaha")) {
4121       id = AV_CODEC_ID_ADPCM_YAMAHA;
4122     } else if (!strcmp (layout, "sbpro2")) {
4123       id = AV_CODEC_ID_ADPCM_SBPRO_2;
4124     } else if (!strcmp (layout, "sbpro3")) {
4125       id = AV_CODEC_ID_ADPCM_SBPRO_3;
4126     } else if (!strcmp (layout, "sbpro4")) {
4127       id = AV_CODEC_ID_ADPCM_SBPRO_4;
4128     }
4129     if (id != AV_CODEC_ID_NONE)
4130       audio = TRUE;
4131   } else if (!strcmp (mimetype, "video/x-4xm")) {
4132     id = AV_CODEC_ID_4XM;
4133     video = TRUE;
4134   } else if (!strcmp (mimetype, "audio/x-dpcm")) {
4135     const gchar *layout;
4136
4137     layout = gst_structure_get_string (structure, "layout");
4138     if (!layout) {
4139       /* .. */
4140     } else if (!strcmp (layout, "roq")) {
4141       id = AV_CODEC_ID_ROQ_DPCM;
4142     } else if (!strcmp (layout, "interplay")) {
4143       id = AV_CODEC_ID_INTERPLAY_DPCM;
4144     } else if (!strcmp (layout, "xan")) {
4145       id = AV_CODEC_ID_XAN_DPCM;
4146     } else if (!strcmp (layout, "sol")) {
4147       id = AV_CODEC_ID_SOL_DPCM;
4148     }
4149     if (id != AV_CODEC_ID_NONE)
4150       audio = TRUE;
4151   } else if (!strcmp (mimetype, "audio/x-flac")) {
4152     id = AV_CODEC_ID_FLAC;
4153     audio = TRUE;
4154   } else if (!strcmp (mimetype, "audio/x-shorten")) {
4155     id = AV_CODEC_ID_SHORTEN;
4156     audio = TRUE;
4157   } else if (!strcmp (mimetype, "audio/x-alac")) {
4158     id = AV_CODEC_ID_ALAC;
4159     audio = TRUE;
4160   } else if (!strcmp (mimetype, "video/x-cinepak")) {
4161     id = AV_CODEC_ID_CINEPAK;
4162     video = TRUE;
4163   } else if (!strcmp (mimetype, "video/x-pn-realvideo")) {
4164     gint rmversion;
4165
4166     if (gst_structure_get_int (structure, "rmversion", &rmversion)) {
4167       switch (rmversion) {
4168         case 1:
4169           id = AV_CODEC_ID_RV10;
4170           break;
4171         case 2:
4172           id = AV_CODEC_ID_RV20;
4173           break;
4174         case 3:
4175           id = AV_CODEC_ID_RV30;
4176           break;
4177         case 4:
4178           id = AV_CODEC_ID_RV40;
4179           break;
4180       }
4181     }
4182     if (id != AV_CODEC_ID_NONE)
4183       video = TRUE;
4184   } else if (!strcmp (mimetype, "audio/x-sipro")) {
4185     id = AV_CODEC_ID_SIPR;
4186     audio = TRUE;
4187   } else if (!strcmp (mimetype, "audio/x-pn-realaudio")) {
4188     gint raversion;
4189
4190     if (gst_structure_get_int (structure, "raversion", &raversion)) {
4191       switch (raversion) {
4192         case 1:
4193           id = AV_CODEC_ID_RA_144;
4194           break;
4195         case 2:
4196           id = AV_CODEC_ID_RA_288;
4197           break;
4198         case 8:
4199           id = AV_CODEC_ID_COOK;
4200           break;
4201       }
4202     }
4203     if (id != AV_CODEC_ID_NONE)
4204       audio = TRUE;
4205   } else if (!strcmp (mimetype, "video/x-rle")) {
4206     const gchar *layout;
4207
4208     if ((layout = gst_structure_get_string (structure, "layout"))) {
4209       if (!strcmp (layout, "microsoft")) {
4210         id = AV_CODEC_ID_MSRLE;
4211         video = TRUE;
4212       }
4213     }
4214   } else if (!strcmp (mimetype, "video/x-xan")) {
4215     gint wcversion = 0;
4216
4217     if ((gst_structure_get_int (structure, "wcversion", &wcversion))) {
4218       switch (wcversion) {
4219         case 3:
4220           id = AV_CODEC_ID_XAN_WC3;
4221           video = TRUE;
4222           break;
4223         case 4:
4224           id = AV_CODEC_ID_XAN_WC4;
4225           video = TRUE;
4226           break;
4227         default:
4228           break;
4229       }
4230     }
4231   } else if (!strcmp (mimetype, "audio/AMR")) {
4232     audio = TRUE;
4233     id = AV_CODEC_ID_AMR_NB;
4234   } else if (!strcmp (mimetype, "audio/AMR-WB")) {
4235     id = AV_CODEC_ID_AMR_WB;
4236     audio = TRUE;
4237   } else if (!strcmp (mimetype, "audio/qcelp")) {
4238     id = AV_CODEC_ID_QCELP;
4239     audio = TRUE;
4240   } else if (!strcmp (mimetype, "video/x-h264")) {
4241     id = AV_CODEC_ID_H264;
4242     video = TRUE;
4243   } else if (!strcmp (mimetype, "video/x-h265")) {
4244     id = AV_CODEC_ID_HEVC;
4245     video = TRUE;
4246   } else if (!strcmp (mimetype, "video/x-flash-video")) {
4247     gint flvversion = 0;
4248
4249     if ((gst_structure_get_int (structure, "flvversion", &flvversion))) {
4250       switch (flvversion) {
4251         case 1:
4252           id = AV_CODEC_ID_FLV1;
4253           video = TRUE;
4254           break;
4255         default:
4256           break;
4257       }
4258     }
4259
4260   } else if (!strcmp (mimetype, "audio/x-nellymoser")) {
4261     id = AV_CODEC_ID_NELLYMOSER;
4262     audio = TRUE;
4263   } else if (!strncmp (mimetype, "audio/x-gst-av-", 15)) {
4264     gchar ext[16];
4265     AVCodec *codec;
4266
4267     if (strlen (mimetype) <= 30 &&
4268         sscanf (mimetype, "audio/x-gst-av-%s", ext) == 1) {
4269       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4270           (codec = avcodec_find_encoder_by_name (ext))) {
4271         id = codec->id;
4272         audio = TRUE;
4273       }
4274     }
4275   } else if (!strncmp (mimetype, "video/x-gst-av-", 15)) {
4276     gchar ext[16];
4277     AVCodec *codec;
4278
4279     if (strlen (mimetype) <= 30 &&
4280         sscanf (mimetype, "video/x-gst-av-%s", ext) == 1) {
4281       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4282           (codec = avcodec_find_encoder_by_name (ext))) {
4283         id = codec->id;
4284         video = TRUE;
4285       }
4286     }
4287   }
4288
4289   if (context != NULL) {
4290     if (video == TRUE) {
4291       context->codec_type = AVMEDIA_TYPE_VIDEO;
4292     } else if (audio == TRUE) {
4293       context->codec_type = AVMEDIA_TYPE_AUDIO;
4294     } else {
4295       context->codec_type = AVMEDIA_TYPE_UNKNOWN;
4296     }
4297     context->codec_id = id;
4298     gst_ffmpeg_caps_with_codecid (id, context->codec_type, caps, context);
4299   }
4300
4301   if (id != AV_CODEC_ID_NONE) {
4302     GST_DEBUG ("The id=%d belongs to the caps %" GST_PTR_FORMAT, id, caps);
4303   } else {
4304     GST_WARNING ("Couldn't figure out the id for caps %" GST_PTR_FORMAT, caps);
4305   }
4306
4307   return id;
4308 }