a7c64e010617553911aafc833aa31d1bc4b58c89
[platform/upstream/gstreamer.git] / subprojects / gst-libav / ext / libav / gstavcodecmap.c
1 /* GStreamer
2  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
3  * This file:
4  * Copyright (c) 2002-2004 Ronald Bultje <rbultje@ronald.bitfreak.net>
5  *
6  * This library is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Library General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Library General Public License for more details.
15  *
16  * You should have received a copy of the GNU Library General Public
17  * License along with this library; if not, write to the
18  * Free Software Foundation, Inc., 51 Franklin St, Fifth Floor,
19  * Boston, MA 02110-1301, USA.
20  */
21
22 #ifdef HAVE_CONFIG_H
23 #include "config.h"
24 #endif
25
26 #include <string.h>
27
28 #include <gst/gst.h>
29 #include <libavcodec/avcodec.h>
30 #include <libavutil/channel_layout.h>
31
32 #include "gstav.h"
33 #include "gstavcodecmap.h"
34
35 #include <gst/video/video.h>
36 #include <gst/audio/audio.h>
37 #include <gst/pbutils/codec-utils.h>
38
39 /* IMPORTANT: Keep this sorted by the ffmpeg channel masks */
40 static const struct
41 {
42   guint64 ff;
43   GstAudioChannelPosition gst;
44 } _ff_to_gst_layout[] = {
45   {
46   AV_CH_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
47   AV_CH_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}, {
48   AV_CH_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_CENTER}, {
49   AV_CH_LOW_FREQUENCY, GST_AUDIO_CHANNEL_POSITION_LFE1}, {
50   AV_CH_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_REAR_LEFT}, {
51   AV_CH_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_REAR_RIGHT}, {
52   AV_CH_FRONT_LEFT_OF_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT_OF_CENTER}, {
53   AV_CH_FRONT_RIGHT_OF_CENTER,
54         GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT_OF_CENTER}, {
55   AV_CH_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_REAR_CENTER}, {
56   AV_CH_SIDE_LEFT, GST_AUDIO_CHANNEL_POSITION_SIDE_LEFT}, {
57   AV_CH_SIDE_RIGHT, GST_AUDIO_CHANNEL_POSITION_SIDE_RIGHT}, {
58   AV_CH_TOP_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_CENTER}, {
59   AV_CH_TOP_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_LEFT}, {
60   AV_CH_TOP_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_CENTER}, {
61   AV_CH_TOP_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_RIGHT}, {
62   AV_CH_TOP_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_LEFT}, {
63   AV_CH_TOP_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_CENTER}, {
64   AV_CH_TOP_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_RIGHT}, {
65   AV_CH_STEREO_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
66   AV_CH_STEREO_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}
67 };
68
69 static guint64
70 gst_ffmpeg_channel_positions_to_layout (GstAudioChannelPosition * pos,
71     gint channels)
72 {
73   gint i, j;
74   guint64 ret = 0;
75   gint channels_found = 0;
76
77   if (!pos)
78     return 0;
79
80   if (channels == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
81     return AV_CH_LAYOUT_MONO;
82
83   for (i = 0; i < channels; i++) {
84     for (j = 0; j < G_N_ELEMENTS (_ff_to_gst_layout); j++) {
85       if (_ff_to_gst_layout[j].gst == pos[i]) {
86         ret |= _ff_to_gst_layout[j].ff;
87         channels_found++;
88         break;
89       }
90     }
91   }
92
93   if (channels_found != channels)
94     return 0;
95   return ret;
96 }
97
98 gboolean
99 gst_ffmpeg_channel_layout_to_gst (guint64 channel_layout, gint channels,
100     GstAudioChannelPosition * pos)
101 {
102   guint nchannels = 0;
103   gboolean none_layout = FALSE;
104
105   if (channel_layout == 0 || channels > 64) {
106     nchannels = channels;
107     none_layout = TRUE;
108   } else {
109     guint i, j;
110
111     /* Special path for mono, as AV_CH_LAYOUT_MONO is the same
112      * as FRONT_CENTER but we distinguish between the two in
113      * GStreamer
114      */
115     if (channels == 1 && channel_layout == AV_CH_LAYOUT_MONO) {
116       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
117       return TRUE;
118     }
119
120     for (i = 0; i < 64; i++) {
121       if ((channel_layout & (G_GUINT64_CONSTANT (1) << i)) != 0) {
122         nchannels++;
123       }
124     }
125
126     if (nchannels != channels) {
127       GST_ERROR ("Number of channels is different (%u != %u)", channels,
128           nchannels);
129       nchannels = channels;
130       none_layout = TRUE;
131     } else {
132
133       for (i = 0, j = 0; i < G_N_ELEMENTS (_ff_to_gst_layout); i++) {
134         if ((channel_layout & _ff_to_gst_layout[i].ff) != 0) {
135           pos[j++] = _ff_to_gst_layout[i].gst;
136
137           if (_ff_to_gst_layout[i].gst == GST_AUDIO_CHANNEL_POSITION_NONE)
138             none_layout = TRUE;
139         }
140       }
141
142       if (j != nchannels) {
143         GST_WARNING
144             ("Unknown channels in channel layout - assuming NONE layout");
145         none_layout = TRUE;
146       }
147     }
148   }
149
150   if (!none_layout
151       && !gst_audio_check_valid_channel_positions (pos, nchannels, FALSE)) {
152     GST_ERROR ("Invalid channel layout %" G_GUINT64_FORMAT
153         " - assuming NONE layout", channel_layout);
154     none_layout = TRUE;
155   }
156
157   if (none_layout) {
158     if (nchannels == 1) {
159       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
160     } else if (nchannels == 2) {
161       pos[0] = GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT;
162       pos[1] = GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT;
163     } else {
164       guint i;
165
166       for (i = 0; i < nchannels && i < 64; i++)
167         pos[i] = GST_AUDIO_CHANNEL_POSITION_NONE;
168     }
169   }
170
171   return TRUE;
172 }
173
174 static gboolean
175 _gst_value_list_contains (const GValue * list, const GValue * value)
176 {
177   guint i, n;
178   const GValue *tmp;
179
180   n = gst_value_list_get_size (list);
181   for (i = 0; i < n; i++) {
182     tmp = gst_value_list_get_value (list, i);
183     if (gst_value_compare (value, tmp) == GST_VALUE_EQUAL)
184       return TRUE;
185   }
186
187   return FALSE;
188 }
189
190 static void
191 gst_ffmpeg_video_set_pix_fmts (GstCaps * caps, const enum AVPixelFormat *fmts)
192 {
193   GValue va = { 0, };
194   GValue v = { 0, };
195   GstVideoFormat format;
196
197   if (!fmts || fmts[0] == -1) {
198     gint i;
199
200     g_value_init (&va, GST_TYPE_LIST);
201     g_value_init (&v, G_TYPE_STRING);
202     for (i = 0; i <= AV_PIX_FMT_NB; i++) {
203       format = gst_ffmpeg_pixfmt_to_videoformat (i);
204       if (format == GST_VIDEO_FORMAT_UNKNOWN)
205         continue;
206       g_value_set_string (&v, gst_video_format_to_string (format));
207       gst_value_list_append_value (&va, &v);
208     }
209     gst_caps_set_value (caps, "format", &va);
210     g_value_unset (&v);
211     g_value_unset (&va);
212     return;
213   }
214
215   /* Only a single format */
216   g_value_init (&va, GST_TYPE_LIST);
217   g_value_init (&v, G_TYPE_STRING);
218   while (*fmts != -1) {
219     format = gst_ffmpeg_pixfmt_to_videoformat (*fmts);
220     if (format != GST_VIDEO_FORMAT_UNKNOWN) {
221       g_value_set_string (&v, gst_video_format_to_string (format));
222       /* Only append values we don't have yet */
223       if (!_gst_value_list_contains (&va, &v))
224         gst_value_list_append_value (&va, &v);
225     }
226     fmts++;
227   }
228   if (gst_value_list_get_size (&va) == 1) {
229     /* The single value is still in v */
230     gst_caps_set_value (caps, "format", &v);
231   } else if (gst_value_list_get_size (&va) > 1) {
232     gst_caps_set_value (caps, "format", &va);
233   }
234   g_value_unset (&v);
235   g_value_unset (&va);
236 }
237
238 /* this macro makes a caps width fixed or unfixed width/height
239  * properties depending on whether we've got a context.
240  *
241  * See below for why we use this.
242  *
243  * We should actually do this stuff at the end, like in riff-media.c,
244  * but I'm too lazy today. Maybe later.
245  */
246 static GstCaps *
247 gst_ff_vid_caps_new (AVCodecContext * context, const AVCodec * codec,
248     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
249     const char *fieldname, ...)
250 {
251   GstCaps *caps = NULL;
252   va_list var_args;
253   gint i;
254
255   GST_LOG ("context:%p, codec_id:%d, mimetype:%s", context, codec_id, mimetype);
256
257   /* fixed, non probing context */
258   if (context != NULL && context->width != -1) {
259     gint num, denom;
260
261     caps = gst_caps_new_simple (mimetype,
262         "width", G_TYPE_INT, context->width,
263         "height", G_TYPE_INT, context->height, NULL);
264
265     num = context->framerate.num;
266     denom = context->framerate.den;
267
268     if (!denom) {
269       GST_LOG ("invalid framerate: %d/0, -> %d/1", num, num);
270       denom = 1;
271     }
272     if (gst_util_fraction_compare (num, denom, 1000, 1) > 0) {
273       GST_LOG ("excessive framerate: %d/%d, -> 0/1", num, denom);
274       num = 0;
275       denom = 1;
276     }
277     GST_LOG ("setting framerate: %d/%d", num, denom);
278     gst_caps_set_simple (caps,
279         "framerate", GST_TYPE_FRACTION, num, denom, NULL);
280   } else if (encode) {
281     /* so we are after restricted caps in this case */
282     switch (codec_id) {
283       case AV_CODEC_ID_H261:
284       {
285         caps = gst_caps_new_simple (mimetype,
286             "width", G_TYPE_INT, 352,
287             "height", G_TYPE_INT, 288,
288             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
289         gst_caps_append (caps, gst_caps_new_simple (mimetype,
290                 "width", G_TYPE_INT, 176,
291                 "height", G_TYPE_INT, 144,
292                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
293         break;
294       }
295       case AV_CODEC_ID_H263:
296       {
297         /* 128x96, 176x144, 352x288, 704x576, and 1408x1152. slightly reordered
298          * because we want automatic negotiation to go as close to 320x240 as
299          * possible. */
300         const static gint widths[] = { 352, 704, 176, 1408, 128 };
301         const static gint heights[] = { 288, 576, 144, 1152, 96 };
302         GstCaps *temp;
303         gint n_sizes = G_N_ELEMENTS (widths);
304
305         caps = gst_caps_new_empty ();
306         for (i = 0; i < n_sizes; i++) {
307           temp = gst_caps_new_simple (mimetype,
308               "width", G_TYPE_INT, widths[i],
309               "height", G_TYPE_INT, heights[i],
310               "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
311
312           gst_caps_append (caps, temp);
313         }
314         break;
315       }
316       case AV_CODEC_ID_DVVIDEO:
317       {
318         static struct
319         {
320           const gchar *csp;
321           gint width, height;
322           gint par_n, par_d;
323           gint framerate_n, framerate_d;
324         } profiles[] = {
325           {
326           "Y41B", 720, 480, 8, 9, 30000, 1001}, {
327           "Y41B", 720, 480, 32, 27, 30000, 1001}, {
328           "Y42B", 720, 480, 8, 9, 30000, 1001}, {
329           "Y42B", 720, 480, 32, 27, 30000, 1001}, {
330           "I420", 720, 576, 16, 15, 25, 1}, {
331           "I420", 720, 576, 64, 45, 25, 1}, {
332           "Y41B", 720, 576, 16, 15, 25, 1}, {
333           "Y41B", 720, 576, 64, 45, 25, 1}, {
334           "Y42B", 720, 576, 16, 15, 25, 1}, {
335           "Y42B", 720, 576, 64, 45, 25, 1}, {
336           "Y42B", 1280, 1080, 1, 1, 30000, 1001}, {
337           "Y42B", 1280, 1080, 3, 2, 30000, 1001}, {
338           "Y42B", 1440, 1080, 1, 1, 25, 1}, {
339           "Y42B", 1440, 1080, 4, 3, 25, 1}, {
340           "Y42B", 960, 720, 1, 1, 60000, 1001}, {
341           "Y42B", 960, 720, 4, 3, 60000, 1001}, {
342           "Y42B", 960, 720, 1, 1, 50, 1}, {
343         "Y42B", 960, 720, 4, 3, 50, 1},};
344         GstCaps *temp;
345         gint n_sizes = G_N_ELEMENTS (profiles);
346
347         if (strcmp (mimetype, "video/x-raw") == 0) {
348           caps = gst_caps_new_empty ();
349           for (i = 0; i < n_sizes; i++) {
350             temp = gst_caps_new_simple (mimetype,
351                 "format", G_TYPE_STRING, profiles[i].csp,
352                 "width", G_TYPE_INT, profiles[i].width,
353                 "height", G_TYPE_INT, profiles[i].height,
354                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
355                 profiles[i].framerate_d, "pixel-aspect-ratio",
356                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
357
358             gst_caps_append (caps, temp);
359           }
360         } else {
361           caps = gst_caps_new_empty ();
362           for (i = 0; i < n_sizes; i++) {
363             temp = gst_caps_new_simple (mimetype,
364                 "width", G_TYPE_INT, profiles[i].width,
365                 "height", G_TYPE_INT, profiles[i].height,
366                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
367                 profiles[i].framerate_d, "pixel-aspect-ratio",
368                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
369
370             gst_caps_append (caps, temp);
371           }
372         }
373         break;
374       }
375       case AV_CODEC_ID_DNXHD:
376       {
377         caps = gst_caps_new_simple (mimetype,
378             "width", G_TYPE_INT, 1920,
379             "height", G_TYPE_INT, 1080,
380             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
381         gst_caps_append (caps, gst_caps_new_simple (mimetype,
382                 "width", G_TYPE_INT, 1280,
383                 "height", G_TYPE_INT, 720,
384                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
385         break;
386       }
387       default:
388       {
389         if (codec && codec->supported_framerates
390             && codec->supported_framerates[0].num != 0
391             && codec->supported_framerates[0].den != 0) {
392           GValue va = { 0, };
393           GValue v = { 0, };
394           const AVRational *rates = codec->supported_framerates;
395
396           if (rates[1].num == 0 && rates[1].den == 0) {
397             caps =
398                 gst_caps_new_simple (mimetype, "framerate", GST_TYPE_FRACTION,
399                 rates[0].num, rates[0].den, NULL);
400           } else {
401             g_value_init (&va, GST_TYPE_LIST);
402             g_value_init (&v, GST_TYPE_FRACTION);
403
404             while (rates->num != 0 && rates->den != 0) {
405               gst_value_set_fraction (&v, rates->num, rates->den);
406               gst_value_list_append_value (&va, &v);
407               rates++;
408             }
409
410             caps = gst_caps_new_simple (mimetype, NULL, NULL, NULL);
411             gst_caps_set_value (caps, "framerate", &va);
412             g_value_unset (&va);
413             g_value_unset (&v);
414           }
415
416         } else {
417           caps = gst_caps_new_empty_simple (mimetype);
418         }
419
420         break;
421       }
422     }
423   }
424
425   /* no fixed caps or special restrictions applied;
426    * default unfixed setting */
427   if (!caps) {
428     GST_DEBUG ("Creating default caps");
429     caps = gst_caps_new_empty_simple (mimetype);
430   }
431
432   va_start (var_args, fieldname);
433   gst_caps_set_simple_valist (caps, fieldname, var_args);
434   va_end (var_args);
435
436   return caps;
437 }
438
439 static gint
440 get_nbits_set (guint64 n)
441 {
442   gint i, x;
443
444   x = 0;
445   for (i = 0; i < 64; i++) {
446     if ((n & (G_GUINT64_CONSTANT (1) << i)))
447       x++;
448   }
449
450   return x;
451 }
452
453 static void
454 gst_ffmpeg_audio_set_sample_fmts (GstCaps * caps,
455     const enum AVSampleFormat *fmts, gboolean always_interleaved)
456 {
457   GValue va = { 0, };
458   GValue vap = { 0, };
459   GValue v = { 0, };
460   GstAudioFormat format;
461   GstAudioLayout layout;
462   GstCaps *caps_copy = NULL;
463
464   if (!fmts || fmts[0] == -1) {
465     gint i;
466
467     g_value_init (&va, GST_TYPE_LIST);
468     g_value_init (&v, G_TYPE_STRING);
469     for (i = 0; i <= AV_SAMPLE_FMT_DBL; i++) {
470       format = gst_ffmpeg_smpfmt_to_audioformat (i, NULL);
471       if (format == GST_AUDIO_FORMAT_UNKNOWN)
472         continue;
473       g_value_set_string (&v, gst_audio_format_to_string (format));
474       gst_value_list_append_value (&va, &v);
475     }
476     gst_caps_set_value (caps, "format", &va);
477     if (!always_interleaved) {
478       g_value_init (&vap, GST_TYPE_LIST);
479       g_value_set_string (&v, "interleaved");
480       gst_value_list_append_value (&vap, &v);
481       g_value_set_string (&v, "non-interleaved");
482       gst_value_list_append_value (&vap, &v);
483       gst_caps_set_value (caps, "layout", &vap);
484       g_value_unset (&vap);
485     } else {
486       gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
487     }
488     g_value_unset (&v);
489     g_value_unset (&va);
490     return;
491   }
492
493   g_value_init (&va, GST_TYPE_LIST);
494   g_value_init (&vap, GST_TYPE_LIST);
495   g_value_init (&v, G_TYPE_STRING);
496   while (*fmts != -1) {
497     format = gst_ffmpeg_smpfmt_to_audioformat (*fmts, &layout);
498     if (format != GST_AUDIO_FORMAT_UNKNOWN) {
499       g_value_set_string (&v, gst_audio_format_to_string (format));
500       /* Only append values we don't have yet */
501       if (layout == GST_AUDIO_LAYOUT_INTERLEAVED || always_interleaved) {
502         if (!_gst_value_list_contains (&va, &v))
503           gst_value_list_append_value (&va, &v);
504       } else {
505         if (!_gst_value_list_contains (&vap, &v))
506           gst_value_list_append_value (&vap, &v);
507       }
508     }
509     fmts++;
510   }
511   if (gst_value_list_get_size (&va) >= 1 && gst_value_list_get_size (&vap) >= 1) {
512     caps_copy = gst_caps_copy (caps);
513   }
514   if (gst_value_list_get_size (&va) == 1) {
515     gst_caps_set_value (caps, "format", gst_value_list_get_value (&va, 0));
516     gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
517   } else if (gst_value_list_get_size (&va) > 1) {
518     gst_caps_set_value (caps, "format", &va);
519     gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
520   }
521   if (gst_value_list_get_size (&vap) == 1) {
522     gst_caps_set_value (caps_copy ? caps_copy : caps, "format",
523         gst_value_list_get_value (&vap, 0));
524     gst_caps_set_simple (caps_copy ? caps_copy : caps, "layout", G_TYPE_STRING,
525         "non-interleaved", NULL);
526   } else if (gst_value_list_get_size (&vap) > 1) {
527     gst_caps_set_value (caps_copy ? caps_copy : caps, "format", &vap);
528     gst_caps_set_simple (caps_copy ? caps_copy : caps, "layout", G_TYPE_STRING,
529         "non-interleaved", NULL);
530   }
531   if (caps_copy) {
532     gst_caps_append (caps, caps_copy);
533   }
534   g_value_unset (&v);
535   g_value_unset (&va);
536   g_value_unset (&vap);
537 }
538
539 /* same for audio - now with channels/sample rate
540  */
541 static GstCaps *
542 gst_ff_aud_caps_new (AVCodecContext * context, AVCodec * codec,
543     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
544     const char *fieldname, ...)
545 {
546   GstCaps *caps = NULL;
547   gint i;
548   va_list var_args;
549
550   /* fixed, non-probing context */
551   if (context != NULL && context->channels != -1) {
552     GstAudioChannelPosition pos[64];
553     guint64 mask;
554
555     caps = gst_caps_new_simple (mimetype,
556         "rate", G_TYPE_INT, context->sample_rate,
557         "channels", G_TYPE_INT, context->channels, NULL);
558
559     if (context->channels > 1 &&
560         gst_ffmpeg_channel_layout_to_gst (context->channel_layout,
561             context->channels, pos) &&
562         gst_audio_channel_positions_to_mask (pos, context->channels, FALSE,
563             &mask)) {
564       gst_caps_set_simple (caps, "channel-mask", GST_TYPE_BITMASK, mask, NULL);
565     }
566   } else if (encode) {
567     gint maxchannels = 2;
568     const gint *rates = NULL;
569     gint n_rates = 0;
570
571     /* so we must be after restricted caps in this case */
572     switch (codec_id) {
573       case AV_CODEC_ID_AAC:
574       case AV_CODEC_ID_AAC_LATM:
575       case AV_CODEC_ID_DTS:
576         maxchannels = 6;
577         break;
578       case AV_CODEC_ID_MP2:
579       {
580         const static gint l_rates[] =
581             { 48000, 44100, 32000, 24000, 22050, 16000 };
582         n_rates = G_N_ELEMENTS (l_rates);
583         rates = l_rates;
584         break;
585       }
586       case AV_CODEC_ID_EAC3:
587       case AV_CODEC_ID_AC3:
588       {
589         const static gint l_rates[] = { 48000, 44100, 32000 };
590         maxchannels = 6;
591         n_rates = G_N_ELEMENTS (l_rates);
592         rates = l_rates;
593         break;
594       }
595       case AV_CODEC_ID_ADPCM_G722:
596       {
597         const static gint l_rates[] = { 16000 };
598         n_rates = G_N_ELEMENTS (l_rates);
599         rates = l_rates;
600         maxchannels = 1;
601         break;
602       }
603       case AV_CODEC_ID_ADPCM_G726:
604       {
605         const static gint l_rates[] = { 8000 };
606         n_rates = G_N_ELEMENTS (l_rates);
607         rates = l_rates;
608         maxchannels = 1;
609         break;
610       }
611       case AV_CODEC_ID_ADPCM_SWF:
612       {
613         const static gint l_rates[] = { 11025, 22050, 44100 };
614         n_rates = G_N_ELEMENTS (l_rates);
615         rates = l_rates;
616         break;
617       }
618       case AV_CODEC_ID_ROQ_DPCM:
619       {
620         const static gint l_rates[] = { 22050 };
621         n_rates = G_N_ELEMENTS (l_rates);
622         rates = l_rates;
623         break;
624       }
625       case AV_CODEC_ID_AMR_NB:
626       {
627         const static gint l_rates[] = { 8000 };
628         maxchannels = 1;
629         n_rates = G_N_ELEMENTS (l_rates);
630         rates = l_rates;
631         break;
632       }
633       case AV_CODEC_ID_AMR_WB:
634       {
635         const static gint l_rates[] = { 16000 };
636         maxchannels = 1;
637         n_rates = G_N_ELEMENTS (l_rates);
638         rates = l_rates;
639         break;
640       }
641       default:
642         break;
643     }
644
645     /* regardless of encode/decode, open up channels if applicable */
646     /* Until decoders/encoders expose the maximum number of channels
647      * they support, we whitelist them here. */
648     switch (codec_id) {
649       case AV_CODEC_ID_WMAPRO:
650       case AV_CODEC_ID_TRUEHD:
651         maxchannels = 8;
652         break;
653       default:
654         break;
655     }
656
657     if (codec && codec->channel_layouts) {
658       const uint64_t *layouts = codec->channel_layouts;
659       GstAudioChannelPosition pos[64];
660
661       caps = gst_caps_new_empty ();
662       while (*layouts) {
663         gint nbits_set = get_nbits_set (*layouts);
664
665         if (gst_ffmpeg_channel_layout_to_gst (*layouts, nbits_set, pos)) {
666           guint64 mask;
667
668           if (gst_audio_channel_positions_to_mask (pos, nbits_set, FALSE,
669                   &mask)) {
670             GstStructure *s =
671                 gst_structure_new (mimetype, "channels", G_TYPE_INT, nbits_set,
672                 NULL);
673
674             /* No need to require a channel mask for mono or stereo */
675             if (!(nbits_set == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
676                 && !(nbits_set == 2
677                     && pos[0] == GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT
678                     && pos[1] == GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT))
679               gst_structure_set (s, "channel-mask", GST_TYPE_BITMASK, mask,
680                   NULL);
681
682             gst_caps_append_structure (caps, s);
683           }
684         }
685         layouts++;
686       }
687     } else {
688       if (maxchannels == 1)
689         caps = gst_caps_new_simple (mimetype,
690             "channels", G_TYPE_INT, maxchannels, NULL);
691       else
692         caps = gst_caps_new_simple (mimetype,
693             "channels", GST_TYPE_INT_RANGE, 1, maxchannels, NULL);
694     }
695
696     if (n_rates) {
697       GValue list = { 0, };
698
699       g_value_init (&list, GST_TYPE_LIST);
700       for (i = 0; i < n_rates; i++) {
701         GValue v = { 0, };
702
703         g_value_init (&v, G_TYPE_INT);
704         g_value_set_int (&v, rates[i]);
705         gst_value_list_append_value (&list, &v);
706         g_value_unset (&v);
707       }
708       gst_caps_set_value (caps, "rate", &list);
709       g_value_unset (&list);
710     } else if (codec && codec->supported_samplerates
711         && codec->supported_samplerates[0]) {
712       GValue va = { 0, };
713       GValue v = { 0, };
714
715       if (!codec->supported_samplerates[1]) {
716         gst_caps_set_simple (caps, "rate", G_TYPE_INT,
717             codec->supported_samplerates[0], NULL);
718       } else {
719         const int *rates = codec->supported_samplerates;
720
721         g_value_init (&va, GST_TYPE_LIST);
722         g_value_init (&v, G_TYPE_INT);
723
724         while (*rates) {
725           g_value_set_int (&v, *rates);
726           gst_value_list_append_value (&va, &v);
727           rates++;
728         }
729         gst_caps_set_value (caps, "rate", &va);
730         g_value_unset (&va);
731         g_value_unset (&v);
732       }
733     } else {
734       gst_caps_set_simple (caps, "rate", GST_TYPE_INT_RANGE, 4000, 96000, NULL);
735     }
736   } else {
737     caps = gst_caps_new_empty_simple (mimetype);
738   }
739
740   va_start (var_args, fieldname);
741   gst_caps_set_simple_valist (caps, fieldname, var_args);
742   va_end (var_args);
743
744   return caps;
745 }
746
747 /* Check if the given codec ID is an image format -- for now this is just
748  * anything whose caps is image/... */
749 gboolean
750 gst_ffmpeg_codecid_is_image (enum AVCodecID codec_id)
751 {
752   switch (codec_id) {
753     case AV_CODEC_ID_MJPEG:
754     case AV_CODEC_ID_LJPEG:
755     case AV_CODEC_ID_GIF:
756     case AV_CODEC_ID_PPM:
757     case AV_CODEC_ID_PBM:
758     case AV_CODEC_ID_PCX:
759     case AV_CODEC_ID_SGI:
760     case AV_CODEC_ID_TARGA:
761     case AV_CODEC_ID_TIFF:
762     case AV_CODEC_ID_SUNRAST:
763     case AV_CODEC_ID_BMP:
764       return TRUE;
765
766     default:
767       return FALSE;
768   }
769 }
770
771 /* Convert a FFMPEG codec ID and optional AVCodecContext
772  * to a GstCaps. If the context is ommitted, no fixed values
773  * for video/audio size will be included in the GstCaps
774  *
775  * CodecID is primarily meant for compressed data GstCaps!
776  *
777  * encode is a special parameter. gstffmpegdec will say
778  * FALSE, gstffmpegenc will say TRUE. The output caps
779  * depends on this, in such a way that it will be very
780  * specific, defined, fixed and correct caps for encoders,
781  * yet very wide, "forgiving" caps for decoders. Example
782  * for mp3: decode: audio/mpeg,mpegversion=1,layer=[1-3]
783  * but encode: audio/mpeg,mpegversion=1,layer=3,bitrate=x,
784  * rate=x,channels=x.
785  */
786
787 GstCaps *
788 gst_ffmpeg_codecid_to_caps (enum AVCodecID codec_id,
789     AVCodecContext * context, gboolean encode)
790 {
791   GstCaps *caps = NULL;
792   gboolean buildcaps = FALSE;
793
794   GST_LOG ("codec_id:%d, context:%p, encode:%d", codec_id, context, encode);
795
796   switch (codec_id) {
797     case AV_CODEC_ID_MPEG1VIDEO:
798       /* FIXME: bitrate */
799       caps = gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
800           "mpegversion", G_TYPE_INT, 1,
801           "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
802       break;
803
804     case AV_CODEC_ID_MPEG2VIDEO:
805       if (encode) {
806         /* FIXME: bitrate */
807         caps =
808             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
809             "mpegversion", G_TYPE_INT, 2, "systemstream", G_TYPE_BOOLEAN, FALSE,
810             NULL);
811       } else {
812         /* decode both MPEG-1 and MPEG-2; width/height/fps are all in
813          * the MPEG video stream headers, so may be omitted from caps. */
814         caps = gst_caps_new_simple ("video/mpeg",
815             "mpegversion", GST_TYPE_INT_RANGE, 1, 2,
816             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
817       }
818       break;
819
820     case AV_CODEC_ID_H263:
821       if (encode) {
822         caps =
823             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
824             "video/x-h263", "variant", G_TYPE_STRING, "itu", "h263version",
825             G_TYPE_STRING, "h263", NULL);
826       } else {
827         /* don't pass codec_id, we can decode other variants with the H263
828          * decoder that don't have specific size requirements
829          */
830         caps =
831             gst_ff_vid_caps_new (context, NULL, AV_CODEC_ID_NONE, encode,
832             "video/x-h263", "variant", G_TYPE_STRING, "itu", NULL);
833       }
834       break;
835
836     case AV_CODEC_ID_H263P:
837       caps =
838           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h263",
839           "variant", G_TYPE_STRING, "itu", "h263version", G_TYPE_STRING,
840           "h263p", NULL);
841       if (encode && context) {
842
843         gst_caps_set_simple (caps,
844             "annex-f", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_4MV,
845             "annex-j", G_TYPE_BOOLEAN,
846             context->flags & AV_CODEC_FLAG_LOOP_FILTER,
847             "annex-i", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_AC_PRED,
848             "annex-t", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_AC_PRED,
849             NULL);
850       }
851       break;
852
853     case AV_CODEC_ID_H263I:
854       caps =
855           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
856           "video/x-intel-h263", "variant", G_TYPE_STRING, "intel", NULL);
857       break;
858
859     case AV_CODEC_ID_H261:
860       caps =
861           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h261",
862           NULL);
863       break;
864
865     case AV_CODEC_ID_RV10:
866     case AV_CODEC_ID_RV20:
867     case AV_CODEC_ID_RV30:
868     case AV_CODEC_ID_RV40:
869     {
870       gint version;
871
872       switch (codec_id) {
873         case AV_CODEC_ID_RV40:
874           version = 4;
875           break;
876         case AV_CODEC_ID_RV30:
877           version = 3;
878           break;
879         case AV_CODEC_ID_RV20:
880           version = 2;
881           break;
882         default:
883           version = 1;
884           break;
885       }
886
887       caps =
888           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
889           "video/x-pn-realvideo", "rmversion", G_TYPE_INT, version, NULL);
890       if (context) {
891         if (context->extradata_size >= 8) {
892           gst_caps_set_simple (caps,
893               "subformat", G_TYPE_INT, GST_READ_UINT32_BE (context->extradata),
894               NULL);
895         }
896       }
897     }
898       break;
899
900     case AV_CODEC_ID_MP1:
901       /* FIXME: bitrate */
902       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
903           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 1, NULL);
904       break;
905
906     case AV_CODEC_ID_MP2:
907       /* FIXME: bitrate */
908       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
909           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 2, NULL);
910       break;
911
912     case AV_CODEC_ID_MP3:
913       if (encode) {
914         /* FIXME: bitrate */
915         caps =
916             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
917             "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 3, NULL);
918       } else {
919         /* Decodes MPEG-1 layer 1/2/3. Samplerate, channels et al are
920          * in the MPEG audio header, so may be omitted from caps. */
921         caps = gst_caps_new_simple ("audio/mpeg",
922             "mpegversion", G_TYPE_INT, 1,
923             "layer", GST_TYPE_INT_RANGE, 1, 3, NULL);
924       }
925       break;
926
927     case AV_CODEC_ID_MUSEPACK7:
928       caps =
929           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
930           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 7,
931           NULL);
932       break;
933
934     case AV_CODEC_ID_MUSEPACK8:
935       caps =
936           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
937           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 8,
938           NULL);
939       break;
940
941     case AV_CODEC_ID_AC3:
942       /* FIXME: bitrate */
943       caps =
944           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-ac3",
945           NULL);
946       break;
947
948     case AV_CODEC_ID_EAC3:
949       /* FIXME: bitrate */
950       caps =
951           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-eac3",
952           NULL);
953       break;
954
955     case AV_CODEC_ID_TRUEHD:
956       caps =
957           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
958           "audio/x-true-hd", NULL);
959       break;
960
961     case AV_CODEC_ID_ATRAC1:
962       caps =
963           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
964           "audio/x-vnd.sony.atrac1", NULL);
965       break;
966
967     case AV_CODEC_ID_ATRAC3:
968       caps =
969           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
970           "audio/x-vnd.sony.atrac3", NULL);
971       break;
972
973     case AV_CODEC_ID_DTS:
974       caps =
975           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dts",
976           NULL);
977       break;
978
979     case AV_CODEC_ID_APE:
980       caps =
981           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
982           "audio/x-ffmpeg-parsed-ape", NULL);
983       if (context) {
984         gst_caps_set_simple (caps,
985             "depth", G_TYPE_INT, context->bits_per_coded_sample, NULL);
986       }
987       break;
988
989     case AV_CODEC_ID_MLP:
990       caps =
991           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mlp",
992           NULL);
993       break;
994
995     case AV_CODEC_ID_METASOUND:
996       caps =
997           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
998           "audio/x-voxware", NULL);
999       break;
1000
1001     case AV_CODEC_ID_IMC:
1002       caps =
1003           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-imc",
1004           NULL);
1005       break;
1006
1007       /* MJPEG is normal JPEG, Motion-JPEG and Quicktime MJPEG-A. MJPEGB
1008        * is Quicktime's MJPEG-B. LJPEG is lossless JPEG. I don't know what
1009        * sp5x is, but it's apparently something JPEG... We don't separate
1010        * between those in GStreamer. Should we (at least between MJPEG,
1011        * MJPEG-B and sp5x decoding...)? */
1012     case AV_CODEC_ID_MJPEG:
1013     case AV_CODEC_ID_LJPEG:
1014       caps =
1015           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/jpeg",
1016           "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
1017       break;
1018
1019     case AV_CODEC_ID_JPEG2000:
1020       caps =
1021           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-j2c",
1022           NULL);
1023       if (!encode) {
1024         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1025                 encode, "image/x-jpc", NULL));
1026         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1027                 encode, "image/jp2", NULL));
1028       }
1029       break;
1030
1031     case AV_CODEC_ID_SP5X:
1032       caps =
1033           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/sp5x",
1034           NULL);
1035       break;
1036
1037     case AV_CODEC_ID_MJPEGB:
1038       caps =
1039           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1040           "video/x-mjpeg-b", NULL);
1041       break;
1042
1043     case AV_CODEC_ID_MPEG4:
1044       if (encode && context != NULL) {
1045         /* I'm not exactly sure what ffmpeg outputs... ffmpeg itself uses
1046          * the AVI fourcc 'DIVX', but 'mp4v' for Quicktime... */
1047         switch (context->codec_tag) {
1048           case GST_MAKE_FOURCC ('D', 'I', 'V', 'X'):
1049             caps =
1050                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1051                 "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL);
1052             break;
1053           case GST_MAKE_FOURCC ('m', 'p', '4', 'v'):
1054           default:
1055             /* FIXME: bitrate. libav doesn't expose the used profile and level */
1056             caps =
1057                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1058                 "video/mpeg", "systemstream", G_TYPE_BOOLEAN, FALSE,
1059                 "mpegversion", G_TYPE_INT, 4, NULL);
1060             break;
1061         }
1062       } else {
1063         /* The trick here is to separate xvid, divx, mpeg4, 3ivx et al */
1064         caps =
1065             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
1066             "mpegversion", G_TYPE_INT, 4, "systemstream", G_TYPE_BOOLEAN, FALSE,
1067             NULL);
1068
1069         if (encode) {
1070           GValue arr = { 0, };
1071           GValue item = { 0, };
1072
1073           g_value_init (&arr, GST_TYPE_LIST);
1074           g_value_init (&item, G_TYPE_STRING);
1075           g_value_set_string (&item, "simple");
1076           gst_value_list_append_value (&arr, &item);
1077           g_value_set_string (&item, "advanced-simple");
1078           gst_value_list_append_value (&arr, &item);
1079           g_value_unset (&item);
1080
1081           gst_caps_set_value (caps, "profile", &arr);
1082           g_value_unset (&arr);
1083
1084           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1085                   encode, "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL));
1086         } else {
1087           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1088                   encode, "video/x-divx", "divxversion", GST_TYPE_INT_RANGE, 4,
1089                   5, NULL));
1090         }
1091       }
1092       break;
1093
1094     case AV_CODEC_ID_RAWVIDEO:
1095       caps =
1096           gst_ffmpeg_codectype_to_video_caps (context, codec_id, encode, NULL);
1097       break;
1098
1099     case AV_CODEC_ID_MSMPEG4V1:
1100     case AV_CODEC_ID_MSMPEG4V2:
1101     case AV_CODEC_ID_MSMPEG4V3:
1102     {
1103       gint version = 41 + codec_id - AV_CODEC_ID_MSMPEG4V1;
1104
1105       /* encode-FIXME: bitrate */
1106       caps =
1107           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1108           "video/x-msmpeg", "msmpegversion", G_TYPE_INT, version, NULL);
1109       if (!encode && codec_id == AV_CODEC_ID_MSMPEG4V3) {
1110         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1111                 encode, "video/x-divx", "divxversion", G_TYPE_INT, 3, NULL));
1112       }
1113     }
1114       break;
1115
1116     case AV_CODEC_ID_WMV1:
1117     case AV_CODEC_ID_WMV2:
1118     {
1119       gint version = (codec_id == AV_CODEC_ID_WMV1) ? 1 : 2;
1120
1121       caps =
1122           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1123           "wmvversion", G_TYPE_INT, version, NULL);
1124     }
1125       break;
1126
1127     case AV_CODEC_ID_FLV1:
1128       caps =
1129           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1130           "video/x-flash-video", "flvversion", G_TYPE_INT, 1, NULL);
1131       break;
1132
1133     case AV_CODEC_ID_SVQ1:
1134       caps =
1135           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1136           "svqversion", G_TYPE_INT, 1, NULL);
1137       break;
1138
1139     case AV_CODEC_ID_SVQ3:
1140       caps =
1141           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1142           "svqversion", G_TYPE_INT, 3, NULL);
1143       break;
1144
1145     case AV_CODEC_ID_DVAUDIO:
1146       caps =
1147           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dv",
1148           NULL);
1149       break;
1150
1151     case AV_CODEC_ID_DVVIDEO:
1152     {
1153       if (encode && context) {
1154         const gchar *format;
1155
1156         switch (context->pix_fmt) {
1157           case AV_PIX_FMT_YUYV422:
1158             format = "YUY2";
1159             break;
1160           case AV_PIX_FMT_YUV420P:
1161             format = "I420";
1162             break;
1163           case AV_PIX_FMT_YUVA420P:
1164             format = "A420";
1165             break;
1166           case AV_PIX_FMT_YUV411P:
1167             format = "Y41B";
1168             break;
1169           case AV_PIX_FMT_YUV422P:
1170             format = "Y42B";
1171             break;
1172           case AV_PIX_FMT_YUV410P:
1173             format = "YUV9";
1174             break;
1175           default:
1176             GST_WARNING
1177                 ("Couldnt' find format for pixfmt %d, defaulting to I420",
1178                 context->pix_fmt);
1179             format = "I420";
1180             break;
1181         }
1182         caps =
1183             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1184             "systemstream", G_TYPE_BOOLEAN, FALSE, "format", G_TYPE_STRING,
1185             format, NULL);
1186       } else {
1187         caps =
1188             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1189             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
1190       }
1191     }
1192       break;
1193
1194     case AV_CODEC_ID_WMAV1:
1195     case AV_CODEC_ID_WMAV2:
1196     {
1197       gint version = (codec_id == AV_CODEC_ID_WMAV1) ? 1 : 2;
1198
1199       if (context) {
1200         caps =
1201             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1202             "wmaversion", G_TYPE_INT, version, "block_align", G_TYPE_INT,
1203             context->block_align, "bitrate", G_TYPE_INT,
1204             (guint) context->bit_rate, NULL);
1205       } else {
1206         caps =
1207             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1208             "wmaversion", G_TYPE_INT, version, "block_align",
1209             GST_TYPE_INT_RANGE, 0, G_MAXINT, "bitrate", GST_TYPE_INT_RANGE, 0,
1210             G_MAXINT, NULL);
1211       }
1212     }
1213       break;
1214     case AV_CODEC_ID_WMAPRO:
1215     {
1216       caps =
1217           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1218           "wmaversion", G_TYPE_INT, 3, NULL);
1219       break;
1220     }
1221     case AV_CODEC_ID_WMALOSSLESS:
1222     {
1223       caps =
1224           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1225           "wmaversion", G_TYPE_INT, 4, NULL);
1226       break;
1227     }
1228     case AV_CODEC_ID_WMAVOICE:
1229     {
1230       caps =
1231           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wms",
1232           NULL);
1233       break;
1234     }
1235
1236     case AV_CODEC_ID_XMA1:
1237     {
1238       caps =
1239           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-xma",
1240           "xmaversion", G_TYPE_INT, 1, NULL);
1241       break;
1242     }
1243     case AV_CODEC_ID_XMA2:
1244     {
1245       caps =
1246           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-xma",
1247           "xmaversion", G_TYPE_INT, 2, NULL);
1248       break;
1249     }
1250
1251     case AV_CODEC_ID_MACE3:
1252     case AV_CODEC_ID_MACE6:
1253     {
1254       gint version = (codec_id == AV_CODEC_ID_MACE3) ? 3 : 6;
1255
1256       caps =
1257           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mace",
1258           "maceversion", G_TYPE_INT, version, NULL);
1259     }
1260       break;
1261
1262     case AV_CODEC_ID_HUFFYUV:
1263       caps =
1264           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1265           "video/x-huffyuv", NULL);
1266       if (context) {
1267         gst_caps_set_simple (caps,
1268             "bpp", G_TYPE_INT, context->bits_per_coded_sample, NULL);
1269       }
1270       break;
1271
1272     case AV_CODEC_ID_CYUV:
1273       caps =
1274           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1275           "video/x-compressed-yuv", NULL);
1276       break;
1277
1278     case AV_CODEC_ID_H264:
1279       caps =
1280           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h264",
1281           "alignment", G_TYPE_STRING, "au", NULL);
1282       if (!encode) {
1283         GValue arr = { 0, };
1284         GValue item = { 0, };
1285         g_value_init (&arr, GST_TYPE_LIST);
1286         g_value_init (&item, G_TYPE_STRING);
1287         g_value_set_string (&item, "avc");
1288         gst_value_list_append_value (&arr, &item);
1289         g_value_set_string (&item, "byte-stream");
1290         gst_value_list_append_value (&arr, &item);
1291         g_value_unset (&item);
1292         gst_caps_set_value (caps, "stream-format", &arr);
1293         g_value_unset (&arr);
1294
1295         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1296                 encode, "video/x-h264", "alignment", G_TYPE_STRING, "nal",
1297                 "stream-format", G_TYPE_STRING, "byte-stream", NULL));
1298
1299       } else if (context) {
1300         /* FIXME: ffmpeg currently assumes AVC if there is extradata and
1301          * byte-stream otherwise. See for example the MOV or MPEG-TS code.
1302          * ffmpeg does not distinguish the different types of AVC. */
1303         if (context->extradata_size > 0) {
1304           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "avc",
1305               NULL);
1306         } else {
1307           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING,
1308               "byte-stream", NULL);
1309         }
1310       }
1311       break;
1312
1313     case AV_CODEC_ID_HEVC:
1314       caps =
1315           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h265",
1316           "alignment", G_TYPE_STRING, "au", NULL);
1317       if (!encode) {
1318         GValue arr = { 0, };
1319         GValue item = { 0, };
1320         g_value_init (&arr, GST_TYPE_LIST);
1321         g_value_init (&item, G_TYPE_STRING);
1322         g_value_set_string (&item, "hvc1");
1323         gst_value_list_append_value (&arr, &item);
1324         g_value_set_string (&item, "hev1");
1325         gst_value_list_append_value (&arr, &item);
1326         g_value_set_string (&item, "byte-stream");
1327         gst_value_list_append_value (&arr, &item);
1328         g_value_unset (&item);
1329         gst_caps_set_value (caps, "stream-format", &arr);
1330         g_value_unset (&arr);
1331       } else if (context) {
1332         /* FIXME: ffmpeg currently assumes HVC1 if there is extradata and
1333          * byte-stream otherwise. See for example the MOV or MPEG-TS code.
1334          * ffmpeg does not distinguish the different types: HVC1/HEV1/etc. */
1335         if (context->extradata_size > 0) {
1336           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "hvc1",
1337               NULL);
1338         } else {
1339           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING,
1340               "byte-stream", NULL);
1341         }
1342       }
1343       break;
1344
1345     case AV_CODEC_ID_INDEO5:
1346       caps =
1347           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1348           "indeoversion", G_TYPE_INT, 5, NULL);
1349       break;
1350
1351     case AV_CODEC_ID_INDEO4:
1352       caps =
1353           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1354           "indeoversion", G_TYPE_INT, 4, NULL);
1355       break;
1356
1357     case AV_CODEC_ID_INDEO3:
1358       caps =
1359           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1360           "indeoversion", G_TYPE_INT, 3, NULL);
1361       break;
1362
1363     case AV_CODEC_ID_INDEO2:
1364       caps =
1365           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1366           "indeoversion", G_TYPE_INT, 2, NULL);
1367       break;
1368
1369     case AV_CODEC_ID_FLASHSV:
1370       caps =
1371           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1372           "video/x-flash-screen", NULL);
1373       break;
1374
1375     case AV_CODEC_ID_FLASHSV2:
1376       caps =
1377           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1378           "video/x-flash-screen2", NULL);
1379       break;
1380
1381     case AV_CODEC_ID_VP3:
1382       caps =
1383           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp3",
1384           NULL);
1385       break;
1386
1387     case AV_CODEC_ID_VP5:
1388       caps =
1389           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp5",
1390           NULL);
1391       break;
1392
1393     case AV_CODEC_ID_VP6:
1394       caps =
1395           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp6",
1396           NULL);
1397       break;
1398
1399     case AV_CODEC_ID_VP6F:
1400       caps =
1401           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1402           "video/x-vp6-flash", NULL);
1403       break;
1404
1405     case AV_CODEC_ID_VP6A:
1406       caps =
1407           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1408           "video/x-vp6-alpha", NULL);
1409       break;
1410
1411     case AV_CODEC_ID_VP8:
1412       caps =
1413           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp8",
1414           NULL);
1415       break;
1416
1417     case AV_CODEC_ID_VP9:
1418       caps =
1419           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp9",
1420           NULL);
1421       break;
1422
1423     case AV_CODEC_ID_THEORA:
1424       caps =
1425           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1426           "video/x-theora", NULL);
1427       break;
1428
1429     case AV_CODEC_ID_CFHD:
1430       caps =
1431           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1432           "video/x-cineform", NULL);
1433       break;
1434
1435     case AV_CODEC_ID_SPEEDHQ:
1436       if (context && context->codec_tag) {
1437         gchar *variant = g_strdup_printf ("%" GST_FOURCC_FORMAT,
1438             GST_FOURCC_ARGS (context->codec_tag));
1439         caps =
1440             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1441             "video/x-speedhq", "variant", G_TYPE_STRING, variant, NULL);
1442         g_free (variant);
1443       } else {
1444         caps =
1445             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1446             "video/x-speedhq", NULL);
1447       }
1448       break;
1449
1450     case AV_CODEC_ID_AAC:
1451     {
1452       caps =
1453           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1454           NULL);
1455
1456       if (!encode) {
1457         GValue arr = { 0, };
1458         GValue item = { 0, };
1459
1460         g_value_init (&arr, GST_TYPE_LIST);
1461         g_value_init (&item, G_TYPE_INT);
1462         g_value_set_int (&item, 2);
1463         gst_value_list_append_value (&arr, &item);
1464         g_value_set_int (&item, 4);
1465         gst_value_list_append_value (&arr, &item);
1466         g_value_unset (&item);
1467
1468         gst_caps_set_value (caps, "mpegversion", &arr);
1469         g_value_unset (&arr);
1470
1471         g_value_init (&arr, GST_TYPE_LIST);
1472         g_value_init (&item, G_TYPE_STRING);
1473         g_value_set_string (&item, "raw");
1474         gst_value_list_append_value (&arr, &item);
1475         g_value_set_string (&item, "adts");
1476         gst_value_list_append_value (&arr, &item);
1477         g_value_set_string (&item, "adif");
1478         gst_value_list_append_value (&arr, &item);
1479         g_value_unset (&item);
1480
1481         gst_caps_set_value (caps, "stream-format", &arr);
1482         g_value_unset (&arr);
1483       } else {
1484         gst_caps_set_simple (caps, "mpegversion", G_TYPE_INT, 4,
1485             "base-profile", G_TYPE_STRING, "lc", NULL);
1486
1487         /* FIXME: ffmpeg currently assumes raw if there is extradata and
1488          * ADTS otherwise. See for example the FDK AAC encoder. */
1489         if (context && context->extradata_size > 0) {
1490           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "raw",
1491               NULL);
1492           gst_codec_utils_aac_caps_set_level_and_profile (caps,
1493               context->extradata, context->extradata_size);
1494         } else if (context) {
1495           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "adts",
1496               NULL);
1497         }
1498       }
1499
1500       break;
1501     }
1502     case AV_CODEC_ID_AAC_LATM: /* LATM/LOAS AAC syntax */
1503       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1504           "mpegversion", G_TYPE_INT, 4, "stream-format", G_TYPE_STRING, "loas",
1505           NULL);
1506       break;
1507
1508     case AV_CODEC_ID_ASV1:
1509       caps =
1510           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1511           "asusversion", G_TYPE_INT, 1, NULL);
1512       break;
1513     case AV_CODEC_ID_ASV2:
1514       caps =
1515           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1516           "asusversion", G_TYPE_INT, 2, NULL);
1517       break;
1518
1519     case AV_CODEC_ID_FFV1:
1520       caps =
1521           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-ffv",
1522           "ffvversion", G_TYPE_INT, 1, NULL);
1523       break;
1524
1525     case AV_CODEC_ID_4XM:
1526       caps =
1527           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-4xm",
1528           NULL);
1529       break;
1530
1531     case AV_CODEC_ID_XAN_WC3:
1532     case AV_CODEC_ID_XAN_WC4:
1533       caps =
1534           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-xan",
1535           "wcversion", G_TYPE_INT, 3 - AV_CODEC_ID_XAN_WC3 + codec_id, NULL);
1536       break;
1537
1538     case AV_CODEC_ID_CLJR:
1539       caps =
1540           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1541           "video/x-cirrus-logic-accupak", NULL);
1542       break;
1543
1544     case AV_CODEC_ID_FRAPS:
1545       caps =
1546           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-fraps",
1547           NULL);
1548       break;
1549
1550     case AV_CODEC_ID_MDEC:
1551     case AV_CODEC_ID_ROQ:
1552     case AV_CODEC_ID_INTERPLAY_VIDEO:
1553       buildcaps = TRUE;
1554       break;
1555
1556     case AV_CODEC_ID_VCR1:
1557       caps =
1558           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1559           "video/x-ati-vcr", "vcrversion", G_TYPE_INT, 1, NULL);
1560       break;
1561
1562     case AV_CODEC_ID_RPZA:
1563       caps =
1564           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1565           "video/x-apple-video", NULL);
1566       break;
1567
1568     case AV_CODEC_ID_CINEPAK:
1569       caps =
1570           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1571           "video/x-cinepak", NULL);
1572       break;
1573
1574       /* WS_VQA belogns here (order) */
1575
1576     case AV_CODEC_ID_MSRLE:
1577       caps =
1578           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1579           "layout", G_TYPE_STRING, "microsoft", NULL);
1580       if (context) {
1581         gst_caps_set_simple (caps,
1582             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1583       } else {
1584         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1585       }
1586       break;
1587
1588     case AV_CODEC_ID_QTRLE:
1589       caps =
1590           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1591           "layout", G_TYPE_STRING, "quicktime", NULL);
1592       if (context) {
1593         gst_caps_set_simple (caps,
1594             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1595       } else {
1596         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1597       }
1598       break;
1599
1600     case AV_CODEC_ID_MSVIDEO1:
1601       caps =
1602           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1603           "video/x-msvideocodec", "msvideoversion", G_TYPE_INT, 1, NULL);
1604       break;
1605
1606     case AV_CODEC_ID_MSS1:
1607       caps =
1608           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1609           "wmvversion", G_TYPE_INT, 1, "format", G_TYPE_STRING, "MSS1", NULL);
1610       break;
1611
1612     case AV_CODEC_ID_MSS2:
1613       caps =
1614           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1615           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "MSS2", NULL);
1616       break;
1617
1618     case AV_CODEC_ID_WMV3:
1619       caps =
1620           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1621           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "WMV3", NULL);
1622       break;
1623     case AV_CODEC_ID_VC1:
1624       caps =
1625           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1626           "wmvversion", G_TYPE_INT, 3, NULL);
1627       if (!context && !encode) {
1628         GValue arr = { 0, };
1629         GValue item = { 0, };
1630
1631         g_value_init (&arr, GST_TYPE_LIST);
1632         g_value_init (&item, G_TYPE_STRING);
1633         g_value_set_string (&item, "WVC1");
1634         gst_value_list_append_value (&arr, &item);
1635         g_value_set_string (&item, "WMVA");
1636         gst_value_list_append_and_take_value (&arr, &item);
1637         gst_caps_set_value (caps, "format", &arr);
1638         g_value_unset (&arr);
1639       } else {
1640         gst_caps_set_simple (caps, "format", G_TYPE_STRING, "WVC1", NULL);
1641       }
1642       break;
1643     case AV_CODEC_ID_QDM2:
1644       caps =
1645           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-qdm2",
1646           NULL);
1647       break;
1648
1649     case AV_CODEC_ID_MSZH:
1650       caps =
1651           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mszh",
1652           NULL);
1653       break;
1654
1655     case AV_CODEC_ID_ZLIB:
1656       caps =
1657           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zlib",
1658           NULL);
1659       break;
1660
1661     case AV_CODEC_ID_TRUEMOTION1:
1662       caps =
1663           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1664           "video/x-truemotion", "trueversion", G_TYPE_INT, 1, NULL);
1665       break;
1666     case AV_CODEC_ID_TRUEMOTION2:
1667       caps =
1668           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1669           "video/x-truemotion", "trueversion", G_TYPE_INT, 2, NULL);
1670       break;
1671
1672     case AV_CODEC_ID_ULTI:
1673       caps =
1674           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1675           "video/x-ultimotion", NULL);
1676       break;
1677
1678     case AV_CODEC_ID_TSCC:
1679       caps =
1680           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1681           "video/x-camtasia", NULL);
1682       if (context) {
1683         gst_caps_set_simple (caps,
1684             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1685       } else {
1686         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1687       }
1688       break;
1689
1690     case AV_CODEC_ID_TSCC2:
1691       caps =
1692           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1693           "video/x-tscc", "tsccversion", G_TYPE_INT, 2, NULL);
1694       break;
1695
1696     case AV_CODEC_ID_KMVC:
1697       caps =
1698           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-kmvc",
1699           NULL);
1700       break;
1701
1702     case AV_CODEC_ID_NUV:
1703       caps =
1704           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-nuv",
1705           NULL);
1706       break;
1707
1708     case AV_CODEC_ID_GIF:
1709       caps =
1710           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1711           "image/gst-libav-gif", "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
1712       break;
1713
1714     case AV_CODEC_ID_PNG:
1715       caps =
1716           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/png",
1717           NULL);
1718       break;
1719
1720     case AV_CODEC_ID_PPM:
1721       caps =
1722           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/ppm",
1723           NULL);
1724       break;
1725
1726     case AV_CODEC_ID_PBM:
1727       caps =
1728           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/pbm",
1729           NULL);
1730       break;
1731
1732     case AV_CODEC_ID_PAM:
1733       caps =
1734           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1735           "image/x-portable-anymap", NULL);
1736       break;
1737
1738     case AV_CODEC_ID_PGM:
1739       caps =
1740           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1741           "image/x-portable-graymap", NULL);
1742       break;
1743
1744     case AV_CODEC_ID_PCX:
1745       caps =
1746           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-pcx",
1747           NULL);
1748       break;
1749
1750     case AV_CODEC_ID_SGI:
1751       caps =
1752           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-sgi",
1753           NULL);
1754       break;
1755
1756     case AV_CODEC_ID_TARGA:
1757       caps =
1758           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-tga",
1759           NULL);
1760       break;
1761
1762     case AV_CODEC_ID_TIFF:
1763       caps =
1764           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/tiff",
1765           NULL);
1766       break;
1767
1768     case AV_CODEC_ID_SUNRAST:
1769       caps =
1770           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1771           "image/x-sun-raster", NULL);
1772       break;
1773
1774     case AV_CODEC_ID_SMC:
1775       caps =
1776           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-smc",
1777           NULL);
1778       break;
1779
1780     case AV_CODEC_ID_QDRAW:
1781       caps =
1782           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-qdrw",
1783           NULL);
1784       break;
1785
1786     case AV_CODEC_ID_DNXHD:
1787       caps =
1788           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dnxhd",
1789           NULL);
1790       break;
1791
1792     case AV_CODEC_ID_PRORES:
1793       caps =
1794           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1795           "video/x-prores", NULL);
1796       if (context) {
1797         switch (context->codec_tag) {
1798           case GST_MAKE_FOURCC ('a', 'p', 'c', 'o'):
1799             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "proxy", NULL);
1800             break;
1801           case GST_MAKE_FOURCC ('a', 'p', 'c', 's'):
1802             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "lt", NULL);
1803             break;
1804           default:
1805           case GST_MAKE_FOURCC ('a', 'p', 'c', 'n'):
1806             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "standard",
1807                 NULL);
1808             break;
1809           case GST_MAKE_FOURCC ('a', 'p', 'c', 'h'):
1810             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "hq", NULL);
1811             break;
1812           case GST_MAKE_FOURCC ('a', 'p', '4', 'h'):
1813             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444", NULL);
1814             break;
1815           case GST_MAKE_FOURCC ('a', 'p', '4', 'x'):
1816             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444xq",
1817                 NULL);
1818             break;
1819         }
1820       }
1821       break;
1822
1823     case AV_CODEC_ID_MIMIC:
1824       caps =
1825           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mimic",
1826           NULL);
1827       break;
1828
1829     case AV_CODEC_ID_VMNC:
1830       caps =
1831           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vmnc",
1832           NULL);
1833       break;
1834
1835     case AV_CODEC_ID_TRUESPEECH:
1836       caps =
1837           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
1838           "audio/x-truespeech", NULL);
1839       break;
1840
1841     case AV_CODEC_ID_QCELP:
1842       caps =
1843           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/qcelp",
1844           NULL);
1845       break;
1846
1847     case AV_CODEC_ID_AMV:
1848       caps =
1849           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-amv",
1850           NULL);
1851       break;
1852
1853     case AV_CODEC_ID_AASC:
1854       caps =
1855           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-aasc",
1856           NULL);
1857       break;
1858
1859     case AV_CODEC_ID_LOCO:
1860       caps =
1861           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-loco",
1862           NULL);
1863       break;
1864
1865     case AV_CODEC_ID_ZMBV:
1866       caps =
1867           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zmbv",
1868           NULL);
1869       break;
1870
1871     case AV_CODEC_ID_LAGARITH:
1872       caps =
1873           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1874           "video/x-lagarith", NULL);
1875       break;
1876
1877     case AV_CODEC_ID_CSCD:
1878       caps =
1879           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1880           "video/x-camstudio", NULL);
1881       if (context) {
1882         gst_caps_set_simple (caps,
1883             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1884       } else {
1885         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1886       }
1887       break;
1888
1889     case AV_CODEC_ID_AIC:
1890       caps =
1891           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1892           "video/x-apple-intermediate-codec", NULL);
1893       break;
1894
1895     case AV_CODEC_ID_CAVS:
1896       caps =
1897           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1898           "video/x-cavs", NULL);
1899       break;
1900
1901     case AV_CODEC_ID_WS_VQA:
1902     case AV_CODEC_ID_IDCIN:
1903     case AV_CODEC_ID_8BPS:
1904     case AV_CODEC_ID_FLIC:
1905     case AV_CODEC_ID_VMDVIDEO:
1906     case AV_CODEC_ID_VMDAUDIO:
1907     case AV_CODEC_ID_VIXL:
1908     case AV_CODEC_ID_QPEG:
1909     case AV_CODEC_ID_PGMYUV:
1910     case AV_CODEC_ID_FFVHUFF:
1911     case AV_CODEC_ID_WNV1:
1912     case AV_CODEC_ID_MP3ADU:
1913     case AV_CODEC_ID_MP3ON4:
1914     case AV_CODEC_ID_WESTWOOD_SND1:
1915     case AV_CODEC_ID_MMVIDEO:
1916     case AV_CODEC_ID_AVS:
1917       buildcaps = TRUE;
1918       break;
1919
1920       /* weird quasi-codecs for the demuxers only */
1921     case AV_CODEC_ID_PCM_S16LE:
1922     case AV_CODEC_ID_PCM_S16BE:
1923     case AV_CODEC_ID_PCM_U16LE:
1924     case AV_CODEC_ID_PCM_U16BE:
1925     case AV_CODEC_ID_PCM_S8:
1926     case AV_CODEC_ID_PCM_U8:
1927     {
1928       GstAudioFormat format;
1929
1930       switch (codec_id) {
1931         case AV_CODEC_ID_PCM_S16LE:
1932           format = GST_AUDIO_FORMAT_S16LE;
1933           break;
1934         case AV_CODEC_ID_PCM_S16BE:
1935           format = GST_AUDIO_FORMAT_S16BE;
1936           break;
1937         case AV_CODEC_ID_PCM_U16LE:
1938           format = GST_AUDIO_FORMAT_U16LE;
1939           break;
1940         case AV_CODEC_ID_PCM_U16BE:
1941           format = GST_AUDIO_FORMAT_U16BE;
1942           break;
1943         case AV_CODEC_ID_PCM_S8:
1944           format = GST_AUDIO_FORMAT_S8;
1945           break;
1946         case AV_CODEC_ID_PCM_U8:
1947           format = GST_AUDIO_FORMAT_U8;
1948           break;
1949         default:
1950           format = 0;
1951           g_assert (0);         /* don't worry, we never get here */
1952           break;
1953       }
1954
1955       caps =
1956           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-raw",
1957           "format", G_TYPE_STRING, gst_audio_format_to_string (format),
1958           "layout", G_TYPE_STRING, "interleaved", NULL);
1959     }
1960       break;
1961
1962     case AV_CODEC_ID_PCM_MULAW:
1963       caps =
1964           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mulaw",
1965           NULL);
1966       break;
1967
1968     case AV_CODEC_ID_PCM_ALAW:
1969       caps =
1970           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alaw",
1971           NULL);
1972       break;
1973
1974     case AV_CODEC_ID_ADPCM_G722:
1975       caps =
1976           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G722",
1977           NULL);
1978       if (context)
1979         gst_caps_set_simple (caps,
1980             "block_align", G_TYPE_INT, context->block_align,
1981             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1982       break;
1983
1984     case AV_CODEC_ID_ADPCM_G726:
1985     {
1986       /* the G726 decoder can also handle G721 */
1987       caps =
1988           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1989           "layout", G_TYPE_STRING, "g726", NULL);
1990       if (context)
1991         gst_caps_set_simple (caps,
1992             "block_align", G_TYPE_INT, context->block_align,
1993             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1994
1995       if (!encode) {
1996         gst_caps_append (caps, gst_caps_new_simple ("audio/x-adpcm",
1997                 "layout", G_TYPE_STRING, "g721",
1998                 "channels", G_TYPE_INT, 1, "rate", G_TYPE_INT, 8000, NULL));
1999       }
2000       break;
2001     }
2002     case AV_CODEC_ID_ADPCM_IMA_QT:
2003     case AV_CODEC_ID_ADPCM_IMA_WAV:
2004     case AV_CODEC_ID_ADPCM_IMA_DK3:
2005     case AV_CODEC_ID_ADPCM_IMA_DK4:
2006     case AV_CODEC_ID_ADPCM_IMA_OKI:
2007     case AV_CODEC_ID_ADPCM_IMA_WS:
2008     case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
2009     case AV_CODEC_ID_ADPCM_IMA_AMV:
2010     case AV_CODEC_ID_ADPCM_IMA_ISS:
2011     case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
2012     case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
2013     case AV_CODEC_ID_ADPCM_MS:
2014     case AV_CODEC_ID_ADPCM_4XM:
2015     case AV_CODEC_ID_ADPCM_XA:
2016     case AV_CODEC_ID_ADPCM_ADX:
2017     case AV_CODEC_ID_ADPCM_EA:
2018     case AV_CODEC_ID_ADPCM_CT:
2019     case AV_CODEC_ID_ADPCM_SWF:
2020     case AV_CODEC_ID_ADPCM_YAMAHA:
2021     case AV_CODEC_ID_ADPCM_SBPRO_2:
2022     case AV_CODEC_ID_ADPCM_SBPRO_3:
2023     case AV_CODEC_ID_ADPCM_SBPRO_4:
2024     case AV_CODEC_ID_ADPCM_EA_R1:
2025     case AV_CODEC_ID_ADPCM_EA_R2:
2026     case AV_CODEC_ID_ADPCM_EA_R3:
2027     case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
2028     case AV_CODEC_ID_ADPCM_EA_XAS:
2029     case AV_CODEC_ID_ADPCM_THP:
2030     {
2031       const gchar *layout = NULL;
2032
2033       switch (codec_id) {
2034         case AV_CODEC_ID_ADPCM_IMA_QT:
2035           layout = "quicktime";
2036           break;
2037         case AV_CODEC_ID_ADPCM_IMA_WAV:
2038           layout = "dvi";
2039           break;
2040         case AV_CODEC_ID_ADPCM_IMA_DK3:
2041           layout = "dk3";
2042           break;
2043         case AV_CODEC_ID_ADPCM_IMA_DK4:
2044           layout = "dk4";
2045           break;
2046         case AV_CODEC_ID_ADPCM_IMA_OKI:
2047           layout = "oki";
2048           break;
2049         case AV_CODEC_ID_ADPCM_IMA_WS:
2050           layout = "westwood";
2051           break;
2052         case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
2053           layout = "smjpeg";
2054           break;
2055         case AV_CODEC_ID_ADPCM_IMA_AMV:
2056           layout = "amv";
2057           break;
2058         case AV_CODEC_ID_ADPCM_IMA_ISS:
2059           layout = "iss";
2060           break;
2061         case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
2062           layout = "ea-eacs";
2063           break;
2064         case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
2065           layout = "ea-sead";
2066           break;
2067         case AV_CODEC_ID_ADPCM_MS:
2068           layout = "microsoft";
2069           break;
2070         case AV_CODEC_ID_ADPCM_4XM:
2071           layout = "4xm";
2072           break;
2073         case AV_CODEC_ID_ADPCM_XA:
2074           layout = "xa";
2075           break;
2076         case AV_CODEC_ID_ADPCM_ADX:
2077           layout = "adx";
2078           break;
2079         case AV_CODEC_ID_ADPCM_EA:
2080           layout = "ea";
2081           break;
2082         case AV_CODEC_ID_ADPCM_CT:
2083           layout = "ct";
2084           break;
2085         case AV_CODEC_ID_ADPCM_SWF:
2086           layout = "swf";
2087           break;
2088         case AV_CODEC_ID_ADPCM_YAMAHA:
2089           layout = "yamaha";
2090           break;
2091         case AV_CODEC_ID_ADPCM_SBPRO_2:
2092           layout = "sbpro2";
2093           break;
2094         case AV_CODEC_ID_ADPCM_SBPRO_3:
2095           layout = "sbpro3";
2096           break;
2097         case AV_CODEC_ID_ADPCM_SBPRO_4:
2098           layout = "sbpro4";
2099           break;
2100         case AV_CODEC_ID_ADPCM_EA_R1:
2101           layout = "ea-r1";
2102           break;
2103         case AV_CODEC_ID_ADPCM_EA_R2:
2104           layout = "ea-r3";
2105           break;
2106         case AV_CODEC_ID_ADPCM_EA_R3:
2107           layout = "ea-r3";
2108           break;
2109         case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
2110           layout = "ea-maxis-xa";
2111           break;
2112         case AV_CODEC_ID_ADPCM_EA_XAS:
2113           layout = "ea-xas";
2114           break;
2115         case AV_CODEC_ID_ADPCM_THP:
2116           layout = "thp";
2117           break;
2118         default:
2119           g_assert (0);         /* don't worry, we never get here */
2120           break;
2121       }
2122
2123       /* FIXME: someone please check whether we need additional properties
2124        * in this caps definition. */
2125       caps =
2126           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
2127           "layout", G_TYPE_STRING, layout, NULL);
2128       if (context)
2129         gst_caps_set_simple (caps,
2130             "block_align", G_TYPE_INT, context->block_align,
2131             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2132     }
2133       break;
2134
2135     case AV_CODEC_ID_AMR_NB:
2136       caps =
2137           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR",
2138           NULL);
2139       break;
2140
2141     case AV_CODEC_ID_AMR_WB:
2142       caps =
2143           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR-WB",
2144           NULL);
2145       break;
2146
2147     case AV_CODEC_ID_GSM:
2148       caps =
2149           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-gsm",
2150           NULL);
2151       break;
2152
2153     case AV_CODEC_ID_GSM_MS:
2154       caps =
2155           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/ms-gsm",
2156           NULL);
2157       break;
2158
2159     case AV_CODEC_ID_NELLYMOSER:
2160       caps =
2161           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2162           "audio/x-nellymoser", NULL);
2163       break;
2164
2165     case AV_CODEC_ID_SIPR:
2166     {
2167       caps =
2168           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-sipro",
2169           NULL);
2170       if (context) {
2171         gst_caps_set_simple (caps,
2172             "leaf_size", G_TYPE_INT, context->block_align,
2173             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2174       }
2175     }
2176       break;
2177
2178     case AV_CODEC_ID_RA_144:
2179     case AV_CODEC_ID_RA_288:
2180     case AV_CODEC_ID_COOK:
2181     {
2182       gint version = 0;
2183
2184       switch (codec_id) {
2185         case AV_CODEC_ID_RA_144:
2186           version = 1;
2187           break;
2188         case AV_CODEC_ID_RA_288:
2189           version = 2;
2190           break;
2191         case AV_CODEC_ID_COOK:
2192           version = 8;
2193           break;
2194         default:
2195           break;
2196       }
2197
2198       /* FIXME: properties? */
2199       caps =
2200           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2201           "audio/x-pn-realaudio", "raversion", G_TYPE_INT, version, NULL);
2202       if (context) {
2203         gst_caps_set_simple (caps,
2204             "leaf_size", G_TYPE_INT, context->block_align,
2205             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2206       }
2207     }
2208       break;
2209
2210     case AV_CODEC_ID_ROQ_DPCM:
2211     case AV_CODEC_ID_INTERPLAY_DPCM:
2212     case AV_CODEC_ID_XAN_DPCM:
2213     case AV_CODEC_ID_SOL_DPCM:
2214     {
2215       const gchar *layout = NULL;
2216
2217       switch (codec_id) {
2218         case AV_CODEC_ID_ROQ_DPCM:
2219           layout = "roq";
2220           break;
2221         case AV_CODEC_ID_INTERPLAY_DPCM:
2222           layout = "interplay";
2223           break;
2224         case AV_CODEC_ID_XAN_DPCM:
2225           layout = "xan";
2226           break;
2227         case AV_CODEC_ID_SOL_DPCM:
2228           layout = "sol";
2229           break;
2230         default:
2231           g_assert (0);         /* don't worry, we never get here */
2232           break;
2233       }
2234
2235       /* FIXME: someone please check whether we need additional properties
2236        * in this caps definition. */
2237       caps =
2238           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dpcm",
2239           "layout", G_TYPE_STRING, layout, NULL);
2240       if (context)
2241         gst_caps_set_simple (caps,
2242             "block_align", G_TYPE_INT, context->block_align,
2243             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2244     }
2245       break;
2246
2247     case AV_CODEC_ID_SHORTEN:
2248       caps = gst_caps_new_empty_simple ("audio/x-shorten");
2249       break;
2250
2251     case AV_CODEC_ID_ALAC:
2252       caps =
2253           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alac",
2254           NULL);
2255       if (context) {
2256         gst_caps_set_simple (caps,
2257             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2258       }
2259       break;
2260
2261     case AV_CODEC_ID_FLAC:
2262       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2263        * encoder case, we want to add things like samplerate, channels... */
2264       if (!encode) {
2265         caps = gst_caps_new_empty_simple ("audio/x-flac");
2266       }
2267       break;
2268
2269     case AV_CODEC_ID_OPUS:
2270       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2271        * encoder case, we want to add things like samplerate, channels... */
2272       if (!encode) {
2273         /* FIXME: can ffmpeg handle multichannel Opus? */
2274         caps = gst_caps_new_simple ("audio/x-opus",
2275             "channel-mapping-family", G_TYPE_INT, 0, NULL);
2276       }
2277       break;
2278
2279     case AV_CODEC_ID_S302M:
2280       caps = gst_caps_new_empty_simple ("audio/x-smpte-302m");
2281       break;
2282
2283     case AV_CODEC_ID_DVD_SUBTITLE:
2284     case AV_CODEC_ID_DVB_SUBTITLE:
2285       caps = NULL;
2286       break;
2287     case AV_CODEC_ID_BMP:
2288       caps = gst_caps_new_empty_simple ("image/bmp");
2289       break;
2290     case AV_CODEC_ID_TTA:
2291       caps =
2292           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-tta",
2293           NULL);
2294       if (context) {
2295         gst_caps_set_simple (caps,
2296             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2297       }
2298       break;
2299     case AV_CODEC_ID_TWINVQ:
2300       caps =
2301           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2302           "audio/x-twin-vq", NULL);
2303       break;
2304     case AV_CODEC_ID_G729:
2305       caps =
2306           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G729",
2307           NULL);
2308       break;
2309     case AV_CODEC_ID_DSD_LSBF:
2310       caps =
2311           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2312           NULL);
2313       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2314           TRUE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2315       break;
2316     case AV_CODEC_ID_DSD_MSBF:
2317       caps =
2318           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2319           NULL);
2320       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2321           FALSE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2322       break;
2323     case AV_CODEC_ID_DSD_LSBF_PLANAR:
2324       caps =
2325           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2326           NULL);
2327       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2328           TRUE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2329       break;
2330     case AV_CODEC_ID_DSD_MSBF_PLANAR:
2331       caps =
2332           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2333           NULL);
2334       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2335           FALSE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2336       break;
2337     case AV_CODEC_ID_APTX:
2338       caps =
2339           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/aptx",
2340           NULL);
2341       break;
2342     case AV_CODEC_ID_APTX_HD:
2343       caps =
2344           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/aptx-hd",
2345           NULL);
2346       break;
2347     case AV_CODEC_ID_AV1:
2348       caps =
2349           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-av1",
2350           NULL);
2351       break;
2352     default:
2353       GST_DEBUG ("Unknown codec ID %d, please add mapping here", codec_id);
2354       break;
2355   }
2356
2357   if (buildcaps) {
2358     const AVCodec *codec;
2359
2360     if ((codec = avcodec_find_decoder (codec_id)) ||
2361         (codec = avcodec_find_encoder (codec_id))) {
2362       gchar *mime = NULL;
2363
2364       GST_LOG ("Could not create stream format caps for %s", codec->name);
2365
2366       switch (codec->type) {
2367         case AVMEDIA_TYPE_VIDEO:
2368           mime = g_strdup_printf ("video/x-gst-av-%s", codec->name);
2369           caps =
2370               gst_ff_vid_caps_new (context, NULL, codec_id, encode, mime, NULL);
2371           g_free (mime);
2372           break;
2373         case AVMEDIA_TYPE_AUDIO:
2374           mime = g_strdup_printf ("audio/x-gst-av-%s", codec->name);
2375           caps =
2376               gst_ff_aud_caps_new (context, NULL, codec_id, encode, mime, NULL);
2377           if (context)
2378             gst_caps_set_simple (caps,
2379                 "block_align", G_TYPE_INT, context->block_align,
2380                 "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2381           g_free (mime);
2382           break;
2383         default:
2384           break;
2385       }
2386     }
2387   }
2388
2389   if (caps != NULL) {
2390
2391     /* set private data */
2392     if (context && context->extradata_size > 0) {
2393       GstBuffer *data = gst_buffer_new_and_alloc (context->extradata_size);
2394
2395       gst_buffer_fill (data, 0, context->extradata, context->extradata_size);
2396       gst_caps_set_simple (caps, "codec_data", GST_TYPE_BUFFER, data, NULL);
2397       gst_buffer_unref (data);
2398     }
2399
2400     GST_LOG ("caps for codec_id=%d: %" GST_PTR_FORMAT, codec_id, caps);
2401
2402   } else {
2403     GST_LOG ("No caps found for codec_id=%d", codec_id);
2404   }
2405
2406   return caps;
2407 }
2408
2409 /* Convert a FFMPEG Pixel Format and optional AVCodecContext
2410  * to a GstCaps. If the context is ommitted, no fixed values
2411  * for video/audio size will be included in the GstCaps
2412  *
2413  * See below for usefullness
2414  */
2415
2416 static GstCaps *
2417 gst_ffmpeg_pixfmt_to_caps (enum AVPixelFormat pix_fmt, AVCodecContext * context,
2418     enum AVCodecID codec_id)
2419 {
2420   GstCaps *caps = NULL;
2421   GstVideoFormat format;
2422
2423   format = gst_ffmpeg_pixfmt_to_videoformat (pix_fmt);
2424
2425   if (format != GST_VIDEO_FORMAT_UNKNOWN) {
2426     caps = gst_ff_vid_caps_new (context, NULL, codec_id, TRUE, "video/x-raw",
2427         "format", G_TYPE_STRING, gst_video_format_to_string (format), NULL);
2428   }
2429
2430   if (caps != NULL) {
2431     GST_DEBUG ("caps for pix_fmt=%d: %" GST_PTR_FORMAT, pix_fmt, caps);
2432   } else {
2433     GST_LOG ("No caps found for pix_fmt=%d", pix_fmt);
2434   }
2435
2436   return caps;
2437 }
2438
2439 GstAudioFormat
2440 gst_ffmpeg_smpfmt_to_audioformat (enum AVSampleFormat sample_fmt,
2441     GstAudioLayout * layout)
2442 {
2443   if (layout)
2444     *layout = GST_AUDIO_LAYOUT_NON_INTERLEAVED;
2445
2446   switch (sample_fmt) {
2447     case AV_SAMPLE_FMT_U8:
2448       if (layout)
2449         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2450     case AV_SAMPLE_FMT_U8P:
2451       return GST_AUDIO_FORMAT_U8;
2452       break;
2453
2454     case AV_SAMPLE_FMT_S16:
2455       if (layout)
2456         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2457     case AV_SAMPLE_FMT_S16P:
2458       return GST_AUDIO_FORMAT_S16;
2459       break;
2460
2461     case AV_SAMPLE_FMT_S32:
2462       if (layout)
2463         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2464     case AV_SAMPLE_FMT_S32P:
2465       return GST_AUDIO_FORMAT_S32;
2466       break;
2467     case AV_SAMPLE_FMT_FLT:
2468       if (layout)
2469         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2470     case AV_SAMPLE_FMT_FLTP:
2471       return GST_AUDIO_FORMAT_F32;
2472       break;
2473
2474     case AV_SAMPLE_FMT_DBL:
2475       if (layout)
2476         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2477     case AV_SAMPLE_FMT_DBLP:
2478       return GST_AUDIO_FORMAT_F64;
2479       break;
2480
2481     default:
2482       /* .. */
2483       return GST_AUDIO_FORMAT_UNKNOWN;
2484       break;
2485   }
2486 }
2487
2488 /* Convert a FFMPEG Sample Format and optional AVCodecContext
2489  * to a GstCaps. If the context is ommitted, no fixed values
2490  * for video/audio size will be included in the GstCaps
2491  *
2492  * See below for usefullness
2493  */
2494
2495 static GstCaps *
2496 gst_ffmpeg_smpfmt_to_caps (enum AVSampleFormat sample_fmt,
2497     AVCodecContext * context, AVCodec * codec, enum AVCodecID codec_id)
2498 {
2499   GstCaps *caps = NULL;
2500   GstAudioFormat format;
2501   GstAudioLayout layout;
2502
2503   format = gst_ffmpeg_smpfmt_to_audioformat (sample_fmt, &layout);
2504
2505   if (format != GST_AUDIO_FORMAT_UNKNOWN) {
2506     caps = gst_ff_aud_caps_new (context, codec, codec_id, TRUE, "audio/x-raw",
2507         "format", G_TYPE_STRING, gst_audio_format_to_string (format),
2508         "layout", G_TYPE_STRING,
2509         (layout == GST_AUDIO_LAYOUT_INTERLEAVED) ?
2510         "interleaved" : "non-interleaved", NULL);
2511     GST_LOG ("caps for sample_fmt=%d: %" GST_PTR_FORMAT, sample_fmt, caps);
2512   } else {
2513     GST_LOG ("No caps found for sample_fmt=%d", sample_fmt);
2514   }
2515
2516   return caps;
2517 }
2518
2519 static gboolean
2520 caps_has_field (GstCaps * caps, const gchar * field)
2521 {
2522   guint i, n;
2523
2524   n = gst_caps_get_size (caps);
2525   for (i = 0; i < n; i++) {
2526     GstStructure *s = gst_caps_get_structure (caps, i);
2527
2528     if (gst_structure_has_field (s, field))
2529       return TRUE;
2530   }
2531
2532   return FALSE;
2533 }
2534
2535 GstCaps *
2536 gst_ffmpeg_codectype_to_audio_caps (AVCodecContext * context,
2537     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2538 {
2539   GstCaps *caps = NULL;
2540
2541   GST_DEBUG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2542       context, codec_id, encode, codec);
2543   if (codec)
2544     GST_DEBUG ("sample_fmts:%p, samplerates:%p",
2545         codec->sample_fmts, codec->supported_samplerates);
2546
2547   if (context) {
2548     /* Specific codec context */
2549     caps =
2550         gst_ffmpeg_smpfmt_to_caps (context->sample_fmt, context, codec,
2551         codec_id);
2552   } else {
2553     caps = gst_ff_aud_caps_new (context, codec, codec_id, encode, "audio/x-raw",
2554         NULL);
2555     if (!caps_has_field (caps, "format"))
2556       gst_ffmpeg_audio_set_sample_fmts (caps,
2557           codec ? codec->sample_fmts : NULL, encode);
2558   }
2559
2560   return caps;
2561 }
2562
2563 GstCaps *
2564 gst_ffmpeg_codectype_to_video_caps (AVCodecContext * context,
2565     enum AVCodecID codec_id, gboolean encode, const AVCodec * codec)
2566 {
2567   GstCaps *caps;
2568
2569   GST_LOG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2570       context, codec_id, encode, codec);
2571
2572   if (context) {
2573     caps = gst_ffmpeg_pixfmt_to_caps (context->pix_fmt, context, codec_id);
2574   } else {
2575     caps =
2576         gst_ff_vid_caps_new (context, codec, codec_id, encode, "video/x-raw",
2577         NULL);
2578     if (!caps_has_field (caps, "format"))
2579       gst_ffmpeg_video_set_pix_fmts (caps, codec ? codec->pix_fmts : NULL);
2580   }
2581   return caps;
2582 }
2583
2584 /* Convert a GstCaps (audio/raw) to a FFMPEG SampleFmt
2585  * and other audio properties in a AVCodecContext.
2586  *
2587  * For usefullness, see below
2588  */
2589
2590 static void
2591 gst_ffmpeg_caps_to_smpfmt (const GstCaps * caps,
2592     AVCodecContext * context, gboolean raw)
2593 {
2594   GstStructure *structure;
2595   const gchar *fmt;
2596   GstAudioFormat format = GST_AUDIO_FORMAT_UNKNOWN;
2597   gint bitrate;
2598   const gchar *layout;
2599   gboolean interleaved;
2600
2601   g_return_if_fail (gst_caps_get_size (caps) == 1);
2602
2603   structure = gst_caps_get_structure (caps, 0);
2604
2605   gst_structure_get_int (structure, "channels", &context->channels);
2606   gst_structure_get_int (structure, "rate", &context->sample_rate);
2607   gst_structure_get_int (structure, "block_align", &context->block_align);
2608   if (gst_structure_get_int (structure, "bitrate", &bitrate))
2609     context->bit_rate = bitrate;
2610
2611   if (!raw)
2612     return;
2613
2614   if (gst_structure_has_name (structure, "audio/x-raw")) {
2615     if ((fmt = gst_structure_get_string (structure, "format"))) {
2616       format = gst_audio_format_from_string (fmt);
2617     }
2618   }
2619
2620   layout = gst_structure_get_string (structure, "layout");
2621   interleaved = ! !g_strcmp0 (layout, "non-interleaved");
2622
2623   switch (format) {
2624     case GST_AUDIO_FORMAT_F32:
2625       context->sample_fmt =
2626           interleaved ? AV_SAMPLE_FMT_FLT : AV_SAMPLE_FMT_FLTP;
2627       break;
2628     case GST_AUDIO_FORMAT_F64:
2629       context->sample_fmt =
2630           interleaved ? AV_SAMPLE_FMT_DBL : AV_SAMPLE_FMT_DBLP;
2631       break;
2632     case GST_AUDIO_FORMAT_S32:
2633       context->sample_fmt =
2634           interleaved ? AV_SAMPLE_FMT_S32 : AV_SAMPLE_FMT_S32P;
2635       break;
2636     case GST_AUDIO_FORMAT_S16:
2637       context->sample_fmt =
2638           interleaved ? AV_SAMPLE_FMT_S16 : AV_SAMPLE_FMT_S16P;
2639       break;
2640     default:
2641       break;
2642   }
2643 }
2644
2645 /* Convert a GstCaps (video/raw) to a FFMPEG PixFmt
2646  * and other video properties in a AVCodecContext.
2647  *
2648  * For usefullness, see below
2649  */
2650
2651 static void
2652 gst_ffmpeg_caps_to_pixfmt (const GstCaps * caps,
2653     AVCodecContext * context, gboolean raw)
2654 {
2655   GstStructure *structure;
2656   const GValue *fps;
2657   const GValue *par = NULL;
2658   const gchar *fmt;
2659   GstVideoFormat format = GST_VIDEO_FORMAT_UNKNOWN;
2660   const gchar *s;
2661
2662   GST_DEBUG ("converting caps %" GST_PTR_FORMAT, caps);
2663   g_return_if_fail (gst_caps_get_size (caps) == 1);
2664   structure = gst_caps_get_structure (caps, 0);
2665
2666   gst_structure_get_int (structure, "width", &context->width);
2667   gst_structure_get_int (structure, "height", &context->height);
2668   gst_structure_get_int (structure, "bpp", &context->bits_per_coded_sample);
2669
2670   fps = gst_structure_get_value (structure, "framerate");
2671   if (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps)) {
2672
2673     int num = gst_value_get_fraction_numerator (fps);
2674     int den = gst_value_get_fraction_denominator (fps);
2675
2676     if (num > 0 && den > 0) {
2677       /* somehow these seem mixed up.. */
2678       /* they're fine, this is because it does period=1/frequency */
2679       context->time_base.den = gst_value_get_fraction_numerator (fps);
2680       context->time_base.num = gst_value_get_fraction_denominator (fps);
2681       context->ticks_per_frame = 1;
2682
2683       GST_DEBUG ("setting framerate %d/%d = %lf",
2684           context->time_base.den, context->time_base.num,
2685           1. * context->time_base.den / context->time_base.num);
2686     } else {
2687       GST_INFO ("ignoring framerate %d/%d (probably variable framerate)",
2688           context->time_base.num, context->time_base.den);
2689     }
2690   }
2691
2692   par = gst_structure_get_value (structure, "pixel-aspect-ratio");
2693   if (par && GST_VALUE_HOLDS_FRACTION (par)) {
2694
2695     int num = gst_value_get_fraction_numerator (par);
2696     int den = gst_value_get_fraction_denominator (par);
2697
2698     if (num > 0 && den > 0) {
2699       context->sample_aspect_ratio.num = num;
2700       context->sample_aspect_ratio.den = den;
2701
2702       GST_DEBUG ("setting pixel-aspect-ratio %d/%d = %lf",
2703           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den,
2704           1. * context->sample_aspect_ratio.num /
2705           context->sample_aspect_ratio.den);
2706     } else {
2707       GST_WARNING ("ignoring insane pixel-aspect-ratio %d/%d",
2708           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den);
2709     }
2710   }
2711
2712   if (!raw)
2713     return;
2714
2715   g_return_if_fail (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps));
2716
2717   if (gst_structure_has_name (structure, "video/x-raw")) {
2718     if ((fmt = gst_structure_get_string (structure, "format"))) {
2719       format = gst_video_format_from_string (fmt);
2720     }
2721   }
2722
2723   switch (format) {
2724     case GST_VIDEO_FORMAT_YUY2:
2725       context->pix_fmt = AV_PIX_FMT_YUYV422;
2726       break;
2727     case GST_VIDEO_FORMAT_I420:
2728       context->pix_fmt = AV_PIX_FMT_YUV420P;
2729       break;
2730     case GST_VIDEO_FORMAT_A420:
2731       context->pix_fmt = AV_PIX_FMT_YUVA420P;
2732       break;
2733     case GST_VIDEO_FORMAT_Y41B:
2734       context->pix_fmt = AV_PIX_FMT_YUV411P;
2735       break;
2736     case GST_VIDEO_FORMAT_Y42B:
2737       context->pix_fmt = AV_PIX_FMT_YUV422P;
2738       break;
2739     case GST_VIDEO_FORMAT_YUV9:
2740       context->pix_fmt = AV_PIX_FMT_YUV410P;
2741       break;
2742     case GST_VIDEO_FORMAT_Y444:
2743       context->pix_fmt = AV_PIX_FMT_YUV444P;
2744       break;
2745     case GST_VIDEO_FORMAT_GRAY8:
2746       context->pix_fmt = AV_PIX_FMT_GRAY8;
2747       break;
2748     case GST_VIDEO_FORMAT_xRGB:
2749 #if (G_BYTE_ORDER == G_BIG_ENDIAN)
2750       context->pix_fmt = AV_PIX_FMT_RGB32;
2751 #endif
2752       break;
2753     case GST_VIDEO_FORMAT_BGRx:
2754 #if (G_BYTE_ORDER == G_LITTLE_ENDIAN)
2755       context->pix_fmt = AV_PIX_FMT_RGB32;
2756 #endif
2757       break;
2758     case GST_VIDEO_FORMAT_RGB:
2759       context->pix_fmt = AV_PIX_FMT_RGB24;
2760       break;
2761     case GST_VIDEO_FORMAT_BGR:
2762       context->pix_fmt = AV_PIX_FMT_BGR24;
2763       break;
2764     case GST_VIDEO_FORMAT_RGB16:
2765       context->pix_fmt = AV_PIX_FMT_RGB565;
2766       break;
2767     case GST_VIDEO_FORMAT_RGB15:
2768       context->pix_fmt = AV_PIX_FMT_RGB555;
2769       break;
2770     case GST_VIDEO_FORMAT_RGB8P:
2771       context->pix_fmt = AV_PIX_FMT_PAL8;
2772       break;
2773     default:
2774       break;
2775   }
2776
2777   s = gst_structure_get_string (structure, "interlace-mode");
2778   if (s) {
2779     if (strcmp (s, "progressive") == 0) {
2780       context->field_order = AV_FIELD_PROGRESSIVE;
2781     } else if (strcmp (s, "interleaved") == 0) {
2782       s = gst_structure_get_string (structure, "field-order");
2783       if (s) {
2784         if (strcmp (s, "top-field-first") == 0) {
2785           context->field_order = AV_FIELD_TT;
2786         } else if (strcmp (s, "bottom-field-first") == 0) {
2787           context->field_order = AV_FIELD_TB;
2788         }
2789       }
2790     }
2791   }
2792 }
2793
2794 typedef struct
2795 {
2796   GstVideoFormat format;
2797   enum AVPixelFormat pixfmt;
2798 } PixToFmt;
2799
2800 /* FIXME : FILLME */
2801 static const PixToFmt pixtofmttable[] = {
2802   /* GST_VIDEO_FORMAT_I420, */
2803   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUV420P},
2804   /* Note : this should use a different chroma placement */
2805   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUVJ420P},
2806
2807   /* GST_VIDEO_FORMAT_YV12, */
2808   /* GST_VIDEO_FORMAT_YUY2, */
2809   {GST_VIDEO_FORMAT_YUY2, AV_PIX_FMT_YUYV422},
2810   /* GST_VIDEO_FORMAT_UYVY, */
2811   {GST_VIDEO_FORMAT_UYVY, AV_PIX_FMT_UYVY422},
2812   /* GST_VIDEO_FORMAT_AYUV, */
2813   /* GST_VIDEO_FORMAT_RGBx, */
2814   {GST_VIDEO_FORMAT_RGBx, AV_PIX_FMT_RGB0},
2815   /* GST_VIDEO_FORMAT_BGRx, */
2816   {GST_VIDEO_FORMAT_BGRx, AV_PIX_FMT_BGR0},
2817   /* GST_VIDEO_FORMAT_xRGB, */
2818   {GST_VIDEO_FORMAT_xRGB, AV_PIX_FMT_0RGB},
2819   /* GST_VIDEO_FORMAT_xBGR, */
2820   {GST_VIDEO_FORMAT_xBGR, AV_PIX_FMT_0BGR},
2821   /* GST_VIDEO_FORMAT_RGBA, */
2822   {GST_VIDEO_FORMAT_RGBA, AV_PIX_FMT_RGBA},
2823   /* GST_VIDEO_FORMAT_BGRA, */
2824   {GST_VIDEO_FORMAT_BGRA, AV_PIX_FMT_BGRA},
2825   /* GST_VIDEO_FORMAT_ARGB, */
2826   {GST_VIDEO_FORMAT_ARGB, AV_PIX_FMT_ARGB},
2827   /* GST_VIDEO_FORMAT_ABGR, */
2828   {GST_VIDEO_FORMAT_ABGR, AV_PIX_FMT_ABGR},
2829   /* GST_VIDEO_FORMAT_RGB, */
2830   {GST_VIDEO_FORMAT_RGB, AV_PIX_FMT_RGB24},
2831   /* GST_VIDEO_FORMAT_BGR, */
2832   {GST_VIDEO_FORMAT_BGR, AV_PIX_FMT_BGR24},
2833   /* GST_VIDEO_FORMAT_Y41B, */
2834   {GST_VIDEO_FORMAT_Y41B, AV_PIX_FMT_YUV411P},
2835   /* GST_VIDEO_FORMAT_Y42B, */
2836   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUV422P},
2837   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUVJ422P},
2838   /* GST_VIDEO_FORMAT_YVYU, */
2839   /* GST_VIDEO_FORMAT_Y444, */
2840   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUV444P},
2841   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUVJ444P},
2842   /* GST_VIDEO_FORMAT_v210, */
2843   /* GST_VIDEO_FORMAT_v216, */
2844   /* GST_VIDEO_FORMAT_NV12, */
2845   {GST_VIDEO_FORMAT_NV12, AV_PIX_FMT_NV12},
2846   /* GST_VIDEO_FORMAT_NV21, */
2847   {GST_VIDEO_FORMAT_NV21, AV_PIX_FMT_NV21},
2848   /* GST_VIDEO_FORMAT_GRAY8, */
2849   {GST_VIDEO_FORMAT_GRAY8, AV_PIX_FMT_GRAY8},
2850   /* GST_VIDEO_FORMAT_GRAY16_BE, */
2851   {GST_VIDEO_FORMAT_GRAY16_BE, AV_PIX_FMT_GRAY16BE},
2852   /* GST_VIDEO_FORMAT_GRAY16_LE, */
2853   {GST_VIDEO_FORMAT_GRAY16_LE, AV_PIX_FMT_GRAY16LE},
2854   /* GST_VIDEO_FORMAT_v308, */
2855   /* GST_VIDEO_FORMAT_Y800, */
2856   /* GST_VIDEO_FORMAT_Y16, */
2857   /* GST_VIDEO_FORMAT_RGB16, */
2858   {GST_VIDEO_FORMAT_RGB16, AV_PIX_FMT_RGB565},
2859   /* GST_VIDEO_FORMAT_BGR16, */
2860   /* GST_VIDEO_FORMAT_RGB15, */
2861   {GST_VIDEO_FORMAT_RGB15, AV_PIX_FMT_RGB555},
2862   /* GST_VIDEO_FORMAT_BGR15, */
2863   /* GST_VIDEO_FORMAT_UYVP, */
2864   /* GST_VIDEO_FORMAT_A420, */
2865   {GST_VIDEO_FORMAT_A420, AV_PIX_FMT_YUVA420P},
2866   /* GST_VIDEO_FORMAT_RGB8_PALETTED, */
2867   {GST_VIDEO_FORMAT_RGB8P, AV_PIX_FMT_PAL8},
2868   /* GST_VIDEO_FORMAT_YUV9, */
2869   {GST_VIDEO_FORMAT_YUV9, AV_PIX_FMT_YUV410P},
2870   /* GST_VIDEO_FORMAT_YVU9, */
2871   /* GST_VIDEO_FORMAT_IYU1, */
2872   /* GST_VIDEO_FORMAT_ARGB64, */
2873   /* GST_VIDEO_FORMAT_AYUV64, */
2874   /* GST_VIDEO_FORMAT_r210, */
2875   {GST_VIDEO_FORMAT_I420_10LE, AV_PIX_FMT_YUV420P10LE},
2876   {GST_VIDEO_FORMAT_I420_10BE, AV_PIX_FMT_YUV420P10BE},
2877   {GST_VIDEO_FORMAT_I422_10LE, AV_PIX_FMT_YUV422P10LE},
2878   {GST_VIDEO_FORMAT_I422_10BE, AV_PIX_FMT_YUV422P10BE},
2879   {GST_VIDEO_FORMAT_Y444_10LE, AV_PIX_FMT_YUV444P10LE},
2880   {GST_VIDEO_FORMAT_Y444_10BE, AV_PIX_FMT_YUV444P10BE},
2881   {GST_VIDEO_FORMAT_GBR, AV_PIX_FMT_GBRP},
2882   {GST_VIDEO_FORMAT_GBRA, AV_PIX_FMT_GBRAP},
2883   {GST_VIDEO_FORMAT_GBR_10LE, AV_PIX_FMT_GBRP10LE},
2884   {GST_VIDEO_FORMAT_GBR_10BE, AV_PIX_FMT_GBRP10BE},
2885   {GST_VIDEO_FORMAT_GBRA_10LE, AV_PIX_FMT_GBRAP10LE},
2886   {GST_VIDEO_FORMAT_GBRA_10BE, AV_PIX_FMT_GBRAP10BE},
2887   {GST_VIDEO_FORMAT_GBR_12LE, AV_PIX_FMT_GBRP12LE},
2888   {GST_VIDEO_FORMAT_GBR_12BE, AV_PIX_FMT_GBRP12BE},
2889   {GST_VIDEO_FORMAT_GBRA_12LE, AV_PIX_FMT_GBRAP12LE},
2890   {GST_VIDEO_FORMAT_GBRA_12BE, AV_PIX_FMT_GBRAP12BE},
2891   {GST_VIDEO_FORMAT_A420_10LE, AV_PIX_FMT_YUVA420P10LE},
2892   {GST_VIDEO_FORMAT_A420_10BE, AV_PIX_FMT_YUVA420P10BE},
2893   {GST_VIDEO_FORMAT_A422_10LE, AV_PIX_FMT_YUVA422P10LE},
2894   {GST_VIDEO_FORMAT_A422_10BE, AV_PIX_FMT_YUVA422P10BE},
2895   {GST_VIDEO_FORMAT_A444_10LE, AV_PIX_FMT_YUVA444P10LE},
2896   {GST_VIDEO_FORMAT_A444_10BE, AV_PIX_FMT_YUVA444P10BE},
2897   {GST_VIDEO_FORMAT_I420_12LE, AV_PIX_FMT_YUV420P12LE},
2898   {GST_VIDEO_FORMAT_I420_12BE, AV_PIX_FMT_YUV420P12BE},
2899   {GST_VIDEO_FORMAT_I422_12LE, AV_PIX_FMT_YUV422P12LE},
2900   {GST_VIDEO_FORMAT_I422_12BE, AV_PIX_FMT_YUV422P12BE},
2901   {GST_VIDEO_FORMAT_Y444_12LE, AV_PIX_FMT_YUV444P12LE},
2902   {GST_VIDEO_FORMAT_Y444_12BE, AV_PIX_FMT_YUV444P12BE},
2903 };
2904
2905 GstVideoFormat
2906 gst_ffmpeg_pixfmt_to_videoformat (enum AVPixelFormat pixfmt)
2907 {
2908   guint i;
2909
2910   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++)
2911     if (pixtofmttable[i].pixfmt == pixfmt)
2912       return pixtofmttable[i].format;
2913
2914   GST_DEBUG ("Unknown pixel format %d", pixfmt);
2915   return GST_VIDEO_FORMAT_UNKNOWN;
2916 }
2917
2918 static enum AVPixelFormat
2919 gst_ffmpeg_videoformat_to_pixfmt_for_codec (GstVideoFormat format,
2920     const AVCodec * codec)
2921 {
2922   guint i;
2923
2924   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++) {
2925     if (pixtofmttable[i].format == format) {
2926       gint j;
2927
2928       if (codec && codec->pix_fmts) {
2929         for (j = 0; codec->pix_fmts[j] != -1; j++) {
2930           if (pixtofmttable[i].pixfmt == codec->pix_fmts[j])
2931             return pixtofmttable[i].pixfmt;
2932         }
2933       } else {
2934         return pixtofmttable[i].pixfmt;
2935       }
2936     }
2937   }
2938
2939   return AV_PIX_FMT_NONE;
2940 }
2941
2942 enum AVPixelFormat
2943 gst_ffmpeg_videoformat_to_pixfmt (GstVideoFormat format)
2944 {
2945   return gst_ffmpeg_videoformat_to_pixfmt_for_codec (format, NULL);
2946 }
2947
2948 void
2949 gst_ffmpeg_videoinfo_to_context (GstVideoInfo * info, AVCodecContext * context)
2950 {
2951   gint i, bpp = 0;
2952
2953   context->width = GST_VIDEO_INFO_WIDTH (info);
2954   context->height = GST_VIDEO_INFO_HEIGHT (info);
2955   for (i = 0; i < GST_VIDEO_INFO_N_COMPONENTS (info); i++)
2956     bpp += GST_VIDEO_INFO_COMP_DEPTH (info, i);
2957   context->bits_per_coded_sample = bpp;
2958
2959   context->time_base.den = 1000000000;
2960   context->time_base.num = 1;
2961   context->ticks_per_frame = 1;
2962
2963   if (GST_VIDEO_INFO_FPS_N (info) != 0) {
2964     context->framerate.num = GST_VIDEO_INFO_FPS_N (info);
2965     context->framerate.den = GST_VIDEO_INFO_FPS_D (info);
2966   }
2967
2968   context->sample_aspect_ratio.num = GST_VIDEO_INFO_PAR_N (info);
2969   context->sample_aspect_ratio.den = GST_VIDEO_INFO_PAR_D (info);
2970
2971   context->pix_fmt =
2972       gst_ffmpeg_videoformat_to_pixfmt_for_codec (GST_VIDEO_INFO_FORMAT (info),
2973       context->codec);
2974
2975   switch (info->chroma_site) {
2976     case GST_VIDEO_CHROMA_SITE_MPEG2:
2977       context->chroma_sample_location = AVCHROMA_LOC_LEFT;
2978       break;
2979     case GST_VIDEO_CHROMA_SITE_JPEG:
2980       context->chroma_sample_location = AVCHROMA_LOC_CENTER;
2981       break;
2982     case GST_VIDEO_CHROMA_SITE_DV:
2983       context->chroma_sample_location = AVCHROMA_LOC_TOPLEFT;
2984       break;
2985     case GST_VIDEO_CHROMA_SITE_V_COSITED:
2986       context->chroma_sample_location = AVCHROMA_LOC_TOP;
2987       break;
2988     default:
2989       break;
2990   }
2991
2992   context->color_primaries =
2993       gst_video_color_primaries_to_iso (info->colorimetry.primaries);
2994   context->color_trc =
2995       gst_video_transfer_function_to_iso (info->colorimetry.transfer);
2996   context->colorspace =
2997       gst_video_color_matrix_to_iso (info->colorimetry.matrix);
2998
2999   if (info->colorimetry.range == GST_VIDEO_COLOR_RANGE_0_255) {
3000     context->color_range = AVCOL_RANGE_JPEG;
3001   } else {
3002     context->color_range = AVCOL_RANGE_MPEG;
3003     context->strict_std_compliance = FF_COMPLIANCE_UNOFFICIAL;
3004   }
3005 }
3006
3007 void
3008 gst_ffmpeg_audioinfo_to_context (GstAudioInfo * info, AVCodecContext * context)
3009 {
3010   const AVCodec *codec;
3011   const enum AVSampleFormat *smpl_fmts;
3012   enum AVSampleFormat smpl_fmt = -1;
3013
3014   context->channels = info->channels;
3015   context->sample_rate = info->rate;
3016   context->channel_layout =
3017       gst_ffmpeg_channel_positions_to_layout (info->position, info->channels);
3018
3019   codec = context->codec;
3020
3021   smpl_fmts = codec->sample_fmts;
3022
3023   switch (info->finfo->format) {
3024     case GST_AUDIO_FORMAT_F32:
3025       if (smpl_fmts) {
3026         while (*smpl_fmts != -1) {
3027           if (*smpl_fmts == AV_SAMPLE_FMT_FLT) {
3028             smpl_fmt = *smpl_fmts;
3029             break;
3030           } else if (*smpl_fmts == AV_SAMPLE_FMT_FLTP) {
3031             smpl_fmt = *smpl_fmts;
3032           }
3033
3034           smpl_fmts++;
3035         }
3036       } else {
3037         smpl_fmt = AV_SAMPLE_FMT_FLT;
3038       }
3039       break;
3040     case GST_AUDIO_FORMAT_F64:
3041       if (smpl_fmts) {
3042         while (*smpl_fmts != -1) {
3043           if (*smpl_fmts == AV_SAMPLE_FMT_DBL) {
3044             smpl_fmt = *smpl_fmts;
3045             break;
3046           } else if (*smpl_fmts == AV_SAMPLE_FMT_DBLP) {
3047             smpl_fmt = *smpl_fmts;
3048           }
3049
3050           smpl_fmts++;
3051         }
3052       } else {
3053         smpl_fmt = AV_SAMPLE_FMT_DBL;
3054       }
3055       break;
3056     case GST_AUDIO_FORMAT_S32:
3057       if (smpl_fmts) {
3058         while (*smpl_fmts != -1) {
3059           if (*smpl_fmts == AV_SAMPLE_FMT_S32) {
3060             smpl_fmt = *smpl_fmts;
3061             break;
3062           } else if (*smpl_fmts == AV_SAMPLE_FMT_S32P) {
3063             smpl_fmt = *smpl_fmts;
3064           }
3065
3066           smpl_fmts++;
3067         }
3068       } else {
3069         smpl_fmt = AV_SAMPLE_FMT_S32;
3070       }
3071       break;
3072     case GST_AUDIO_FORMAT_S16:
3073       if (smpl_fmts) {
3074         while (*smpl_fmts != -1) {
3075           if (*smpl_fmts == AV_SAMPLE_FMT_S16) {
3076             smpl_fmt = *smpl_fmts;
3077             break;
3078           } else if (*smpl_fmts == AV_SAMPLE_FMT_S16P) {
3079             smpl_fmt = *smpl_fmts;
3080           }
3081
3082           smpl_fmts++;
3083         }
3084       } else {
3085         smpl_fmt = AV_SAMPLE_FMT_S16;
3086       }
3087       break;
3088     case GST_AUDIO_FORMAT_U8:
3089       if (smpl_fmts) {
3090         while (*smpl_fmts != -1) {
3091           if (*smpl_fmts == AV_SAMPLE_FMT_U8) {
3092             smpl_fmt = *smpl_fmts;
3093             break;
3094           } else if (*smpl_fmts == AV_SAMPLE_FMT_U8P) {
3095             smpl_fmt = *smpl_fmts;
3096           }
3097
3098           smpl_fmts++;
3099         }
3100       } else {
3101         smpl_fmt = AV_SAMPLE_FMT_U8;
3102       }
3103       break;
3104     default:
3105       break;
3106   }
3107
3108   g_assert (smpl_fmt != -1);
3109
3110   context->sample_fmt = smpl_fmt;
3111 }
3112
3113 /* Convert a GstCaps and a FFMPEG codec Type to a
3114  * AVCodecContext. If the context is ommitted, no fixed values
3115  * for video/audio size will be included in the context
3116  *
3117  * AVMediaType is primarily meant for uncompressed data GstCaps!
3118  */
3119
3120 void
3121 gst_ffmpeg_caps_with_codectype (enum AVMediaType type,
3122     const GstCaps * caps, AVCodecContext * context)
3123 {
3124   if (context == NULL)
3125     return;
3126
3127   switch (type) {
3128     case AVMEDIA_TYPE_VIDEO:
3129       gst_ffmpeg_caps_to_pixfmt (caps, context, TRUE);
3130       break;
3131
3132     case AVMEDIA_TYPE_AUDIO:
3133       gst_ffmpeg_caps_to_smpfmt (caps, context, TRUE);
3134       break;
3135
3136     default:
3137       /* unknown */
3138       break;
3139   }
3140 }
3141
3142 #if 0
3143 static void
3144 nal_escape (guint8 * dst, guint8 * src, guint size, guint * destsize)
3145 {
3146   guint8 *dstp = dst;
3147   guint8 *srcp = src;
3148   guint8 *end = src + size;
3149   gint count = 0;
3150
3151   while (srcp < end) {
3152     if (count == 2 && *srcp <= 0x03) {
3153       GST_DEBUG ("added escape code");
3154       *dstp++ = 0x03;
3155       count = 0;
3156     }
3157     if (*srcp == 0)
3158       count++;
3159     else
3160       count = 0;
3161
3162     GST_DEBUG ("copy %02x, count %d", *srcp, count);
3163     *dstp++ = *srcp++;
3164   }
3165   *destsize = dstp - dst;
3166 }
3167
3168 /* copy the config, escaping NAL units as we iterate them, if something fails we
3169  * copy everything and hope for the best. */
3170 static void
3171 copy_config (guint8 * dst, guint8 * src, guint size, guint * destsize)
3172 {
3173   guint8 *dstp = dst;
3174   guint8 *srcp = src;
3175   gint cnt, i;
3176   guint nalsize, esize;
3177
3178   /* check size */
3179   if (size < 7)
3180     goto full_copy;
3181
3182   /* check version */
3183   if (*srcp != 1)
3184     goto full_copy;
3185
3186   cnt = *(srcp + 5) & 0x1f;     /* Number of sps */
3187
3188   GST_DEBUG ("num SPS %d", cnt);
3189
3190   memcpy (dstp, srcp, 6);
3191   srcp += 6;
3192   dstp += 6;
3193
3194   for (i = 0; i < cnt; i++) {
3195     GST_DEBUG ("copy SPS %d", i);
3196     nalsize = (srcp[0] << 8) | srcp[1];
3197     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3198     dstp[0] = esize >> 8;
3199     dstp[1] = esize & 0xff;
3200     dstp += esize + 2;
3201     srcp += nalsize + 2;
3202   }
3203
3204   cnt = *(dstp++) = *(srcp++);  /* Number of pps */
3205
3206   GST_DEBUG ("num PPS %d", cnt);
3207
3208   for (i = 0; i < cnt; i++) {
3209     GST_DEBUG ("copy PPS %d", i);
3210     nalsize = (srcp[0] << 8) | srcp[1];
3211     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3212     dstp[0] = esize >> 8;
3213     dstp[1] = esize & 0xff;
3214     dstp += esize + 2;
3215     srcp += nalsize + 2;
3216   }
3217   *destsize = dstp - dst;
3218
3219   return;
3220
3221 full_copy:
3222   {
3223     GST_DEBUG ("something unexpected, doing full copy");
3224     memcpy (dst, src, size);
3225     *destsize = size;
3226     return;
3227   }
3228 }
3229 #endif
3230
3231 /*
3232  * caps_with_codecid () transforms a GstCaps for a known codec
3233  * ID into a filled-in context.
3234  * codec_data from caps will override possible extradata already in the context
3235  */
3236
3237 void
3238 gst_ffmpeg_caps_with_codecid (enum AVCodecID codec_id,
3239     enum AVMediaType codec_type, const GstCaps * caps, AVCodecContext * context)
3240 {
3241   GstStructure *str;
3242   const GValue *value;
3243   GstBuffer *buf;
3244
3245   GST_LOG ("codec_id:%d, codec_type:%d, caps:%" GST_PTR_FORMAT " context:%p",
3246       codec_id, codec_type, caps, context);
3247
3248   if (!context || !gst_caps_get_size (caps))
3249     return;
3250
3251   str = gst_caps_get_structure (caps, 0);
3252
3253   /* extradata parsing (esds [mpeg4], wma/wmv, msmpeg4v1/2/3, etc.) */
3254   if ((value = gst_structure_get_value (str, "codec_data"))) {
3255     GstMapInfo map;
3256
3257     buf = gst_value_get_buffer (value);
3258     gst_buffer_map (buf, &map, GST_MAP_READ);
3259
3260     /* free the old one if it is there */
3261     if (context->extradata)
3262       av_free (context->extradata);
3263
3264 #if 0
3265     if (codec_id == AV_CODEC_ID_H264) {
3266       guint extrasize;
3267
3268       GST_DEBUG ("copy, escaping codec_data %d", size);
3269       /* ffmpeg h264 expects the codec_data to be escaped, there is no real
3270        * reason for this but let's just escape it for now. Start by allocating
3271        * enough space, x2 is more than enough.
3272        *
3273        * FIXME, we disabled escaping because some file already contain escaped
3274        * codec_data and then we escape twice and fail. It's better to leave it
3275        * as is, as that is what most players do. */
3276       context->extradata =
3277           av_mallocz (GST_ROUND_UP_16 (size * 2 +
3278               AV_INPUT_BUFFER_PADDING_SIZE));
3279       copy_config (context->extradata, data, size, &extrasize);
3280       GST_DEBUG ("escaped size: %d", extrasize);
3281       context->extradata_size = extrasize;
3282     } else
3283 #endif
3284     {
3285       /* allocate with enough padding */
3286       GST_DEBUG ("copy codec_data");
3287       context->extradata =
3288           av_mallocz (GST_ROUND_UP_16 (map.size +
3289               AV_INPUT_BUFFER_PADDING_SIZE));
3290       memcpy (context->extradata, map.data, map.size);
3291       context->extradata_size = map.size;
3292     }
3293
3294     /* Hack for VC1. Sometimes the first (length) byte is 0 for some files */
3295     if (codec_id == AV_CODEC_ID_VC1 && map.size > 0 && map.data[0] == 0) {
3296       context->extradata[0] = (guint8) map.size;
3297     }
3298
3299     GST_DEBUG ("have codec data of size %" G_GSIZE_FORMAT, map.size);
3300
3301     gst_buffer_unmap (buf, &map);
3302   } else {
3303     context->extradata = NULL;
3304     context->extradata_size = 0;
3305     GST_DEBUG ("no codec data");
3306   }
3307
3308   switch (codec_id) {
3309     case AV_CODEC_ID_MPEG4:
3310     {
3311       const gchar *mime = gst_structure_get_name (str);
3312
3313       context->flags |= AV_CODEC_FLAG_4MV;
3314
3315       if (!strcmp (mime, "video/x-divx"))
3316         context->codec_tag = GST_MAKE_FOURCC ('D', 'I', 'V', 'X');
3317       else if (!strcmp (mime, "video/mpeg")) {
3318         const gchar *profile;
3319
3320         context->codec_tag = GST_MAKE_FOURCC ('m', 'p', '4', 'v');
3321
3322         profile = gst_structure_get_string (str, "profile");
3323         if (profile) {
3324           if (g_strcmp0 (profile, "advanced-simple") == 0)
3325             context->flags |= AV_CODEC_FLAG_QPEL;
3326         }
3327       }
3328       break;
3329     }
3330
3331     case AV_CODEC_ID_SVQ3:
3332       /* FIXME: this is a workaround for older gst-plugins releases
3333        * (<= 0.8.9). This should be removed at some point, because
3334        * it causes wrong decoded frame order. */
3335       if (!context->extradata) {
3336         gint halfpel_flag, thirdpel_flag, low_delay, unknown_svq3_flag;
3337         guint16 flags;
3338
3339         if (gst_structure_get_int (str, "halfpel_flag", &halfpel_flag) &&
3340             gst_structure_get_int (str, "thirdpel_flag", &thirdpel_flag) &&
3341             gst_structure_get_int (str, "low_delay", &low_delay) &&
3342             gst_structure_get_int (str, "unknown_svq3_flag",
3343                 &unknown_svq3_flag)) {
3344           context->extradata = (guint8 *) av_mallocz (0x64);
3345           g_stpcpy ((gchar *) context->extradata, "SVQ3");
3346           flags = 1 << 3;
3347           flags |= low_delay;
3348           flags = flags << 2;
3349           flags |= unknown_svq3_flag;
3350           flags = flags << 6;
3351           flags |= halfpel_flag;
3352           flags = flags << 1;
3353           flags |= thirdpel_flag;
3354           flags = flags << 3;
3355
3356           flags = GUINT16_FROM_LE (flags);
3357
3358           memcpy ((gchar *) context->extradata + 0x62, &flags, 2);
3359           context->extradata_size = 0x64;
3360         }
3361       }
3362       break;
3363
3364     case AV_CODEC_ID_MSRLE:
3365     case AV_CODEC_ID_QTRLE:
3366     case AV_CODEC_ID_TSCC:
3367     case AV_CODEC_ID_CSCD:
3368     case AV_CODEC_ID_APE:
3369     {
3370       gint depth;
3371
3372       if (gst_structure_get_int (str, "depth", &depth)) {
3373         context->bits_per_coded_sample = depth;
3374       } else {
3375         GST_WARNING ("No depth field in caps %" GST_PTR_FORMAT, caps);
3376       }
3377
3378     }
3379       break;
3380
3381     case AV_CODEC_ID_COOK:
3382     case AV_CODEC_ID_RA_288:
3383     case AV_CODEC_ID_RA_144:
3384     case AV_CODEC_ID_SIPR:
3385     {
3386       gint leaf_size;
3387       gint bitrate;
3388
3389       if (gst_structure_get_int (str, "leaf_size", &leaf_size))
3390         context->block_align = leaf_size;
3391       if (gst_structure_get_int (str, "bitrate", &bitrate))
3392         context->bit_rate = bitrate;
3393     }
3394       break;
3395     case AV_CODEC_ID_ALAC:
3396       gst_structure_get_int (str, "samplesize",
3397           &context->bits_per_coded_sample);
3398       break;
3399
3400     case AV_CODEC_ID_DVVIDEO:
3401     {
3402       const gchar *format;
3403
3404       if ((format = gst_structure_get_string (str, "format"))) {
3405
3406         if (g_str_equal (format, "YUY2"))
3407           context->pix_fmt = AV_PIX_FMT_YUYV422;
3408         else if (g_str_equal (format, "I420"))
3409           context->pix_fmt = AV_PIX_FMT_YUV420P;
3410         else if (g_str_equal (format, "A420"))
3411           context->pix_fmt = AV_PIX_FMT_YUVA420P;
3412         else if (g_str_equal (format, "Y41B"))
3413           context->pix_fmt = AV_PIX_FMT_YUV411P;
3414         else if (g_str_equal (format, "Y42B"))
3415           context->pix_fmt = AV_PIX_FMT_YUV422P;
3416         else if (g_str_equal (format, "YUV9"))
3417           context->pix_fmt = AV_PIX_FMT_YUV410P;
3418         else {
3419           GST_WARNING ("couldn't convert format %s" " to a pixel format",
3420               format);
3421         }
3422       } else
3423         GST_WARNING ("No specified format");
3424       break;
3425     }
3426     case AV_CODEC_ID_H263P:
3427     {
3428       gboolean val;
3429
3430       if (!gst_structure_get_boolean (str, "annex-f", &val) || val)
3431         context->flags |= AV_CODEC_FLAG_4MV;
3432       else
3433         context->flags &= ~AV_CODEC_FLAG_4MV;
3434       if ((!gst_structure_get_boolean (str, "annex-i", &val) || val) &&
3435           (!gst_structure_get_boolean (str, "annex-t", &val) || val))
3436         context->flags |= AV_CODEC_FLAG_AC_PRED;
3437       else
3438         context->flags &= ~AV_CODEC_FLAG_AC_PRED;
3439       if (!gst_structure_get_boolean (str, "annex-j", &val) || val)
3440         context->flags |= AV_CODEC_FLAG_LOOP_FILTER;
3441       else
3442         context->flags &= ~AV_CODEC_FLAG_LOOP_FILTER;
3443       break;
3444     }
3445     case AV_CODEC_ID_ADPCM_G726:
3446     {
3447       const gchar *layout;
3448
3449       if ((layout = gst_structure_get_string (str, "layout"))) {
3450         if (!strcmp (layout, "g721")) {
3451           context->sample_rate = 8000;
3452           context->channels = 1;
3453           context->bit_rate = 32000;
3454         }
3455       }
3456       break;
3457     }
3458     case AV_CODEC_ID_SPEEDHQ:
3459     {
3460       const gchar *variant;
3461
3462       if (context && (variant = gst_structure_get_string (str, "variant"))
3463           && strlen (variant) == 4) {
3464
3465         context->codec_tag =
3466             GST_MAKE_FOURCC (variant[0], variant[1], variant[2], variant[3]);
3467       }
3468       break;
3469     }
3470     default:
3471       break;
3472   }
3473
3474   if (!gst_caps_is_fixed (caps))
3475     return;
3476
3477   /* common properties (width, height, fps) */
3478   switch (codec_type) {
3479     case AVMEDIA_TYPE_VIDEO:
3480       gst_ffmpeg_caps_to_pixfmt (caps, context,
3481           codec_id == AV_CODEC_ID_RAWVIDEO);
3482       break;
3483     case AVMEDIA_TYPE_AUDIO:
3484       gst_ffmpeg_caps_to_smpfmt (caps, context, FALSE);
3485       break;
3486     default:
3487       break;
3488   }
3489
3490   /* fixup of default settings */
3491   switch (codec_id) {
3492     case AV_CODEC_ID_QCELP:
3493       /* QCELP is always mono, no matter what the caps say */
3494       context->channels = 1;
3495       break;
3496     case AV_CODEC_ID_ADPCM_G726:
3497       if (context->sample_rate && context->bit_rate)
3498         context->bits_per_coded_sample =
3499             context->bit_rate / context->sample_rate;
3500       break;
3501     default:
3502       break;
3503   }
3504 }
3505
3506 /* _formatid_to_caps () is meant for muxers/demuxers, it
3507  * transforms a name (ffmpeg way of ID'ing these, why don't
3508  * they have unique numerical IDs?) to the corresponding
3509  * caps belonging to that mux-format
3510  *
3511  * Note: we don't need any additional info because the caps
3512  * isn't supposed to contain any useful info besides the
3513  * media type anyway
3514  */
3515
3516 GstCaps *
3517 gst_ffmpeg_formatid_to_caps (const gchar * format_name)
3518 {
3519   GstCaps *caps = NULL;
3520
3521   if (!strcmp (format_name, "mpeg")) {
3522     caps = gst_caps_new_simple ("video/mpeg",
3523         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3524   } else if (!strcmp (format_name, "mpegts")) {
3525     caps = gst_caps_new_simple ("video/mpegts",
3526         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3527   } else if (!strcmp (format_name, "rm")) {
3528     caps = gst_caps_new_simple ("application/x-pn-realmedia",
3529         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3530   } else if (!strcmp (format_name, "asf")) {
3531     caps = gst_caps_new_empty_simple ("video/x-ms-asf");
3532   } else if (!strcmp (format_name, "avi")) {
3533     caps = gst_caps_new_empty_simple ("video/x-msvideo");
3534   } else if (!strcmp (format_name, "wav")) {
3535     caps = gst_caps_new_empty_simple ("audio/x-wav");
3536   } else if (!strcmp (format_name, "ape")) {
3537     caps = gst_caps_new_empty_simple ("application/x-ape");
3538   } else if (!strcmp (format_name, "swf")) {
3539     caps = gst_caps_new_empty_simple ("application/x-shockwave-flash");
3540   } else if (!strcmp (format_name, "au")) {
3541     caps = gst_caps_new_empty_simple ("audio/x-au");
3542   } else if (!strcmp (format_name, "dv")) {
3543     caps = gst_caps_new_simple ("video/x-dv",
3544         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3545   } else if (!strcmp (format_name, "4xm")) {
3546     caps = gst_caps_new_empty_simple ("video/x-4xm");
3547   } else if (!strcmp (format_name, "matroska")) {
3548     caps = gst_caps_new_empty_simple ("video/x-matroska");
3549   } else if (!strcmp (format_name, "ivf")) {
3550     caps = gst_caps_new_empty_simple ("video/x-ivf");
3551   } else if (!strcmp (format_name, "mp3")) {
3552     caps = gst_caps_new_empty_simple ("application/x-id3");
3553   } else if (!strcmp (format_name, "flic")) {
3554     caps = gst_caps_new_empty_simple ("video/x-fli");
3555   } else if (!strcmp (format_name, "flv")) {
3556     caps = gst_caps_new_empty_simple ("video/x-flv");
3557   } else if (!strcmp (format_name, "tta")) {
3558     caps = gst_caps_new_empty_simple ("audio/x-ttafile");
3559   } else if (!strcmp (format_name, "aiff")) {
3560     caps = gst_caps_new_empty_simple ("audio/x-aiff");
3561   } else if (!strcmp (format_name, "mov_mp4_m4a_3gp_3g2")) {
3562     caps =
3563         gst_caps_from_string
3564         ("application/x-3gp; video/quicktime; audio/x-m4a");
3565   } else if (!strcmp (format_name, "mov")) {
3566     caps = gst_caps_from_string ("video/quicktime,variant=(string)apple");
3567   } else if (!strcmp (format_name, "mp4")) {
3568     caps = gst_caps_from_string ("video/quicktime,variant=(string)iso");
3569   } else if (!strcmp (format_name, "3gp")) {
3570     caps = gst_caps_from_string ("video/quicktime,variant=(string)3gpp");
3571   } else if (!strcmp (format_name, "3g2")) {
3572     caps = gst_caps_from_string ("video/quicktime,variant=(string)3g2");
3573   } else if (!strcmp (format_name, "psp")) {
3574     caps = gst_caps_from_string ("video/quicktime,variant=(string)psp");
3575   } else if (!strcmp (format_name, "ipod")) {
3576     caps = gst_caps_from_string ("video/quicktime,variant=(string)ipod");
3577   } else if (!strcmp (format_name, "aac")) {
3578     caps = gst_caps_new_simple ("audio/mpeg",
3579         "mpegversion", G_TYPE_INT, 4, NULL);
3580   } else if (!strcmp (format_name, "gif")) {
3581     caps = gst_caps_from_string ("image/gif");
3582   } else if (!strcmp (format_name, "ogg")) {
3583     caps = gst_caps_from_string ("application/ogg");
3584   } else if (!strcmp (format_name, "mxf") || !strcmp (format_name, "mxf_d10")) {
3585     caps = gst_caps_from_string ("application/mxf");
3586   } else if (!strcmp (format_name, "gxf")) {
3587     caps = gst_caps_from_string ("application/gxf");
3588   } else if (!strcmp (format_name, "yuv4mpegpipe")) {
3589     caps = gst_caps_new_simple ("application/x-yuv4mpeg",
3590         "y4mversion", G_TYPE_INT, 2, NULL);
3591   } else if (!strcmp (format_name, "mpc")) {
3592     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 7");
3593   } else if (!strcmp (format_name, "mpc8")) {
3594     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 8");
3595   } else if (!strcmp (format_name, "vqf")) {
3596     caps = gst_caps_from_string ("audio/x-vqf");
3597   } else if (!strcmp (format_name, "nsv")) {
3598     caps = gst_caps_from_string ("video/x-nsv");
3599   } else if (!strcmp (format_name, "amr")) {
3600     caps = gst_caps_from_string ("audio/x-amr-nb-sh");
3601   } else if (!strcmp (format_name, "webm")) {
3602     caps = gst_caps_from_string ("video/webm");
3603   } else if (!strcmp (format_name, "voc")) {
3604     caps = gst_caps_from_string ("audio/x-voc");
3605   } else if (!strcmp (format_name, "pva")) {
3606     caps = gst_caps_from_string ("video/x-pva");
3607   } else if (!strcmp (format_name, "brstm")) {
3608     caps = gst_caps_from_string ("audio/x-brstm");
3609   } else if (!strcmp (format_name, "bfstm")) {
3610     caps = gst_caps_from_string ("audio/x-bfstm");
3611   } else {
3612     gchar *name;
3613
3614     GST_LOG ("Could not create stream format caps for %s", format_name);
3615     name = g_strdup_printf ("application/x-gst-av-%s", format_name);
3616     caps = gst_caps_new_empty_simple (name);
3617     g_free (name);
3618   }
3619
3620   return caps;
3621 }
3622
3623 gboolean
3624 gst_ffmpeg_formatid_get_codecids (const gchar * format_name,
3625     enum AVCodecID ** video_codec_list, enum AVCodecID ** audio_codec_list,
3626     AVOutputFormat * plugin)
3627 {
3628   static enum AVCodecID tmp_vlist[] = {
3629     AV_CODEC_ID_NONE,
3630     AV_CODEC_ID_NONE
3631   };
3632   static enum AVCodecID tmp_alist[] = {
3633     AV_CODEC_ID_NONE,
3634     AV_CODEC_ID_NONE
3635   };
3636
3637   GST_LOG ("format_name : %s", format_name);
3638
3639   if (!strcmp (format_name, "mp4")) {
3640     static enum AVCodecID mp4_video_list[] = {
3641       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H264,
3642       AV_CODEC_ID_MJPEG,
3643       AV_CODEC_ID_NONE
3644     };
3645     static enum AVCodecID mp4_audio_list[] = {
3646       AV_CODEC_ID_AAC, AV_CODEC_ID_MP3,
3647       AV_CODEC_ID_NONE
3648     };
3649
3650     *video_codec_list = mp4_video_list;
3651     *audio_codec_list = mp4_audio_list;
3652   } else if (!strcmp (format_name, "mpeg")) {
3653     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3654       AV_CODEC_ID_MPEG2VIDEO,
3655       AV_CODEC_ID_H264,
3656       AV_CODEC_ID_NONE
3657     };
3658     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP1,
3659       AV_CODEC_ID_MP2,
3660       AV_CODEC_ID_MP3,
3661       AV_CODEC_ID_NONE
3662     };
3663
3664     *video_codec_list = mpeg_video_list;
3665     *audio_codec_list = mpeg_audio_list;
3666   } else if (!strcmp (format_name, "dvd")) {
3667     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG2VIDEO,
3668       AV_CODEC_ID_NONE
3669     };
3670     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP2,
3671       AV_CODEC_ID_AC3,
3672       AV_CODEC_ID_DTS,
3673       AV_CODEC_ID_PCM_S16BE,
3674       AV_CODEC_ID_NONE
3675     };
3676
3677     *video_codec_list = mpeg_video_list;
3678     *audio_codec_list = mpeg_audio_list;
3679   } else if (!strcmp (format_name, "mpegts")) {
3680     static enum AVCodecID mpegts_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3681       AV_CODEC_ID_MPEG2VIDEO,
3682       AV_CODEC_ID_H264,
3683       AV_CODEC_ID_NONE
3684     };
3685     static enum AVCodecID mpegts_audio_list[] = { AV_CODEC_ID_MP2,
3686       AV_CODEC_ID_MP3,
3687       AV_CODEC_ID_AC3,
3688       AV_CODEC_ID_DTS,
3689       AV_CODEC_ID_AAC,
3690       AV_CODEC_ID_NONE
3691     };
3692
3693     *video_codec_list = mpegts_video_list;
3694     *audio_codec_list = mpegts_audio_list;
3695   } else if (!strcmp (format_name, "vob")) {
3696     static enum AVCodecID vob_video_list[] =
3697         { AV_CODEC_ID_MPEG2VIDEO, AV_CODEC_ID_NONE };
3698     static enum AVCodecID vob_audio_list[] = { AV_CODEC_ID_MP2, AV_CODEC_ID_AC3,
3699       AV_CODEC_ID_DTS, AV_CODEC_ID_NONE
3700     };
3701
3702     *video_codec_list = vob_video_list;
3703     *audio_codec_list = vob_audio_list;
3704   } else if (!strcmp (format_name, "flv")) {
3705     static enum AVCodecID flv_video_list[] =
3706         { AV_CODEC_ID_FLV1, AV_CODEC_ID_NONE };
3707     static enum AVCodecID flv_audio_list[] =
3708         { AV_CODEC_ID_MP3, AV_CODEC_ID_NONE };
3709
3710     *video_codec_list = flv_video_list;
3711     *audio_codec_list = flv_audio_list;
3712   } else if (!strcmp (format_name, "asf")) {
3713     static enum AVCodecID asf_video_list[] =
3714         { AV_CODEC_ID_WMV1, AV_CODEC_ID_WMV2, AV_CODEC_ID_MSMPEG4V3,
3715       AV_CODEC_ID_NONE
3716     };
3717     static enum AVCodecID asf_audio_list[] =
3718         { AV_CODEC_ID_WMAV1, AV_CODEC_ID_WMAV2, AV_CODEC_ID_MP3,
3719       AV_CODEC_ID_NONE
3720     };
3721
3722     *video_codec_list = asf_video_list;
3723     *audio_codec_list = asf_audio_list;
3724   } else if (!strcmp (format_name, "dv")) {
3725     static enum AVCodecID dv_video_list[] =
3726         { AV_CODEC_ID_DVVIDEO, AV_CODEC_ID_NONE };
3727     static enum AVCodecID dv_audio_list[] =
3728         { AV_CODEC_ID_PCM_S16LE, AV_CODEC_ID_NONE };
3729
3730     *video_codec_list = dv_video_list;
3731     *audio_codec_list = dv_audio_list;
3732   } else if (!strcmp (format_name, "mov")) {
3733     static enum AVCodecID mov_video_list[] = {
3734       AV_CODEC_ID_SVQ1, AV_CODEC_ID_SVQ3, AV_CODEC_ID_MPEG4,
3735       AV_CODEC_ID_H263, AV_CODEC_ID_H263P,
3736       AV_CODEC_ID_H264, AV_CODEC_ID_DVVIDEO,
3737       AV_CODEC_ID_MJPEG,
3738       AV_CODEC_ID_NONE
3739     };
3740     static enum AVCodecID mov_audio_list[] = {
3741       AV_CODEC_ID_PCM_MULAW, AV_CODEC_ID_PCM_ALAW, AV_CODEC_ID_ADPCM_IMA_QT,
3742       AV_CODEC_ID_MACE3, AV_CODEC_ID_MACE6, AV_CODEC_ID_AAC,
3743       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3744       AV_CODEC_ID_PCM_S16BE, AV_CODEC_ID_PCM_S16LE,
3745       AV_CODEC_ID_MP3, AV_CODEC_ID_NONE
3746     };
3747
3748     *video_codec_list = mov_video_list;
3749     *audio_codec_list = mov_audio_list;
3750   } else if ((!strcmp (format_name, "3gp") || !strcmp (format_name, "3g2"))) {
3751     static enum AVCodecID tgp_video_list[] = {
3752       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H263, AV_CODEC_ID_H263P, AV_CODEC_ID_H264,
3753       AV_CODEC_ID_NONE
3754     };
3755     static enum AVCodecID tgp_audio_list[] = {
3756       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3757       AV_CODEC_ID_AAC,
3758       AV_CODEC_ID_NONE
3759     };
3760
3761     *video_codec_list = tgp_video_list;
3762     *audio_codec_list = tgp_audio_list;
3763   } else if (!strcmp (format_name, "mmf")) {
3764     static enum AVCodecID mmf_audio_list[] = {
3765       AV_CODEC_ID_ADPCM_YAMAHA, AV_CODEC_ID_NONE
3766     };
3767     *video_codec_list = NULL;
3768     *audio_codec_list = mmf_audio_list;
3769   } else if (!strcmp (format_name, "amr")) {
3770     static enum AVCodecID amr_audio_list[] = {
3771       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3772       AV_CODEC_ID_NONE
3773     };
3774     *video_codec_list = NULL;
3775     *audio_codec_list = amr_audio_list;
3776   } else if (!strcmp (format_name, "gif")) {
3777     static enum AVCodecID gif_image_list[] = {
3778       AV_CODEC_ID_RAWVIDEO, AV_CODEC_ID_NONE
3779     };
3780     *video_codec_list = gif_image_list;
3781     *audio_codec_list = NULL;
3782   } else if ((!strcmp (format_name, "pva"))) {
3783     static enum AVCodecID pga_video_list[] = {
3784       AV_CODEC_ID_MPEG2VIDEO,
3785       AV_CODEC_ID_NONE
3786     };
3787     static enum AVCodecID pga_audio_list[] = {
3788       AV_CODEC_ID_MP2,
3789       AV_CODEC_ID_NONE
3790     };
3791
3792     *video_codec_list = pga_video_list;
3793     *audio_codec_list = pga_audio_list;
3794   } else if ((!strcmp (format_name, "ivf"))) {
3795     static enum AVCodecID ivf_video_list[] = {
3796       AV_CODEC_ID_VP8,
3797       AV_CODEC_ID_VP9,
3798       AV_CODEC_ID_AV1,
3799       AV_CODEC_ID_NONE
3800     };
3801     static enum AVCodecID ivf_audio_list[] = {
3802       AV_CODEC_ID_NONE
3803     };
3804
3805     *video_codec_list = ivf_video_list;
3806     *audio_codec_list = ivf_audio_list;
3807   } else if ((plugin->audio_codec != AV_CODEC_ID_NONE) ||
3808       (plugin->video_codec != AV_CODEC_ID_NONE)) {
3809     tmp_vlist[0] = plugin->video_codec;
3810     tmp_alist[0] = plugin->audio_codec;
3811
3812     *video_codec_list = tmp_vlist;
3813     *audio_codec_list = tmp_alist;
3814   } else {
3815     GST_LOG ("Format %s not found", format_name);
3816     return FALSE;
3817   }
3818
3819   return TRUE;
3820 }
3821
3822 /* Convert a GstCaps to a FFMPEG codec ID. Size et all
3823  * are omitted, that can be queried by the user itself,
3824  * we're not eating the GstCaps or anything
3825  * A pointer to an allocated context is also needed for
3826  * optional extra info
3827  */
3828
3829 enum AVCodecID
3830 gst_ffmpeg_caps_to_codecid (const GstCaps * caps, AVCodecContext * context)
3831 {
3832   enum AVCodecID id = AV_CODEC_ID_NONE;
3833   const gchar *mimetype;
3834   const GstStructure *structure;
3835   gboolean video = FALSE, audio = FALSE;        /* we want to be sure! */
3836
3837   g_return_val_if_fail (caps != NULL, AV_CODEC_ID_NONE);
3838   g_return_val_if_fail (gst_caps_get_size (caps) == 1, AV_CODEC_ID_NONE);
3839   structure = gst_caps_get_structure (caps, 0);
3840
3841   mimetype = gst_structure_get_name (structure);
3842
3843   if (!strcmp (mimetype, "video/x-raw")) {
3844     id = AV_CODEC_ID_RAWVIDEO;
3845     video = TRUE;
3846   } else if (!strcmp (mimetype, "audio/x-raw")) {
3847     GstAudioInfo info;
3848
3849     if (gst_audio_info_from_caps (&info, caps)) {
3850       switch (GST_AUDIO_INFO_FORMAT (&info)) {
3851         case GST_AUDIO_FORMAT_S8:
3852           id = AV_CODEC_ID_PCM_S8;
3853           break;
3854         case GST_AUDIO_FORMAT_U8:
3855           id = AV_CODEC_ID_PCM_U8;
3856           break;
3857         case GST_AUDIO_FORMAT_S16LE:
3858           id = AV_CODEC_ID_PCM_S16LE;
3859           break;
3860         case GST_AUDIO_FORMAT_S16BE:
3861           id = AV_CODEC_ID_PCM_S16BE;
3862           break;
3863         case GST_AUDIO_FORMAT_U16LE:
3864           id = AV_CODEC_ID_PCM_U16LE;
3865           break;
3866         case GST_AUDIO_FORMAT_U16BE:
3867           id = AV_CODEC_ID_PCM_U16BE;
3868           break;
3869         default:
3870           break;
3871       }
3872       if (id != AV_CODEC_ID_NONE)
3873         audio = TRUE;
3874     }
3875   } else if (!strcmp (mimetype, "audio/x-mulaw")) {
3876     id = AV_CODEC_ID_PCM_MULAW;
3877     audio = TRUE;
3878   } else if (!strcmp (mimetype, "audio/x-alaw")) {
3879     id = AV_CODEC_ID_PCM_ALAW;
3880     audio = TRUE;
3881   } else if (!strcmp (mimetype, "video/x-dv")) {
3882     gboolean sys_strm;
3883
3884     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3885         !sys_strm) {
3886       id = AV_CODEC_ID_DVVIDEO;
3887       video = TRUE;
3888     }
3889   } else if (!strcmp (mimetype, "audio/x-dv")) {        /* ??? */
3890     id = AV_CODEC_ID_DVAUDIO;
3891     audio = TRUE;
3892   } else if (!strcmp (mimetype, "video/x-h263")) {
3893     const gchar *h263version =
3894         gst_structure_get_string (structure, "h263version");
3895     if (h263version && !strcmp (h263version, "h263p"))
3896       id = AV_CODEC_ID_H263P;
3897     else
3898       id = AV_CODEC_ID_H263;
3899     video = TRUE;
3900   } else if (!strcmp (mimetype, "video/x-intel-h263")) {
3901     id = AV_CODEC_ID_H263I;
3902     video = TRUE;
3903   } else if (!strcmp (mimetype, "video/x-h261")) {
3904     id = AV_CODEC_ID_H261;
3905     video = TRUE;
3906   } else if (!strcmp (mimetype, "video/mpeg")) {
3907     gboolean sys_strm;
3908     gint mpegversion;
3909
3910     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3911         gst_structure_get_int (structure, "mpegversion", &mpegversion) &&
3912         !sys_strm) {
3913       switch (mpegversion) {
3914         case 1:
3915           id = AV_CODEC_ID_MPEG1VIDEO;
3916           break;
3917         case 2:
3918           id = AV_CODEC_ID_MPEG2VIDEO;
3919           break;
3920         case 4:
3921           id = AV_CODEC_ID_MPEG4;
3922           break;
3923       }
3924     }
3925     if (id != AV_CODEC_ID_NONE)
3926       video = TRUE;
3927   } else if (!strcmp (mimetype, "image/jpeg")) {
3928     id = AV_CODEC_ID_MJPEG;     /* A... B... */
3929     video = TRUE;
3930   } else if (!strcmp (mimetype, "video/x-jpeg-b")) {
3931     id = AV_CODEC_ID_MJPEGB;
3932     video = TRUE;
3933   } else if (!strcmp (mimetype, "video/x-wmv")) {
3934     gint wmvversion = 0;
3935
3936     if (gst_structure_get_int (structure, "wmvversion", &wmvversion)) {
3937       switch (wmvversion) {
3938         case 1:
3939           id = AV_CODEC_ID_WMV1;
3940           break;
3941         case 2:
3942           id = AV_CODEC_ID_WMV2;
3943           break;
3944         case 3:
3945         {
3946           const gchar *format;
3947
3948           /* WMV3 unless the fourcc exists and says otherwise */
3949           id = AV_CODEC_ID_WMV3;
3950
3951           if ((format = gst_structure_get_string (structure, "format")) &&
3952               (g_str_equal (format, "WVC1") || g_str_equal (format, "WMVA")))
3953             id = AV_CODEC_ID_VC1;
3954
3955           break;
3956         }
3957       }
3958     }
3959     if (id != AV_CODEC_ID_NONE)
3960       video = TRUE;
3961   } else if (!strcmp (mimetype, "audio/x-vorbis")) {
3962     id = AV_CODEC_ID_VORBIS;
3963     audio = TRUE;
3964   } else if (!strcmp (mimetype, "audio/x-qdm2")) {
3965     id = AV_CODEC_ID_QDM2;
3966     audio = TRUE;
3967   } else if (!strcmp (mimetype, "audio/mpeg")) {
3968     gint layer = 0;
3969     gint mpegversion = 0;
3970
3971     if (gst_structure_get_int (structure, "mpegversion", &mpegversion)) {
3972       switch (mpegversion) {
3973         case 2:                /* ffmpeg uses faad for both... */
3974         case 4:
3975           id = AV_CODEC_ID_AAC;
3976           break;
3977         case 1:
3978           if (gst_structure_get_int (structure, "layer", &layer)) {
3979             switch (layer) {
3980               case 1:
3981                 id = AV_CODEC_ID_MP1;
3982                 break;
3983               case 2:
3984                 id = AV_CODEC_ID_MP2;
3985                 break;
3986               case 3:
3987                 id = AV_CODEC_ID_MP3;
3988                 break;
3989             }
3990           }
3991       }
3992     }
3993     if (id != AV_CODEC_ID_NONE)
3994       audio = TRUE;
3995   } else if (!strcmp (mimetype, "audio/x-musepack")) {
3996     gint streamversion = -1;
3997
3998     if (gst_structure_get_int (structure, "streamversion", &streamversion)) {
3999       if (streamversion == 7)
4000         id = AV_CODEC_ID_MUSEPACK7;
4001     } else {
4002       id = AV_CODEC_ID_MUSEPACK7;
4003     }
4004   } else if (!strcmp (mimetype, "audio/x-wma")) {
4005     gint wmaversion = 0;
4006
4007     if (gst_structure_get_int (structure, "wmaversion", &wmaversion)) {
4008       switch (wmaversion) {
4009         case 1:
4010           id = AV_CODEC_ID_WMAV1;
4011           break;
4012         case 2:
4013           id = AV_CODEC_ID_WMAV2;
4014           break;
4015         case 3:
4016           id = AV_CODEC_ID_WMAPRO;
4017           break;
4018       }
4019     }
4020     if (id != AV_CODEC_ID_NONE)
4021       audio = TRUE;
4022   } else if (!strcmp (mimetype, "audio/x-xma")) {
4023     gint xmaversion = 0;
4024
4025     if (gst_structure_get_int (structure, "xmaversion", &xmaversion)) {
4026       switch (xmaversion) {
4027         case 1:
4028           id = AV_CODEC_ID_XMA1;
4029           break;
4030         case 2:
4031           id = AV_CODEC_ID_XMA2;
4032           break;
4033       }
4034     }
4035     if (id != AV_CODEC_ID_NONE)
4036       audio = TRUE;
4037   } else if (!strcmp (mimetype, "audio/x-wms")) {
4038     id = AV_CODEC_ID_WMAVOICE;
4039     audio = TRUE;
4040   } else if (!strcmp (mimetype, "audio/x-ac3")) {
4041     id = AV_CODEC_ID_AC3;
4042     audio = TRUE;
4043   } else if (!strcmp (mimetype, "audio/x-eac3")) {
4044     id = AV_CODEC_ID_EAC3;
4045     audio = TRUE;
4046   } else if (!strcmp (mimetype, "audio/x-vnd.sony.atrac3") ||
4047       !strcmp (mimetype, "audio/atrac3")) {
4048     id = AV_CODEC_ID_ATRAC3;
4049     audio = TRUE;
4050   } else if (!strcmp (mimetype, "audio/x-dts")) {
4051     id = AV_CODEC_ID_DTS;
4052     audio = TRUE;
4053   } else if (!strcmp (mimetype, "application/x-ape")) {
4054     id = AV_CODEC_ID_APE;
4055     audio = TRUE;
4056   } else if (!strcmp (mimetype, "video/x-msmpeg")) {
4057     gint msmpegversion = 0;
4058
4059     if (gst_structure_get_int (structure, "msmpegversion", &msmpegversion)) {
4060       switch (msmpegversion) {
4061         case 41:
4062           id = AV_CODEC_ID_MSMPEG4V1;
4063           break;
4064         case 42:
4065           id = AV_CODEC_ID_MSMPEG4V2;
4066           break;
4067         case 43:
4068           id = AV_CODEC_ID_MSMPEG4V3;
4069           break;
4070       }
4071     }
4072     if (id != AV_CODEC_ID_NONE)
4073       video = TRUE;
4074   } else if (!strcmp (mimetype, "video/x-svq")) {
4075     gint svqversion = 0;
4076
4077     if (gst_structure_get_int (structure, "svqversion", &svqversion)) {
4078       switch (svqversion) {
4079         case 1:
4080           id = AV_CODEC_ID_SVQ1;
4081           break;
4082         case 3:
4083           id = AV_CODEC_ID_SVQ3;
4084           break;
4085       }
4086     }
4087     if (id != AV_CODEC_ID_NONE)
4088       video = TRUE;
4089   } else if (!strcmp (mimetype, "video/x-huffyuv")) {
4090     id = AV_CODEC_ID_HUFFYUV;
4091     video = TRUE;
4092   } else if (!strcmp (mimetype, "audio/x-mace")) {
4093     gint maceversion = 0;
4094
4095     if (gst_structure_get_int (structure, "maceversion", &maceversion)) {
4096       switch (maceversion) {
4097         case 3:
4098           id = AV_CODEC_ID_MACE3;
4099           break;
4100         case 6:
4101           id = AV_CODEC_ID_MACE6;
4102           break;
4103       }
4104     }
4105     if (id != AV_CODEC_ID_NONE)
4106       audio = TRUE;
4107   } else if (!strcmp (mimetype, "video/x-theora")) {
4108     id = AV_CODEC_ID_THEORA;
4109     video = TRUE;
4110   } else if (!strcmp (mimetype, "video/x-vp3")) {
4111     id = AV_CODEC_ID_VP3;
4112     video = TRUE;
4113   } else if (!strcmp (mimetype, "video/x-vp5")) {
4114     id = AV_CODEC_ID_VP5;
4115     video = TRUE;
4116   } else if (!strcmp (mimetype, "video/x-vp6")) {
4117     id = AV_CODEC_ID_VP6;
4118     video = TRUE;
4119   } else if (!strcmp (mimetype, "video/x-vp6-flash")) {
4120     id = AV_CODEC_ID_VP6F;
4121     video = TRUE;
4122   } else if (!strcmp (mimetype, "video/x-vp6-alpha")) {
4123     id = AV_CODEC_ID_VP6A;
4124     video = TRUE;
4125   } else if (!strcmp (mimetype, "video/x-vp8")) {
4126     id = AV_CODEC_ID_VP8;
4127     video = TRUE;
4128   } else if (!strcmp (mimetype, "video/x-vp9")) {
4129     id = AV_CODEC_ID_VP9;
4130     video = TRUE;
4131   } else if (!strcmp (mimetype, "video/x-flash-screen")) {
4132     id = AV_CODEC_ID_FLASHSV;
4133     video = TRUE;
4134   } else if (!strcmp (mimetype, "video/x-flash-screen2")) {
4135     id = AV_CODEC_ID_FLASHSV2;
4136     video = TRUE;
4137   } else if (!strcmp (mimetype, "video/x-cineform")) {
4138     id = AV_CODEC_ID_CFHD;
4139     video = TRUE;
4140   } else if (!strcmp (mimetype, "video/x-speedhq")) {
4141     id = AV_CODEC_ID_SPEEDHQ;
4142     video = TRUE;
4143   } else if (!strcmp (mimetype, "video/x-indeo")) {
4144     gint indeoversion = 0;
4145
4146     if (gst_structure_get_int (structure, "indeoversion", &indeoversion)) {
4147       switch (indeoversion) {
4148         case 5:
4149           id = AV_CODEC_ID_INDEO5;
4150           break;
4151         case 4:
4152           id = AV_CODEC_ID_INDEO4;
4153           break;
4154         case 3:
4155           id = AV_CODEC_ID_INDEO3;
4156           break;
4157         case 2:
4158           id = AV_CODEC_ID_INDEO2;
4159           break;
4160       }
4161       if (id != AV_CODEC_ID_NONE)
4162         video = TRUE;
4163     }
4164   } else if (!strcmp (mimetype, "video/x-divx")) {
4165     gint divxversion = 0;
4166
4167     if (gst_structure_get_int (structure, "divxversion", &divxversion)) {
4168       switch (divxversion) {
4169         case 3:
4170           id = AV_CODEC_ID_MSMPEG4V3;
4171           break;
4172         case 4:
4173         case 5:
4174           id = AV_CODEC_ID_MPEG4;
4175           break;
4176       }
4177     }
4178     if (id != AV_CODEC_ID_NONE)
4179       video = TRUE;
4180   } else if (!strcmp (mimetype, "video/x-ffv")) {
4181     gint ffvversion = 0;
4182
4183     if (gst_structure_get_int (structure, "ffvversion", &ffvversion) &&
4184         ffvversion == 1) {
4185       id = AV_CODEC_ID_FFV1;
4186       video = TRUE;
4187     }
4188   } else if (!strcmp (mimetype, "video/x-apple-intermediate-codec")) {
4189     id = AV_CODEC_ID_AIC;
4190     video = TRUE;
4191   } else if (!strcmp (mimetype, "audio/x-adpcm")) {
4192     const gchar *layout;
4193
4194     layout = gst_structure_get_string (structure, "layout");
4195     if (layout == NULL) {
4196       /* break */
4197     } else if (!strcmp (layout, "quicktime")) {
4198       id = AV_CODEC_ID_ADPCM_IMA_QT;
4199     } else if (!strcmp (layout, "microsoft")) {
4200       id = AV_CODEC_ID_ADPCM_MS;
4201     } else if (!strcmp (layout, "dvi")) {
4202       id = AV_CODEC_ID_ADPCM_IMA_WAV;
4203     } else if (!strcmp (layout, "4xm")) {
4204       id = AV_CODEC_ID_ADPCM_4XM;
4205     } else if (!strcmp (layout, "smjpeg")) {
4206       id = AV_CODEC_ID_ADPCM_IMA_SMJPEG;
4207     } else if (!strcmp (layout, "dk3")) {
4208       id = AV_CODEC_ID_ADPCM_IMA_DK3;
4209     } else if (!strcmp (layout, "dk4")) {
4210       id = AV_CODEC_ID_ADPCM_IMA_DK4;
4211     } else if (!strcmp (layout, "oki")) {
4212       id = AV_CODEC_ID_ADPCM_IMA_OKI;
4213     } else if (!strcmp (layout, "westwood")) {
4214       id = AV_CODEC_ID_ADPCM_IMA_WS;
4215     } else if (!strcmp (layout, "iss")) {
4216       id = AV_CODEC_ID_ADPCM_IMA_ISS;
4217     } else if (!strcmp (layout, "xa")) {
4218       id = AV_CODEC_ID_ADPCM_XA;
4219     } else if (!strcmp (layout, "adx")) {
4220       id = AV_CODEC_ID_ADPCM_ADX;
4221     } else if (!strcmp (layout, "ea")) {
4222       id = AV_CODEC_ID_ADPCM_EA;
4223     } else if (!strcmp (layout, "g726")) {
4224       id = AV_CODEC_ID_ADPCM_G726;
4225     } else if (!strcmp (layout, "g721")) {
4226       id = AV_CODEC_ID_ADPCM_G726;
4227     } else if (!strcmp (layout, "ct")) {
4228       id = AV_CODEC_ID_ADPCM_CT;
4229     } else if (!strcmp (layout, "swf")) {
4230       id = AV_CODEC_ID_ADPCM_SWF;
4231     } else if (!strcmp (layout, "yamaha")) {
4232       id = AV_CODEC_ID_ADPCM_YAMAHA;
4233     } else if (!strcmp (layout, "sbpro2")) {
4234       id = AV_CODEC_ID_ADPCM_SBPRO_2;
4235     } else if (!strcmp (layout, "sbpro3")) {
4236       id = AV_CODEC_ID_ADPCM_SBPRO_3;
4237     } else if (!strcmp (layout, "sbpro4")) {
4238       id = AV_CODEC_ID_ADPCM_SBPRO_4;
4239     }
4240     if (id != AV_CODEC_ID_NONE)
4241       audio = TRUE;
4242   } else if (!strcmp (mimetype, "video/x-4xm")) {
4243     id = AV_CODEC_ID_4XM;
4244     video = TRUE;
4245   } else if (!strcmp (mimetype, "audio/x-dpcm")) {
4246     const gchar *layout;
4247
4248     layout = gst_structure_get_string (structure, "layout");
4249     if (!layout) {
4250       /* .. */
4251     } else if (!strcmp (layout, "roq")) {
4252       id = AV_CODEC_ID_ROQ_DPCM;
4253     } else if (!strcmp (layout, "interplay")) {
4254       id = AV_CODEC_ID_INTERPLAY_DPCM;
4255     } else if (!strcmp (layout, "xan")) {
4256       id = AV_CODEC_ID_XAN_DPCM;
4257     } else if (!strcmp (layout, "sol")) {
4258       id = AV_CODEC_ID_SOL_DPCM;
4259     }
4260     if (id != AV_CODEC_ID_NONE)
4261       audio = TRUE;
4262   } else if (!strcmp (mimetype, "audio/x-flac")) {
4263     id = AV_CODEC_ID_FLAC;
4264     audio = TRUE;
4265   } else if (!strcmp (mimetype, "audio/x-shorten")) {
4266     id = AV_CODEC_ID_SHORTEN;
4267     audio = TRUE;
4268   } else if (!strcmp (mimetype, "audio/x-alac")) {
4269     id = AV_CODEC_ID_ALAC;
4270     audio = TRUE;
4271   } else if (!strcmp (mimetype, "video/x-cinepak")) {
4272     id = AV_CODEC_ID_CINEPAK;
4273     video = TRUE;
4274   } else if (!strcmp (mimetype, "video/x-pn-realvideo")) {
4275     gint rmversion;
4276
4277     if (gst_structure_get_int (structure, "rmversion", &rmversion)) {
4278       switch (rmversion) {
4279         case 1:
4280           id = AV_CODEC_ID_RV10;
4281           break;
4282         case 2:
4283           id = AV_CODEC_ID_RV20;
4284           break;
4285         case 3:
4286           id = AV_CODEC_ID_RV30;
4287           break;
4288         case 4:
4289           id = AV_CODEC_ID_RV40;
4290           break;
4291       }
4292     }
4293     if (id != AV_CODEC_ID_NONE)
4294       video = TRUE;
4295   } else if (!strcmp (mimetype, "audio/x-sipro")) {
4296     id = AV_CODEC_ID_SIPR;
4297     audio = TRUE;
4298   } else if (!strcmp (mimetype, "audio/x-pn-realaudio")) {
4299     gint raversion;
4300
4301     if (gst_structure_get_int (structure, "raversion", &raversion)) {
4302       switch (raversion) {
4303         case 1:
4304           id = AV_CODEC_ID_RA_144;
4305           break;
4306         case 2:
4307           id = AV_CODEC_ID_RA_288;
4308           break;
4309         case 8:
4310           id = AV_CODEC_ID_COOK;
4311           break;
4312       }
4313     }
4314     if (id != AV_CODEC_ID_NONE)
4315       audio = TRUE;
4316   } else if (!strcmp (mimetype, "video/x-rle")) {
4317     const gchar *layout;
4318
4319     if ((layout = gst_structure_get_string (structure, "layout"))) {
4320       if (!strcmp (layout, "microsoft")) {
4321         id = AV_CODEC_ID_MSRLE;
4322         video = TRUE;
4323       }
4324     }
4325   } else if (!strcmp (mimetype, "video/x-xan")) {
4326     gint wcversion = 0;
4327
4328     if ((gst_structure_get_int (structure, "wcversion", &wcversion))) {
4329       switch (wcversion) {
4330         case 3:
4331           id = AV_CODEC_ID_XAN_WC3;
4332           video = TRUE;
4333           break;
4334         case 4:
4335           id = AV_CODEC_ID_XAN_WC4;
4336           video = TRUE;
4337           break;
4338         default:
4339           break;
4340       }
4341     }
4342   } else if (!strcmp (mimetype, "audio/AMR")) {
4343     audio = TRUE;
4344     id = AV_CODEC_ID_AMR_NB;
4345   } else if (!strcmp (mimetype, "audio/AMR-WB")) {
4346     id = AV_CODEC_ID_AMR_WB;
4347     audio = TRUE;
4348   } else if (!strcmp (mimetype, "audio/qcelp")) {
4349     id = AV_CODEC_ID_QCELP;
4350     audio = TRUE;
4351   } else if (!strcmp (mimetype, "video/x-h264")) {
4352     id = AV_CODEC_ID_H264;
4353     video = TRUE;
4354   } else if (!strcmp (mimetype, "video/x-h265")) {
4355     id = AV_CODEC_ID_HEVC;
4356     video = TRUE;
4357   } else if (!strcmp (mimetype, "video/x-flash-video")) {
4358     gint flvversion = 0;
4359
4360     if ((gst_structure_get_int (structure, "flvversion", &flvversion))) {
4361       switch (flvversion) {
4362         case 1:
4363           id = AV_CODEC_ID_FLV1;
4364           video = TRUE;
4365           break;
4366         default:
4367           break;
4368       }
4369     }
4370
4371   } else if (!strcmp (mimetype, "audio/x-nellymoser")) {
4372     id = AV_CODEC_ID_NELLYMOSER;
4373     audio = TRUE;
4374   } else if (!strncmp (mimetype, "audio/x-gst-av-", 15)) {
4375     gchar ext[16];
4376     const AVCodec *codec;
4377
4378     if (strlen (mimetype) <= 30 &&
4379         sscanf (mimetype, "audio/x-gst-av-%s", ext) == 1) {
4380       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4381           (codec = avcodec_find_encoder_by_name (ext))) {
4382         id = codec->id;
4383         audio = TRUE;
4384       }
4385     }
4386   } else if (!strncmp (mimetype, "video/x-gst-av-", 15)) {
4387     gchar ext[16];
4388     const AVCodec *codec;
4389
4390     if (strlen (mimetype) <= 30 &&
4391         sscanf (mimetype, "video/x-gst-av-%s", ext) == 1) {
4392       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4393           (codec = avcodec_find_encoder_by_name (ext))) {
4394         id = codec->id;
4395         video = TRUE;
4396       }
4397     }
4398   }
4399
4400   if (context != NULL) {
4401     if (video == TRUE) {
4402       context->codec_type = AVMEDIA_TYPE_VIDEO;
4403     } else if (audio == TRUE) {
4404       context->codec_type = AVMEDIA_TYPE_AUDIO;
4405     } else {
4406       context->codec_type = AVMEDIA_TYPE_UNKNOWN;
4407     }
4408     context->codec_id = id;
4409     gst_ffmpeg_caps_with_codecid (id, context->codec_type, caps, context);
4410   }
4411
4412   if (id != AV_CODEC_ID_NONE) {
4413     GST_DEBUG ("The id=%d belongs to the caps %" GST_PTR_FORMAT, id, caps);
4414   } else {
4415     GST_WARNING ("Couldn't figure out the id for caps %" GST_PTR_FORMAT, caps);
4416   }
4417
4418   return id;
4419 }