subprojects/gst-libav/ext/libav/gstavcodecmap.c

   1 /* GStreamer
   2  * Copyright (C) <1999> Erik Walthinsen <omega@cse.ogi.edu>
   3  * This file:
   4  * Copyright (c) 2002-2004 Ronald Bultje <rbultje@ronald.bitfreak.net>
   5  *
   6  * This library is free software; you can redistribute it and/or
   7  * modify it under the terms of the GNU Library General Public
   8  * License as published by the Free Software Foundation; either
   9  * version 2 of the License, or (at your option) any later version.
  10  *
  11  * This library is distributed in the hope that it will be useful,
  12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  14  * Library General Public License for more details.
  15  *
  16  * You should have received a copy of the GNU Library General Public
  17  * License along with this library; if not, write to the
  18  * Free Software Foundation, Inc., 51 Franklin St, Fifth Floor,
  19  * Boston, MA 02110-1301, USA.
  20  */
  21
  22 #ifdef HAVE_CONFIG_H
  23 #include "config.h"
  24 #endif
  25
  26 #include <string.h>
  27
  28 #include <gst/gst.h>
  29 #include <libavcodec/avcodec.h>
  30 #include <libavutil/channel_layout.h>
  31
  32 #include "gstav.h"
  33 #include "gstavcodecmap.h"
  34
  35 #include <gst/video/video.h>
  36 #include <gst/audio/audio.h>
  37 #include <gst/pbutils/codec-utils.h>
  38
  39 /* IMPORTANT: Keep this sorted by the ffmpeg channel masks */
  40 static const struct
  41 {
  42   guint64 ff;
  43   GstAudioChannelPosition gst;
  44 } _ff_to_gst_layout[] = {
  45   {
  46   AV_CH_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
  47   AV_CH_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}, {
  48   AV_CH_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_CENTER}, {
  49   AV_CH_LOW_FREQUENCY, GST_AUDIO_CHANNEL_POSITION_LFE1}, {
  50   AV_CH_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_REAR_LEFT}, {
  51   AV_CH_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_REAR_RIGHT}, {
  52   AV_CH_FRONT_LEFT_OF_CENTER, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT_OF_CENTER}, {
  53   AV_CH_FRONT_RIGHT_OF_CENTER,
  54         GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT_OF_CENTER}, {
  55   AV_CH_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_REAR_CENTER}, {
  56   AV_CH_SIDE_LEFT, GST_AUDIO_CHANNEL_POSITION_SIDE_LEFT}, {
  57   AV_CH_SIDE_RIGHT, GST_AUDIO_CHANNEL_POSITION_SIDE_RIGHT}, {
  58   AV_CH_TOP_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_CENTER}, {
  59   AV_CH_TOP_FRONT_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_LEFT}, {
  60   AV_CH_TOP_FRONT_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_CENTER}, {
  61   AV_CH_TOP_FRONT_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_FRONT_RIGHT}, {
  62   AV_CH_TOP_BACK_LEFT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_LEFT}, {
  63   AV_CH_TOP_BACK_CENTER, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_CENTER}, {
  64   AV_CH_TOP_BACK_RIGHT, GST_AUDIO_CHANNEL_POSITION_TOP_REAR_RIGHT}, {
  65   AV_CH_STEREO_LEFT, GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT}, {
  66   AV_CH_STEREO_RIGHT, GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT}
  67 };
  68
  69 static guint64
  70 gst_ffmpeg_channel_positions_to_layout (GstAudioChannelPosition * pos,
  71     gint channels)
  72 {
  73   gint i, j;
  74   guint64 ret = 0;
  75   gint channels_found = 0;
  76
  77   if (!pos)
  78     return 0;
  79
  80   if (channels == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
  81     return AV_CH_LAYOUT_MONO;
  82
  83   for (i = 0; i < channels; i++) {
  84     for (j = 0; j < G_N_ELEMENTS (_ff_to_gst_layout); j++) {
  85       if (_ff_to_gst_layout[j].gst == pos[i]) {
  86         ret |= _ff_to_gst_layout[j].ff;
  87         channels_found++;
  88         break;
  89       }
  90     }
  91   }
  92
  93   if (channels_found != channels)
  94     return 0;
  95   return ret;
  96 }
  97
  98 gboolean
  99 gst_ffmpeg_channel_layout_to_gst (guint64 channel_layout, gint channels,
 100     GstAudioChannelPosition * pos)
 101 {
 102   guint nchannels = 0;
 103   gboolean none_layout = FALSE;
 104
 105   if (channel_layout == 0 || channels > 64) {
 106     nchannels = channels;
 107     none_layout = TRUE;
 108   } else {
 109     guint i, j;
 110
 111     /* Special path for mono, as AV_CH_LAYOUT_MONO is the same
 112      * as FRONT_CENTER but we distinguish between the two in
 113      * GStreamer
 114      */
 115     if (channels == 1 && channel_layout == AV_CH_LAYOUT_MONO) {
 116       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
 117       return TRUE;
 118     }
 119
 120     for (i = 0; i < 64; i++) {
 121       if ((channel_layout & (G_GUINT64_CONSTANT (1) << i)) != 0) {
 122         nchannels++;
 123       }
 124     }
 125
 126     if (nchannels != channels) {
 127       GST_ERROR ("Number of channels is different (%u != %u)", channels,
 128           nchannels);
 129       nchannels = channels;
 130       none_layout = TRUE;
 131     } else {
 132
 133       for (i = 0, j = 0; i < G_N_ELEMENTS (_ff_to_gst_layout); i++) {
 134         if ((channel_layout & _ff_to_gst_layout[i].ff) != 0) {
 135           pos[j++] = _ff_to_gst_layout[i].gst;
 136
 137           if (_ff_to_gst_layout[i].gst == GST_AUDIO_CHANNEL_POSITION_NONE)
 138             none_layout = TRUE;
 139         }
 140       }
 141
 142       if (j != nchannels) {
 143         GST_WARNING
 144             ("Unknown channels in channel layout - assuming NONE layout");
 145         none_layout = TRUE;
 146       }
 147     }
 148   }
 149
 150   if (!none_layout
 151       && !gst_audio_check_valid_channel_positions (pos, nchannels, FALSE)) {
 152     GST_ERROR ("Invalid channel layout %" G_GUINT64_FORMAT
 153         " - assuming NONE layout", channel_layout);
 154     none_layout = TRUE;
 155   }
 156
 157   if (none_layout) {
 158     if (nchannels == 1) {
 159       pos[0] = GST_AUDIO_CHANNEL_POSITION_MONO;
 160     } else if (nchannels == 2) {
 161       pos[0] = GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT;
 162       pos[1] = GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT;
 163     } else {
 164       guint i;
 165
 166       for (i = 0; i < nchannels && i < 64; i++)
 167         pos[i] = GST_AUDIO_CHANNEL_POSITION_NONE;
 168     }
 169   }
 170
 171   return TRUE;
 172 }
 173
 174 static gboolean
 175 _gst_value_list_contains (const GValue * list, const GValue * value)
 176 {
 177   guint i, n;
 178   const GValue *tmp;
 179
 180   n = gst_value_list_get_size (list);
 181   for (i = 0; i < n; i++) {
 182     tmp = gst_value_list_get_value (list, i);
 183     if (gst_value_compare (value, tmp) == GST_VALUE_EQUAL)
 184       return TRUE;
 185   }
 186
 187   return FALSE;
 188 }
 189
 190 static void
 191 gst_ffmpeg_video_set_pix_fmts (GstCaps * caps, const enum AVPixelFormat *fmts)
 192 {
 193   GValue va = { 0, };
 194   GValue v = { 0, };
 195   GstVideoFormat format;
 196
 197   if (!fmts || fmts[0] == -1) {
 198     gint i;
 199
 200     g_value_init (&va, GST_TYPE_LIST);
 201     g_value_init (&v, G_TYPE_STRING);
 202     for (i = 0; i <= AV_PIX_FMT_NB; i++) {
 203       format = gst_ffmpeg_pixfmt_to_videoformat (i);
 204       if (format == GST_VIDEO_FORMAT_UNKNOWN)
 205         continue;
 206       g_value_set_string (&v, gst_video_format_to_string (format));
 207       gst_value_list_append_value (&va, &v);
 208     }
 209     gst_caps_set_value (caps, "format", &va);
 210     g_value_unset (&v);
 211     g_value_unset (&va);
 212     return;
 213   }
 214
 215   /* Only a single format */
 216   g_value_init (&va, GST_TYPE_LIST);
 217   g_value_init (&v, G_TYPE_STRING);
 218   while (*fmts != -1) {
 219     format = gst_ffmpeg_pixfmt_to_videoformat (*fmts);
 220     if (format != GST_VIDEO_FORMAT_UNKNOWN) {
 221       g_value_set_string (&v, gst_video_format_to_string (format));
 222       /* Only append values we don't have yet */
 223       if (!_gst_value_list_contains (&va, &v))
 224         gst_value_list_append_value (&va, &v);
 225     }
 226     fmts++;
 227   }
 228   if (gst_value_list_get_size (&va) == 1) {
 229     /* The single value is still in v */
 230     gst_caps_set_value (caps, "format", &v);
 231   } else if (gst_value_list_get_size (&va) > 1) {
 232     gst_caps_set_value (caps, "format", &va);
 233   }
 234   g_value_unset (&v);
 235   g_value_unset (&va);
 236 }
 237
 238 /* this macro makes a caps width fixed or unfixed width/height
 239  * properties depending on whether we've got a context.
 240  *
 241  * See below for why we use this.
 242  *
 243  * We should actually do this stuff at the end, like in riff-media.c,
 244  * but I'm too lazy today. Maybe later.
 245  */
 246 static GstCaps *
 247 gst_ff_vid_caps_new (AVCodecContext * context, const AVCodec * codec,
 248     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
 249     const char *fieldname, ...)
 250 {
 251   GstCaps *caps = NULL;
 252   va_list var_args;
 253   gint i;
 254
 255   GST_LOG ("context:%p, codec_id:%d, mimetype:%s", context, codec_id, mimetype);
 256
 257   /* fixed, non probing context */
 258   if (context != NULL && context->width != -1) {
 259     gint num, denom;
 260
 261     caps = gst_caps_new_simple (mimetype,
 262         "width", G_TYPE_INT, context->width,
 263         "height", G_TYPE_INT, context->height, NULL);
 264
 265     num = context->framerate.num;
 266     denom = context->framerate.den;
 267
 268     if (!denom) {
 269       GST_LOG ("invalid framerate: %d/0, -> %d/1", num, num);
 270       denom = 1;
 271     }
 272     if (gst_util_fraction_compare (num, denom, 1000, 1) > 0) {
 273       GST_LOG ("excessive framerate: %d/%d, -> 0/1", num, denom);
 274       num = 0;
 275       denom = 1;
 276     }
 277     GST_LOG ("setting framerate: %d/%d", num, denom);
 278     gst_caps_set_simple (caps,
 279         "framerate", GST_TYPE_FRACTION, num, denom, NULL);
 280   } else if (encode) {
 281     /* so we are after restricted caps in this case */
 282     switch (codec_id) {
 283       case AV_CODEC_ID_H261:
 284       {
 285         caps = gst_caps_new_simple (mimetype,
 286             "width", G_TYPE_INT, 352,
 287             "height", G_TYPE_INT, 288,
 288             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
 289         gst_caps_append (caps, gst_caps_new_simple (mimetype,
 290                 "width", G_TYPE_INT, 176,
 291                 "height", G_TYPE_INT, 144,
 292                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
 293         break;
 294       }
 295       case AV_CODEC_ID_H263:
 296       {
 297         /* 128x96, 176x144, 352x288, 704x576, and 1408x1152. slightly reordered
 298          * because we want automatic negotiation to go as close to 320x240 as
 299          * possible. */
 300         const static gint widths[] = { 352, 704, 176, 1408, 128 };
 301         const static gint heights[] = { 288, 576, 144, 1152, 96 };
 302         GstCaps *temp;
 303         gint n_sizes = G_N_ELEMENTS (widths);
 304
 305         caps = gst_caps_new_empty ();
 306         for (i = 0; i < n_sizes; i++) {
 307           temp = gst_caps_new_simple (mimetype,
 308               "width", G_TYPE_INT, widths[i],
 309               "height", G_TYPE_INT, heights[i],
 310               "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
 311
 312           gst_caps_append (caps, temp);
 313         }
 314         break;
 315       }
 316       case AV_CODEC_ID_DVVIDEO:
 317       {
 318         static struct
 319         {
 320           const gchar *csp;
 321           gint width, height;
 322           gint par_n, par_d;
 323           gint framerate_n, framerate_d;
 324         } profiles[] = {
 325           {
 326           "Y41B", 720, 480, 8, 9, 30000, 1001}, {
 327           "Y41B", 720, 480, 32, 27, 30000, 1001}, {
 328           "Y42B", 720, 480, 8, 9, 30000, 1001}, {
 329           "Y42B", 720, 480, 32, 27, 30000, 1001}, {
 330           "I420", 720, 576, 16, 15, 25, 1}, {
 331           "I420", 720, 576, 64, 45, 25, 1}, {
 332           "Y41B", 720, 576, 16, 15, 25, 1}, {
 333           "Y41B", 720, 576, 64, 45, 25, 1}, {
 334           "Y42B", 720, 576, 16, 15, 25, 1}, {
 335           "Y42B", 720, 576, 64, 45, 25, 1}, {
 336           "Y42B", 1280, 1080, 1, 1, 30000, 1001}, {
 337           "Y42B", 1280, 1080, 3, 2, 30000, 1001}, {
 338           "Y42B", 1440, 1080, 1, 1, 25, 1}, {
 339           "Y42B", 1440, 1080, 4, 3, 25, 1}, {
 340           "Y42B", 960, 720, 1, 1, 60000, 1001}, {
 341           "Y42B", 960, 720, 4, 3, 60000, 1001}, {
 342           "Y42B", 960, 720, 1, 1, 50, 1}, {
 343         "Y42B", 960, 720, 4, 3, 50, 1},};
 344         GstCaps *temp;
 345         gint n_sizes = G_N_ELEMENTS (profiles);
 346
 347         if (strcmp (mimetype, "video/x-raw") == 0) {
 348           caps = gst_caps_new_empty ();
 349           for (i = 0; i < n_sizes; i++) {
 350             temp = gst_caps_new_simple (mimetype,
 351                 "format", G_TYPE_STRING, profiles[i].csp,
 352                 "width", G_TYPE_INT, profiles[i].width,
 353                 "height", G_TYPE_INT, profiles[i].height,
 354                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
 355                 profiles[i].framerate_d, "pixel-aspect-ratio",
 356                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
 357
 358             gst_caps_append (caps, temp);
 359           }
 360         } else {
 361           caps = gst_caps_new_empty ();
 362           for (i = 0; i < n_sizes; i++) {
 363             temp = gst_caps_new_simple (mimetype,
 364                 "width", G_TYPE_INT, profiles[i].width,
 365                 "height", G_TYPE_INT, profiles[i].height,
 366                 "framerate", GST_TYPE_FRACTION, profiles[i].framerate_n,
 367                 profiles[i].framerate_d, "pixel-aspect-ratio",
 368                 GST_TYPE_FRACTION, profiles[i].par_n, profiles[i].par_d, NULL);
 369
 370             gst_caps_append (caps, temp);
 371           }
 372         }
 373         break;
 374       }
 375       case AV_CODEC_ID_DNXHD:
 376       {
 377         caps = gst_caps_new_simple (mimetype,
 378             "width", G_TYPE_INT, 1920,
 379             "height", G_TYPE_INT, 1080,
 380             "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL);
 381         gst_caps_append (caps, gst_caps_new_simple (mimetype,
 382                 "width", G_TYPE_INT, 1280,
 383                 "height", G_TYPE_INT, 720,
 384                 "framerate", GST_TYPE_FRACTION_RANGE, 0, 1, G_MAXINT, 1, NULL));
 385         break;
 386       }
 387       default:
 388       {
 389         if (codec && codec->supported_framerates
 390             && codec->supported_framerates[0].num != 0
 391             && codec->supported_framerates[0].den != 0) {
 392           GValue va = { 0, };
 393           GValue v = { 0, };
 394           const AVRational *rates = codec->supported_framerates;
 395
 396           if (rates[1].num == 0 && rates[1].den == 0) {
 397             caps =
 398                 gst_caps_new_simple (mimetype, "framerate", GST_TYPE_FRACTION,
 399                 rates[0].num, rates[0].den, NULL);
 400           } else {
 401             g_value_init (&va, GST_TYPE_LIST);
 402             g_value_init (&v, GST_TYPE_FRACTION);
 403
 404             while (rates->num != 0 && rates->den != 0) {
 405               gst_value_set_fraction (&v, rates->num, rates->den);
 406               gst_value_list_append_value (&va, &v);
 407               rates++;
 408             }
 409
 410             caps = gst_caps_new_simple (mimetype, NULL, NULL, NULL);
 411             gst_caps_set_value (caps, "framerate", &va);
 412             g_value_unset (&va);
 413             g_value_unset (&v);
 414           }
 415
 416         } else {
 417           caps = gst_caps_new_empty_simple (mimetype);
 418         }
 419
 420         break;
 421       }
 422     }
 423   }
 424
 425   /* no fixed caps or special restrictions applied;
 426    * default unfixed setting */
 427   if (!caps) {
 428     GST_DEBUG ("Creating default caps");
 429     caps = gst_caps_new_empty_simple (mimetype);
 430   }
 431
 432   va_start (var_args, fieldname);
 433   gst_caps_set_simple_valist (caps, fieldname, var_args);
 434   va_end (var_args);
 435
 436   return caps;
 437 }
 438
 439 static gint
 440 get_nbits_set (guint64 n)
 441 {
 442   gint i, x;
 443
 444   x = 0;
 445   for (i = 0; i < 64; i++) {
 446     if ((n & (G_GUINT64_CONSTANT (1) << i)))
 447       x++;
 448   }
 449
 450   return x;
 451 }
 452
 453 static void
 454 gst_ffmpeg_audio_set_sample_fmts (GstCaps * caps,
 455     const enum AVSampleFormat *fmts, gboolean always_interleaved)
 456 {
 457   GValue va = { 0, };
 458   GValue vap = { 0, };
 459   GValue v = { 0, };
 460   GstAudioFormat format;
 461   GstAudioLayout layout;
 462   GstCaps *caps_copy = NULL;
 463
 464   if (!fmts || fmts[0] == -1) {
 465     gint i;
 466
 467     g_value_init (&va, GST_TYPE_LIST);
 468     g_value_init (&v, G_TYPE_STRING);
 469     for (i = 0; i <= AV_SAMPLE_FMT_DBL; i++) {
 470       format = gst_ffmpeg_smpfmt_to_audioformat (i, NULL);
 471       if (format == GST_AUDIO_FORMAT_UNKNOWN)
 472         continue;
 473       g_value_set_string (&v, gst_audio_format_to_string (format));
 474       gst_value_list_append_value (&va, &v);
 475     }
 476     gst_caps_set_value (caps, "format", &va);
 477     if (!always_interleaved) {
 478       g_value_init (&vap, GST_TYPE_LIST);
 479       g_value_set_string (&v, "interleaved");
 480       gst_value_list_append_value (&vap, &v);
 481       g_value_set_string (&v, "non-interleaved");
 482       gst_value_list_append_value (&vap, &v);
 483       gst_caps_set_value (caps, "layout", &vap);
 484       g_value_unset (&vap);
 485     } else {
 486       gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
 487     }
 488     g_value_unset (&v);
 489     g_value_unset (&va);
 490     return;
 491   }
 492
 493   g_value_init (&va, GST_TYPE_LIST);
 494   g_value_init (&vap, GST_TYPE_LIST);
 495   g_value_init (&v, G_TYPE_STRING);
 496   while (*fmts != -1) {
 497     format = gst_ffmpeg_smpfmt_to_audioformat (*fmts, &layout);
 498     if (format != GST_AUDIO_FORMAT_UNKNOWN) {
 499       g_value_set_string (&v, gst_audio_format_to_string (format));
 500       /* Only append values we don't have yet */
 501       if (layout == GST_AUDIO_LAYOUT_INTERLEAVED || always_interleaved) {
 502         if (!_gst_value_list_contains (&va, &v))
 503           gst_value_list_append_value (&va, &v);
 504       } else {
 505         if (!_gst_value_list_contains (&vap, &v))
 506           gst_value_list_append_value (&vap, &v);
 507       }
 508     }
 509     fmts++;
 510   }
 511   if (gst_value_list_get_size (&va) >= 1 && gst_value_list_get_size (&vap) >= 1) {
 512     caps_copy = gst_caps_copy (caps);
 513   }
 514   if (gst_value_list_get_size (&va) == 1) {
 515     gst_caps_set_value (caps, "format", gst_value_list_get_value (&va, 0));
 516     gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
 517   } else if (gst_value_list_get_size (&va) > 1) {
 518     gst_caps_set_value (caps, "format", &va);
 519     gst_caps_set_simple (caps, "layout", G_TYPE_STRING, "interleaved", NULL);
 520   }
 521   if (gst_value_list_get_size (&vap) == 1) {
 522     gst_caps_set_value (caps_copy ? caps_copy : caps, "format",
 523         gst_value_list_get_value (&vap, 0));
 524     gst_caps_set_simple (caps_copy ? caps_copy : caps, "layout", G_TYPE_STRING,
 525         "non-interleaved", NULL);
 526   } else if (gst_value_list_get_size (&vap) > 1) {
 527     gst_caps_set_value (caps_copy ? caps_copy : caps, "format", &vap);
 528     gst_caps_set_simple (caps_copy ? caps_copy : caps, "layout", G_TYPE_STRING,
 529         "non-interleaved", NULL);
 530   }
 531   if (caps_copy) {
 532     gst_caps_append (caps, caps_copy);
 533   }
 534   g_value_unset (&v);
 535   g_value_unset (&va);
 536   g_value_unset (&vap);
 537 }
 538
 539 /* same for audio - now with channels/sample rate
 540  */
 541 static GstCaps *
 542 gst_ff_aud_caps_new (AVCodecContext * context, AVCodec * codec,
 543     enum AVCodecID codec_id, gboolean encode, const char *mimetype,
 544     const char *fieldname, ...)
 545 {
 546   GstCaps *caps = NULL;
 547   gint i;
 548   va_list var_args;
 549
 550   /* fixed, non-probing context */
 551   if (context != NULL && context->channels != -1) {
 552     GstAudioChannelPosition pos[64];
 553     guint64 mask;
 554
 555     caps = gst_caps_new_simple (mimetype,
 556         "rate", G_TYPE_INT, context->sample_rate,
 557         "channels", G_TYPE_INT, context->channels, NULL);
 558
 559     if (context->channels > 1 &&
 560         gst_ffmpeg_channel_layout_to_gst (context->channel_layout,
 561             context->channels, pos) &&
 562         gst_audio_channel_positions_to_mask (pos, context->channels, FALSE,
 563             &mask)) {
 564       gst_caps_set_simple (caps, "channel-mask", GST_TYPE_BITMASK, mask, NULL);
 565     }
 566   } else if (encode) {
 567     gint maxchannels = 2;
 568     const gint *rates = NULL;
 569     gint n_rates = 0;
 570
 571     /* so we must be after restricted caps in this case */
 572     switch (codec_id) {
 573       case AV_CODEC_ID_AAC:
 574       case AV_CODEC_ID_AAC_LATM:
 575       case AV_CODEC_ID_DTS:
 576         maxchannels = 6;
 577         break;
 578       case AV_CODEC_ID_MP2:
 579       {
 580         const static gint l_rates[] =
 581             { 48000, 44100, 32000, 24000, 22050, 16000 };
 582         n_rates = G_N_ELEMENTS (l_rates);
 583         rates = l_rates;
 584         break;
 585       }
 586       case AV_CODEC_ID_EAC3:
 587       case AV_CODEC_ID_AC3:
 588       {
 589         const static gint l_rates[] = { 48000, 44100, 32000 };
 590         maxchannels = 6;
 591         n_rates = G_N_ELEMENTS (l_rates);
 592         rates = l_rates;
 593         break;
 594       }
 595       case AV_CODEC_ID_ADPCM_G722:
 596       {
 597         const static gint l_rates[] = { 16000 };
 598         n_rates = G_N_ELEMENTS (l_rates);
 599         rates = l_rates;
 600         maxchannels = 1;
 601         break;
 602       }
 603       case AV_CODEC_ID_ADPCM_G726:
 604       {
 605         const static gint l_rates[] = { 8000 };
 606         n_rates = G_N_ELEMENTS (l_rates);
 607         rates = l_rates;
 608         maxchannels = 1;
 609         break;
 610       }
 611       case AV_CODEC_ID_ADPCM_SWF:
 612       {
 613         const static gint l_rates[] = { 11025, 22050, 44100 };
 614         n_rates = G_N_ELEMENTS (l_rates);
 615         rates = l_rates;
 616         break;
 617       }
 618       case AV_CODEC_ID_ROQ_DPCM:
 619       {
 620         const static gint l_rates[] = { 22050 };
 621         n_rates = G_N_ELEMENTS (l_rates);
 622         rates = l_rates;
 623         break;
 624       }
 625       case AV_CODEC_ID_AMR_NB:
 626       {
 627         const static gint l_rates[] = { 8000 };
 628         maxchannels = 1;
 629         n_rates = G_N_ELEMENTS (l_rates);
 630         rates = l_rates;
 631         break;
 632       }
 633       case AV_CODEC_ID_AMR_WB:
 634       {
 635         const static gint l_rates[] = { 16000 };
 636         maxchannels = 1;
 637         n_rates = G_N_ELEMENTS (l_rates);
 638         rates = l_rates;
 639         break;
 640       }
 641       default:
 642         break;
 643     }
 644
 645     /* regardless of encode/decode, open up channels if applicable */
 646     /* Until decoders/encoders expose the maximum number of channels
 647      * they support, we whitelist them here. */
 648     switch (codec_id) {
 649       case AV_CODEC_ID_WMAPRO:
 650       case AV_CODEC_ID_TRUEHD:
 651         maxchannels = 8;
 652         break;
 653       default:
 654         break;
 655     }
 656
 657     if (codec && codec->channel_layouts) {
 658       const uint64_t *layouts = codec->channel_layouts;
 659       GstAudioChannelPosition pos[64];
 660
 661       caps = gst_caps_new_empty ();
 662       while (*layouts) {
 663         gint nbits_set = get_nbits_set (*layouts);
 664
 665         if (gst_ffmpeg_channel_layout_to_gst (*layouts, nbits_set, pos)) {
 666           guint64 mask;
 667
 668           if (gst_audio_channel_positions_to_mask (pos, nbits_set, FALSE,
 669                   &mask)) {
 670             GstStructure *s =
 671                 gst_structure_new (mimetype, "channels", G_TYPE_INT, nbits_set,
 672                 NULL);
 673
 674             /* No need to require a channel mask for mono or stereo */
 675             if (!(nbits_set == 1 && pos[0] == GST_AUDIO_CHANNEL_POSITION_MONO)
 676                 && !(nbits_set == 2
 677                     && pos[0] == GST_AUDIO_CHANNEL_POSITION_FRONT_LEFT
 678                     && pos[1] == GST_AUDIO_CHANNEL_POSITION_FRONT_RIGHT))
 679               gst_structure_set (s, "channel-mask", GST_TYPE_BITMASK, mask,
 680                   NULL);
 681
 682             gst_caps_append_structure (caps, s);
 683           }
 684         }
 685         layouts++;
 686       }
 687     } else {
 688       if (maxchannels == 1)
 689         caps = gst_caps_new_simple (mimetype,
 690             "channels", G_TYPE_INT, maxchannels, NULL);
 691       else
 692         caps = gst_caps_new_simple (mimetype,
 693             "channels", GST_TYPE_INT_RANGE, 1, maxchannels, NULL);
 694     }
 695
 696     if (n_rates) {
 697       GValue list = { 0, };
 698
 699       g_value_init (&list, GST_TYPE_LIST);
 700       for (i = 0; i < n_rates; i++) {
 701         GValue v = { 0, };
 702
 703         g_value_init (&v, G_TYPE_INT);
 704         g_value_set_int (&v, rates[i]);
 705         gst_value_list_append_value (&list, &v);
 706         g_value_unset (&v);
 707       }
 708       gst_caps_set_value (caps, "rate", &list);
 709       g_value_unset (&list);
 710     } else if (codec && codec->supported_samplerates
 711         && codec->supported_samplerates[0]) {
 712       GValue va = { 0, };
 713       GValue v = { 0, };
 714
 715       if (!codec->supported_samplerates[1]) {
 716         gst_caps_set_simple (caps, "rate", G_TYPE_INT,
 717             codec->supported_samplerates[0], NULL);
 718       } else {
 719         const int *rates = codec->supported_samplerates;
 720
 721         g_value_init (&va, GST_TYPE_LIST);
 722         g_value_init (&v, G_TYPE_INT);
 723
 724         while (*rates) {
 725           g_value_set_int (&v, *rates);
 726           gst_value_list_append_value (&va, &v);
 727           rates++;
 728         }
 729         gst_caps_set_value (caps, "rate", &va);
 730         g_value_unset (&va);
 731         g_value_unset (&v);
 732       }
 733     } else {
 734       gst_caps_set_simple (caps, "rate", GST_TYPE_INT_RANGE, 4000, 96000, NULL);
 735     }
 736   } else {
 737     caps = gst_caps_new_empty_simple (mimetype);
 738   }
 739
 740   va_start (var_args, fieldname);
 741   gst_caps_set_simple_valist (caps, fieldname, var_args);
 742   va_end (var_args);
 743
 744   return caps;
 745 }
 746
 747 /* Check if the given codec ID is an image format -- for now this is just
 748  * anything whose caps is image/... */
 749 gboolean
 750 gst_ffmpeg_codecid_is_image (enum AVCodecID codec_id)
 751 {
 752   switch (codec_id) {
 753     case AV_CODEC_ID_MJPEG:
 754     case AV_CODEC_ID_LJPEG:
 755     case AV_CODEC_ID_GIF:
 756     case AV_CODEC_ID_PPM:
 757     case AV_CODEC_ID_PBM:
 758     case AV_CODEC_ID_PCX:
 759     case AV_CODEC_ID_SGI:
 760     case AV_CODEC_ID_TARGA:
 761     case AV_CODEC_ID_TIFF:
 762     case AV_CODEC_ID_SUNRAST:
 763     case AV_CODEC_ID_BMP:
 764       return TRUE;
 765
 766     default:
 767       return FALSE;
 768   }
 769 }
 770
 771 /* Convert a FFMPEG codec ID and optional AVCodecContext
 772  * to a GstCaps. If the context is ommitted, no fixed values
 773  * for video/audio size will be included in the GstCaps
 774  *
 775  * CodecID is primarily meant for compressed data GstCaps!
 776  *
 777  * encode is a special parameter. gstffmpegdec will say
 778  * FALSE, gstffmpegenc will say TRUE. The output caps
 779  * depends on this, in such a way that it will be very
 780  * specific, defined, fixed and correct caps for encoders,
 781  * yet very wide, "forgiving" caps for decoders. Example
 782  * for mp3: decode: audio/mpeg,mpegversion=1,layer=[1-3]
 783  * but encode: audio/mpeg,mpegversion=1,layer=3,bitrate=x,
 784  * rate=x,channels=x.
 785  */
 786
 787 GstCaps *
 788 gst_ffmpeg_codecid_to_caps (enum AVCodecID codec_id,
 789     AVCodecContext * context, gboolean encode)
 790 {
 791   GstCaps *caps = NULL;
 792   gboolean buildcaps = FALSE;
 793
 794   GST_LOG ("codec_id:%d, context:%p, encode:%d", codec_id, context, encode);
 795
 796   switch (codec_id) {
 797     case AV_CODEC_ID_MPEG1VIDEO:
 798       /* FIXME: bitrate */
 799       caps = gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
 800           "mpegversion", G_TYPE_INT, 1,
 801           "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
 802       break;
 803
 804     case AV_CODEC_ID_MPEG2VIDEO:
 805       if (encode) {
 806         /* FIXME: bitrate */
 807         caps =
 808             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
 809             "mpegversion", G_TYPE_INT, 2, "systemstream", G_TYPE_BOOLEAN, FALSE,
 810             NULL);
 811       } else {
 812         /* decode both MPEG-1 and MPEG-2; width/height/fps are all in
 813          * the MPEG video stream headers, so may be omitted from caps. */
 814         caps = gst_caps_new_simple ("video/mpeg",
 815             "mpegversion", GST_TYPE_INT_RANGE, 1, 2,
 816             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
 817       }
 818       break;
 819
 820     case AV_CODEC_ID_H263:
 821       if (encode) {
 822         caps =
 823             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
 824             "video/x-h263", "variant", G_TYPE_STRING, "itu", "h263version",
 825             G_TYPE_STRING, "h263", NULL);
 826       } else {
 827         /* don't pass codec_id, we can decode other variants with the H263
 828          * decoder that don't have specific size requirements
 829          */
 830         caps =
 831             gst_ff_vid_caps_new (context, NULL, AV_CODEC_ID_NONE, encode,
 832             "video/x-h263", "variant", G_TYPE_STRING, "itu", NULL);
 833       }
 834       break;
 835
 836     case AV_CODEC_ID_H263P:
 837       caps =
 838           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h263",
 839           "variant", G_TYPE_STRING, "itu", "h263version", G_TYPE_STRING,
 840           "h263p", NULL);
 841       if (encode && context) {
 842
 843         gst_caps_set_simple (caps,
 844             "annex-f", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_4MV,
 845             "annex-j", G_TYPE_BOOLEAN,
 846             context->flags & AV_CODEC_FLAG_LOOP_FILTER,
 847             "annex-i", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_AC_PRED,
 848             "annex-t", G_TYPE_BOOLEAN, context->flags & AV_CODEC_FLAG_AC_PRED,
 849             NULL);
 850       }
 851       break;
 852
 853     case AV_CODEC_ID_H263I:
 854       caps =
 855           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
 856           "video/x-intel-h263", "variant", G_TYPE_STRING, "intel", NULL);
 857       break;
 858
 859     case AV_CODEC_ID_H261:
 860       caps =
 861           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h261",
 862           NULL);
 863       break;
 864
 865     case AV_CODEC_ID_RV10:
 866     case AV_CODEC_ID_RV20:
 867     case AV_CODEC_ID_RV30:
 868     case AV_CODEC_ID_RV40:
 869     {
 870       gint version;
 871
 872       switch (codec_id) {
 873         case AV_CODEC_ID_RV40:
 874           version = 4;
 875           break;
 876         case AV_CODEC_ID_RV30:
 877           version = 3;
 878           break;
 879         case AV_CODEC_ID_RV20:
 880           version = 2;
 881           break;
 882         default:
 883           version = 1;
 884           break;
 885       }
 886
 887       caps =
 888           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
 889           "video/x-pn-realvideo", "rmversion", G_TYPE_INT, version, NULL);
 890       if (context) {
 891         if (context->extradata_size >= 8) {
 892           gst_caps_set_simple (caps,
 893               "subformat", G_TYPE_INT, GST_READ_UINT32_BE (context->extradata),
 894               NULL);
 895         }
 896       }
 897     }
 898       break;
 899
 900     case AV_CODEC_ID_MP1:
 901       /* FIXME: bitrate */
 902       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
 903           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 1, NULL);
 904       break;
 905
 906     case AV_CODEC_ID_MP2:
 907       /* FIXME: bitrate */
 908       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
 909           "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 2, NULL);
 910       break;
 911
 912     case AV_CODEC_ID_MP3:
 913       if (encode) {
 914         /* FIXME: bitrate */
 915         caps =
 916             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
 917             "mpegversion", G_TYPE_INT, 1, "layer", G_TYPE_INT, 3, NULL);
 918       } else {
 919         /* Decodes MPEG-1 layer 1/2/3. Samplerate, channels et al are
 920          * in the MPEG audio header, so may be omitted from caps. */
 921         caps = gst_caps_new_simple ("audio/mpeg",
 922             "mpegversion", G_TYPE_INT, 1,
 923             "layer", GST_TYPE_INT_RANGE, 1, 3, NULL);
 924       }
 925       break;
 926
 927     case AV_CODEC_ID_MUSEPACK7:
 928       caps =
 929           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 930           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 7,
 931           NULL);
 932       break;
 933
 934     case AV_CODEC_ID_MUSEPACK8:
 935       caps =
 936           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 937           "audio/x-ffmpeg-parsed-musepack", "streamversion", G_TYPE_INT, 8,
 938           NULL);
 939       break;
 940
 941     case AV_CODEC_ID_AC3:
 942       /* FIXME: bitrate */
 943       caps =
 944           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-ac3",
 945           NULL);
 946       break;
 947
 948     case AV_CODEC_ID_EAC3:
 949       /* FIXME: bitrate */
 950       caps =
 951           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-eac3",
 952           NULL);
 953       break;
 954
 955     case AV_CODEC_ID_TRUEHD:
 956       caps =
 957           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 958           "audio/x-true-hd", NULL);
 959       break;
 960
 961     case AV_CODEC_ID_ATRAC1:
 962       caps =
 963           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 964           "audio/x-vnd.sony.atrac1", NULL);
 965       break;
 966
 967     case AV_CODEC_ID_ATRAC3:
 968       caps =
 969           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 970           "audio/x-vnd.sony.atrac3", NULL);
 971       break;
 972
 973     case AV_CODEC_ID_DTS:
 974       caps =
 975           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dts",
 976           NULL);
 977       break;
 978
 979     case AV_CODEC_ID_APE:
 980       caps =
 981           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 982           "audio/x-ffmpeg-parsed-ape", NULL);
 983       if (context) {
 984         gst_caps_set_simple (caps,
 985             "depth", G_TYPE_INT, context->bits_per_coded_sample, NULL);
 986       }
 987       break;
 988
 989     case AV_CODEC_ID_MLP:
 990       caps =
 991           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mlp",
 992           NULL);
 993       break;
 994
 995     case AV_CODEC_ID_METASOUND:
 996       caps =
 997           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
 998           "audio/x-voxware", NULL);
 999       break;
1000
1001     case AV_CODEC_ID_IMC:
1002       caps =
1003           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-imc",
1004           NULL);
1005       break;
1006
1007       /* MJPEG is normal JPEG, Motion-JPEG and Quicktime MJPEG-A. MJPEGB
1008        * is Quicktime's MJPEG-B. LJPEG is lossless JPEG. I don't know what
1009        * sp5x is, but it's apparently something JPEG... We don't separate
1010        * between those in GStreamer. Should we (at least between MJPEG,
1011        * MJPEG-B and sp5x decoding...)? */
1012     case AV_CODEC_ID_MJPEG:
1013     case AV_CODEC_ID_LJPEG:
1014       caps =
1015           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/jpeg",
1016           "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
1017       break;
1018
1019     case AV_CODEC_ID_JPEG2000:
1020       caps =
1021           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-j2c",
1022           NULL);
1023       if (!encode) {
1024         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1025                 encode, "image/x-jpc", NULL));
1026         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1027                 encode, "image/jp2", NULL));
1028       }
1029       break;
1030
1031     case AV_CODEC_ID_SP5X:
1032       caps =
1033           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/sp5x",
1034           NULL);
1035       break;
1036
1037     case AV_CODEC_ID_MJPEGB:
1038       caps =
1039           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1040           "video/x-mjpeg-b", NULL);
1041       break;
1042
1043     case AV_CODEC_ID_MPEG4:
1044       if (encode && context != NULL) {
1045         /* I'm not exactly sure what ffmpeg outputs... ffmpeg itself uses
1046          * the AVI fourcc 'DIVX', but 'mp4v' for Quicktime... */
1047         switch (context->codec_tag) {
1048           case GST_MAKE_FOURCC ('D', 'I', 'V', 'X'):
1049             caps =
1050                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1051                 "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL);
1052             break;
1053           case GST_MAKE_FOURCC ('m', 'p', '4', 'v'):
1054           default:
1055             /* FIXME: bitrate. libav doesn't expose the used profile and level */
1056             caps =
1057                 gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1058                 "video/mpeg", "systemstream", G_TYPE_BOOLEAN, FALSE,
1059                 "mpegversion", G_TYPE_INT, 4, NULL);
1060             break;
1061         }
1062       } else {
1063         /* The trick here is to separate xvid, divx, mpeg4, 3ivx et al */
1064         caps =
1065             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/mpeg",
1066             "mpegversion", G_TYPE_INT, 4, "systemstream", G_TYPE_BOOLEAN, FALSE,
1067             NULL);
1068
1069         if (encode) {
1070           GValue arr = { 0, };
1071           GValue item = { 0, };
1072
1073           g_value_init (&arr, GST_TYPE_LIST);
1074           g_value_init (&item, G_TYPE_STRING);
1075           g_value_set_string (&item, "simple");
1076           gst_value_list_append_value (&arr, &item);
1077           g_value_set_string (&item, "advanced-simple");
1078           gst_value_list_append_value (&arr, &item);
1079           g_value_unset (&item);
1080
1081           gst_caps_set_value (caps, "profile", &arr);
1082           g_value_unset (&arr);
1083
1084           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1085                   encode, "video/x-divx", "divxversion", G_TYPE_INT, 5, NULL));
1086         } else {
1087           gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1088                   encode, "video/x-divx", "divxversion", GST_TYPE_INT_RANGE, 4,
1089                   5, NULL));
1090         }
1091       }
1092       break;
1093
1094     case AV_CODEC_ID_RAWVIDEO:
1095       caps =
1096           gst_ffmpeg_codectype_to_video_caps (context, codec_id, encode, NULL);
1097       break;
1098
1099     case AV_CODEC_ID_MSMPEG4V1:
1100     case AV_CODEC_ID_MSMPEG4V2:
1101     case AV_CODEC_ID_MSMPEG4V3:
1102     {
1103       gint version = 41 + codec_id - AV_CODEC_ID_MSMPEG4V1;
1104
1105       /* encode-FIXME: bitrate */
1106       caps =
1107           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1108           "video/x-msmpeg", "msmpegversion", G_TYPE_INT, version, NULL);
1109       if (!encode && codec_id == AV_CODEC_ID_MSMPEG4V3) {
1110         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1111                 encode, "video/x-divx", "divxversion", G_TYPE_INT, 3, NULL));
1112       }
1113     }
1114       break;
1115
1116     case AV_CODEC_ID_WMV1:
1117     case AV_CODEC_ID_WMV2:
1118     {
1119       gint version = (codec_id == AV_CODEC_ID_WMV1) ? 1 : 2;
1120
1121       caps =
1122           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1123           "wmvversion", G_TYPE_INT, version, NULL);
1124     }
1125       break;
1126
1127     case AV_CODEC_ID_FLV1:
1128       caps =
1129           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1130           "video/x-flash-video", "flvversion", G_TYPE_INT, 1, NULL);
1131       break;
1132
1133     case AV_CODEC_ID_SVQ1:
1134       caps =
1135           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1136           "svqversion", G_TYPE_INT, 1, NULL);
1137       break;
1138
1139     case AV_CODEC_ID_SVQ3:
1140       caps =
1141           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-svq",
1142           "svqversion", G_TYPE_INT, 3, NULL);
1143       break;
1144
1145     case AV_CODEC_ID_DVAUDIO:
1146       caps =
1147           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dv",
1148           NULL);
1149       break;
1150
1151     case AV_CODEC_ID_DVVIDEO:
1152     {
1153       if (encode && context) {
1154         const gchar *format;
1155
1156         switch (context->pix_fmt) {
1157           case AV_PIX_FMT_YUYV422:
1158             format = "YUY2";
1159             break;
1160           case AV_PIX_FMT_YUV420P:
1161             format = "I420";
1162             break;
1163           case AV_PIX_FMT_YUVA420P:
1164             format = "A420";
1165             break;
1166           case AV_PIX_FMT_YUV411P:
1167             format = "Y41B";
1168             break;
1169           case AV_PIX_FMT_YUV422P:
1170             format = "Y42B";
1171             break;
1172           case AV_PIX_FMT_YUV410P:
1173             format = "YUV9";
1174             break;
1175           default:
1176             GST_WARNING
1177                 ("Couldnt' find format for pixfmt %d, defaulting to I420",
1178                 context->pix_fmt);
1179             format = "I420";
1180             break;
1181         }
1182         caps =
1183             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1184             "systemstream", G_TYPE_BOOLEAN, FALSE, "format", G_TYPE_STRING,
1185             format, NULL);
1186       } else {
1187         caps =
1188             gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dv",
1189             "systemstream", G_TYPE_BOOLEAN, FALSE, NULL);
1190       }
1191     }
1192       break;
1193
1194     case AV_CODEC_ID_WMAV1:
1195     case AV_CODEC_ID_WMAV2:
1196     {
1197       gint version = (codec_id == AV_CODEC_ID_WMAV1) ? 1 : 2;
1198
1199       if (context) {
1200         caps =
1201             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1202             "wmaversion", G_TYPE_INT, version, "block_align", G_TYPE_INT,
1203             context->block_align, "bitrate", G_TYPE_INT,
1204             (guint) context->bit_rate, NULL);
1205       } else {
1206         caps =
1207             gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1208             "wmaversion", G_TYPE_INT, version, "block_align",
1209             GST_TYPE_INT_RANGE, 0, G_MAXINT, "bitrate", GST_TYPE_INT_RANGE, 0,
1210             G_MAXINT, NULL);
1211       }
1212     }
1213       break;
1214     case AV_CODEC_ID_WMAPRO:
1215     {
1216       caps =
1217           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1218           "wmaversion", G_TYPE_INT, 3, NULL);
1219       break;
1220     }
1221     case AV_CODEC_ID_WMALOSSLESS:
1222     {
1223       caps =
1224           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wma",
1225           "wmaversion", G_TYPE_INT, 4, NULL);
1226       break;
1227     }
1228     case AV_CODEC_ID_WMAVOICE:
1229     {
1230       caps =
1231           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-wms",
1232           NULL);
1233       break;
1234     }
1235
1236     case AV_CODEC_ID_XMA1:
1237     {
1238       caps =
1239           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-xma",
1240           "xmaversion", G_TYPE_INT, 1, NULL);
1241       break;
1242     }
1243     case AV_CODEC_ID_XMA2:
1244     {
1245       caps =
1246           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-xma",
1247           "xmaversion", G_TYPE_INT, 2, NULL);
1248       break;
1249     }
1250
1251     case AV_CODEC_ID_MACE3:
1252     case AV_CODEC_ID_MACE6:
1253     {
1254       gint version = (codec_id == AV_CODEC_ID_MACE3) ? 3 : 6;
1255
1256       caps =
1257           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mace",
1258           "maceversion", G_TYPE_INT, version, NULL);
1259     }
1260       break;
1261
1262     case AV_CODEC_ID_HUFFYUV:
1263       caps =
1264           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1265           "video/x-huffyuv", NULL);
1266       if (context) {
1267         gst_caps_set_simple (caps,
1268             "bpp", G_TYPE_INT, context->bits_per_coded_sample, NULL);
1269       }
1270       break;
1271
1272     case AV_CODEC_ID_CYUV:
1273       caps =
1274           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1275           "video/x-compressed-yuv", NULL);
1276       break;
1277
1278     case AV_CODEC_ID_H264:
1279       caps =
1280           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h264",
1281           "alignment", G_TYPE_STRING, "au", NULL);
1282       if (!encode) {
1283         GValue arr = { 0, };
1284         GValue item = { 0, };
1285         g_value_init (&arr, GST_TYPE_LIST);
1286         g_value_init (&item, G_TYPE_STRING);
1287         g_value_set_string (&item, "avc");
1288         gst_value_list_append_value (&arr, &item);
1289         g_value_set_string (&item, "byte-stream");
1290         gst_value_list_append_value (&arr, &item);
1291         g_value_unset (&item);
1292         gst_caps_set_value (caps, "stream-format", &arr);
1293         g_value_unset (&arr);
1294
1295         gst_caps_append (caps, gst_ff_vid_caps_new (context, NULL, codec_id,
1296                 encode, "video/x-h264", "alignment", G_TYPE_STRING, "nal",
1297                 "stream-format", G_TYPE_STRING, "byte-stream", NULL));
1298
1299       } else if (context) {
1300         /* FIXME: ffmpeg currently assumes AVC if there is extradata and
1301          * byte-stream otherwise. See for example the MOV or MPEG-TS code.
1302          * ffmpeg does not distinguish the different types of AVC. */
1303         if (context->extradata_size > 0) {
1304           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "avc",
1305               NULL);
1306         } else {
1307           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING,
1308               "byte-stream", NULL);
1309         }
1310       }
1311       break;
1312
1313     case AV_CODEC_ID_HEVC:
1314       caps =
1315           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-h265",
1316           "alignment", G_TYPE_STRING, "au", NULL);
1317       if (!encode) {
1318         GValue arr = { 0, };
1319         GValue item = { 0, };
1320         g_value_init (&arr, GST_TYPE_LIST);
1321         g_value_init (&item, G_TYPE_STRING);
1322         g_value_set_string (&item, "hvc1");
1323         gst_value_list_append_value (&arr, &item);
1324         g_value_set_string (&item, "hev1");
1325         gst_value_list_append_value (&arr, &item);
1326         g_value_set_string (&item, "byte-stream");
1327         gst_value_list_append_value (&arr, &item);
1328         g_value_unset (&item);
1329         gst_caps_set_value (caps, "stream-format", &arr);
1330         g_value_unset (&arr);
1331       } else if (context) {
1332         /* FIXME: ffmpeg currently assumes HVC1 if there is extradata and
1333          * byte-stream otherwise. See for example the MOV or MPEG-TS code.
1334          * ffmpeg does not distinguish the different types: HVC1/HEV1/etc. */
1335         if (context->extradata_size > 0) {
1336           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "hvc1",
1337               NULL);
1338         } else {
1339           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING,
1340               "byte-stream", NULL);
1341         }
1342       }
1343       break;
1344
1345     case AV_CODEC_ID_INDEO5:
1346       caps =
1347           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1348           "indeoversion", G_TYPE_INT, 5, NULL);
1349       break;
1350
1351     case AV_CODEC_ID_INDEO4:
1352       caps =
1353           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1354           "indeoversion", G_TYPE_INT, 4, NULL);
1355       break;
1356
1357     case AV_CODEC_ID_INDEO3:
1358       caps =
1359           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1360           "indeoversion", G_TYPE_INT, 3, NULL);
1361       break;
1362
1363     case AV_CODEC_ID_INDEO2:
1364       caps =
1365           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-indeo",
1366           "indeoversion", G_TYPE_INT, 2, NULL);
1367       break;
1368
1369     case AV_CODEC_ID_FLASHSV:
1370       caps =
1371           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1372           "video/x-flash-screen", NULL);
1373       break;
1374
1375     case AV_CODEC_ID_FLASHSV2:
1376       caps =
1377           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1378           "video/x-flash-screen2", NULL);
1379       break;
1380
1381     case AV_CODEC_ID_VP3:
1382       caps =
1383           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp3",
1384           NULL);
1385       break;
1386
1387     case AV_CODEC_ID_VP5:
1388       caps =
1389           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp5",
1390           NULL);
1391       break;
1392
1393     case AV_CODEC_ID_VP6:
1394       caps =
1395           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp6",
1396           NULL);
1397       break;
1398
1399     case AV_CODEC_ID_VP6F:
1400       caps =
1401           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1402           "video/x-vp6-flash", NULL);
1403       break;
1404
1405     case AV_CODEC_ID_VP6A:
1406       caps =
1407           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1408           "video/x-vp6-alpha", NULL);
1409       break;
1410
1411     case AV_CODEC_ID_VP8:
1412       caps =
1413           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp8",
1414           NULL);
1415       break;
1416
1417     case AV_CODEC_ID_VP9:
1418       caps =
1419           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vp9",
1420           NULL);
1421       break;
1422
1423     case AV_CODEC_ID_THEORA:
1424       caps =
1425           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1426           "video/x-theora", NULL);
1427       break;
1428
1429     case AV_CODEC_ID_CFHD:
1430       caps =
1431           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1432           "video/x-cineform", NULL);
1433       break;
1434
1435     case AV_CODEC_ID_SPEEDHQ:
1436       if (context && context->codec_tag) {
1437         gchar *variant = g_strdup_printf ("%" GST_FOURCC_FORMAT,
1438             GST_FOURCC_ARGS (context->codec_tag));
1439         caps =
1440             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1441             "video/x-speedhq", "variant", G_TYPE_STRING, variant, NULL);
1442         g_free (variant);
1443       } else {
1444         caps =
1445             gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1446             "video/x-speedhq", NULL);
1447       }
1448       break;
1449
1450     case AV_CODEC_ID_AAC:
1451     {
1452       caps =
1453           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1454           NULL);
1455
1456       if (!encode) {
1457         GValue arr = { 0, };
1458         GValue item = { 0, };
1459
1460         g_value_init (&arr, GST_TYPE_LIST);
1461         g_value_init (&item, G_TYPE_INT);
1462         g_value_set_int (&item, 2);
1463         gst_value_list_append_value (&arr, &item);
1464         g_value_set_int (&item, 4);
1465         gst_value_list_append_value (&arr, &item);
1466         g_value_unset (&item);
1467
1468         gst_caps_set_value (caps, "mpegversion", &arr);
1469         g_value_unset (&arr);
1470
1471         g_value_init (&arr, GST_TYPE_LIST);
1472         g_value_init (&item, G_TYPE_STRING);
1473         g_value_set_string (&item, "raw");
1474         gst_value_list_append_value (&arr, &item);
1475         g_value_set_string (&item, "adts");
1476         gst_value_list_append_value (&arr, &item);
1477         g_value_set_string (&item, "adif");
1478         gst_value_list_append_value (&arr, &item);
1479         g_value_unset (&item);
1480
1481         gst_caps_set_value (caps, "stream-format", &arr);
1482         g_value_unset (&arr);
1483       } else {
1484         gst_caps_set_simple (caps, "mpegversion", G_TYPE_INT, 4,
1485             "base-profile", G_TYPE_STRING, "lc", NULL);
1486
1487         /* FIXME: ffmpeg currently assumes raw if there is extradata and
1488          * ADTS otherwise. See for example the FDK AAC encoder. */
1489         if (context && context->extradata_size > 0) {
1490           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "raw",
1491               NULL);
1492           gst_codec_utils_aac_caps_set_level_and_profile (caps,
1493               context->extradata, context->extradata_size);
1494         } else if (context) {
1495           gst_caps_set_simple (caps, "stream-format", G_TYPE_STRING, "adts",
1496               NULL);
1497         }
1498       }
1499
1500       break;
1501     }
1502     case AV_CODEC_ID_AAC_LATM: /* LATM/LOAS AAC syntax */
1503       caps = gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/mpeg",
1504           "mpegversion", G_TYPE_INT, 4, "stream-format", G_TYPE_STRING, "loas",
1505           NULL);
1506       break;
1507
1508     case AV_CODEC_ID_ASV1:
1509       caps =
1510           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1511           "asusversion", G_TYPE_INT, 1, NULL);
1512       break;
1513     case AV_CODEC_ID_ASV2:
1514       caps =
1515           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-asus",
1516           "asusversion", G_TYPE_INT, 2, NULL);
1517       break;
1518
1519     case AV_CODEC_ID_FFV1:
1520       caps =
1521           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-ffv",
1522           "ffvversion", G_TYPE_INT, 1, NULL);
1523       break;
1524
1525     case AV_CODEC_ID_4XM:
1526       caps =
1527           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-4xm",
1528           NULL);
1529       break;
1530
1531     case AV_CODEC_ID_XAN_WC3:
1532     case AV_CODEC_ID_XAN_WC4:
1533       caps =
1534           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-xan",
1535           "wcversion", G_TYPE_INT, 3 - AV_CODEC_ID_XAN_WC3 + codec_id, NULL);
1536       break;
1537
1538     case AV_CODEC_ID_CLJR:
1539       caps =
1540           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1541           "video/x-cirrus-logic-accupak", NULL);
1542       break;
1543
1544     case AV_CODEC_ID_FRAPS:
1545       caps =
1546           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-fraps",
1547           NULL);
1548       break;
1549
1550     case AV_CODEC_ID_MDEC:
1551     case AV_CODEC_ID_ROQ:
1552     case AV_CODEC_ID_INTERPLAY_VIDEO:
1553       buildcaps = TRUE;
1554       break;
1555
1556     case AV_CODEC_ID_VCR1:
1557       caps =
1558           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1559           "video/x-ati-vcr", "vcrversion", G_TYPE_INT, 1, NULL);
1560       break;
1561
1562     case AV_CODEC_ID_RPZA:
1563       caps =
1564           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1565           "video/x-apple-video", NULL);
1566       break;
1567
1568     case AV_CODEC_ID_CINEPAK:
1569       caps =
1570           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1571           "video/x-cinepak", NULL);
1572       break;
1573
1574       /* WS_VQA belogns here (order) */
1575
1576     case AV_CODEC_ID_MSRLE:
1577       caps =
1578           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1579           "layout", G_TYPE_STRING, "microsoft", NULL);
1580       if (context) {
1581         gst_caps_set_simple (caps,
1582             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1583       } else {
1584         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1585       }
1586       break;
1587
1588     case AV_CODEC_ID_QTRLE:
1589       caps =
1590           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-rle",
1591           "layout", G_TYPE_STRING, "quicktime", NULL);
1592       if (context) {
1593         gst_caps_set_simple (caps,
1594             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1595       } else {
1596         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 1, 64, NULL);
1597       }
1598       break;
1599
1600     case AV_CODEC_ID_MSVIDEO1:
1601       caps =
1602           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1603           "video/x-msvideocodec", "msvideoversion", G_TYPE_INT, 1, NULL);
1604       break;
1605
1606     case AV_CODEC_ID_MSS1:
1607       caps =
1608           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1609           "wmvversion", G_TYPE_INT, 1, "format", G_TYPE_STRING, "MSS1", NULL);
1610       break;
1611
1612     case AV_CODEC_ID_MSS2:
1613       caps =
1614           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1615           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "MSS2", NULL);
1616       break;
1617
1618     case AV_CODEC_ID_WMV3:
1619       caps =
1620           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1621           "wmvversion", G_TYPE_INT, 3, "format", G_TYPE_STRING, "WMV3", NULL);
1622       break;
1623     case AV_CODEC_ID_VC1:
1624       caps =
1625           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-wmv",
1626           "wmvversion", G_TYPE_INT, 3, NULL);
1627       if (!context && !encode) {
1628         GValue arr = { 0, };
1629         GValue item = { 0, };
1630
1631         g_value_init (&arr, GST_TYPE_LIST);
1632         g_value_init (&item, G_TYPE_STRING);
1633         g_value_set_string (&item, "WVC1");
1634         gst_value_list_append_value (&arr, &item);
1635         g_value_set_string (&item, "WMVA");
1636         gst_value_list_append_and_take_value (&arr, &item);
1637         gst_caps_set_value (caps, "format", &arr);
1638         g_value_unset (&arr);
1639       } else {
1640         gst_caps_set_simple (caps, "format", G_TYPE_STRING, "WVC1", NULL);
1641       }
1642       break;
1643     case AV_CODEC_ID_QDM2:
1644       caps =
1645           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-qdm2",
1646           NULL);
1647       break;
1648
1649     case AV_CODEC_ID_MSZH:
1650       caps =
1651           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mszh",
1652           NULL);
1653       break;
1654
1655     case AV_CODEC_ID_ZLIB:
1656       caps =
1657           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zlib",
1658           NULL);
1659       break;
1660
1661     case AV_CODEC_ID_TRUEMOTION1:
1662       caps =
1663           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1664           "video/x-truemotion", "trueversion", G_TYPE_INT, 1, NULL);
1665       break;
1666     case AV_CODEC_ID_TRUEMOTION2:
1667       caps =
1668           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1669           "video/x-truemotion", "trueversion", G_TYPE_INT, 2, NULL);
1670       break;
1671
1672     case AV_CODEC_ID_ULTI:
1673       caps =
1674           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1675           "video/x-ultimotion", NULL);
1676       break;
1677
1678     case AV_CODEC_ID_TSCC:
1679       caps =
1680           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1681           "video/x-camtasia", NULL);
1682       if (context) {
1683         gst_caps_set_simple (caps,
1684             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1685       } else {
1686         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1687       }
1688       break;
1689
1690     case AV_CODEC_ID_TSCC2:
1691       caps =
1692           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1693           "video/x-tscc", "tsccversion", G_TYPE_INT, 2, NULL);
1694       break;
1695
1696     case AV_CODEC_ID_KMVC:
1697       caps =
1698           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-kmvc",
1699           NULL);
1700       break;
1701
1702     case AV_CODEC_ID_NUV:
1703       caps =
1704           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-nuv",
1705           NULL);
1706       break;
1707
1708     case AV_CODEC_ID_GIF:
1709       caps =
1710           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1711           "image/gst-libav-gif", "parsed", G_TYPE_BOOLEAN, TRUE, NULL);
1712       break;
1713
1714     case AV_CODEC_ID_PNG:
1715       caps =
1716           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/png",
1717           NULL);
1718       break;
1719
1720     case AV_CODEC_ID_PPM:
1721       caps =
1722           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/ppm",
1723           NULL);
1724       break;
1725
1726     case AV_CODEC_ID_PBM:
1727       caps =
1728           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/pbm",
1729           NULL);
1730       break;
1731
1732     case AV_CODEC_ID_PAM:
1733       caps =
1734           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1735           "image/x-portable-anymap", NULL);
1736       break;
1737
1738     case AV_CODEC_ID_PGM:
1739       caps =
1740           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1741           "image/x-portable-graymap", NULL);
1742       break;
1743
1744     case AV_CODEC_ID_PCX:
1745       caps =
1746           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-pcx",
1747           NULL);
1748       break;
1749
1750     case AV_CODEC_ID_SGI:
1751       caps =
1752           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-sgi",
1753           NULL);
1754       break;
1755
1756     case AV_CODEC_ID_TARGA:
1757       caps =
1758           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/x-tga",
1759           NULL);
1760       break;
1761
1762     case AV_CODEC_ID_TIFF:
1763       caps =
1764           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "image/tiff",
1765           NULL);
1766       break;
1767
1768     case AV_CODEC_ID_SUNRAST:
1769       caps =
1770           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1771           "image/x-sun-raster", NULL);
1772       break;
1773
1774     case AV_CODEC_ID_SMC:
1775       caps =
1776           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-smc",
1777           NULL);
1778       break;
1779
1780     case AV_CODEC_ID_QDRAW:
1781       caps =
1782           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-qdrw",
1783           NULL);
1784       break;
1785
1786     case AV_CODEC_ID_DNXHD:
1787       caps =
1788           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-dnxhd",
1789           NULL);
1790       break;
1791
1792     case AV_CODEC_ID_PRORES:
1793       caps =
1794           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1795           "video/x-prores", NULL);
1796       if (context) {
1797         switch (context->codec_tag) {
1798           case GST_MAKE_FOURCC ('a', 'p', 'c', 'o'):
1799             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "proxy", NULL);
1800             break;
1801           case GST_MAKE_FOURCC ('a', 'p', 'c', 's'):
1802             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "lt", NULL);
1803             break;
1804           default:
1805           case GST_MAKE_FOURCC ('a', 'p', 'c', 'n'):
1806             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "standard",
1807                 NULL);
1808             break;
1809           case GST_MAKE_FOURCC ('a', 'p', 'c', 'h'):
1810             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "hq", NULL);
1811             break;
1812           case GST_MAKE_FOURCC ('a', 'p', '4', 'h'):
1813             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444", NULL);
1814             break;
1815           case GST_MAKE_FOURCC ('a', 'p', '4', 'x'):
1816             gst_caps_set_simple (caps, "variant", G_TYPE_STRING, "4444xq",
1817                 NULL);
1818             break;
1819         }
1820       }
1821       break;
1822
1823     case AV_CODEC_ID_MIMIC:
1824       caps =
1825           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-mimic",
1826           NULL);
1827       break;
1828
1829     case AV_CODEC_ID_VMNC:
1830       caps =
1831           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-vmnc",
1832           NULL);
1833       break;
1834
1835     case AV_CODEC_ID_TRUESPEECH:
1836       caps =
1837           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
1838           "audio/x-truespeech", NULL);
1839       break;
1840
1841     case AV_CODEC_ID_QCELP:
1842       caps =
1843           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/qcelp",
1844           NULL);
1845       break;
1846
1847     case AV_CODEC_ID_AMV:
1848       caps =
1849           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-amv",
1850           NULL);
1851       break;
1852
1853     case AV_CODEC_ID_AASC:
1854       caps =
1855           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-aasc",
1856           NULL);
1857       break;
1858
1859     case AV_CODEC_ID_LOCO:
1860       caps =
1861           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-loco",
1862           NULL);
1863       break;
1864
1865     case AV_CODEC_ID_ZMBV:
1866       caps =
1867           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-zmbv",
1868           NULL);
1869       break;
1870
1871     case AV_CODEC_ID_LAGARITH:
1872       caps =
1873           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1874           "video/x-lagarith", NULL);
1875       break;
1876
1877     case AV_CODEC_ID_CSCD:
1878       caps =
1879           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1880           "video/x-camstudio", NULL);
1881       if (context) {
1882         gst_caps_set_simple (caps,
1883             "depth", G_TYPE_INT, (gint) context->bits_per_coded_sample, NULL);
1884       } else {
1885         gst_caps_set_simple (caps, "depth", GST_TYPE_INT_RANGE, 8, 32, NULL);
1886       }
1887       break;
1888
1889     case AV_CODEC_ID_AIC:
1890       caps =
1891           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1892           "video/x-apple-intermediate-codec", NULL);
1893       break;
1894
1895     case AV_CODEC_ID_CAVS:
1896       caps =
1897           gst_ff_vid_caps_new (context, NULL, codec_id, encode,
1898           "video/x-cavs", NULL);
1899       break;
1900
1901     case AV_CODEC_ID_WS_VQA:
1902     case AV_CODEC_ID_IDCIN:
1903     case AV_CODEC_ID_8BPS:
1904     case AV_CODEC_ID_FLIC:
1905     case AV_CODEC_ID_VMDVIDEO:
1906     case AV_CODEC_ID_VMDAUDIO:
1907     case AV_CODEC_ID_VIXL:
1908     case AV_CODEC_ID_QPEG:
1909     case AV_CODEC_ID_PGMYUV:
1910     case AV_CODEC_ID_FFVHUFF:
1911     case AV_CODEC_ID_WNV1:
1912     case AV_CODEC_ID_MP3ADU:
1913     case AV_CODEC_ID_MP3ON4:
1914     case AV_CODEC_ID_WESTWOOD_SND1:
1915     case AV_CODEC_ID_MMVIDEO:
1916     case AV_CODEC_ID_AVS:
1917       buildcaps = TRUE;
1918       break;
1919
1920       /* weird quasi-codecs for the demuxers only */
1921     case AV_CODEC_ID_PCM_S16LE:
1922     case AV_CODEC_ID_PCM_S16BE:
1923     case AV_CODEC_ID_PCM_U16LE:
1924     case AV_CODEC_ID_PCM_U16BE:
1925     case AV_CODEC_ID_PCM_S8:
1926     case AV_CODEC_ID_PCM_U8:
1927     {
1928       GstAudioFormat format;
1929
1930       switch (codec_id) {
1931         case AV_CODEC_ID_PCM_S16LE:
1932           format = GST_AUDIO_FORMAT_S16LE;
1933           break;
1934         case AV_CODEC_ID_PCM_S16BE:
1935           format = GST_AUDIO_FORMAT_S16BE;
1936           break;
1937         case AV_CODEC_ID_PCM_U16LE:
1938           format = GST_AUDIO_FORMAT_U16LE;
1939           break;
1940         case AV_CODEC_ID_PCM_U16BE:
1941           format = GST_AUDIO_FORMAT_U16BE;
1942           break;
1943         case AV_CODEC_ID_PCM_S8:
1944           format = GST_AUDIO_FORMAT_S8;
1945           break;
1946         case AV_CODEC_ID_PCM_U8:
1947           format = GST_AUDIO_FORMAT_U8;
1948           break;
1949         default:
1950           format = 0;
1951           g_assert (0);         /* don't worry, we never get here */
1952           break;
1953       }
1954
1955       caps =
1956           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-raw",
1957           "format", G_TYPE_STRING, gst_audio_format_to_string (format),
1958           "layout", G_TYPE_STRING, "interleaved", NULL);
1959     }
1960       break;
1961
1962     case AV_CODEC_ID_PCM_MULAW:
1963       caps =
1964           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-mulaw",
1965           NULL);
1966       break;
1967
1968     case AV_CODEC_ID_PCM_ALAW:
1969       caps =
1970           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alaw",
1971           NULL);
1972       break;
1973
1974     case AV_CODEC_ID_ADPCM_G722:
1975       caps =
1976           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G722",
1977           NULL);
1978       if (context)
1979         gst_caps_set_simple (caps,
1980             "block_align", G_TYPE_INT, context->block_align,
1981             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1982       break;
1983
1984     case AV_CODEC_ID_ADPCM_G726:
1985     {
1986       /* the G726 decoder can also handle G721 */
1987       caps =
1988           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
1989           "layout", G_TYPE_STRING, "g726", NULL);
1990       if (context)
1991         gst_caps_set_simple (caps,
1992             "block_align", G_TYPE_INT, context->block_align,
1993             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
1994
1995       if (!encode) {
1996         gst_caps_append (caps, gst_caps_new_simple ("audio/x-adpcm",
1997                 "layout", G_TYPE_STRING, "g721",
1998                 "channels", G_TYPE_INT, 1, "rate", G_TYPE_INT, 8000, NULL));
1999       }
2000       break;
2001     }
2002     case AV_CODEC_ID_ADPCM_IMA_QT:
2003     case AV_CODEC_ID_ADPCM_IMA_WAV:
2004     case AV_CODEC_ID_ADPCM_IMA_DK3:
2005     case AV_CODEC_ID_ADPCM_IMA_DK4:
2006     case AV_CODEC_ID_ADPCM_IMA_OKI:
2007     case AV_CODEC_ID_ADPCM_IMA_WS:
2008     case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
2009     case AV_CODEC_ID_ADPCM_IMA_AMV:
2010     case AV_CODEC_ID_ADPCM_IMA_ISS:
2011     case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
2012     case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
2013     case AV_CODEC_ID_ADPCM_MS:
2014     case AV_CODEC_ID_ADPCM_4XM:
2015     case AV_CODEC_ID_ADPCM_XA:
2016     case AV_CODEC_ID_ADPCM_ADX:
2017     case AV_CODEC_ID_ADPCM_EA:
2018     case AV_CODEC_ID_ADPCM_CT:
2019     case AV_CODEC_ID_ADPCM_SWF:
2020     case AV_CODEC_ID_ADPCM_YAMAHA:
2021     case AV_CODEC_ID_ADPCM_SBPRO_2:
2022     case AV_CODEC_ID_ADPCM_SBPRO_3:
2023     case AV_CODEC_ID_ADPCM_SBPRO_4:
2024     case AV_CODEC_ID_ADPCM_EA_R1:
2025     case AV_CODEC_ID_ADPCM_EA_R2:
2026     case AV_CODEC_ID_ADPCM_EA_R3:
2027     case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
2028     case AV_CODEC_ID_ADPCM_EA_XAS:
2029     case AV_CODEC_ID_ADPCM_THP:
2030     {
2031       const gchar *layout = NULL;
2032
2033       switch (codec_id) {
2034         case AV_CODEC_ID_ADPCM_IMA_QT:
2035           layout = "quicktime";
2036           break;
2037         case AV_CODEC_ID_ADPCM_IMA_WAV:
2038           layout = "dvi";
2039           break;
2040         case AV_CODEC_ID_ADPCM_IMA_DK3:
2041           layout = "dk3";
2042           break;
2043         case AV_CODEC_ID_ADPCM_IMA_DK4:
2044           layout = "dk4";
2045           break;
2046         case AV_CODEC_ID_ADPCM_IMA_OKI:
2047           layout = "oki";
2048           break;
2049         case AV_CODEC_ID_ADPCM_IMA_WS:
2050           layout = "westwood";
2051           break;
2052         case AV_CODEC_ID_ADPCM_IMA_SMJPEG:
2053           layout = "smjpeg";
2054           break;
2055         case AV_CODEC_ID_ADPCM_IMA_AMV:
2056           layout = "amv";
2057           break;
2058         case AV_CODEC_ID_ADPCM_IMA_ISS:
2059           layout = "iss";
2060           break;
2061         case AV_CODEC_ID_ADPCM_IMA_EA_EACS:
2062           layout = "ea-eacs";
2063           break;
2064         case AV_CODEC_ID_ADPCM_IMA_EA_SEAD:
2065           layout = "ea-sead";
2066           break;
2067         case AV_CODEC_ID_ADPCM_MS:
2068           layout = "microsoft";
2069           break;
2070         case AV_CODEC_ID_ADPCM_4XM:
2071           layout = "4xm";
2072           break;
2073         case AV_CODEC_ID_ADPCM_XA:
2074           layout = "xa";
2075           break;
2076         case AV_CODEC_ID_ADPCM_ADX:
2077           layout = "adx";
2078           break;
2079         case AV_CODEC_ID_ADPCM_EA:
2080           layout = "ea";
2081           break;
2082         case AV_CODEC_ID_ADPCM_CT:
2083           layout = "ct";
2084           break;
2085         case AV_CODEC_ID_ADPCM_SWF:
2086           layout = "swf";
2087           break;
2088         case AV_CODEC_ID_ADPCM_YAMAHA:
2089           layout = "yamaha";
2090           break;
2091         case AV_CODEC_ID_ADPCM_SBPRO_2:
2092           layout = "sbpro2";
2093           break;
2094         case AV_CODEC_ID_ADPCM_SBPRO_3:
2095           layout = "sbpro3";
2096           break;
2097         case AV_CODEC_ID_ADPCM_SBPRO_4:
2098           layout = "sbpro4";
2099           break;
2100         case AV_CODEC_ID_ADPCM_EA_R1:
2101           layout = "ea-r1";
2102           break;
2103         case AV_CODEC_ID_ADPCM_EA_R2:
2104           layout = "ea-r3";
2105           break;
2106         case AV_CODEC_ID_ADPCM_EA_R3:
2107           layout = "ea-r3";
2108           break;
2109         case AV_CODEC_ID_ADPCM_EA_MAXIS_XA:
2110           layout = "ea-maxis-xa";
2111           break;
2112         case AV_CODEC_ID_ADPCM_EA_XAS:
2113           layout = "ea-xas";
2114           break;
2115         case AV_CODEC_ID_ADPCM_THP:
2116           layout = "thp";
2117           break;
2118         default:
2119           g_assert (0);         /* don't worry, we never get here */
2120           break;
2121       }
2122
2123       /* FIXME: someone please check whether we need additional properties
2124        * in this caps definition. */
2125       caps =
2126           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-adpcm",
2127           "layout", G_TYPE_STRING, layout, NULL);
2128       if (context)
2129         gst_caps_set_simple (caps,
2130             "block_align", G_TYPE_INT, context->block_align,
2131             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2132     }
2133       break;
2134
2135     case AV_CODEC_ID_AMR_NB:
2136       caps =
2137           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR",
2138           NULL);
2139       break;
2140
2141     case AV_CODEC_ID_AMR_WB:
2142       caps =
2143           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/AMR-WB",
2144           NULL);
2145       break;
2146
2147     case AV_CODEC_ID_GSM:
2148       caps =
2149           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-gsm",
2150           NULL);
2151       break;
2152
2153     case AV_CODEC_ID_GSM_MS:
2154       caps =
2155           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/ms-gsm",
2156           NULL);
2157       break;
2158
2159     case AV_CODEC_ID_NELLYMOSER:
2160       caps =
2161           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2162           "audio/x-nellymoser", NULL);
2163       break;
2164
2165     case AV_CODEC_ID_SIPR:
2166     {
2167       caps =
2168           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-sipro",
2169           NULL);
2170       if (context) {
2171         gst_caps_set_simple (caps,
2172             "leaf_size", G_TYPE_INT, context->block_align,
2173             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2174       }
2175     }
2176       break;
2177
2178     case AV_CODEC_ID_RA_144:
2179     case AV_CODEC_ID_RA_288:
2180     case AV_CODEC_ID_COOK:
2181     {
2182       gint version = 0;
2183
2184       switch (codec_id) {
2185         case AV_CODEC_ID_RA_144:
2186           version = 1;
2187           break;
2188         case AV_CODEC_ID_RA_288:
2189           version = 2;
2190           break;
2191         case AV_CODEC_ID_COOK:
2192           version = 8;
2193           break;
2194         default:
2195           break;
2196       }
2197
2198       /* FIXME: properties? */
2199       caps =
2200           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2201           "audio/x-pn-realaudio", "raversion", G_TYPE_INT, version, NULL);
2202       if (context) {
2203         gst_caps_set_simple (caps,
2204             "leaf_size", G_TYPE_INT, context->block_align,
2205             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2206       }
2207     }
2208       break;
2209
2210     case AV_CODEC_ID_ROQ_DPCM:
2211     case AV_CODEC_ID_INTERPLAY_DPCM:
2212     case AV_CODEC_ID_XAN_DPCM:
2213     case AV_CODEC_ID_SOL_DPCM:
2214     {
2215       const gchar *layout = NULL;
2216
2217       switch (codec_id) {
2218         case AV_CODEC_ID_ROQ_DPCM:
2219           layout = "roq";
2220           break;
2221         case AV_CODEC_ID_INTERPLAY_DPCM:
2222           layout = "interplay";
2223           break;
2224         case AV_CODEC_ID_XAN_DPCM:
2225           layout = "xan";
2226           break;
2227         case AV_CODEC_ID_SOL_DPCM:
2228           layout = "sol";
2229           break;
2230         default:
2231           g_assert (0);         /* don't worry, we never get here */
2232           break;
2233       }
2234
2235       /* FIXME: someone please check whether we need additional properties
2236        * in this caps definition. */
2237       caps =
2238           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dpcm",
2239           "layout", G_TYPE_STRING, layout, NULL);
2240       if (context)
2241         gst_caps_set_simple (caps,
2242             "block_align", G_TYPE_INT, context->block_align,
2243             "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2244     }
2245       break;
2246
2247     case AV_CODEC_ID_SHORTEN:
2248       caps = gst_caps_new_empty_simple ("audio/x-shorten");
2249       break;
2250
2251     case AV_CODEC_ID_ALAC:
2252       caps =
2253           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-alac",
2254           NULL);
2255       if (context) {
2256         gst_caps_set_simple (caps,
2257             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2258       }
2259       break;
2260
2261     case AV_CODEC_ID_FLAC:
2262       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2263        * encoder case, we want to add things like samplerate, channels... */
2264       if (!encode) {
2265         caps = gst_caps_new_empty_simple ("audio/x-flac");
2266       }
2267       break;
2268
2269     case AV_CODEC_ID_OPUS:
2270       /* Note that ffmpeg has no encoder yet, but just for safety. In the
2271        * encoder case, we want to add things like samplerate, channels... */
2272       if (!encode) {
2273         /* FIXME: can ffmpeg handle multichannel Opus? */
2274         caps = gst_caps_new_simple ("audio/x-opus",
2275             "channel-mapping-family", G_TYPE_INT, 0, NULL);
2276       }
2277       break;
2278
2279     case AV_CODEC_ID_S302M:
2280       caps = gst_caps_new_empty_simple ("audio/x-smpte-302m");
2281       break;
2282
2283     case AV_CODEC_ID_DVD_SUBTITLE:
2284     case AV_CODEC_ID_DVB_SUBTITLE:
2285       caps = NULL;
2286       break;
2287     case AV_CODEC_ID_BMP:
2288       caps = gst_caps_new_empty_simple ("image/bmp");
2289       break;
2290     case AV_CODEC_ID_TTA:
2291       caps =
2292           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-tta",
2293           NULL);
2294       if (context) {
2295         gst_caps_set_simple (caps,
2296             "samplesize", G_TYPE_INT, context->bits_per_coded_sample, NULL);
2297       }
2298       break;
2299     case AV_CODEC_ID_TWINVQ:
2300       caps =
2301           gst_ff_aud_caps_new (context, NULL, codec_id, encode,
2302           "audio/x-twin-vq", NULL);
2303       break;
2304     case AV_CODEC_ID_G729:
2305       caps =
2306           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/G729",
2307           NULL);
2308       break;
2309     case AV_CODEC_ID_DSD_LSBF:
2310       caps =
2311           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2312           NULL);
2313       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2314           TRUE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2315       break;
2316     case AV_CODEC_ID_DSD_MSBF:
2317       caps =
2318           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2319           NULL);
2320       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2321           FALSE, "planar", G_TYPE_BOOLEAN, FALSE, NULL);
2322       break;
2323     case AV_CODEC_ID_DSD_LSBF_PLANAR:
2324       caps =
2325           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2326           NULL);
2327       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2328           TRUE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2329       break;
2330     case AV_CODEC_ID_DSD_MSBF_PLANAR:
2331       caps =
2332           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/x-dsd",
2333           NULL);
2334       gst_caps_set_simple (caps, "lsbf", G_TYPE_BOOLEAN,
2335           FALSE, "planar", G_TYPE_BOOLEAN, TRUE, NULL);
2336       break;
2337     case AV_CODEC_ID_APTX:
2338       caps =
2339           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/aptx",
2340           NULL);
2341       break;
2342     case AV_CODEC_ID_APTX_HD:
2343       caps =
2344           gst_ff_aud_caps_new (context, NULL, codec_id, encode, "audio/aptx-hd",
2345           NULL);
2346       break;
2347     case AV_CODEC_ID_AV1:
2348       caps =
2349           gst_ff_vid_caps_new (context, NULL, codec_id, encode, "video/x-av1",
2350           NULL);
2351       break;
2352     default:
2353       GST_DEBUG ("Unknown codec ID %d, please add mapping here", codec_id);
2354       break;
2355   }
2356
2357   if (buildcaps) {
2358     const AVCodec *codec;
2359
2360     if ((codec = avcodec_find_decoder (codec_id)) ||
2361         (codec = avcodec_find_encoder (codec_id))) {
2362       gchar *mime = NULL;
2363
2364       GST_LOG ("Could not create stream format caps for %s", codec->name);
2365
2366       switch (codec->type) {
2367         case AVMEDIA_TYPE_VIDEO:
2368           mime = g_strdup_printf ("video/x-gst-av-%s", codec->name);
2369           caps =
2370               gst_ff_vid_caps_new (context, NULL, codec_id, encode, mime, NULL);
2371           g_free (mime);
2372           break;
2373         case AVMEDIA_TYPE_AUDIO:
2374           mime = g_strdup_printf ("audio/x-gst-av-%s", codec->name);
2375           caps =
2376               gst_ff_aud_caps_new (context, NULL, codec_id, encode, mime, NULL);
2377           if (context)
2378             gst_caps_set_simple (caps,
2379                 "block_align", G_TYPE_INT, context->block_align,
2380                 "bitrate", G_TYPE_INT, (guint) context->bit_rate, NULL);
2381           g_free (mime);
2382           break;
2383         default:
2384           break;
2385       }
2386     }
2387   }
2388
2389   if (caps != NULL) {
2390
2391     /* set private data */
2392     if (context && context->extradata_size > 0) {
2393       GstBuffer *data = gst_buffer_new_and_alloc (context->extradata_size);
2394
2395       gst_buffer_fill (data, 0, context->extradata, context->extradata_size);
2396       gst_caps_set_simple (caps, "codec_data", GST_TYPE_BUFFER, data, NULL);
2397       gst_buffer_unref (data);
2398     }
2399
2400     GST_LOG ("caps for codec_id=%d: %" GST_PTR_FORMAT, codec_id, caps);
2401
2402   } else {
2403     GST_LOG ("No caps found for codec_id=%d", codec_id);
2404   }
2405
2406   return caps;
2407 }
2408
2409 /* Convert a FFMPEG Pixel Format and optional AVCodecContext
2410  * to a GstCaps. If the context is ommitted, no fixed values
2411  * for video/audio size will be included in the GstCaps
2412  *
2413  * See below for usefullness
2414  */
2415
2416 static GstCaps *
2417 gst_ffmpeg_pixfmt_to_caps (enum AVPixelFormat pix_fmt, AVCodecContext * context,
2418     enum AVCodecID codec_id)
2419 {
2420   GstCaps *caps = NULL;
2421   GstVideoFormat format;
2422
2423   format = gst_ffmpeg_pixfmt_to_videoformat (pix_fmt);
2424
2425   if (format != GST_VIDEO_FORMAT_UNKNOWN) {
2426     caps = gst_ff_vid_caps_new (context, NULL, codec_id, TRUE, "video/x-raw",
2427         "format", G_TYPE_STRING, gst_video_format_to_string (format), NULL);
2428   }
2429
2430   if (caps != NULL) {
2431     GST_DEBUG ("caps for pix_fmt=%d: %" GST_PTR_FORMAT, pix_fmt, caps);
2432   } else {
2433     GST_LOG ("No caps found for pix_fmt=%d", pix_fmt);
2434   }
2435
2436   return caps;
2437 }
2438
2439 GstAudioFormat
2440 gst_ffmpeg_smpfmt_to_audioformat (enum AVSampleFormat sample_fmt,
2441     GstAudioLayout * layout)
2442 {
2443   if (layout)
2444     *layout = GST_AUDIO_LAYOUT_NON_INTERLEAVED;
2445
2446   switch (sample_fmt) {
2447     case AV_SAMPLE_FMT_U8:
2448       if (layout)
2449         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2450     case AV_SAMPLE_FMT_U8P:
2451       return GST_AUDIO_FORMAT_U8;
2452       break;
2453
2454     case AV_SAMPLE_FMT_S16:
2455       if (layout)
2456         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2457     case AV_SAMPLE_FMT_S16P:
2458       return GST_AUDIO_FORMAT_S16;
2459       break;
2460
2461     case AV_SAMPLE_FMT_S32:
2462       if (layout)
2463         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2464     case AV_SAMPLE_FMT_S32P:
2465       return GST_AUDIO_FORMAT_S32;
2466       break;
2467     case AV_SAMPLE_FMT_FLT:
2468       if (layout)
2469         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2470     case AV_SAMPLE_FMT_FLTP:
2471       return GST_AUDIO_FORMAT_F32;
2472       break;
2473
2474     case AV_SAMPLE_FMT_DBL:
2475       if (layout)
2476         *layout = GST_AUDIO_LAYOUT_INTERLEAVED;
2477     case AV_SAMPLE_FMT_DBLP:
2478       return GST_AUDIO_FORMAT_F64;
2479       break;
2480
2481     default:
2482       /* .. */
2483       return GST_AUDIO_FORMAT_UNKNOWN;
2484       break;
2485   }
2486 }
2487
2488 /* Convert a FFMPEG Sample Format and optional AVCodecContext
2489  * to a GstCaps. If the context is ommitted, no fixed values
2490  * for video/audio size will be included in the GstCaps
2491  *
2492  * See below for usefullness
2493  */
2494
2495 static GstCaps *
2496 gst_ffmpeg_smpfmt_to_caps (enum AVSampleFormat sample_fmt,
2497     AVCodecContext * context, AVCodec * codec, enum AVCodecID codec_id)
2498 {
2499   GstCaps *caps = NULL;
2500   GstAudioFormat format;
2501   GstAudioLayout layout;
2502
2503   format = gst_ffmpeg_smpfmt_to_audioformat (sample_fmt, &layout);
2504
2505   if (format != GST_AUDIO_FORMAT_UNKNOWN) {
2506     caps = gst_ff_aud_caps_new (context, codec, codec_id, TRUE, "audio/x-raw",
2507         "format", G_TYPE_STRING, gst_audio_format_to_string (format),
2508         "layout", G_TYPE_STRING,
2509         (layout == GST_AUDIO_LAYOUT_INTERLEAVED) ?
2510         "interleaved" : "non-interleaved", NULL);
2511     GST_LOG ("caps for sample_fmt=%d: %" GST_PTR_FORMAT, sample_fmt, caps);
2512   } else {
2513     GST_LOG ("No caps found for sample_fmt=%d", sample_fmt);
2514   }
2515
2516   return caps;
2517 }
2518
2519 static gboolean
2520 caps_has_field (GstCaps * caps, const gchar * field)
2521 {
2522   guint i, n;
2523
2524   n = gst_caps_get_size (caps);
2525   for (i = 0; i < n; i++) {
2526     GstStructure *s = gst_caps_get_structure (caps, i);
2527
2528     if (gst_structure_has_field (s, field))
2529       return TRUE;
2530   }
2531
2532   return FALSE;
2533 }
2534
2535 GstCaps *
2536 gst_ffmpeg_codectype_to_audio_caps (AVCodecContext * context,
2537     enum AVCodecID codec_id, gboolean encode, AVCodec * codec)
2538 {
2539   GstCaps *caps = NULL;
2540
2541   GST_DEBUG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2542       context, codec_id, encode, codec);
2543   if (codec)
2544     GST_DEBUG ("sample_fmts:%p, samplerates:%p",
2545         codec->sample_fmts, codec->supported_samplerates);
2546
2547   if (context) {
2548     /* Specific codec context */
2549     caps =
2550         gst_ffmpeg_smpfmt_to_caps (context->sample_fmt, context, codec,
2551         codec_id);
2552   } else {
2553     caps = gst_ff_aud_caps_new (context, codec, codec_id, encode, "audio/x-raw",
2554         NULL);
2555     if (!caps_has_field (caps, "format"))
2556       gst_ffmpeg_audio_set_sample_fmts (caps,
2557           codec ? codec->sample_fmts : NULL, encode);
2558   }
2559
2560   return caps;
2561 }
2562
2563 GstCaps *
2564 gst_ffmpeg_codectype_to_video_caps (AVCodecContext * context,
2565     enum AVCodecID codec_id, gboolean encode, const AVCodec * codec)
2566 {
2567   GstCaps *caps;
2568
2569   GST_LOG ("context:%p, codec_id:%d, encode:%d, codec:%p",
2570       context, codec_id, encode, codec);
2571
2572   if (context) {
2573     caps = gst_ffmpeg_pixfmt_to_caps (context->pix_fmt, context, codec_id);
2574   } else {
2575     caps =
2576         gst_ff_vid_caps_new (context, codec, codec_id, encode, "video/x-raw",
2577         NULL);
2578     if (!caps_has_field (caps, "format"))
2579       gst_ffmpeg_video_set_pix_fmts (caps, codec ? codec->pix_fmts : NULL);
2580   }
2581   return caps;
2582 }
2583
2584 /* Convert a GstCaps (audio/raw) to a FFMPEG SampleFmt
2585  * and other audio properties in a AVCodecContext.
2586  *
2587  * For usefullness, see below
2588  */
2589
2590 static void
2591 gst_ffmpeg_caps_to_smpfmt (const GstCaps * caps,
2592     AVCodecContext * context, gboolean raw)
2593 {
2594   GstStructure *structure;
2595   const gchar *fmt;
2596   GstAudioFormat format = GST_AUDIO_FORMAT_UNKNOWN;
2597   gint bitrate;
2598   const gchar *layout;
2599   gboolean interleaved;
2600
2601   g_return_if_fail (gst_caps_get_size (caps) == 1);
2602
2603   structure = gst_caps_get_structure (caps, 0);
2604
2605   gst_structure_get_int (structure, "channels", &context->channels);
2606   gst_structure_get_int (structure, "rate", &context->sample_rate);
2607   gst_structure_get_int (structure, "block_align", &context->block_align);
2608   if (gst_structure_get_int (structure, "bitrate", &bitrate))
2609     context->bit_rate = bitrate;
2610
2611   if (!raw)
2612     return;
2613
2614   if (gst_structure_has_name (structure, "audio/x-raw")) {
2615     if ((fmt = gst_structure_get_string (structure, "format"))) {
2616       format = gst_audio_format_from_string (fmt);
2617     }
2618   }
2619
2620   layout = gst_structure_get_string (structure, "layout");
2621   interleaved = ! !g_strcmp0 (layout, "non-interleaved");
2622
2623   switch (format) {
2624     case GST_AUDIO_FORMAT_F32:
2625       context->sample_fmt =
2626           interleaved ? AV_SAMPLE_FMT_FLT : AV_SAMPLE_FMT_FLTP;
2627       break;
2628     case GST_AUDIO_FORMAT_F64:
2629       context->sample_fmt =
2630           interleaved ? AV_SAMPLE_FMT_DBL : AV_SAMPLE_FMT_DBLP;
2631       break;
2632     case GST_AUDIO_FORMAT_S32:
2633       context->sample_fmt =
2634           interleaved ? AV_SAMPLE_FMT_S32 : AV_SAMPLE_FMT_S32P;
2635       break;
2636     case GST_AUDIO_FORMAT_S16:
2637       context->sample_fmt =
2638           interleaved ? AV_SAMPLE_FMT_S16 : AV_SAMPLE_FMT_S16P;
2639       break;
2640     default:
2641       break;
2642   }
2643 }
2644
2645 /* Convert a GstCaps (video/raw) to a FFMPEG PixFmt
2646  * and other video properties in a AVCodecContext.
2647  *
2648  * For usefullness, see below
2649  */
2650
2651 static void
2652 gst_ffmpeg_caps_to_pixfmt (const GstCaps * caps,
2653     AVCodecContext * context, gboolean raw)
2654 {
2655   GstStructure *structure;
2656   const GValue *fps;
2657   const GValue *par = NULL;
2658   const gchar *fmt;
2659   GstVideoFormat format = GST_VIDEO_FORMAT_UNKNOWN;
2660   const gchar *s;
2661
2662   GST_DEBUG ("converting caps %" GST_PTR_FORMAT, caps);
2663   g_return_if_fail (gst_caps_get_size (caps) == 1);
2664   structure = gst_caps_get_structure (caps, 0);
2665
2666   gst_structure_get_int (structure, "width", &context->width);
2667   gst_structure_get_int (structure, "height", &context->height);
2668   gst_structure_get_int (structure, "bpp", &context->bits_per_coded_sample);
2669
2670   fps = gst_structure_get_value (structure, "framerate");
2671   if (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps)) {
2672
2673     int num = gst_value_get_fraction_numerator (fps);
2674     int den = gst_value_get_fraction_denominator (fps);
2675
2676     if (num > 0 && den > 0) {
2677       /* somehow these seem mixed up.. */
2678       /* they're fine, this is because it does period=1/frequency */
2679       context->time_base.den = gst_value_get_fraction_numerator (fps);
2680       context->time_base.num = gst_value_get_fraction_denominator (fps);
2681       context->ticks_per_frame = 1;
2682
2683       GST_DEBUG ("setting framerate %d/%d = %lf",
2684           context->time_base.den, context->time_base.num,
2685           1. * context->time_base.den / context->time_base.num);
2686     } else {
2687       GST_INFO ("ignoring framerate %d/%d (probably variable framerate)",
2688           context->time_base.num, context->time_base.den);
2689     }
2690   }
2691
2692   par = gst_structure_get_value (structure, "pixel-aspect-ratio");
2693   if (par && GST_VALUE_HOLDS_FRACTION (par)) {
2694
2695     int num = gst_value_get_fraction_numerator (par);
2696     int den = gst_value_get_fraction_denominator (par);
2697
2698     if (num > 0 && den > 0) {
2699       context->sample_aspect_ratio.num = num;
2700       context->sample_aspect_ratio.den = den;
2701
2702       GST_DEBUG ("setting pixel-aspect-ratio %d/%d = %lf",
2703           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den,
2704           1. * context->sample_aspect_ratio.num /
2705           context->sample_aspect_ratio.den);
2706     } else {
2707       GST_WARNING ("ignoring insane pixel-aspect-ratio %d/%d",
2708           context->sample_aspect_ratio.num, context->sample_aspect_ratio.den);
2709     }
2710   }
2711
2712   if (!raw)
2713     return;
2714
2715   g_return_if_fail (fps != NULL && GST_VALUE_HOLDS_FRACTION (fps));
2716
2717   if (gst_structure_has_name (structure, "video/x-raw")) {
2718     if ((fmt = gst_structure_get_string (structure, "format"))) {
2719       format = gst_video_format_from_string (fmt);
2720     }
2721   }
2722
2723   switch (format) {
2724     case GST_VIDEO_FORMAT_YUY2:
2725       context->pix_fmt = AV_PIX_FMT_YUYV422;
2726       break;
2727     case GST_VIDEO_FORMAT_I420:
2728       context->pix_fmt = AV_PIX_FMT_YUV420P;
2729       break;
2730     case GST_VIDEO_FORMAT_A420:
2731       context->pix_fmt = AV_PIX_FMT_YUVA420P;
2732       break;
2733     case GST_VIDEO_FORMAT_Y41B:
2734       context->pix_fmt = AV_PIX_FMT_YUV411P;
2735       break;
2736     case GST_VIDEO_FORMAT_Y42B:
2737       context->pix_fmt = AV_PIX_FMT_YUV422P;
2738       break;
2739     case GST_VIDEO_FORMAT_YUV9:
2740       context->pix_fmt = AV_PIX_FMT_YUV410P;
2741       break;
2742     case GST_VIDEO_FORMAT_Y444:
2743       context->pix_fmt = AV_PIX_FMT_YUV444P;
2744       break;
2745     case GST_VIDEO_FORMAT_GRAY8:
2746       context->pix_fmt = AV_PIX_FMT_GRAY8;
2747       break;
2748     case GST_VIDEO_FORMAT_xRGB:
2749 #if (G_BYTE_ORDER == G_BIG_ENDIAN)
2750       context->pix_fmt = AV_PIX_FMT_RGB32;
2751 #endif
2752       break;
2753     case GST_VIDEO_FORMAT_BGRx:
2754 #if (G_BYTE_ORDER == G_LITTLE_ENDIAN)
2755       context->pix_fmt = AV_PIX_FMT_RGB32;
2756 #endif
2757       break;
2758     case GST_VIDEO_FORMAT_RGB:
2759       context->pix_fmt = AV_PIX_FMT_RGB24;
2760       break;
2761     case GST_VIDEO_FORMAT_BGR:
2762       context->pix_fmt = AV_PIX_FMT_BGR24;
2763       break;
2764     case GST_VIDEO_FORMAT_RGB16:
2765       context->pix_fmt = AV_PIX_FMT_RGB565;
2766       break;
2767     case GST_VIDEO_FORMAT_RGB15:
2768       context->pix_fmt = AV_PIX_FMT_RGB555;
2769       break;
2770     case GST_VIDEO_FORMAT_RGB8P:
2771       context->pix_fmt = AV_PIX_FMT_PAL8;
2772       break;
2773     default:
2774       break;
2775   }
2776
2777   s = gst_structure_get_string (structure, "interlace-mode");
2778   if (s) {
2779     if (strcmp (s, "progressive") == 0) {
2780       context->field_order = AV_FIELD_PROGRESSIVE;
2781     } else if (strcmp (s, "interleaved") == 0) {
2782       s = gst_structure_get_string (structure, "field-order");
2783       if (s) {
2784         if (strcmp (s, "top-field-first") == 0) {
2785           context->field_order = AV_FIELD_TT;
2786         } else if (strcmp (s, "bottom-field-first") == 0) {
2787           context->field_order = AV_FIELD_TB;
2788         }
2789       }
2790     }
2791   }
2792 }
2793
2794 typedef struct
2795 {
2796   GstVideoFormat format;
2797   enum AVPixelFormat pixfmt;
2798 } PixToFmt;
2799
2800 /* FIXME : FILLME */
2801 static const PixToFmt pixtofmttable[] = {
2802   /* GST_VIDEO_FORMAT_I420, */
2803   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUV420P},
2804   /* Note : this should use a different chroma placement */
2805   {GST_VIDEO_FORMAT_I420, AV_PIX_FMT_YUVJ420P},
2806
2807   /* GST_VIDEO_FORMAT_YV12, */
2808   /* GST_VIDEO_FORMAT_YUY2, */
2809   {GST_VIDEO_FORMAT_YUY2, AV_PIX_FMT_YUYV422},
2810   /* GST_VIDEO_FORMAT_UYVY, */
2811   {GST_VIDEO_FORMAT_UYVY, AV_PIX_FMT_UYVY422},
2812   /* GST_VIDEO_FORMAT_AYUV, */
2813   /* GST_VIDEO_FORMAT_RGBx, */
2814   {GST_VIDEO_FORMAT_RGBx, AV_PIX_FMT_RGB0},
2815   /* GST_VIDEO_FORMAT_BGRx, */
2816   {GST_VIDEO_FORMAT_BGRx, AV_PIX_FMT_BGR0},
2817   /* GST_VIDEO_FORMAT_xRGB, */
2818   {GST_VIDEO_FORMAT_xRGB, AV_PIX_FMT_0RGB},
2819   /* GST_VIDEO_FORMAT_xBGR, */
2820   {GST_VIDEO_FORMAT_xBGR, AV_PIX_FMT_0BGR},
2821   /* GST_VIDEO_FORMAT_RGBA, */
2822   {GST_VIDEO_FORMAT_RGBA, AV_PIX_FMT_RGBA},
2823   /* GST_VIDEO_FORMAT_BGRA, */
2824   {GST_VIDEO_FORMAT_BGRA, AV_PIX_FMT_BGRA},
2825   /* GST_VIDEO_FORMAT_ARGB, */
2826   {GST_VIDEO_FORMAT_ARGB, AV_PIX_FMT_ARGB},
2827   /* GST_VIDEO_FORMAT_ABGR, */
2828   {GST_VIDEO_FORMAT_ABGR, AV_PIX_FMT_ABGR},
2829   /* GST_VIDEO_FORMAT_RGB, */
2830   {GST_VIDEO_FORMAT_RGB, AV_PIX_FMT_RGB24},
2831   /* GST_VIDEO_FORMAT_BGR, */
2832   {GST_VIDEO_FORMAT_BGR, AV_PIX_FMT_BGR24},
2833   /* GST_VIDEO_FORMAT_Y41B, */
2834   {GST_VIDEO_FORMAT_Y41B, AV_PIX_FMT_YUV411P},
2835   /* GST_VIDEO_FORMAT_Y42B, */
2836   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUV422P},
2837   {GST_VIDEO_FORMAT_Y42B, AV_PIX_FMT_YUVJ422P},
2838   /* GST_VIDEO_FORMAT_YVYU, */
2839   /* GST_VIDEO_FORMAT_Y444, */
2840   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUV444P},
2841   {GST_VIDEO_FORMAT_Y444, AV_PIX_FMT_YUVJ444P},
2842   /* GST_VIDEO_FORMAT_v210, */
2843   /* GST_VIDEO_FORMAT_v216, */
2844   /* GST_VIDEO_FORMAT_NV12, */
2845   {GST_VIDEO_FORMAT_NV12, AV_PIX_FMT_NV12},
2846   /* GST_VIDEO_FORMAT_NV21, */
2847   {GST_VIDEO_FORMAT_NV21, AV_PIX_FMT_NV21},
2848   /* GST_VIDEO_FORMAT_GRAY8, */
2849   {GST_VIDEO_FORMAT_GRAY8, AV_PIX_FMT_GRAY8},
2850   /* GST_VIDEO_FORMAT_GRAY16_BE, */
2851   {GST_VIDEO_FORMAT_GRAY16_BE, AV_PIX_FMT_GRAY16BE},
2852   /* GST_VIDEO_FORMAT_GRAY16_LE, */
2853   {GST_VIDEO_FORMAT_GRAY16_LE, AV_PIX_FMT_GRAY16LE},
2854   /* GST_VIDEO_FORMAT_v308, */
2855   /* GST_VIDEO_FORMAT_Y800, */
2856   /* GST_VIDEO_FORMAT_Y16, */
2857   /* GST_VIDEO_FORMAT_RGB16, */
2858   {GST_VIDEO_FORMAT_RGB16, AV_PIX_FMT_RGB565},
2859   /* GST_VIDEO_FORMAT_BGR16, */
2860   /* GST_VIDEO_FORMAT_RGB15, */
2861   {GST_VIDEO_FORMAT_RGB15, AV_PIX_FMT_RGB555},
2862   /* GST_VIDEO_FORMAT_BGR15, */
2863   /* GST_VIDEO_FORMAT_UYVP, */
2864   /* GST_VIDEO_FORMAT_A420, */
2865   {GST_VIDEO_FORMAT_A420, AV_PIX_FMT_YUVA420P},
2866   /* GST_VIDEO_FORMAT_RGB8_PALETTED, */
2867   {GST_VIDEO_FORMAT_RGB8P, AV_PIX_FMT_PAL8},
2868   /* GST_VIDEO_FORMAT_YUV9, */
2869   {GST_VIDEO_FORMAT_YUV9, AV_PIX_FMT_YUV410P},
2870   /* GST_VIDEO_FORMAT_YVU9, */
2871   /* GST_VIDEO_FORMAT_IYU1, */
2872   /* GST_VIDEO_FORMAT_ARGB64, */
2873   /* GST_VIDEO_FORMAT_AYUV64, */
2874   /* GST_VIDEO_FORMAT_r210, */
2875   {GST_VIDEO_FORMAT_I420_10LE, AV_PIX_FMT_YUV420P10LE},
2876   {GST_VIDEO_FORMAT_I420_10BE, AV_PIX_FMT_YUV420P10BE},
2877   {GST_VIDEO_FORMAT_I422_10LE, AV_PIX_FMT_YUV422P10LE},
2878   {GST_VIDEO_FORMAT_I422_10BE, AV_PIX_FMT_YUV422P10BE},
2879   {GST_VIDEO_FORMAT_Y444_10LE, AV_PIX_FMT_YUV444P10LE},
2880   {GST_VIDEO_FORMAT_Y444_10BE, AV_PIX_FMT_YUV444P10BE},
2881   {GST_VIDEO_FORMAT_GBR, AV_PIX_FMT_GBRP},
2882   {GST_VIDEO_FORMAT_GBRA, AV_PIX_FMT_GBRAP},
2883   {GST_VIDEO_FORMAT_GBR_10LE, AV_PIX_FMT_GBRP10LE},
2884   {GST_VIDEO_FORMAT_GBR_10BE, AV_PIX_FMT_GBRP10BE},
2885   {GST_VIDEO_FORMAT_GBRA_10LE, AV_PIX_FMT_GBRAP10LE},
2886   {GST_VIDEO_FORMAT_GBRA_10BE, AV_PIX_FMT_GBRAP10BE},
2887   {GST_VIDEO_FORMAT_GBR_12LE, AV_PIX_FMT_GBRP12LE},
2888   {GST_VIDEO_FORMAT_GBR_12BE, AV_PIX_FMT_GBRP12BE},
2889   {GST_VIDEO_FORMAT_GBRA_12LE, AV_PIX_FMT_GBRAP12LE},
2890   {GST_VIDEO_FORMAT_GBRA_12BE, AV_PIX_FMT_GBRAP12BE},
2891   {GST_VIDEO_FORMAT_A420_10LE, AV_PIX_FMT_YUVA420P10LE},
2892   {GST_VIDEO_FORMAT_A420_10BE, AV_PIX_FMT_YUVA420P10BE},
2893   {GST_VIDEO_FORMAT_A422_10LE, AV_PIX_FMT_YUVA422P10LE},
2894   {GST_VIDEO_FORMAT_A422_10BE, AV_PIX_FMT_YUVA422P10BE},
2895   {GST_VIDEO_FORMAT_A444_10LE, AV_PIX_FMT_YUVA444P10LE},
2896   {GST_VIDEO_FORMAT_A444_10BE, AV_PIX_FMT_YUVA444P10BE},
2897   {GST_VIDEO_FORMAT_I420_12LE, AV_PIX_FMT_YUV420P12LE},
2898   {GST_VIDEO_FORMAT_I420_12BE, AV_PIX_FMT_YUV420P12BE},
2899   {GST_VIDEO_FORMAT_I422_12LE, AV_PIX_FMT_YUV422P12LE},
2900   {GST_VIDEO_FORMAT_I422_12BE, AV_PIX_FMT_YUV422P12BE},
2901   {GST_VIDEO_FORMAT_Y444_12LE, AV_PIX_FMT_YUV444P12LE},
2902   {GST_VIDEO_FORMAT_Y444_12BE, AV_PIX_FMT_YUV444P12BE},
2903 };
2904
2905 GstVideoFormat
2906 gst_ffmpeg_pixfmt_to_videoformat (enum AVPixelFormat pixfmt)
2907 {
2908   guint i;
2909
2910   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++)
2911     if (pixtofmttable[i].pixfmt == pixfmt)
2912       return pixtofmttable[i].format;
2913
2914   GST_DEBUG ("Unknown pixel format %d", pixfmt);
2915   return GST_VIDEO_FORMAT_UNKNOWN;
2916 }
2917
2918 static enum AVPixelFormat
2919 gst_ffmpeg_videoformat_to_pixfmt_for_codec (GstVideoFormat format,
2920     const AVCodec * codec)
2921 {
2922   guint i;
2923
2924   for (i = 0; i < G_N_ELEMENTS (pixtofmttable); i++) {
2925     if (pixtofmttable[i].format == format) {
2926       gint j;
2927
2928       if (codec && codec->pix_fmts) {
2929         for (j = 0; codec->pix_fmts[j] != -1; j++) {
2930           if (pixtofmttable[i].pixfmt == codec->pix_fmts[j])
2931             return pixtofmttable[i].pixfmt;
2932         }
2933       } else {
2934         return pixtofmttable[i].pixfmt;
2935       }
2936     }
2937   }
2938
2939   return AV_PIX_FMT_NONE;
2940 }
2941
2942 enum AVPixelFormat
2943 gst_ffmpeg_videoformat_to_pixfmt (GstVideoFormat format)
2944 {
2945   return gst_ffmpeg_videoformat_to_pixfmt_for_codec (format, NULL);
2946 }
2947
2948 void
2949 gst_ffmpeg_videoinfo_to_context (GstVideoInfo * info, AVCodecContext * context)
2950 {
2951   gint i, bpp = 0;
2952
2953   context->width = GST_VIDEO_INFO_WIDTH (info);
2954   context->height = GST_VIDEO_INFO_HEIGHT (info);
2955   for (i = 0; i < GST_VIDEO_INFO_N_COMPONENTS (info); i++)
2956     bpp += GST_VIDEO_INFO_COMP_DEPTH (info, i);
2957   context->bits_per_coded_sample = bpp;
2958
2959   context->ticks_per_frame = 1;
2960   if (GST_VIDEO_INFO_FPS_N (info) == 0) {
2961     GST_DEBUG ("Using 25/1 framerate");
2962     context->time_base.den = 25;
2963     context->time_base.num = 1;
2964   } else {
2965     context->time_base.den = GST_VIDEO_INFO_FPS_N (info);
2966     context->time_base.num = GST_VIDEO_INFO_FPS_D (info);
2967   }
2968
2969   context->sample_aspect_ratio.num = GST_VIDEO_INFO_PAR_N (info);
2970   context->sample_aspect_ratio.den = GST_VIDEO_INFO_PAR_D (info);
2971
2972   context->pix_fmt =
2973       gst_ffmpeg_videoformat_to_pixfmt_for_codec (GST_VIDEO_INFO_FORMAT (info),
2974       context->codec);
2975
2976   switch (info->chroma_site) {
2977     case GST_VIDEO_CHROMA_SITE_MPEG2:
2978       context->chroma_sample_location = AVCHROMA_LOC_LEFT;
2979       break;
2980     case GST_VIDEO_CHROMA_SITE_JPEG:
2981       context->chroma_sample_location = AVCHROMA_LOC_CENTER;
2982       break;
2983     case GST_VIDEO_CHROMA_SITE_DV:
2984       context->chroma_sample_location = AVCHROMA_LOC_TOPLEFT;
2985       break;
2986     case GST_VIDEO_CHROMA_SITE_V_COSITED:
2987       context->chroma_sample_location = AVCHROMA_LOC_TOP;
2988       break;
2989     default:
2990       break;
2991   }
2992
2993   context->color_primaries =
2994       gst_video_color_primaries_to_iso (info->colorimetry.primaries);
2995   context->color_trc =
2996       gst_video_transfer_function_to_iso (info->colorimetry.transfer);
2997   context->colorspace =
2998       gst_video_color_matrix_to_iso (info->colorimetry.matrix);
2999
3000   if (info->colorimetry.range == GST_VIDEO_COLOR_RANGE_0_255) {
3001     context->color_range = AVCOL_RANGE_JPEG;
3002   } else {
3003     context->color_range = AVCOL_RANGE_MPEG;
3004     context->strict_std_compliance = FF_COMPLIANCE_UNOFFICIAL;
3005   }
3006 }
3007
3008 void
3009 gst_ffmpeg_audioinfo_to_context (GstAudioInfo * info, AVCodecContext * context)
3010 {
3011   const AVCodec *codec;
3012   const enum AVSampleFormat *smpl_fmts;
3013   enum AVSampleFormat smpl_fmt = -1;
3014
3015   context->channels = info->channels;
3016   context->sample_rate = info->rate;
3017   context->channel_layout =
3018       gst_ffmpeg_channel_positions_to_layout (info->position, info->channels);
3019
3020   codec = context->codec;
3021
3022   smpl_fmts = codec->sample_fmts;
3023
3024   switch (info->finfo->format) {
3025     case GST_AUDIO_FORMAT_F32:
3026       if (smpl_fmts) {
3027         while (*smpl_fmts != -1) {
3028           if (*smpl_fmts == AV_SAMPLE_FMT_FLT) {
3029             smpl_fmt = *smpl_fmts;
3030             break;
3031           } else if (*smpl_fmts == AV_SAMPLE_FMT_FLTP) {
3032             smpl_fmt = *smpl_fmts;
3033           }
3034
3035           smpl_fmts++;
3036         }
3037       } else {
3038         smpl_fmt = AV_SAMPLE_FMT_FLT;
3039       }
3040       break;
3041     case GST_AUDIO_FORMAT_F64:
3042       if (smpl_fmts) {
3043         while (*smpl_fmts != -1) {
3044           if (*smpl_fmts == AV_SAMPLE_FMT_DBL) {
3045             smpl_fmt = *smpl_fmts;
3046             break;
3047           } else if (*smpl_fmts == AV_SAMPLE_FMT_DBLP) {
3048             smpl_fmt = *smpl_fmts;
3049           }
3050
3051           smpl_fmts++;
3052         }
3053       } else {
3054         smpl_fmt = AV_SAMPLE_FMT_DBL;
3055       }
3056       break;
3057     case GST_AUDIO_FORMAT_S32:
3058       if (smpl_fmts) {
3059         while (*smpl_fmts != -1) {
3060           if (*smpl_fmts == AV_SAMPLE_FMT_S32) {
3061             smpl_fmt = *smpl_fmts;
3062             break;
3063           } else if (*smpl_fmts == AV_SAMPLE_FMT_S32P) {
3064             smpl_fmt = *smpl_fmts;
3065           }
3066
3067           smpl_fmts++;
3068         }
3069       } else {
3070         smpl_fmt = AV_SAMPLE_FMT_S32;
3071       }
3072       break;
3073     case GST_AUDIO_FORMAT_S16:
3074       if (smpl_fmts) {
3075         while (*smpl_fmts != -1) {
3076           if (*smpl_fmts == AV_SAMPLE_FMT_S16) {
3077             smpl_fmt = *smpl_fmts;
3078             break;
3079           } else if (*smpl_fmts == AV_SAMPLE_FMT_S16P) {
3080             smpl_fmt = *smpl_fmts;
3081           }
3082
3083           smpl_fmts++;
3084         }
3085       } else {
3086         smpl_fmt = AV_SAMPLE_FMT_S16;
3087       }
3088       break;
3089     case GST_AUDIO_FORMAT_U8:
3090       if (smpl_fmts) {
3091         while (*smpl_fmts != -1) {
3092           if (*smpl_fmts == AV_SAMPLE_FMT_U8) {
3093             smpl_fmt = *smpl_fmts;
3094             break;
3095           } else if (*smpl_fmts == AV_SAMPLE_FMT_U8P) {
3096             smpl_fmt = *smpl_fmts;
3097           }
3098
3099           smpl_fmts++;
3100         }
3101       } else {
3102         smpl_fmt = AV_SAMPLE_FMT_U8;
3103       }
3104       break;
3105     default:
3106       break;
3107   }
3108
3109   g_assert (smpl_fmt != -1);
3110
3111   context->sample_fmt = smpl_fmt;
3112 }
3113
3114 /* Convert a GstCaps and a FFMPEG codec Type to a
3115  * AVCodecContext. If the context is ommitted, no fixed values
3116  * for video/audio size will be included in the context
3117  *
3118  * AVMediaType is primarily meant for uncompressed data GstCaps!
3119  */
3120
3121 void
3122 gst_ffmpeg_caps_with_codectype (enum AVMediaType type,
3123     const GstCaps * caps, AVCodecContext * context)
3124 {
3125   if (context == NULL)
3126     return;
3127
3128   switch (type) {
3129     case AVMEDIA_TYPE_VIDEO:
3130       gst_ffmpeg_caps_to_pixfmt (caps, context, TRUE);
3131       break;
3132
3133     case AVMEDIA_TYPE_AUDIO:
3134       gst_ffmpeg_caps_to_smpfmt (caps, context, TRUE);
3135       break;
3136
3137     default:
3138       /* unknown */
3139       break;
3140   }
3141 }
3142
3143 #if 0
3144 static void
3145 nal_escape (guint8 * dst, guint8 * src, guint size, guint * destsize)
3146 {
3147   guint8 *dstp = dst;
3148   guint8 *srcp = src;
3149   guint8 *end = src + size;
3150   gint count = 0;
3151
3152   while (srcp < end) {
3153     if (count == 2 && *srcp <= 0x03) {
3154       GST_DEBUG ("added escape code");
3155       *dstp++ = 0x03;
3156       count = 0;
3157     }
3158     if (*srcp == 0)
3159       count++;
3160     else
3161       count = 0;
3162
3163     GST_DEBUG ("copy %02x, count %d", *srcp, count);
3164     *dstp++ = *srcp++;
3165   }
3166   *destsize = dstp - dst;
3167 }
3168
3169 /* copy the config, escaping NAL units as we iterate them, if something fails we
3170  * copy everything and hope for the best. */
3171 static void
3172 copy_config (guint8 * dst, guint8 * src, guint size, guint * destsize)
3173 {
3174   guint8 *dstp = dst;
3175   guint8 *srcp = src;
3176   gint cnt, i;
3177   guint nalsize, esize;
3178
3179   /* check size */
3180   if (size < 7)
3181     goto full_copy;
3182
3183   /* check version */
3184   if (*srcp != 1)
3185     goto full_copy;
3186
3187   cnt = *(srcp + 5) & 0x1f;     /* Number of sps */
3188
3189   GST_DEBUG ("num SPS %d", cnt);
3190
3191   memcpy (dstp, srcp, 6);
3192   srcp += 6;
3193   dstp += 6;
3194
3195   for (i = 0; i < cnt; i++) {
3196     GST_DEBUG ("copy SPS %d", i);
3197     nalsize = (srcp[0] << 8) | srcp[1];
3198     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3199     dstp[0] = esize >> 8;
3200     dstp[1] = esize & 0xff;
3201     dstp += esize + 2;
3202     srcp += nalsize + 2;
3203   }
3204
3205   cnt = *(dstp++) = *(srcp++);  /* Number of pps */
3206
3207   GST_DEBUG ("num PPS %d", cnt);
3208
3209   for (i = 0; i < cnt; i++) {
3210     GST_DEBUG ("copy PPS %d", i);
3211     nalsize = (srcp[0] << 8) | srcp[1];
3212     nal_escape (dstp + 2, srcp + 2, nalsize, &esize);
3213     dstp[0] = esize >> 8;
3214     dstp[1] = esize & 0xff;
3215     dstp += esize + 2;
3216     srcp += nalsize + 2;
3217   }
3218   *destsize = dstp - dst;
3219
3220   return;
3221
3222 full_copy:
3223   {
3224     GST_DEBUG ("something unexpected, doing full copy");
3225     memcpy (dst, src, size);
3226     *destsize = size;
3227     return;
3228   }
3229 }
3230 #endif
3231
3232 /*
3233  * caps_with_codecid () transforms a GstCaps for a known codec
3234  * ID into a filled-in context.
3235  * codec_data from caps will override possible extradata already in the context
3236  */
3237
3238 void
3239 gst_ffmpeg_caps_with_codecid (enum AVCodecID codec_id,
3240     enum AVMediaType codec_type, const GstCaps * caps, AVCodecContext * context)
3241 {
3242   GstStructure *str;
3243   const GValue *value;
3244   GstBuffer *buf;
3245
3246   GST_LOG ("codec_id:%d, codec_type:%d, caps:%" GST_PTR_FORMAT " context:%p",
3247       codec_id, codec_type, caps, context);
3248
3249   if (!context || !gst_caps_get_size (caps))
3250     return;
3251
3252   str = gst_caps_get_structure (caps, 0);
3253
3254   /* extradata parsing (esds [mpeg4], wma/wmv, msmpeg4v1/2/3, etc.) */
3255   if ((value = gst_structure_get_value (str, "codec_data"))) {
3256     GstMapInfo map;
3257
3258     buf = gst_value_get_buffer (value);
3259     gst_buffer_map (buf, &map, GST_MAP_READ);
3260
3261     /* free the old one if it is there */
3262     if (context->extradata)
3263       av_free (context->extradata);
3264
3265 #if 0
3266     if (codec_id == AV_CODEC_ID_H264) {
3267       guint extrasize;
3268
3269       GST_DEBUG ("copy, escaping codec_data %d", size);
3270       /* ffmpeg h264 expects the codec_data to be escaped, there is no real
3271        * reason for this but let's just escape it for now. Start by allocating
3272        * enough space, x2 is more than enough.
3273        *
3274        * FIXME, we disabled escaping because some file already contain escaped
3275        * codec_data and then we escape twice and fail. It's better to leave it
3276        * as is, as that is what most players do. */
3277       context->extradata =
3278           av_mallocz (GST_ROUND_UP_16 (size * 2 +
3279               AV_INPUT_BUFFER_PADDING_SIZE));
3280       copy_config (context->extradata, data, size, &extrasize);
3281       GST_DEBUG ("escaped size: %d", extrasize);
3282       context->extradata_size = extrasize;
3283     } else
3284 #endif
3285     {
3286       /* allocate with enough padding */
3287       GST_DEBUG ("copy codec_data");
3288       context->extradata =
3289           av_mallocz (GST_ROUND_UP_16 (map.size +
3290               AV_INPUT_BUFFER_PADDING_SIZE));
3291       memcpy (context->extradata, map.data, map.size);
3292       context->extradata_size = map.size;
3293     }
3294
3295     /* Hack for VC1. Sometimes the first (length) byte is 0 for some files */
3296     if (codec_id == AV_CODEC_ID_VC1 && map.size > 0 && map.data[0] == 0) {
3297       context->extradata[0] = (guint8) map.size;
3298     }
3299
3300     GST_DEBUG ("have codec data of size %" G_GSIZE_FORMAT, map.size);
3301
3302     gst_buffer_unmap (buf, &map);
3303   } else {
3304     context->extradata = NULL;
3305     context->extradata_size = 0;
3306     GST_DEBUG ("no codec data");
3307   }
3308
3309   switch (codec_id) {
3310     case AV_CODEC_ID_MPEG4:
3311     {
3312       const gchar *mime = gst_structure_get_name (str);
3313
3314       context->flags |= AV_CODEC_FLAG_4MV;
3315
3316       if (!strcmp (mime, "video/x-divx"))
3317         context->codec_tag = GST_MAKE_FOURCC ('D', 'I', 'V', 'X');
3318       else if (!strcmp (mime, "video/mpeg")) {
3319         const gchar *profile;
3320
3321         context->codec_tag = GST_MAKE_FOURCC ('m', 'p', '4', 'v');
3322
3323         profile = gst_structure_get_string (str, "profile");
3324         if (profile) {
3325           if (g_strcmp0 (profile, "advanced-simple") == 0)
3326             context->flags |= AV_CODEC_FLAG_QPEL;
3327         }
3328       }
3329       break;
3330     }
3331
3332     case AV_CODEC_ID_SVQ3:
3333       /* FIXME: this is a workaround for older gst-plugins releases
3334        * (<= 0.8.9). This should be removed at some point, because
3335        * it causes wrong decoded frame order. */
3336       if (!context->extradata) {
3337         gint halfpel_flag, thirdpel_flag, low_delay, unknown_svq3_flag;
3338         guint16 flags;
3339
3340         if (gst_structure_get_int (str, "halfpel_flag", &halfpel_flag) &&
3341             gst_structure_get_int (str, "thirdpel_flag", &thirdpel_flag) &&
3342             gst_structure_get_int (str, "low_delay", &low_delay) &&
3343             gst_structure_get_int (str, "unknown_svq3_flag",
3344                 &unknown_svq3_flag)) {
3345           context->extradata = (guint8 *) av_mallocz (0x64);
3346           g_stpcpy ((gchar *) context->extradata, "SVQ3");
3347           flags = 1 << 3;
3348           flags |= low_delay;
3349           flags = flags << 2;
3350           flags |= unknown_svq3_flag;
3351           flags = flags << 6;
3352           flags |= halfpel_flag;
3353           flags = flags << 1;
3354           flags |= thirdpel_flag;
3355           flags = flags << 3;
3356
3357           flags = GUINT16_FROM_LE (flags);
3358
3359           memcpy ((gchar *) context->extradata + 0x62, &flags, 2);
3360           context->extradata_size = 0x64;
3361         }
3362       }
3363       break;
3364
3365     case AV_CODEC_ID_MSRLE:
3366     case AV_CODEC_ID_QTRLE:
3367     case AV_CODEC_ID_TSCC:
3368     case AV_CODEC_ID_CSCD:
3369     case AV_CODEC_ID_APE:
3370     {
3371       gint depth;
3372
3373       if (gst_structure_get_int (str, "depth", &depth)) {
3374         context->bits_per_coded_sample = depth;
3375       } else {
3376         GST_WARNING ("No depth field in caps %" GST_PTR_FORMAT, caps);
3377       }
3378
3379     }
3380       break;
3381
3382     case AV_CODEC_ID_COOK:
3383     case AV_CODEC_ID_RA_288:
3384     case AV_CODEC_ID_RA_144:
3385     case AV_CODEC_ID_SIPR:
3386     {
3387       gint leaf_size;
3388       gint bitrate;
3389
3390       if (gst_structure_get_int (str, "leaf_size", &leaf_size))
3391         context->block_align = leaf_size;
3392       if (gst_structure_get_int (str, "bitrate", &bitrate))
3393         context->bit_rate = bitrate;
3394     }
3395       break;
3396     case AV_CODEC_ID_ALAC:
3397       gst_structure_get_int (str, "samplesize",
3398           &context->bits_per_coded_sample);
3399       break;
3400
3401     case AV_CODEC_ID_DVVIDEO:
3402     {
3403       const gchar *format;
3404
3405       if ((format = gst_structure_get_string (str, "format"))) {
3406
3407         if (g_str_equal (format, "YUY2"))
3408           context->pix_fmt = AV_PIX_FMT_YUYV422;
3409         else if (g_str_equal (format, "I420"))
3410           context->pix_fmt = AV_PIX_FMT_YUV420P;
3411         else if (g_str_equal (format, "A420"))
3412           context->pix_fmt = AV_PIX_FMT_YUVA420P;
3413         else if (g_str_equal (format, "Y41B"))
3414           context->pix_fmt = AV_PIX_FMT_YUV411P;
3415         else if (g_str_equal (format, "Y42B"))
3416           context->pix_fmt = AV_PIX_FMT_YUV422P;
3417         else if (g_str_equal (format, "YUV9"))
3418           context->pix_fmt = AV_PIX_FMT_YUV410P;
3419         else {
3420           GST_WARNING ("couldn't convert format %s" " to a pixel format",
3421               format);
3422         }
3423       } else
3424         GST_WARNING ("No specified format");
3425       break;
3426     }
3427     case AV_CODEC_ID_H263P:
3428     {
3429       gboolean val;
3430
3431       if (!gst_structure_get_boolean (str, "annex-f", &val) || val)
3432         context->flags |= AV_CODEC_FLAG_4MV;
3433       else
3434         context->flags &= ~AV_CODEC_FLAG_4MV;
3435       if ((!gst_structure_get_boolean (str, "annex-i", &val) || val) &&
3436           (!gst_structure_get_boolean (str, "annex-t", &val) || val))
3437         context->flags |= AV_CODEC_FLAG_AC_PRED;
3438       else
3439         context->flags &= ~AV_CODEC_FLAG_AC_PRED;
3440       if (!gst_structure_get_boolean (str, "annex-j", &val) || val)
3441         context->flags |= AV_CODEC_FLAG_LOOP_FILTER;
3442       else
3443         context->flags &= ~AV_CODEC_FLAG_LOOP_FILTER;
3444       break;
3445     }
3446     case AV_CODEC_ID_ADPCM_G726:
3447     {
3448       const gchar *layout;
3449
3450       if ((layout = gst_structure_get_string (str, "layout"))) {
3451         if (!strcmp (layout, "g721")) {
3452           context->sample_rate = 8000;
3453           context->channels = 1;
3454           context->bit_rate = 32000;
3455         }
3456       }
3457       break;
3458     }
3459     case AV_CODEC_ID_SPEEDHQ:
3460     {
3461       const gchar *variant;
3462
3463       if (context && (variant = gst_structure_get_string (str, "variant"))
3464           && strlen (variant) == 4) {
3465
3466         context->codec_tag =
3467             GST_MAKE_FOURCC (variant[0], variant[1], variant[2], variant[3]);
3468       }
3469       break;
3470     }
3471     default:
3472       break;
3473   }
3474
3475   if (!gst_caps_is_fixed (caps))
3476     return;
3477
3478   /* common properties (width, height, fps) */
3479   switch (codec_type) {
3480     case AVMEDIA_TYPE_VIDEO:
3481       gst_ffmpeg_caps_to_pixfmt (caps, context,
3482           codec_id == AV_CODEC_ID_RAWVIDEO);
3483       break;
3484     case AVMEDIA_TYPE_AUDIO:
3485       gst_ffmpeg_caps_to_smpfmt (caps, context, FALSE);
3486       break;
3487     default:
3488       break;
3489   }
3490
3491   /* fixup of default settings */
3492   switch (codec_id) {
3493     case AV_CODEC_ID_QCELP:
3494       /* QCELP is always mono, no matter what the caps say */
3495       context->channels = 1;
3496       break;
3497     case AV_CODEC_ID_ADPCM_G726:
3498       if (context->sample_rate && context->bit_rate)
3499         context->bits_per_coded_sample =
3500             context->bit_rate / context->sample_rate;
3501       break;
3502     default:
3503       break;
3504   }
3505 }
3506
3507 /* _formatid_to_caps () is meant for muxers/demuxers, it
3508  * transforms a name (ffmpeg way of ID'ing these, why don't
3509  * they have unique numerical IDs?) to the corresponding
3510  * caps belonging to that mux-format
3511  *
3512  * Note: we don't need any additional info because the caps
3513  * isn't supposed to contain any useful info besides the
3514  * media type anyway
3515  */
3516
3517 GstCaps *
3518 gst_ffmpeg_formatid_to_caps (const gchar * format_name)
3519 {
3520   GstCaps *caps = NULL;
3521
3522   if (!strcmp (format_name, "mpeg")) {
3523     caps = gst_caps_new_simple ("video/mpeg",
3524         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3525   } else if (!strcmp (format_name, "mpegts")) {
3526     caps = gst_caps_new_simple ("video/mpegts",
3527         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3528   } else if (!strcmp (format_name, "rm")) {
3529     caps = gst_caps_new_simple ("application/x-pn-realmedia",
3530         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3531   } else if (!strcmp (format_name, "asf")) {
3532     caps = gst_caps_new_empty_simple ("video/x-ms-asf");
3533   } else if (!strcmp (format_name, "avi")) {
3534     caps = gst_caps_new_empty_simple ("video/x-msvideo");
3535   } else if (!strcmp (format_name, "wav")) {
3536     caps = gst_caps_new_empty_simple ("audio/x-wav");
3537   } else if (!strcmp (format_name, "ape")) {
3538     caps = gst_caps_new_empty_simple ("application/x-ape");
3539   } else if (!strcmp (format_name, "swf")) {
3540     caps = gst_caps_new_empty_simple ("application/x-shockwave-flash");
3541   } else if (!strcmp (format_name, "au")) {
3542     caps = gst_caps_new_empty_simple ("audio/x-au");
3543   } else if (!strcmp (format_name, "dv")) {
3544     caps = gst_caps_new_simple ("video/x-dv",
3545         "systemstream", G_TYPE_BOOLEAN, TRUE, NULL);
3546   } else if (!strcmp (format_name, "4xm")) {
3547     caps = gst_caps_new_empty_simple ("video/x-4xm");
3548   } else if (!strcmp (format_name, "matroska")) {
3549     caps = gst_caps_new_empty_simple ("video/x-matroska");
3550   } else if (!strcmp (format_name, "ivf")) {
3551     caps = gst_caps_new_empty_simple ("video/x-ivf");
3552   } else if (!strcmp (format_name, "mp3")) {
3553     caps = gst_caps_new_empty_simple ("application/x-id3");
3554   } else if (!strcmp (format_name, "flic")) {
3555     caps = gst_caps_new_empty_simple ("video/x-fli");
3556   } else if (!strcmp (format_name, "flv")) {
3557     caps = gst_caps_new_empty_simple ("video/x-flv");
3558   } else if (!strcmp (format_name, "tta")) {
3559     caps = gst_caps_new_empty_simple ("audio/x-ttafile");
3560   } else if (!strcmp (format_name, "aiff")) {
3561     caps = gst_caps_new_empty_simple ("audio/x-aiff");
3562   } else if (!strcmp (format_name, "mov_mp4_m4a_3gp_3g2")) {
3563     caps =
3564         gst_caps_from_string
3565         ("application/x-3gp; video/quicktime; audio/x-m4a");
3566   } else if (!strcmp (format_name, "mov")) {
3567     caps = gst_caps_from_string ("video/quicktime,variant=(string)apple");
3568   } else if (!strcmp (format_name, "mp4")) {
3569     caps = gst_caps_from_string ("video/quicktime,variant=(string)iso");
3570   } else if (!strcmp (format_name, "3gp")) {
3571     caps = gst_caps_from_string ("video/quicktime,variant=(string)3gpp");
3572   } else if (!strcmp (format_name, "3g2")) {
3573     caps = gst_caps_from_string ("video/quicktime,variant=(string)3g2");
3574   } else if (!strcmp (format_name, "psp")) {
3575     caps = gst_caps_from_string ("video/quicktime,variant=(string)psp");
3576   } else if (!strcmp (format_name, "ipod")) {
3577     caps = gst_caps_from_string ("video/quicktime,variant=(string)ipod");
3578   } else if (!strcmp (format_name, "aac")) {
3579     caps = gst_caps_new_simple ("audio/mpeg",
3580         "mpegversion", G_TYPE_INT, 4, NULL);
3581   } else if (!strcmp (format_name, "gif")) {
3582     caps = gst_caps_from_string ("image/gif");
3583   } else if (!strcmp (format_name, "ogg")) {
3584     caps = gst_caps_from_string ("application/ogg");
3585   } else if (!strcmp (format_name, "mxf") || !strcmp (format_name, "mxf_d10")) {
3586     caps = gst_caps_from_string ("application/mxf");
3587   } else if (!strcmp (format_name, "gxf")) {
3588     caps = gst_caps_from_string ("application/gxf");
3589   } else if (!strcmp (format_name, "yuv4mpegpipe")) {
3590     caps = gst_caps_new_simple ("application/x-yuv4mpeg",
3591         "y4mversion", G_TYPE_INT, 2, NULL);
3592   } else if (!strcmp (format_name, "mpc")) {
3593     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 7");
3594   } else if (!strcmp (format_name, "mpc8")) {
3595     caps = gst_caps_from_string ("audio/x-musepack, streamversion = (int) 8");
3596   } else if (!strcmp (format_name, "vqf")) {
3597     caps = gst_caps_from_string ("audio/x-vqf");
3598   } else if (!strcmp (format_name, "nsv")) {
3599     caps = gst_caps_from_string ("video/x-nsv");
3600   } else if (!strcmp (format_name, "amr")) {
3601     caps = gst_caps_from_string ("audio/x-amr-nb-sh");
3602   } else if (!strcmp (format_name, "webm")) {
3603     caps = gst_caps_from_string ("video/webm");
3604   } else if (!strcmp (format_name, "voc")) {
3605     caps = gst_caps_from_string ("audio/x-voc");
3606   } else if (!strcmp (format_name, "pva")) {
3607     caps = gst_caps_from_string ("video/x-pva");
3608   } else if (!strcmp (format_name, "brstm")) {
3609     caps = gst_caps_from_string ("audio/x-brstm");
3610   } else if (!strcmp (format_name, "bfstm")) {
3611     caps = gst_caps_from_string ("audio/x-bfstm");
3612   } else {
3613     gchar *name;
3614
3615     GST_LOG ("Could not create stream format caps for %s", format_name);
3616     name = g_strdup_printf ("application/x-gst-av-%s", format_name);
3617     caps = gst_caps_new_empty_simple (name);
3618     g_free (name);
3619   }
3620
3621   return caps;
3622 }
3623
3624 gboolean
3625 gst_ffmpeg_formatid_get_codecids (const gchar * format_name,
3626     enum AVCodecID ** video_codec_list, enum AVCodecID ** audio_codec_list,
3627     AVOutputFormat * plugin)
3628 {
3629   static enum AVCodecID tmp_vlist[] = {
3630     AV_CODEC_ID_NONE,
3631     AV_CODEC_ID_NONE
3632   };
3633   static enum AVCodecID tmp_alist[] = {
3634     AV_CODEC_ID_NONE,
3635     AV_CODEC_ID_NONE
3636   };
3637
3638   GST_LOG ("format_name : %s", format_name);
3639
3640   if (!strcmp (format_name, "mp4")) {
3641     static enum AVCodecID mp4_video_list[] = {
3642       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H264,
3643       AV_CODEC_ID_MJPEG,
3644       AV_CODEC_ID_NONE
3645     };
3646     static enum AVCodecID mp4_audio_list[] = {
3647       AV_CODEC_ID_AAC, AV_CODEC_ID_MP3,
3648       AV_CODEC_ID_NONE
3649     };
3650
3651     *video_codec_list = mp4_video_list;
3652     *audio_codec_list = mp4_audio_list;
3653   } else if (!strcmp (format_name, "mpeg")) {
3654     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3655       AV_CODEC_ID_MPEG2VIDEO,
3656       AV_CODEC_ID_H264,
3657       AV_CODEC_ID_NONE
3658     };
3659     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP1,
3660       AV_CODEC_ID_MP2,
3661       AV_CODEC_ID_MP3,
3662       AV_CODEC_ID_NONE
3663     };
3664
3665     *video_codec_list = mpeg_video_list;
3666     *audio_codec_list = mpeg_audio_list;
3667   } else if (!strcmp (format_name, "dvd")) {
3668     static enum AVCodecID mpeg_video_list[] = { AV_CODEC_ID_MPEG2VIDEO,
3669       AV_CODEC_ID_NONE
3670     };
3671     static enum AVCodecID mpeg_audio_list[] = { AV_CODEC_ID_MP2,
3672       AV_CODEC_ID_AC3,
3673       AV_CODEC_ID_DTS,
3674       AV_CODEC_ID_PCM_S16BE,
3675       AV_CODEC_ID_NONE
3676     };
3677
3678     *video_codec_list = mpeg_video_list;
3679     *audio_codec_list = mpeg_audio_list;
3680   } else if (!strcmp (format_name, "mpegts")) {
3681     static enum AVCodecID mpegts_video_list[] = { AV_CODEC_ID_MPEG1VIDEO,
3682       AV_CODEC_ID_MPEG2VIDEO,
3683       AV_CODEC_ID_H264,
3684       AV_CODEC_ID_NONE
3685     };
3686     static enum AVCodecID mpegts_audio_list[] = { AV_CODEC_ID_MP2,
3687       AV_CODEC_ID_MP3,
3688       AV_CODEC_ID_AC3,
3689       AV_CODEC_ID_DTS,
3690       AV_CODEC_ID_AAC,
3691       AV_CODEC_ID_NONE
3692     };
3693
3694     *video_codec_list = mpegts_video_list;
3695     *audio_codec_list = mpegts_audio_list;
3696   } else if (!strcmp (format_name, "vob")) {
3697     static enum AVCodecID vob_video_list[] =
3698         { AV_CODEC_ID_MPEG2VIDEO, AV_CODEC_ID_NONE };
3699     static enum AVCodecID vob_audio_list[] = { AV_CODEC_ID_MP2, AV_CODEC_ID_AC3,
3700       AV_CODEC_ID_DTS, AV_CODEC_ID_NONE
3701     };
3702
3703     *video_codec_list = vob_video_list;
3704     *audio_codec_list = vob_audio_list;
3705   } else if (!strcmp (format_name, "flv")) {
3706     static enum AVCodecID flv_video_list[] =
3707         { AV_CODEC_ID_FLV1, AV_CODEC_ID_NONE };
3708     static enum AVCodecID flv_audio_list[] =
3709         { AV_CODEC_ID_MP3, AV_CODEC_ID_NONE };
3710
3711     *video_codec_list = flv_video_list;
3712     *audio_codec_list = flv_audio_list;
3713   } else if (!strcmp (format_name, "asf")) {
3714     static enum AVCodecID asf_video_list[] =
3715         { AV_CODEC_ID_WMV1, AV_CODEC_ID_WMV2, AV_CODEC_ID_MSMPEG4V3,
3716       AV_CODEC_ID_NONE
3717     };
3718     static enum AVCodecID asf_audio_list[] =
3719         { AV_CODEC_ID_WMAV1, AV_CODEC_ID_WMAV2, AV_CODEC_ID_MP3,
3720       AV_CODEC_ID_NONE
3721     };
3722
3723     *video_codec_list = asf_video_list;
3724     *audio_codec_list = asf_audio_list;
3725   } else if (!strcmp (format_name, "dv")) {
3726     static enum AVCodecID dv_video_list[] =
3727         { AV_CODEC_ID_DVVIDEO, AV_CODEC_ID_NONE };
3728     static enum AVCodecID dv_audio_list[] =
3729         { AV_CODEC_ID_PCM_S16LE, AV_CODEC_ID_NONE };
3730
3731     *video_codec_list = dv_video_list;
3732     *audio_codec_list = dv_audio_list;
3733   } else if (!strcmp (format_name, "mov")) {
3734     static enum AVCodecID mov_video_list[] = {
3735       AV_CODEC_ID_SVQ1, AV_CODEC_ID_SVQ3, AV_CODEC_ID_MPEG4,
3736       AV_CODEC_ID_H263, AV_CODEC_ID_H263P,
3737       AV_CODEC_ID_H264, AV_CODEC_ID_DVVIDEO,
3738       AV_CODEC_ID_MJPEG,
3739       AV_CODEC_ID_NONE
3740     };
3741     static enum AVCodecID mov_audio_list[] = {
3742       AV_CODEC_ID_PCM_MULAW, AV_CODEC_ID_PCM_ALAW, AV_CODEC_ID_ADPCM_IMA_QT,
3743       AV_CODEC_ID_MACE3, AV_CODEC_ID_MACE6, AV_CODEC_ID_AAC,
3744       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3745       AV_CODEC_ID_PCM_S16BE, AV_CODEC_ID_PCM_S16LE,
3746       AV_CODEC_ID_MP3, AV_CODEC_ID_NONE
3747     };
3748
3749     *video_codec_list = mov_video_list;
3750     *audio_codec_list = mov_audio_list;
3751   } else if ((!strcmp (format_name, "3gp") || !strcmp (format_name, "3g2"))) {
3752     static enum AVCodecID tgp_video_list[] = {
3753       AV_CODEC_ID_MPEG4, AV_CODEC_ID_H263, AV_CODEC_ID_H263P, AV_CODEC_ID_H264,
3754       AV_CODEC_ID_NONE
3755     };
3756     static enum AVCodecID tgp_audio_list[] = {
3757       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3758       AV_CODEC_ID_AAC,
3759       AV_CODEC_ID_NONE
3760     };
3761
3762     *video_codec_list = tgp_video_list;
3763     *audio_codec_list = tgp_audio_list;
3764   } else if (!strcmp (format_name, "mmf")) {
3765     static enum AVCodecID mmf_audio_list[] = {
3766       AV_CODEC_ID_ADPCM_YAMAHA, AV_CODEC_ID_NONE
3767     };
3768     *video_codec_list = NULL;
3769     *audio_codec_list = mmf_audio_list;
3770   } else if (!strcmp (format_name, "amr")) {
3771     static enum AVCodecID amr_audio_list[] = {
3772       AV_CODEC_ID_AMR_NB, AV_CODEC_ID_AMR_WB,
3773       AV_CODEC_ID_NONE
3774     };
3775     *video_codec_list = NULL;
3776     *audio_codec_list = amr_audio_list;
3777   } else if (!strcmp (format_name, "gif")) {
3778     static enum AVCodecID gif_image_list[] = {
3779       AV_CODEC_ID_RAWVIDEO, AV_CODEC_ID_NONE
3780     };
3781     *video_codec_list = gif_image_list;
3782     *audio_codec_list = NULL;
3783   } else if ((!strcmp (format_name, "pva"))) {
3784     static enum AVCodecID pga_video_list[] = {
3785       AV_CODEC_ID_MPEG2VIDEO,
3786       AV_CODEC_ID_NONE
3787     };
3788     static enum AVCodecID pga_audio_list[] = {
3789       AV_CODEC_ID_MP2,
3790       AV_CODEC_ID_NONE
3791     };
3792
3793     *video_codec_list = pga_video_list;
3794     *audio_codec_list = pga_audio_list;
3795   } else if ((!strcmp (format_name, "ivf"))) {
3796     static enum AVCodecID ivf_video_list[] = {
3797       AV_CODEC_ID_VP8,
3798       AV_CODEC_ID_VP9,
3799       AV_CODEC_ID_AV1,
3800       AV_CODEC_ID_NONE
3801     };
3802     static enum AVCodecID ivf_audio_list[] = {
3803       AV_CODEC_ID_NONE
3804     };
3805
3806     *video_codec_list = ivf_video_list;
3807     *audio_codec_list = ivf_audio_list;
3808   } else if ((plugin->audio_codec != AV_CODEC_ID_NONE) ||
3809       (plugin->video_codec != AV_CODEC_ID_NONE)) {
3810     tmp_vlist[0] = plugin->video_codec;
3811     tmp_alist[0] = plugin->audio_codec;
3812
3813     *video_codec_list = tmp_vlist;
3814     *audio_codec_list = tmp_alist;
3815   } else {
3816     GST_LOG ("Format %s not found", format_name);
3817     return FALSE;
3818   }
3819
3820   return TRUE;
3821 }
3822
3823 /* Convert a GstCaps to a FFMPEG codec ID. Size et all
3824  * are omitted, that can be queried by the user itself,
3825  * we're not eating the GstCaps or anything
3826  * A pointer to an allocated context is also needed for
3827  * optional extra info
3828  */
3829
3830 enum AVCodecID
3831 gst_ffmpeg_caps_to_codecid (const GstCaps * caps, AVCodecContext * context)
3832 {
3833   enum AVCodecID id = AV_CODEC_ID_NONE;
3834   const gchar *mimetype;
3835   const GstStructure *structure;
3836   gboolean video = FALSE, audio = FALSE;        /* we want to be sure! */
3837
3838   g_return_val_if_fail (caps != NULL, AV_CODEC_ID_NONE);
3839   g_return_val_if_fail (gst_caps_get_size (caps) == 1, AV_CODEC_ID_NONE);
3840   structure = gst_caps_get_structure (caps, 0);
3841
3842   mimetype = gst_structure_get_name (structure);
3843
3844   if (!strcmp (mimetype, "video/x-raw")) {
3845     id = AV_CODEC_ID_RAWVIDEO;
3846     video = TRUE;
3847   } else if (!strcmp (mimetype, "audio/x-raw")) {
3848     GstAudioInfo info;
3849
3850     if (gst_audio_info_from_caps (&info, caps)) {
3851       switch (GST_AUDIO_INFO_FORMAT (&info)) {
3852         case GST_AUDIO_FORMAT_S8:
3853           id = AV_CODEC_ID_PCM_S8;
3854           break;
3855         case GST_AUDIO_FORMAT_U8:
3856           id = AV_CODEC_ID_PCM_U8;
3857           break;
3858         case GST_AUDIO_FORMAT_S16LE:
3859           id = AV_CODEC_ID_PCM_S16LE;
3860           break;
3861         case GST_AUDIO_FORMAT_S16BE:
3862           id = AV_CODEC_ID_PCM_S16BE;
3863           break;
3864         case GST_AUDIO_FORMAT_U16LE:
3865           id = AV_CODEC_ID_PCM_U16LE;
3866           break;
3867         case GST_AUDIO_FORMAT_U16BE:
3868           id = AV_CODEC_ID_PCM_U16BE;
3869           break;
3870         default:
3871           break;
3872       }
3873       if (id != AV_CODEC_ID_NONE)
3874         audio = TRUE;
3875     }
3876   } else if (!strcmp (mimetype, "audio/x-mulaw")) {
3877     id = AV_CODEC_ID_PCM_MULAW;
3878     audio = TRUE;
3879   } else if (!strcmp (mimetype, "audio/x-alaw")) {
3880     id = AV_CODEC_ID_PCM_ALAW;
3881     audio = TRUE;
3882   } else if (!strcmp (mimetype, "video/x-dv")) {
3883     gboolean sys_strm;
3884
3885     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3886         !sys_strm) {
3887       id = AV_CODEC_ID_DVVIDEO;
3888       video = TRUE;
3889     }
3890   } else if (!strcmp (mimetype, "audio/x-dv")) {        /* ??? */
3891     id = AV_CODEC_ID_DVAUDIO;
3892     audio = TRUE;
3893   } else if (!strcmp (mimetype, "video/x-h263")) {
3894     const gchar *h263version =
3895         gst_structure_get_string (structure, "h263version");
3896     if (h263version && !strcmp (h263version, "h263p"))
3897       id = AV_CODEC_ID_H263P;
3898     else
3899       id = AV_CODEC_ID_H263;
3900     video = TRUE;
3901   } else if (!strcmp (mimetype, "video/x-intel-h263")) {
3902     id = AV_CODEC_ID_H263I;
3903     video = TRUE;
3904   } else if (!strcmp (mimetype, "video/x-h261")) {
3905     id = AV_CODEC_ID_H261;
3906     video = TRUE;
3907   } else if (!strcmp (mimetype, "video/mpeg")) {
3908     gboolean sys_strm;
3909     gint mpegversion;
3910
3911     if (gst_structure_get_boolean (structure, "systemstream", &sys_strm) &&
3912         gst_structure_get_int (structure, "mpegversion", &mpegversion) &&
3913         !sys_strm) {
3914       switch (mpegversion) {
3915         case 1:
3916           id = AV_CODEC_ID_MPEG1VIDEO;
3917           break;
3918         case 2:
3919           id = AV_CODEC_ID_MPEG2VIDEO;
3920           break;
3921         case 4:
3922           id = AV_CODEC_ID_MPEG4;
3923           break;
3924       }
3925     }
3926     if (id != AV_CODEC_ID_NONE)
3927       video = TRUE;
3928   } else if (!strcmp (mimetype, "image/jpeg")) {
3929     id = AV_CODEC_ID_MJPEG;     /* A... B... */
3930     video = TRUE;
3931   } else if (!strcmp (mimetype, "video/x-jpeg-b")) {
3932     id = AV_CODEC_ID_MJPEGB;
3933     video = TRUE;
3934   } else if (!strcmp (mimetype, "video/x-wmv")) {
3935     gint wmvversion = 0;
3936
3937     if (gst_structure_get_int (structure, "wmvversion", &wmvversion)) {
3938       switch (wmvversion) {
3939         case 1:
3940           id = AV_CODEC_ID_WMV1;
3941           break;
3942         case 2:
3943           id = AV_CODEC_ID_WMV2;
3944           break;
3945         case 3:
3946         {
3947           const gchar *format;
3948
3949           /* WMV3 unless the fourcc exists and says otherwise */
3950           id = AV_CODEC_ID_WMV3;
3951
3952           if ((format = gst_structure_get_string (structure, "format")) &&
3953               (g_str_equal (format, "WVC1") || g_str_equal (format, "WMVA")))
3954             id = AV_CODEC_ID_VC1;
3955
3956           break;
3957         }
3958       }
3959     }
3960     if (id != AV_CODEC_ID_NONE)
3961       video = TRUE;
3962   } else if (!strcmp (mimetype, "audio/x-vorbis")) {
3963     id = AV_CODEC_ID_VORBIS;
3964     audio = TRUE;
3965   } else if (!strcmp (mimetype, "audio/x-qdm2")) {
3966     id = AV_CODEC_ID_QDM2;
3967     audio = TRUE;
3968   } else if (!strcmp (mimetype, "audio/mpeg")) {
3969     gint layer = 0;
3970     gint mpegversion = 0;
3971
3972     if (gst_structure_get_int (structure, "mpegversion", &mpegversion)) {
3973       switch (mpegversion) {
3974         case 2:                /* ffmpeg uses faad for both... */
3975         case 4:
3976           id = AV_CODEC_ID_AAC;
3977           break;
3978         case 1:
3979           if (gst_structure_get_int (structure, "layer", &layer)) {
3980             switch (layer) {
3981               case 1:
3982                 id = AV_CODEC_ID_MP1;
3983                 break;
3984               case 2:
3985                 id = AV_CODEC_ID_MP2;
3986                 break;
3987               case 3:
3988                 id = AV_CODEC_ID_MP3;
3989                 break;
3990             }
3991           }
3992       }
3993     }
3994     if (id != AV_CODEC_ID_NONE)
3995       audio = TRUE;
3996   } else if (!strcmp (mimetype, "audio/x-musepack")) {
3997     gint streamversion = -1;
3998
3999     if (gst_structure_get_int (structure, "streamversion", &streamversion)) {
4000       if (streamversion == 7)
4001         id = AV_CODEC_ID_MUSEPACK7;
4002     } else {
4003       id = AV_CODEC_ID_MUSEPACK7;
4004     }
4005   } else if (!strcmp (mimetype, "audio/x-wma")) {
4006     gint wmaversion = 0;
4007
4008     if (gst_structure_get_int (structure, "wmaversion", &wmaversion)) {
4009       switch (wmaversion) {
4010         case 1:
4011           id = AV_CODEC_ID_WMAV1;
4012           break;
4013         case 2:
4014           id = AV_CODEC_ID_WMAV2;
4015           break;
4016         case 3:
4017           id = AV_CODEC_ID_WMAPRO;
4018           break;
4019       }
4020     }
4021     if (id != AV_CODEC_ID_NONE)
4022       audio = TRUE;
4023   } else if (!strcmp (mimetype, "audio/x-xma")) {
4024     gint xmaversion = 0;
4025
4026     if (gst_structure_get_int (structure, "xmaversion", &xmaversion)) {
4027       switch (xmaversion) {
4028         case 1:
4029           id = AV_CODEC_ID_XMA1;
4030           break;
4031         case 2:
4032           id = AV_CODEC_ID_XMA2;
4033           break;
4034       }
4035     }
4036     if (id != AV_CODEC_ID_NONE)
4037       audio = TRUE;
4038   } else if (!strcmp (mimetype, "audio/x-wms")) {
4039     id = AV_CODEC_ID_WMAVOICE;
4040     audio = TRUE;
4041   } else if (!strcmp (mimetype, "audio/x-ac3")) {
4042     id = AV_CODEC_ID_AC3;
4043     audio = TRUE;
4044   } else if (!strcmp (mimetype, "audio/x-eac3")) {
4045     id = AV_CODEC_ID_EAC3;
4046     audio = TRUE;
4047   } else if (!strcmp (mimetype, "audio/x-vnd.sony.atrac3") ||
4048       !strcmp (mimetype, "audio/atrac3")) {
4049     id = AV_CODEC_ID_ATRAC3;
4050     audio = TRUE;
4051   } else if (!strcmp (mimetype, "audio/x-dts")) {
4052     id = AV_CODEC_ID_DTS;
4053     audio = TRUE;
4054   } else if (!strcmp (mimetype, "application/x-ape")) {
4055     id = AV_CODEC_ID_APE;
4056     audio = TRUE;
4057   } else if (!strcmp (mimetype, "video/x-msmpeg")) {
4058     gint msmpegversion = 0;
4059
4060     if (gst_structure_get_int (structure, "msmpegversion", &msmpegversion)) {
4061       switch (msmpegversion) {
4062         case 41:
4063           id = AV_CODEC_ID_MSMPEG4V1;
4064           break;
4065         case 42:
4066           id = AV_CODEC_ID_MSMPEG4V2;
4067           break;
4068         case 43:
4069           id = AV_CODEC_ID_MSMPEG4V3;
4070           break;
4071       }
4072     }
4073     if (id != AV_CODEC_ID_NONE)
4074       video = TRUE;
4075   } else if (!strcmp (mimetype, "video/x-svq")) {
4076     gint svqversion = 0;
4077
4078     if (gst_structure_get_int (structure, "svqversion", &svqversion)) {
4079       switch (svqversion) {
4080         case 1:
4081           id = AV_CODEC_ID_SVQ1;
4082           break;
4083         case 3:
4084           id = AV_CODEC_ID_SVQ3;
4085           break;
4086       }
4087     }
4088     if (id != AV_CODEC_ID_NONE)
4089       video = TRUE;
4090   } else if (!strcmp (mimetype, "video/x-huffyuv")) {
4091     id = AV_CODEC_ID_HUFFYUV;
4092     video = TRUE;
4093   } else if (!strcmp (mimetype, "audio/x-mace")) {
4094     gint maceversion = 0;
4095
4096     if (gst_structure_get_int (structure, "maceversion", &maceversion)) {
4097       switch (maceversion) {
4098         case 3:
4099           id = AV_CODEC_ID_MACE3;
4100           break;
4101         case 6:
4102           id = AV_CODEC_ID_MACE6;
4103           break;
4104       }
4105     }
4106     if (id != AV_CODEC_ID_NONE)
4107       audio = TRUE;
4108   } else if (!strcmp (mimetype, "video/x-theora")) {
4109     id = AV_CODEC_ID_THEORA;
4110     video = TRUE;
4111   } else if (!strcmp (mimetype, "video/x-vp3")) {
4112     id = AV_CODEC_ID_VP3;
4113     video = TRUE;
4114   } else if (!strcmp (mimetype, "video/x-vp5")) {
4115     id = AV_CODEC_ID_VP5;
4116     video = TRUE;
4117   } else if (!strcmp (mimetype, "video/x-vp6")) {
4118     id = AV_CODEC_ID_VP6;
4119     video = TRUE;
4120   } else if (!strcmp (mimetype, "video/x-vp6-flash")) {
4121     id = AV_CODEC_ID_VP6F;
4122     video = TRUE;
4123   } else if (!strcmp (mimetype, "video/x-vp6-alpha")) {
4124     id = AV_CODEC_ID_VP6A;
4125     video = TRUE;
4126   } else if (!strcmp (mimetype, "video/x-vp8")) {
4127     id = AV_CODEC_ID_VP8;
4128     video = TRUE;
4129   } else if (!strcmp (mimetype, "video/x-vp9")) {
4130     id = AV_CODEC_ID_VP9;
4131     video = TRUE;
4132   } else if (!strcmp (mimetype, "video/x-flash-screen")) {
4133     id = AV_CODEC_ID_FLASHSV;
4134     video = TRUE;
4135   } else if (!strcmp (mimetype, "video/x-flash-screen2")) {
4136     id = AV_CODEC_ID_FLASHSV2;
4137     video = TRUE;
4138   } else if (!strcmp (mimetype, "video/x-cineform")) {
4139     id = AV_CODEC_ID_CFHD;
4140     video = TRUE;
4141   } else if (!strcmp (mimetype, "video/x-speedhq")) {
4142     id = AV_CODEC_ID_SPEEDHQ;
4143     video = TRUE;
4144   } else if (!strcmp (mimetype, "video/x-indeo")) {
4145     gint indeoversion = 0;
4146
4147     if (gst_structure_get_int (structure, "indeoversion", &indeoversion)) {
4148       switch (indeoversion) {
4149         case 5:
4150           id = AV_CODEC_ID_INDEO5;
4151           break;
4152         case 4:
4153           id = AV_CODEC_ID_INDEO4;
4154           break;
4155         case 3:
4156           id = AV_CODEC_ID_INDEO3;
4157           break;
4158         case 2:
4159           id = AV_CODEC_ID_INDEO2;
4160           break;
4161       }
4162       if (id != AV_CODEC_ID_NONE)
4163         video = TRUE;
4164     }
4165   } else if (!strcmp (mimetype, "video/x-divx")) {
4166     gint divxversion = 0;
4167
4168     if (gst_structure_get_int (structure, "divxversion", &divxversion)) {
4169       switch (divxversion) {
4170         case 3:
4171           id = AV_CODEC_ID_MSMPEG4V3;
4172           break;
4173         case 4:
4174         case 5:
4175           id = AV_CODEC_ID_MPEG4;
4176           break;
4177       }
4178     }
4179     if (id != AV_CODEC_ID_NONE)
4180       video = TRUE;
4181   } else if (!strcmp (mimetype, "video/x-ffv")) {
4182     gint ffvversion = 0;
4183
4184     if (gst_structure_get_int (structure, "ffvversion", &ffvversion) &&
4185         ffvversion == 1) {
4186       id = AV_CODEC_ID_FFV1;
4187       video = TRUE;
4188     }
4189   } else if (!strcmp (mimetype, "video/x-apple-intermediate-codec")) {
4190     id = AV_CODEC_ID_AIC;
4191     video = TRUE;
4192   } else if (!strcmp (mimetype, "audio/x-adpcm")) {
4193     const gchar *layout;
4194
4195     layout = gst_structure_get_string (structure, "layout");
4196     if (layout == NULL) {
4197       /* break */
4198     } else if (!strcmp (layout, "quicktime")) {
4199       id = AV_CODEC_ID_ADPCM_IMA_QT;
4200     } else if (!strcmp (layout, "microsoft")) {
4201       id = AV_CODEC_ID_ADPCM_MS;
4202     } else if (!strcmp (layout, "dvi")) {
4203       id = AV_CODEC_ID_ADPCM_IMA_WAV;
4204     } else if (!strcmp (layout, "4xm")) {
4205       id = AV_CODEC_ID_ADPCM_4XM;
4206     } else if (!strcmp (layout, "smjpeg")) {
4207       id = AV_CODEC_ID_ADPCM_IMA_SMJPEG;
4208     } else if (!strcmp (layout, "dk3")) {
4209       id = AV_CODEC_ID_ADPCM_IMA_DK3;
4210     } else if (!strcmp (layout, "dk4")) {
4211       id = AV_CODEC_ID_ADPCM_IMA_DK4;
4212     } else if (!strcmp (layout, "oki")) {
4213       id = AV_CODEC_ID_ADPCM_IMA_OKI;
4214     } else if (!strcmp (layout, "westwood")) {
4215       id = AV_CODEC_ID_ADPCM_IMA_WS;
4216     } else if (!strcmp (layout, "iss")) {
4217       id = AV_CODEC_ID_ADPCM_IMA_ISS;
4218     } else if (!strcmp (layout, "xa")) {
4219       id = AV_CODEC_ID_ADPCM_XA;
4220     } else if (!strcmp (layout, "adx")) {
4221       id = AV_CODEC_ID_ADPCM_ADX;
4222     } else if (!strcmp (layout, "ea")) {
4223       id = AV_CODEC_ID_ADPCM_EA;
4224     } else if (!strcmp (layout, "g726")) {
4225       id = AV_CODEC_ID_ADPCM_G726;
4226     } else if (!strcmp (layout, "g721")) {
4227       id = AV_CODEC_ID_ADPCM_G726;
4228     } else if (!strcmp (layout, "ct")) {
4229       id = AV_CODEC_ID_ADPCM_CT;
4230     } else if (!strcmp (layout, "swf")) {
4231       id = AV_CODEC_ID_ADPCM_SWF;
4232     } else if (!strcmp (layout, "yamaha")) {
4233       id = AV_CODEC_ID_ADPCM_YAMAHA;
4234     } else if (!strcmp (layout, "sbpro2")) {
4235       id = AV_CODEC_ID_ADPCM_SBPRO_2;
4236     } else if (!strcmp (layout, "sbpro3")) {
4237       id = AV_CODEC_ID_ADPCM_SBPRO_3;
4238     } else if (!strcmp (layout, "sbpro4")) {
4239       id = AV_CODEC_ID_ADPCM_SBPRO_4;
4240     }
4241     if (id != AV_CODEC_ID_NONE)
4242       audio = TRUE;
4243   } else if (!strcmp (mimetype, "video/x-4xm")) {
4244     id = AV_CODEC_ID_4XM;
4245     video = TRUE;
4246   } else if (!strcmp (mimetype, "audio/x-dpcm")) {
4247     const gchar *layout;
4248
4249     layout = gst_structure_get_string (structure, "layout");
4250     if (!layout) {
4251       /* .. */
4252     } else if (!strcmp (layout, "roq")) {
4253       id = AV_CODEC_ID_ROQ_DPCM;
4254     } else if (!strcmp (layout, "interplay")) {
4255       id = AV_CODEC_ID_INTERPLAY_DPCM;
4256     } else if (!strcmp (layout, "xan")) {
4257       id = AV_CODEC_ID_XAN_DPCM;
4258     } else if (!strcmp (layout, "sol")) {
4259       id = AV_CODEC_ID_SOL_DPCM;
4260     }
4261     if (id != AV_CODEC_ID_NONE)
4262       audio = TRUE;
4263   } else if (!strcmp (mimetype, "audio/x-flac")) {
4264     id = AV_CODEC_ID_FLAC;
4265     audio = TRUE;
4266   } else if (!strcmp (mimetype, "audio/x-shorten")) {
4267     id = AV_CODEC_ID_SHORTEN;
4268     audio = TRUE;
4269   } else if (!strcmp (mimetype, "audio/x-alac")) {
4270     id = AV_CODEC_ID_ALAC;
4271     audio = TRUE;
4272   } else if (!strcmp (mimetype, "video/x-cinepak")) {
4273     id = AV_CODEC_ID_CINEPAK;
4274     video = TRUE;
4275   } else if (!strcmp (mimetype, "video/x-pn-realvideo")) {
4276     gint rmversion;
4277
4278     if (gst_structure_get_int (structure, "rmversion", &rmversion)) {
4279       switch (rmversion) {
4280         case 1:
4281           id = AV_CODEC_ID_RV10;
4282           break;
4283         case 2:
4284           id = AV_CODEC_ID_RV20;
4285           break;
4286         case 3:
4287           id = AV_CODEC_ID_RV30;
4288           break;
4289         case 4:
4290           id = AV_CODEC_ID_RV40;
4291           break;
4292       }
4293     }
4294     if (id != AV_CODEC_ID_NONE)
4295       video = TRUE;
4296   } else if (!strcmp (mimetype, "audio/x-sipro")) {
4297     id = AV_CODEC_ID_SIPR;
4298     audio = TRUE;
4299   } else if (!strcmp (mimetype, "audio/x-pn-realaudio")) {
4300     gint raversion;
4301
4302     if (gst_structure_get_int (structure, "raversion", &raversion)) {
4303       switch (raversion) {
4304         case 1:
4305           id = AV_CODEC_ID_RA_144;
4306           break;
4307         case 2:
4308           id = AV_CODEC_ID_RA_288;
4309           break;
4310         case 8:
4311           id = AV_CODEC_ID_COOK;
4312           break;
4313       }
4314     }
4315     if (id != AV_CODEC_ID_NONE)
4316       audio = TRUE;
4317   } else if (!strcmp (mimetype, "video/x-rle")) {
4318     const gchar *layout;
4319
4320     if ((layout = gst_structure_get_string (structure, "layout"))) {
4321       if (!strcmp (layout, "microsoft")) {
4322         id = AV_CODEC_ID_MSRLE;
4323         video = TRUE;
4324       }
4325     }
4326   } else if (!strcmp (mimetype, "video/x-xan")) {
4327     gint wcversion = 0;
4328
4329     if ((gst_structure_get_int (structure, "wcversion", &wcversion))) {
4330       switch (wcversion) {
4331         case 3:
4332           id = AV_CODEC_ID_XAN_WC3;
4333           video = TRUE;
4334           break;
4335         case 4:
4336           id = AV_CODEC_ID_XAN_WC4;
4337           video = TRUE;
4338           break;
4339         default:
4340           break;
4341       }
4342     }
4343   } else if (!strcmp (mimetype, "audio/AMR")) {
4344     audio = TRUE;
4345     id = AV_CODEC_ID_AMR_NB;
4346   } else if (!strcmp (mimetype, "audio/AMR-WB")) {
4347     id = AV_CODEC_ID_AMR_WB;
4348     audio = TRUE;
4349   } else if (!strcmp (mimetype, "audio/qcelp")) {
4350     id = AV_CODEC_ID_QCELP;
4351     audio = TRUE;
4352   } else if (!strcmp (mimetype, "video/x-h264")) {
4353     id = AV_CODEC_ID_H264;
4354     video = TRUE;
4355   } else if (!strcmp (mimetype, "video/x-h265")) {
4356     id = AV_CODEC_ID_HEVC;
4357     video = TRUE;
4358   } else if (!strcmp (mimetype, "video/x-flash-video")) {
4359     gint flvversion = 0;
4360
4361     if ((gst_structure_get_int (structure, "flvversion", &flvversion))) {
4362       switch (flvversion) {
4363         case 1:
4364           id = AV_CODEC_ID_FLV1;
4365           video = TRUE;
4366           break;
4367         default:
4368           break;
4369       }
4370     }
4371
4372   } else if (!strcmp (mimetype, "audio/x-nellymoser")) {
4373     id = AV_CODEC_ID_NELLYMOSER;
4374     audio = TRUE;
4375   } else if (!strncmp (mimetype, "audio/x-gst-av-", 15)) {
4376     gchar ext[16];
4377     const AVCodec *codec;
4378
4379     if (strlen (mimetype) <= 30 &&
4380         sscanf (mimetype, "audio/x-gst-av-%s", ext) == 1) {
4381       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4382           (codec = avcodec_find_encoder_by_name (ext))) {
4383         id = codec->id;
4384         audio = TRUE;
4385       }
4386     }
4387   } else if (!strncmp (mimetype, "video/x-gst-av-", 15)) {
4388     gchar ext[16];
4389     const AVCodec *codec;
4390
4391     if (strlen (mimetype) <= 30 &&
4392         sscanf (mimetype, "video/x-gst-av-%s", ext) == 1) {
4393       if ((codec = avcodec_find_decoder_by_name (ext)) ||
4394           (codec = avcodec_find_encoder_by_name (ext))) {
4395         id = codec->id;
4396         video = TRUE;
4397       }
4398     }
4399   }
4400
4401   if (context != NULL) {
4402     if (video == TRUE) {
4403       context->codec_type = AVMEDIA_TYPE_VIDEO;
4404     } else if (audio == TRUE) {
4405       context->codec_type = AVMEDIA_TYPE_AUDIO;
4406     } else {
4407       context->codec_type = AVMEDIA_TYPE_UNKNOWN;
4408     }
4409     context->codec_id = id;
4410     gst_ffmpeg_caps_with_codecid (id, context->codec_type, caps, context);
4411   }
4412
4413   if (id != AV_CODEC_ID_NONE) {
4414     GST_DEBUG ("The id=%d belongs to the caps %" GST_PTR_FORMAT, id, caps);
4415   } else {
4416     GST_WARNING ("Couldn't figure out the id for caps %" GST_PTR_FORMAT, caps);
4417   }
4418
4419   return id;
4420 }