mxfdec: add missing break
[platform/upstream/libav.git] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 #include <inttypes.h>
47
48 #include "libavutil/aes.h"
49 #include "libavutil/mathematics.h"
50 #include "libavcodec/bytestream.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a = 1,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72     OPSonyOpt,  /* FATE sample, violates the spec in places */
73 } MXFOP;
74
75 typedef struct {
76     int closed;
77     int complete;
78     MXFPartitionType type;
79     uint64_t previous_partition;
80     int index_sid;
81     int body_sid;
82     int64_t this_partition;
83     int64_t essence_offset;         ///< absolute offset of essence
84     int64_t essence_length;
85     int32_t kag_size;
86     int64_t header_byte_count;
87     int64_t index_byte_count;
88     int pack_length;
89 } MXFPartition;
90
91 typedef struct {
92     UID uid;
93     enum MXFMetadataSetType type;
94     UID source_container_ul;
95 } MXFCryptoContext;
96
97 typedef struct {
98     UID uid;
99     enum MXFMetadataSetType type;
100     UID source_package_uid;
101     UID data_definition_ul;
102     int64_t duration;
103     int64_t start_position;
104     int source_track_id;
105 } MXFStructuralComponent;
106
107 typedef struct {
108     UID uid;
109     enum MXFMetadataSetType type;
110     UID data_definition_ul;
111     UID *structural_components_refs;
112     int structural_components_count;
113     int64_t duration;
114     uint8_t origin;
115 } MXFSequence;
116
117 typedef struct {
118     UID uid;
119     enum MXFMetadataSetType type;
120     MXFSequence *sequence; /* mandatory, and only one */
121     UID sequence_ref;
122     int track_id;
123     uint8_t track_number[4];
124     AVRational edit_rate;
125     int intra_only;
126     uint64_t sample_count;
127     int64_t original_duration; /* st->duration in SampleRate/EditRate units */
128 } MXFTrack;
129
130 typedef struct {
131     UID uid;
132     enum MXFMetadataSetType type;
133     UID essence_container_ul;
134     UID essence_codec_ul;
135     AVRational sample_rate;
136     AVRational aspect_ratio;
137     int width;
138     int height; /* Field height, not frame height */
139     int frame_layout; /* See MXFFrameLayout enum */
140 #define MXF_TFF 1
141 #define MXF_BFF 2
142     int field_dominance;
143     int channels;
144     int bits_per_sample;
145     unsigned int component_depth;
146     unsigned int horiz_subsampling;
147     unsigned int vert_subsampling;
148     UID *sub_descriptors_refs;
149     int sub_descriptors_count;
150     int linked_track_id;
151     uint8_t *extradata;
152     int extradata_size;
153     enum AVPixelFormat pix_fmt;
154 } MXFDescriptor;
155
156 typedef struct {
157     UID uid;
158     enum MXFMetadataSetType type;
159     int edit_unit_byte_count;
160     int index_sid;
161     int body_sid;
162     AVRational index_edit_rate;
163     uint64_t index_start_position;
164     uint64_t index_duration;
165     int8_t *temporal_offset_entries;
166     int *flag_entries;
167     uint64_t *stream_offset_entries;
168     int nb_index_entries;
169 } MXFIndexTableSegment;
170
171 typedef struct {
172     UID uid;
173     enum MXFMetadataSetType type;
174     UID package_uid;
175     UID *tracks_refs;
176     int tracks_count;
177     MXFDescriptor *descriptor; /* only one */
178     UID descriptor_ref;
179 } MXFPackage;
180
181 typedef struct {
182     UID uid;
183     enum MXFMetadataSetType type;
184 } MXFMetadataSet;
185
186 /* decoded index table */
187 typedef struct {
188     int index_sid;
189     int body_sid;
190     int nb_ptses;               /* number of PTSes or total duration of index */
191     int64_t first_dts;          /* DTS = EditUnit + first_dts */
192     int64_t *ptses;             /* maps EditUnit -> PTS */
193     int nb_segments;
194     MXFIndexTableSegment **segments;    /* sorted by IndexStartPosition */
195     AVIndexEntry *fake_index;   /* used for calling ff_index_search_timestamp() */
196 } MXFIndexTable;
197
198 typedef struct {
199     MXFPartition *partitions;
200     unsigned partitions_count;
201     MXFOP op;
202     UID *packages_refs;
203     int packages_count;
204     MXFMetadataSet **metadata_sets;
205     int metadata_sets_count;
206     AVFormatContext *fc;
207     struct AVAES *aesc;
208     uint8_t *local_tags;
209     int local_tags_count;
210     uint64_t last_partition;
211     uint64_t footer_partition;
212     KLVPacket current_klv_data;
213     int current_klv_index;
214     int run_in;
215     MXFPartition *current_partition;
216     int parsing_backward;
217     int64_t last_forward_tell;
218     int last_forward_partition;
219     int current_edit_unit;
220     int nb_index_tables;
221     MXFIndexTable *index_tables;
222     int edit_units_per_packet;      ///< how many edit units to read at a time (PCM, OPAtom)
223 } MXFContext;
224
225 enum MXFWrappingScheme {
226     Frame,
227     Clip,
228 };
229
230 /* NOTE: klv_offset is not set (-1) for local keys */
231 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset);
232
233 typedef struct {
234     const UID key;
235     MXFMetadataReadFunc *read;
236     int ctx_size;
237     enum MXFMetadataSetType type;
238 } MXFMetadataReadTableEntry;
239
240 /* partial keys to match */
241 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
242 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
243 static const uint8_t mxf_avid_essence_element_key[]        = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0e,0x04,0x03,0x01 };
244 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x03,0x01,0x04 };
245 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
246 /* complete keys to match */
247 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
248 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
249 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
250 static const uint8_t mxf_random_index_pack_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x11,0x01,0x00 };
251 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
252
253 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
254
255 static int64_t klv_decode_ber_length(AVIOContext *pb)
256 {
257     uint64_t size = avio_r8(pb);
258     if (size & 0x80) { /* long form */
259         int bytes_num = size & 0x7f;
260         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
261         if (bytes_num > 8)
262             return AVERROR_INVALIDDATA;
263         size = 0;
264         while (bytes_num--)
265             size = size << 8 | avio_r8(pb);
266     }
267     return size;
268 }
269
270 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
271 {
272     int i, b;
273     for (i = 0; i < size && !pb->eof_reached; i++) {
274         b = avio_r8(pb);
275         if (b == key[0])
276             i = 0;
277         else if (b != key[i])
278             i = -1;
279     }
280     return i == size;
281 }
282
283 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
284 {
285     if (!mxf_read_sync(pb, mxf_klv_key, 4))
286         return AVERROR_INVALIDDATA;
287     klv->offset = avio_tell(pb) - 4;
288     memcpy(klv->key, mxf_klv_key, 4);
289     avio_read(pb, klv->key + 4, 12);
290     klv->length = klv_decode_ber_length(pb);
291     return klv->length == -1 ? -1 : 0;
292 }
293
294 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
295 {
296     int i;
297
298     for (i = 0; i < s->nb_streams; i++) {
299         MXFTrack *track = s->streams[i]->priv_data;
300         /* SMPTE 379M 7.3 */
301         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
302             return i;
303     }
304     /* return 0 if only one stream, for OP Atom files with 0 as track number */
305     return s->nb_streams == 1 ? 0 : -1;
306 }
307
308 /* XXX: use AVBitStreamFilter */
309 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
310 {
311     const uint8_t *buf_ptr, *end_ptr;
312     uint8_t *data_ptr;
313     int i;
314
315     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
316         return AVERROR_INVALIDDATA;
317     length = av_get_packet(pb, pkt, length);
318     if (length < 0)
319         return length;
320     data_ptr = pkt->data;
321     end_ptr = pkt->data + length;
322     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
323     for (; end_ptr - buf_ptr >= st->codec->channels * 4; ) {
324         for (i = 0; i < st->codec->channels; i++) {
325             uint32_t sample = bytestream_get_le32(&buf_ptr);
326             if (st->codec->bits_per_coded_sample == 24)
327                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
328             else
329                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
330         }
331         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
332     }
333     av_shrink_packet(pkt, data_ptr - pkt->data);
334     return 0;
335 }
336
337 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
338 {
339     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
340     MXFContext *mxf = s->priv_data;
341     AVIOContext *pb = s->pb;
342     int64_t end = avio_tell(pb) + klv->length;
343     int64_t size;
344     uint64_t orig_size;
345     uint64_t plaintext_size;
346     uint8_t ivec[16];
347     uint8_t tmpbuf[16];
348     int index;
349
350     if (!mxf->aesc && s->key && s->keylen == 16) {
351         mxf->aesc = av_aes_alloc();
352         if (!mxf->aesc)
353             return AVERROR(ENOMEM);
354         av_aes_init(mxf->aesc, s->key, 128, 1);
355     }
356     // crypto context
357     avio_skip(pb, klv_decode_ber_length(pb));
358     // plaintext offset
359     klv_decode_ber_length(pb);
360     plaintext_size = avio_rb64(pb);
361     // source klv key
362     klv_decode_ber_length(pb);
363     avio_read(pb, klv->key, 16);
364     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
365         return AVERROR_INVALIDDATA;
366     index = mxf_get_stream_index(s, klv);
367     if (index < 0)
368         return AVERROR_INVALIDDATA;
369     // source size
370     klv_decode_ber_length(pb);
371     orig_size = avio_rb64(pb);
372     if (orig_size < plaintext_size)
373         return AVERROR_INVALIDDATA;
374     // enc. code
375     size = klv_decode_ber_length(pb);
376     if (size < 32 || size - 32 < orig_size)
377         return AVERROR_INVALIDDATA;
378     avio_read(pb, ivec, 16);
379     avio_read(pb, tmpbuf, 16);
380     if (mxf->aesc)
381         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
382     if (memcmp(tmpbuf, checkv, 16))
383         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
384     size -= 32;
385     size = av_get_packet(pb, pkt, size);
386     if (size < 0)
387         return size;
388     else if (size < plaintext_size)
389         return AVERROR_INVALIDDATA;
390     size -= plaintext_size;
391     if (mxf->aesc)
392         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
393                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
394     av_shrink_packet(pkt, orig_size);
395     pkt->stream_index = index;
396     avio_skip(pb, end - avio_tell(pb));
397     return 0;
398 }
399
400 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
401 {
402     MXFContext *mxf = arg;
403     int item_num = avio_rb32(pb);
404     int item_len = avio_rb32(pb);
405
406     if (item_len != 18) {
407         avpriv_request_sample(pb, "Primer pack item length %d", item_len);
408         return AVERROR_PATCHWELCOME;
409     }
410     if (item_num > UINT_MAX / item_len)
411         return AVERROR_INVALIDDATA;
412     mxf->local_tags_count = item_num;
413     mxf->local_tags = av_malloc(item_num*item_len);
414     if (!mxf->local_tags)
415         return AVERROR(ENOMEM);
416     avio_read(pb, mxf->local_tags, item_num*item_len);
417     return 0;
418 }
419
420 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
421 {
422     MXFContext *mxf = arg;
423     MXFPartition *partition;
424     UID op;
425     uint64_t footer_partition;
426     uint32_t nb_essence_containers;
427     int err;
428
429     if ((err = av_reallocp_array(&mxf->partitions, mxf->partitions_count + 1,
430                                  sizeof(*mxf->partitions))) < 0) {
431         mxf->partitions_count = 0;
432         return err;
433     }
434
435     if (mxf->parsing_backward) {
436         /* insert the new partition pack in the middle
437          * this makes the entries in mxf->partitions sorted by offset */
438         memmove(&mxf->partitions[mxf->last_forward_partition+1],
439                 &mxf->partitions[mxf->last_forward_partition],
440                 (mxf->partitions_count - mxf->last_forward_partition)*sizeof(*mxf->partitions));
441         partition = mxf->current_partition = &mxf->partitions[mxf->last_forward_partition];
442     } else {
443         mxf->last_forward_partition++;
444         partition = mxf->current_partition = &mxf->partitions[mxf->partitions_count];
445     }
446
447     memset(partition, 0, sizeof(*partition));
448     mxf->partitions_count++;
449     partition->pack_length = avio_tell(pb) - klv_offset + size;
450
451     switch(uid[13]) {
452     case 2:
453         partition->type = Header;
454         break;
455     case 3:
456         partition->type = BodyPartition;
457         break;
458     case 4:
459         partition->type = Footer;
460         break;
461     default:
462         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
463         return AVERROR_INVALIDDATA;
464     }
465
466     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
467     partition->closed = partition->type == Footer || !(uid[14] & 1);
468     partition->complete = uid[14] > 2;
469     avio_skip(pb, 4);
470     partition->kag_size = avio_rb32(pb);
471     partition->this_partition = avio_rb64(pb);
472     partition->previous_partition = avio_rb64(pb);
473     footer_partition = avio_rb64(pb);
474     partition->header_byte_count = avio_rb64(pb);
475     partition->index_byte_count = avio_rb64(pb);
476     partition->index_sid = avio_rb32(pb);
477     avio_skip(pb, 8);
478     partition->body_sid = avio_rb32(pb);
479     avio_read(pb, op, sizeof(UID));
480     nb_essence_containers = avio_rb32(pb);
481
482     if (partition->this_partition &&
483         partition->previous_partition == partition->this_partition) {
484         av_log(mxf->fc, AV_LOG_ERROR,
485                "PreviousPartition equal to ThisPartition %"PRIx64"\n",
486                partition->previous_partition);
487         /* override with the actual previous partition offset */
488         if (!mxf->parsing_backward && mxf->last_forward_partition > 1) {
489             MXFPartition *prev =
490                 mxf->partitions + mxf->last_forward_partition - 2;
491             partition->previous_partition = prev->this_partition;
492         }
493         /* if no previous body partition are found point to the header
494          * partition */
495         if (partition->previous_partition == partition->this_partition)
496             partition->previous_partition = 0;
497         av_log(mxf->fc, AV_LOG_ERROR,
498                "Overriding PreviousPartition with %"PRIx64"\n",
499                partition->previous_partition);
500     }
501
502     /* some files don'thave FooterPartition set in every partition */
503     if (footer_partition) {
504         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
505             av_log(mxf->fc, AV_LOG_ERROR,
506                    "inconsistent FooterPartition value: %"PRIu64" != %"PRIu64"\n",
507                    mxf->footer_partition, footer_partition);
508         } else {
509             mxf->footer_partition = footer_partition;
510         }
511     }
512
513     av_dlog(mxf->fc,
514             "PartitionPack: ThisPartition = 0x%"PRIX64
515             ", PreviousPartition = 0x%"PRIX64", "
516             "FooterPartition = 0x%"PRIX64", IndexSID = %i, BodySID = %i\n",
517             partition->this_partition,
518             partition->previous_partition, footer_partition,
519             partition->index_sid, partition->body_sid);
520
521     /* sanity check PreviousPartition if set */
522     if (partition->previous_partition &&
523         mxf->run_in + partition->previous_partition >= klv_offset) {
524         av_log(mxf->fc, AV_LOG_ERROR,
525                "PreviousPartition points to this partition or forward\n");
526         return AVERROR_INVALIDDATA;
527     }
528
529     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
530     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
531     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
532     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
533     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
534     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
535     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
536     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
537     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
538     else if (op[12] == 64&& op[13] == 1) mxf->op = OPSonyOpt;
539     else if (op[12] == 0x10) {
540         /* SMPTE 390m: "There shall be exactly one essence container"
541          * The following block deals with files that violate this, namely:
542          * 2011_DCPTEST_24FPS.V.mxf - two ECs, OP1a
543          * abcdefghiv016f56415e.mxf - zero ECs, OPAtom, output by Avid AirSpeed */
544         if (nb_essence_containers != 1) {
545             MXFOP op = nb_essence_containers ? OP1a : OPAtom;
546
547             /* only nag once */
548             if (!mxf->op)
549                 av_log(mxf->fc, AV_LOG_WARNING,
550                        "\"OPAtom\" with %"PRIu32" ECs - assuming %s\n",
551                        nb_essence_containers,
552                        op == OP1a ? "OP1a" : "OPAtom");
553
554             mxf->op = op;
555         } else
556             mxf->op = OPAtom;
557     } else {
558         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh - guessing OP1a\n", op[12], op[13]);
559         mxf->op = OP1a;
560     }
561
562     if (partition->kag_size <= 0 || partition->kag_size > (1 << 20)) {
563         av_log(mxf->fc, AV_LOG_WARNING, "invalid KAGSize %"PRId32" - guessing ",
564                partition->kag_size);
565
566         if (mxf->op == OPSonyOpt)
567             partition->kag_size = 512;
568         else
569             partition->kag_size = 1;
570
571         av_log(mxf->fc, AV_LOG_WARNING, "%"PRId32"\n", partition->kag_size);
572     }
573
574     return 0;
575 }
576
577 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
578 {
579     int err;
580
581     if ((err = av_reallocp_array(&mxf->metadata_sets, mxf->metadata_sets_count + 1,
582                                  sizeof(*mxf->metadata_sets))) < 0) {
583         mxf->metadata_sets_count = 0;
584         return err;
585     }
586     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
587     mxf->metadata_sets_count++;
588     return 0;
589 }
590
591 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
592 {
593     MXFCryptoContext *cryptocontext = arg;
594     if (size != 16)
595         return AVERROR_INVALIDDATA;
596     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
597         avio_read(pb, cryptocontext->source_container_ul, 16);
598     return 0;
599 }
600
601 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
602 {
603     MXFContext *mxf = arg;
604     switch (tag) {
605     case 0x1901:
606         mxf->packages_count = avio_rb32(pb);
607         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
608             return AVERROR_INVALIDDATA;
609         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
610         if (!mxf->packages_refs)
611             return AVERROR(ENOMEM);
612         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
613         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
614         break;
615     }
616     return 0;
617 }
618
619 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
620 {
621     MXFStructuralComponent *source_clip = arg;
622     switch(tag) {
623     case 0x0202:
624         source_clip->duration = avio_rb64(pb);
625         break;
626     case 0x1201:
627         source_clip->start_position = avio_rb64(pb);
628         break;
629     case 0x1101:
630         /* UMID, only get last 16 bytes */
631         avio_skip(pb, 16);
632         avio_read(pb, source_clip->source_package_uid, 16);
633         break;
634     case 0x1102:
635         source_clip->source_track_id = avio_rb32(pb);
636         break;
637     }
638     return 0;
639 }
640
641 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
642 {
643     MXFPackage *package = arg;
644     switch(tag) {
645     case 0x4403:
646         package->tracks_count = avio_rb32(pb);
647         if (package->tracks_count >= UINT_MAX / sizeof(UID))
648             return AVERROR_INVALIDDATA;
649         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
650         if (!package->tracks_refs)
651             return AVERROR(ENOMEM);
652         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
653         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
654         break;
655     }
656     return 0;
657 }
658
659 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
660 {
661     MXFTrack *track = arg;
662     switch(tag) {
663     case 0x4801:
664         track->track_id = avio_rb32(pb);
665         break;
666     case 0x4804:
667         avio_read(pb, track->track_number, 4);
668         break;
669     case 0x4b01:
670         track->edit_rate.num = avio_rb32(pb);
671         track->edit_rate.den = avio_rb32(pb);
672         break;
673     case 0x4803:
674         avio_read(pb, track->sequence_ref, 16);
675         break;
676     }
677     return 0;
678 }
679
680 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
681 {
682     MXFSequence *sequence = arg;
683     switch(tag) {
684     case 0x0202:
685         sequence->duration = avio_rb64(pb);
686         break;
687     case 0x0201:
688         avio_read(pb, sequence->data_definition_ul, 16);
689         break;
690         case 0x4b02:
691         sequence->origin = avio_r8(pb);
692         break;
693     case 0x1001:
694         sequence->structural_components_count = avio_rb32(pb);
695         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
696             return AVERROR_INVALIDDATA;
697         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
698         if (!sequence->structural_components_refs)
699             return AVERROR(ENOMEM);
700         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
701         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
702         break;
703     }
704     return 0;
705 }
706
707 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
708 {
709     MXFPackage *package = arg;
710     switch(tag) {
711     case 0x4403:
712         package->tracks_count = avio_rb32(pb);
713         if (package->tracks_count >= UINT_MAX / sizeof(UID))
714             return AVERROR_INVALIDDATA;
715         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
716         if (!package->tracks_refs)
717             return AVERROR(ENOMEM);
718         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
719         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
720         break;
721     case 0x4401:
722         /* UMID, only get last 16 bytes */
723         avio_skip(pb, 16);
724         avio_read(pb, package->package_uid, 16);
725         break;
726     case 0x4701:
727         avio_read(pb, package->descriptor_ref, 16);
728         break;
729     }
730     return 0;
731 }
732
733 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
734 {
735     int i, length;
736
737     segment->nb_index_entries = avio_rb32(pb);
738     if (!segment->nb_index_entries)
739         return 0;
740     else if (segment->nb_index_entries < 0 ||
741              segment->nb_index_entries >
742              (INT_MAX / sizeof(*segment->stream_offset_entries)))
743         return AVERROR(ENOMEM);
744
745     length = avio_rb32(pb);
746
747     segment->temporal_offset_entries = av_mallocz(segment->nb_index_entries *
748                                  sizeof(*segment->temporal_offset_entries));
749     segment->flag_entries            = av_mallocz(segment->nb_index_entries *
750                                  sizeof(*segment->flag_entries));
751     segment->stream_offset_entries   = av_mallocz(segment->nb_index_entries *
752                                  sizeof(*segment->stream_offset_entries));
753
754     if (!segment->flag_entries || !segment->stream_offset_entries ||
755         !segment->temporal_offset_entries) {
756         av_freep(&segment->flag_entries);
757         av_freep(&segment->stream_offset_entries);
758         av_freep(&segment->temporal_offset_entries);
759         return AVERROR(ENOMEM);
760     }
761
762     for (i = 0; i < segment->nb_index_entries; i++) {
763         segment->temporal_offset_entries[i] = avio_r8(pb);
764         avio_r8(pb);                                        /* KeyFrameOffset */
765         segment->flag_entries[i] = avio_r8(pb);
766         segment->stream_offset_entries[i] = avio_rb64(pb);
767         avio_skip(pb, length - 11);
768     }
769     return 0;
770 }
771
772 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
773 {
774     MXFIndexTableSegment *segment = arg;
775     switch(tag) {
776     case 0x3F05:
777         segment->edit_unit_byte_count = avio_rb32(pb);
778         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
779         break;
780     case 0x3F06:
781         segment->index_sid = avio_rb32(pb);
782         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
783         break;
784     case 0x3F07:
785         segment->body_sid = avio_rb32(pb);
786         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
787         break;
788     case 0x3F0A:
789         av_dlog(NULL, "IndexEntryArray found\n");
790         return mxf_read_index_entry_array(pb, segment);
791     case 0x3F0B:
792         segment->index_edit_rate.num = avio_rb32(pb);
793         segment->index_edit_rate.den = avio_rb32(pb);
794         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
795                 segment->index_edit_rate.den);
796         break;
797     case 0x3F0C:
798         segment->index_start_position = avio_rb64(pb);
799         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
800         break;
801     case 0x3F0D:
802         segment->index_duration = avio_rb64(pb);
803         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
804         break;
805     }
806     return 0;
807 }
808
809 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
810 {
811     int code, value, ofs = 0;
812     char layout[16] = {0};
813
814     do {
815         code = avio_r8(pb);
816         value = avio_r8(pb);
817         av_dlog(NULL, "pixel layout: code %#x\n", code);
818
819         if (ofs < 16) {
820             layout[ofs++] = code;
821             layout[ofs++] = value;
822         }
823     } while (code != 0); /* SMPTE 377M E.2.46 */
824
825     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
826 }
827
828 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
829 {
830     MXFDescriptor *descriptor = arg;
831     descriptor->pix_fmt = AV_PIX_FMT_NONE;
832     switch(tag) {
833     case 0x3F01:
834         descriptor->sub_descriptors_count = avio_rb32(pb);
835         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
836             return AVERROR_INVALIDDATA;
837         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
838         if (!descriptor->sub_descriptors_refs)
839             return AVERROR(ENOMEM);
840         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
841         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
842         break;
843     case 0x3004:
844         avio_read(pb, descriptor->essence_container_ul, 16);
845         break;
846     case 0x3006:
847         descriptor->linked_track_id = avio_rb32(pb);
848         break;
849     case 0x3201: /* PictureEssenceCoding */
850         avio_read(pb, descriptor->essence_codec_ul, 16);
851         break;
852     case 0x3203:
853         descriptor->width = avio_rb32(pb);
854         break;
855     case 0x3202:
856         descriptor->height = avio_rb32(pb);
857         break;
858     case 0x320C:
859         descriptor->frame_layout = avio_r8(pb);
860         break;
861     case 0x320E:
862         descriptor->aspect_ratio.num = avio_rb32(pb);
863         descriptor->aspect_ratio.den = avio_rb32(pb);
864         break;
865     case 0x3212:
866         descriptor->field_dominance = avio_r8(pb);
867         break;
868     case 0x3301:
869         descriptor->component_depth = avio_rb32(pb);
870         break;
871     case 0x3302:
872         descriptor->horiz_subsampling = avio_rb32(pb);
873         break;
874     case 0x3308:
875         descriptor->vert_subsampling = avio_rb32(pb);
876         break;
877     case 0x3D03:
878         descriptor->sample_rate.num = avio_rb32(pb);
879         descriptor->sample_rate.den = avio_rb32(pb);
880         break;
881     case 0x3D06: /* SoundEssenceCompression */
882         avio_read(pb, descriptor->essence_codec_ul, 16);
883         break;
884     case 0x3D07:
885         descriptor->channels = avio_rb32(pb);
886         break;
887     case 0x3D01:
888         descriptor->bits_per_sample = avio_rb32(pb);
889         break;
890     case 0x3401:
891         mxf_read_pixel_layout(pb, descriptor);
892         break;
893     default:
894         /* Private uid used by SONY C0023S01.mxf */
895         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
896             av_free(descriptor->extradata);
897             descriptor->extradata_size = 0;
898             descriptor->extradata = av_malloc(size + FF_INPUT_BUFFER_PADDING_SIZE);
899             if (!descriptor->extradata)
900                 return AVERROR(ENOMEM);
901             descriptor->extradata_size = size;
902             avio_read(pb, descriptor->extradata, size);
903         }
904         break;
905     }
906     return 0;
907 }
908
909 /*
910  * Match an uid independently of the version byte and up to len common bytes
911  * Returns: boolean
912  */
913 static int mxf_match_uid(const UID key, const UID uid, int len)
914 {
915     int i;
916     for (i = 0; i < len; i++) {
917         if (i != 7 && key[i] != uid[i])
918             return 0;
919     }
920     return 1;
921 }
922
923 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
924 {
925     while (uls->uid[0]) {
926         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
927             break;
928         uls++;
929     }
930     return uls;
931 }
932
933 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
934 {
935     int i;
936
937     if (!strong_ref)
938         return NULL;
939     for (i = 0; i < mxf->metadata_sets_count; i++) {
940         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
941             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
942             return mxf->metadata_sets[i];
943         }
944     }
945     return NULL;
946 }
947
948 static const MXFCodecUL mxf_picture_essence_container_uls[] = {
949     // video essence container uls
950     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x02,0x0d,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
951     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    AV_CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
952     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x05,0x00,0x00 }, 14,   AV_CODEC_ID_RAWVIDEO }, /* Uncompressed Picture */
953     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
954 };
955
956 /* EC ULs for intra-only formats */
957 static const MXFCodecUL mxf_intra_only_essence_container_uls[] = {
958     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x01,0x00,0x00 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MXF-GC SMPTE D-10 Mappings */
959     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
960 };
961
962 /* intra-only PictureEssenceCoding ULs, where no corresponding EC UL exists */
963 static const MXFCodecUL mxf_intra_only_picture_essence_coding_uls[] = {
964     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x0A,0x04,0x01,0x02,0x02,0x01,0x32,0x00,0x00 }, 14,       AV_CODEC_ID_H264 }, /* H.264/MPEG-4 AVC Intra Profiles */
965     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x04,0x01,0x02,0x02,0x03,0x01,0x01,0x00 }, 14,   AV_CODEC_ID_JPEG2000 }, /* JPEG2000 Codestream */
966     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
967 };
968
969 static const MXFCodecUL mxf_sound_essence_container_uls[] = {
970     // sound essence container uls
971     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, AV_CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
972     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x02,0x0d,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       AV_CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
973     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, AV_CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
974     { { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0xff,0x4b,0x46,0x41,0x41,0x00,0x0d,0x4d,0x4F }, 14, AV_CODEC_ID_PCM_S16LE }, /* 0001GL00.MXF.A1.mxf_opatom.mxf */
975     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x03,0x04,0x02,0x02,0x02,0x03,0x03,0x01,0x00 }, 14,       AV_CODEC_ID_AAC }, /* MPEG2 AAC ADTS (legacy) */
976     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
977 };
978
979 static const MXFCodecUL mxf_data_essence_container_uls[] = {
980     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x09,0x0d,0x01,0x03,0x01,0x02,0x0e,0x00,0x00 }, 16, 0 },
981     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x09,0x0d,0x01,0x03,0x01,0x02,0x0e,0x00,0x00 }, 16, AV_CODEC_ID_NONE },
982 };
983
984 static const char* mxf_data_essence_descriptor[] = {
985     "vbi_vanc_smpte_436M",
986 };
987
988 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
989 {
990     int i, j, nb_segments = 0;
991     MXFIndexTableSegment **unsorted_segments;
992     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
993
994     /* count number of segments, allocate arrays and copy unsorted segments */
995     for (i = 0; i < mxf->metadata_sets_count; i++)
996         if (mxf->metadata_sets[i]->type == IndexTableSegment)
997             nb_segments++;
998
999     if (!nb_segments)
1000         return AVERROR_INVALIDDATA;
1001
1002     *sorted_segments  = av_mallocz(nb_segments * sizeof(**sorted_segments));
1003     unsorted_segments = av_mallocz(nb_segments * sizeof(*unsorted_segments));
1004     if (!*sorted_segments || !unsorted_segments) {
1005         av_freep(sorted_segments);
1006         av_free(unsorted_segments);
1007         return AVERROR(ENOMEM);
1008     }
1009
1010     for (i = j = 0; i < mxf->metadata_sets_count; i++)
1011         if (mxf->metadata_sets[i]->type == IndexTableSegment)
1012             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
1013
1014     *nb_sorted_segments = 0;
1015
1016     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
1017     for (i = 0; i < nb_segments; i++) {
1018         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
1019         uint64_t best_index_duration = 0;
1020
1021         for (j = 0; j < nb_segments; j++) {
1022             MXFIndexTableSegment *s = unsorted_segments[j];
1023
1024             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
1025              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
1026              * If we come across an entry with the same IndexStartPosition but larger IndexDuration, then we'll prefer it over the one we currently have.
1027              */
1028             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
1029                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start ||
1030                 (s->index_start_position == best_index_start && s->index_duration > best_index_duration))) {
1031                 best             = j;
1032                 best_body_sid    = s->body_sid;
1033                 best_index_sid   = s->index_sid;
1034                 best_index_start = s->index_start_position;
1035                 best_index_duration = s->index_duration;
1036             }
1037         }
1038
1039         /* no suitable entry found -> we're done */
1040         if (best == -1)
1041             break;
1042
1043         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
1044         last_body_sid    = best_body_sid;
1045         last_index_sid   = best_index_sid;
1046         last_index_start = best_index_start;
1047     }
1048
1049     av_free(unsorted_segments);
1050
1051     return 0;
1052 }
1053
1054 /**
1055  * Computes the absolute file offset of the given essence container offset
1056  */
1057 static int mxf_absolute_bodysid_offset(MXFContext *mxf, int body_sid, int64_t offset, int64_t *offset_out)
1058 {
1059     int x;
1060     int64_t offset_in = offset;     /* for logging */
1061
1062     for (x = 0; x < mxf->partitions_count; x++) {
1063         MXFPartition *p = &mxf->partitions[x];
1064
1065         if (p->body_sid != body_sid)
1066             continue;
1067
1068         if (offset < p->essence_length || !p->essence_length) {
1069             *offset_out = p->essence_offset + offset;
1070             return 0;
1071         }
1072
1073         offset -= p->essence_length;
1074     }
1075
1076     av_log(mxf->fc, AV_LOG_ERROR,
1077            "failed to find absolute offset of %"PRIX64" in BodySID %i - partial file?\n",
1078            offset_in, body_sid);
1079
1080     return AVERROR_INVALIDDATA;
1081 }
1082
1083 /**
1084  * Returns the end position of the essence container with given BodySID, or zero if unknown
1085  */
1086 static int64_t mxf_essence_container_end(MXFContext *mxf, int body_sid)
1087 {
1088     int x;
1089     int64_t ret = 0;
1090
1091     for (x = 0; x < mxf->partitions_count; x++) {
1092         MXFPartition *p = &mxf->partitions[x];
1093
1094         if (p->body_sid != body_sid)
1095             continue;
1096
1097         if (!p->essence_length)
1098             return 0;
1099
1100         ret = p->essence_offset + p->essence_length;
1101     }
1102
1103     return ret;
1104 }
1105
1106 /* EditUnit -> absolute offset */
1107 static int mxf_edit_unit_absolute_offset(MXFContext *mxf, MXFIndexTable *index_table, int64_t edit_unit, int64_t *edit_unit_out, int64_t *offset_out, int nag)
1108 {
1109     int i;
1110     int64_t offset_temp = 0;
1111
1112     for (i = 0; i < index_table->nb_segments; i++) {
1113         MXFIndexTableSegment *s = index_table->segments[i];
1114
1115         edit_unit = FFMAX(edit_unit, s->index_start_position);  /* clamp if trying to seek before start */
1116
1117         if (edit_unit < s->index_start_position + s->index_duration) {
1118             int64_t index = edit_unit - s->index_start_position;
1119
1120             if (s->edit_unit_byte_count)
1121                 offset_temp += s->edit_unit_byte_count * index;
1122             else if (s->nb_index_entries) {
1123                 if (s->nb_index_entries == 2 * s->index_duration + 1)
1124                     index *= 2;     /* Avid index */
1125
1126                 if (index < 0 || index >= s->nb_index_entries) {
1127                     av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" IndexEntryArray too small\n",
1128                            index_table->index_sid, s->index_start_position);
1129                     return AVERROR_INVALIDDATA;
1130                 }
1131
1132                 offset_temp = s->stream_offset_entries[index];
1133             } else {
1134                 av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" missing EditUnitByteCount and IndexEntryArray\n",
1135                        index_table->index_sid, s->index_start_position);
1136                 return AVERROR_INVALIDDATA;
1137             }
1138
1139             if (edit_unit_out)
1140                 *edit_unit_out = edit_unit;
1141
1142             return mxf_absolute_bodysid_offset(mxf, index_table->body_sid, offset_temp, offset_out);
1143         } else {
1144             /* EditUnitByteCount == 0 for VBR indexes, which is fine since they use explicit StreamOffsets */
1145             offset_temp += s->edit_unit_byte_count * s->index_duration;
1146         }
1147     }
1148
1149     if (nag)
1150         av_log(mxf->fc, AV_LOG_ERROR, "failed to map EditUnit %"PRId64" in IndexSID %i to an offset\n", edit_unit, index_table->index_sid);
1151
1152     return AVERROR_INVALIDDATA;
1153 }
1154
1155 static int mxf_compute_ptses_fake_index(MXFContext *mxf, MXFIndexTable *index_table)
1156 {
1157     int i, j, x;
1158     int8_t max_temporal_offset = -128;
1159
1160     /* first compute how many entries we have */
1161     for (i = 0; i < index_table->nb_segments; i++) {
1162         MXFIndexTableSegment *s = index_table->segments[i];
1163
1164         if (!s->nb_index_entries) {
1165             index_table->nb_ptses = 0;
1166             return 0;                               /* no TemporalOffsets */
1167         }
1168
1169         index_table->nb_ptses += s->index_duration;
1170     }
1171
1172     /* paranoid check */
1173     if (index_table->nb_ptses <= 0)
1174         return 0;
1175
1176     if (index_table->nb_ptses > INT_MAX / sizeof(AVIndexEntry))
1177         return AVERROR(ENOMEM);
1178
1179     index_table->ptses      = av_mallocz(index_table->nb_ptses *
1180                                          sizeof(int64_t));
1181     index_table->fake_index = av_mallocz(index_table->nb_ptses *
1182                                          sizeof(AVIndexEntry));
1183     if (!index_table->ptses || !index_table->fake_index) {
1184         av_freep(&index_table->ptses);
1185         return AVERROR(ENOMEM);
1186     }
1187
1188     /* we may have a few bad TemporalOffsets
1189      * make sure the corresponding PTSes don't have the bogus value 0 */
1190     for (x = 0; x < index_table->nb_ptses; x++)
1191         index_table->ptses[x] = AV_NOPTS_VALUE;
1192
1193     /**
1194      * We have this:
1195      *
1196      * x  TemporalOffset
1197      * 0:  0
1198      * 1:  1
1199      * 2:  1
1200      * 3: -2
1201      * 4:  1
1202      * 5:  1
1203      * 6: -2
1204      *
1205      * We want to transform it into this:
1206      *
1207      * x  DTS PTS
1208      * 0: -1   0
1209      * 1:  0   3
1210      * 2:  1   1
1211      * 3:  2   2
1212      * 4:  3   6
1213      * 5:  4   4
1214      * 6:  5   5
1215      *
1216      * We do this by bucket sorting x by x+TemporalOffset[x] into mxf->ptses,
1217      * then settings mxf->first_dts = -max(TemporalOffset[x]).
1218      * The latter makes DTS <= PTS.
1219      */
1220     for (i = x = 0; i < index_table->nb_segments; i++) {
1221         MXFIndexTableSegment *s = index_table->segments[i];
1222         int index_delta = 1;
1223         int n = s->nb_index_entries;
1224
1225         if (s->nb_index_entries == 2 * s->index_duration + 1) {
1226             index_delta = 2;    /* Avid index */
1227             /* ignore the last entry - it's the size of the essence container */
1228             n--;
1229         }
1230
1231         for (j = 0; j < n; j += index_delta, x++) {
1232             int offset = s->temporal_offset_entries[j] / index_delta;
1233             int index  = x + offset;
1234
1235             if (x >= index_table->nb_ptses) {
1236                 av_log(mxf->fc, AV_LOG_ERROR,
1237                        "x >= nb_ptses - IndexEntryCount %i < IndexDuration %"PRId64"?\n",
1238                        s->nb_index_entries, s->index_duration);
1239                 break;
1240             }
1241
1242             index_table->fake_index[x].timestamp = x;
1243             index_table->fake_index[x].flags = !(s->flag_entries[j] & 0x30) ? AVINDEX_KEYFRAME : 0;
1244
1245             if (index < 0 || index >= index_table->nb_ptses) {
1246                 av_log(mxf->fc, AV_LOG_ERROR,
1247                        "index entry %i + TemporalOffset %i = %i, which is out of bounds\n",
1248                        x, offset, index);
1249                 continue;
1250             }
1251
1252             index_table->ptses[index] = x;
1253             max_temporal_offset = FFMAX(max_temporal_offset, offset);
1254         }
1255     }
1256
1257     index_table->first_dts = -max_temporal_offset;
1258
1259     return 0;
1260 }
1261
1262 /**
1263  * Sorts and collects index table segments into index tables.
1264  * Also computes PTSes if possible.
1265  */
1266 static int mxf_compute_index_tables(MXFContext *mxf)
1267 {
1268     int i, j, k, ret, nb_sorted_segments;
1269     MXFIndexTableSegment **sorted_segments = NULL;
1270
1271     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)) ||
1272         nb_sorted_segments <= 0) {
1273         av_log(mxf->fc, AV_LOG_WARNING, "broken or empty index\n");
1274         return 0;
1275     }
1276
1277     /* sanity check and count unique BodySIDs/IndexSIDs */
1278     for (i = 0; i < nb_sorted_segments; i++) {
1279         if (i == 0 || sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid)
1280             mxf->nb_index_tables++;
1281         else if (sorted_segments[i-1]->body_sid != sorted_segments[i]->body_sid) {
1282             av_log(mxf->fc, AV_LOG_ERROR, "found inconsistent BodySID\n");
1283             ret = AVERROR_INVALIDDATA;
1284             goto finish_decoding_index;
1285         }
1286     }
1287
1288     mxf->index_tables = av_mallocz_array(mxf->nb_index_tables,
1289                                          sizeof(*mxf->index_tables));
1290     if (!mxf->index_tables) {
1291         av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate index tables\n");
1292         ret = AVERROR(ENOMEM);
1293         goto finish_decoding_index;
1294     }
1295
1296     /* distribute sorted segments to index tables */
1297     for (i = j = 0; i < nb_sorted_segments; i++) {
1298         if (i != 0 && sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid) {
1299             /* next IndexSID */
1300             j++;
1301         }
1302
1303         mxf->index_tables[j].nb_segments++;
1304     }
1305
1306     for (i = j = 0; j < mxf->nb_index_tables; i += mxf->index_tables[j++].nb_segments) {
1307         MXFIndexTable *t = &mxf->index_tables[j];
1308
1309         t->segments = av_mallocz_array(t->nb_segments,
1310                                        sizeof(*t->segments));
1311
1312         if (!t->segments) {
1313             av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate IndexTableSegment"
1314                    " pointer array\n");
1315             ret = AVERROR(ENOMEM);
1316             goto finish_decoding_index;
1317         }
1318
1319         if (sorted_segments[i]->index_start_position)
1320             av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i starts at EditUnit %"PRId64" - seeking may not work as expected\n",
1321                    sorted_segments[i]->index_sid, sorted_segments[i]->index_start_position);
1322
1323         memcpy(t->segments, &sorted_segments[i], t->nb_segments * sizeof(MXFIndexTableSegment*));
1324         t->index_sid = sorted_segments[i]->index_sid;
1325         t->body_sid = sorted_segments[i]->body_sid;
1326
1327         if ((ret = mxf_compute_ptses_fake_index(mxf, t)) < 0)
1328             goto finish_decoding_index;
1329
1330         /* fix zero IndexDurations */
1331         for (k = 0; k < t->nb_segments; k++) {
1332             if (t->segments[k]->index_duration)
1333                 continue;
1334
1335             if (t->nb_segments > 1)
1336                 av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i segment %i has zero IndexDuration and there's more than one segment\n",
1337                        t->index_sid, k);
1338
1339             if (mxf->fc->nb_streams <= 0) {
1340                 av_log(mxf->fc, AV_LOG_WARNING, "no streams?\n");
1341                 break;
1342             }
1343
1344             /* assume the first stream's duration is reasonable
1345              * leave index_duration = 0 on further segments in case we have any (unlikely)
1346              */
1347             t->segments[k]->index_duration = mxf->fc->streams[0]->duration;
1348             break;
1349         }
1350     }
1351
1352     ret = 0;
1353 finish_decoding_index:
1354     av_free(sorted_segments);
1355     return ret;
1356 }
1357
1358 static int mxf_is_intra_only(MXFDescriptor *d)
1359 {
1360     return mxf_get_codec_ul(mxf_intra_only_essence_container_uls,
1361                             &d->essence_container_ul)->id != AV_CODEC_ID_NONE ||
1362            mxf_get_codec_ul(mxf_intra_only_picture_essence_coding_uls,
1363                             &d->essence_codec_ul)->id     != AV_CODEC_ID_NONE;
1364 }
1365
1366 static int mxf_parse_structural_metadata(MXFContext *mxf)
1367 {
1368     MXFPackage *material_package = NULL;
1369     MXFPackage *temp_package = NULL;
1370     int i, j, k, ret;
1371
1372     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1373     /* TODO: handle multiple material packages (OP3x) */
1374     for (i = 0; i < mxf->packages_count; i++) {
1375         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1376         if (material_package) break;
1377     }
1378     if (!material_package) {
1379         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1380         return AVERROR_INVALIDDATA;
1381     }
1382
1383     for (i = 0; i < material_package->tracks_count; i++) {
1384         MXFPackage *source_package = NULL;
1385         MXFTrack *material_track = NULL;
1386         MXFTrack *source_track = NULL;
1387         MXFTrack *temp_track = NULL;
1388         MXFDescriptor *descriptor = NULL;
1389         MXFStructuralComponent *component = NULL;
1390         UID *essence_container_ul = NULL;
1391         const MXFCodecUL *codec_ul = NULL;
1392         const MXFCodecUL *container_ul = NULL;
1393         const MXFCodecUL *pix_fmt_ul = NULL;
1394         AVStream *st;
1395
1396         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1397             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1398             continue;
1399         }
1400
1401         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1402             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1403             continue;
1404         }
1405
1406         /* TODO: handle multiple source clips */
1407         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1408             /* TODO: handle timecode component */
1409             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1410             if (!component)
1411                 continue;
1412
1413             for (k = 0; k < mxf->packages_count; k++) {
1414                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1415                 if (!temp_package)
1416                     continue;
1417                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1418                     source_package = temp_package;
1419                     break;
1420                 }
1421             }
1422             if (!source_package) {
1423                 av_dlog(mxf->fc, "material track %d: no corresponding source package found\n", material_track->track_id);
1424                 break;
1425             }
1426             for (k = 0; k < source_package->tracks_count; k++) {
1427                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1428                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1429                     ret = AVERROR_INVALIDDATA;
1430                     goto fail_and_free;
1431                 }
1432                 if (temp_track->track_id == component->source_track_id) {
1433                     source_track = temp_track;
1434                     break;
1435                 }
1436             }
1437             if (!source_track) {
1438                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1439                 break;
1440             }
1441         }
1442         if (!source_track || !component)
1443             continue;
1444
1445         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1446             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1447             ret = AVERROR_INVALIDDATA;
1448             goto fail_and_free;
1449         }
1450
1451         /* 0001GL00.MXF.A1.mxf_opatom.mxf has the same SourcePackageID as 0001GL.MXF.V1.mxf_opatom.mxf
1452          * This would result in both files appearing to have two streams. Work around this by sanity checking DataDefinition */
1453         if (memcmp(material_track->sequence->data_definition_ul, source_track->sequence->data_definition_ul, 16)) {
1454             av_log(mxf->fc, AV_LOG_ERROR, "material track %d: DataDefinition mismatch\n", material_track->track_id);
1455             continue;
1456         }
1457
1458         st = avformat_new_stream(mxf->fc, NULL);
1459         if (!st) {
1460             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1461             ret = AVERROR(ENOMEM);
1462             goto fail_and_free;
1463         }
1464         st->id = source_track->track_id;
1465         st->priv_data = source_track;
1466         source_track->original_duration = st->duration = component->duration;
1467         if (st->duration == -1)
1468             st->duration = AV_NOPTS_VALUE;
1469         st->start_time = component->start_position;
1470         if (material_track->edit_rate.num <= 0 ||
1471             material_track->edit_rate.den <= 0) {
1472             av_log(mxf->fc, AV_LOG_WARNING,
1473                    "Invalid edit rate (%d/%d) found on stream #%d, "
1474                    "defaulting to 25/1\n",
1475                    material_track->edit_rate.num,
1476                    material_track->edit_rate.den, st->index);
1477             material_track->edit_rate = (AVRational){25, 1};
1478         }
1479         avpriv_set_pts_info(st, 64, material_track->edit_rate.den, material_track->edit_rate.num);
1480
1481         /* ensure SourceTrack EditRate == MaterialTrack EditRate since only
1482          * the former is accessible via st->priv_data */
1483         source_track->edit_rate = material_track->edit_rate;
1484
1485         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1486         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1487         st->codec->codec_type = codec_ul->id;
1488
1489         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1490         if (source_package->descriptor) {
1491             if (source_package->descriptor->type == MultipleDescriptor) {
1492                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1493                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1494
1495                     if (!sub_descriptor) {
1496                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1497                         continue;
1498                     }
1499                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1500                         descriptor = sub_descriptor;
1501                         break;
1502                     }
1503                 }
1504             } else if (source_package->descriptor->type == Descriptor)
1505                 descriptor = source_package->descriptor;
1506         }
1507         if (!descriptor) {
1508             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1509             continue;
1510         }
1511         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1512         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1513         essence_container_ul = &descriptor->essence_container_ul;
1514         /* HACK: replacing the original key with mxf_encrypted_essence_container
1515          * is not allowed according to s429-6, try to find correct information anyway */
1516         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1517             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1518             for (k = 0; k < mxf->metadata_sets_count; k++) {
1519                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1520                 if (metadata->type == CryptoContext) {
1521                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1522                     break;
1523                 }
1524             }
1525         }
1526
1527         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1528         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1529         st->codec->codec_id = codec_ul->id;
1530
1531         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1532             source_track->intra_only = mxf_is_intra_only(descriptor);
1533             container_ul = mxf_get_codec_ul(mxf_picture_essence_container_uls, essence_container_ul);
1534             if (st->codec->codec_id == AV_CODEC_ID_NONE)
1535                 st->codec->codec_id = container_ul->id;
1536             st->codec->width = descriptor->width;
1537             /* Field height, not frame height */
1538             st->codec->height = descriptor->height;
1539             switch (descriptor->frame_layout) {
1540                 case SegmentedFrame:
1541                     /* This one is a weird layout I don't fully understand. */
1542                     av_log(mxf->fc, AV_LOG_INFO,
1543                            "SegmentedFrame layout isn't currently supported\n");
1544                     break;
1545                 case FullFrame:
1546                     st->codec->field_order = AV_FIELD_PROGRESSIVE;
1547                     break;
1548                 case OneField:
1549                     /* Every other line is stored and needs to be duplicated. */
1550                     av_log(mxf->fc, AV_LOG_INFO,
1551                            "OneField frame layout isn't currently supported\n");
1552                     break;
1553                     /* The correct thing to do here is fall through, but by
1554                      * breaking we might be able to decode some streams at half
1555                      * the vertical resolution, rather than not al all.
1556                      * It's also for compatibility with the old behavior. */
1557                 case SeparateFields:
1558                 case MixedFields:
1559                     switch (descriptor->field_dominance) {
1560                     case MXF_TFF:
1561                         st->codec->field_order = AV_FIELD_TT;
1562                         break;
1563                     case MXF_BFF:
1564                         st->codec->field_order = AV_FIELD_BB;
1565                         break;
1566                     default:
1567                         avpriv_request_sample(mxf->fc,
1568                                               "Field dominance %d support",
1569                                               descriptor->field_dominance);
1570                         break;
1571                     }
1572                     /* Turn field height into frame height. */
1573                     st->codec->height *= 2;
1574                     break;
1575                 default:
1576                     av_log(mxf->fc, AV_LOG_INFO,
1577                            "Unknown frame layout type: %d\n",
1578                            descriptor->frame_layout);
1579             }
1580             if (st->codec->codec_id == AV_CODEC_ID_RAWVIDEO) {
1581                 st->codec->pix_fmt = descriptor->pix_fmt;
1582                 if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1583                     pix_fmt_ul = mxf_get_codec_ul(ff_mxf_pixel_format_uls,
1584                                                   &descriptor->essence_codec_ul);
1585                     st->codec->pix_fmt = pix_fmt_ul->id;
1586                     if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1587                         /* support files created before RP224v10 by defaulting to UYVY422
1588                            if subsampling is 4:2:2 and component depth is 8-bit */
1589                         if (descriptor->horiz_subsampling == 2 &&
1590                             descriptor->vert_subsampling == 1 &&
1591                             descriptor->component_depth == 8) {
1592                             st->codec->pix_fmt = AV_PIX_FMT_UYVY422;
1593                         }
1594                     }
1595                 }
1596             }
1597             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1598             if (material_track->sequence->origin) {
1599                 char material_origin[3];
1600                 snprintf(material_origin, sizeof(material_origin), "%d", material_track->sequence->origin);
1601                 av_dict_set(&st->metadata, "material_track_origin", material_origin, 0);
1602             }
1603             if (source_track->sequence->origin) {
1604                 char source_origin[3];
1605                 snprintf(source_origin, sizeof(source_origin), "%d", source_track->sequence->origin);
1606                 av_dict_set(&st->metadata, "source_track_origin", source_origin, 0);
1607             }
1608         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1609             container_ul = mxf_get_codec_ul(mxf_sound_essence_container_uls, essence_container_ul);
1610             if (st->codec->codec_id == AV_CODEC_ID_NONE)
1611                 st->codec->codec_id = container_ul->id;
1612             st->codec->channels = descriptor->channels;
1613             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1614
1615             if (descriptor->sample_rate.den > 0) {
1616                 st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1617                 avpriv_set_pts_info(st, 64, descriptor->sample_rate.den, descriptor->sample_rate.num);
1618             } else {
1619                 av_log(mxf->fc, AV_LOG_WARNING, "invalid sample rate (%d/%d) "
1620                        "found for stream #%d, time base forced to 1/48000\n",
1621                        descriptor->sample_rate.num, descriptor->sample_rate.den,
1622                        st->index);
1623                 avpriv_set_pts_info(st, 64, 1, 48000);
1624             }
1625
1626             /* if duration is set, rescale it from EditRate to SampleRate */
1627             if (st->duration != AV_NOPTS_VALUE)
1628                 st->duration = av_rescale_q(st->duration,
1629                                             av_inv_q(material_track->edit_rate),
1630                                             st->time_base);
1631
1632             /* TODO: implement AV_CODEC_ID_RAWAUDIO */
1633             if (st->codec->codec_id == AV_CODEC_ID_PCM_S16LE) {
1634                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1635                     st->codec->codec_id = AV_CODEC_ID_PCM_S24LE;
1636                 else if (descriptor->bits_per_sample == 32)
1637                     st->codec->codec_id = AV_CODEC_ID_PCM_S32LE;
1638             } else if (st->codec->codec_id == AV_CODEC_ID_PCM_S16BE) {
1639                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1640                     st->codec->codec_id = AV_CODEC_ID_PCM_S24BE;
1641                 else if (descriptor->bits_per_sample == 32)
1642                     st->codec->codec_id = AV_CODEC_ID_PCM_S32BE;
1643             } else if (st->codec->codec_id == AV_CODEC_ID_MP2) {
1644                 st->need_parsing = AVSTREAM_PARSE_FULL;
1645             }
1646         } else if (st->codec->codec_type == AVMEDIA_TYPE_DATA) {
1647             int codec_id = mxf_get_codec_ul(mxf_data_essence_container_uls,
1648                                             essence_container_ul)->id;
1649             if (codec_id >= 0 &&
1650                 codec_id < FF_ARRAY_ELEMS(mxf_data_essence_descriptor)) {
1651                 av_dict_set(&st->metadata, "data_type",
1652                             mxf_data_essence_descriptor[codec_id], 0);
1653             }
1654         }
1655         if (descriptor->extradata) {
1656             st->codec->extradata = av_mallocz(descriptor->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
1657             if (st->codec->extradata) {
1658                 memcpy(st->codec->extradata, descriptor->extradata, descriptor->extradata_size);
1659                 st->codec->extradata_size = descriptor->extradata_size;
1660             }
1661         } else if (st->codec->codec_id == AV_CODEC_ID_H264) {
1662             ret = ff_generate_avci_extradata(st);
1663             if (ret < 0)
1664                 return ret;
1665         }
1666         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1667             /* TODO: decode timestamps */
1668             st->need_parsing = AVSTREAM_PARSE_TIMESTAMPS;
1669         }
1670     }
1671
1672     ret = 0;
1673 fail_and_free:
1674     return ret;
1675 }
1676
1677 static int mxf_read_utf16_string(AVIOContext *pb, int size, char** str)
1678 {
1679     int ret;
1680     size_t buf_size;
1681
1682     if (size < 0)
1683         return AVERROR(EINVAL);
1684
1685     buf_size = size + size / 2 + 1;
1686     *str = av_malloc(buf_size);
1687     if (!*str)
1688         return AVERROR(ENOMEM);
1689
1690     if ((ret = avio_get_str16be(pb, size, *str, buf_size)) < 0) {
1691         av_freep(str);
1692         return ret;
1693     }
1694
1695     return ret;
1696 }
1697
1698 static int mxf_uid_to_str(UID uid, char **str)
1699 {
1700     int i;
1701     char *p;
1702     p = *str = av_mallocz(sizeof(UID) * 2 + 4 + 1);
1703     if (!p)
1704         return AVERROR(ENOMEM);
1705     for (i = 0; i < sizeof(UID); i++) {
1706         snprintf(p, 2 + 1, "%.2x", uid[i]);
1707         p += 2;
1708         if (i == 3 || i == 5 || i == 7 || i == 9) {
1709             snprintf(p, 1 + 1, "-");
1710             p++;
1711         }
1712     }
1713     return 0;
1714 }
1715
1716 static int mxf_timestamp_to_str(uint64_t timestamp, char **str)
1717 {
1718     struct tm time = { 0 };
1719     time.tm_year = (timestamp >> 48) - 1900;
1720     time.tm_mon  = (timestamp >> 40 & 0xFF) - 1;
1721     time.tm_mday = (timestamp >> 32 & 0xFF);
1722     time.tm_hour = (timestamp >> 24 & 0xFF);
1723     time.tm_min  = (timestamp >> 16 & 0xFF);
1724     time.tm_sec  = (timestamp >> 8  & 0xFF);
1725
1726     /* msvcrt versions of strftime calls the invalid parameter handler
1727      * (aborting the process if one isn't set) if the parameters are out
1728      * of range. */
1729     time.tm_mon  = av_clip(time.tm_mon,  0, 11);
1730     time.tm_mday = av_clip(time.tm_mday, 1, 31);
1731     time.tm_hour = av_clip(time.tm_hour, 0, 23);
1732     time.tm_min  = av_clip(time.tm_min,  0, 59);
1733     time.tm_sec  = av_clip(time.tm_sec,  0, 59);
1734
1735     *str = av_mallocz(32);
1736     if (!*str)
1737         return AVERROR(ENOMEM);
1738     strftime(*str, 32, "%Y-%m-%d %H:%M:%S", &time);
1739
1740     return 0;
1741 }
1742
1743 #define SET_STR_METADATA(pb, name, str) do { \
1744     if ((ret = mxf_read_utf16_string(pb, size, &str)) < 0) \
1745         return ret; \
1746     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1747 } while (0)
1748
1749 #define SET_UID_METADATA(pb, name, var, str) do { \
1750     avio_read(pb, var, 16); \
1751     if ((ret = mxf_uid_to_str(var, &str)) < 0) \
1752         return ret; \
1753     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1754 } while (0)
1755
1756 #define SET_TS_METADATA(pb, name, var, str) do { \
1757     var = avio_rb64(pb); \
1758     if ((ret = mxf_timestamp_to_str(var, &str)) < 0) \
1759         return ret; \
1760     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1761 } while (0)
1762
1763 static int mxf_read_identification_metadata(void *arg, AVIOContext *pb, int tag, int size, UID _uid, int64_t klv_offset)
1764 {
1765     MXFContext *mxf = arg;
1766     AVFormatContext *s = mxf->fc;
1767     int ret;
1768     UID uid = { 0 };
1769     char *str = NULL;
1770     uint64_t ts;
1771     switch (tag) {
1772     case 0x3C01:
1773         SET_STR_METADATA(pb, "company_name", str);
1774         break;
1775     case 0x3C02:
1776         SET_STR_METADATA(pb, "product_name", str);
1777         break;
1778     case 0x3C04:
1779         SET_STR_METADATA(pb, "product_version", str);
1780         break;
1781     case 0x3C05:
1782         SET_UID_METADATA(pb, "product_uid", uid, str);
1783         break;
1784     case 0x3C06:
1785         SET_TS_METADATA(pb, "modification_date", ts, str);
1786         break;
1787     case 0x3C08:
1788         SET_STR_METADATA(pb, "application_platform", str);
1789         break;
1790     case 0x3C09:
1791         SET_UID_METADATA(pb, "generation_uid", uid, str);
1792         break;
1793     case 0x3C0A:
1794         SET_UID_METADATA(pb, "uid", uid, str);
1795         break;
1796     }
1797     return 0;
1798 }
1799
1800 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1801     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1802 //    { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x2f,0x00 }, mxf_read_preface_pack },
1803     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1804     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1805     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1806     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1807     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1808     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1809     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1810     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1811     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1812     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1813     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x30,0x00 }, mxf_read_identification_metadata },
1814     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1815     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1816     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1817     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1818     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1819     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1820     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1821     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1822     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1823     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1824     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1825     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1826     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG2VideoDescriptor */
1827     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x5c,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* VANC/VBI - SMPTE 436M */
1828     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x5e,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG2AudioDescriptor */
1829     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1830     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1831     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1832     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1833     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1834 };
1835
1836 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1837 {
1838     AVIOContext *pb = mxf->fc->pb;
1839     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1840     uint64_t klv_end = avio_tell(pb) + klv->length;
1841
1842     if (!ctx)
1843         return AVERROR(ENOMEM);
1844     while (avio_tell(pb) + 4 < klv_end && !pb->eof_reached) {
1845         int ret;
1846         int tag = avio_rb16(pb);
1847         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1848         uint64_t next = avio_tell(pb) + size;
1849         UID uid = {0};
1850
1851         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1852         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1853             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1854             continue;
1855         }
1856         if (tag > 0x7FFF) { /* dynamic tag */
1857             int i;
1858             for (i = 0; i < mxf->local_tags_count; i++) {
1859                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1860                 if (local_tag == tag) {
1861                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1862                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1863                     PRINT_KEY(mxf->fc, "uid", uid);
1864                 }
1865             }
1866         }
1867         if (ctx_size && tag == 0x3C0A)
1868             avio_read(pb, ctx->uid, 16);
1869         else if ((ret = read_child(ctx, pb, tag, size, uid, -1)) < 0)
1870             return ret;
1871
1872         /* Accept the 64k local set limit being exceeded (Avid). Don't accept
1873          * it extending past the end of the KLV though (zzuf5.mxf). */
1874         if (avio_tell(pb) > klv_end) {
1875             if (ctx_size)
1876                 av_free(ctx);
1877
1878             av_log(mxf->fc, AV_LOG_ERROR,
1879                    "local tag %#04x extends past end of local set @ %#"PRIx64"\n",
1880                    tag, klv->offset);
1881             return AVERROR_INVALIDDATA;
1882         } else if (avio_tell(pb) <= next)   /* only seek forward, else this can loop for a long time */
1883             avio_seek(pb, next, SEEK_SET);
1884     }
1885     if (ctx_size) ctx->type = type;
1886     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1887 }
1888
1889 /**
1890  * Seeks to the previous partition, if possible
1891  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1892  */
1893 static int mxf_seek_to_previous_partition(MXFContext *mxf)
1894 {
1895     AVIOContext *pb = mxf->fc->pb;
1896
1897     if (!mxf->current_partition ||
1898         mxf->run_in + mxf->current_partition->previous_partition <= mxf->last_forward_tell)
1899         return 0;   /* we've parsed all partitions */
1900
1901     /* seek to previous partition */
1902     avio_seek(pb, mxf->run_in + mxf->current_partition->previous_partition, SEEK_SET);
1903     mxf->current_partition = NULL;
1904
1905     av_dlog(mxf->fc, "seeking to previous partition\n");
1906
1907     return 1;
1908 }
1909
1910 /**
1911  * Called when essence is encountered
1912  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1913  */
1914 static int mxf_parse_handle_essence(MXFContext *mxf)
1915 {
1916     AVIOContext *pb = mxf->fc->pb;
1917     int64_t ret;
1918
1919     if (mxf->parsing_backward) {
1920         return mxf_seek_to_previous_partition(mxf);
1921     } else {
1922         uint64_t offset = mxf->footer_partition ? mxf->footer_partition
1923                                                 : mxf->last_partition;
1924
1925         if (!offset) {
1926             av_dlog(mxf->fc, "no last partition\n");
1927             return 0;
1928         }
1929
1930         av_dlog(mxf->fc, "seeking to last partition\n");
1931
1932         /* remember where we were so we don't end up seeking further back than this */
1933         mxf->last_forward_tell = avio_tell(pb);
1934
1935         if (!pb->seekable) {
1936             av_log(mxf->fc, AV_LOG_INFO, "file is not seekable - not parsing last partition\n");
1937             return -1;
1938         }
1939
1940         /* seek to last partition and parse backward */
1941         if ((ret = avio_seek(pb, mxf->run_in + offset, SEEK_SET)) < 0) {
1942             av_log(mxf->fc, AV_LOG_ERROR,
1943                    "failed to seek to last partition @ 0x%" PRIx64
1944                    " (%"PRId64") - partial file?\n",
1945                    mxf->run_in + offset, ret);
1946             return ret;
1947         }
1948
1949         mxf->current_partition = NULL;
1950         mxf->parsing_backward = 1;
1951     }
1952
1953     return 1;
1954 }
1955
1956 /**
1957  * Called when the next partition or EOF is encountered
1958  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1959  */
1960 static int mxf_parse_handle_partition_or_eof(MXFContext *mxf)
1961 {
1962     return mxf->parsing_backward ? mxf_seek_to_previous_partition(mxf) : 1;
1963 }
1964
1965 /**
1966  * Figure out the proper offset and length of the essence container
1967  * in each partition
1968  */
1969 static void mxf_compute_essence_containers(MXFContext *mxf)
1970 {
1971     int x;
1972
1973     /* everything is already correct */
1974     if (mxf->op == OPAtom)
1975         return;
1976
1977     for (x = 0; x < mxf->partitions_count; x++) {
1978         MXFPartition *p = &mxf->partitions[x];
1979
1980         if (!p->body_sid)
1981             continue;       /* BodySID == 0 -> no essence */
1982
1983         if (x >= mxf->partitions_count - 1)
1984             break;          /* last partition - can't compute length (and we don't need to) */
1985
1986         /* essence container spans to the next partition */
1987         p->essence_length = mxf->partitions[x+1].this_partition - p->essence_offset;
1988
1989         if (p->essence_length < 0) {
1990             /* next ThisPartition < essence_offset */
1991             p->essence_length = 0;
1992             av_log(mxf->fc, AV_LOG_ERROR,
1993                    "partition %i: bad ThisPartition = %"PRIX64"\n",
1994                    x+1, mxf->partitions[x+1].this_partition);
1995         }
1996     }
1997 }
1998
1999 static int64_t round_to_kag(int64_t position, int kag_size)
2000 {
2001     /* TODO: account for run-in? the spec isn't clear whether KAG should account for it */
2002     /* NOTE: kag_size may be any integer between 1 - 2^10 */
2003     int64_t ret = (position / kag_size) * kag_size;
2004     return ret == position ? ret : ret + kag_size;
2005 }
2006
2007 static inline void compute_partition_essence_offset(AVFormatContext *s,
2008                                                     MXFContext *mxf,
2009                                                     KLVPacket *klv)
2010 {
2011     MXFPartition *cur_part = mxf->current_partition;
2012     /* for OP1a we compute essence_offset
2013      * for OPAtom we point essence_offset after the KL
2014      *     (usually op1a_essence_offset + 20 or 25)
2015      * TODO: for OP1a we could eliminate this entire if statement, always
2016      *       stopping parsing at op1a_essence_offset
2017      *       for OPAtom we still need the actual essence_offset though
2018      *       (the KL's length can vary)
2019      */
2020     int64_t op1a_essence_offset =
2021         round_to_kag(cur_part->this_partition + cur_part->pack_length,
2022                      cur_part->kag_size) +
2023         round_to_kag(cur_part->header_byte_count, cur_part->kag_size) +
2024         round_to_kag(cur_part->index_byte_count, cur_part->kag_size);
2025
2026     if (mxf->op == OPAtom) {
2027         /* point essence_offset to the actual data
2028          * OPAtom has all the essence in one big KLV
2029          */
2030         cur_part->essence_offset = avio_tell(s->pb);
2031         cur_part->essence_length = klv->length;
2032     } else {
2033         /* NOTE: op1a_essence_offset may be less than to klv.offset
2034          * (C0023S01.mxf)  */
2035         cur_part->essence_offset = op1a_essence_offset;
2036     }
2037 }
2038
2039 static int is_pcm(enum AVCodecID codec_id)
2040 {
2041     /* we only care about "normal" PCM codecs until we get samples */
2042     return codec_id >= AV_CODEC_ID_PCM_S16LE && codec_id < AV_CODEC_ID_PCM_S24DAUD;
2043 }
2044
2045 /**
2046  * Deal with the case where for some audio atoms EditUnitByteCount is
2047  * very small (2, 4..). In those cases we should read more than one
2048  * sample per call to mxf_read_packet().
2049  */
2050 static void mxf_handle_small_eubc(AVFormatContext *s)
2051 {
2052     MXFContext *mxf = s->priv_data;
2053
2054     /* assuming non-OPAtom == frame wrapped
2055      * no sane writer would wrap 2 byte PCM packets with 20 byte headers.. */
2056     if (mxf->op != OPAtom)
2057         return;
2058
2059     /* expect PCM with exactly one index table segment and a small (< 32) EUBC */
2060     if (s->nb_streams != 1                                     ||
2061         s->streams[0]->codec->codec_type != AVMEDIA_TYPE_AUDIO ||
2062         !is_pcm(s->streams[0]->codec->codec_id)                ||
2063         mxf->nb_index_tables != 1                              ||
2064         mxf->index_tables[0].nb_segments != 1                  ||
2065         mxf->index_tables[0].segments[0]->edit_unit_byte_count >= 32)
2066         return;
2067
2068     /* arbitrarily default to 48 kHz PAL audio frame size */
2069     /* TODO: We could compute this from the ratio between the audio
2070      *       and video edit rates for 48 kHz NTSC we could use the
2071      *       1802-1802-1802-1802-1801 pattern. */
2072     mxf->edit_units_per_packet = 1920;
2073 }
2074
2075 static void mxf_read_random_index_pack(AVFormatContext *s)
2076 {
2077     MXFContext *mxf = s->priv_data;
2078     uint32_t length;
2079     int64_t file_size;
2080     KLVPacket klv;
2081
2082     if (!s->pb->seekable)
2083         return;
2084
2085     file_size = avio_size(s->pb);
2086     avio_seek(s->pb, file_size - 4, SEEK_SET);
2087     length = avio_rb32(s->pb);
2088     if (length <= 32 || length >= FFMIN(file_size, INT_MAX))
2089         goto end;
2090     avio_seek(s->pb, file_size - length, SEEK_SET);
2091     if (klv_read_packet(&klv, s->pb) < 0 ||
2092         !IS_KLV_KEY(klv.key, mxf_random_index_pack_key) ||
2093         klv.length != length - 20)
2094         goto end;
2095
2096     avio_skip(s->pb, klv.length - 12);
2097     mxf->last_partition = avio_rb64(s->pb);
2098
2099 end:
2100     avio_seek(s->pb, mxf->run_in, SEEK_SET);
2101 }
2102
2103 static int mxf_read_header(AVFormatContext *s)
2104 {
2105     MXFContext *mxf = s->priv_data;
2106     KLVPacket klv;
2107     int64_t essence_offset = 0;
2108     int ret;
2109
2110     mxf->last_forward_tell = INT64_MAX;
2111     mxf->edit_units_per_packet = 1;
2112
2113     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
2114         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
2115         return AVERROR_INVALIDDATA;
2116     }
2117     avio_seek(s->pb, -14, SEEK_CUR);
2118     mxf->fc = s;
2119     mxf->run_in = avio_tell(s->pb);
2120
2121     mxf_read_random_index_pack(s);
2122
2123     while (!s->pb->eof_reached) {
2124
2125         const MXFMetadataReadTableEntry *metadata;
2126
2127         if (klv_read_packet(&klv, s->pb) < 0) {
2128             /* EOF - seek to previous partition or stop */
2129             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
2130                 break;
2131             else
2132                 continue;
2133         }
2134
2135         PRINT_KEY(s, "read header", klv.key);
2136         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2137         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
2138             IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2139             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key) ||
2140             IS_KLV_KEY(klv.key, mxf_system_item_key)) {
2141
2142             if (!mxf->current_partition) {
2143                 av_log(mxf->fc, AV_LOG_ERROR,
2144                        "found essence prior to first PartitionPack\n");
2145                 return AVERROR_INVALIDDATA;
2146             }
2147
2148             if (!mxf->current_partition->essence_offset) {
2149                 compute_partition_essence_offset(s, mxf, &klv);
2150             }
2151
2152             if (!essence_offset)
2153                 essence_offset = klv.offset;
2154
2155             /* seek to footer, previous partition or stop */
2156             if (mxf_parse_handle_essence(mxf) <= 0)
2157                 break;
2158             continue;
2159         } else if (!memcmp(klv.key, mxf_header_partition_pack_key, 13) &&
2160                    klv.key[13] >= 2 && klv.key[13] <= 4 && mxf->current_partition) {
2161             /* next partition pack - keep going, seek to previous partition or stop */
2162             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
2163                 break;
2164             else if (mxf->parsing_backward)
2165                 continue;
2166             /* we're still parsing forward. proceed to parsing this partition pack */
2167         }
2168
2169         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
2170             if (IS_KLV_KEY(klv.key, metadata->key)) {
2171                 int res;
2172                 if (klv.key[5] == 0x53) {
2173                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
2174                 } else {
2175                     uint64_t next = avio_tell(s->pb) + klv.length;
2176                     res = metadata->read(mxf, s->pb, 0, klv.length, klv.key, klv.offset);
2177
2178                     /* only seek forward, else this can loop for a long time */
2179                     if (avio_tell(s->pb) > next) {
2180                         av_log(s, AV_LOG_ERROR, "read past end of KLV @ %#"PRIx64"\n",
2181                                klv.offset);
2182                         return AVERROR_INVALIDDATA;
2183                     }
2184
2185                     avio_seek(s->pb, next, SEEK_SET);
2186                 }
2187                 if (res < 0) {
2188                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
2189                     return res;
2190                 }
2191                 break;
2192             } else {
2193                 av_log(s, AV_LOG_VERBOSE, "Dark key " PRIxUID "\n",
2194                        UID_ARG(klv.key));
2195             }
2196         }
2197         if (!metadata->read)
2198             avio_skip(s->pb, klv.length);
2199     }
2200     /* FIXME avoid seek */
2201     if (!essence_offset)  {
2202         av_log(s, AV_LOG_ERROR, "no essence\n");
2203         return AVERROR_INVALIDDATA;
2204     }
2205     avio_seek(s->pb, essence_offset, SEEK_SET);
2206
2207     mxf_compute_essence_containers(mxf);
2208
2209     /* we need to do this before computing the index tables
2210      * to be able to fill in zero IndexDurations with st->duration */
2211     if ((ret = mxf_parse_structural_metadata(mxf)) < 0)
2212         return ret;
2213
2214     if ((ret = mxf_compute_index_tables(mxf)) < 0)
2215         return ret;
2216
2217     if (mxf->nb_index_tables > 1) {
2218         /* TODO: look up which IndexSID to use via EssenceContainerData */
2219         av_log(mxf->fc, AV_LOG_INFO, "got %i index tables - only the first one (IndexSID %i) will be used\n",
2220                mxf->nb_index_tables, mxf->index_tables[0].index_sid);
2221     } else if (mxf->nb_index_tables == 0 && mxf->op == OPAtom) {
2222         av_log(mxf->fc, AV_LOG_ERROR, "cannot demux OPAtom without an index\n");
2223         return AVERROR_INVALIDDATA;
2224     }
2225
2226     mxf_handle_small_eubc(s);
2227
2228     return 0;
2229 }
2230
2231 /**
2232  * Sets mxf->current_edit_unit based on what offset we're currently at.
2233  * @return next_ofs if OK, <0 on error
2234  */
2235 static int64_t mxf_set_current_edit_unit(MXFContext *mxf, int64_t current_offset)
2236 {
2237     int64_t last_ofs = -1, next_ofs = -1;
2238     MXFIndexTable *t = &mxf->index_tables[0];
2239
2240     /* this is called from the OP1a demuxing logic, which means there
2241      * may be no index tables */
2242     if (mxf->nb_index_tables <= 0)
2243         return -1;
2244
2245     /* find mxf->current_edit_unit so that the next edit unit starts ahead
2246      * of current_offset */
2247     while (mxf->current_edit_unit >= 0) {
2248         if (mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + 1,
2249                                           NULL, &next_ofs, 0) < 0)
2250             return -1;
2251
2252         if (next_ofs <= last_ofs) {
2253             /* large next_ofs didn't change or current_edit_unit wrapped
2254              * around this fixes the infinite loop on zzuf3.mxf */
2255             av_log(mxf->fc, AV_LOG_ERROR,
2256                    "next_ofs didn't change. not deriving packet timestamps\n");
2257             return -1;
2258         }
2259
2260         if (next_ofs > current_offset)
2261             break;
2262
2263         last_ofs = next_ofs;
2264         mxf->current_edit_unit++;
2265     }
2266
2267     /* not checking mxf->current_edit_unit >= t->nb_ptses here since CBR files
2268      * may lack IndexEntryArrays */
2269     if (mxf->current_edit_unit < 0)
2270         return -1;
2271
2272     return next_ofs;
2273 }
2274
2275 static int mxf_compute_sample_count(MXFContext *mxf, int stream_index,
2276                                     uint64_t *sample_count)
2277 {
2278     int i, total = 0, size = 0;
2279     AVStream *st = mxf->fc->streams[stream_index];
2280     MXFTrack *track = st->priv_data;
2281     AVRational time_base = av_inv_q(track->edit_rate);
2282     AVRational sample_rate = av_inv_q(st->time_base);
2283     const MXFSamplesPerFrame *spf = NULL;
2284
2285     if ((sample_rate.num / sample_rate.den) == 48000)
2286         spf = ff_mxf_get_samples_per_frame(mxf->fc, time_base);
2287     if (!spf) {
2288         int remainder = (sample_rate.num * time_base.num) %
2289                         (time_base.den * sample_rate.den);
2290         *sample_count = av_q2d(av_mul_q((AVRational){mxf->current_edit_unit, 1},
2291                                         av_mul_q(sample_rate, time_base)));
2292         if (remainder)
2293             av_log(mxf->fc, AV_LOG_WARNING,
2294                    "seeking detected on stream #%d with time base (%d/%d) and "
2295                    "sample rate (%d/%d), audio pts won't be accurate.\n",
2296                    stream_index, time_base.num, time_base.den,
2297                    sample_rate.num, sample_rate.den);
2298         return 0;
2299     }
2300
2301     while (spf->samples_per_frame[size]) {
2302         total += spf->samples_per_frame[size];
2303         size++;
2304     }
2305
2306     if (!size)
2307         return 0;
2308
2309     *sample_count = (mxf->current_edit_unit / size) * (uint64_t)total;
2310     for (i = 0; i < mxf->current_edit_unit % size; i++) {
2311         *sample_count += spf->samples_per_frame[i];
2312     }
2313
2314     return 0;
2315 }
2316
2317 static int mxf_set_audio_pts(MXFContext *mxf, AVCodecContext *codec,
2318                              AVPacket *pkt)
2319 {
2320     MXFTrack *track = mxf->fc->streams[pkt->stream_index]->priv_data;
2321     int64_t bits_per_sample = codec->bits_per_coded_sample;
2322
2323     if (!bits_per_sample)
2324         bits_per_sample = av_get_bits_per_sample(codec->codec_id);
2325
2326     pkt->pts = track->sample_count;
2327
2328     if (codec->channels <= 0 || codec->channels * bits_per_sample < 8)
2329         return AVERROR_INVALIDDATA;
2330
2331     track->sample_count += pkt->size / (codec->channels * bits_per_sample / 8);
2332     return 0;
2333 }
2334
2335 static int mxf_read_packet_old(AVFormatContext *s, AVPacket *pkt)
2336 {
2337     KLVPacket klv;
2338     MXFContext *mxf = s->priv_data;
2339     int ret;
2340
2341     while (!s->pb->eof_reached) {
2342         if ((ret = klv_read_packet(&klv, s->pb)) < 0)
2343             return ret;
2344         PRINT_KEY(s, "read packet", klv.key);
2345         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2346         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
2347             ret = mxf_decrypt_triplet(s, pkt, &klv);
2348             if (ret < 0) {
2349                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
2350                 return ret;
2351             }
2352             return 0;
2353         }
2354         if (IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2355             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key)) {
2356             int index = mxf_get_stream_index(s, &klv);
2357             int64_t next_ofs, next_klv;
2358             AVStream *st;
2359             MXFTrack *track;
2360             AVCodecContext *codec;
2361
2362             if (index < 0) {
2363                 av_log(s, AV_LOG_ERROR,
2364                        "error getting stream index %"PRIu32"\n",
2365                        AV_RB32(klv.key + 12));
2366                 goto skip;
2367             }
2368
2369             st = s->streams[index];
2370             track = st->priv_data;
2371
2372             if (s->streams[index]->discard == AVDISCARD_ALL)
2373                 goto skip;
2374
2375             next_klv = avio_tell(s->pb) + klv.length;
2376             next_ofs = mxf_set_current_edit_unit(mxf, klv.offset);
2377
2378             if (next_ofs >= 0 && next_klv > next_ofs) {
2379                 /* if this check is hit then it's possible OPAtom was treated
2380                  * as OP1a truncate the packet since it's probably very large
2381                  * (>2 GiB is common) */
2382                 avpriv_request_sample(s,
2383                                       "OPAtom misinterpreted as OP1a?"
2384                                       "KLV for edit unit %i extending into "
2385                                       "next edit unit",
2386                                       mxf->current_edit_unit);
2387                 klv.length = next_ofs - avio_tell(s->pb);
2388             }
2389
2390             /* check for 8 channels AES3 element */
2391             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
2392                 ret = mxf_get_d10_aes3_packet(s->pb, s->streams[index],
2393                                               pkt, klv.length);
2394                 if (ret < 0) {
2395                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
2396                     return ret;
2397                 }
2398             } else {
2399                 ret = av_get_packet(s->pb, pkt, klv.length);
2400                 if (ret < 0)
2401                     return ret;
2402             }
2403             pkt->stream_index = index;
2404             pkt->pos = klv.offset;
2405
2406             codec = s->streams[index]->codec;
2407
2408             if (codec->codec_type == AVMEDIA_TYPE_VIDEO && next_ofs >= 0) {
2409                 /* mxf->current_edit_unit good - see if we have an
2410                  * index table to derive timestamps from */
2411                 MXFIndexTable *t = &mxf->index_tables[0];
2412
2413                 if (mxf->nb_index_tables >= 1 &&
2414                     mxf->current_edit_unit < t->nb_ptses) {
2415                     pkt->dts = mxf->current_edit_unit + t->first_dts;
2416                     pkt->pts = t->ptses[mxf->current_edit_unit];
2417                 } else if (track->intra_only) {
2418                     /* intra-only -> PTS = EditUnit.
2419                      * let utils.c figure out DTS since it can be
2420                      * < PTS if low_delay = 0 (Sony IMX30) */
2421                     pkt->pts = mxf->current_edit_unit;
2422                 }
2423             } else if (codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2424                 ret = mxf_set_audio_pts(mxf, codec, pkt);
2425                 if (ret < 0)
2426                     return ret;
2427             }
2428
2429             /* seek for truncated packets */
2430             avio_seek(s->pb, next_klv, SEEK_SET);
2431
2432             return 0;
2433         } else
2434         skip:
2435             avio_skip(s->pb, klv.length);
2436     }
2437     return AVERROR_EOF;
2438 }
2439
2440 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
2441 {
2442     MXFContext *mxf = s->priv_data;
2443     int ret, size;
2444     int64_t ret64, pos, next_pos;
2445     AVStream *st;
2446     MXFIndexTable *t;
2447     int edit_units;
2448
2449     if (mxf->op != OPAtom)
2450         return mxf_read_packet_old(s, pkt);
2451
2452     /* OPAtom - clip wrapped demuxing */
2453     /* NOTE: mxf_read_header() makes sure nb_index_tables > 0 for OPAtom */
2454     st = s->streams[0];
2455     t = &mxf->index_tables[0];
2456
2457     if (mxf->current_edit_unit >= st->duration)
2458         return AVERROR_EOF;
2459
2460     edit_units = FFMIN(mxf->edit_units_per_packet, st->duration - mxf->current_edit_unit);
2461
2462     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit, NULL, &pos, 1)) < 0)
2463         return ret;
2464
2465     /* compute size by finding the next edit unit or the end of the essence container
2466      * not pretty, but it works */
2467     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + edit_units, NULL, &next_pos, 0)) < 0 &&
2468         (next_pos = mxf_essence_container_end(mxf, t->body_sid)) <= 0) {
2469         av_log(s, AV_LOG_ERROR, "unable to compute the size of the last packet\n");
2470         return AVERROR_INVALIDDATA;
2471     }
2472
2473     if ((size = next_pos - pos) <= 0) {
2474         av_log(s, AV_LOG_ERROR, "bad size: %i\n", size);
2475         return AVERROR_INVALIDDATA;
2476     }
2477
2478     if ((ret64 = avio_seek(s->pb, pos, SEEK_SET)) < 0)
2479         return ret64;
2480
2481         if ((ret = av_get_packet(s->pb, pkt, size)) != size)
2482             return ret < 0 ? ret : AVERROR_EOF;
2483
2484     pkt->stream_index = 0;
2485
2486     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO && t->ptses &&
2487         mxf->current_edit_unit >= 0 && mxf->current_edit_unit < t->nb_ptses) {
2488         pkt->dts = mxf->current_edit_unit + t->first_dts;
2489         pkt->pts = t->ptses[mxf->current_edit_unit];
2490     } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2491         int ret = mxf_set_audio_pts(mxf, st->codec, pkt);
2492         if (ret < 0)
2493             return ret;
2494     }
2495
2496     mxf->current_edit_unit += edit_units;
2497
2498     return 0;
2499 }
2500
2501
2502 static int mxf_read_close(AVFormatContext *s)
2503 {
2504     MXFContext *mxf = s->priv_data;
2505     MXFIndexTableSegment *seg;
2506     int i;
2507
2508     av_freep(&mxf->packages_refs);
2509
2510     for (i = 0; i < s->nb_streams; i++)
2511         s->streams[i]->priv_data = NULL;
2512
2513     for (i = 0; i < mxf->metadata_sets_count; i++) {
2514         switch (mxf->metadata_sets[i]->type) {
2515         case Descriptor:
2516             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->extradata);
2517             break;
2518         case MultipleDescriptor:
2519             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
2520             break;
2521         case Sequence:
2522             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
2523             break;
2524         case SourcePackage:
2525         case MaterialPackage:
2526             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
2527             break;
2528         case IndexTableSegment:
2529             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
2530             av_freep(&seg->temporal_offset_entries);
2531             av_freep(&seg->flag_entries);
2532             av_freep(&seg->stream_offset_entries);
2533             break;
2534         default:
2535             break;
2536         }
2537         av_freep(&mxf->metadata_sets[i]);
2538     }
2539     av_freep(&mxf->partitions);
2540     av_freep(&mxf->metadata_sets);
2541     av_freep(&mxf->aesc);
2542     av_freep(&mxf->local_tags);
2543
2544     for (i = 0; i < mxf->nb_index_tables; i++) {
2545         av_freep(&mxf->index_tables[i].segments);
2546         av_freep(&mxf->index_tables[i].ptses);
2547         av_freep(&mxf->index_tables[i].fake_index);
2548     }
2549     av_freep(&mxf->index_tables);
2550
2551     return 0;
2552 }
2553
2554 static int mxf_probe(AVProbeData *p) {
2555     uint8_t *bufp = p->buf;
2556     uint8_t *end = p->buf + p->buf_size;
2557
2558     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
2559         return 0;
2560
2561     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
2562     end -= sizeof(mxf_header_partition_pack_key);
2563     for (; bufp < end; bufp++) {
2564         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
2565             return AVPROBE_SCORE_MAX;
2566     }
2567     return 0;
2568 }
2569
2570 /* rudimentary byte seek */
2571 /* XXX: use MXF Index */
2572 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
2573 {
2574     AVStream *st = s->streams[stream_index];
2575     int64_t seconds;
2576     MXFContext* mxf = s->priv_data;
2577     int64_t seekpos;
2578     int i, ret;
2579     MXFIndexTable *t;
2580     MXFTrack *source_track = st->priv_data;
2581
2582     /* if audio then truncate sample_time to EditRate */
2583     if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO)
2584         sample_time = av_rescale_q(sample_time, st->time_base,
2585                                    av_inv_q(source_track->edit_rate));
2586
2587     if (mxf->nb_index_tables <= 0) {
2588     if (!s->bit_rate)
2589         return AVERROR_INVALIDDATA;
2590     if (sample_time < 0)
2591         sample_time = 0;
2592     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
2593
2594     seekpos = avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET);
2595     if (seekpos < 0)
2596         return seekpos;
2597
2598     ff_update_cur_dts(s, st, sample_time);
2599     mxf->current_edit_unit = sample_time;
2600     } else {
2601         t = &mxf->index_tables[0];
2602
2603         /* clamp above zero, else ff_index_search_timestamp() returns negative
2604          * this also means we allow seeking before the start */
2605         sample_time = FFMAX(sample_time, 0);
2606
2607         if (t->fake_index) {
2608             /* behave as if we have a proper index */
2609             if ((sample_time = ff_index_search_timestamp(t->fake_index, t->nb_ptses, sample_time, flags)) < 0)
2610                 return sample_time;
2611         } else {
2612             /* no IndexEntryArray (one or more CBR segments)
2613              * make sure we don't seek past the end */
2614             sample_time = FFMIN(sample_time, source_track->original_duration - 1);
2615         }
2616
2617         if ((ret = mxf_edit_unit_absolute_offset(mxf, t, sample_time, &sample_time, &seekpos, 1)) << 0)
2618             return ret;
2619
2620         ff_update_cur_dts(s, st, sample_time);
2621         mxf->current_edit_unit = sample_time;
2622         avio_seek(s->pb, seekpos, SEEK_SET);
2623     }
2624
2625     // Update all tracks sample count
2626     for (i = 0; i < s->nb_streams; i++) {
2627         AVStream *cur_st = s->streams[i];
2628         MXFTrack *cur_track = cur_st->priv_data;
2629         uint64_t current_sample_count = 0;
2630         if (cur_st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2631             ret = mxf_compute_sample_count(mxf, i, &current_sample_count);
2632             if (ret < 0)
2633                 return ret;
2634
2635             cur_track->sample_count = current_sample_count;
2636         }
2637     }
2638     return 0;
2639 }
2640
2641 AVInputFormat ff_mxf_demuxer = {
2642     .name           = "mxf",
2643     .long_name      = NULL_IF_CONFIG_SMALL("MXF (Material eXchange Format)"),
2644     .priv_data_size = sizeof(MXFContext),
2645     .read_probe     = mxf_probe,
2646     .read_header    = mxf_read_header,
2647     .read_packet    = mxf_read_packet,
2648     .read_close     = mxf_read_close,
2649     .read_seek      = mxf_read_seek,
2650 };