Imported Upstream version 6.1
[platform/upstream/ffmpeg.git] / libavfilter / af_amerge.c
1 /*
2  * Copyright (c) 2011 Nicolas George <nicolas.george@normalesup.org>
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  * GNU Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file
23  * Audio merging filter
24  */
25
26 #include "libavutil/avstring.h"
27 #include "libavutil/bprint.h"
28 #include "libavutil/channel_layout.h"
29 #include "libavutil/opt.h"
30 #include "avfilter.h"
31 #include "filters.h"
32 #include "audio.h"
33 #include "formats.h"
34 #include "internal.h"
35
36 #define SWR_CH_MAX 64
37
38 typedef struct AMergeContext {
39     const AVClass *class;
40     int nb_inputs;
41     int route[SWR_CH_MAX]; /**< channels routing, see copy_samples */
42     int bps;
43     struct amerge_input {
44         int nb_ch;         /**< number of channels for the input */
45     } *in;
46 } AMergeContext;
47
48 #define OFFSET(x) offsetof(AMergeContext, x)
49 #define FLAGS AV_OPT_FLAG_AUDIO_PARAM|AV_OPT_FLAG_FILTERING_PARAM
50
51 static const AVOption amerge_options[] = {
52     { "inputs", "specify the number of inputs", OFFSET(nb_inputs),
53       AV_OPT_TYPE_INT, { .i64 = 2 }, 1, SWR_CH_MAX, FLAGS },
54     { NULL }
55 };
56
57 AVFILTER_DEFINE_CLASS(amerge);
58
59 static av_cold void uninit(AVFilterContext *ctx)
60 {
61     AMergeContext *s = ctx->priv;
62
63     av_freep(&s->in);
64 }
65
66 static int query_formats(AVFilterContext *ctx)
67 {
68     static const enum AVSampleFormat packed_sample_fmts[] = {
69         AV_SAMPLE_FMT_U8,
70         AV_SAMPLE_FMT_S16,
71         AV_SAMPLE_FMT_S32,
72         AV_SAMPLE_FMT_FLT,
73         AV_SAMPLE_FMT_DBL,
74         AV_SAMPLE_FMT_NONE
75     };
76     AMergeContext *s = ctx->priv;
77     AVChannelLayout *inlayout[SWR_CH_MAX] = { NULL }, outlayout = { 0 };
78     uint64_t outmask = 0;
79     AVFilterChannelLayouts *layouts;
80     int i, ret, overlap = 0, nb_ch = 0;
81
82     for (i = 0; i < s->nb_inputs; i++) {
83         if (!ctx->inputs[i]->incfg.channel_layouts ||
84             !ctx->inputs[i]->incfg.channel_layouts->nb_channel_layouts) {
85             av_log(ctx, AV_LOG_WARNING,
86                    "No channel layout for input %d\n", i + 1);
87             return AVERROR(EAGAIN);
88         }
89         inlayout[i] = &ctx->inputs[i]->incfg.channel_layouts->channel_layouts[0];
90         if (ctx->inputs[i]->incfg.channel_layouts->nb_channel_layouts > 1) {
91             char buf[256];
92             av_channel_layout_describe(inlayout[i], buf, sizeof(buf));
93             av_log(ctx, AV_LOG_INFO, "Using \"%s\" for input %d\n", buf, i + 1);
94         }
95         s->in[i].nb_ch = FF_LAYOUT2COUNT(inlayout[i]);
96         if (s->in[i].nb_ch) {
97             overlap++;
98         } else {
99             s->in[i].nb_ch = inlayout[i]->nb_channels;
100             if (av_channel_layout_subset(inlayout[i], outmask))
101                 overlap++;
102             outmask |= inlayout[i]->order == AV_CHANNEL_ORDER_NATIVE ?
103                        inlayout[i]->u.mask : 0;
104         }
105         nb_ch += s->in[i].nb_ch;
106     }
107     if (nb_ch > SWR_CH_MAX) {
108         av_log(ctx, AV_LOG_ERROR, "Too many channels (max %d)\n", SWR_CH_MAX);
109         return AVERROR(EINVAL);
110     }
111     if (overlap) {
112         av_log(ctx, AV_LOG_WARNING,
113                "Input channel layouts overlap: "
114                "output layout will be determined by the number of distinct input channels\n");
115         for (i = 0; i < nb_ch; i++)
116             s->route[i] = i;
117         av_channel_layout_default(&outlayout, nb_ch);
118         if (!KNOWN(&outlayout) && nb_ch)
119             av_channel_layout_from_mask(&outlayout, 0xFFFFFFFFFFFFFFFFULL >> (64 - nb_ch));
120     } else {
121         int *route[SWR_CH_MAX];
122         int c, out_ch_number = 0;
123
124         av_channel_layout_from_mask(&outlayout, outmask);
125         route[0] = s->route;
126         for (i = 1; i < s->nb_inputs; i++)
127             route[i] = route[i - 1] + s->in[i - 1].nb_ch;
128         for (c = 0; c < 64; c++)
129             for (i = 0; i < s->nb_inputs; i++)
130                 if (av_channel_layout_index_from_channel(inlayout[i], c) >= 0)
131                     *(route[i]++) = out_ch_number++;
132     }
133     if ((ret = ff_set_common_formats_from_list(ctx, packed_sample_fmts)) < 0)
134         return ret;
135     for (i = 0; i < s->nb_inputs; i++) {
136         layouts = NULL;
137         if ((ret = ff_add_channel_layout(&layouts, inlayout[i])) < 0)
138             return ret;
139         if ((ret = ff_channel_layouts_ref(layouts, &ctx->inputs[i]->outcfg.channel_layouts)) < 0)
140             return ret;
141     }
142     layouts = NULL;
143     if ((ret = ff_add_channel_layout(&layouts, &outlayout)) < 0)
144         return ret;
145     if ((ret = ff_channel_layouts_ref(layouts, &ctx->outputs[0]->incfg.channel_layouts)) < 0)
146         return ret;
147
148     return ff_set_common_all_samplerates(ctx);
149 }
150
151 static int config_output(AVFilterLink *outlink)
152 {
153     AVFilterContext *ctx = outlink->src;
154     AMergeContext *s = ctx->priv;
155     AVBPrint bp;
156     char buf[128];
157     int i;
158
159     s->bps = av_get_bytes_per_sample(ctx->outputs[0]->format);
160     outlink->time_base   = ctx->inputs[0]->time_base;
161
162     av_bprint_init(&bp, 0, AV_BPRINT_SIZE_AUTOMATIC);
163     for (i = 0; i < s->nb_inputs; i++) {
164         av_bprintf(&bp, "%sin%d:", i ? " + " : "", i);
165         av_channel_layout_describe(&ctx->inputs[i]->ch_layout, buf, sizeof(buf));
166         av_bprintf(&bp, "%s", buf);
167     }
168     av_bprintf(&bp, " -> out:");
169     av_channel_layout_describe(&ctx->outputs[0]->ch_layout, buf, sizeof(buf));
170     av_bprintf(&bp, "%s", buf);
171     av_log(ctx, AV_LOG_VERBOSE, "%s\n", bp.str);
172
173     return 0;
174 }
175
176 /**
177  * Copy samples from several input streams to one output stream.
178  * @param nb_inputs number of inputs
179  * @param in        inputs; used only for the nb_ch field;
180  * @param route     routing values;
181  *                  input channel i goes to output channel route[i];
182  *                  i <  in[0].nb_ch are the channels from the first output;
183  *                  i >= in[0].nb_ch are the channels from the second output
184  * @param ins       pointer to the samples of each inputs, in packed format;
185  *                  will be left at the end of the copied samples
186  * @param outs      pointer to the samples of the output, in packet format;
187  *                  must point to a buffer big enough;
188  *                  will be left at the end of the copied samples
189  * @param ns        number of samples to copy
190  * @param bps       bytes per sample
191  */
192 static inline void copy_samples(int nb_inputs, struct amerge_input in[],
193                                 int *route, uint8_t *ins[],
194                                 uint8_t **outs, int ns, int bps)
195 {
196     int *route_cur;
197     int i, c, nb_ch = 0;
198
199     for (i = 0; i < nb_inputs; i++)
200         nb_ch += in[i].nb_ch;
201     while (ns--) {
202         route_cur = route;
203         for (i = 0; i < nb_inputs; i++) {
204             for (c = 0; c < in[i].nb_ch; c++) {
205                 memcpy((*outs) + bps * *(route_cur++), ins[i], bps);
206                 ins[i] += bps;
207             }
208         }
209         *outs += nb_ch * bps;
210     }
211 }
212
213 static void free_frames(int nb_inputs, AVFrame **input_frames)
214 {
215     int i;
216     for (i = 0; i < nb_inputs; i++)
217         av_frame_free(&input_frames[i]);
218 }
219
220 static int try_push_frame(AVFilterContext *ctx, int nb_samples)
221 {
222     AMergeContext *s = ctx->priv;
223     AVFilterLink *outlink = ctx->outputs[0];
224     int i, ret;
225     AVFrame *outbuf, *inbuf[SWR_CH_MAX] = { NULL };
226     uint8_t *outs, *ins[SWR_CH_MAX];
227
228     for (i = 0; i < ctx->nb_inputs; i++) {
229         ret = ff_inlink_consume_samples(ctx->inputs[i], nb_samples, nb_samples, &inbuf[i]);
230         if (ret < 0) {
231             free_frames(i, inbuf);
232             return ret;
233         }
234         ins[i] = inbuf[i]->data[0];
235     }
236
237     outbuf = ff_get_audio_buffer(ctx->outputs[0], nb_samples);
238     if (!outbuf) {
239         free_frames(s->nb_inputs, inbuf);
240         return AVERROR(ENOMEM);
241     }
242
243     outs = outbuf->data[0];
244     outbuf->pts = inbuf[0]->pts;
245
246     outbuf->nb_samples     = nb_samples;
247     outbuf->duration = av_rescale_q(outbuf->nb_samples,
248                                     av_make_q(1, outlink->sample_rate),
249                                     outlink->time_base);
250
251     if ((ret = av_channel_layout_copy(&outbuf->ch_layout, &outlink->ch_layout)) < 0)
252         return ret;
253 #if FF_API_OLD_CHANNEL_LAYOUT
254 FF_DISABLE_DEPRECATION_WARNINGS
255     outbuf->channel_layout = outlink->channel_layout;
256     outbuf->channels       = outlink->ch_layout.nb_channels;
257 FF_ENABLE_DEPRECATION_WARNINGS
258 #endif
259
260     while (nb_samples) {
261         /* Unroll the most common sample formats: speed +~350% for the loop,
262            +~13% overall (including two common decoders) */
263         switch (s->bps) {
264             case 1:
265                 copy_samples(s->nb_inputs, s->in, s->route, ins, &outs, nb_samples, 1);
266                 break;
267             case 2:
268                 copy_samples(s->nb_inputs, s->in, s->route, ins, &outs, nb_samples, 2);
269                 break;
270             case 4:
271                 copy_samples(s->nb_inputs, s->in, s->route, ins, &outs, nb_samples, 4);
272                 break;
273             default:
274                 copy_samples(s->nb_inputs, s->in, s->route, ins, &outs, nb_samples, s->bps);
275                 break;
276         }
277
278         nb_samples = 0;
279     }
280
281     free_frames(s->nb_inputs, inbuf);
282     return ff_filter_frame(ctx->outputs[0], outbuf);
283 }
284
285 static int activate(AVFilterContext *ctx)
286 {
287     int i, status;
288     int ret, nb_samples;
289     int64_t pts;
290
291     FF_FILTER_FORWARD_STATUS_BACK_ALL(ctx->outputs[0], ctx);
292
293     nb_samples = ff_inlink_queued_samples(ctx->inputs[0]);
294     for (i = 1; i < ctx->nb_inputs && nb_samples > 0; i++) {
295         nb_samples = FFMIN(ff_inlink_queued_samples(ctx->inputs[i]), nb_samples);
296     }
297
298     if (nb_samples) {
299         ret = try_push_frame(ctx, nb_samples);
300         if (ret < 0)
301             return ret;
302     }
303
304     for (i = 0; i < ctx->nb_inputs; i++) {
305         if (ff_inlink_queued_samples(ctx->inputs[i]))
306             continue;
307
308         if (ff_inlink_acknowledge_status(ctx->inputs[i], &status, &pts)) {
309             ff_outlink_set_status(ctx->outputs[0], status, pts);
310             return 0;
311         } else if (ff_outlink_frame_wanted(ctx->outputs[0])) {
312             ff_inlink_request_frame(ctx->inputs[i]);
313             return 0;
314         }
315     }
316
317     return 0;
318 }
319
320 static av_cold int init(AVFilterContext *ctx)
321 {
322     AMergeContext *s = ctx->priv;
323     int i, ret;
324
325     s->in = av_calloc(s->nb_inputs, sizeof(*s->in));
326     if (!s->in)
327         return AVERROR(ENOMEM);
328     for (i = 0; i < s->nb_inputs; i++) {
329         char *name = av_asprintf("in%d", i);
330         AVFilterPad pad = {
331             .name             = name,
332             .type             = AVMEDIA_TYPE_AUDIO,
333         };
334         if (!name)
335             return AVERROR(ENOMEM);
336         if ((ret = ff_append_inpad_free_name(ctx, &pad)) < 0)
337             return ret;
338     }
339     return 0;
340 }
341
342 static const AVFilterPad amerge_outputs[] = {
343     {
344         .name          = "default",
345         .type          = AVMEDIA_TYPE_AUDIO,
346         .config_props  = config_output,
347     },
348 };
349
350 const AVFilter ff_af_amerge = {
351     .name          = "amerge",
352     .description   = NULL_IF_CONFIG_SMALL("Merge two or more audio streams into "
353                                           "a single multi-channel stream."),
354     .priv_size     = sizeof(AMergeContext),
355     .init          = init,
356     .uninit        = uninit,
357     .activate      = activate,
358     .inputs        = NULL,
359     FILTER_OUTPUTS(amerge_outputs),
360     FILTER_QUERY_FUNC(query_formats),
361     .priv_class    = &amerge_class,
362     .flags         = AVFILTER_FLAG_DYNAMIC_INPUTS,
363 };