tuning on a branch. New noise metrics, noise bugfixes, postecho on.
[platform/upstream/libvorbis.git] / lib / psy.c
1 /********************************************************************
2  *                                                                  *
3  * THIS FILE IS PART OF THE OggVorbis SOFTWARE CODEC SOURCE CODE.   *
4  * USE, DISTRIBUTION AND REPRODUCTION OF THIS LIBRARY SOURCE IS     *
5  * GOVERNED BY A BSD-STYLE SOURCE LICENSE INCLUDED WITH THIS SOURCE *
6  * IN 'COPYING'. PLEASE READ THESE TERMS BEFORE DISTRIBUTING.       *
7  *                                                                  *
8  * THE OggVorbis SOURCE CODE IS (C) COPYRIGHT 1994-2001             *
9  * by the XIPHOPHORUS Company http://www.xiph.org/                  *
10  *                                                                  *
11  ********************************************************************
12
13  function: psychoacoustics not including preecho
14  last mod: $Id: psy.c,v 1.52 2001/09/01 06:14:50 xiphmont Exp $
15
16  ********************************************************************/
17
18 #include <stdlib.h>
19 #include <math.h>
20 #include <string.h>
21 #include "vorbis/codec.h"
22 #include "codec_internal.h"
23
24 #include "masking.h"
25 #include "psy.h"
26 #include "os.h"
27 #include "lpc.h"
28 #include "smallft.h"
29 #include "scales.h"
30 #include "misc.h"
31
32 #define NEGINF -9999.f
33
34 /* Why Bark scale for encoding but not masking computation? Because
35    masking has a strong harmonic dependancy */
36
37 vorbis_look_psy_global *_vp_global_look(vorbis_info *vi){
38   int i,j;
39   codec_setup_info *ci=vi->codec_setup;
40   vorbis_info_psy_global *gi=ci->psy_g_param;
41   vorbis_look_psy_global *look=_ogg_calloc(1,sizeof(vorbis_look_psy_global));
42
43   int shiftoc=rint(log(gi->eighth_octave_lines*8)/log(2))-1;
44   look->decaylines=toOC(96000.f)*(1<<(shiftoc+1))+.5f; /* max sample
45                                                           rate of
46                                                           192000kHz
47                                                           for now */
48   look->decay=_ogg_calloc(vi->channels,sizeof(float *));
49   for(i=0;i<vi->channels;i++){
50     look->decay[i]=_ogg_calloc(look->decaylines,sizeof(float));
51     for(j=0;j<look->decaylines;j++)
52       look->decay[i][j]=-9999.;
53   }
54   look->channels=vi->channels;
55
56   look->ampmax=-9999.;
57   look->gi=gi;
58   return(look);
59 }
60
61 void _vp_global_free(vorbis_look_psy_global *look){
62   int i;
63   if(look->decay){
64     for(i=0;i<look->channels;i++)
65       _ogg_free(look->decay[i]);
66     _ogg_free(look->decay);
67   }
68   memset(look,0,sizeof(vorbis_look_psy_global));
69   _ogg_free(look);
70 }
71
72 void _vi_psy_free(vorbis_info_psy *i){
73   if(i){
74     memset(i,0,sizeof(vorbis_info_psy));
75     _ogg_free(i);
76   }
77 }
78
79 vorbis_info_psy *_vi_psy_copy(vorbis_info_psy *i){
80   vorbis_info_psy *ret=_ogg_malloc(sizeof(vorbis_info_psy));
81   memcpy(ret,i,sizeof(vorbis_info_psy));
82   return(ret);
83 }
84
85 /* Set up decibel threshold slopes on a Bark frequency scale */
86 /* ATH is the only bit left on a Bark scale.  No reason to change it
87    right now */
88 static void set_curve(float *ref,float *c,int n, float crate){
89   int i,j=0;
90
91   for(i=0;i<MAX_BARK-1;i++){
92     int endpos=rint(fromBARK(i+1)*2*n/crate);
93     float base=ref[i];
94     if(j<endpos){
95       float delta=(ref[i+1]-base)/(endpos-j);
96       for(;j<endpos && j<n;j++){
97         c[j]=base;
98         base+=delta;
99       }
100     }
101   }
102 }
103
104 static void min_curve(float *c,
105                        float *c2){
106   int i;  
107   for(i=0;i<EHMER_MAX;i++)if(c2[i]<c[i])c[i]=c2[i];
108 }
109 static void max_curve(float *c,
110                        float *c2){
111   int i;  
112   for(i=0;i<EHMER_MAX;i++)if(c2[i]>c[i])c[i]=c2[i];
113 }
114
115 static void attenuate_curve(float *c,float att){
116   int i;
117   for(i=0;i<EHMER_MAX;i++)
118     c[i]+=att;
119 }
120
121 static void interp_curve(float *c,float *c1,float *c2,float del){
122   int i;
123   for(i=0;i<EHMER_MAX;i++)
124     c[i]=c2[i]*del+c1[i]*(1.f-del);
125 }
126
127 extern int analysis_noisy;
128 static void setup_curve(float **c,
129                         int band,
130                         float *curveatt_dB){
131   int i,j;
132   float ath[EHMER_MAX];
133   float tempc[P_LEVELS][EHMER_MAX];
134   float *ATH=ATH_Bark_dB_lspconservative; /* just for limiting here */
135
136   memcpy(c[0]+2,c[4]+2,sizeof(float)*EHMER_MAX);
137   memcpy(c[2]+2,c[4]+2,sizeof(float)*EHMER_MAX);
138
139   /* we add back in the ATH to avoid low level curves falling off to
140      -infinity and unneccessarily cutting off high level curves in the
141      curve limiting (last step).  But again, remember... a half-band's
142      settings must be valid over the whole band, and it's better to
143      mask too little than too much, so be pessimal. */
144
145   for(i=0;i<EHMER_MAX;i++){
146     float oc_min=band*.5+(i-EHMER_OFFSET)*.125;
147     float oc_max=band*.5+(i-EHMER_OFFSET+1)*.125;
148     float bark=toBARK(fromOC(oc_min));
149     int ibark=floor(bark);
150     float del=bark-ibark;
151     float ath_min,ath_max;
152
153     if(ibark<26)
154       ath_min=ATH[ibark]*(1.f-del)+ATH[ibark+1]*del;
155     else
156       ath_min=ATH[25];
157
158     bark=toBARK(fromOC(oc_max));
159     ibark=floor(bark);
160     del=bark-ibark;
161
162     if(ibark<26)
163       ath_max=ATH[ibark]*(1.f-del)+ATH[ibark+1]*del;
164     else
165       ath_max=ATH[25];
166
167     ath[i]=min(ath_min,ath_max);
168   }
169
170   /* The c array is comes in as dB curves at 20 40 60 80 100 dB.
171      interpolate intermediate dB curves */
172   for(i=1;i<P_LEVELS;i+=2){
173     interp_curve(c[i]+2,c[i-1]+2,c[i+1]+2,.5);
174   }
175
176   /* normalize curves so the driving amplitude is 0dB */
177   /* make temp curves with the ATH overlayed */
178   for(i=0;i<P_LEVELS;i++){
179     attenuate_curve(c[i]+2,curveatt_dB[i]);
180     memcpy(tempc[i],ath,EHMER_MAX*sizeof(float));
181     attenuate_curve(tempc[i],-i*10.f);
182     max_curve(tempc[i],c[i]+2);
183   }
184
185   /* Now limit the louder curves.
186
187      the idea is this: We don't know what the playback attenuation
188      will be; 0dB SL moves every time the user twiddles the volume
189      knob. So that means we have to use a single 'most pessimal' curve
190      for all masking amplitudes, right?  Wrong.  The *loudest* sound
191      can be in (we assume) a range of ...+100dB] SL.  However, sounds
192      20dB down will be in a range ...+80], 40dB down is from ...+60],
193      etc... */
194
195   for(j=1;j<P_LEVELS;j++){
196     min_curve(tempc[j],tempc[j-1]);
197     min_curve(c[j]+2,tempc[j]);
198   }
199
200   /* add fenceposts */
201   for(j=0;j<P_LEVELS;j++){
202
203     for(i=0;i<EHMER_OFFSET;i++)
204       if(c[j][i+2]>-200.f)break;  
205     c[j][0]=i;
206
207     for(i=EHMER_MAX-1;i>EHMER_OFFSET+1;i--)
208       if(c[j][i+2]>-200.f)
209         break;
210     c[j][1]=i;
211
212   }
213 }
214
215 void _vp_psy_init(vorbis_look_psy *p,vorbis_info_psy *vi,
216                   vorbis_info_psy_global *gi,int n,long rate){
217   long i,j,k,lo=-99,hi=0;
218   long maxoc;
219   memset(p,0,sizeof(vorbis_look_psy));
220
221
222   p->eighth_octave_lines=gi->eighth_octave_lines;
223   p->shiftoc=rint(log(gi->eighth_octave_lines*8)/log(2))-1;
224
225   p->firstoc=toOC(.25f*rate/n)*(1<<(p->shiftoc+1))-gi->eighth_octave_lines;
226   maxoc=toOC((n*.5f-.25f)*rate/n)*(1<<(p->shiftoc+1))+.5f;
227   p->total_octave_lines=maxoc-p->firstoc+1;
228
229   if(vi->ath)
230     p->ath=_ogg_malloc(n*sizeof(float));
231   p->octave=_ogg_malloc(n*sizeof(long));
232   p->bark=_ogg_malloc(n*sizeof(unsigned long));
233   p->vi=vi;
234   p->n=n;
235   p->rate=rate;
236
237   /* set up the lookups for a given blocksize and sample rate */
238   if(vi->ath)
239     set_curve(vi->ath, p->ath,n,rate);
240   for(i=0;i<n;i++){
241     float bark=toBARK(rate/(2*n)*i); 
242
243     for(;lo+vi->noisewindowlomin<i && 
244           toBARK(rate/(2*n)*lo)<(bark-vi->noisewindowlo);lo++);
245     
246     for(;hi<n && (hi<i+vi->noisewindowhimin ||
247           toBARK(rate/(2*n)*hi)<(bark+vi->noisewindowhi));hi++);
248     
249     p->bark[i]=(lo<<16)+hi;
250
251   }
252
253   for(i=0;i<n;i++)
254     p->octave[i]=toOC((i*.5f+.25f)*rate/n)*(1<<(p->shiftoc+1))+.5f;
255
256   p->tonecurves=_ogg_malloc(P_BANDS*sizeof(float **));
257   p->noisethresh=_ogg_malloc(n*sizeof(float));
258   p->noiseoffset=_ogg_malloc(n*sizeof(float));
259   for(i=0;i<P_BANDS;i++)
260     p->tonecurves[i]=_ogg_malloc(P_LEVELS*sizeof(float *));
261   
262   for(i=0;i<P_BANDS;i++)
263     for(j=0;j<P_LEVELS;j++)
264       p->tonecurves[i][j]=_ogg_malloc((EHMER_MAX+2)*sizeof(float));
265   
266
267   /* OK, yeah, this was a silly way to do it */
268   memcpy(p->tonecurves[0][4]+2,tone_125_40dB_SL,sizeof(float)*EHMER_MAX);
269   memcpy(p->tonecurves[0][6]+2,tone_125_60dB_SL,sizeof(float)*EHMER_MAX);
270   memcpy(p->tonecurves[0][8]+2,tone_125_80dB_SL,sizeof(float)*EHMER_MAX);
271   memcpy(p->tonecurves[0][10]+2,tone_125_100dB_SL,sizeof(float)*EHMER_MAX);
272
273   memcpy(p->tonecurves[2][4]+2,tone_125_40dB_SL,sizeof(float)*EHMER_MAX);
274   memcpy(p->tonecurves[2][6]+2,tone_125_60dB_SL,sizeof(float)*EHMER_MAX);
275   memcpy(p->tonecurves[2][8]+2,tone_125_80dB_SL,sizeof(float)*EHMER_MAX);
276   memcpy(p->tonecurves[2][10]+2,tone_125_100dB_SL,sizeof(float)*EHMER_MAX);
277
278   memcpy(p->tonecurves[4][4]+2,tone_250_40dB_SL,sizeof(float)*EHMER_MAX);
279   memcpy(p->tonecurves[4][6]+2,tone_250_60dB_SL,sizeof(float)*EHMER_MAX);
280   memcpy(p->tonecurves[4][8]+2,tone_250_80dB_SL,sizeof(float)*EHMER_MAX);
281   memcpy(p->tonecurves[4][10]+2,tone_250_100dB_SL,sizeof(float)*EHMER_MAX);
282
283   memcpy(p->tonecurves[6][4]+2,tone_500_40dB_SL,sizeof(float)*EHMER_MAX);
284   memcpy(p->tonecurves[6][6]+2,tone_500_60dB_SL,sizeof(float)*EHMER_MAX);
285   memcpy(p->tonecurves[6][8]+2,tone_500_80dB_SL,sizeof(float)*EHMER_MAX);
286   memcpy(p->tonecurves[6][10]+2,tone_500_100dB_SL,sizeof(float)*EHMER_MAX);
287
288   memcpy(p->tonecurves[8][4]+2,tone_1000_40dB_SL,sizeof(float)*EHMER_MAX);
289   memcpy(p->tonecurves[8][6]+2,tone_1000_60dB_SL,sizeof(float)*EHMER_MAX);
290   memcpy(p->tonecurves[8][8]+2,tone_1000_80dB_SL,sizeof(float)*EHMER_MAX);
291   memcpy(p->tonecurves[8][10]+2,tone_1000_100dB_SL,sizeof(float)*EHMER_MAX);
292
293   memcpy(p->tonecurves[10][4]+2,tone_2000_40dB_SL,sizeof(float)*EHMER_MAX);
294   memcpy(p->tonecurves[10][6]+2,tone_2000_60dB_SL,sizeof(float)*EHMER_MAX);
295   memcpy(p->tonecurves[10][8]+2,tone_2000_80dB_SL,sizeof(float)*EHMER_MAX);
296   memcpy(p->tonecurves[10][10]+2,tone_2000_100dB_SL,sizeof(float)*EHMER_MAX);
297
298   memcpy(p->tonecurves[12][4]+2,tone_4000_40dB_SL,sizeof(float)*EHMER_MAX);
299   memcpy(p->tonecurves[12][6]+2,tone_4000_60dB_SL,sizeof(float)*EHMER_MAX);
300   memcpy(p->tonecurves[12][8]+2,tone_4000_80dB_SL,sizeof(float)*EHMER_MAX);
301   memcpy(p->tonecurves[12][10]+2,tone_4000_100dB_SL,sizeof(float)*EHMER_MAX);
302
303   memcpy(p->tonecurves[14][4]+2,tone_8000_40dB_SL,sizeof(float)*EHMER_MAX);
304   memcpy(p->tonecurves[14][6]+2,tone_8000_60dB_SL,sizeof(float)*EHMER_MAX);
305   memcpy(p->tonecurves[14][8]+2,tone_8000_80dB_SL,sizeof(float)*EHMER_MAX);
306   memcpy(p->tonecurves[14][10]+2,tone_8000_100dB_SL,sizeof(float)*EHMER_MAX);
307
308   memcpy(p->tonecurves[16][4]+2,tone_8000_40dB_SL,sizeof(float)*EHMER_MAX);
309   memcpy(p->tonecurves[16][6]+2,tone_8000_60dB_SL,sizeof(float)*EHMER_MAX);
310   memcpy(p->tonecurves[16][8]+2,tone_8000_80dB_SL,sizeof(float)*EHMER_MAX);
311   memcpy(p->tonecurves[16][10]+2,tone_8000_100dB_SL,sizeof(float)*EHMER_MAX);
312
313   /* value limit the tonal masking curves; the peakatt not only
314      optionally specifies maximum dynamic depth, but also [always]
315      limits the masking curves to a minimum depth */
316   for(i=0;i<P_BANDS;i+=2)
317     for(j=4;j<P_LEVELS;j+=2)
318       for(k=2;k<EHMER_MAX+2;k++)
319         p->tonecurves[i][j][k]+=vi->tone_masteratt;
320
321   /* interpolate curves between */
322   for(i=1;i<P_BANDS;i+=2)
323     for(j=4;j<P_LEVELS;j+=2){
324       memcpy(p->tonecurves[i][j]+2,p->tonecurves[i-1][j]+2,EHMER_MAX*sizeof(float));
325       /*interp_curve(p->tonecurves[i][j],
326                    p->tonecurves[i-1][j],
327                    p->tonecurves[i+1][j],.5);*/
328       min_curve(p->tonecurves[i][j]+2,p->tonecurves[i+1][j]+2);
329     }
330
331   /* set up the final curves */
332   for(i=0;i<P_BANDS;i++)
333     setup_curve(p->tonecurves[i],i,vi->toneatt->block[i]);
334
335   if(vi->curvelimitp){
336     /* value limit the tonal masking curves; the peakatt not only
337        optionally specifies maximum dynamic depth, but also [always]
338        limits the masking curves to a minimum depth  */
339     for(i=0;i<P_BANDS;i++)
340       for(j=0;j<P_LEVELS;j++){
341         for(k=2;k<EHMER_OFFSET+2+vi->curvelimitp;k++)
342           if(p->tonecurves[i][j][k]> vi->peakatt->block[i][j])
343             p->tonecurves[i][j][k]=  vi->peakatt->block[i][j];
344           else
345             break;
346       }
347   }
348
349   if(vi->peakattp) /* we limit depth only optionally */
350     for(i=0;i<P_BANDS;i++)
351       for(j=0;j<P_LEVELS;j++)
352         if(p->tonecurves[i][j][EHMER_OFFSET+2]< vi->peakatt->block[i][j])
353           p->tonecurves[i][j][EHMER_OFFSET+2]=  vi->peakatt->block[i][j];
354
355   /* but guarding is mandatory */
356   for(i=0;i<P_BANDS;i++)
357     for(j=0;j<P_LEVELS;j++)
358       if(p->tonecurves[i][j][EHMER_OFFSET+2]< vi->tone_maxatt)
359           p->tonecurves[i][j][EHMER_OFFSET+2]=  vi->tone_maxatt;
360
361   /* set up rolling noise median */
362   for(i=0;i<n;i++){
363     float halfoc=toOC((i+.5)*rate/(2.*n))*2.;
364     int inthalfoc;
365     float del;
366     
367     if(halfoc<0)halfoc=0;
368     if(halfoc>=P_BANDS-1)halfoc=P_BANDS-1;
369     inthalfoc=(int)halfoc;
370     del=halfoc-inthalfoc;
371     p->noiseoffset[i]=
372       p->vi->noiseoff[inthalfoc]*(1.-del) + 
373       p->vi->noiseoff[inthalfoc+1]*del;
374   }
375
376   analysis_noisy=1;
377   _analysis_output("noiseoff",0,p->noiseoffset,n,1,0);
378   _analysis_output("noisethresh",0,p->noisethresh,n,1,0);
379
380   for(i=0;i<P_LEVELS;i++)
381     _analysis_output("curve_63Hz",i,p->tonecurves[0][i]+2,EHMER_MAX,0,0);
382   for(i=0;i<P_LEVELS;i++)
383     _analysis_output("curve_88Hz",i,p->tonecurves[1][i]+2,EHMER_MAX,0,0);
384   for(i=0;i<P_LEVELS;i++)
385     _analysis_output("curve_125Hz",i,p->tonecurves[2][i]+2,EHMER_MAX,0,0);
386   for(i=0;i<P_LEVELS;i++)
387     _analysis_output("curve_170Hz",i,p->tonecurves[3][i]+2,EHMER_MAX,0,0);
388   for(i=0;i<P_LEVELS;i++)
389     _analysis_output("curve_250Hz",i,p->tonecurves[4][i]+2,EHMER_MAX,0,0);
390   for(i=0;i<P_LEVELS;i++)
391     _analysis_output("curve_350Hz",i,p->tonecurves[5][i]+2,EHMER_MAX,0,0);
392   for(i=0;i<P_LEVELS;i++)
393     _analysis_output("curve_500Hz",i,p->tonecurves[6][i]+2,EHMER_MAX,0,0);
394   for(i=0;i<P_LEVELS;i++)
395     _analysis_output("curve_700Hz",i,p->tonecurves[7][i]+2,EHMER_MAX,0,0);
396   for(i=0;i<P_LEVELS;i++)
397     _analysis_output("curve_1kHz",i,p->tonecurves[8][i]+2,EHMER_MAX,0,0);
398   for(i=0;i<P_LEVELS;i++)
399     _analysis_output("curve_1.4Hz",i,p->tonecurves[9][i]+2,EHMER_MAX,0,0);
400   for(i=0;i<P_LEVELS;i++)
401     _analysis_output("curve_2kHz",i,p->tonecurves[10][i]+2,EHMER_MAX,0,0);
402   for(i=0;i<P_LEVELS;i++)
403     _analysis_output("curve_2.4kHz",i,p->tonecurves[11][i]+2,EHMER_MAX,0,0);
404   for(i=0;i<P_LEVELS;i++)
405     _analysis_output("curve_4kHz",i,p->tonecurves[12][i]+2,EHMER_MAX,0,0);
406   for(i=0;i<P_LEVELS;i++)
407     _analysis_output("curve_5.6kHz",i,p->tonecurves[13][i]+2,EHMER_MAX,0,0);
408   for(i=0;i<P_LEVELS;i++)
409     _analysis_output("curve_8kHz",i,p->tonecurves[14][i]+2,EHMER_MAX,0,0);
410   for(i=0;i<P_LEVELS;i++)
411     _analysis_output("curve_11.5kHz",i,p->tonecurves[15][i]+2,EHMER_MAX,0,0);
412   for(i=0;i<P_LEVELS;i++)
413     _analysis_output("curve_16kHz",i,p->tonecurves[16][i]+2,EHMER_MAX,0,0);
414   analysis_noisy=1;
415
416 }
417
418 void _vp_psy_clear(vorbis_look_psy *p){
419   int i,j;
420   if(p){
421     if(p->ath)_ogg_free(p->ath);
422     if(p->octave)_ogg_free(p->octave);
423     if(p->bark)_ogg_free(p->bark);
424     if(p->tonecurves){
425       for(i=0;i<P_BANDS;i++){
426         for(j=0;j<P_LEVELS;j++){
427           _ogg_free(p->tonecurves[i][j]);
428         }
429         _ogg_free(p->tonecurves[i]);
430       }
431       _ogg_free(p->tonecurves);
432       _ogg_free(p->noiseoffset);
433     }
434     memset(p,0,sizeof(vorbis_look_psy));
435   }
436 }
437
438 /* octave/(8*eighth_octave_lines) x scale and dB y scale */
439 static void seed_curve(float *seed,
440                        const float **curves,
441                        float amp,
442                        int oc, int n,
443                        int linesper,float dBoffset){
444   int i,post1;
445   int seedptr;
446   const float *posts,*curve;
447
448   int choice=(int)((amp+dBoffset)*.1f);
449   choice=max(choice,0);
450   choice=min(choice,P_LEVELS-1);
451   posts=curves[choice];
452   curve=posts+2;
453   post1=(int)posts[1];
454   seedptr=oc+(posts[0]-16)*linesper-(linesper>>1);
455
456   for(i=posts[0];i<post1;i++){
457     if(seedptr>0){
458       float lin=amp+curve[i];
459       if(seed[seedptr]<lin)seed[seedptr]=lin;
460     }
461     seedptr+=linesper;
462     if(seedptr>=n)break;
463   }
464 }
465
466 static void seed_loop(vorbis_look_psy *p,
467                       const float ***curves,
468                       const float *f, 
469                       const float *flr,
470                       float *seed,
471                       float specmax){
472   vorbis_info_psy *vi=p->vi;
473   long n=p->n,i;
474   float dBoffset=vi->max_curve_dB-specmax;
475
476   /* prime the working vector with peak values */
477
478   for(i=0;i<n;i++){
479     float max=f[i];
480     long oc=p->octave[i];
481     while(i+1<n && p->octave[i+1]==oc){
482       i++;
483       if(f[i]>max)max=f[i];
484     }
485     
486     if(max+6.f>flr[i]){
487       oc=oc>>p->shiftoc;
488       if(oc>=P_BANDS)oc=P_BANDS-1;
489       if(oc<0)oc=0;
490       seed_curve(seed,
491                  curves[oc],
492                  max,
493                  p->octave[i]-p->firstoc,
494                  p->total_octave_lines,
495                  p->eighth_octave_lines,
496                  dBoffset);
497     }
498   }
499 }
500
501 static void seed_chase(float *seeds, int linesper, long n){
502   long  *posstack=alloca(n*sizeof(long));
503   float *ampstack=alloca(n*sizeof(float));
504   long   stack=0;
505   long   pos=0;
506   long   i;
507
508   for(i=0;i<n;i++){
509     if(stack<2){
510       posstack[stack]=i;
511       ampstack[stack++]=seeds[i];
512     }else{
513       while(1){
514         if(seeds[i]<ampstack[stack-1]){
515           posstack[stack]=i;
516           ampstack[stack++]=seeds[i];
517           break;
518         }else{
519           if(i<posstack[stack-1]+linesper){
520             if(stack>1 && ampstack[stack-1]<=ampstack[stack-2] &&
521                i<posstack[stack-2]+linesper){
522               /* we completely overlap, making stack-1 irrelevant.  pop it */
523               stack--;
524               continue;
525             }
526           }
527           posstack[stack]=i;
528           ampstack[stack++]=seeds[i];
529           break;
530
531         }
532       }
533     }
534   }
535
536   /* the stack now contains only the positions that are relevant. Scan
537      'em straight through */
538
539   for(i=0;i<stack;i++){
540     long endpos;
541     if(i<stack-1 && ampstack[i+1]>ampstack[i]){
542       endpos=posstack[i+1];
543     }else{
544       endpos=posstack[i]+linesper+1; /* +1 is important, else bin 0 is
545                                         discarded in short frames */
546     }
547     if(endpos>n)endpos=n;
548     for(;pos<endpos;pos++)
549       seeds[pos]=ampstack[i];
550   }
551   
552   /* there.  Linear time.  I now remember this was on a problem set I
553      had in Grad Skool... I didn't solve it at the time ;-) */
554
555 }
556
557 /* bleaugh, this is more complicated than it needs to be */
558 static void max_seeds(vorbis_look_psy *p,
559                       vorbis_look_psy_global *g,
560                       int channel,
561                       float *seed,
562                       float *flr){
563   long   n=p->total_octave_lines;
564   int    linesper=p->eighth_octave_lines;
565   long   linpos=0;
566   long   pos;
567
568   seed_chase(seed,linesper,n); /* for masking */
569  
570   pos=p->octave[0]-p->firstoc-(linesper>>1);
571   while(linpos+1<p->n){
572     float minV=seed[pos];
573     long end=((p->octave[linpos]+p->octave[linpos+1])>>1)-p->firstoc;
574     while(pos+1<=end){
575       pos++;
576       if((seed[pos]>NEGINF && seed[pos]<minV) || minV==NEGINF)
577         minV=seed[pos];
578     }
579     
580     /* seed scale is log.  Floor is linear.  Map back to it */
581     end=pos+p->firstoc;
582     for(;linpos<p->n && p->octave[linpos]<=end;linpos++)
583       if(flr[linpos]<minV)flr[linpos]=minV;
584   }
585   
586   {
587     float minV=seed[p->total_octave_lines-1];
588     for(;linpos<p->n;linpos++)
589       if(flr[linpos]<minV)flr[linpos]=minV;
590   }
591   
592 }
593
594 static void bark_noise_hybridmp(int n,const long *b,
595                                 const float *f,
596                                 float *noise,
597                                 const float offset,
598                                 const int fixed){
599   long i,hi=b[0]>>16,lo=b[0]>>16,hif=-fixed/2,lof=-fixed/2;
600   double xa=0,xb=0;
601   double ya=0,yb=0;
602   double x2a=0,x2b=0;
603   double y2a=0,y2b=0;
604   double xya=0,xyb=0; 
605   double na=0,nb=0;
606
607   for(i=0;i<n;i++){
608     if(hi<n){
609       /* find new lo/hi */
610       int bi=b[i]&0xffffL;
611       for(;hi<bi;hi++){
612         int ii=(hi<0?-hi:hi);
613         double bin=(f[ii]<-offset?1.:f[ii]+offset);
614         double nn= bin*bin;
615         na  += nn;
616         xa  += hi*nn;
617         ya  += bin*nn;
618         x2a += hi*hi*nn;
619         y2a += bin*bin*nn;
620         xya += hi*bin*nn;
621       }
622       bi=b[i]>>16;
623       for(;lo<bi;lo++){
624         int ii=(lo<0?-lo:lo);
625         double bin=(f[ii]<-offset?1.:f[ii]+offset);
626         double nn= bin*bin;
627         na  -= nn;
628         xa  -= lo*nn;
629         ya  -= bin*nn;
630         x2a -= lo*lo*nn;
631         y2a -= bin*bin*nn;
632         xya -= lo*bin*nn;
633       }
634     }
635
636     if(hif<n && fixed>0){
637       int bi=i+fixed/2;
638       if(bi>n)bi=n;
639
640       for(;hif<bi;hif++){
641         int ii=(hif<0?-hif:hif);
642         double bin=(f[ii]<-offset?1.:f[ii]+offset);
643         double nn= bin*bin;
644         nb  += nn;
645         xb  += hif*nn;
646         yb  += bin*nn;
647         x2b += hif*hif*nn;
648         y2b += bin*bin*nn;
649         xyb += hif*bin*nn;
650       }
651       bi=i-(fixed+1)/2;
652       for(;lof<bi;lof++){
653         int ii=(lof<0?-lof:lof);
654         double bin=(f[ii]<-offset?1.:f[ii]+offset);
655         double nn= bin*bin;
656         nb  -= nn;
657         xb  -= lof*nn;
658         yb  -= bin*nn;
659         x2b -= lof*lof*nn;
660         y2b -= bin*bin*nn;
661         xyb -= lof*bin*nn;
662       }
663     }
664
665     {    
666       double va=0.f;
667       
668       if(na>2){
669         double denom=1./(na*x2a-xa*xa);
670         double a=(ya*x2a-xya*xa)*denom;
671         double b=(na*xya-xa*ya)*denom;
672         va=a+b*i;
673       }
674       if(va<0.)va=0.;
675
676       if(fixed>0){
677         double vb=0.f;
678
679         if(nb>2){
680           double denomf=1./(nb*x2b-xb*xb);
681           double af=(yb*x2b-xyb*xb)*denomf;
682           double bf=(nb*xyb-xb*yb)*denomf;
683           vb=af+bf*i;
684         }
685         if(vb<0.)vb=0.;
686         if(va>vb && vb>0.)va=vb;
687
688       }
689
690       noise[i]=va-offset;
691     }
692   }
693 }
694
695    
696 void _vp_remove_floor(vorbis_look_psy *p,
697                       vorbis_look_psy_global *g,
698                       float *logmdct, 
699                       float *mdct,
700                       float *codedflr,
701                       float *residue,
702                       float local_specmax){ 
703   int i,n=p->n;
704   
705   for(i=0;i<n;i++)
706     if(mdct[i]!=0.f)
707       residue[i]=mdct[i]/codedflr[i];
708     else
709       residue[i]=0.f;
710 }
711   
712
713 void _vp_compute_mask(vorbis_look_psy *p,
714                        vorbis_look_psy_global *g,
715                        int channel,
716                        float *logfft, 
717                        float *logmdct, 
718                        float *logmask, 
719                        float global_specmax,
720                        float local_specmax,
721                        int lastsize){
722   int i,n=p->n;
723   static int seq=0;
724
725   float *seed=alloca(sizeof(float)*p->total_octave_lines);
726   for(i=0;i<p->total_octave_lines;i++)seed[i]=NEGINF;
727
728   /* noise masking */
729   if(p->vi->noisemaskp){
730     float *work=alloca(n*sizeof(float));
731
732     bark_noise_hybridmp(n,p->bark,logmdct,logmask,
733                         140.,-1);
734
735     for(i=0;i<n;i++)work[i]=logmdct[i]-logmask[i];
736
737     _analysis_output("medianmdct",seq,work,n,1,0);
738     bark_noise_hybridmp(n,p->bark,work,logmask,0.,
739                         p->vi->noisewindowfixed);
740
741     for(i=0;i<n;i++)work[i]=logmdct[i]-work[i];
742
743     /* work[i] holds the median line (.5), logmask holds the upper
744        envelope line (1.) */
745
746     _analysis_output("median",seq,work,n,1,0);
747
748     _analysis_output("medianenvelope",seq,logmask,n,1,0);
749     for(i=0;i<n;i++)logmask[i]+=work[i];
750     _analysis_output("envelope",seq,logmask,n,1,0);
751     for(i=0;i<n;i++)logmask[i]-=work[i];
752
753     for(i=0;i<n;i++){
754       int dB=logmask[i]+.5;
755       if(dB>=NOISE_COMPAND_LEVELS)dB=NOISE_COMPAND_LEVELS-1;
756       logmask[i]= work[i]+p->vi->noisecompand[dB]+p->noiseoffset[i];
757     }
758
759     _analysis_output("noise",seq,logmask,n,1,0);
760
761   }else{
762     for(i=0;i<n;i++)logmask[i]=NEGINF;
763   }
764
765   /* set the ATH (floating below localmax, not global max by a
766      specified att) */
767   if(p->vi->ath){
768     float att=local_specmax+p->vi->ath_adjatt;
769     if(att<p->vi->ath_maxatt)att=p->vi->ath_maxatt;
770
771     for(i=0;i<n;i++){
772       float av=p->ath[i]+att;
773       if(av>logmask[i])logmask[i]=av;
774     }
775   }
776
777   /* tone/peak masking */
778   seed_loop(p,(const float ***)p->tonecurves,logfft,logmask,seed,global_specmax);
779   max_seeds(p,g,channel,seed,logmask);
780
781   /* suppress any curve > p->vi->noisemaxsupp */
782   if(p->vi->noisemaxsupp<0.f)
783     for(i=0;i<n;i++)
784       if(logmask[i]>p->vi->noisemaxsupp)
785         logmask[i]=p->vi->noisemaxsupp;
786   
787
788   /* doing this here is clean, but we need to find a faster way to do
789      it than to just tack it on */
790
791   for(i=0;i<n;i++)if(logmdct[i]>=logmask[i])break;
792   if(i==n)
793     for(i=0;i<n;i++)logmask[i]=NEGINF;
794   else
795     for(i=0;i<n;i++)
796       logfft[i]=max(logmdct[i],logfft[i]);
797
798   seq++;
799
800 }
801
802 float _vp_ampmax_decay(float amp,vorbis_dsp_state *vd){
803   vorbis_info *vi=vd->vi;
804   codec_setup_info *ci=vi->codec_setup;
805   vorbis_info_psy_global *gi=ci->psy_g_param;
806
807   int n=ci->blocksizes[vd->W]/2;
808   float secs=(float)n/vi->rate;
809
810   amp+=secs*gi->ampmax_att_per_sec;
811   if(amp<-9999)amp=-9999;
812   return(amp);
813 }
814
815 static void couple_lossless(float A, float B, 
816                             float granule,float igranule,
817                             float *mag, float *ang){
818
819   A=rint(A*igranule)*granule;
820   B=rint(B*igranule)*granule;
821   
822   if(fabs(A)>fabs(B)){
823     *mag=A; *ang=(A>0.f?A-B:B-A);
824   }else{
825     *mag=B; *ang=(B>0.f?A-B:B-A);
826   }
827
828   if(*ang>fabs(*mag)*1.9999f)*ang=-fabs(*mag)*2.f;
829  
830 }
831
832 static void couple_8phase(float A, float B, float fA, float fB, 
833                          float granule,float igranule,
834                          float fmag, float *mag, float *ang){
835
836   float origmag=FAST_HYPOT(A*fA,B*fB),corr;
837
838   if(fmag!=0.f){
839     float phase=rint((A-B)/fmag);
840     
841     if(fabs(A)>fabs(B)){
842       *mag=A;phase=(A>0?phase:-phase);
843     }else{
844       *mag=B;phase=(B>0?phase:-phase);
845     }
846     
847     switch((int)phase){
848     case 0:
849       corr=origmag/FAST_HYPOT(fmag*fA,fmag*fB);
850       *mag=rint(*mag*corr*igranule)*granule; 
851       *ang=0.f;
852       break;
853     case 1:
854       corr=origmag/(fmag*fA);
855       *mag=rint(A*corr*igranule)*granule; 
856       *ang=fabs(*mag);
857       break;
858     case -1:
859       corr=origmag/(fmag*fB);
860       *mag=rint(B*corr*igranule)*granule; 
861       *ang=-fabs(*mag);
862       break;
863     default:
864       corr=origmag/FAST_HYPOT(fmag*fA,fmag*fB);
865       *mag=rint(*mag*corr*igranule)*granule; 
866       *ang=-2.f*fabs(*mag);
867       break;
868     }
869   }else{
870     *mag=0.f;
871     *ang=0.f;
872   }    
873 }
874
875 static void couple_6phase(float A, float B, float fA, float fB, 
876                          float granule,float igranule,
877                          float fmag, float *mag, float *ang){
878
879   float origmag=FAST_HYPOT(A*fA,B*fB),corr;
880
881   if(fmag!=0.f){
882     float phase=rint((A-B)/fmag);
883     
884     if(fabs(A)>fabs(B)){
885       *mag=A;phase=(A>0?phase:-phase);
886     }else{
887       *mag=B;phase=(B>0?phase:-phase);
888     }
889     
890     switch((int)phase){
891     case 0:
892       corr=origmag/FAST_HYPOT(fmag*fA,fmag*fB);
893       *mag=rint(*mag*corr*igranule)*granule; 
894       *ang=0.f;
895       break;
896     case 1:case 2:
897       corr=origmag/(fmag*fA);
898       *mag=rint(A*corr*igranule)*granule; 
899       *ang=fabs(*mag);
900       break;
901     case -1:case -2:
902       corr=origmag/(fmag*fB);
903       *mag=rint(B*corr*igranule)*granule; 
904       *ang=-fabs(*mag);
905       break;
906     }
907   }else{
908     *mag=0.f;
909     *ang=0.f;
910   }    
911 }
912
913 static void couple_4phase(float A, float B, float fA, float fB, 
914                          float granule,float igranule,
915                          float fmag, float *mag, float *ang){
916
917   float origmag=FAST_HYPOT(A*fA,B*fB),corr;
918
919   if(fmag!=0.f){
920     float phase=rint((A-B)*.5/fmag);
921     
922     if(fabs(A)>fabs(B)){
923       *mag=A;phase=(A>0?phase:-phase);
924     }else{
925       *mag=B;phase=(B>0?phase:-phase);
926     }
927     
928     corr=origmag/FAST_HYPOT(fmag*fA,fmag*fB);
929     *mag=rint(*mag*corr*igranule)*granule; 
930     switch((int)phase){
931     case 0:
932       *ang=0.f;
933       break;
934     default:
935       *ang=-2.f*fabs(*mag);
936       break;
937     }
938   }else{
939     *mag=0.f;
940     *ang=0.f;
941   }    
942 }
943
944 static void couple_point(float A, float B, float fA, float fB, 
945                          float granule,float igranule,
946                          float fmag, float *mag, float *ang){
947
948   float origmag=FAST_HYPOT(A*fA,B*fB),corr;
949
950   if(fmag!=0.f){
951     float phase=rint((A-B)*.5/fmag);
952     
953     if(fabs(A)>fabs(B)){
954       *mag=A;phase=(A>0?phase:-phase);
955     }else{
956       *mag=B;phase=(B>0?phase:-phase);
957     }
958     
959     //switch((int)phase){
960       //case 0:
961       corr=origmag/FAST_HYPOT(fmag*fA,fmag*fB);
962       *mag=rint(*mag*corr*igranule)*granule; 
963       *ang=0.f;
964       //break;
965       //default:
966       //*mag=0.f;
967       //*ang=0.f;
968       //break;
969       //}
970   }else{
971     *mag=0.f;
972     *ang=0.f;
973   }    
974 }
975
976
977 void _vp_quantize_couple(vorbis_look_psy *p,
978                          vorbis_info_mapping0 *vi,
979                          float **pcm,
980                          float **sofar,
981                          float **quantized,
982                          int   *nonzero,
983                          int   passno){
984
985   int i,j,k,n=p->n;
986   vorbis_info_psy *info=p->vi;
987
988   /* perform any requested channel coupling */
989   for(i=0;i<vi->coupling_steps;i++){
990     float granulem=info->couple_pass[passno].granulem;
991     float igranulem=info->couple_pass[passno].igranulem;
992     
993     /* make sure coupling a zero and a nonzero channel results in two
994        nonzero channels. */
995     if(nonzero[vi->coupling_mag[i]] ||
996        nonzero[vi->coupling_ang[i]]){
997       
998       float *pcmM=pcm[vi->coupling_mag[i]];
999       float *pcmA=pcm[vi->coupling_ang[i]];
1000       float *floorM=pcm[vi->coupling_mag[i]]+n;
1001       float *floorA=pcm[vi->coupling_ang[i]]+n;
1002       float *sofarM=sofar[vi->coupling_mag[i]];
1003       float *sofarA=sofar[vi->coupling_ang[i]];
1004       float *qM=quantized[vi->coupling_mag[i]];
1005       float *qA=quantized[vi->coupling_ang[i]];
1006
1007       nonzero[vi->coupling_mag[i]]=1; 
1008       nonzero[vi->coupling_ang[i]]=1; 
1009
1010       for(j=0,k=0;j<n;k++){
1011         vp_couple *part=info->couple_pass[passno].couple_pass+k;
1012
1013         for(;j<part->limit && j<p->n;j++){
1014           /* partition by partition; k is our by-location partition
1015              class counter */
1016           float ang,mag,fmag=max(fabs(pcmM[j]),fabs(pcmA[j]));
1017
1018           if(fmag<part->amppost_point){
1019             couple_point(pcmM[j],pcmA[j],floorM[j],floorA[j],
1020                          granulem,igranulem,fmag,&mag,&ang);
1021           }else{
1022             if(fmag<part->amppost_6phase){
1023               couple_6phase(pcmM[j],pcmA[j],floorM[j],floorA[j],
1024                            granulem,igranulem,fmag,&mag,&ang);
1025             }else{ 
1026               if(fmag<part->amppost_8phase){
1027                 couple_8phase(pcmM[j],pcmA[j],floorM[j],floorA[j],
1028                               granulem,igranulem,fmag,&mag,&ang);
1029               }else{
1030                 couple_lossless(pcmM[j],pcmA[j],
1031                                 granulem,igranulem,&mag,&ang);
1032               }
1033             }
1034           }
1035           
1036           qM[j]=mag-sofarM[j];
1037           qA[j]=ang-sofarA[j];
1038         }
1039       }
1040     }
1041   }
1042 }