Incremental update... new 100kbps and 128 kbps books
[platform/upstream/libvorbis.git] / lib / psy.c
1 /********************************************************************
2  *                                                                  *
3  * THIS FILE IS PART OF THE OggVorbis SOFTWARE CODEC SOURCE CODE.   *
4  * USE, DISTRIBUTION AND REPRODUCTION OF THIS SOURCE IS GOVERNED BY *
5  * THE GNU LESSER/LIBRARY PUBLIC LICENSE, WHICH IS INCLUDED WITH    *
6  * THIS SOURCE. PLEASE READ THESE TERMS BEFORE DISTRIBUTING.        *
7  *                                                                  *
8  * THE OggVorbis SOURCE CODE IS (C) COPYRIGHT 1994-2000             *
9  * by Monty <monty@xiph.org> and the XIPHOPHORUS Company            *
10  * http://www.xiph.org/                                             *
11  *                                                                  *
12  ********************************************************************
13
14  function: psychoacoustics not including preecho
15  last mod: $Id: psy.c,v 1.31 2000/11/08 06:08:11 xiphmont Exp $
16
17  ********************************************************************/
18
19 #include <stdlib.h>
20 #include <math.h>
21 #include <string.h>
22 #include "vorbis/codec.h"
23
24 #include "masking.h"
25 #include "psy.h"
26 #include "os.h"
27 #include "lpc.h"
28 #include "smallft.h"
29 #include "scales.h"
30 #include "misc.h"
31
32 /* Why Bark scale for encoding but not masking computation? Because
33    masking has a strong harmonic dependancy */
34
35 /* the beginnings of real psychoacoustic infrastructure.  This is
36    still not tightly tuned */
37 void _vi_psy_free(vorbis_info_psy *i){
38   if(i){
39     memset(i,0,sizeof(vorbis_info_psy));
40     free(i);
41   }
42 }
43
44 vorbis_info_psy *_vi_psy_copy(vorbis_info_psy *i){
45   vorbis_info_psy *ret=_ogg_malloc(sizeof(vorbis_info_psy));
46   memcpy(ret,i,sizeof(vorbis_info_psy));
47   return(ret);
48 }
49
50 /* Set up decibel threshhold slopes on a Bark frequency scale */
51 /* ATH is the only bit left on a Bark scale.  No reason to change it
52    right now */
53 static void set_curve(float *ref,float *c,int n, float crate){
54   int i,j=0;
55
56   for(i=0;i<MAX_BARK-1;i++){
57     int endpos=rint(fromBARK(i+1)*2*n/crate);
58     float base=ref[i];
59     if(j<endpos){
60       float delta=(ref[i+1]-base)/(endpos-j);
61       for(;j<endpos && j<n;j++){
62         c[j]=base;
63         base+=delta;
64       }
65     }
66   }
67 }
68
69 static void min_curve(float *c,
70                        float *c2){
71   int i;  
72   for(i=0;i<EHMER_MAX;i++)if(c2[i]<c[i])c[i]=c2[i];
73 }
74 static void max_curve(float *c,
75                        float *c2){
76   int i;  
77   for(i=0;i<EHMER_MAX;i++)if(c2[i]>c[i])c[i]=c2[i];
78 }
79
80 static void attenuate_curve(float *c,float att){
81   int i;
82   for(i=0;i<EHMER_MAX;i++)
83     c[i]+=att;
84 }
85
86 static void linear_curve(float *c){
87   int i;  
88   for(i=0;i<EHMER_MAX;i++)
89     if(c[i]<=-200.)
90       c[i]=0.;
91     else
92       c[i]=fromdB(c[i]);
93 }
94
95 static void interp_curve(float *c,float *c1,float *c2,float del){
96   int i;
97   for(i=0;i<EHMER_MAX;i++)
98     c[i]=c2[i]*del+c1[i]*(1.-del);
99 }
100
101 static void setup_curve(float **c,
102                         int band,
103                         float *curveatt_dB){
104   int i,j;
105   float ath[EHMER_MAX];
106   float tempc[P_LEVELS][EHMER_MAX];
107
108   memcpy(c[0],c[4],sizeof(float)*EHMER_MAX);
109   memcpy(c[2],c[4],sizeof(float)*EHMER_MAX);
110
111   /* we add back in the ATH to avoid low level curves falling off to
112      -infinity and unneccessarily cutting off high level curves in the
113      curve limiting (last step).  But again, remember... a half-band's
114      settings must be valid over the whole band, and it's better to
115      mask too little than too much, so be pessimal. */
116
117   for(i=0;i<EHMER_MAX;i++){
118     float oc_min=band*.5-1+(i-EHMER_OFFSET)*.125;
119     float oc_max=band*.5-1+(i-EHMER_OFFSET+1)*.125;
120     float bark=toBARK(fromOC(oc_min));
121     int ibark=floor(bark);
122     float del=bark-ibark;
123     float ath_min,ath_max;
124
125     if(ibark<26)
126       ath_min=ATH_Bark_dB[ibark]*(1.-del)+ATH_Bark_dB[ibark+1]*del;
127     else
128       ath_min=200.;
129
130     bark=toBARK(fromOC(oc_max));
131     ibark=floor(bark);
132     del=bark-ibark;
133
134     if(ibark<26)
135       ath_max=ATH_Bark_dB[ibark]*(1.-del)+ATH_Bark_dB[ibark+1]*del;
136     else
137       ath_max=200.;
138
139     ath[i]=min(ath_min,ath_max);
140   }
141
142   /* The c array is comes in as dB curves at 20 40 60 80 100 dB.
143      interpolate intermediate dB curves */
144   for(i=1;i<P_LEVELS;i+=2){
145     interp_curve(c[i],c[i-1],c[i+1],.5);
146   }
147
148   /* normalize curves so the driving amplitude is 0dB */
149   /* make temp curves with the ATH overlayed */
150   for(i=0;i<P_LEVELS;i++){
151     attenuate_curve(c[i],curveatt_dB[i]);
152     memcpy(tempc[i],ath,EHMER_MAX*sizeof(float));
153     attenuate_curve(tempc[i],-i*10.);
154     max_curve(tempc[i],c[i]);
155   }
156
157   /* Now limit the louder curves.
158
159      the idea is this: We don't know what the playback attenuation
160      will be; 0dB SL moves every time the user twiddles the volume
161      knob. So that means we have to use a single 'most pessimal' curve
162      for all masking amplitudes, right?  Wrong.  The *loudest* sound
163      can be in (we assume) a range of ...+100dB] SL.  However, sounds
164      20dB down will be in a range ...+80], 40dB down is from ...+60],
165      etc... */
166
167   for(j=1;j<P_LEVELS;j++){
168     min_curve(tempc[j],tempc[j-1]);
169     min_curve(c[j],tempc[j]);
170   }
171
172   /* take things out of dB domain into linear amplitude */
173   for(i=0;i<P_LEVELS;i++)
174     linear_curve(c[i]);
175
176 }
177
178 void _vp_psy_init(vorbis_look_psy *p,vorbis_info_psy *vi,int n,long rate){
179   long i,j;
180   memset(p,0,sizeof(vorbis_look_psy));
181   p->ath=_ogg_malloc(n*sizeof(float));
182   p->octave=_ogg_malloc(n*sizeof(int));
183   p->bark=_ogg_malloc(n*sizeof(float));
184   p->vi=vi;
185   p->n=n;
186
187   /* set up the lookups for a given blocksize and sample rate */
188   /* Vorbis max sample rate is limited by 26 Bark (54kHz) */
189   set_curve(ATH_Bark_dB, p->ath,n,rate);
190   for(i=0;i<n;i++)
191     p->ath[i]=fromdB(p->ath[i]);
192   for(i=0;i<n;i++)
193     p->bark[i]=toBARK(rate/(2*n)*i); 
194
195   for(i=0;i<n;i++){
196     int oc=toOC((i+.5)*rate/(2*n))*2.+2; /* half octaves, actually */
197     if(oc<0)oc=0;
198     if(oc>=P_BANDS)oc=P_BANDS-1;
199     p->octave[i]=oc;
200   }  
201
202   p->tonecurves=_ogg_malloc(P_BANDS*sizeof(float **));
203   p->noiseatt=_ogg_malloc(P_BANDS*sizeof(float **));
204   p->peakatt=_ogg_malloc(P_BANDS*sizeof(float *));
205   for(i=0;i<P_BANDS;i++){
206     p->tonecurves[i]=_ogg_malloc(P_LEVELS*sizeof(float *));
207     p->noiseatt[i]=_ogg_malloc(P_LEVELS*sizeof(float));
208     p->peakatt[i]=_ogg_malloc(P_LEVELS*sizeof(float));
209   }
210
211   for(i=0;i<P_BANDS;i++)
212     for(j=0;j<P_LEVELS;j++){
213       p->tonecurves[i][j]=_ogg_malloc(EHMER_MAX*sizeof(float));
214     }
215
216   /* OK, yeah, this was a silly way to do it */
217   memcpy(p->tonecurves[0][4],tone_125_40dB_SL,sizeof(float)*EHMER_MAX);
218   memcpy(p->tonecurves[0][6],tone_125_60dB_SL,sizeof(float)*EHMER_MAX);
219   memcpy(p->tonecurves[0][8],tone_125_80dB_SL,sizeof(float)*EHMER_MAX);
220   memcpy(p->tonecurves[0][10],tone_125_100dB_SL,sizeof(float)*EHMER_MAX);
221
222   memcpy(p->tonecurves[2][4],tone_125_40dB_SL,sizeof(float)*EHMER_MAX);
223   memcpy(p->tonecurves[2][6],tone_125_60dB_SL,sizeof(float)*EHMER_MAX);
224   memcpy(p->tonecurves[2][8],tone_125_80dB_SL,sizeof(float)*EHMER_MAX);
225   memcpy(p->tonecurves[2][10],tone_125_100dB_SL,sizeof(float)*EHMER_MAX);
226
227   memcpy(p->tonecurves[4][4],tone_250_40dB_SL,sizeof(float)*EHMER_MAX);
228   memcpy(p->tonecurves[4][6],tone_250_60dB_SL,sizeof(float)*EHMER_MAX);
229   memcpy(p->tonecurves[4][8],tone_250_80dB_SL,sizeof(float)*EHMER_MAX);
230   memcpy(p->tonecurves[4][10],tone_250_100dB_SL,sizeof(float)*EHMER_MAX);
231
232   memcpy(p->tonecurves[6][4],tone_500_40dB_SL,sizeof(float)*EHMER_MAX);
233   memcpy(p->tonecurves[6][6],tone_500_60dB_SL,sizeof(float)*EHMER_MAX);
234   memcpy(p->tonecurves[6][8],tone_500_80dB_SL,sizeof(float)*EHMER_MAX);
235   memcpy(p->tonecurves[6][10],tone_500_100dB_SL,sizeof(float)*EHMER_MAX);
236
237   memcpy(p->tonecurves[8][4],tone_1000_40dB_SL,sizeof(float)*EHMER_MAX);
238   memcpy(p->tonecurves[8][6],tone_1000_60dB_SL,sizeof(float)*EHMER_MAX);
239   memcpy(p->tonecurves[8][8],tone_1000_80dB_SL,sizeof(float)*EHMER_MAX);
240   memcpy(p->tonecurves[8][10],tone_1000_100dB_SL,sizeof(float)*EHMER_MAX);
241
242   memcpy(p->tonecurves[10][4],tone_2000_40dB_SL,sizeof(float)*EHMER_MAX);
243   memcpy(p->tonecurves[10][6],tone_2000_60dB_SL,sizeof(float)*EHMER_MAX);
244   memcpy(p->tonecurves[10][8],tone_2000_80dB_SL,sizeof(float)*EHMER_MAX);
245   memcpy(p->tonecurves[10][10],tone_2000_100dB_SL,sizeof(float)*EHMER_MAX);
246
247   memcpy(p->tonecurves[12][4],tone_4000_40dB_SL,sizeof(float)*EHMER_MAX);
248   memcpy(p->tonecurves[12][6],tone_4000_60dB_SL,sizeof(float)*EHMER_MAX);
249   memcpy(p->tonecurves[12][8],tone_4000_80dB_SL,sizeof(float)*EHMER_MAX);
250   memcpy(p->tonecurves[12][10],tone_4000_100dB_SL,sizeof(float)*EHMER_MAX);
251
252   memcpy(p->tonecurves[14][4],tone_8000_40dB_SL,sizeof(float)*EHMER_MAX);
253   memcpy(p->tonecurves[14][6],tone_8000_60dB_SL,sizeof(float)*EHMER_MAX);
254   memcpy(p->tonecurves[14][8],tone_8000_80dB_SL,sizeof(float)*EHMER_MAX);
255   memcpy(p->tonecurves[14][10],tone_8000_100dB_SL,sizeof(float)*EHMER_MAX);
256
257   memcpy(p->tonecurves[16][4],tone_8000_40dB_SL,sizeof(float)*EHMER_MAX);
258   memcpy(p->tonecurves[16][6],tone_8000_60dB_SL,sizeof(float)*EHMER_MAX);
259   memcpy(p->tonecurves[16][8],tone_8000_80dB_SL,sizeof(float)*EHMER_MAX);
260   memcpy(p->tonecurves[16][10],tone_8000_100dB_SL,sizeof(float)*EHMER_MAX);
261
262   /* interpolate curves between */
263   for(i=1;i<P_BANDS;i+=2)
264     for(j=4;j<P_LEVELS;j+=2){
265       memcpy(p->tonecurves[i][j],p->tonecurves[i-1][j],EHMER_MAX*sizeof(float));
266       /*interp_curve(p->tonecurves[i][j],
267                    p->tonecurves[i-1][j],
268                    p->tonecurves[i+1][j],.5);*/
269       min_curve(p->tonecurves[i][j],p->tonecurves[i+1][j]);
270       /*min_curve(p->tonecurves[i][j],p->tonecurves[i-1][j]);*/
271     }
272
273   /*for(i=0;i<P_BANDS-1;i++)
274     for(j=4;j<P_LEVELS;j+=2)
275     min_curve(p->tonecurves[i][j],p->tonecurves[i+1][j]);*/
276
277   /* set up the final curves */
278   for(i=0;i<P_BANDS;i++)
279     setup_curve(p->tonecurves[i],i,vi->toneatt[i]);
280
281   /* set up attenuation levels */
282   for(i=0;i<P_BANDS;i++)
283     for(j=0;j<P_LEVELS;j++){
284       p->peakatt[i][j]=fromdB(p->vi->peakatt[i][j]);
285       p->noiseatt[i][j]=fromdB(p->vi->noiseatt[i][j]);
286     }
287
288 }
289
290 void _vp_psy_clear(vorbis_look_psy *p){
291   int i,j;
292   if(p){
293     if(p->ath)free(p->ath);
294     if(p->octave)free(p->octave);
295     if(p->tonecurves){
296       for(i=0;i<P_BANDS;i++){
297         for(j=0;j<P_LEVELS;j++){
298           free(p->tonecurves[i][j]);
299         }
300         free(p->noiseatt[i]);
301         free(p->tonecurves[i]);
302         free(p->peakatt[i]);
303       }
304       free(p->tonecurves);
305       free(p->noiseatt);
306       free(p->peakatt);
307     }
308     memset(p,0,sizeof(vorbis_look_psy));
309   }
310 }
311
312 static void compute_decay_fixed(vorbis_look_psy *p,float *f, float *decay, int n){
313   /* handle decay */
314   int i;
315   float decscale=fromdB(p->vi->decay_coeff*n); 
316   float attscale=1./fromdB(p->vi->attack_coeff); 
317
318   for(i=10;i<n;i++){
319     float pre=decay[i];
320     if(decay[i]){
321       float val=decay[i]*decscale;
322       float att=fabs(f[i]/val);
323
324       if(att>attscale)
325         decay[i]=fabs(f[i]/attscale);
326       else
327         decay[i]=val;
328     }else{
329       decay[i]=fabs(f[i]/attscale);
330     }
331     if(pre>f[i])f[i]=pre;
332   }
333 }
334
335 static long _eights[EHMER_MAX+1]={
336   981,1069,1166,1272,
337   1387,1512,1649,1798,
338   1961,2139,2332,2543,
339   2774,3025,3298,3597,
340   3922,4277,4664,5087,
341   5547,6049,6597,7194,
342   7845,8555,9329,10173,
343   11094,12098,13193,14387,
344   15689,17109,18658,20347,
345   22188,24196,26386,28774,
346   31379,34219,37316,40693,
347   44376,48393,52772,57549,
348   62757,68437,74631,81386,
349   88752,96785,105545,115097,
350   125515};
351
352 static int seed_curve(float *flr,
353                       float **curves,
354                        float amp,float specmax,
355                        int x,int n,float specatt,
356                        int maxEH){
357   int i;
358   float *curve;
359
360   /* make this attenuation adjustable */
361   int choice=(int)((todB(amp)-specmax+specatt)/10.+.5);
362   choice=max(choice,0);
363   choice=min(choice,P_LEVELS-1);
364
365   for(i=maxEH;i>=0;i--)
366     if(((x*_eights[i])>>12)<n)break;
367   maxEH=i;
368   curve=curves[choice];
369
370   for(;i>=0;i--)
371     if(curve[i]>0.)break;
372   
373   for(;i>=0;i--){
374     float lin=curve[i];
375     if(lin>0.){
376       float *fp=flr+((x*_eights[i])>>12);
377       lin*=amp; 
378       if(*fp<lin)*fp=lin;
379     }else break;
380   }    
381   return(maxEH);
382 }
383
384 static void seed_peak(float *flr,
385                       float *att,
386                       float amp,float specmax,
387                       int x,int n,float specatt){
388   int prevx=(x*_eights[16])>>12;
389
390   /* make this attenuation adjustable */
391   int choice=rint((todB(amp)-specmax+specatt)/10.+.5);
392   if(choice<0)choice=0;
393   if(choice>=P_LEVELS)choice=P_LEVELS-1;
394
395   if(prevx<n){
396     float lin=att[choice];
397     if(lin){
398       lin*=amp; 
399       if(flr[prevx]<lin)flr[prevx]=lin;
400     }
401   }
402 }
403
404 static void seed_generic(vorbis_look_psy *p,
405                          float ***curves,
406                          float *f, 
407                          float *flr,
408                          float *seeds,
409                          float specmax){
410   vorbis_info_psy *vi=p->vi;
411   long n=p->n,i;
412   int maxEH=EHMER_MAX-1;
413
414   /* prime the working vector with peak values */
415   /* Use the 125 Hz curve up to 125 Hz and 8kHz curve after 8kHz. */
416   for(i=0;i<n;i++)
417     if(f[i]>flr[i])
418       maxEH=seed_curve(seeds,curves[p->octave[i]],
419                        f[i],specmax,i,n,vi->max_curve_dB,maxEH);
420 }
421
422 static void seed_att(vorbis_look_psy *p,
423                      float **att,
424                      float *f, 
425                      float *flr,
426                      float specmax){
427   vorbis_info_psy *vi=p->vi;
428   long n=p->n,i;
429   
430   for(i=0;i<n;i++)
431     if(f[i]>flr[i])
432       seed_peak(flr,att[p->octave[i]],f[i],
433                 specmax,i,n,vi->max_curve_dB);
434 }
435
436 static void seed_point(vorbis_look_psy *p,
437                      float **att,
438                      float *f, 
439                      float *flr,
440                      float specmax){
441   vorbis_info_psy *vi=p->vi;
442   long n=p->n,i;
443   
444   for(i=0;i<n;i++){
445     /* make this attenuation adjustable */
446     int choice=rint((todB(f[i])-specmax+vi->max_curve_dB)/10.+.5);
447     float lin;
448     if(choice<0)choice=0;
449     if(choice>=P_LEVELS)choice=P_LEVELS-1;
450     lin=att[p->octave[i]][choice]*f[i];
451     if(flr[i]<lin)flr[i]=lin;
452   }
453 }
454
455 /* bleaugh, this is more complicated than it needs to be */
456 static void max_seeds(vorbis_look_psy *p,float *seeds,float *flr){
457   long n=p->n,i,j;
458   long *posstack=alloca(n*sizeof(long));
459   float *ampstack=alloca(n*sizeof(float));
460   long stack=0;
461
462   for(i=0;i<n;i++){
463     if(stack<2){
464       posstack[stack]=i;
465       ampstack[stack++]=seeds[i];
466     }else{
467       while(1){
468         if(seeds[i]<ampstack[stack-1]){
469           posstack[stack]=i;
470           ampstack[stack++]=seeds[i];
471           break;
472         }else{
473           if(i<posstack[stack-1]*1.0905077080){
474             if(stack>1 && ampstack[stack-1]<ampstack[stack-2] &&
475                i<posstack[stack-2]*1.0905077080){
476               /* we completely overlap, making stack-1 irrelevant.  pop it */
477               stack--;
478               continue;
479             }
480           }
481           posstack[stack]=i;
482           ampstack[stack++]=seeds[i];
483           break;
484
485         }
486       }
487     }
488   }
489
490   /* the stack now contains only the positions that are relevant. Scan
491      'em straight through */
492   {
493     long pos=0;
494     for(i=0;i<stack;i++){
495       long endpos;
496       if(i<stack-1 && ampstack[i+1]>ampstack[i]){
497         endpos=posstack[i+1];
498       }else{
499         endpos=posstack[i]*1.0905077080+1; /* +1 is important, else bin 0 is
500                                        discarded in short frames */
501       }
502       if(endpos>n)endpos=n;
503       for(j=pos;j<endpos;j++)
504         if(flr[j]<ampstack[i])
505           flr[j]=ampstack[i];
506       pos=endpos;
507     }
508   }   
509
510   /* there.  Linear time.  I now remember this was on a problem set I
511      had in Grad Skool... I didn't solve it at the time ;-) */
512 }
513
514 static void bark_noise(long n,float *b,float *f,float *noise){
515   long i=1,lo=0,hi=2;
516   float acc=0.,val,del=0.;
517
518   float *norm=alloca(n*sizeof(float));
519
520   memset(noise,0,n*sizeof(float));
521   memset(norm,0,n*sizeof(float));
522
523   while(hi<n){
524     val=todB_nn(f[i]*f[i])+400.;
525     del=1./(i-lo);
526     noise[lo]+=val*del;
527     noise[i]-=val*del;
528     norm[lo]+=del;
529     norm[i]-=del;
530  
531     del=1./(hi-i);
532     noise[i]-=val*del;
533     noise[hi]+=val*del;
534     norm[hi]+=del;
535     norm[i]-=del;
536     
537
538     i++;
539     for(;hi<n && b[hi]-.3<b[i];hi++);
540     for(;lo<i-1 && b[lo]+.3<b[i];lo++);
541     if(i==hi)hi++;
542   }
543
544   {
545     long ilo=i-lo;
546     long hii=hi-i;
547
548     for(;i<n;i++){
549       val=todB_nn(f[i]*f[i])+400.;
550       del=1./(hii);
551       noise[i]-=val*del;
552       norm[i]-=del;
553      
554       del=1./(ilo);
555       noise[i-ilo]+=val*del;
556       noise[i]-=val*del;      
557       norm[i-ilo]+=del;
558       norm[i]-=del;      
559     }
560     for(i=1,lo=n-ilo;lo<n;lo++,i++){
561       val=todB_nn(f[n-i]*f[n-i])+400.;
562       del=1./ilo;
563       noise[lo]+=val*del;
564       norm[lo]+=del;
565     }
566   }
567
568
569   acc=0;
570   val=0;
571
572   for(i=0;i<n;i++){
573     val+=norm[i];
574     norm[i]=val;
575     acc+=noise[i];
576     noise[i]=acc;
577   }
578
579   val=0;
580   acc=0;
581   for(i=0;i<n;i++){
582     val+=norm[i];
583     acc+=noise[i];
584     if(val==0){
585       noise[i]=0.;
586       norm[i]=0;
587     }else{
588       float v=acc/val-400;
589       noise[i]=sqrt(fromdB(v));
590     }
591   }
592 }
593
594 void _vp_compute_mask(vorbis_look_psy *p,float *f, 
595                       float *flr, 
596                       float *decay){
597   float *smooth=alloca(sizeof(float)*p->n);
598   int i,n=p->n;
599   float specmax=0.;
600   static int seq=0;
601
602   float *seed=alloca(sizeof(float)*p->n);
603   float *seed2=alloca(sizeof(float)*p->n);
604
605   _analysis_output("mdct",seq,f,n,1,1);
606   memset(flr,0,n*sizeof(float));
607
608   /* noise masking */
609   if(p->vi->noisemaskp){
610     memset(seed,0,n*sizeof(float));
611     bark_noise(n,p->bark,f,seed);
612     seed_point(p,p->noiseatt,seed,flr,specmax);
613
614   }
615
616   /* smooth the data is that's called for ********************************/
617   for(i=0;i<n;i++)smooth[i]=fabs(f[i]);
618   if(p->vi->smoothp){
619     /* compute power^.5 of three neighboring bins to smooth for peaks
620        that get split twixt bins/peaks that nail the bin.  This evens
621        out treatment as we're not doing additive masking any longer. */
622     float acc=smooth[0]*smooth[0]+smooth[1]*smooth[1];
623     float prev=smooth[0];
624
625     smooth[0]=sqrt(acc);
626     for(i=1;i<n-1;i++){
627       float this=smooth[i];
628       acc+=smooth[i+1]*smooth[i+1];
629       if(acc<0)acc=0; /* it can happen due to finite precision */
630       smooth[i]=sqrt(acc);
631       acc-=prev*prev;
632       prev=this;
633     }
634     if(acc<0)acc=0; /* in case it happens on the final iteration */
635     smooth[n-1]=sqrt(acc);
636   }
637
638   _analysis_output("smooth",seq,smooth,n,1,1);
639
640   /* find the highest peak so we know the limits *************************/
641   for(i=0;i<n;i++){
642     if(smooth[i]>specmax)specmax=smooth[i];
643   }
644   specmax=todB(specmax);
645
646   /* set the ATH (floating below specmax by a specified att) */
647   if(p->vi->athp){
648     float att=specmax+p->vi->ath_adjatt;
649     if(att<p->vi->ath_maxatt)att=p->vi->ath_maxatt;
650     att=fromdB(att);
651
652     for(i=0;i<n;i++){
653       float av=p->ath[i]*att;
654       if(av>flr[i])flr[i]=av;
655     }
656   }
657
658   _analysis_output("ath",seq,flr,n,1,1);
659
660   /* peak attenuation ******/
661   if(p->vi->peakattp){
662     memset(seed,0,n*sizeof(float));
663     seed_att(p,p->peakatt,smooth,seed,specmax);
664     max_seeds(p,seed,flr);
665   }
666
667   /* tone masking */
668   if(p->vi->tonemaskp){
669     memset(seed,0,n*sizeof(float));
670     memset(seed2,0,n*sizeof(float));
671
672     seed_generic(p,p->tonecurves,smooth,flr,seed2,specmax);
673     max_seeds(p,seed2,seed2);
674
675     for(i=0;i<n;i++)if(seed2[i]<flr[i])seed2[i]=flr[i];
676     for(i=0;i<n;i++)if(seed2[i]<decay[i])seed2[i]=decay[i];
677
678     seed_generic(p,p->tonecurves,smooth,seed2,seed,specmax);
679     max_seeds(p,seed,seed);
680     
681     if(p->vi->decayp)
682       compute_decay_fixed(p,seed,decay,n);
683     
684     for(i=0;i<n;i++)if(flr[i]<seed[i])flr[i]=seed[i];
685     
686   }
687
688   _analysis_output("final",seq,flr,n,1,1);
689
690   /* doing this here is clean, but we need to find a faster way to do
691      it than to just tack it on */
692
693   for(i=0;i<n;i++)if(2.*f[i]>flr[i] || -2.*f[i]>flr[i])break;
694   if(i==n)memset(flr,0,sizeof(float)*n);
695
696   seq++;
697 }
698
699
700 /* this applies the floor and (optionally) tries to preserve noise
701    energy in low resolution portions of the spectrum */
702 /* f and flr are *linear* scale, not dB */
703 void _vp_apply_floor(vorbis_look_psy *p,float *f, float *flr){
704   float *work=alloca(p->n*sizeof(float));
705   int j;
706
707   /* subtract the floor */
708   for(j=0;j<p->n;j++){
709     if(flr[j]<=0)
710       work[j]=0.;
711     else
712       work[j]=f[j]/flr[j];
713   }
714
715   memcpy(f,work,p->n*sizeof(float));
716 }
717
718