sse2 version of compute_autocorr().
authorLoren Merritt <lorenm@u.washington.edu>
Sat, 29 Sep 2007 22:31:18 +0000 (22:31 +0000)
committerLoren Merritt <lorenm@u.washington.edu>
Sat, 29 Sep 2007 22:31:18 +0000 (22:31 +0000)
commit6810b93a81a8c0e845dc2bb90f9e2d35eac17cd1
tree5727ef05fe765c427001d23f416c23c7bafc0867
parentfdf885983c878e6976a72311c56a0efefa725d11
sse2 version of compute_autocorr().
4x faster than c (somehow, even though doubles only allow 2x simd).
overal flac encoding: 15-50% faster on core2, 4-11% on k8, 3-13% on p4.

Originally committed as revision 10621 to svn://svn.ffmpeg.org/ffmpeg/trunk
libavcodec/dsputil.c
libavcodec/dsputil.h
libavcodec/flacenc.c
libavcodec/i386/dsputil_mmx.c