Enable no-loop memory/register saving for ssse3/sse4 also.
authorRonald S. Bultje <rsbultje@gmail.com>
Mon, 26 Jul 2010 14:07:57 +0000 (14:07 +0000)
committerRonald S. Bultje <rsbultje@gmail.com>
Mon, 26 Jul 2010 14:07:57 +0000 (14:07 +0000)
Originally committed as revision 24511 to svn://svn.ffmpeg.org/ffmpeg/trunk

libavcodec/x86/vp8dsp.asm

index b3070825f122f27c715099616ac9c22b4debc4d6..12144383958c7161503be70ee2f3f6eac5f3dfb2 100644 (file)
@@ -2200,7 +2200,7 @@ cglobal vp8_%2_loop_filter16y_mbedge_%1, 5, %3, %5
     ; align stack
     mov       stack_reg, rsp         ; backup stack pointer
     and             rsp, ~(mmsize-1) ; align stack
-%ifidn %2, sse2
+%if mmsize == 16
     sub             rsp, mmsize * 7
 %else
     sub             rsp, mmsize * 8  ; stack layout: [0]=E, [1]=I, [2]=hev_thr
@@ -2219,7 +2219,7 @@ cglobal vp8_%2_loop_filter16y_mbedge_%1, 5, %3, %5
 %define q0backup [rsp+mmsize*4]
 %define p2backup [rsp+mmsize*5]
 %define q2backup [rsp+mmsize*6]
-%ifidn %2, sse2
+%if mmsize == 16
 %define lim_sign [rsp]
 %else
 %define lim_sign [rsp+mmsize*7]