sgemm_kernel_16x4_haswell.S minor changes
authorwernsaar <wernsaar@googlemail.com>
Tue, 13 Aug 2013 23:44:41 +0000 (01:44 +0200)
committerwernsaar <wernsaar@googlemail.com>
Tue, 13 Aug 2013 23:44:41 +0000 (01:44 +0200)
kernel/x86_64/sgemm_kernel_16x4_haswell.S

index 5a6a9e6..9220961 100644 (file)
         leaq    BUFFER1, BO                    // first buffer to BO\r
         addq    $4 * SIZE, BO\r
         movq    %rax, BI                        //  Index for BO\r
-       salq    $2 ,BI                          // BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         salq    $4, %rax                        // rax = rax * 16 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         movq    K, %rax\r
         subq    KKK, %rax\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         salq    $4, %rax                        // rax = rax * 16 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         leaq    BUFFER1, BO             // first buffer to BO\r
         addq    $4 * SIZE, BO\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         salq    $3, %rax                        // rax = rax * 8 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         movq    K, %rax \r
         subq    KKK, %rax\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO         \r
         salq    $3, %rax                        // rax = rax * 8 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         leaq    BUFFER1, BO             // first buffer to BO\r
         addq    $4 * SIZE, BO\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         salq    $2, %rax                        // rax = rax * 4 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         movq    K, %rax \r
         subq    KKK, %rax\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO         \r
         salq    $2, %rax                        // rax = rax * 4 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         leaq    BUFFER1, BO             // first buffer to BO\r
         addq    $4 * SIZE, BO\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                         //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         salq    $1, %rax                        // rax = rax * 2 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
        je .L4_39\r
 \r
        movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                          //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
        \r
        salq    $1, %rax                        // rax = rax *2 ; number of values\r
        leaq    (AO, %rax, SIZE), AO\r
         movq    K, %rax \r
         subq    KKK, %rax\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                          //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO         \r
         salq    $1, %rax                        // rax = rax * 2 ; number of values\r
         leaq    (AO, %rax, SIZE), AO\r
         leaq    BUFFER1, BO             // first buffer to BO\r
         addq    $4 * SIZE, BO\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                          //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO\r
         leaq    (AO, %rax, SIZE), AO\r
 #endif\r
         movq    K, %rax \r
         subq    KKK, %rax\r
         movq    %rax, BI                        //  Index for BO\r
-        salq    $2, BI                          //  BI = BI * 4 ; number of values\r
+       leaq    (,BI, 4), BI                    // BI = BI * 4 ; number of values\r
         leaq    (BO, BI, SIZE), BO         \r
         leaq    (AO, %rax, SIZE), AO\r
 #endif  \r