Update dgemm_kernel_4x8_haswell.S
authorwjc404 <52632443+wjc404@users.noreply.github.com>
Sat, 20 Jul 2019 16:47:45 +0000 (00:47 +0800)
committerGitHub <noreply@github.com>
Sat, 20 Jul 2019 16:47:45 +0000 (00:47 +0800)
kernel/x86_64/dgemm_kernel_4x8_haswell.S

index c834239..26eea0a 100644 (file)
@@ -1866,7 +1866,7 @@ USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
        SAVE4x12\r
 \r
         /* here for the prefetch of next b source block */\r
-       /* the increment should be proportional to the ratio of GEMM_Q/GEMM_P */\r
+       /* the increment should be proportional to GEMM_Q/GEMM_P */\r
 \r
         salq    $3, K\r
 #ifdef WINDOWS_ABI /* GEMM_P == GEMM_Q * 4 */\r
@@ -2184,19 +2184,19 @@ USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
        SAVE4x12\r
 \r
         /* here for the prefetch of next b source block */\r
-       /* the increment should be proportional to the ratio of GEMM_Q/GEMM_P */\r
+       /* the increment should be proportional to GEMM_Q/GEMM_P */\r
 \r
         salq    $3, K\r
 #ifdef WINDOWS_ABI /* GEMM_P == GEMM_Q * 4 */\r
         prefetcht2 (B)\r
         prefetcht2 (B, K, 8)\r
-        addq    $64, B\r
+        addq    $64, B /* increment */\r
 #else /* GEMM_P == GEMM_Q * 2 under linux x86_64 */\r
         prefetcht2 (B)\r
         prefetcht2 (B, K, 8)\r
         prefetcht2 64(B)\r
         prefetcht2 64(B, K, 8)\r
-        addq    $128, B\r
+        addq    $128, B /* increment */\r
 #endif\r
         sarq    $3, K\r
 \r