\r
SAVE4x12\r
\r
+ salq $3, K\r
+ prefetcht2 32(B)\r
+ prefetcht2 32(B, K, 8)\r
+ prefetcht2 96(B)\r
+ prefetcht2 96(B, K, 8)\r
+ addq $128, B\r
+ sarq $3, K\r
+\r
decq I # i --\r
jne .L12_11\r
ALIGN_4 \r
/**************************************************************************\r
* Rest of M \r
***************************************************************************/\r
+ movq M, I\r
+ sarq $2, I\r
+ salq $7, I\r
+ subq I, B\r
+\r
.L12_20:\r
// Test rest of M\r
\r
\r
jmp .L13_16\r
\r
-\r
+ PREFETCHT0_C\r
.L13_13:\r
\r
test $1, %rax\r
\r
SAVE4x12\r
\r
+ salq $3, K\r
+ prefetcht2 (B)\r
+ prefetcht2 (B, K, 8)\r
+ prefetcht2 64(B)\r
+ prefetcht2 64(B, K, 8)\r
+ addq $128, B\r
+ sarq $3, K\r
+\r
decq I # i --\r
jne .L13_11\r
ALIGN_4 \r
/**************************************************************************\r
* Rest of M \r
***************************************************************************/\r
+\r
+ movq M, I\r
+ sarq $2, I\r
+ salq $7, I\r
+ subq I, B\r
+\r
.L13_20:\r
// Test rest of M\r
\r