\r
\r
.macro PREFETCHT0_C\r
+ prefetcht0 ALPHA\r
prefetcht0 (CO1)\r
prefetcht0 24(CO1)\r
prefetcht0 (CO1,LDC,4)\r
prefetcht0 24(CO1,LDC,4)\r
prefetcht0 (CO1,LDC,8)\r
prefetcht0 24(CO1,LDC,8)\r
- addq LDC,CO1\r
- prefetcht0 (CO1)\r
- prefetcht0 24(CO1)\r
- prefetcht0 (CO1,LDC,4)\r
- prefetcht0 24(CO1,LDC,4)\r
- prefetcht0 (CO1,LDC,8)\r
- prefetcht0 24(CO1,LDC,8)\r
- leaq (CO1,LDC,2),CO1\r
- prefetcht0 (CO1)\r
- prefetcht0 24(CO1)\r
- prefetcht0 (CO1,LDC,4)\r
- prefetcht0 24(CO1,LDC,4)\r
- prefetcht0 (CO1,LDC,8)\r
- prefetcht0 24(CO1,LDC,8)\r
- subq LDC,CO1\r
- prefetcht0 (CO1)\r
- prefetcht0 24(CO1)\r
- prefetcht0 (CO1,LDC,4)\r
- prefetcht0 24(CO1,LDC,4)\r
- prefetcht0 (CO1,LDC,8)\r
- prefetcht0 24(CO1,LDC,8)\r
- subq LDC,CO1\r
- subq LDC,CO1\r
.endm\r
/*******************************************************************************************/\r
\r
dec %rax\r
jne .L12_12\r
\r
- PREFETCHT0_C\r
.L12_12a:\r
-\r
+ PREFETCHT0_C\r
+ addq LDC,CO1\r
KERNEL4x12_M1\r
+ PREFETCHT0_C\r
+ leaq (CO1,LDC,2),CO1\r
KERNEL4x12_M2\r
+ PREFETCHT0_C\r
+ subq LDC,CO1\r
KERNEL4x12_M1\r
+ PREFETCHT0_C\r
+ subq LDC,CO1\r
+ subq LDC,CO1\r
KERNEL4x12_M2\r
\r
KERNEL4x12_M1\r
\r
.L13_12a:\r
\r
+ PREFETCHT0_C\r
+ addq LDC,CO1\r
KERNEL4x12_M1\r
+ PREFETCHT0_C\r
+ leaq (CO1,LDC,2),CO1\r
KERNEL4x12_M2\r
+ PREFETCHT0_C\r
+ subq LDC,CO1\r
KERNEL4x12_M1\r
+ PREFETCHT0_C\r
+ subq LDC,CO1\r
+ subq LDC,CO1\r
KERNEL4x12_M2\r
\r
KERNEL4x12_M1\r
\r
jmp .L13_16\r
\r
- PREFETCHT0_C\r
.L13_13:\r
\r
test $1, %rax\r