[X86] Always classify gf2p8affineqb/gf2p8affineinvqb instructions with SchedWriteVecIMul
authorSimon Pilgrim <llvm-dev@redking.me.uk>
Sat, 12 Nov 2022 17:20:07 +0000 (17:20 +0000)
committerSimon Pilgrim <llvm-dev@redking.me.uk>
Sat, 12 Nov 2022 17:20:07 +0000 (17:20 +0000)
There was a mismatch between the AVX512 and SSE/AVX versions

llvm/lib/Target/X86/X86InstrSSE.td
llvm/test/tools/llvm-mca/X86/Generic/resources-avx512gfnivl.s
llvm/test/tools/llvm-mca/X86/Generic/resources-avxgfni.s
llvm/test/tools/llvm-mca/X86/Generic/resources-gfni.s
llvm/test/tools/llvm-mca/X86/IceLakeServer/resources-avx512gfnivl.s
llvm/test/tools/llvm-mca/X86/IceLakeServer/resources-avxgfni.s
llvm/test/tools/llvm-mca/X86/IceLakeServer/resources-gfni.s

index a31117e377ae299934ca05478bcf7bb115f2592e..e648c30c30fb5736eb903907d330f4ebc6d65f63 100644 (file)
@@ -8081,13 +8081,13 @@ multiclass GF2P8AFFINE_rmi<bits<8> Op, string OpStr, ValueType OpVT,
   def rri : Ii8<Op, MRMSrcReg, (outs RC:$dst),
               (ins RC:$src1, RC:$src2, u8imm:$src3), "",
               [(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, timm:$src3)))],
-              SSEPackedInt>, Sched<[SchedWriteVecALU.XMM]>;
+              SSEPackedInt>, Sched<[SchedWriteVecIMul.XMM]>;
   def rmi : Ii8<Op, MRMSrcMem, (outs RC:$dst),
               (ins RC:$src1, X86MemOp:$src2, u8imm:$src3), "",
               [(set RC:$dst, (OpVT (OpNode RC:$src1,
                                     (MemOpFrag addr:$src2),
                               timm:$src3)))], SSEPackedInt>,
-              Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>;
+              Sched<[SchedWriteVecIMul.XMM.Folded, SchedWriteVecIMul.XMM.ReadAfterFold]>;
   }
 }
 
index afb8d5558863bcb1847a18a0667b5a223aa932e3..9d3664d8a0dbe87324c877a7be8b7e867aa54024 100644 (file)
@@ -64,8 +64,8 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2 {%k1}
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2 {%k1}
@@ -73,8 +73,8 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineinvqb      $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2 {%k1}
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2 {%k1}
@@ -82,20 +82,20 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineinvqb      $0, (%rax){1to4}, %ymm1, %ymm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineqb $0, (%rax){1to4}, %ymm1, %ymm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineqb $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    1.00    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2 {%k1} {z}
@@ -125,12 +125,12 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]
-# CHECK-NEXT:  -      -     24.00  12.00   -     12.00  15.00  15.00
+# CHECK-NEXT:  -      -     36.00  6.00    -     6.00   15.00  15.00
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]  Instructions:
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2 {%k1}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2 {%k1}
@@ -138,8 +138,8 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineinvqb        $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %ymm0, %ymm1, %ymm2 {%k1}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %ymm1, %ymm2 {%k1}
@@ -147,20 +147,20 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax){1to4}, %ymm1, %ymm2 {%k1} {z}
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax){1to2}, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax){1to4}, %ymm1, %ymm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2 {%k1} {z}
index e394e301be718fb753ce935f7acdc1e0f4fa4aae..8f86f2a880b37e922705ca109ab03513db327b00 100644 (file)
@@ -19,10 +19,10 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2      7     0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %xmm1, %xmm2
 
@@ -38,13 +38,13 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]
-# CHECK-NEXT:  -      -      -     3.00    -     3.00   1.50   1.50
+# CHECK-NEXT:  -      -     4.00   1.00    -     1.00   1.50   1.50
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]  Instructions:
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8mulb       %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8mulb       (%rax), %xmm1, %xmm2
index e781874f37fbc411f93f52923c1505a86032362a..7c65980e9126c192455d69d8e46356fe9ad7bc46 100644 (file)
@@ -19,10 +19,10 @@ gf2p8mulb           (%rax), %xmm1
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        gf2p8affineinvqb       $0, %xmm0, %xmm1
-# CHECK-NEXT:  2      7     0.50    *                   gf2p8affineinvqb       $0, (%rax), %xmm1
-# CHECK-NEXT:  1      1     0.50                        gf2p8affineqb  $0, %xmm0, %xmm1
-# CHECK-NEXT:  2      7     0.50    *                   gf2p8affineqb  $0, (%rax), %xmm1
+# CHECK-NEXT:  1      5     1.00                        gf2p8affineinvqb       $0, %xmm0, %xmm1
+# CHECK-NEXT:  2      11    1.00    *                   gf2p8affineinvqb       $0, (%rax), %xmm1
+# CHECK-NEXT:  1      5     1.00                        gf2p8affineqb  $0, %xmm0, %xmm1
+# CHECK-NEXT:  2      11    1.00    *                   gf2p8affineqb  $0, (%rax), %xmm1
 # CHECK-NEXT:  1      1     0.50                        gf2p8mulb      %xmm0, %xmm1
 # CHECK-NEXT:  2      7     0.50    *                   gf2p8mulb      (%rax), %xmm1
 
@@ -38,13 +38,13 @@ gf2p8mulb           (%rax), %xmm1
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]
-# CHECK-NEXT:  -      -      -     3.00    -     3.00   1.50   1.50
+# CHECK-NEXT:  -      -     4.00   1.00    -     1.00   1.50   1.50
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]  Instructions:
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     gf2p8affineinvqb $0, %xmm0, %xmm1
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   gf2p8affineinvqb $0, (%rax), %xmm1
-# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     gf2p8affineqb    $0, %xmm0, %xmm1
-# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   gf2p8affineqb    $0, (%rax), %xmm1
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     gf2p8affineinvqb $0, %xmm0, %xmm1
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   gf2p8affineinvqb $0, (%rax), %xmm1
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     gf2p8affineqb    $0, %xmm0, %xmm1
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   gf2p8affineqb    $0, (%rax), %xmm1
 # CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     gf2p8mulb        %xmm0, %xmm1
 # CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   gf2p8mulb        (%rax), %xmm1
index fa53da99cd83b4c6b554a36ccd1b4c030f39cdaa..c284985ae3b18badbffac82fb1ded768ba4528ae 100644 (file)
@@ -64,8 +64,8 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2 {%k1}
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2 {%k1}
@@ -73,8 +73,8 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2 {%k1}
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2 {%k1}
@@ -82,20 +82,20 @@ vgf2p8mulb          (%rax), %ymm1, %ymm2 {z}{k1}
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax){1to4}, %ymm1, %ymm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2 {%k1} {z}
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax){1to2}, %xmm1, %xmm2 {%k1} {z}
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineqb $0, (%rax){1to4}, %ymm1, %ymm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineqb $0, (%rax){1to4}, %ymm1, %ymm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2 {%k1} {z}
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2 {%k1} {z}
index 75b1291d95be706c7a6b46562aa1899739c86bda..c2f6d293ebae31dece88308f3f62a860f22d6799 100644 (file)
@@ -19,10 +19,10 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
-# CHECK-NEXT:  1      1     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
-# CHECK-NEXT:  2          0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
 # CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %xmm1, %xmm2
 
index 0fef4065f3dfbdb97cc21217d3a7b6aa5df53a12..f65339de7ebed80e2ac5f3a2648589a84b501b15 100644 (file)
@@ -19,10 +19,10 @@ gf2p8mulb           (%rax), %xmm1
 # CHECK-NEXT: [6]: HasSideEffects (U)
 
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
-# CHECK-NEXT:  1      1     0.50                        gf2p8affineinvqb       $0, %xmm0, %xmm1
-# CHECK-NEXT:  2          0.50    *                   gf2p8affineinvqb       $0, (%rax), %xmm1
-# CHECK-NEXT:  1      1     0.50                        gf2p8affineqb  $0, %xmm0, %xmm1
-# CHECK-NEXT:  2          0.50    *                   gf2p8affineqb  $0, (%rax), %xmm1
+# CHECK-NEXT:  1      5     0.50                        gf2p8affineinvqb       $0, %xmm0, %xmm1
+# CHECK-NEXT:  2      11    0.50    *                   gf2p8affineinvqb       $0, (%rax), %xmm1
+# CHECK-NEXT:  1      5     0.50                        gf2p8affineqb  $0, %xmm0, %xmm1
+# CHECK-NEXT:  2      11    0.50    *                   gf2p8affineqb  $0, (%rax), %xmm1
 # CHECK-NEXT:  1      1     0.50                        gf2p8mulb      %xmm0, %xmm1
 # CHECK-NEXT:  2      7     0.50    *                   gf2p8mulb      (%rax), %xmm1