[MCA][X86] Add missing AVX-GFNI YMM test coverage
authorSimon Pilgrim <llvm-dev@redking.me.uk>
Sat, 12 Nov 2022 17:37:09 +0000 (17:37 +0000)
committerSimon Pilgrim <llvm-dev@redking.me.uk>
Sat, 12 Nov 2022 17:37:09 +0000 (17:37 +0000)
llvm/test/tools/llvm-mca/X86/AlderlakeP/resources-avxgfni.s
llvm/test/tools/llvm-mca/X86/Generic/resources-avxgfni.s
llvm/test/tools/llvm-mca/X86/IceLakeServer/resources-avxgfni.s

index 8728310..2f9fe5d 100644 (file)
@@ -4,12 +4,21 @@
 vgf2p8affineinvqb   $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineinvqb   $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineinvqb   $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineinvqb   $0, (%rax), %ymm1, %ymm2
+
 vgf2p8affineqb      $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineqb      $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineqb      $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineqb      $0, (%rax), %ymm1, %ymm2
+
 vgf2p8mulb          %xmm0, %xmm1, %xmm2
 vgf2p8mulb          (%rax), %xmm1, %xmm2
 
+vgf2p8mulb          %ymm0, %ymm1, %ymm2
+vgf2p8mulb          (%rax), %ymm1, %ymm2
+
 # CHECK:      Instruction Info:
 # CHECK-NEXT: [1]: #uOps
 # CHECK-NEXT: [2]: Latency
@@ -21,10 +30,16 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      12    0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8mulb     %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      12    0.50    *                   vgf2p8mulb     (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8mulb     %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      12    0.50    *                   vgf2p8mulb     (%rax), %ymm1, %ymm2
 
 # CHECK:      Resources:
 # CHECK-NEXT: [0]   - ADLPPort00
@@ -43,13 +58,19 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]   [12]
-# CHECK-NEXT: 3.00   3.00   1.00   1.00    -      -      -      -      -      -      -     1.00    -
+# CHECK-NEXT: 6.00   6.00   2.00   2.00    -      -      -      -      -      -      -     2.00    -
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]   [12]   Instructions:
 # CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8affineinvqb     $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8affineinvqb     $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8affineinvqb     $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8affineinvqb     $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8affineqb        $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8affineqb        $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8affineqb        $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8affineqb        $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8mulb    %xmm0, %xmm1, %xmm2
 # CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8mulb    (%rax), %xmm1, %xmm2
+# CHECK-NEXT: 0.50   0.50    -      -      -      -      -      -      -      -      -      -      -     vgf2p8mulb    %ymm0, %ymm1, %ymm2
+# CHECK-NEXT: 0.50   0.50   0.33   0.33    -      -      -      -      -      -      -     0.33    -     vgf2p8mulb    (%rax), %ymm1, %ymm2
index 8f86f2a..729e092 100644 (file)
@@ -4,12 +4,21 @@
 vgf2p8affineinvqb   $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineinvqb   $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineinvqb   $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineinvqb   $0, (%rax), %ymm1, %ymm2
+
 vgf2p8affineqb      $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineqb      $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineqb      $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineqb      $0, (%rax), %ymm1, %ymm2
+
 vgf2p8mulb          %xmm0, %xmm1, %xmm2
 vgf2p8mulb          (%rax), %xmm1, %xmm2
 
+vgf2p8mulb          %ymm0, %ymm1, %ymm2
+vgf2p8mulb          (%rax), %ymm1, %ymm2
+
 # CHECK:      Instruction Info:
 # CHECK-NEXT: [1]: #uOps
 # CHECK-NEXT: [2]: Latency
@@ -21,10 +30,16 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     1.00                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    1.00    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %ymm1, %ymm2
 
 # CHECK:      Resources:
 # CHECK-NEXT: [0]   - SBDivider
@@ -38,13 +53,19 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]
-# CHECK-NEXT:  -      -     4.00   1.00    -     1.00   1.50   1.50
+# CHECK-NEXT:  -      -     8.00   2.00    -     2.00   3.00   3.00
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6.0]  [6.1]  Instructions:
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineinvqb        $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineinvqb        $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     1.00    -      -      -      -      -     vgf2p8affineqb   $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     1.00    -      -      -     0.50   0.50   vgf2p8affineqb   $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8mulb       %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8mulb       (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -      -     0.50    -     0.50    -      -     vgf2p8mulb       %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -      -     0.50    -     0.50   0.50   0.50   vgf2p8mulb       (%rax), %ymm1, %ymm2
index c2f6d29..10176e1 100644 (file)
@@ -4,12 +4,21 @@
 vgf2p8affineinvqb   $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineinvqb   $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineinvqb   $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineinvqb   $0, (%rax), %ymm1, %ymm2
+
 vgf2p8affineqb      $0, %xmm0, %xmm1, %xmm2
 vgf2p8affineqb      $0, (%rax), %xmm1, %xmm2
 
+vgf2p8affineqb      $0, %ymm0, %ymm1, %ymm2
+vgf2p8affineqb      $0, (%rax), %ymm1, %ymm2
+
 vgf2p8mulb          %xmm0, %xmm1, %xmm2
 vgf2p8mulb          (%rax), %xmm1, %xmm2
 
+vgf2p8mulb          %ymm0, %ymm1, %ymm2
+vgf2p8mulb          (%rax), %ymm1, %ymm2
+
 # CHECK:      Instruction Info:
 # CHECK-NEXT: [1]: #uOps
 # CHECK-NEXT: [2]: Latency
@@ -21,10 +30,16 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 # CHECK:      [1]    [2]    [3]    [4]    [5]    [6]    Instructions:
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineinvqb      $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineinvqb      $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      5     0.50                        vgf2p8affineqb $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      11    0.50    *                   vgf2p8affineqb $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  1      1     0.50                        vgf2p8mulb     %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  2      7     0.50    *                   vgf2p8mulb     (%rax), %ymm1, %ymm2
 
 # CHECK:      Resources:
 # CHECK-NEXT: [0]   - ICXDivider
@@ -42,13 +57,19 @@ vgf2p8mulb          (%rax), %xmm1, %xmm2
 
 # CHECK:      Resource pressure per iteration:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]
-# CHECK-NEXT:  -      -     3.00   3.00   1.50   1.50    -      -      -      -      -      -
+# CHECK-NEXT:  -      -     6.00   6.00   3.00   3.00    -      -      -      -      -      -
 
 # CHECK:      Resource pressure by instruction:
 # CHECK-NEXT: [0]    [1]    [2]    [3]    [4]    [5]    [6]    [7]    [8]    [9]    [10]   [11]   Instructions:
 # CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8affineinvqb    $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8affineinvqb    $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8affineinvqb    $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8affineinvqb    $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8affineqb       $0, %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8affineqb       $0, (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8affineqb       $0, %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8affineqb       $0, (%rax), %ymm1, %ymm2
 # CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8mulb   %xmm0, %xmm1, %xmm2
 # CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8mulb   (%rax), %xmm1, %xmm2
+# CHECK-NEXT:  -      -     0.50   0.50    -      -      -      -      -      -      -      -     vgf2p8mulb   %ymm0, %ymm1, %ymm2
+# CHECK-NEXT:  -      -     0.50   0.50   0.50   0.50    -      -      -      -      -      -     vgf2p8mulb   (%rax), %ymm1, %ymm2