[X86] canonicalizeShuffleWithBinOps - merge shuffles across binops if either source...

author Simon Pilgrim <llvm-dev@redking.me.uk>

Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)

committer Simon Pilgrim <llvm-dev@redking.me.uk>

Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)
author Simon Pilgrim <llvm-dev@redking.me.uk>
Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)
committer Simon Pilgrim <llvm-dev@redking.me.uk>
Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp

index e1298ed..1b4c9e1 100644 (file)
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -39363,17 +39363,18 @@ static SDValue canonicalizeShuffleWithBinOps(SDValue N, SelectionDAG &DAG,
    const TargetLowering &TLI = DAG.getTargetLoweringInfo();
    EVT ShuffleVT = N.getValueType();
  
-  auto IsMergeableWithShuffle = [](SDValue Op, bool FoldLoad = false) {
+  auto IsMergeableWithShuffle = [&DAG](SDValue Op, bool FoldLoad = false) {
      // AllZeros/AllOnes constants are freely shuffled and will peek through
      // bitcasts. Other constant build vectors do not peek through bitcasts. Only
      // merge with target shuffles if it has one use so shuffle combining is
-    // likely to kick in.
+    // likely to kick in. Shuffles of splats are expected to be removed.
      return ISD::isBuildVectorAllOnes(Op.getNode()) ||
             ISD::isBuildVectorAllZeros(Op.getNode()) ||
             ISD::isBuildVectorOfConstantSDNodes(Op.getNode()) ||
             ISD::isBuildVectorOfConstantFPSDNodes(Op.getNode()) ||
             (isTargetShuffle(Op.getOpcode()) && Op->hasOneUse()) ||
-           (FoldLoad && isShuffleFoldableLoad(Op));
+           (FoldLoad && isShuffleFoldableLoad(Op)) ||
+           DAG.isSplatValue(Op, /*AllowUndefs*/ false);
    };
    auto IsSafeToMoveShuffle = [ShuffleVT](SDValue Op, unsigned BinOp) {
      // Ensure we only shuffle whole vector src elements, unless its a logical
diff --git a/llvm/test/CodeGen/X86/avx512-hadd-hsub.ll b/llvm/test/CodeGen/X86/avx512-hadd-hsub.ll

index 85266a7..0519130 100644 (file)
--- a/llvm/test/CodeGen/X86/avx512-hadd-hsub.ll
+++ b/llvm/test/CodeGen/X86/avx512-hadd-hsub.ll
@@ -215,9 +215,8 @@ define double @fsub_noundef_ee (<8 x double> %x225, <8 x double> %x227) {
  ; KNL-LABEL: fsub_noundef_ee:
  ; KNL:       # %bb.0:
  ; KNL-NEXT:    vextractf32x4 $2, %zmm1, %xmm0
-; KNL-NEXT:    vmovddup {{.*#+}} xmm1 = xmm0[0,0]
-; KNL-NEXT:    vsubpd %xmm0, %xmm1, %xmm0
-; KNL-NEXT:    vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
+; KNL-NEXT:    vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
+; KNL-NEXT:    vsubsd %xmm1, %xmm0, %xmm0
  ; KNL-NEXT:    retq
  ;
  ; SKX-LABEL: fsub_noundef_ee:
diff --git a/llvm/test/CodeGen/X86/sar_fold64.ll b/llvm/test/CodeGen/X86/sar_fold64.ll

index 17d4d9f..a23d0cb 100644 (file)
--- a/llvm/test/CodeGen/X86/sar_fold64.ll
+++ b/llvm/test/CodeGen/X86/sar_fold64.ll
@@ -117,9 +117,9 @@ define <4 x i32> @all_sign_bit_ashr_vec1(<4 x i32> %x) {
  ;
  ; AVX2-LABEL: all_sign_bit_ashr_vec1:
  ; AVX2:       # %bb.0:
+; AVX2-NEXT:    vpbroadcastd %xmm0, %xmm0
  ; AVX2-NEXT:    vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
  ; AVX2-NEXT:    vpand %xmm1, %xmm0, %xmm0
-; AVX2-NEXT:    vpbroadcastd %xmm0, %xmm0
  ; AVX2-NEXT:    vpxor %xmm1, %xmm1, %xmm1
  ; AVX2-NEXT:    vpsubd %xmm0, %xmm1, %xmm0
  ; AVX2-NEXT:    retq
@@ -177,9 +177,9 @@ define <4 x i32> @all_sign_bit_ashr_vec3(<4 x i32> %x) {
  ;
  ; AVX2-LABEL: all_sign_bit_ashr_vec3:
  ; AVX2:       # %bb.0:
+; AVX2-NEXT:    vpbroadcastd %xmm0, %xmm0
  ; AVX2-NEXT:    vpbroadcastd {{.*#+}} xmm1 = [1,1,1,1]
  ; AVX2-NEXT:    vpand %xmm1, %xmm0, %xmm0
-; AVX2-NEXT:    vpbroadcastd %xmm0, %xmm0
  ; AVX2-NEXT:    vpcmpeqd %xmm1, %xmm1, %xmm1
  ; AVX2-NEXT:    vpaddd %xmm1, %xmm0, %xmm0
  ; AVX2-NEXT:    retq
author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Sat, 18 Jun 2022 16:14:00 +0000 (17:14 +0100)
llvm/lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/X86/avx512-hadd-hsub.ll		patch \| blob \| history
llvm/test/CodeGen/X86/sar_fold64.ll		patch \| blob \| history