[X86] combineBitcastvxi1 - peek through bitcast(concat(X,undef)) -> aext(bitcast(X))

author Simon Pilgrim <llvm-dev@redking.me.uk>

Tue, 4 Apr 2023 13:24:52 +0000 (14:24 +0100)

committer Simon Pilgrim <llvm-dev@redking.me.uk>

Tue, 4 Apr 2023 13:24:59 +0000 (14:24 +0100)
author Simon Pilgrim <llvm-dev@redking.me.uk>
Tue, 4 Apr 2023 13:24:52 +0000 (14:24 +0100)
committer Simon Pilgrim <llvm-dev@redking.me.uk>
Tue, 4 Apr 2023 13:24:59 +0000 (14:24 +0100)
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp

index 79a5bbd..55e085e 100644 (file)
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -44099,6 +44099,21 @@ static SDValue combineBitcastvxi1(SelectionDAG &DAG, EVT VT, SDValue Src,
    if (!Subtarget.hasSSE2() || (Subtarget.hasAVX512() && !PreferMovMsk))
      return SDValue();
  
+  // If the upper half of the ops are undef, then try to bitcast the lower half
+  // and extend.
+  SmallVector<SDValue, 4> SubSrcOps;
+  if (collectConcatOps(Src.getNode(), SubSrcOps, DAG) &&
+      SubSrcOps.size() == 2) {
+    SDValue LowerOp = SubSrcOps[0];
+    SDValue UpperOp = SubSrcOps[1];
+    if (LowerOp.getOpcode() == ISD::SETCC && UpperOp.isUndef()) {
+      EVT HalfVT = VT.getHalfSizedIntegerVT(*DAG.getContext());
+      EVT HalfSrcVT = SrcVT.getHalfNumVectorElementsVT(*DAG.getContext());
+      if (SDValue V = combineBitcastvxi1(DAG, HalfVT, LowerOp, DL, Subtarget))
+        return DAG.getNode(ISD::ANY_EXTEND, DL, VT, V);
+    }
+  }
+
    // There are MOVMSK flavors for types v16i8, v32i8, v4f32, v8f32, v4f64 and
    // v8f64. So all legal 128-bit and 256-bit vectors are covered except for
    // v8i16 and v16i16.
diff --git a/llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll b/llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll

index b22fa80..2e6501e 100644 (file)
--- a/llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll
+++ b/llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll
@@ -872,12 +872,8 @@ define i8 @v4i32_concat_undef(<4 x i32> %vec) {
  ; SSE2-SSSE3:       # %bb.0:
  ; SSE2-SSSE3-NEXT:    pxor %xmm1, %xmm1
  ; SSE2-SSSE3-NEXT:    pcmpeqd %xmm0, %xmm1
-; SSE2-SSSE3-NEXT:    pcmpeqd %xmm0, %xmm0
-; SSE2-SSSE3-NEXT:    pxor %xmm1, %xmm0
-; SSE2-SSSE3-NEXT:    packssdw %xmm0, %xmm0
-; SSE2-SSSE3-NEXT:    psllw $15, %xmm0
-; SSE2-SSSE3-NEXT:    packsswb %xmm0, %xmm0
-; SSE2-SSSE3-NEXT:    pmovmskb %xmm0, %eax
+; SSE2-SSSE3-NEXT:    movmskps %xmm1, %eax
+; SSE2-SSSE3-NEXT:    xorl $15, %eax
  ; SSE2-SSSE3-NEXT:    # kill: def $al killed $al killed $eax
  ; SSE2-SSSE3-NEXT:    retq
  ;
@@ -885,12 +881,8 @@ define i8 @v4i32_concat_undef(<4 x i32> %vec) {
  ; AVX12:       # %bb.0:
  ; AVX12-NEXT:    vpxor %xmm1, %xmm1, %xmm1
  ; AVX12-NEXT:    vpcmpeqd %xmm1, %xmm0, %xmm0
-; AVX12-NEXT:    vpcmpeqd %xmm1, %xmm1, %xmm1
-; AVX12-NEXT:    vpxor %xmm1, %xmm0, %xmm0
-; AVX12-NEXT:    vpackssdw %xmm0, %xmm0, %xmm0
-; AVX12-NEXT:    vpsllw $15, %xmm0, %xmm0
-; AVX12-NEXT:    vpacksswb %xmm0, %xmm0, %xmm0
-; AVX12-NEXT:    vpmovmskb %xmm0, %eax
+; AVX12-NEXT:    vmovmskps %xmm0, %eax
+; AVX12-NEXT:    xorl $15, %eax
  ; AVX12-NEXT:    # kill: def $al killed $al killed $eax
  ; AVX12-NEXT:    retq
  ;
author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Tue, 4 Apr 2023 13:24:52 +0000 (14:24 +0100)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Tue, 4 Apr 2023 13:24:59 +0000 (14:24 +0100)
llvm/lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/X86/bitcast-and-setcc-256.ll		patch \| blob \| history