[SelectionDAG] Add support for vector demandedelts in ADD/SUB opcodes

author Simon Pilgrim <llvm-dev@redking.me.uk>

Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)

committer Simon Pilgrim <llvm-dev@redking.me.uk>

Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)
author Simon Pilgrim <llvm-dev@redking.me.uk>
Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)
committer Simon Pilgrim <llvm-dev@redking.me.uk>
Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)
diff --git a/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp b/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

index 446067a..93ca120 100644 (file)
--- a/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
+++ b/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
@@ -2422,7 +2422,8 @@ void SelectionDAG::computeKnownBits(SDValue Op, APInt &KnownZero,
          unsigned NLZ = (CLHS->getAPIntValue()+1).countLeadingZeros();
          // NLZ can't be BitWidth with no sign bit
          APInt MaskV = APInt::getHighBitsSet(BitWidth, NLZ+1);
-        computeKnownBits(Op.getOperand(1), KnownZero2, KnownOne2, Depth+1);
+        computeKnownBits(Op.getOperand(1), KnownZero2, KnownOne2, DemandedElts,
+                         Depth + 1);
  
          // If all of the MaskV bits are known to be zero, then we know the
          // output top bits are zero, because we now know that the output is
@@ -2445,11 +2446,13 @@ void SelectionDAG::computeKnownBits(SDValue Op, APInt &KnownZero,
      // known to be clear. For example, if one input has the top 10 bits clear
      // and the other has the top 8 bits clear, we know the top 7 bits of the
      // output must be clear.
-    computeKnownBits(Op.getOperand(0), KnownZero2, KnownOne2, Depth+1);
+    computeKnownBits(Op.getOperand(0), KnownZero2, KnownOne2, DemandedElts,
+                     Depth + 1);
      unsigned KnownZeroHigh = KnownZero2.countLeadingOnes();
      unsigned KnownZeroLow = KnownZero2.countTrailingOnes();
  
-    computeKnownBits(Op.getOperand(1), KnownZero2, KnownOne2, Depth+1);
+    computeKnownBits(Op.getOperand(1), KnownZero2, KnownOne2, DemandedElts,
+                     Depth + 1);
      KnownZeroHigh = std::min(KnownZeroHigh,
                               KnownZero2.countLeadingOnes());
      KnownZeroLow = std::min(KnownZeroLow,
diff --git a/llvm/test/CodeGen/X86/known-bits-vector.ll b/llvm/test/CodeGen/X86/known-bits-vector.ll

index 967447c..0995329 100644 (file)
--- a/llvm/test/CodeGen/X86/known-bits-vector.ll
+++ b/llvm/test/CodeGen/X86/known-bits-vector.ll
@@ -207,22 +207,12 @@ define <4 x i32> @knownbits_mask_trunc_shuffle_shl(<4 x i64> %a0) nounwind {
  define <4 x i32> @knownbits_mask_add_shuffle_lshr(<4 x i32> %a0, <4 x i32> %a1) nounwind {
  ; X32-LABEL: knownbits_mask_add_shuffle_lshr:
  ; X32:       # BB#0:
-; X32-NEXT:    vmovdqa {{.*#+}} xmm2 = [32767,4294967295,4294967295,32767]
-; X32-NEXT:    vpand %xmm2, %xmm0, %xmm0
-; X32-NEXT:    vpand %xmm2, %xmm1, %xmm1
-; X32-NEXT:    vpaddd %xmm1, %xmm0, %xmm0
-; X32-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[0,0,3,3]
-; X32-NEXT:    vpsrld $17, %xmm0, %xmm0
+; X32-NEXT:    vxorps %xmm0, %xmm0, %xmm0
  ; X32-NEXT:    retl
  ;
  ; X64-LABEL: knownbits_mask_add_shuffle_lshr:
  ; X64:       # BB#0:
-; X64-NEXT:    vmovdqa {{.*#+}} xmm2 = [32767,4294967295,4294967295,32767]
-; X64-NEXT:    vpand %xmm2, %xmm0, %xmm0
-; X64-NEXT:    vpand %xmm2, %xmm1, %xmm1
-; X64-NEXT:    vpaddd %xmm1, %xmm0, %xmm0
-; X64-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[0,0,3,3]
-; X64-NEXT:    vpsrld $17, %xmm0, %xmm0
+; X64-NEXT:    vxorps %xmm0, %xmm0, %xmm0
  ; X64-NEXT:    retq
    %1 = and <4 x i32> %a0, <i32 32767, i32 -1, i32 -1, i32 32767>
    %2 = and <4 x i32> %a1, <i32 32767, i32 -1, i32 -1, i32 32767>
@@ -235,20 +225,12 @@ define <4 x i32> @knownbits_mask_add_shuffle_lshr(<4 x i32> %a0, <4 x i32> %a1)
  define <4 x i32> @knownbits_mask_sub_shuffle_lshr(<4 x i32> %a0) nounwind {
  ; X32-LABEL: knownbits_mask_sub_shuffle_lshr:
  ; X32:       # BB#0:
-; X32-NEXT:    vpand {{\.LCPI.*}}, %xmm0, %xmm0
-; X32-NEXT:    vmovdqa {{.*#+}} xmm1 = [255,255,255,255]
-; X32-NEXT:    vpsubd %xmm0, %xmm1, %xmm0
-; X32-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[0,0,3,3]
-; X32-NEXT:    vpsrld $22, %xmm0, %xmm0
+; X32-NEXT:    vxorps %xmm0, %xmm0, %xmm0
  ; X32-NEXT:    retl
  ;
  ; X64-LABEL: knownbits_mask_sub_shuffle_lshr:
  ; X64:       # BB#0:
-; X64-NEXT:    vpand {{.*}}(%rip), %xmm0, %xmm0
-; X64-NEXT:    vmovdqa {{.*#+}} xmm1 = [255,255,255,255]
-; X64-NEXT:    vpsubd %xmm0, %xmm1, %xmm0
-; X64-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[0,0,3,3]
-; X64-NEXT:    vpsrld $22, %xmm0, %xmm0
+; X64-NEXT:    vxorps %xmm0, %xmm0, %xmm0
  ; X64-NEXT:    retq
    %1 = and <4 x i32> %a0, <i32 15, i32 -1, i32 -1, i32 15>
    %2 = sub <4 x i32> <i32 255, i32 255, i32 255, i32 255>, %1
author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Thu, 10 Nov 2016 22:41:49 +0000 (22:41 +0000)
llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp		patch \| blob \| history
llvm/test/CodeGen/X86/known-bits-vector.ll		patch \| blob \| history