[X86] Clamp large constant shift amounts for MMX shift intrinsics to 8-bits.

author Craig Topper <craig.topper@intel.com>

Wed, 6 Nov 2019 20:39:09 +0000 (12:39 -0800)

committer Craig Topper <craig.topper@intel.com>

Wed, 6 Nov 2019 21:03:18 +0000 (13:03 -0800)
author Craig Topper <craig.topper@intel.com>
Wed, 6 Nov 2019 20:39:09 +0000 (12:39 -0800)
committer Craig Topper <craig.topper@intel.com>
Wed, 6 Nov 2019 21:03:18 +0000 (13:03 -0800)
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp

index bb975e59ccf45d20cbdbb38bd6639f833bdd7ad5..e9c32c1f336f4f3153b9ee8e20f04378fd408839 100644 (file)
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -23636,9 +23636,12 @@ SDValue X86TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,
      SDValue ShAmt = Op.getOperand(2);
      // If the argument is a constant, convert it to a target constant.
      if (auto *C = dyn_cast<ConstantSDNode>(ShAmt)) {
-      ShAmt = DAG.getTargetConstant(C->getZExtValue(), DL, MVT::i32);
+      // Clamp out of bounds shift amounts since they will otherwise be masked
+      // to 8-bits which may make it no longer out of bounds.
+      unsigned ShiftAmount = C->getAPIntValue().getLimitedValue(255);
        return DAG.getNode(ISD::INTRINSIC_WO_CHAIN, DL, Op.getValueType(),
-                         Op.getOperand(0), Op.getOperand(1), ShAmt);
+                         Op.getOperand(0), Op.getOperand(1),
+                         DAG.getTargetConstant(ShiftAmount, DL, MVT::i32));
      }
  
      unsigned NewIntrinsic;
diff --git a/llvm/test/CodeGen/X86/mmx-arith.ll b/llvm/test/CodeGen/X86/mmx-arith.ll

index e9c86af6503709ace88574377bba067f4d8066fa..055a5a5ef660f5cc6c3d8adab877c0a5c17d2961 100644 (file)
--- a/llvm/test/CodeGen/X86/mmx-arith.ll
+++ b/llvm/test/CodeGen/X86/mmx-arith.ll
@@ -647,6 +647,40 @@ entry:
    ret void
  }
  
+; Make sure we clamp large shift amounts to 255
+define i64 @pr43922() {
+; X32-LABEL: pr43922:
+; X32:       # %bb.0: # %entry
+; X32-NEXT:    pushl %ebp
+; X32-NEXT:    .cfi_def_cfa_offset 8
+; X32-NEXT:    .cfi_offset %ebp, -8
+; X32-NEXT:    movl %esp, %ebp
+; X32-NEXT:    .cfi_def_cfa_register %ebp
+; X32-NEXT:    andl $-8, %esp
+; X32-NEXT:    subl $8, %esp
+; X32-NEXT:    movq {{\.LCPI.*}}, %mm0 # mm0 = 0x7AAAAAAA7AAAAAAA
+; X32-NEXT:    psrad $255, %mm0
+; X32-NEXT:    movq %mm0, (%esp)
+; X32-NEXT:    movl (%esp), %eax
+; X32-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X32-NEXT:    movl %ebp, %esp
+; X32-NEXT:    popl %ebp
+; X32-NEXT:    .cfi_def_cfa %esp, 4
+; X32-NEXT:    retl
+;
+; X64-LABEL: pr43922:
+; X64:       # %bb.0: # %entry
+; X64-NEXT:    movq {{.*}}(%rip), %mm0 # mm0 = 0x7AAAAAAA7AAAAAAA
+; X64-NEXT:    psrad $255, %mm0
+; X64-NEXT:    movq %mm0, %rax
+; X64-NEXT:    retq
+entry:
+  %0 = tail call x86_mmx @llvm.x86.mmx.psrai.d(x86_mmx bitcast (<2 x i32> <i32 2058005162, i32 2058005162> to x86_mmx), i32 268435456)
+  %1 = bitcast x86_mmx %0 to i64
+  ret i64 %1
+}
+declare x86_mmx @llvm.x86.mmx.psrai.d(x86_mmx, i32)
+
  declare x86_mmx @llvm.x86.mmx.padd.b(x86_mmx, x86_mmx)
  declare x86_mmx @llvm.x86.mmx.padd.w(x86_mmx, x86_mmx)
  declare x86_mmx @llvm.x86.mmx.padd.d(x86_mmx, x86_mmx)
author	Craig Topper <craig.topper@intel.com>
	Wed, 6 Nov 2019 20:39:09 +0000 (12:39 -0800)
committer	Craig Topper <craig.topper@intel.com>
	Wed, 6 Nov 2019 21:03:18 +0000 (13:03 -0800)
llvm/lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/X86/mmx-arith.ll		patch \| blob \| history