[CVP] Narrow SDiv/SRem to the smallest power-of-2 that's sufficient to contain its...

author Roman Lebedev <lebedev.ri@gmail.com>

Tue, 22 Sep 2020 13:33:18 +0000 (16:33 +0300)

committer Roman Lebedev <lebedev.ri@gmail.com>

Tue, 22 Sep 2020 18:37:30 +0000 (21:37 +0300)
author Roman Lebedev <lebedev.ri@gmail.com>
Tue, 22 Sep 2020 13:33:18 +0000 (16:33 +0300)
committer Roman Lebedev <lebedev.ri@gmail.com>
Tue, 22 Sep 2020 18:37:30 +0000 (21:37 +0300)
diff --git a/llvm/lib/Transforms/Scalar/CorrelatedValuePropagation.cpp b/llvm/lib/Transforms/Scalar/CorrelatedValuePropagation.cpp

index db89e125e475e4d24db86525c2ab59c56d7a8c17..f21e6548841810de6669efb73932427f3fa7a73e 100644 (file)
--- a/llvm/lib/Transforms/Scalar/CorrelatedValuePropagation.cpp
+++ b/llvm/lib/Transforms/Scalar/CorrelatedValuePropagation.cpp
@@ -58,6 +58,8 @@ STATISTIC(NumMemAccess, "Number of memory access targets propagated");
  STATISTIC(NumCmps,      "Number of comparisons propagated");
  STATISTIC(NumReturns,   "Number of return values propagated");
  STATISTIC(NumDeadCases, "Number of switch cases removed");
+STATISTIC(NumSDivSRemsNarrowed,
+          "Number of sdivs/srems whose width was decreased");
  STATISTIC(NumSDivs,     "Number of sdiv converted to udiv");
  STATISTIC(NumUDivURemsNarrowed,
            "Number of udivs/urems whose width was decreased");
@@ -624,6 +626,60 @@ Domain getDomain(Value *V, LazyValueInfo *LVI, Instruction *CxtI) {
    return Domain::Unknown;
  };
  
+/// Try to shrink a sdiv/srem's width down to the smallest power of two that's
+/// sufficient to contain its operands.
+static bool narrowSDivOrSRem(BinaryOperator *Instr, LazyValueInfo *LVI) {
+  assert(Instr->getOpcode() == Instruction::SDiv ||
+         Instr->getOpcode() == Instruction::SRem);
+  if (Instr->getType()->isVectorTy())
+    return false;
+
+  // Find the smallest power of two bitwidth that's sufficient to hold Instr's
+  // operands.
+  unsigned OrigWidth = Instr->getType()->getIntegerBitWidth();
+
+  // What is the smallest bit width that can accomodate the entire value ranges
+  // of both of the operands?
+  std::array<Optional<ConstantRange>, 2> CRs;
+  unsigned MinSignedBits = 0;
+  for (auto I : zip(Instr->operands(), CRs)) {
+    std::get<1>(I) = LVI->getConstantRange(std::get<0>(I), Instr->getParent());
+    MinSignedBits = std::max(std::get<1>(I)->getMinSignedBits(), MinSignedBits);
+  }
+
+  // sdiv/srem is UB if divisor is -1 and divident is INT_MIN, so unless we can
+  // prove that such a combination is impossible, we need to bump the bitwidth.
+  if (CRs[1]->contains(APInt::getAllOnesValue(OrigWidth)) &&
+      CRs[0]->contains(
+          APInt::getSignedMinValue(MinSignedBits).sextOrSelf(OrigWidth)))
+    ++MinSignedBits;
+
+  // Don't shrink below 8 bits wide.
+  unsigned NewWidth = std::max<unsigned>(PowerOf2Ceil(MinSignedBits), 8);
+
+  // NewWidth might be greater than OrigWidth if OrigWidth is not a power of
+  // two.
+  if (NewWidth >= OrigWidth)
+    return false;
+
+  ++NumSDivSRemsNarrowed;
+  IRBuilder<> B{Instr};
+  auto *TruncTy = Type::getIntNTy(Instr->getContext(), NewWidth);
+  auto *LHS = B.CreateTruncOrBitCast(Instr->getOperand(0), TruncTy,
+                                     Instr->getName() + ".lhs.trunc");
+  auto *RHS = B.CreateTruncOrBitCast(Instr->getOperand(1), TruncTy,
+                                     Instr->getName() + ".rhs.trunc");
+  auto *BO = B.CreateBinOp(Instr->getOpcode(), LHS, RHS, Instr->getName());
+  auto *Sext = B.CreateSExt(BO, Instr->getType(), Instr->getName() + ".sext");
+  if (auto *BinOp = dyn_cast<BinaryOperator>(BO))
+    if (BinOp->getOpcode() == Instruction::SDiv)
+      BinOp->setIsExact(Instr->isExact());
+
+  Instr->replaceAllUsesWith(Sext);
+  Instr->eraseFromParent();
+  return true;
+}
+
  /// Try to shrink a udiv/urem's width down to the smallest power of two that's
  /// sufficient to contain its operands.
  static bool processUDivOrURem(BinaryOperator *Instr, LazyValueInfo *LVI) {
@@ -669,6 +725,7 @@ static bool processUDivOrURem(BinaryOperator *Instr, LazyValueInfo *LVI) {
  }
  
  static bool processSRem(BinaryOperator *SDI, LazyValueInfo *LVI) {
+  assert(SDI->getOpcode() == Instruction::SRem);
    if (SDI->getType()->isVectorTy())
      return false;
  
@@ -724,6 +781,7 @@ static bool processSRem(BinaryOperator *SDI, LazyValueInfo *LVI) {
  /// conditions, this can sometimes prove conditions instcombine can't by
  /// exploiting range information.
  static bool processSDiv(BinaryOperator *SDI, LazyValueInfo *LVI) {
+  assert(SDI->getOpcode() == Instruction::SDiv);
    if (SDI->getType()->isVectorTy())
      return false;
  
@@ -774,6 +832,23 @@ static bool processSDiv(BinaryOperator *SDI, LazyValueInfo *LVI) {
    return true;
  }
  
+static bool processSDivOrSRem(BinaryOperator *Instr, LazyValueInfo *LVI) {
+  assert(Instr->getOpcode() == Instruction::SDiv ||
+         Instr->getOpcode() == Instruction::SRem);
+  if (Instr->getType()->isVectorTy())
+    return false;
+
+  if (Instr->getOpcode() == Instruction::SDiv)
+    if (processSDiv(Instr, LVI))
+      return true;
+
+  if (Instr->getOpcode() == Instruction::SRem)
+    if (processSRem(Instr, LVI))
+      return true;
+
+  return narrowSDivOrSRem(Instr, LVI);
+}
+
  static bool processAShr(BinaryOperator *SDI, LazyValueInfo *LVI) {
    if (SDI->getType()->isVectorTy())
      return false;
@@ -935,10 +1010,8 @@ static bool runImpl(Function &F, LazyValueInfo *LVI, DominatorTree *DT,
          BBChanged |= processCallSite(cast<CallBase>(*II), LVI);
          break;
        case Instruction::SRem:
-        BBChanged |= processSRem(cast<BinaryOperator>(II), LVI);
-        break;
        case Instruction::SDiv:
-        BBChanged |= processSDiv(cast<BinaryOperator>(II), LVI);
+        BBChanged |= processSDivOrSRem(cast<BinaryOperator>(II), LVI);
          break;
        case Instruction::UDiv:
        case Instruction::URem:
diff --git a/llvm/test/Transforms/CorrelatedValuePropagation/sdiv.ll b/llvm/test/Transforms/CorrelatedValuePropagation/sdiv.ll

index ba618f5af033431daab4346f78c9ce0bf43b3a7d..3f533030a11cefb7daf43c85d237abd428fa6cd0 100644 (file)
--- a/llvm/test/Transforms/CorrelatedValuePropagation/sdiv.ll
+++ b/llvm/test/Transforms/CorrelatedValuePropagation/sdiv.ll
@@ -271,8 +271,11 @@ define i64 @test11_i15_i15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 16383
@@ -306,8 +309,11 @@ define i64 @test12_i16_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -338,8 +344,11 @@ define i64 @test13_i16_u15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C2]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -371,8 +380,11 @@ define i64 @test14_i16safe_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -403,8 +415,11 @@ define i64 @test15_i16safe_u15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C2]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -435,8 +450,11 @@ define i64 @test16_i4_i4(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i8
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i8
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i8 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i8 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 3
@@ -469,8 +487,11 @@ define i64 @test17_i9_i9(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 255
@@ -569,8 +590,11 @@ define i64 @test20_i16_i18(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 16383
@@ -601,8 +625,11 @@ define i64 @test21_i18_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 65535
@@ -635,8 +662,11 @@ define i64 @test22_i16_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = sdiv exact i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = sdiv exact i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
diff --git a/llvm/test/Transforms/CorrelatedValuePropagation/srem.ll b/llvm/test/Transforms/CorrelatedValuePropagation/srem.ll

index 4e7e28c8e98c27e81a61379b68ab57485fc4ecc3..8d55de9eb1eb23be332f4ee6a67e736213229871 100644 (file)
--- a/llvm/test/Transforms/CorrelatedValuePropagation/srem.ll
+++ b/llvm/test/Transforms/CorrelatedValuePropagation/srem.ll
@@ -184,8 +184,11 @@ define i64 @test11_i15_i15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 16383
@@ -219,8 +222,11 @@ define i64 @test12_i16_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -251,8 +257,11 @@ define i64 @test13_i16_u15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C2]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -284,8 +293,11 @@ define i64 @test14_i16safe_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -316,8 +328,11 @@ define i64 @test15_i16safe_u15(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C2]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 32767
@@ -348,8 +363,11 @@ define i64 @test16_i4_i4(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i8
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i8
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i8 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i8 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 3
@@ -382,8 +400,11 @@ define i64 @test17_i9_i9(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i16
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i16
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i16 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i16 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 255
@@ -482,8 +503,11 @@ define i64 @test20_i16_i18(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 16383
@@ -514,8 +538,11 @@ define i64 @test21_i18_i16(i64 %x, i64 %y) {
  ; CHECK-NEXT:    call void @llvm.assume(i1 [[C3]])
  ; CHECK-NEXT:    br label [[END:%.*]]
  ; CHECK:       end:
-; CHECK-NEXT:    [[DIV:%.*]] = srem i64 [[X]], [[Y]]
-; CHECK-NEXT:    ret i64 [[DIV]]
+; CHECK-NEXT:    [[DIV_LHS_TRUNC:%.*]] = trunc i64 [[X]] to i32
+; CHECK-NEXT:    [[DIV_RHS_TRUNC:%.*]] = trunc i64 [[Y]] to i32
+; CHECK-NEXT:    [[DIV1:%.*]] = srem i32 [[DIV_LHS_TRUNC]], [[DIV_RHS_TRUNC]]
+; CHECK-NEXT:    [[DIV_SEXT:%.*]] = sext i32 [[DIV1]] to i64
+; CHECK-NEXT:    ret i64 [[DIV_SEXT]]
  ;
  entry:
    %c0 = icmp sle i64 %x, 65535
author	Roman Lebedev <lebedev.ri@gmail.com>
	Tue, 22 Sep 2020 13:33:18 +0000 (16:33 +0300)
committer	Roman Lebedev <lebedev.ri@gmail.com>
	Tue, 22 Sep 2020 18:37:30 +0000 (21:37 +0300)
llvm/lib/Transforms/Scalar/CorrelatedValuePropagation.cpp		patch \| blob \| history
llvm/test/Transforms/CorrelatedValuePropagation/sdiv.ll		patch \| blob \| history
llvm/test/Transforms/CorrelatedValuePropagation/srem.ll		patch \| blob \| history