[RISCV][InsertVSETVLI] Mutate prior vsetvli AVL if doing so allows us to remove a...

author Philip Reames <preames@rivosinc.com>

Wed, 14 Dec 2022 20:27:53 +0000 (12:27 -0800)

committer Philip Reames <listmail@philipreames.com>

Thu, 15 Dec 2022 15:32:28 +0000 (07:32 -0800)
author Philip Reames <preames@rivosinc.com>
Wed, 14 Dec 2022 20:27:53 +0000 (12:27 -0800)
committer Philip Reames <listmail@philipreames.com>
Thu, 15 Dec 2022 15:32:28 +0000 (07:32 -0800)
diff --git a/llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp b/llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

index 891bc3a..c991b99 100644 (file)
--- a/llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
+++ b/llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
@@ -1195,21 +1195,28 @@ static void doUnion(DemandedFields &A, DemandedFields B) {
    A.MaskPolicy |= B.MaskPolicy;
  }
  
-// Return true if we can mutate PrevMI's VTYPE to match MI's
-// without changing any the fields which have been used.
-// TODO: Restructure code to allow code reuse between this and isCompatible
-// above.
+// Return true if we can mutate PrevMI to match MI without changing any the
+// fields which would be observed.
  static bool canMutatePriorConfig(const MachineInstr &PrevMI,
                                   const MachineInstr &MI,
                                   const DemandedFields &Used) {
-  // TODO: Extend this to handle cases where VL does change, but VL
-  // has not been used.  (e.g. over a vmv.x.s)
-  if (!isVLPreservingConfig(MI))
-    // Note: `vsetvli x0, x0, vtype' is the canonical instruction
-    // for this case.  If you find yourself wanting to add other forms
-    // to this "unused VTYPE" case, we're probably missing a
-    // canonicalization earlier.
-    return false;
+  // If the VL values aren't equal, return false if either a) the former is
+  // demanded, or b) we can't rewrite the former to be the later for
+  // implementation reasons.
+  if (!isVLPreservingConfig(MI)) {
+    if (Used.VL)
+      return false;
+
+    // TODO: Requires more care in the mutation...
+    if (isVLPreservingConfig(PrevMI))
+      return false;
+
+    // TODO: Track whether the register is defined between
+    // PrevMI and MI.
+    if (MI.getOperand(1).isReg() &&
+        RISCV::X0 != MI.getOperand(1).getReg())
+      return false;
+  }
  
    if (!PrevMI.getOperand(2).isImm() || !MI.getOperand(2).isImm())
      return false;
@@ -1245,6 +1252,12 @@ void RISCVInsertVSETVLI::doLocalPostpass(MachineBasicBlock &MBB) {
          // Leave NextMI unchanged
          continue;
        } else if (canMutatePriorConfig(MI, *NextMI, Used)) {
+        if (!isVLPreservingConfig(*NextMI)) {
+          if (NextMI->getOperand(1).isImm())
+            MI.getOperand(1).ChangeToImmediate(NextMI->getOperand(1).getImm());
+          else
+            MI.getOperand(1).ChangeToRegister(NextMI->getOperand(1).getReg(), false);
+        }
          MI.getOperand(2).setImm(NextMI->getOperand(2).getImm());
          ToDelete.push_back(NextMI);
          // fallthrough
diff --git a/llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll b/llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll

index 481152e..a044f49 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll
@@ -1388,7 +1388,7 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-UNKNOWN-NEXT:    addi s0, sp, 128
  ; RV32-BITS-UNKNOWN-NEXT:    .cfi_def_cfa s0, 0
  ; RV32-BITS-UNKNOWN-NEXT:    andi sp, sp, -64
-; RV32-BITS-UNKNOWN-NEXT:    vsetivli zero, 0, e32, mf2, ta, ma
+; RV32-BITS-UNKNOWN-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-UNKNOWN-NEXT:    vmv.x.s a0, v0
  ; RV32-BITS-UNKNOWN-NEXT:    andi a1, a0, 1
  ; RV32-BITS-UNKNOWN-NEXT:    sb a1, 63(sp)
@@ -1484,7 +1484,6 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-UNKNOWN-NEXT:    slli a0, a0, 1
  ; RV32-BITS-UNKNOWN-NEXT:    srli a0, a0, 31
  ; RV32-BITS-UNKNOWN-NEXT:    sb a0, 33(sp)
-; RV32-BITS-UNKNOWN-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-UNKNOWN-NEXT:    vslidedown.vi v8, v0, 1
  ; RV32-BITS-UNKNOWN-NEXT:    vmv.x.s a0, v8
  ; RV32-BITS-UNKNOWN-NEXT:    andi a1, a0, 1
@@ -1604,7 +1603,7 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-256-NEXT:    addi s0, sp, 128
  ; RV32-BITS-256-NEXT:    .cfi_def_cfa s0, 0
  ; RV32-BITS-256-NEXT:    andi sp, sp, -64
-; RV32-BITS-256-NEXT:    vsetivli zero, 0, e32, mf2, ta, ma
+; RV32-BITS-256-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-256-NEXT:    vmv.x.s a0, v0
  ; RV32-BITS-256-NEXT:    andi a1, a0, 1
  ; RV32-BITS-256-NEXT:    sb a1, 63(sp)
@@ -1700,7 +1699,6 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-256-NEXT:    slli a0, a0, 1
  ; RV32-BITS-256-NEXT:    srli a0, a0, 31
  ; RV32-BITS-256-NEXT:    sb a0, 33(sp)
-; RV32-BITS-256-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-256-NEXT:    vslidedown.vi v8, v0, 1
  ; RV32-BITS-256-NEXT:    vmv.x.s a0, v8
  ; RV32-BITS-256-NEXT:    andi a1, a0, 1
@@ -1820,7 +1818,7 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-512-NEXT:    addi s0, sp, 128
  ; RV32-BITS-512-NEXT:    .cfi_def_cfa s0, 0
  ; RV32-BITS-512-NEXT:    andi sp, sp, -64
-; RV32-BITS-512-NEXT:    vsetivli zero, 0, e32, mf2, ta, ma
+; RV32-BITS-512-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-512-NEXT:    vmv.x.s a0, v0
  ; RV32-BITS-512-NEXT:    andi a1, a0, 1
  ; RV32-BITS-512-NEXT:    sb a1, 63(sp)
@@ -1916,7 +1914,6 @@ define <64 x i1> @reverse_v64i1(<64 x i1> %a) {
  ; RV32-BITS-512-NEXT:    slli a0, a0, 1
  ; RV32-BITS-512-NEXT:    srli a0, a0, 31
  ; RV32-BITS-512-NEXT:    sb a0, 33(sp)
-; RV32-BITS-512-NEXT:    vsetivli zero, 1, e32, mf2, ta, ma
  ; RV32-BITS-512-NEXT:    vslidedown.vi v8, v0, 1
  ; RV32-BITS-512-NEXT:    vmv.x.s a0, v8
  ; RV32-BITS-512-NEXT:    andi a1, a0, 1
diff --git a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll

index 6843652..2dc2b62 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll
@@ -1177,12 +1177,11 @@ define <2 x i64> @mgather_v2i16_zextload_v2i64(<2 x i16*> %ptrs, <2 x i1> %m, <2
  ; RV64ZVE32F-NEXT:    vsetvli zero, zero, e16, mf2, tu, ma
  ; RV64ZVE32F-NEXT:    vslideup.vi v8, v9, 1
  ; RV64ZVE32F-NEXT:  .LBB18_4: # %else2
-; RV64ZVE32F-NEXT:    vsetivli zero, 0, e16, mf2, ta, ma
+; RV64ZVE32F-NEXT:    vsetivli zero, 1, e16, mf2, ta, ma
  ; RV64ZVE32F-NEXT:    vmv.x.s a0, v8
  ; RV64ZVE32F-NEXT:    lui a1, 16
  ; RV64ZVE32F-NEXT:    addiw a1, a1, -1
  ; RV64ZVE32F-NEXT:    and a0, a0, a1
-; RV64ZVE32F-NEXT:    vsetivli zero, 1, e16, mf2, ta, ma
  ; RV64ZVE32F-NEXT:    vslidedown.vi v8, v8, 1
  ; RV64ZVE32F-NEXT:    vmv.x.s a2, v8
  ; RV64ZVE32F-NEXT:    and a1, a2, a1
@@ -3600,12 +3599,11 @@ define <8 x i32> @mgather_baseidx_v8i32(i32* %base, <8 x i32> %idxs, <8 x i1> %m
  ; RV64ZVE32F-NEXT:    andi a2, a1, 16
  ; RV64ZVE32F-NEXT:    beqz a2, .LBB41_7
  ; RV64ZVE32F-NEXT:  .LBB41_14: # %cond.load10
-; RV64ZVE32F-NEXT:    vsetivli zero, 0, e32, m1, ta, ma
+; RV64ZVE32F-NEXT:    vsetivli zero, 8, e32, m1, ta, ma
  ; RV64ZVE32F-NEXT:    vmv.x.s a2, v12
  ; RV64ZVE32F-NEXT:    slli a2, a2, 2
  ; RV64ZVE32F-NEXT:    add a2, a0, a2
  ; RV64ZVE32F-NEXT:    lw a2, 0(a2)
-; RV64ZVE32F-NEXT:    vsetivli zero, 8, e32, m1, ta, ma
  ; RV64ZVE32F-NEXT:    vmv.s.x v8, a2
  ; RV64ZVE32F-NEXT:    vsetivli zero, 5, e32, m2, tu, ma
  ; RV64ZVE32F-NEXT:    vslideup.vi v10, v8, 4
@@ -9538,12 +9536,11 @@ define <8 x float> @mgather_baseidx_v8f32(float* %base, <8 x i32> %idxs, <8 x i1
  ; RV64ZVE32F-NEXT:    andi a2, a1, 16
  ; RV64ZVE32F-NEXT:    beqz a2, .LBB80_7
  ; RV64ZVE32F-NEXT:  .LBB80_14: # %cond.load10
-; RV64ZVE32F-NEXT:    vsetivli zero, 0, e32, m1, ta, ma
+; RV64ZVE32F-NEXT:    vsetivli zero, 8, e32, m1, ta, ma
  ; RV64ZVE32F-NEXT:    vmv.x.s a2, v12
  ; RV64ZVE32F-NEXT:    slli a2, a2, 2
  ; RV64ZVE32F-NEXT:    add a2, a0, a2
  ; RV64ZVE32F-NEXT:    flw ft0, 0(a2)
-; RV64ZVE32F-NEXT:    vsetivli zero, 8, e32, m1, ta, ma
  ; RV64ZVE32F-NEXT:    vfmv.s.f v8, ft0
  ; RV64ZVE32F-NEXT:    vsetivli zero, 5, e32, m2, tu, ma
  ; RV64ZVE32F-NEXT:    vslideup.vi v10, v8, 4
diff --git a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll

index d51fa92..93aa47c 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll
@@ -1134,9 +1134,8 @@ define double @vreduce_ord_fwadd_v32f64(<32 x float>* %x, double %s) {
  ; CHECK-NEXT:    vfmv.s.f v24, fa0
  ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
  ; CHECK-NEXT:    vfwredosum.vs v16, v16, v24
-; CHECK-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
-; CHECK-NEXT:    vfmv.f.s ft0, v16
  ; CHECK-NEXT:    vsetivli zero, 16, e64, m1, ta, ma
+; CHECK-NEXT:    vfmv.f.s ft0, v16
  ; CHECK-NEXT:    vfmv.s.f v16, ft0
  ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
  ; CHECK-NEXT:    vfwredosum.vs v8, v8, v16
diff --git a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll

index 7f1def2..ed77538 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll
@@ -1143,10 +1143,9 @@ define i64 @vwreduce_add_v4i64(<4 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v9, zero
  ; RV32-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
  ; RV32-NEXT:    vwredsum.vs v8, v8, v9
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1177,10 +1176,9 @@ define i64 @vwreduce_uadd_v4i64(<4 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v9, zero
  ; RV32-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
  ; RV32-NEXT:    vwredsumu.vs v8, v8, v9
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1240,10 +1238,9 @@ define i64 @vwreduce_add_v8i64(<8 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v10, zero
  ; RV32-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
  ; RV32-NEXT:    vwredsum.vs v8, v8, v10
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1274,10 +1271,9 @@ define i64 @vwreduce_uadd_v8i64(<8 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v10, zero
  ; RV32-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
  ; RV32-NEXT:    vwredsumu.vs v8, v8, v10
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1337,10 +1333,9 @@ define i64 @vwreduce_add_v16i64(<16 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v12, zero
  ; RV32-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
  ; RV32-NEXT:    vwredsum.vs v8, v8, v12
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1371,10 +1366,9 @@ define i64 @vwreduce_uadd_v16i64(<16 x i32>* %x) {
  ; RV32-NEXT:    vmv.s.x v12, zero
  ; RV32-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
  ; RV32-NEXT:    vwredsumu.vs v8, v8, v12
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -7319,9 +7313,8 @@ define i64 @vreduce_mul_v32i64(<32 x i64>* %x) {
  ; RV32-NEXT:    vmul.vv v8, v8, v16
  ; RV32-NEXT:    vrgather.vi v16, v8, 1
  ; RV32-NEXT:    vmul.vv v8, v8, v16
-; RV32-NEXT:    vsetivli zero, 0, e32, m8, ta, ma
-; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    vsetivli zero, 1, e32, m8, ta, ma
+; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    vslidedown.vi v8, v8, 1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -7372,9 +7365,8 @@ define i64 @vreduce_mul_v64i64(<64 x i64>* %x) nounwind {
  ; RV32-NEXT:    vmul.vv v8, v8, v16
  ; RV32-NEXT:    vrgather.vi v16, v8, 1
  ; RV32-NEXT:    vmul.vv v8, v8, v16
-; RV32-NEXT:    vsetivli zero, 0, e32, m8, ta, ma
-; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    vsetivli zero, 1, e32, m8, ta, ma
+; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    vslidedown.vi v8, v8, 1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
diff --git a/llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll b/llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll

index 287da88..af9f1a3 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll
@@ -1701,10 +1701,9 @@ define signext i64 @vwpreduce_add_nxv2i32(i64 signext %s, <vscale x 2 x i32> %v,
  ; RV32-NEXT:    vlse64.v v9, (a0), zero
  ; RV32-NEXT:    vsetvli zero, a2, e32, m1, tu, ma
  ; RV32-NEXT:    vwredsum.vs v9, v8, v9, v0.t
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v9
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v9, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    addi sp, sp, 16
@@ -1736,10 +1735,9 @@ define signext i64 @vwpreduce_uadd_nxv2i32(i64 signext %s, <vscale x 2 x i32> %v
  ; RV32-NEXT:    vlse64.v v9, (a0), zero
  ; RV32-NEXT:    vsetvli zero, a2, e32, m1, tu, ma
  ; RV32-NEXT:    vwredsum.vs v9, v8, v9, v0.t
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v9
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v9, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    addi sp, sp, 16
@@ -2043,10 +2041,9 @@ define signext i64 @vpwreduce_add_nxv4i32(i64 signext %s, <vscale x 4 x i32> %v,
  ; RV32-NEXT:    vlse64.v v10, (a0), zero
  ; RV32-NEXT:    vsetvli zero, a2, e32, m2, tu, ma
  ; RV32-NEXT:    vwredsum.vs v10, v8, v10, v0.t
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v10
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v10, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    addi sp, sp, 16
@@ -2078,10 +2075,9 @@ define signext i64 @vpwreduce_uadd_nxv4i32(i64 signext %s, <vscale x 4 x i32> %v
  ; RV32-NEXT:    vlse64.v v10, (a0), zero
  ; RV32-NEXT:    vsetvli zero, a2, e32, m2, tu, ma
  ; RV32-NEXT:    vwredsumu.vs v10, v8, v10, v0.t
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v10
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v10, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    addi sp, sp, 16
diff --git a/llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll b/llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll

index 2668de6..7941ab5 100644 (file)
--- a/llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll
+++ b/llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll
@@ -1614,10 +1614,9 @@ define i64 @vwreduce_add_nxv2i32(<vscale x 2 x i32> %v) {
  ; RV32-NEXT:    vmv.s.x v9, zero
  ; RV32-NEXT:    vsetvli a0, zero, e32, m1, ta, ma
  ; RV32-NEXT:    vwredsum.vs v8, v8, v9
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1643,10 +1642,9 @@ define i64 @vwreduce_uadd_nxv2i32(<vscale x 2 x i32> %v) {
  ; RV32-NEXT:    vmv.s.x v9, zero
  ; RV32-NEXT:    vsetvli a0, zero, e32, m1, ta, ma
  ; RV32-NEXT:    vwredsumu.vs v8, v8, v9
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1916,10 +1914,9 @@ define i64 @vwreduce_add_nxv4i32(<vscale x 4 x i32> %v) {
  ; RV32-NEXT:    vmv.s.x v10, zero
  ; RV32-NEXT:    vsetvli a0, zero, e32, m2, ta, ma
  ; RV32-NEXT:    vwredsum.vs v8, v8, v10
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
@@ -1945,10 +1942,9 @@ define i64 @vwreduce_uadd_nxv4i32(<vscale x 4 x i32> %v) {
  ; RV32-NEXT:    vmv.s.x v10, zero
  ; RV32-NEXT:    vsetvli a0, zero, e32, m2, ta, ma
  ; RV32-NEXT:    vwredsumu.vs v8, v8, v10
-; RV32-NEXT:    vsetivli zero, 0, e64, m1, ta, ma
+; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vmv.x.s a0, v8
  ; RV32-NEXT:    li a1, 32
-; RV32-NEXT:    vsetivli zero, 1, e64, m1, ta, ma
  ; RV32-NEXT:    vsrl.vx v8, v8, a1
  ; RV32-NEXT:    vmv.x.s a1, v8
  ; RV32-NEXT:    ret
author	Philip Reames <preames@rivosinc.com>
	Wed, 14 Dec 2022 20:27:53 +0000 (12:27 -0800)
committer	Philip Reames <listmail@philipreames.com>
	Thu, 15 Dec 2022 15:32:28 +0000 (07:32 -0800)
llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/fixed-vector-shuffle-reverse.ll		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-fp.ll		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/fixed-vectors-reduction-int.ll		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/vreductions-int-vp.ll		patch \| blob \| history
llvm/test/CodeGen/RISCV/rvv/vreductions-int.ll		patch \| blob \| history