AMDGPU: Broadcast scalar boolean to vector boolean explicitly

author Ruiling Song <ruiling.song@amd.com>

Thu, 16 Sep 2021 15:04:39 +0000 (23:04 +0800)

committer Ruiling Song <ruiling.song@amd.com>

Thu, 30 Sep 2021 02:15:01 +0000 (10:15 +0800)
author Ruiling Song <ruiling.song@amd.com>
Thu, 16 Sep 2021 15:04:39 +0000 (23:04 +0800)
committer Ruiling Song <ruiling.song@amd.com>
Thu, 30 Sep 2021 02:15:01 +0000 (10:15 +0800)
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp

index c99cc96..51bf50e 100644 (file)
--- a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
@@ -4138,7 +4138,10 @@ MachineBasicBlock *SITargetLowering::EmitInstrWithCustomInserter(
      }
  
      const TargetRegisterClass *Src2RC = MRI.getRegClass(Src2.getReg());
-    if (TRI->getRegSizeInBits(*Src2RC) == 64) {
+    unsigned WaveSize = TRI->getRegSizeInBits(*Src2RC);
+    assert(WaveSize == 64 || WaveSize == 32);
+
+    if (WaveSize == 64) {
        if (ST.hasScalarCompareEq64()) {
          BuildMI(*BB, MII, DL, TII->get(AMDGPU::S_CMP_LG_U64))
              .addReg(Src2.getReg())
@@ -4168,8 +4171,13 @@ MachineBasicBlock *SITargetLowering::EmitInstrWithCustomInserter(
  
      BuildMI(*BB, MII, DL, TII->get(Opc), Dest.getReg()).add(Src0).add(Src1);
  
-    BuildMI(*BB, MII, DL, TII->get(AMDGPU::COPY), CarryDest.getReg())
-      .addReg(AMDGPU::SCC);
+    unsigned SelOpc =
+        (WaveSize == 64) ? AMDGPU::S_CSELECT_B64 : AMDGPU::S_CSELECT_B32;
+
+    BuildMI(*BB, MII, DL, TII->get(SelOpc), CarryDest.getReg())
+        .addImm(-1)
+        .addImm(0);
+
      MI.eraseFromParent();
      return BB;
    }
diff --git a/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll b/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll

index c0291a1..4ea3072 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll
+++ b/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll
@@ -15,7 +15,7 @@ define i32 @s_add_co_select_user() {
  ; GFX7-NEXT:    s_cmp_lg_u32 s4, 0
  ; GFX7-NEXT:    s_addc_u32 s4, s6, 0
  ; GFX7-NEXT:    v_mov_b32_e32 v1, s4
-; GFX7-NEXT:    s_cselect_b64 vcc, 1, 0
+; GFX7-NEXT:    s_cselect_b64 vcc, -1, 0
  ; GFX7-NEXT:    s_cmp_gt_u32 s6, 31
  ; GFX7-NEXT:    v_cndmask_b32_e32 v1, 0, v1, vcc
  ; GFX7-NEXT:    s_cselect_b64 vcc, -1, 0
@@ -32,7 +32,7 @@ define i32 @s_add_co_select_user() {
  ; GFX9-NEXT:    s_cmp_lg_u64 s[4:5], 0
  ; GFX9-NEXT:    s_addc_u32 s4, s6, 0
  ; GFX9-NEXT:    v_mov_b32_e32 v1, s4
-; GFX9-NEXT:    s_cselect_b64 vcc, 1, 0
+; GFX9-NEXT:    s_cselect_b64 vcc, -1, 0
  ; GFX9-NEXT:    s_cmp_gt_u32 s6, 31
  ; GFX9-NEXT:    v_cndmask_b32_e32 v1, 0, v1, vcc
  ; GFX9-NEXT:    s_cselect_b64 vcc, -1, 0
@@ -49,7 +49,7 @@ define i32 @s_add_co_select_user() {
  ; GFX10-NEXT:    v_add_co_u32 v0, s5, s4, s4
  ; GFX10-NEXT:    s_cmpk_lg_u32 s5, 0x0
  ; GFX10-NEXT:    s_addc_u32 s5, s4, 0
-; GFX10-NEXT:    s_cselect_b32 s6, 1, 0
+; GFX10-NEXT:    s_cselect_b32 s6, -1, 0
  ; GFX10-NEXT:    s_cmp_gt_u32 s4, 31
  ; GFX10-NEXT:    v_cndmask_b32_e64 v1, 0, s5, s6
  ; GFX10-NEXT:    s_cselect_b32 vcc_lo, -1, 0
author	Ruiling Song <ruiling.song@amd.com>
	Thu, 16 Sep 2021 15:04:39 +0000 (23:04 +0800)
committer	Ruiling Song <ruiling.song@amd.com>
	Thu, 30 Sep 2021 02:15:01 +0000 (10:15 +0800)
llvm/lib/Target/AMDGPU/SIISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll		patch \| blob \| history