[AMDGPU] Stop adding an implicit def of vcc_hi for wave32

author Jay Foad <jay.foad@amd.com>

Tue, 1 Dec 2020 11:55:50 +0000 (11:55 +0000)

committer Jay Foad <jay.foad@amd.com>

Wed, 2 Dec 2020 10:11:42 +0000 (10:11 +0000)
author Jay Foad <jay.foad@amd.com>
Tue, 1 Dec 2020 11:55:50 +0000 (11:55 +0000)
committer Jay Foad <jay.foad@amd.com>
Wed, 2 Dec 2020 10:11:42 +0000 (10:11 +0000)
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp

index 8f74a2e..57caa00 100644 (file)
--- a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
@@ -11561,17 +11561,7 @@ void SITargetLowering::finalizeLowering(MachineFunction &MF) const {
    Info->limitOccupancy(MF);
  
    if (ST.isWave32() && !MF.empty()) {
-    // Add VCC_HI def because many instructions marked as imp-use VCC where
-    // we may only define VCC_LO. If nothing defines VCC_HI we may end up
-    // having a use of undef.
-
      const SIInstrInfo *TII = ST.getInstrInfo();
-    DebugLoc DL;
-
-    MachineBasicBlock &MBB = MF.front();
-    MachineBasicBlock::iterator I = MBB.getFirstNonDebugInstr();
-    BuildMI(MBB, I, DL, TII->get(TargetOpcode::IMPLICIT_DEF), AMDGPU::VCC_HI);
-
      for (auto &MBB : MF) {
        for (auto &MI : MBB) {
          TII->fixImplicitOperands(MI);
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/add_shl.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/add_shl.ll

index 0e232bf..5e7bc9a 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/add_shl.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/add_shl.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @add_shl(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add_shl:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, %c
@@ -46,7 +45,6 @@ define amdgpu_ps float @add_shl_vgpr_c(i32 inreg %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: add_shl_vgpr_c:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_add_i32 s2, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshlrev_b32_e64 v0, v0, s2
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
@@ -70,7 +68,6 @@ define amdgpu_ps float @add_shl_vgpr_ac(i32 %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: add_shl_vgpr_ac:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, s2, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, %c
@@ -93,7 +90,6 @@ define amdgpu_ps float @add_shl_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: add_shl_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, v1, 9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, 9
@@ -117,7 +113,6 @@ define amdgpu_ps float @add_shl_vgpr_const_inline_const(i32 %a) {
  ; GFX10-LABEL: add_shl_vgpr_const_inline_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, 0x3f4, 9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, 1012
    %result = shl i32 %x, 9
@@ -140,7 +135,6 @@ define amdgpu_ps float @add_shl_vgpr_inline_const_x2(i32 %a) {
  ; GFX10-LABEL: add_shl_vgpr_inline_const_x2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, 3, 9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, 3
    %result = shl i32 %x, 9
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll

index c815220..5f83bee 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll
@@ -14,7 +14,6 @@ define amdgpu_ps float @fmul_s_s(float inreg %src0, float inreg %src1) {
  ; GFX10-LABEL: fmul_s_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mul_f32_e64 v0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = fmul float %src0, %src1
    ret float %result
@@ -29,7 +28,6 @@ define amdgpu_ps float @fmul_ss(float inreg %src) {
  ; GFX10-LABEL: fmul_ss:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mul_f32_e64 v0, s2, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = fmul float %src, %src
    ret float %result
@@ -47,7 +45,6 @@ define amdgpu_ps float @fma_s_s_s(float inreg %src0, float inreg %src1, float in
  ; GFX10-LABEL: fma_s_s_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_fma_f32 v0, s3, s2, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call float @llvm.fma.f32(float %src0, float %src1, float %src2)
@@ -64,7 +61,6 @@ define amdgpu_ps float @fma_sss(float inreg %src) {
  ; GFX10-LABEL: fma_sss:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_fma_f32 v0, s2, s2, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call float @llvm.fma.f32(float %src, float %src, float %src)
    ret float %result
@@ -81,7 +77,6 @@ define amdgpu_ps float @fma_ss_s(float inreg %src01, float inreg %src2) {
  ; GFX10-LABEL: fma_ss_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_fma_f32 v0, s2, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call float @llvm.fma.f32(float %src01, float %src01, float %src2)
    ret float %result
@@ -98,7 +93,6 @@ define amdgpu_ps float @fma_s_ss(float inreg %src0, float inreg %src12) {
  ; GFX10-LABEL: fma_s_ss:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_fma_f32 v0, s2, s3, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call float @llvm.fma.f32(float %src0, float %src12, float %src12)
    ret float %result
@@ -115,7 +109,6 @@ define amdgpu_ps float @fma_ss_s_same_outer(float inreg %src02, float inreg %src
  ; GFX10-LABEL: fma_ss_s_same_outer:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_fma_f32 v0, s2, s3, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call float @llvm.fma.f32(float %src02, float %src1, float %src02)
    ret float %result
@@ -132,7 +125,6 @@ define amdgpu_ps float @fcmp_s_s(float inreg %src0, float inreg %src1) {
  ; GFX10-LABEL: fcmp_s_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_cmp_eq_f32_e64 s0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1.0, s0
  ; GFX10-NEXT:    ; return to shader part epilog
    %cmp = fcmp oeq float %src0, %src1
@@ -153,7 +145,6 @@ define amdgpu_ps float @select_vcc_s_s(float %cmp0, float %cmp1, float inreg %sr
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s3
  ; GFX10-NEXT:    v_cmp_eq_f32_e32 vcc_lo, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v2, s2, vcc_lo
  ; GFX10-NEXT:    ; return to shader part epilog
    %cmp = fcmp oeq float %cmp0, %cmp1
@@ -174,7 +165,6 @@ define amdgpu_ps float @select_vcc_fneg_s_s(float %cmp0, float %cmp1, float inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s2
  ; GFX10-NEXT:    v_cmp_eq_f32_e32 vcc_lo, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, s3, -v2, vcc_lo
  ; GFX10-NEXT:    ; return to shader part epilog
    %cmp = fcmp oeq float %cmp0, %cmp1
@@ -197,7 +187,6 @@ define amdgpu_ps float @amdgcn_div_fmas_sss(float inreg %src, float %cmp.src) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_cmp_eq_f32_e32 vcc_lo, 0, v0
  ; GFX10-NEXT:    v_div_fmas_f32 v0, s2, s2, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %vcc = fcmp oeq float %cmp.src, 0.0
    %result = call float @llvm.amdgcn.div.fmas.f32(float %src, float %src, float %src, i1 %vcc)
@@ -215,7 +204,6 @@ define amdgpu_ps float @class_s_s(float inreg %src0, i32 inreg %src1) {
  ; GFX10-LABEL: class_s_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_cmp_class_f32_e64 s0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1.0, s0
  ; GFX10-NEXT:    ; return to shader part epilog
    %class = call i1 @llvm.amdgcn.class.f32(float %src0, i32 %src1)
@@ -233,7 +221,6 @@ define amdgpu_ps float @div_scale_s_s_true(float inreg %src0, float inreg %src1)
  ; GFX10-LABEL: div_scale_s_s_true:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_div_scale_f32 v0, s0, s2, s3, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %div.scale = call { float, i1 } @llvm.amdgcn.div.scale.f32(float %src0, float %src1, i1 true)
    %result = extractvalue { float, i1 } %div.scale, 0
@@ -250,7 +237,6 @@ define amdgpu_ps float @div_scale_s_s_false(float inreg %src0, float inreg %src1
  ; GFX10-LABEL: div_scale_s_s_false:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_div_scale_f32 v0, s0, s3, s3, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %div.scale = call { float, i1 } @llvm.amdgcn.div.scale.f32(float %src0, float %src1, i1 false)
    %result = extractvalue { float, i1 } %div.scale, 0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/dynamic-alloca-uniform.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/dynamic-alloca-uniform.ll

index 025ee68..de31669 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/dynamic-alloca-uniform.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/dynamic-alloca-uniform.ll
@@ -36,7 +36,6 @@ define amdgpu_kernel void @kernel_dynamic_stackalloc_sgpr_align4(i32 %n) {
  ; GFX10-NEXT:    s_add_u32 s0, s0, s9
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_lshl2_add_u32 s4, s4, 15
  ; GFX10-NEXT:    s_and_b32 s4, s4, -16
@@ -88,7 +87,6 @@ define void @func_dynamic_stackalloc_sgpr_align4() {
  ; GFX10-NEXT:    s_addc_u32 s5, s5, gv@gotpcrel32@hi+12
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[4:5], 0x0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s33, s6
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_load_dword s4, s[4:5], 0x0
@@ -140,7 +138,6 @@ define amdgpu_kernel void @kernel_dynamic_stackalloc_sgpr_align16(i32 %n) {
  ; GFX10-NEXT:    s_add_u32 s0, s0, s9
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_lshl2_add_u32 s4, s4, 15
  ; GFX10-NEXT:    s_and_b32 s4, s4, -16
@@ -192,7 +189,6 @@ define void @func_dynamic_stackalloc_sgpr_align16() {
  ; GFX10-NEXT:    s_addc_u32 s5, s5, gv@gotpcrel32@hi+12
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[4:5], 0x0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s33, s6
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_load_dword s4, s[4:5], 0x0
@@ -245,7 +241,6 @@ define amdgpu_kernel void @kernel_dynamic_stackalloc_sgpr_align32(i32 %n) {
  ; GFX10-NEXT:    s_add_u32 s0, s0, s9
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_lshl2_add_u32 s4, s4, 15
  ; GFX10-NEXT:    s_and_b32 s4, s4, -16
@@ -301,7 +296,6 @@ define void @func_dynamic_stackalloc_sgpr_align32(i32 addrspace(1)* %out) {
  ; GFX10-NEXT:    s_addc_u32 s5, s5, gv@gotpcrel32@hi+12
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[4:5], 0x0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s33, s6
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_load_dword s4, s[4:5], 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/image_ls_mipmap_zero.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/image_ls_mipmap_zero.ll

index afcc55a..a5bf0db 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/image_ls_mipmap_zero.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/image_ls_mipmap_zero.ll
@@ -27,7 +27,6 @@ define amdgpu_ps <4 x float> @load_mip_1d(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -61,7 +60,6 @@ define amdgpu_ps <4 x float> @load_mip_2d(<8 x i32> inreg %rsrc, i32 %s, i32 %t)
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -95,7 +93,6 @@ define amdgpu_ps <4 x float> @load_mip_3d(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -129,7 +126,6 @@ define amdgpu_ps <4 x float> @load_mip_1darray(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -163,7 +159,6 @@ define amdgpu_ps <4 x float> @load_mip_2darray(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -197,7 +192,6 @@ define amdgpu_ps <4 x float> @load_mip_cube(<8 x i32> inreg %rsrc, i32 %s, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -230,7 +224,6 @@ define amdgpu_ps void @store_mip_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -262,7 +255,6 @@ define amdgpu_ps void @store_mip_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -294,7 +286,6 @@ define amdgpu_ps void @store_mip_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -326,7 +317,6 @@ define amdgpu_ps void @store_mip_1darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -358,7 +348,6 @@ define amdgpu_ps void @store_mip_2darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -390,7 +379,6 @@ define amdgpu_ps void @store_mip_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm
  ; GFX10-NEXT:    s_endpgm
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll

index b4afc48..3b883de 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll
@@ -30,7 +30,6 @@ define amdgpu_ps <8 x i32> @dyn_insertelement_v8i32_s_s_s(<8 x i32> inreg %vec,
  ; MOVREL-LABEL: dyn_insertelement_v8i32_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s10, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s10, s3
@@ -76,7 +75,6 @@ define amdgpu_ps <8 x i8 addrspace(3)*> @dyn_insertelement_v8p3i8_s_s_s(<8 x i8
  ; MOVREL-LABEL: dyn_insertelement_v8p3i8_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s10, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s10, s3
@@ -161,7 +159,6 @@ define <8 x float> @dyn_insertelement_v8f32_const_s_v_v(float %val, i32 %idx) {
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v1
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s9
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s10
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v9, v9, v0, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 2, v1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v10, v0, vcc_lo
@@ -244,7 +241,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_s_s_v(<8 x float> inreg %v
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v0
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s5
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s6
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v9, v7, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 2, v0
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v10, v7, vcc_lo
@@ -324,7 +320,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_s_v_s(<8 x float> inreg %v
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s10, 1
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s5
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s6
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v9, v0, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s10, 2
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v10, v0, vcc_lo
@@ -371,7 +366,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_s_s(<8 x float> %vec, fl
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_mov_b32_e32 v8, s2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s3, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s3, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v8, vcc_lo
@@ -453,7 +447,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_s_v_v(<8 x float> inreg %v
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v1
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s5
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s6
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v9, v9, v0, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 2, v1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v10, v0, vcc_lo
@@ -501,7 +494,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_s_v(<8 x float> %vec, fl
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_mov_b32_e32 v9, s2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v8
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v9, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v8
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v9, vcc_lo
@@ -547,7 +539,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_v_s(<8 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v8f32_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v8, vcc_lo
@@ -593,7 +584,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8p3i8_v_v_s(<8 x i8 addrspace(3
  ; MOVREL-LABEL: dyn_insertelement_v8p3i8_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v8, vcc_lo
@@ -641,7 +631,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_v_v(<8 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v8f32_v_v_v:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v9
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v9
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v8, vcc_lo
@@ -707,7 +696,6 @@ define amdgpu_ps <8 x i64> @dyn_insertelement_v8i64_s_s_s(<8 x i64> inreg %vec,
  ; MOVREL-NEXT:    s_mov_b32 s14, s16
  ; MOVREL-NEXT:    s_mov_b32 s15, s17
  ; MOVREL-NEXT:    s_movreld_b64 s[0:1], s[18:19]
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <8 x i64> %vec, i64 %val, i32 %idx
@@ -758,7 +746,6 @@ define amdgpu_ps <8 x i8 addrspace(1)*> @dyn_insertelement_v8p1i8_s_s_s(<8 x i8
  ; MOVREL-NEXT:    s_mov_b32 s14, s16
  ; MOVREL-NEXT:    s_mov_b32 s15, s17
  ; MOVREL-NEXT:    s_movreld_b64 s[0:1], s[18:19]
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <8 x i8 addrspace(1)*> %vec, i8 addrspace(1)* %val, i32 %idx
@@ -864,29 +851,28 @@ define void @dyn_insertelement_v8f64_const_s_v_v(double %val, i32 %idx) {
  ; MOVREL-NEXT:    v_mov_b32_e32 v17, s18
  ; MOVREL-NEXT:    v_mov_b32_e32 v18, s19
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 1, v2
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s5, 3, v2
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s10, 2, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s6, 4, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s7, 5, v2
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s5, 3, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s8, 6, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s9, 7, v2
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s10, 2, v2
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v3, v3, v0, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, v0, s4
-; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v0, s6
-; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v0, s7
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v4, v4, v1, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, v1, s4
-; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v1, s6
-; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v1, s7
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, v0, s10
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v0, s5
-; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v0, s8
-; MOVREL-NEXT:    v_cndmask_b32_e64 v17, v17, v0, s9
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v1, s10
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v1, s5
+; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v0, s6
+; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v0, s7
+; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v1, s6
+; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v1, s7
+; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v0, s8
+; MOVREL-NEXT:    v_cndmask_b32_e64 v17, v17, v0, s9
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v16, v16, v1, s8
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v18, v18, v1, s9
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[3:6], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[7:10], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[11:14], off
@@ -992,6 +978,9 @@ define amdgpu_ps void @dyn_insertelement_v8f64_s_s_v(<8 x double> inreg %vec, do
  ; MOVREL-NEXT:    s_mov_b32 s12, s14
  ; MOVREL-NEXT:    s_mov_b32 s14, s16
  ; MOVREL-NEXT:    v_mov_b32_e32 v16, s15
+; MOVREL-NEXT:    v_mov_b32_e32 v2, s1
+; MOVREL-NEXT:    v_mov_b32_e32 v1, s0
+; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s14
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s13
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s12
@@ -1005,37 +994,33 @@ define amdgpu_ps void @dyn_insertelement_v8f64_s_s_v(<8 x double> inreg %vec, do
  ; MOVREL-NEXT:    v_mov_b32_e32 v5, s4
  ; MOVREL-NEXT:    v_mov_b32_e32 v4, s3
  ; MOVREL-NEXT:    v_mov_b32_e32 v3, s2
-; MOVREL-NEXT:    v_mov_b32_e32 v2, s1
-; MOVREL-NEXT:    v_mov_b32_e32 v1, s0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v0
-; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; MOVREL-NEXT:    s_mov_b32 s30, s18
  ; MOVREL-NEXT:    s_mov_b32 s31, s19
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 2, v0
+; MOVREL-NEXT:    v_cndmask_b32_e64 v1, v1, s30, vcc_lo
+; MOVREL-NEXT:    v_cndmask_b32_e64 v2, v2, s31, vcc_lo
+; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 3, v0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s2, 5, v0
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v3, v3, s30, s0
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v4, v4, s31, s0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 4, v0
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 2, v0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 6, v0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 7, v0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v1, v1, s30, vcc_lo
-; MOVREL-NEXT:    v_cndmask_b32_e64 v2, v2, s31, vcc_lo
-; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 3, v0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, s30, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, s31, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, s30, s2
-; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, s31, s2
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, s30, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, s31, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, s30, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, s31, vcc_lo
+; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, s30, s0
+; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, s31, s0
+; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, s30, s2
+; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, s31, s2
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, s30, s3
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, s31, s3
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, s30, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v16, v16, s31, s4
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[1:4], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[5:8], off
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[9:12], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[13:16], off
  ; MOVREL-NEXT:    s_endpgm
@@ -1135,7 +1120,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_s_v_s(<8 x double> inreg %vec, do
  ; MOVREL-NEXT:    v_mov_b32_e32 v3, s1
  ; MOVREL-NEXT:    v_movreld_b32_e32 v2, v0
  ; MOVREL-NEXT:    v_movreld_b32_e32 v3, v1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[2:5], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[6:9], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[10:13], off
@@ -1171,7 +1155,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_s_s(<8 x double> %vec, double i
  ; MOVREL-LABEL: dyn_insertelement_v8f64_v_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_lshl_b32 m0, s4, 1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, s2
  ; MOVREL-NEXT:    v_movreld_b32_e32 v1, s3
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
@@ -1293,29 +1276,28 @@ define amdgpu_ps void @dyn_insertelement_v8f64_s_v_v(<8 x double> inreg %vec, do
  ; MOVREL-NEXT:    v_mov_b32_e32 v3, s0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v2
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 3, v2
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s6, 2, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s2, 4, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 5, v2
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 3, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 6, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s5, 7, v2
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s6, 2, v2
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v3, v3, v0, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, v0, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v0, s2
-; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v0, s3
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v4, v4, v1, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, v1, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v1, s2
-; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v1, s3
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, v0, s6
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v0, s1
-; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v0, s4
-; MOVREL-NEXT:    v_cndmask_b32_e64 v17, v17, v0, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v1, s6
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v1, s1
+; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v0, s2
+; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v0, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v1, s2
+; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v1, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v0, s4
+; MOVREL-NEXT:    v_cndmask_b32_e64 v17, v17, v0, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v16, v16, v1, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v18, v18, v1, s5
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[3:6], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[7:10], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[11:14], off
@@ -1372,7 +1354,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_s_v(<8 x double> %vec, double i
  ; MOVREL-LABEL: dyn_insertelement_v8f64_v_s_v:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v16
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v0, v0, s2, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v1, v1, s3, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v16
@@ -1385,8 +1366,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_s_v(<8 x double> %vec, double i
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, s2, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, s3, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 4, v16
-; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
-; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[4:7], off
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, s2, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, s3, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 5, v16
@@ -1398,6 +1377,8 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_s_v(<8 x double> %vec, double i
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 7, v16
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, s2, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, s3, vcc_lo
+; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
+; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[4:7], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[8:11], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[12:15], off
  ; MOVREL-NEXT:    s_endpgm
@@ -1431,7 +1412,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_v_s(<8 x double> %vec, double %
  ; MOVREL-LABEL: dyn_insertelement_v8f64_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_lshl_b32 m0, s2, 1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, v16
  ; MOVREL-NEXT:    v_movreld_b32_e32 v1, v17
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
@@ -1488,32 +1468,31 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_v_v(<8 x double> %vec, double %
  ; MOVREL-LABEL: dyn_insertelement_v8f64_v_v_v:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v18
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 4, v18
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 5, v18
  ; MOVREL-NEXT:    v_mov_b32_e32 v19, v0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v18
  ; MOVREL-NEXT:    v_mov_b32_e32 v23, v1
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 2, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s2, 3, v18
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 4, v18
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 5, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s5, 7, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s6, 6, v18
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v19, v16, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v2, v2, v16, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v16, s3
-; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v16, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v23, v17, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v3, v3, v17, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v17, s3
-; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v17, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v4, v4, v16, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, v16, s2
-; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v16, s6
-; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v16, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, v17, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, v17, s2
+; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v16, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v16, s4
+; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v17, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v17, s4
+; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v16, s6
+; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v16, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v17, s6
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v17, s5
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[4:7], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[8:11], off
@@ -1546,7 +1525,6 @@ define amdgpu_ps <3 x i32> @dyn_insertelement_v3i32_s_s_s(<3 x i32> inreg %vec,
  ; MOVREL-LABEL: dyn_insertelement_v3i32_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s6, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s5, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s6, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s5, s3
@@ -1572,7 +1550,6 @@ define amdgpu_ps <3 x float> @dyn_insertelement_v3i32_v_v_s(<3 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v3i32_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v3, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v3, vcc_lo
@@ -1602,7 +1579,6 @@ define amdgpu_ps <5 x i32> @dyn_insertelement_v5i32_s_s_s(<5 x i32> inreg %vec,
  ; MOVREL-LABEL: dyn_insertelement_v5i32_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s8, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s7, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s8, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s7, s3
@@ -1636,7 +1612,6 @@ define amdgpu_ps <5 x float> @dyn_insertelement_v5i32_v_v_s(<5 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v5i32_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v5, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v5, vcc_lo
@@ -1728,7 +1703,6 @@ define amdgpu_ps <32 x i32> @dyn_insertelement_v32i32_s_s_s(<32 x i32> inreg %ve
  ; MOVREL-NEXT:    s_mov_b32 s31, s33
  ; MOVREL-NEXT:    s_mov_b32 s30, s32
  ; MOVREL-NEXT:    s_movreld_b32 s0, s34
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <32 x i32> %vec, i32 %val, i32 %idx
@@ -1746,7 +1720,6 @@ define amdgpu_ps <32 x float> @dyn_insertelement_v32i32_v_v_s(<32 x float> %vec,
  ; MOVREL-LABEL: dyn_insertelement_v32i32_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_mov_b32 m0, s2
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, v32
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
@@ -1787,7 +1760,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_s_s_s_add_1(<8 x float> in
  ; MOVREL-LABEL: dyn_insertelement_v8f32_s_s_s_add_1:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_add_i32 s11, s11, 1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 0
  ; MOVREL-NEXT:    s_cselect_b32 s0, s10, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 1
@@ -1852,7 +1824,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_s_s_s_add_7(<8 x float> in
  ; MOVREL-LABEL: dyn_insertelement_v8f32_s_s_s_add_7:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_add_i32 s11, s11, 7
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 0
  ; MOVREL-NEXT:    s_cselect_b32 s0, s10, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s11, 1
@@ -1909,7 +1880,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_v_v_add_1(<8 x float> %v
  ; MOVREL-LABEL: dyn_insertelement_v8f32_v_v_v_add_1:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_add_nc_u32_e32 v9, 1, v9
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v9
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v9
@@ -1958,7 +1928,6 @@ define amdgpu_ps <8 x float> @dyn_insertelement_v8f32_v_v_v_add_7(<8 x float> %v
  ; MOVREL-LABEL: dyn_insertelement_v8f32_v_v_v_add_7:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_add_nc_u32_e32 v9, 7, v9
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v9
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v8, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v9
@@ -2065,7 +2034,6 @@ define amdgpu_ps void @dyn_insertelement_v8f64_s_s_s_add_1(<8 x double> inreg %v
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s13
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s14
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s15
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[4:7], off
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[8:11], off
@@ -2124,29 +2092,28 @@ define amdgpu_ps void @dyn_insertelement_v8f64_v_v_v_add_1(<8 x double> %vec, do
  ; MOVREL-NEXT:    v_add_nc_u32_e32 v18, 1, v18
  ; MOVREL-NEXT:    v_mov_b32_e32 v19, v0
  ; MOVREL-NEXT:    v_mov_b32_e32 v23, v1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v18
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 4, v18
-; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 5, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 2, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s2, 3, v18
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s3, 4, v18
+; MOVREL-NEXT:    v_cmp_eq_u32_e64 s4, 5, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s5, 7, v18
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s6, 6, v18
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v19, v16, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v2, v2, v16, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v16, s3
-; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v16, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v23, v17, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v3, v3, v17, s0
-; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v17, s3
-; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v17, s4
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v4, v4, v16, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v6, v6, v16, s2
-; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v16, s6
-; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v16, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, v17, s1
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v7, v7, v17, s2
+; MOVREL-NEXT:    v_cndmask_b32_e64 v8, v8, v16, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v10, v10, v16, s4
+; MOVREL-NEXT:    v_cndmask_b32_e64 v9, v9, v17, s3
+; MOVREL-NEXT:    v_cndmask_b32_e64 v11, v11, v17, s4
+; MOVREL-NEXT:    v_cndmask_b32_e64 v12, v12, v16, s6
+; MOVREL-NEXT:    v_cndmask_b32_e64 v14, v14, v16, s5
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v13, v13, v17, s6
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v15, v15, v17, s5
  ; MOVREL-NEXT:    global_store_dwordx4 v[0:1], v[0:3], off
@@ -2212,7 +2179,6 @@ define amdgpu_ps <16 x i32> @dyn_insertelement_v16i32_s_s_s(<16 x i32> inreg %ve
  ; MOVREL-NEXT:    s_mov_b32 s14, s16
  ; MOVREL-NEXT:    s_mov_b32 s15, s17
  ; MOVREL-NEXT:    s_movreld_b32 s0, s18
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x i32> %vec, i32 %val, i32 %idx
@@ -2295,7 +2261,6 @@ define amdgpu_ps <16 x float> @dyn_insertelement_v16f32_s_s_s(<16 x float> inreg
  ; MOVREL-NEXT:    v_mov_b32_e32 v13, s13
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s14
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s15
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x float> %vec, float %val, i32 %idx
@@ -2442,7 +2407,6 @@ define amdgpu_ps <32 x float> @dyn_insertelement_v32f32_s_s_s(<32 x float> inreg
  ; MOVREL-NEXT:    v_mov_b32_e32 v29, s29
  ; MOVREL-NEXT:    v_mov_b32_e32 v30, s30
  ; MOVREL-NEXT:    v_mov_b32_e32 v31, s31
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <32 x float> %vec, float %val, i32 %idx
@@ -2525,7 +2489,6 @@ define amdgpu_ps <16 x i64> @dyn_insertelement_v16i64_s_s_s(<16 x i64> inreg %ve
  ; MOVREL-NEXT:    s_mov_b32 s31, s33
  ; MOVREL-NEXT:    s_mov_b32 s30, s32
  ; MOVREL-NEXT:    s_movreld_b64 s[0:1], s[34:35]
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x i64> %vec, i64 %val, i32 %idx
@@ -2608,7 +2571,6 @@ define amdgpu_ps <16 x double> @dyn_insertelement_v16f64_s_s_s(<16 x double> inr
  ; MOVREL-NEXT:    s_mov_b32 s31, s33
  ; MOVREL-NEXT:    s_mov_b32 s30, s32
  ; MOVREL-NEXT:    s_movreld_b64 s[0:1], s[34:35]
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x double> %vec, double %val, i32 %idx
@@ -2723,7 +2685,6 @@ define amdgpu_ps <16 x i32> @dyn_insertelement_v16i32_s_v_s(<16 x i32> inreg %ve
  ; MOVREL-NEXT:    v_readfirstlane_b32 s13, v14
  ; MOVREL-NEXT:    v_readfirstlane_b32 s14, v15
  ; MOVREL-NEXT:    v_readfirstlane_b32 s15, v16
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x i32> %vec, i32 %val, i32 %idx
@@ -2808,7 +2769,6 @@ define amdgpu_ps <16 x float> @dyn_insertelement_v16f32_s_v_s(<16 x float> inreg
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s14
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s15
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, v16
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x float> %vec, float %val, i32 %idx
@@ -2957,7 +2917,6 @@ define amdgpu_ps <32 x float> @dyn_insertelement_v32f32_s_v_s(<32 x float> inreg
  ; MOVREL-NEXT:    v_mov_b32_e32 v30, s30
  ; MOVREL-NEXT:    v_mov_b32_e32 v31, s31
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, v32
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <32 x float> %vec, float %val, i32 %idx
@@ -3171,7 +3130,6 @@ define amdgpu_ps <16 x i64> @dyn_insertelement_v16i64_s_v_s(<16 x i64> inreg %ve
  ; MOVREL-NEXT:    v_readfirstlane_b32 s29, v31
  ; MOVREL-NEXT:    v_readfirstlane_b32 s30, v32
  ; MOVREL-NEXT:    v_readfirstlane_b32 s31, v33
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x i64> %vec, i64 %val, i32 %idx
@@ -3385,7 +3343,6 @@ define amdgpu_ps <16 x double> @dyn_insertelement_v16f64_s_v_s(<16 x double> inr
  ; MOVREL-NEXT:    v_readfirstlane_b32 s29, v31
  ; MOVREL-NEXT:    v_readfirstlane_b32 s30, v32
  ; MOVREL-NEXT:    v_readfirstlane_b32 s31, v33
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <16 x double> %vec, double %val, i32 %idx
@@ -3414,7 +3371,6 @@ define amdgpu_ps <7 x i32> @dyn_insertelement_v7i32_s_s_s(<7 x i32> inreg %vec,
  ; MOVREL-LABEL: dyn_insertelement_v7i32_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s10, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s9, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s10, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s9, s3
@@ -3456,7 +3412,6 @@ define amdgpu_ps <7 x i8 addrspace(3)*> @dyn_insertelement_v7p3i8_s_s_s(<7 x i8
  ; MOVREL-LABEL: dyn_insertelement_v7p3i8_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s10, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b32 s0, s9, s2
  ; MOVREL-NEXT:    s_cmp_eq_u32 s10, 1
  ; MOVREL-NEXT:    s_cselect_b32 s1, s9, s3
@@ -3531,7 +3486,6 @@ define amdgpu_ps <7 x float> @dyn_insertelement_v7f32_s_v_s(<7 x float> inreg %v
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s9, 1
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s5
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s6
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v10, v0, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s9, 2
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v11, v0, vcc_lo
@@ -3606,7 +3560,6 @@ define amdgpu_ps <7 x float> @dyn_insertelement_v7f32_s_v_v(<7 x float> inreg %v
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v1
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, s5
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, s6
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v7, v10, v0, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 2, v1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v11, v0, vcc_lo
@@ -3648,7 +3601,6 @@ define amdgpu_ps <7 x float> @dyn_insertelement_v7f32_v_v_s(<7 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v7f32_v_v_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v7, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v7, vcc_lo
@@ -3690,7 +3642,6 @@ define amdgpu_ps <7 x float> @dyn_insertelement_v7f32_v_v_v(<7 x float> %vec, fl
  ; MOVREL-LABEL: dyn_insertelement_v7f32_v_v_v:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v8
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v7, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v8
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v7, vcc_lo
@@ -3750,7 +3701,6 @@ define amdgpu_ps <7 x double> @dyn_insertelement_v7f64_s_s_s(<7 x double> inreg
  ; MOVREL-NEXT:    s_mov_b32 s12, s14
  ; MOVREL-NEXT:    s_mov_b32 s13, s15
  ; MOVREL-NEXT:    s_movreld_b64 s[0:1], s[16:17]
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <7 x double> %vec, double %val, i32 %idx
@@ -3860,7 +3810,6 @@ define amdgpu_ps <7 x double> @dyn_insertelement_v7f64_s_v_s(<7 x double> inreg
  ; MOVREL-NEXT:    v_readfirstlane_b32 s11, v13
  ; MOVREL-NEXT:    v_readfirstlane_b32 s12, v14
  ; MOVREL-NEXT:    v_readfirstlane_b32 s13, v15
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <7 x double> %vec, double %val, i32 %idx
@@ -3972,7 +3921,6 @@ define amdgpu_ps <7 x double> @dyn_insertelement_v7f64_s_v_v(<7 x double> inreg
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 6, v2
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v3, v3, v0, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v4, v4, v1, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 2, v2
@@ -4040,7 +3988,6 @@ define amdgpu_ps <7 x double> @dyn_insertelement_v7f64_v_v_s(<7 x double> %vec,
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    v_mov_b32_e32 v16, v15
  ; MOVREL-NEXT:    s_lshl_b32 m0, s2, 1
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_movreld_b32_e32 v0, v14
  ; MOVREL-NEXT:    v_movreld_b32_e32 v1, v16
  ; MOVREL-NEXT:    v_readfirstlane_b32 s0, v0
@@ -4142,7 +4089,6 @@ define amdgpu_ps <7 x double> @dyn_insertelement_v7f64_v_v_v(<7 x double> %vec,
  ; MOVREL-NEXT:    v_readfirstlane_b32 s11, v11
  ; MOVREL-NEXT:    v_readfirstlane_b32 s12, v12
  ; MOVREL-NEXT:    v_readfirstlane_b32 s13, v13
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    ; return to shader part epilog
  entry:
    %insert = insertelement <7 x double> %vec, double %val, i32 %idx
@@ -4167,7 +4113,6 @@ define amdgpu_ps <5 x double> @dyn_insertelement_v5f64_s_s_s(<5 x double> inreg
  ; MOVREL-LABEL: dyn_insertelement_v5f64_s_s_s:
  ; MOVREL:       ; %bb.0: ; %entry
  ; MOVREL-NEXT:    s_cmp_eq_u32 s14, 0
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    s_cselect_b64 s[0:1], s[12:13], s[2:3]
  ; MOVREL-NEXT:    s_cmp_eq_u32 s14, 1
  ; MOVREL-NEXT:    s_cselect_b64 s[2:3], s[12:13], s[4:5]
@@ -4270,7 +4215,6 @@ define amdgpu_ps <5 x double> @dyn_insertelement_v5f64_s_v_s(<5 x double> inreg
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s12, 0
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, s12, 1
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, s12, 4
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v2, v5, v0, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v3, v6, v1, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v4, v7, v0, s0
@@ -4386,7 +4330,6 @@ define amdgpu_ps <5 x double> @dyn_insertelement_v5f64_s_v_v(<5 x double> inreg
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s0, 1, v2
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 s1, 4, v2
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v3, v3, v0, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v4, v4, v1, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e64 v5, v5, v0, s0
@@ -4450,7 +4393,6 @@ define amdgpu_ps <5 x double> @dyn_insertelement_v5f64_v_v_s(<5 x double> %vec,
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 0
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, v2
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, v3
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v10, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v11, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e64 vcc_lo, s2, 1
@@ -4516,7 +4458,6 @@ define amdgpu_ps <5 x double> @dyn_insertelement_v5f64_v_v_v(<5 x double> %vec,
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v12
  ; MOVREL-NEXT:    v_mov_b32_e32 v15, v2
  ; MOVREL-NEXT:    v_mov_b32_e32 v14, v3
-; MOVREL-NEXT:    ; implicit-def: $vcc_hi
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v0, v0, v10, vcc_lo
  ; MOVREL-NEXT:    v_cndmask_b32_e32 v1, v1, v11, vcc_lo
  ; MOVREL-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 1, v12
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-add.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-add.s16.mir

index ad8f5df..5e64f0d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-add.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-add.s16.mir
@@ -23,7 +23,6 @@ body: |
      ; GFX6: S_ENDPGM 0, implicit [[V_ADD_U16_e64_]]
      ; GFX10-LABEL: name: add_s16
      ; GFX10: liveins: $vgpr0, $vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ADD_U16_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U16_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -55,7 +54,6 @@ body: |
      ; GFX6: S_ENDPGM 0, implicit [[V_ADD_U16_e64_]]
      ; GFX10-LABEL: name: add_s16_zext_to_s32
      ; GFX10: liveins: $vgpr0, $vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ADD_U16_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U16_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -88,7 +86,6 @@ body: |
      ; GFX6: S_ENDPGM 0, implicit [[V_SUB_U16_e64_]]
      ; GFX10-LABEL: name: add_s16_neg_inline_const_64
      ; GFX10: liveins: $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_SUB_U16_e64_:%[0-9]+]]:vgpr_32 = V_SUB_U16_e64 [[COPY]], 64, 0, implicit $exec
      ; GFX10: S_ENDPGM 0, implicit [[V_SUB_U16_e64_]]
@@ -117,7 +114,6 @@ body: |
      ; GFX6: S_ENDPGM 0, implicit [[V_SUB_U16_e64_]]
      ; GFX10-LABEL: name: add_s16_neg_inline_const_64_zext_to_s32
      ; GFX10: liveins: $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_SUB_U16_e64_:%[0-9]+]]:vgpr_32 = V_SUB_U16_e64 [[COPY]], 64, 0, implicit $exec
      ; GFX10: [[V_BFE_U32_:%[0-9]+]]:vgpr_32 = V_BFE_U32 [[V_SUB_U16_e64_]], 0, 16, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.mir

index 77c372e..69942e9 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.mir
@@ -19,7 +19,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F32_e64_]]
      ; WAVE32-LABEL: name: class_s32_vcc_sv
      ; WAVE32: liveins: $sgpr0, $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CMP_CLASS_F32_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F32_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -47,7 +46,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F32_e64_]]
      ; WAVE32-LABEL: name: class_s32_vcc_vs
      ; WAVE32: liveins: $sgpr0, $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CMP_CLASS_F32_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F32_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -75,7 +73,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F32_e64_]]
      ; WAVE32-LABEL: name: class_s32_vcc_vv
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_CLASS_F32_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F32_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -103,7 +100,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F64_e64_]]
      ; WAVE32-LABEL: name: class_s64_vcc_sv
      ; WAVE32: liveins: $sgpr0_sgpr1, $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CMP_CLASS_F64_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F64_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -132,7 +128,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F64_e64_]]
      ; WAVE32-LABEL: name: class_s64_vcc_vs
      ; WAVE32: liveins: $sgpr0_sgpr1, $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CMP_CLASS_F64_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F64_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -161,7 +156,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_CLASS_F64_e64_]]
      ; WAVE32-LABEL: name: class_s64_vcc_vv
      ; WAVE32: liveins: $vgpr0_vgpr1, $vgpr2
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; WAVE32: [[V_CMP_CLASS_F64_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F64_e64 0, [[COPY]], [[COPY1]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.s16.mir

index 9b2232d..c3ba924 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.s16.mir
@@ -27,7 +27,6 @@ body: |
      ; WAVE32: S_ENDPGM 0, implicit [[V_CMP_CLASS_F16_e64_]]
      ; WAVE64-LABEL: name: class_s16_vcc_sv
      ; WAVE64: liveins: $sgpr0, $vgpr0
-    ; WAVE64: $vcc_hi = IMPLICIT_DEF
      ; WAVE64: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE64: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE64: [[V_CMP_CLASS_F16_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F16_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -56,7 +55,6 @@ body: |
      ; WAVE32: S_ENDPGM 0, implicit [[V_CMP_CLASS_F16_e64_]]
      ; WAVE64-LABEL: name: class_s16_vcc_vs
      ; WAVE64: liveins: $sgpr0, $vgpr0
-    ; WAVE64: $vcc_hi = IMPLICIT_DEF
      ; WAVE64: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE64: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE64: [[V_CMP_CLASS_F16_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F16_e64 0, [[COPY]], [[COPY1]], implicit $exec
@@ -85,7 +83,6 @@ body: |
      ; WAVE32: S_ENDPGM 0, implicit [[V_CMP_CLASS_F16_e64_]]
      ; WAVE64-LABEL: name: class_s16_vcc_vv
      ; WAVE64: liveins: $vgpr0, $vgpr1
-    ; WAVE64: $vcc_hi = IMPLICIT_DEF
      ; WAVE64: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE64: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE64: [[V_CMP_CLASS_F16_e64_:%[0-9]+]]:sreg_32 = V_CMP_CLASS_F16_e64 0, [[COPY]], [[COPY1]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-flat.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-flat.mir

index cfaa09b..e3c82ba 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-flat.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-flat.mir
@@ -31,7 +31,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_flat
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -84,7 +83,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_flat_gep4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -139,7 +137,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_ATOMIC_CMPSWAP_X2_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_flat
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
@@ -192,7 +189,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_ATOMIC_CMPSWAP_X2_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_flat_gep4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
@@ -267,7 +263,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_flat_gepm4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -320,7 +315,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_CMPSWAP_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_CMPSWAP_RTN [[COPY]], [[REG_SEQUENCE]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_flat_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -359,7 +353,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_CMPSWAP_X2_RTN:%[0-9]+]]:vreg_64 = FLAT_ATOMIC_CMPSWAP_X2_RTN [[COPY]], [[REG_SEQUENCE]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 8)
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_flat_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-global.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-global.mir

index 96e109e..9a3b922 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-global.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-global.mir
@@ -69,7 +69,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -168,7 +167,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global_gep4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -249,7 +247,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_ATOMIC_CMPSWAP_X2_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_global
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
@@ -348,7 +345,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_ATOMIC_CMPSWAP_X2_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_global_gep4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
@@ -469,7 +465,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_CMPSWAP_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global_gepm4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -545,7 +540,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_CMPSWAP_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_CMPSWAP_RTN [[COPY]], [[REG_SEQUENCE]], 0, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -617,7 +611,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_CMPSWAP_X2_RTN:%[0-9]+]]:vreg_64 = GLOBAL_ATOMIC_CMPSWAP_X2_RTN [[COPY]], [[REG_SEQUENCE]], 0, 1, 0, implicit $exec :: (load store seq_cst 8, addrspace 1)
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s64_global_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3, $vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr4_vgpr5
@@ -695,7 +688,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_CMPSWAP_SADDR_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global_sgpr_ptr
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -796,7 +788,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_CMPSWAP_SADDR_RTN]]
      ; GFX10-LABEL: name: amdgpu_atomic_cmpxchg_s32_global_sgpr_ptr_offset_4095
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr2, $vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-and.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-and.mir

index 7907608..95812a8 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-and.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-and.mir
@@ -24,7 +24,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B64_]]
      ; WAVE32-LABEL: name: and_s1_vcc_vcc_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -60,7 +59,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B32_]]
      ; WAVE32-LABEL: name: and_s1_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_AND_B32_:%[0-9]+]]:sreg_32 = S_AND_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -91,7 +89,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B32_]]
      ; WAVE32-LABEL: name: and_s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_AND_B32_:%[0-9]+]]:sreg_32 = S_AND_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -122,7 +119,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_AND_B32_e64_]]
      ; WAVE32-LABEL: name: and_s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e64_:%[0-9]+]]:vgpr_32 = V_AND_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -153,7 +149,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B32_]]
      ; WAVE32-LABEL: name: and_s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_AND_B32_:%[0-9]+]]:sreg_32 = S_AND_B32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -182,7 +177,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B64_]]
      ; WAVE32-LABEL: name: and_s64_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -211,7 +205,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B32_]]
      ; WAVE32-LABEL: name: and_v2s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_AND_B32_:%[0-9]+]]:sreg_32 = S_AND_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -240,7 +233,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B64_]]
      ; WAVE32-LABEL: name: and_v2s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -269,7 +261,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B64_]]
      ; WAVE32-LABEL: name: and_v4s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -298,7 +289,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_AND_B32_e64_]]
      ; WAVE32-LABEL: name: and_s32_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e64_:%[0-9]+]]:vgpr_32 = V_AND_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -327,7 +317,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_AND_B32_e64_]]
      ; WAVE32-LABEL: name: and_v2s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e64_:%[0-9]+]]:vgpr_32 = V_AND_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -390,7 +379,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B64_]]
      ; WAVE32-LABEL: name: and_s1_vcc_copy_to_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -435,7 +423,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave32
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -482,7 +469,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave64
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -524,7 +510,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_AND_B32_]]
      ; WAVE32-LABEL: name: and_s32_sgpr_sgpr_sgpr_result_reg_class
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_AND_B32_:%[0-9]+]]:sreg_32 = S_AND_B32 [[COPY]], [[COPY1]], implicit-def $scc
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.mir

index eeefefb..bbd8952 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.mir
@@ -34,7 +34,6 @@ body: |
      ; GFX9: [[S_ASHR_I32_:%[0-9]+]]:sreg_32 = S_ASHR_I32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_ASHR_I32_]]
      ; GFX10-LABEL: name: ashr_s32_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[S_ASHR_I32_:%[0-9]+]]:sreg_32 = S_ASHR_I32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -74,7 +73,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I32_e64_]]
      ; GFX10-LABEL: name: ashr_s32_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -114,7 +112,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I32_e64_]]
      ; GFX10-LABEL: name: ashr_s32_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -154,7 +151,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I32_e64_]]
      ; GFX10-LABEL: name: ashr_s32_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ASHRREV_I32_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -194,7 +190,6 @@ body: |
      ; GFX9: [[S_ASHR_I64_:%[0-9]+]]:sreg_64 = S_ASHR_I64 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_ASHR_I64_]]
      ; GFX10-LABEL: name: ashr_s64_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
      ; GFX10: [[S_ASHR_I64_:%[0-9]+]]:sreg_64 = S_ASHR_I64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -234,7 +229,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I64_]]
      ; GFX10-LABEL: name: ashr_s64_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
@@ -274,7 +268,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I64_]]
      ; GFX10-LABEL: name: ashr_s64_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
@@ -314,7 +307,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I64_]]
      ; GFX10-LABEL: name: ashr_s64_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_ASHRREV_I64_:%[0-9]+]]:vreg_64 = V_ASHRREV_I64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.s16.mir

index 20cbb0a..cb8e685 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.s16.mir
@@ -75,7 +75,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I16_e64_]]
      ; GFX10-LABEL: name: ashr_s16_s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -142,7 +141,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I16_e64_]]
      ; GFX10-LABEL: name: ashr_s16_s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -175,7 +173,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I16_e64_]]
      ; GFX10-LABEL: name: ashr_s16_s16_vv_zext_to_s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -318,7 +315,6 @@ body: |
      ; GFX9: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ASHRREV_I16_e64_]]
      ; GFX10-LABEL: name: ashr_s16_s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_ASHRREV_I16_e64_:%[0-9]+]]:vgpr_32 = V_ASHRREV_I16_e64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.v2s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.v2s16.mir

index 9dcc69f..469194c 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.v2s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.v2s16.mir
@@ -77,7 +77,6 @@ body: |
      ; GFX9: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_ASHRREV_I16_]]
      ; GFX10-LABEL: name: ashr_v2s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -117,7 +116,6 @@ body: |
      ; GFX9: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_ASHRREV_I16_]]
      ; GFX10-LABEL: name: ashr_v2s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -157,7 +155,6 @@ body: |
      ; GFX9: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_ASHRREV_I16_]]
      ; GFX10-LABEL: name: ashr_v2s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_PK_ASHRREV_I16_:%[0-9]+]]:vgpr_32 = V_PK_ASHRREV_I16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-flat.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-flat.mir

index 71c0cbd..6d568a5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-flat.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-flat.mir
@@ -27,7 +27,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
@@ -60,7 +59,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
@@ -103,7 +101,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset2047
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2047, implicit $exec
@@ -158,7 +155,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2047, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset2047_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2047, implicit $exec
@@ -213,7 +209,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset2048
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
@@ -268,7 +263,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2048, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset2048_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
@@ -323,7 +317,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset4095
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -378,7 +371,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 4095, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset4095_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -443,7 +435,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[FLAT_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset4097
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4097, implicit $exec
@@ -508,7 +499,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = FLAT_ATOMIC_ADD_RTN [[REG_SEQUENCE1]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 4)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s32_offset4097_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4097, implicit $exec
@@ -553,7 +543,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_ATOMIC_ADD_X2_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[FLAT_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = FLAT_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 8)
@@ -586,7 +575,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = FLAT_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 8)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s64_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[FLAT_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = FLAT_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 8)
@@ -629,7 +617,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_ATOMIC_ADD_X2_RTN]]
      ; GFX10-LABEL: name: flat_atomicrmw_add_s64_offset4095
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -684,7 +671,6 @@ body:             |
      ; GFX9: [[FLAT_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = FLAT_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 4095, 1, 0, implicit $exec, implicit $flat_scr :: (load store seq_cst 8)
      ; GFX10-LABEL: name: flat_atomicrmw_add_s64_offset4095_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-global.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-global.mir

index cdd8179..d6f6547 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-global.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-global.mir
@@ -39,7 +39,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
@@ -82,7 +81,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
@@ -136,7 +134,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset2047
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2047, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
@@ -191,7 +188,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2047, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset2047_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2047, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
@@ -247,7 +243,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset2048
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
@@ -312,7 +307,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 2048, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset2048_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
@@ -378,7 +372,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset4095
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -443,7 +436,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[COPY]], [[COPY1]], 4095, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset4095_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -520,7 +512,6 @@ body:             |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_ATOMIC_ADD_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset4097
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4097, implicit $exec
@@ -596,7 +587,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_RTN:%[0-9]+]]:vgpr_32 = GLOBAL_ATOMIC_ADD_RTN [[REG_SEQUENCE1]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 4, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s32_offset4097_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4097, implicit $exec
@@ -652,7 +642,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_ATOMIC_ADD_X2_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[GLOBAL_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = GLOBAL_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 8, addrspace 1)
@@ -695,7 +684,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = GLOBAL_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 8, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s64_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[GLOBAL_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = GLOBAL_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 0, 1, 0, implicit $exec :: (load store seq_cst 8, addrspace 1)
@@ -749,7 +737,6 @@ body:             |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_ATOMIC_ADD_X2_RTN]]
      ; GFX10-LABEL: name: global_atomicrmw_add_s64_offset4095
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
@@ -814,7 +801,6 @@ body:             |
      ; GFX9: [[GLOBAL_ATOMIC_ADD_X2_RTN:%[0-9]+]]:vreg_64 = GLOBAL_ATOMIC_ADD_X2_RTN [[COPY]], [[COPY1]], 4095, 1, 0, implicit $exec :: (load store seq_cst 8, addrspace 1)
      ; GFX10-LABEL: name: global_atomicrmw_add_s64_offset4095_nortn
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-constant.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-constant.mir

index 908b76a..bb3c913 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-constant.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-constant.mir
@@ -18,7 +18,6 @@ body: |
      ; WAVE64: [[V_MOV_B32_e32_4:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 27, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_MOV_B32_e32_]], implicit [[V_MOV_B32_e32_1]], implicit [[V_MOV_B32_e32_2]], implicit [[V_MOV_B32_e32_3]], implicit [[V_MOV_B32_e32_4]]
      ; WAVE32-LABEL: name: constant_v_s32
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -49,7 +48,6 @@ body: |
      ; WAVE64: [[S_MOV_B32_4:%[0-9]+]]:sreg_32 = S_MOV_B32 27
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B32_]], implicit [[S_MOV_B32_1]], implicit [[S_MOV_B32_2]], implicit [[S_MOV_B32_3]], implicit [[S_MOV_B32_4]]
      ; WAVE32-LABEL: name: constant_s_s32
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; WAVE32: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 1
      ; WAVE32: [[S_MOV_B32_2:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -80,7 +78,6 @@ body: |
      ; WAVE64: [[V_MOV_B32_e32_4:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 27, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_MOV_B32_e32_]], implicit [[V_MOV_B32_e32_1]], implicit [[V_MOV_B32_e32_2]], implicit [[V_MOV_B32_e32_3]], implicit [[V_MOV_B32_e32_4]]
      ; WAVE32-LABEL: name: constant_v_s16
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -111,7 +108,6 @@ body: |
      ; WAVE64: [[S_MOV_B32_4:%[0-9]+]]:sreg_32 = S_MOV_B32 27
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B32_]], implicit [[S_MOV_B32_1]], implicit [[S_MOV_B32_2]], implicit [[S_MOV_B32_3]], implicit [[S_MOV_B32_4]]
      ; WAVE32-LABEL: name: constant_s_s16
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; WAVE32: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 1
      ; WAVE32: [[S_MOV_B32_2:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -161,7 +157,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE7:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_14]], %subreg.sub0, [[V_MOV_B32_e32_15]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]], implicit [[REG_SEQUENCE4]], implicit [[REG_SEQUENCE5]], implicit [[REG_SEQUENCE6]], implicit [[REG_SEQUENCE7]]
      ; WAVE32-LABEL: name: constant_v_s64
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_]], %subreg.sub0, [[V_MOV_B32_e32_1]], %subreg.sub1
@@ -225,7 +220,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE3:%[0-9]+]]:sreg_64 = REG_SEQUENCE [[S_MOV_B32_6]], %subreg.sub0, [[S_MOV_B32_7]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B64_]], implicit [[S_MOV_B64_1]], implicit [[S_MOV_B64_2]], implicit [[REG_SEQUENCE]], implicit [[S_MOV_B64_3]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]]
      ; WAVE32-LABEL: name: constant_s_s64
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B64_:%[0-9]+]]:sreg_64 = S_MOV_B64 0
      ; WAVE32: [[S_MOV_B64_1:%[0-9]+]]:sreg_64 = S_MOV_B64 1
      ; WAVE32: [[S_MOV_B64_2:%[0-9]+]]:sreg_64 = S_MOV_B64 -1
@@ -268,7 +262,6 @@ body: |
      ; WAVE64: [[S_MOV_B64_1:%[0-9]+]]:sreg_64 = S_MOV_B64 0
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B64_]], implicit [[S_MOV_B64_1]]
      ; WAVE32-LABEL: name: constant_i1_vcc
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
      ; WAVE32: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; WAVE32: S_ENDPGM 0, implicit [[S_MOV_B32_]], implicit [[S_MOV_B32_1]]
@@ -295,7 +288,6 @@ body: |
      ; WAVE64: [[S_MOV_B32_4:%[0-9]+]]:sreg_32 = S_MOV_B32 27
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B32_]], implicit [[S_MOV_B32_1]], implicit [[S_MOV_B32_2]], implicit [[S_MOV_B32_3]], implicit [[S_MOV_B32_4]]
      ; WAVE32-LABEL: name: constant_s_p3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; WAVE32: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 1
      ; WAVE32: [[S_MOV_B32_2:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -326,7 +318,6 @@ body: |
      ; WAVE64: [[V_MOV_B32_e32_4:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 27, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_MOV_B32_e32_]], implicit [[V_MOV_B32_e32_1]], implicit [[V_MOV_B32_e32_2]], implicit [[V_MOV_B32_e32_3]], implicit [[V_MOV_B32_e32_4]]
      ; WAVE32-LABEL: name: constant_v_p3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -368,7 +359,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE3:%[0-9]+]]:sreg_64 = REG_SEQUENCE [[S_MOV_B32_6]], %subreg.sub0, [[S_MOV_B32_7]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B64_]], implicit [[S_MOV_B64_1]], implicit [[S_MOV_B64_2]], implicit [[REG_SEQUENCE]], implicit [[S_MOV_B64_3]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]]
      ; WAVE32-LABEL: name: constant_s_p1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B64_:%[0-9]+]]:sreg_64 = S_MOV_B64 0
      ; WAVE32: [[S_MOV_B64_1:%[0-9]+]]:sreg_64 = S_MOV_B64 1
      ; WAVE32: [[S_MOV_B64_2:%[0-9]+]]:sreg_64 = S_MOV_B64 -1
@@ -432,7 +422,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE7:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_14]], %subreg.sub0, [[V_MOV_B32_e32_15]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]], implicit [[REG_SEQUENCE4]], implicit [[REG_SEQUENCE5]], implicit [[REG_SEQUENCE6]], implicit [[REG_SEQUENCE7]]
      ; WAVE32-LABEL: name: constant_v_p1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_]], %subreg.sub0, [[V_MOV_B32_e32_1]], %subreg.sub1
@@ -496,7 +485,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE3:%[0-9]+]]:sreg_64 = REG_SEQUENCE [[S_MOV_B32_6]], %subreg.sub0, [[S_MOV_B32_7]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[S_MOV_B64_]], implicit [[S_MOV_B64_1]], implicit [[S_MOV_B64_2]], implicit [[REG_SEQUENCE]], implicit [[S_MOV_B64_3]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]]
      ; WAVE32-LABEL: name: constant_s_p999
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[S_MOV_B64_:%[0-9]+]]:sreg_64 = S_MOV_B64 0
      ; WAVE32: [[S_MOV_B64_1:%[0-9]+]]:sreg_64 = S_MOV_B64 1
      ; WAVE32: [[S_MOV_B64_2:%[0-9]+]]:sreg_64 = S_MOV_B64 -1
@@ -560,7 +548,6 @@ body: |
      ; WAVE64: [[REG_SEQUENCE7:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_14]], %subreg.sub0, [[V_MOV_B32_e32_15]], %subreg.sub1
      ; WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]], implicit [[REG_SEQUENCE1]], implicit [[REG_SEQUENCE2]], implicit [[REG_SEQUENCE3]], implicit [[REG_SEQUENCE4]], implicit [[REG_SEQUENCE5]], implicit [[REG_SEQUENCE6]], implicit [[REG_SEQUENCE7]]
      ; WAVE32-LABEL: name: constant_v_p999
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; WAVE32: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_MOV_B32_e32_]], %subreg.sub0, [[V_MOV_B32_e32_1]], %subreg.sub1
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-copy.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-copy.mir

index 7906ff6..8983dfe 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-copy.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-copy.mir
@@ -19,7 +19,6 @@ body: |
      ; WAVE64: [[DEF:%[0-9]+]]:vgpr_32 = IMPLICIT_DEF
      ; WAVE64: FLAT_STORE_DWORD [[COPY1]], [[DEF]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE32-LABEL: name: copy
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[DEF:%[0-9]+]]:vgpr_32 = IMPLICIT_DEF
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -49,7 +48,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY2]], 0, [[COPY1]], [[V_CMP_NE_U32_e64_]], implicit $exec
      ; WAVE64: FLAT_STORE_DWORD [[COPY]], [[V_CNDMASK_B32_e64_]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE32-LABEL: name: copy_vcc_bank_sgpr_bank
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -89,7 +87,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_1:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[V_CNDMASK_B32_e64_]], 0, [[COPY1]], [[V_CMP_NE_U32_e64_1]], implicit $exec
      ; WAVE64: FLAT_STORE_DWORD [[COPY]], [[V_CNDMASK_B32_e64_1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE32-LABEL: name: copy_vcc_bank_sgpr_bank_2_uses
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -129,7 +126,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY2]], 0, [[COPY1]], [[COPY3]], implicit $exec
      ; WAVE64: FLAT_STORE_DWORD [[COPY]], [[V_CNDMASK_B32_e64_]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE32-LABEL: name: copy_vcc_bank_scc_physreg
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr3
@@ -157,7 +153,6 @@ body: |
      ; WAVE64: [[COPY:%[0-9]+]]:sreg_32_xm0 = COPY $sgpr0
      ; WAVE64: S_ENDPGM 0, implicit [[COPY]]
      ; WAVE32-LABEL: name: copy_sgpr_no_type
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32_xm0 = COPY $sgpr0
      ; WAVE32: S_ENDPGM 0, implicit [[COPY]]
      %0:sreg_32_xm0 = COPY $sgpr0
@@ -180,7 +175,6 @@ body: |
      ; WAVE64: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE64: S_ENDPGM 0, implicit [[COPY]]
      ; WAVE32-LABEL: name: copy_vgpr_no_type
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: S_ENDPGM 0, implicit [[COPY]]
      %0:vgpr_32 = COPY $vgpr0
@@ -203,7 +197,6 @@ body: |
      ; WAVE64: [[COPY:%[0-9]+]]:sreg_64_xexec = COPY $sgpr0_sgpr1
      ; WAVE64: S_ENDPGM 0, implicit [[COPY]]
      ; WAVE32-LABEL: name: copy_maybe_vcc
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64_xexec = COPY $sgpr0_sgpr1
      ; WAVE32: S_ENDPGM 0, implicit [[COPY]]
      %0:sreg_64_xexec = COPY $sgpr0_sgpr1
@@ -229,7 +222,6 @@ body: |
      ; WAVE64: [[COPY1:%[0-9]+]]:sreg_64_xexec = COPY [[COPY]]
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_s1_vcc_to_vcc
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32_xm0_xexec = COPY [[COPY]]
      ; WAVE32: S_ENDPGM 0, implicit [[COPY1]]
@@ -255,7 +247,6 @@ body: |
      ; WAVE64: $vcc = COPY [[COPY]]
      ; WAVE64: S_ENDPGM 0, implicit $vcc
      ; WAVE32-LABEL: name: copy_s64_to_vcc
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: $vcc = COPY [[COPY]]
      ; WAVE32: S_ENDPGM 0, implicit $vcc_lo
@@ -280,7 +271,6 @@ body: |
      ; WAVE64: $vcc_lo = COPY [[COPY]]
      ; WAVE64: S_ENDPGM 0, implicit $vcc
      ; WAVE32-LABEL: name: copy_s32_to_vcc_lo
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: $vcc_lo = COPY [[COPY]]
      ; WAVE32: S_ENDPGM 0, implicit $vcc_lo
@@ -304,7 +294,6 @@ body: |
      ; WAVE64: [[COPY:%[0-9]+]]:sreg_64 = COPY $vcc
      ; WAVE64: S_ENDPGM 0, implicit [[COPY]]
      ; WAVE32-LABEL: name: copy_vcc_to_s64
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $vcc
      ; WAVE32: S_ENDPGM 0, implicit [[COPY]]
      %0:sgpr(s64) = COPY $vcc
@@ -326,7 +315,6 @@ body: |
      ; WAVE64: [[COPY:%[0-9]+]]:sreg_32 = COPY $vcc_lo
      ; WAVE64: S_ENDPGM 0, implicit [[COPY]]
      ; WAVE32-LABEL: name: copy_vcc_lo_to_s32
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $vcc_lo
      ; WAVE32: S_ENDPGM 0, implicit [[COPY]]
      %0:sgpr(s32) = COPY $vcc_lo
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.mir

index bd3df5f..006e9e6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.mir
@@ -40,7 +40,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_EQ_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_oeq_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_EQ_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -65,7 +64,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_GT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ogt_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_GT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -90,7 +88,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_GE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_oge_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_GE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -115,7 +112,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_olt_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -140,7 +136,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ole_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -165,7 +160,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LG_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_one_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LG_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -190,7 +184,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_O_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ord_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_O_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -215,7 +208,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_U_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_uno_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_U_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -240,7 +232,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLG_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ueq_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLG_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -265,7 +256,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ugt_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -290,7 +280,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_uge_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -315,7 +304,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NGE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ult_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NGE_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -340,7 +328,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NGT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ule_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NGT_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -365,7 +352,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NEQ_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_une_s32_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NEQ_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -438,7 +424,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_EQ_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_oeq_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_EQ_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -463,7 +448,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_GT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ogt_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_GT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -488,7 +472,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_GE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_oge_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_GE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -513,7 +496,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_olt_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -538,7 +520,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ole_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -563,7 +544,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_LG_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_one_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_LG_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -588,7 +568,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_O_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ord_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_O_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -613,7 +592,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_U_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_uno_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_U_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -638,7 +616,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLG_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ueq_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLG_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -663,7 +640,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ugt_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -688,7 +664,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NLT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_uge_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NLT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -713,7 +688,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NGE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ult_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NGE_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -738,7 +712,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NGT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_ule_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NGT_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -763,7 +736,6 @@ body: |
      ; WAVE64: %2:sreg_64 = nofpexcept V_CMP_NEQ_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %2
      ; WAVE32-LABEL: name: fcmp_une_s64_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; WAVE32: %2:sreg_32 = nofpexcept V_CMP_NEQ_F64_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -813,7 +785,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], %2, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CNDMASK_B32_e64_]]
      ; WAVE32-LABEL: name: fcmp_oeq_s32_vv_select_user
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %2:sreg_32_xm0_xexec = nofpexcept V_CMP_EQ_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.s16.mir

index 7d615a6..51de250 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.s16.mir
@@ -46,7 +46,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_EQ_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_oeq_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_EQ_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -73,7 +72,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_GT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ogt_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_GT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -100,7 +98,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_GE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_oge_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_GE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -127,7 +124,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_LT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_olt_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_LT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -154,7 +150,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_LE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ole_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_LE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -180,7 +175,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_LG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_one_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_LG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -207,7 +201,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_LG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ord_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_LG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -234,7 +227,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_U_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_uno_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_U_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -261,7 +253,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NLG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ueq_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NLG_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -288,7 +279,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NLE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ugt_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NLE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -315,7 +305,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NLT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_uge_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NLT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -342,7 +331,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NGE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ult_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NGE_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -369,7 +357,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NGT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_ule_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NGT_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
@@ -396,7 +383,6 @@ body: |
      ; WAVE64: %4:sreg_64 = nofpexcept V_CMP_NEQ_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit %4
      ; WAVE32-LABEL: name: fcmp_une_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: %4:sreg_32 = nofpexcept V_CMP_NEQ_F16_e64 0, [[COPY]], 0, [[COPY1]], 0, implicit $mode, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fma.s32.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fma.s32.mir

index 0a02c23..d7ba17c 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fma.s32.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fma.s32.mir
@@ -26,7 +26,6 @@ body: |
      ; GFX9-DL: %3:vgpr_32 = nofpexcept V_FMAC_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %3
      ; GFX10-LABEL: name: fma_f32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -63,7 +62,6 @@ body: |
      ; GFX9-DL: %4:vgpr_32 = nofpexcept V_FMAC_F32_e64 1, [[COPY]], 0, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %4
      ; GFX10-LABEL: name: fma_f32_fneg_src0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -101,7 +99,6 @@ body: |
      ; GFX9-DL: %4:vgpr_32 = nofpexcept V_FMAC_F32_e64 0, [[COPY]], 1, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %4
      ; GFX10-LABEL: name: fma_f32_fneg_src1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -139,7 +136,6 @@ body: |
      ; GFX9-DL: %4:vgpr_32 = nofpexcept V_FMA_F32 0, [[COPY]], 0, [[COPY1]], 1, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %4
      ; GFX10-LABEL: name: fma_f32_fneg_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -177,7 +173,6 @@ body: |
      ; GFX9-DL: %4:vgpr_32 = nofpexcept V_FMA_F32 0, [[COPY]], 0, [[COPY1]], 2, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %4
      ; GFX10-LABEL: name: fma_f32_fabs_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -215,7 +210,6 @@ body: |
      ; GFX9-DL: %5:vgpr_32 = nofpexcept V_FMA_F32 0, [[COPY]], 0, [[COPY1]], 1, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX9-DL: S_ENDPGM 0, implicit %5
      ; GFX10-LABEL: name: fma_f32_copy_fneg_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fmad.s32.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fmad.s32.mir

index 99e776b..c8492cc 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fmad.s32.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fmad.s32.mir
@@ -19,7 +19,6 @@ body: |
      ; GFX6: [[V_MAC_F32_e64_:%[0-9]+]]:vgpr_32 = V_MAC_F32_e64 0, [[COPY]], 0, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAC_F32_e64_]]
      ; GFX10-LABEL: name: fmad_f32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -50,7 +49,6 @@ body: |
      ; GFX6: [[V_MAD_F32_:%[0-9]+]]:vgpr_32 = V_MAD_F32 1, [[COPY]], 0, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAD_F32_]]
      ; GFX10-LABEL: name: fmad_f32_fneg_src0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -82,7 +80,6 @@ body: |
      ; GFX6: [[V_MAD_F32_:%[0-9]+]]:vgpr_32 = V_MAD_F32 0, [[COPY]], 1, [[COPY1]], 0, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAD_F32_]]
      ; GFX10-LABEL: name: fmad_f32_fneg_src1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -114,7 +111,6 @@ body: |
      ; GFX6: [[V_MAD_F32_:%[0-9]+]]:vgpr_32 = V_MAD_F32 0, [[COPY]], 0, [[COPY1]], 1, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAD_F32_]]
      ; GFX10-LABEL: name: fmad_f32_fneg_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -146,7 +142,6 @@ body: |
      ; GFX6: [[V_MAD_F32_:%[0-9]+]]:vgpr_32 = V_MAD_F32 0, [[COPY]], 0, [[COPY1]], 2, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAD_F32_]]
      ; GFX10-LABEL: name: fmad_f32_fabs_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -178,7 +173,6 @@ body: |
      ; GFX6: [[V_MAD_F32_:%[0-9]+]]:vgpr_32 = V_MAD_F32 0, [[COPY]], 0, [[COPY1]], 1, [[COPY2]], 0, 0, implicit $mode, implicit $exec
      ; GFX6: S_ENDPGM 0, implicit [[V_MAD_F32_]]
      ; GFX10-LABEL: name: fmad_f32_copy_fneg_src2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fract.f64.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fract.f64.mir

index e04f8d0..a8f4d0f 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fract.f64.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fract.f64.mir
@@ -13,7 +13,6 @@ body: |
  
      ; CHECK-LABEL: name: fract_f64_neg
      ; CHECK: liveins: $sgpr0_sgpr1
-    ; CHECK: $vcc_hi = IMPLICIT_DEF
      ; CHECK: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; CHECK: [[S_LOAD_DWORDX4_IMM:%[0-9]+]]:sgpr_128 = S_LOAD_DWORDX4_IMM [[COPY]], 36, 0, 0 :: (dereferenceable invariant load 16, align 4, addrspace 4)
      ; CHECK: [[COPY1:%[0-9]+]]:sreg_64 = COPY [[S_LOAD_DWORDX4_IMM]].sub0_sub1
@@ -63,7 +62,6 @@ body: |
  
      ; CHECK-LABEL: name: fract_f64_neg_abs
      ; CHECK: liveins: $sgpr0_sgpr1
-    ; CHECK: $vcc_hi = IMPLICIT_DEF
      ; CHECK: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; CHECK: [[S_LOAD_DWORDX4_IMM:%[0-9]+]]:sgpr_128 = S_LOAD_DWORDX4_IMM [[COPY]], 36, 0, 0 :: (dereferenceable invariant load 16, align 4, addrspace 4)
      ; CHECK: [[COPY1:%[0-9]+]]:sreg_64 = COPY [[S_LOAD_DWORDX4_IMM]].sub0_sub1
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-freeze.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-freeze.mir

index 1fd95b5..5517155 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-freeze.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-freeze.mir
@@ -16,7 +16,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s1_vgpr_to_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(s32) = COPY $vgpr0
@@ -40,7 +39,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $agpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s1_vgpr_to_agpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $agpr0 = COPY [[COPY]]
      %0:vgpr(s32) = COPY $vgpr0
@@ -67,7 +65,6 @@ body: |
      ; GFX6: [[COPY2:%[0-9]+]]:sreg_64_xexec = COPY [[V_CMP_EQ_U32_e64_]]
      ; GFX6: S_ENDPGM 0, implicit [[COPY2]]
      ; GFX10-LABEL: name: test_freeze_s1_vcc
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_32 = V_CMP_EQ_U32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -94,7 +91,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s16_vgpr_to_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(s32) = COPY $vgpr0
@@ -118,7 +114,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_vgpr_to_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(s32) = COPY $vgpr0
@@ -140,7 +135,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX6: $sgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_sgpr_to_sgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: $sgpr0 = COPY [[COPY]]
      %0:sgpr(s32) = COPY $sgpr0
@@ -162,7 +156,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_sgpr_to_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:sgpr(s32) = COPY $sgpr0
@@ -184,7 +177,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $agpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_vgpr_to_agpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $agpr0 = COPY [[COPY]]
      %0:vgpr(s32) = COPY $vgpr0
@@ -206,7 +198,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX6: $agpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_sgpr_to_agpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: $agpr0 = COPY [[COPY]]
      %0:sgpr(s32) = COPY $sgpr0
@@ -228,7 +219,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:agpr_32 = COPY $agpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_agpr_to_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:agpr_32 = COPY $agpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:agpr(s32) = COPY $agpr0
@@ -250,7 +240,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:agpr_32 = COPY $agpr0
      ; GFX6: $agpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s32_agpr_to_agpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:agpr_32 = COPY $agpr0
      ; GFX10: $agpr0 = COPY [[COPY]]
      %0:agpr(s32) = COPY $agpr0
@@ -272,7 +261,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s64
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(s64) = COPY $vgpr0_vgpr1
@@ -294,7 +282,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s128
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      %0:vgpr(s128) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
@@ -316,7 +303,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_256 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_256
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_256 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[COPY]]
      %0:vgpr(s256) = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
@@ -338,7 +324,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_512 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_s512
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_512 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15 = COPY [[COPY]]
      %0:vgpr(s512) = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
@@ -360,7 +345,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v2s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(<2 x s32>) = COPY $vgpr0_vgpr1
@@ -382,7 +366,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_96 = COPY $vgpr0_vgpr1_vgpr2
      ; GFX6: $vgpr0_vgpr1_vgpr2 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v3s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_96 = COPY $vgpr0_vgpr1_vgpr2
      ; GFX10: $vgpr0_vgpr1_vgpr2 = COPY [[COPY]]
      %0:vgpr(<3 x s32>) = COPY $vgpr0_vgpr1_vgpr2
@@ -404,7 +387,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v4s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      %0:vgpr(<4 x s32>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
@@ -426,7 +408,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_160 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v5s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_160 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4 = COPY [[COPY]]
      %0:vgpr(<5 x s32>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4
@@ -448,7 +429,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_256 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v8s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_256 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7 = COPY [[COPY]]
      %0:vgpr(<8 x s32>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7
@@ -470,7 +450,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_512 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v16s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_512 = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15 = COPY [[COPY]]
      %0:vgpr(<16 x s32>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11_vgpr12_vgpr13_vgpr14_vgpr15
@@ -492,7 +471,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v2s16
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(<2 x s16>) = COPY $vgpr0
@@ -514,7 +492,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v4s16
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(<4 x s16>) = COPY $vgpr0_vgpr1
@@ -536,7 +513,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_96 = COPY $vgpr0_vgpr1_vgpr2
      ; GFX6: $vgpr0_vgpr1_vgpr2 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v6s16
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_96 = COPY $vgpr0_vgpr1_vgpr2
      ; GFX10: $vgpr0_vgpr1_vgpr2 = COPY [[COPY]]
      %0:vgpr(<6 x s16>) = COPY $vgpr0_vgpr1_vgpr2
@@ -558,7 +534,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v8s16
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      %0:vgpr(<8 x s16>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
@@ -580,7 +555,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX6: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_v2s64
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_128 = COPY $vgpr0_vgpr1_vgpr2_vgpr3
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[COPY]]
      %0:vgpr(<2 x s64>) = COPY $vgpr0_vgpr1_vgpr2_vgpr3
@@ -602,7 +576,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(p0) = COPY $vgpr0_vgpr1
@@ -624,7 +597,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(p1) = COPY $vgpr0_vgpr1
@@ -646,7 +618,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(p2) = COPY $vgpr0
@@ -668,7 +639,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(p3) = COPY $vgpr0
@@ -690,7 +660,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p4
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(p4) = COPY $vgpr0_vgpr1
@@ -712,7 +681,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX6: $vgpr0 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: $vgpr0 = COPY [[COPY]]
      %0:vgpr(p5) = COPY $vgpr0
@@ -734,7 +702,6 @@ body: |
      ; GFX6: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX6: $vgpr0_vgpr1 = COPY [[COPY]]
      ; GFX10-LABEL: name: test_freeze_p999
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: $vgpr0_vgpr1 = COPY [[COPY]]
      %0:vgpr(p999) = COPY $vgpr0_vgpr1
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-icmp.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-icmp.s16.mir

index fa2068c..87427fc 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-icmp.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-icmp.s16.mir
@@ -18,7 +18,6 @@ body: |
      ; WAVE64: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_EQ_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_eq_s16_sv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -47,7 +46,6 @@ body: |
      ; WAVE64: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_EQ_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_eq_s16_vs
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -76,7 +74,6 @@ body: |
      ; WAVE64: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_EQ_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_eq_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_EQ_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_EQ_U16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -105,7 +102,6 @@ body: |
      ; WAVE64: [[V_CMP_NE_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_NE_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_NE_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_ne_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_NE_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_NE_U16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -134,7 +130,6 @@ body: |
      ; WAVE64: [[V_CMP_LT_I16_e64_:%[0-9]+]]:sreg_64 = V_CMP_LT_I16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_LT_I16_e64_]]
      ; WAVE32-LABEL: name: icmp_slt_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_LT_I16_e64_:%[0-9]+]]:sreg_32 = V_CMP_LT_I16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -163,7 +158,6 @@ body: |
      ; WAVE64: [[V_CMP_LE_I16_e64_:%[0-9]+]]:sreg_64 = V_CMP_LE_I16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_LE_I16_e64_]]
      ; WAVE32-LABEL: name: icmp_sle_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_LE_I16_e64_:%[0-9]+]]:sreg_32 = V_CMP_LE_I16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -192,7 +186,6 @@ body: |
      ; WAVE64: [[V_CMP_LT_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_LT_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_LT_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_ult_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_LT_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_LT_U16_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -221,7 +214,6 @@ body: |
      ; WAVE64: [[V_CMP_LE_U16_e64_:%[0-9]+]]:sreg_64 = V_CMP_LE_U16_e64 [[COPY]], [[COPY1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_CMP_LE_U16_e64_]]
      ; WAVE32-LABEL: name: icmp_ule_s16_vv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_CMP_LE_U16_e64_:%[0-9]+]]:sreg_32 = V_CMP_LE_U16_e64 [[COPY]], [[COPY1]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-constant.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-constant.mir

index 41957e1..892d754 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-constant.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-constant.mir
@@ -33,7 +33,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -72,7 +71,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_v2s16_from_4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -110,7 +108,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_v2s32
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -147,7 +144,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_v2s32_align4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -184,7 +180,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_v4s16_align4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -222,7 +217,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1_sgpr2_sgpr3 = COPY [[S_LOAD_DWORDX4_IMM]]
      ; GFX10-LABEL: name: load_constant_v4s32_align4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX4_IMM:%[0-9]+]]:sgpr_128 = S_LOAD_DWORDX4_IMM [[COPY]], 0, 0, 0 :: (load 16, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1_sgpr2_sgpr3 = COPY [[S_LOAD_DWORDX4_IMM]]
@@ -260,7 +254,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_s64
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -298,7 +291,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_s64_align4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -336,7 +328,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1_sgpr2_sgpr3 = COPY [[S_LOAD_DWORDX4_IMM]]
      ; GFX10-LABEL: name: load_constant_v2s64
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX4_IMM:%[0-9]+]]:sgpr_128 = S_LOAD_DWORDX4_IMM [[COPY]], 0, 0, 0 :: (load 16, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1_sgpr2_sgpr3 = COPY [[S_LOAD_DWORDX4_IMM]]
@@ -448,7 +439,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_p3_from_4
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -486,7 +476,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_p1_from_8
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -598,7 +587,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_v2s16
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -636,7 +624,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
      ; GFX10-LABEL: name: load_constant_v4s16
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX2_IMM:%[0-9]+]]:sreg_64_xexec = S_LOAD_DWORDX2_IMM [[COPY]], 0, 0, 0 :: (load 8, addrspace 4)
      ; GFX10: $sgpr0_sgpr1 = COPY [[S_LOAD_DWORDX2_IMM]]
@@ -711,7 +698,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7 = COPY [[S_LOAD_DWORDX8_IMM]]
      ; GFX10-LABEL: name: load_constant_v8s32
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX8_IMM:%[0-9]+]]:sgpr_256 = S_LOAD_DWORDX8_IMM [[COPY]], 0, 0, 0 :: (load 32, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7 = COPY [[S_LOAD_DWORDX8_IMM]]
@@ -749,7 +735,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15 = COPY [[S_LOAD_DWORDX16_IMM]]
      ; GFX10-LABEL: name: load_constant_v16s32
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX16_IMM:%[0-9]+]]:sgpr_512 = S_LOAD_DWORDX16_IMM [[COPY]], 0, 0, 0 :: (load 64, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15 = COPY [[S_LOAD_DWORDX16_IMM]]
@@ -787,7 +772,6 @@ body: |
      ; GFX8: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15 = COPY [[S_LOAD_DWORDX16_IMM]]
      ; GFX10-LABEL: name: load_constant_v8s64
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORDX16_IMM:%[0-9]+]]:sgpr_512 = S_LOAD_DWORDX16_IMM [[COPY]], 0, 0, 0 :: (load 64, align 4, addrspace 4)
      ; GFX10: $sgpr0_sgpr1_sgpr2_sgpr3_sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15 = COPY [[S_LOAD_DWORDX16_IMM]]
@@ -829,7 +813,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_1020
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 1020, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -870,7 +853,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_1024
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 1024, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -912,7 +894,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_1048575
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 1048575
      ; GFX10: [[S_LOAD_DWORD_SGPR:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_SGPR [[COPY]], [[S_MOV_B32_]], 0, 0 :: (load 4, addrspace 4)
@@ -955,7 +936,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_SGPR]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_1048576
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 1048576
      ; GFX10: [[S_LOAD_DWORD_SGPR:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_SGPR [[COPY]], [[S_MOV_B32_]], 0, 0 :: (load 4, addrspace 4)
@@ -999,7 +979,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_SGPR]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_1073741823
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 1073741823
      ; GFX10: [[S_LOAD_DWORD_SGPR:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_SGPR [[COPY]], [[S_MOV_B32_]], 0, 0 :: (load 4, addrspace 4)
@@ -1064,7 +1043,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_negative_1
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], -1, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -1134,7 +1112,6 @@ body: |
      ; GFX8: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GFX10-LABEL: name: load_constant_s32_from_4_gep_negative_524288
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], -524288, 0, 0 :: (load 4, addrspace 4)
      ; GFX10: $sgpr0 = COPY [[S_LOAD_DWORD_IMM]]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-flat.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-flat.mir

index d45ef60..8318f0b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-flat.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-flat.mir
@@ -33,7 +33,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_flat_s32_from_4
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORD:%[0-9]+]]:vgpr_32 = FLAT_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 4)
      ; GFX10: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
@@ -71,7 +70,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_USHORT]]
      ; GFX10-LABEL: name: load_flat_s32_from_2
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_USHORT:%[0-9]+]]:vgpr_32 = FLAT_LOAD_USHORT [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 2)
      ; GFX10: $vgpr0 = COPY [[FLAT_LOAD_USHORT]]
@@ -109,7 +107,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_UBYTE:%[0-9]+]]:vgpr_32 = FLAT_LOAD_UBYTE [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 1)
      ; GFX10: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
@@ -143,7 +140,6 @@ body: |
      ; GFX9: [[FLAT_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = FLAT_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 8)
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_flat_v2s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = FLAT_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 8)
      ; GFX10: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
@@ -181,7 +177,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2 = COPY [[FLAT_LOAD_DWORDX3_]]
      ; GFX10-LABEL: name: load_flat_v3s32
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX3_:%[0-9]+]]:vreg_96 = FLAT_LOAD_DWORDX3 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 12, align 4)
      ; GFX10: $vgpr0_vgpr1_vgpr2 = COPY [[FLAT_LOAD_DWORDX3_]]
@@ -219,7 +214,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_flat_v4s32
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = FLAT_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 16, align 4)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
@@ -257,7 +251,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_flat_s64
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = FLAT_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 8)
      ; GFX10: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
@@ -295,7 +288,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_flat_v2s64
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = FLAT_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 16, align 4)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
@@ -407,7 +399,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_flat_s128
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = FLAT_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 16, align 4)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[FLAT_LOAD_DWORDX4_]]
@@ -445,7 +436,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_flat_p3_from_4
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORD:%[0-9]+]]:vgpr_32 = FLAT_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 4)
      ; GFX10: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
@@ -483,7 +473,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_flat_p1_from_8
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = FLAT_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 8)
      ; GFX10: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
@@ -591,7 +580,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_flat_v2s16
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORD:%[0-9]+]]:vgpr_32 = FLAT_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 4)
      ; GFX10: $vgpr0 = COPY [[FLAT_LOAD_DWORD]]
@@ -629,7 +617,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_flat_v4s16
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[FLAT_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = FLAT_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (load 8)
      ; GFX10: $vgpr0_vgpr1 = COPY [[FLAT_LOAD_DWORDX2_]]
@@ -765,7 +752,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_2047
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2047, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -835,7 +821,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_2048
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -915,7 +900,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m2047
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294965249, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -995,7 +979,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m2048
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294965248, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1065,7 +1048,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_4095
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1145,7 +1127,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_4096
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4096, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1225,7 +1206,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m4095
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294963201, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1305,7 +1285,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m4096
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294963200, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1385,7 +1364,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_8191
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 8191, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1465,7 +1443,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_8192
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 8192, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1545,7 +1522,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m8191
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294959105, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1625,7 +1601,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[FLAT_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_flat_s32_from_1_gep_m8192
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294959104, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global-saddr.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global-saddr.mir

index 4623a7f..ce3272e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global-saddr.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global-saddr.mir
@@ -20,7 +20,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[V_MOV_B32_e32_]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -52,7 +51,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_zext_vgpr
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -87,7 +85,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_merge_zext_vgpr
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -132,7 +129,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_merge_not_0_vgpr
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY [[COPY]]
@@ -177,7 +173,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_zext_vgpr_offset4095
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY [[COPY]]
@@ -234,7 +229,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_zext_vgpr_offset_neg4096
      ; GFX10: liveins: $sgpr0_sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vreg_64 = COPY [[COPY]]
@@ -289,7 +283,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_4096
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4096, implicit $exec
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[V_MOV_B32_e32_]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -321,7 +314,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_4097
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4096, implicit $exec
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[V_MOV_B32_e32_]], 1, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -363,7 +355,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_neg4097
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 4294963199
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -405,7 +396,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_2049
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[V_MOV_B32_e32_]], 1, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -437,7 +427,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_neg2049
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 4294965247
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -478,7 +467,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD_SADDR]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_4294967295
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294965248, implicit $exec
      ; GFX10: [[GLOBAL_LOAD_DWORD_SADDR:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD_SADDR [[COPY]], [[V_MOV_B32_e32_]], 2047, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -519,7 +507,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_4294967296
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 1
@@ -571,7 +558,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_4294971390
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 4094
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 1
@@ -623,7 +609,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_neg4294967295
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 1
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -674,7 +659,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_sgpr_base_offset_neg4294967296
      ; GFX10: liveins: $sgpr0_sgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
      ; GFX10: [[S_MOV_B32_1:%[0-9]+]]:sreg_32 = S_MOV_B32 -1
@@ -712,7 +696,6 @@ body: |
      ; GFX9: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_copy_undef_sgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[DEF:%[0-9]+]]:sreg_64 = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY [[DEF]]
      ; GFX10: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
@@ -737,7 +720,6 @@ body: |
      ; GFX9: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[DEF]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_undef_vgpr
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[DEF:%[0-9]+]]:vreg_64 = IMPLICIT_DEF
      ; GFX10: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[DEF]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.mir

index a9c0560..79b9e53 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.mir
@@ -56,7 +56,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_s32_from_4
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
@@ -114,7 +113,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_USHORT]]
      ; GFX10-LABEL: name: load_global_s32_from_2
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_USHORT:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_USHORT [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 2, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_USHORT]]
@@ -172,7 +170,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_UBYTE:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_UBYTE [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 1, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
@@ -230,7 +227,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_global_v2s32
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = GLOBAL_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 8, addrspace 1)
      ; GFX10: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
@@ -288,7 +284,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_global_v4s32
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = GLOBAL_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 16, align 4, addrspace 1)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
@@ -336,7 +331,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_global_s64
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = GLOBAL_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 8, addrspace 1)
      ; GFX10: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
@@ -384,7 +378,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_global_v2s64
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = GLOBAL_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 16, align 4, addrspace 1)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
@@ -479,7 +472,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
      ; GFX10-LABEL: name: load_global_s128
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX4_:%[0-9]+]]:vreg_128 = GLOBAL_LOAD_DWORDX4 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 16, align 4, addrspace 1)
      ; GFX10: $vgpr0_vgpr1_vgpr2_vgpr3 = COPY [[GLOBAL_LOAD_DWORDX4_]]
@@ -527,7 +519,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_p3_from_4
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
@@ -575,7 +566,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_global_p1_from_8
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = GLOBAL_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 8, addrspace 1)
      ; GFX10: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
@@ -717,7 +707,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
      ; GFX10-LABEL: name: load_global_v2s16
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORD:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_DWORD [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 4, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_DWORD]]
@@ -765,7 +754,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
      ; GFX10-LABEL: name: load_global_v4s16
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX2_:%[0-9]+]]:vreg_64 = GLOBAL_LOAD_DWORDX2 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 8, addrspace 1)
      ; GFX10: $vgpr0_vgpr1 = COPY [[GLOBAL_LOAD_DWORDX2_]]
@@ -894,7 +882,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_2047
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_UBYTE:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_UBYTE [[COPY]], 2047, 0, 0, 0, implicit $exec :: (load 1, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
@@ -974,7 +961,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_2048
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2048, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1084,7 +1070,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m2047
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_UBYTE:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_UBYTE [[COPY]], -2047, 0, 0, 0, implicit $exec :: (load 1, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
@@ -1184,7 +1169,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m2048
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_UBYTE:%[0-9]+]]:vgpr_32 = GLOBAL_LOAD_UBYTE [[COPY]], -2048, 0, 0, 0, implicit $exec :: (load 1, addrspace 1)
      ; GFX10: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
@@ -1264,7 +1248,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_4095
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4095, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1366,7 +1349,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_4096
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4096, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1476,7 +1458,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m4095
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294963201, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1586,7 +1567,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m4096
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294963200, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -1688,7 +1668,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_8191
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 8191, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1790,7 +1769,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_8192
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 8192, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -1910,7 +1888,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m8191
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294959105, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
@@ -2030,7 +2007,6 @@ body: |
      ; GFX9: $vgpr0 = COPY [[GLOBAL_LOAD_UBYTE]]
      ; GFX10-LABEL: name: load_global_s32_from_1_gep_m8192
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4294959104, implicit $exec
      ; GFX10: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 -1, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.s96.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.s96.mir

index 2a7363a..75742e4 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.s96.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.s96.mir
@@ -42,7 +42,6 @@ body: |
      ; GFX9: $vgpr0_vgpr1_vgpr2 = COPY [[GLOBAL_LOAD_DWORDX3_]]
      ; GFX10-LABEL: name: load_global_v3s32
      ; GFX10: liveins: $vgpr0_vgpr1
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[GLOBAL_LOAD_DWORDX3_:%[0-9]+]]:vreg_96 = GLOBAL_LOAD_DWORDX3 [[COPY]], 0, 0, 0, 0, implicit $exec :: (load 12, align 4, addrspace 1)
      ; GFX10: $vgpr0_vgpr1_vgpr2 = COPY [[GLOBAL_LOAD_DWORDX3_]]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.mir

index 03e9720..843d780 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.mir
@@ -34,7 +34,6 @@ body: |
      ; GFX9: [[S_LSHR_B32_:%[0-9]+]]:sreg_32 = S_LSHR_B32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_LSHR_B32_]]
      ; GFX10-LABEL: name: lshr_s32_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[S_LSHR_B32_:%[0-9]+]]:sreg_32 = S_LSHR_B32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -74,7 +73,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B32_e64_]]
      ; GFX10-LABEL: name: lshr_s32_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -114,7 +112,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B32_e64_]]
      ; GFX10-LABEL: name: lshr_s32_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -154,7 +151,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B32_e64_]]
      ; GFX10-LABEL: name: lshr_s32_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHRREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -194,7 +190,6 @@ body: |
      ; GFX9: [[S_LSHR_B64_:%[0-9]+]]:sreg_64 = S_LSHR_B64 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_LSHR_B64_]]
      ; GFX10-LABEL: name: lshr_s64_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
      ; GFX10: [[S_LSHR_B64_:%[0-9]+]]:sreg_64 = S_LSHR_B64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -234,7 +229,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B64_]]
      ; GFX10-LABEL: name: lshr_s64_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
@@ -274,7 +268,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B64_]]
      ; GFX10-LABEL: name: lshr_s64_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
@@ -314,7 +307,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B64_]]
      ; GFX10-LABEL: name: lshr_s64_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_LSHRREV_B64_:%[0-9]+]]:vreg_64 = V_LSHRREV_B64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.s16.mir

index fccdfb9..155d86a 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.s16.mir
@@ -75,7 +75,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B16_e64_]]
      ; GFX10-LABEL: name: lshr_s16_s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -142,7 +141,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B16_e64_]]
      ; GFX10-LABEL: name: lshr_s16_s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -175,7 +173,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B16_e64_]]
      ; GFX10-LABEL: name: lshr_s16_s16_vv_zext_to_s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -318,7 +315,6 @@ body: |
      ; GFX9: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHRREV_B16_e64_]]
      ; GFX10-LABEL: name: lshr_s16_s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHRREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHRREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.v2s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.v2s16.mir

index 72b3ab2..b9039dd 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.v2s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.v2s16.mir
@@ -77,7 +77,6 @@ body: |
      ; GFX9: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHRREV_B16_]]
      ; GFX10-LABEL: name: lshr_v2s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -117,7 +116,6 @@ body: |
      ; GFX9: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHRREV_B16_]]
      ; GFX10-LABEL: name: lshr_v2s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -157,7 +155,6 @@ body: |
      ; GFX9: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHRREV_B16_]]
      ; GFX10-LABEL: name: lshr_v2s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_PK_LSHRREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHRREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-or.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-or.mir

index 966bb8c..bf9cda9 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-or.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-or.mir
@@ -24,7 +24,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B64_]]
      ; WAVE32-LABEL: name: or_s1_vcc_vcc_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -60,7 +59,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B32_]]
      ; WAVE32-LABEL: name: or_s1_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_OR_B32_:%[0-9]+]]:sreg_32 = S_OR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -91,7 +89,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B32_]]
      ; WAVE32-LABEL: name: or_s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_OR_B32_:%[0-9]+]]:sreg_32 = S_OR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -122,7 +119,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_OR_B32_e64_]]
      ; WAVE32-LABEL: name: or_s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_OR_B32_e64_:%[0-9]+]]:vgpr_32 = V_OR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -153,7 +149,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B32_]]
      ; WAVE32-LABEL: name: or_s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_OR_B32_:%[0-9]+]]:sreg_32 = S_OR_B32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -182,7 +177,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B64_]]
      ; WAVE32-LABEL: name: or_s64_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_OR_B64_:%[0-9]+]]:sreg_64 = S_OR_B64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -211,7 +205,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B32_]]
      ; WAVE32-LABEL: name: or_v2s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_OR_B32_:%[0-9]+]]:sreg_32 = S_OR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -240,7 +233,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B64_]]
      ; WAVE32-LABEL: name: or_v2s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_OR_B64_:%[0-9]+]]:sreg_64 = S_OR_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -269,7 +261,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B64_]]
      ; WAVE32-LABEL: name: or_v4s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_OR_B64_:%[0-9]+]]:sreg_64 = S_OR_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -298,7 +289,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_OR_B32_e64_]]
      ; WAVE32-LABEL: name: or_s32_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_OR_B32_e64_:%[0-9]+]]:vgpr_32 = V_OR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -327,7 +317,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_OR_B32_e64_]]
      ; WAVE32-LABEL: name: or_v2s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_OR_B32_e64_:%[0-9]+]]:vgpr_32 = V_OR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -390,7 +379,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_OR_B64_]]
      ; WAVE32-LABEL: name: or_s1_vcc_copy_to_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -435,7 +423,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave32
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -482,7 +469,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave64
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-add3.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-add3.mir

index 12e75bb..93cc8b0 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-add3.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-add3.mir
@@ -31,7 +31,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[S_ADD_I32_1]]
      ; GFX10-LABEL: name: add_s32_sgpr_sgpr_sgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $sgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -73,7 +72,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD3_U32_]]
      ; GFX10-LABEL: name: add_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -115,7 +113,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_U32_e64_1]], implicit [[V_ADD_U32_e64_]]
      ; GFX10-LABEL: name: add_s32_vgpr_vgpr_vgpr_multi_use
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -159,7 +156,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_U32_e64_1]]
      ; GFX10-LABEL: name: add_p3_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -203,7 +199,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_U32_e64_1]]
      ; GFX10-LABEL: name: add_p5_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -247,7 +242,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_U32_e64_1]]
      ; GFX10-LABEL: name: add_p3_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -291,7 +285,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_U32_e64_1]]
      ; GFX10-LABEL: name: add_p5_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-and-or.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-and-or.mir

index 0230dd8..9fb6678 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-and-or.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-and-or.mir
@@ -31,7 +31,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[S_OR_B32_]]
      ; GFX10-LABEL: name: and_or_s32_sgpr_sgpr_sgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $sgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -73,7 +72,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_AND_OR_B32_]]
      ; GFX10-LABEL: name: and_or_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -114,7 +112,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_AND_OR_B32_]]
      ; GFX10-LABEL: name: and_or_s32_vgpr_vgpr_vgpr_commute
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -158,7 +155,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_OR_B32_e64_]]
      ; GFX10-LABEL: name: and_or_s32_sgpr_sgpr_vgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-or3.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-or3.mir

index 7e38ec5..830cde9 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-or3.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-or3.mir
@@ -31,7 +31,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[S_OR_B32_1]]
      ; GFX10-LABEL: name: or_s32_sgpr_sgpr_sgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $sgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -73,7 +72,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_OR3_B32_]]
      ; GFX10-LABEL: name: or_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -115,7 +113,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_OR_B32_e64_1]], implicit [[V_OR_B32_e64_]]
      ; GFX10-LABEL: name: or_s32_vgpr_vgpr_vgpr_multi_use
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-xor3.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-xor3.mir

index 248aad8..0159ae5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-xor3.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-xor3.mir
@@ -31,7 +31,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[S_XOR_B32_1]]
      ; GFX10-LABEL: name: xor_s32_sgpr_sgpr_sgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $sgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -74,7 +73,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_XOR_B32_e64_1]]
      ; GFX10-LABEL: name: xor_s32_vgpr_vgpr_vgpr
      ; GFX10: liveins: $vgpr0, $vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -122,7 +120,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; GFX10-LABEL: name: xor_s32_sgpr_sgpr_vgpr_copy
      ; GFX10: liveins: $sgpr0, $sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr0
@@ -170,7 +167,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; GFX10-LABEL: name: xor_s32_sgpr_sgpr_vgpr_copy_commute
      ; GFX10: liveins: $sgpr0, $sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr0
@@ -216,7 +212,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; GFX10-LABEL: name: xor_s32_sgpr_sgpr_vgpr
      ; GFX10: liveins: $sgpr0, $sgpr1, $vgpr0
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ptr-add.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ptr-add.mir

index 98fdcac..25af0e2 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ptr-add.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ptr-add.mir
@@ -58,7 +58,6 @@ body: |
      ; GFX10-WAVE64: [[REG_SEQUENCE:%[0-9]+]]:sreg_64_xexec = REG_SEQUENCE [[S_ADD_U32_]], %subreg.sub0, [[S_ADDC_U32_]], %subreg.sub1
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]]
      ; GFX10-WAVE32-LABEL: name: gep_p0_sgpr_sgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; GFX10-WAVE32: [[COPY2:%[0-9]+]]:sreg_32 = COPY [[COPY]].sub0
@@ -129,7 +128,6 @@ body: |
      ; GFX10-WAVE64: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_ADD_CO_U32_e64_]], %subreg.sub0, %8, %subreg.sub1
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]]
      ; GFX10-WAVE32-LABEL: name: gep_p0_vgpr_vgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10-WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY [[COPY]].sub0
@@ -200,7 +198,6 @@ body: |
      ; GFX10-WAVE64: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_ADD_CO_U32_e64_]], %subreg.sub0, %8, %subreg.sub1
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]]
      ; GFX10-WAVE32-LABEL: name: gep_p0_sgpr_vgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10-WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY [[COPY]].sub0
@@ -247,7 +244,6 @@ body: |
      ; GFX10-WAVE64: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[S_ADD_U32_]]
      ; GFX10-WAVE32-LABEL: name: gep_p3_sgpr_sgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10-WAVE32: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -288,7 +284,6 @@ body: |
      ; GFX10-WAVE64: [[V_ADD_U32_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[V_ADD_U32_e64_]]
      ; GFX10-WAVE32-LABEL: name: gep_p3_vgpr_vgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10-WAVE32: [[V_ADD_U32_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -329,7 +324,6 @@ body: |
      ; GFX10-WAVE64: [[V_ADD_U32_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[V_ADD_U32_e64_]]
      ; GFX10-WAVE32-LABEL: name: gep_p3_sgpr_vgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10-WAVE32: [[V_ADD_U32_e64_:%[0-9]+]]:vgpr_32 = V_ADD_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -370,7 +364,6 @@ body: |
      ; GFX10-WAVE64: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[S_ADD_U32_]]
      ; GFX10-WAVE32-LABEL: name: gep_p6_sgpr_sgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10-WAVE32: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -411,7 +404,6 @@ body: |
      ; GFX10-WAVE64: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[S_ADD_U32_]]
      ; GFX10-WAVE32-LABEL: name: gep_p2_sgpr_sgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10-WAVE32: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -476,7 +468,6 @@ body: |
      ; GFX10-WAVE64: [[REG_SEQUENCE:%[0-9]+]]:sreg_64_xexec = REG_SEQUENCE [[S_ADD_U32_]], %subreg.sub0, [[S_ADDC_U32_]], %subreg.sub1
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]]
      ; GFX10-WAVE32-LABEL: name: gep_p999_sgpr_sgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; GFX10-WAVE32: [[COPY2:%[0-9]+]]:sreg_32 = COPY [[COPY]].sub0
@@ -547,7 +538,6 @@ body: |
      ; GFX10-WAVE64: [[REG_SEQUENCE:%[0-9]+]]:vreg_64 = REG_SEQUENCE [[V_ADD_CO_U32_e64_]], %subreg.sub0, %8, %subreg.sub1
      ; GFX10-WAVE64: S_ENDPGM 0, implicit [[REG_SEQUENCE]]
      ; GFX10-WAVE32-LABEL: name: gep_p999_vgpr_vgpr
-    ; GFX10-WAVE32: $vcc_hi = IMPLICIT_DEF
      ; GFX10-WAVE32: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10-WAVE32: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10-WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY [[COPY]].sub0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.mir

index 825341e..217f210 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.mir
@@ -34,7 +34,6 @@ body: |
      ; GFX9: [[S_LSHL_B32_:%[0-9]+]]:sreg_32 = S_LSHL_B32 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_LSHL_B32_]]
      ; GFX10-LABEL: name: shl_s32_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[S_LSHL_B32_:%[0-9]+]]:sreg_32 = S_LSHL_B32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -74,7 +73,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B32_e64_]]
      ; GFX10-LABEL: name: shl_s32_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -114,7 +112,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B32_e64_]]
      ; GFX10-LABEL: name: shl_s32_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -154,7 +151,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B32_e64_]]
      ; GFX10-LABEL: name: shl_s32_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHLREV_B32_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B32_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -194,7 +190,6 @@ body: |
      ; GFX9: [[S_LSHL_B64_:%[0-9]+]]:sreg_64 = S_LSHL_B64 [[COPY]], [[COPY1]], implicit-def $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_LSHL_B64_]]
      ; GFX10-LABEL: name: shl_s64_ss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
      ; GFX10: [[S_LSHL_B64_:%[0-9]+]]:sreg_64 = S_LSHL_B64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -234,7 +229,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B64_]]
      ; GFX10-LABEL: name: shl_s64_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
@@ -274,7 +268,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B64_]]
      ; GFX10-LABEL: name: shl_s64_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
@@ -314,7 +307,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B64_]]
      ; GFX10-LABEL: name: shl_s64_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_LSHLREV_B64_:%[0-9]+]]:vreg_64 = V_LSHLREV_B64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.s16.mir

index b483c0a..b2d1111 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.s16.mir
@@ -75,7 +75,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B16_e64_]]
      ; GFX10-LABEL: name: shl_s16_s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -142,7 +141,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B16_e64_]]
      ; GFX10-LABEL: name: shl_s16_s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -175,7 +173,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B16_e64_]]
      ; GFX10-LABEL: name: shl_s16_s16_vv_zext_to_s32
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
@@ -318,7 +315,6 @@ body: |
      ; GFX9: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_LSHLREV_B16_e64_]]
      ; GFX10-LABEL: name: shl_s16_s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_LSHLREV_B16_e64_:%[0-9]+]]:vgpr_32 = V_LSHLREV_B16_e64 [[COPY1]], [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.v2s16.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.v2s16.mir

index ef30789..0310c28 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.v2s16.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.v2s16.mir
@@ -77,7 +77,6 @@ body: |
      ; GFX9: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHLREV_B16_]]
      ; GFX10-LABEL: name: shl_v2s16_sv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -117,7 +116,6 @@ body: |
      ; GFX9: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHLREV_B16_]]
      ; GFX10-LABEL: name: shl_v2s16_vs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
@@ -157,7 +155,6 @@ body: |
      ; GFX9: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_PK_LSHLREV_B16_]]
      ; GFX10-LABEL: name: shl_v2s16_vv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_PK_LSHLREV_B16_:%[0-9]+]]:vgpr_32 = V_PK_LSHLREV_B16 8, [[COPY1]], 8, [[COPY]], 0, 0, 0, 0, 0, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sitofp.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sitofp.mir

index 6d6a70e..2af468e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sitofp.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sitofp.mir
@@ -21,7 +21,6 @@ body: |
      ; WAVE64: FLAT_STORE_DWORD [[COPY2]], [[V_CVT_F32_I32_e64_]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE64: FLAT_STORE_DWORD [[COPY2]], [[V_CVT_F32_I32_e64_1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4, addrspace 1)
      ; WAVE32-LABEL: name: sitofp
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
@@ -63,7 +62,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY %1
      ; WAVE32-LABEL: name: sitofp_s32_to_s16_vv
      ; WAVE32: liveins: $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CVT_F32_I32_e32_:%[0-9]+]]:vgpr_32 = V_CVT_F32_I32_e32 [[COPY]], implicit $mode, implicit $exec
      ; WAVE32: %1:vgpr_32 = nofpexcept V_CVT_F16_F32_e32 [[V_CVT_F32_I32_e32_]], implicit $mode, implicit $exec
@@ -92,7 +90,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY %1
      ; WAVE32-LABEL: name: sitofp_s32_to_s16_vs
      ; WAVE32: liveins: $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CVT_F32_I32_e32_:%[0-9]+]]:vgpr_32 = V_CVT_F32_I32_e32 [[COPY]], implicit $mode, implicit $exec
      ; WAVE32: %1:vgpr_32 = nofpexcept V_CVT_F16_F32_e32 [[V_CVT_F32_I32_e32_]], implicit $mode, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-flat.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-flat.mir

index 38b60d6..164cc8e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-flat.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-flat.mir
@@ -32,7 +32,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
      ; GFX10-LABEL: name: store_flat_s32_to_4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
@@ -69,7 +68,6 @@ body: |
      ; GFX9: FLAT_STORE_SHORT [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 2)
      ; GFX10-LABEL: name: store_flat_s32_to_2
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_SHORT [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 2)
@@ -106,7 +104,6 @@ body: |
      ; GFX9: FLAT_STORE_BYTE [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 1)
      ; GFX10-LABEL: name: store_flat_s32_to_1
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_BYTE [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 1)
@@ -144,7 +141,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
      ; GFX10-LABEL: name: store_flat_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
@@ -217,7 +213,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
      ; GFX10-LABEL: name: store_flat_s128
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
@@ -255,7 +250,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
      ; GFX10-LABEL: name: store_flat_v2s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
@@ -292,7 +286,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX3 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 12, align 16)
      ; GFX10-LABEL: name: store_flat_v3s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_96 = COPY $vgpr2_vgpr3_vgpr4
      ; GFX10: FLAT_STORE_DWORDX3 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 12, align 16)
@@ -329,7 +322,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
      ; GFX10-LABEL: name: store_flat_v4s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
@@ -367,7 +359,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
      ; GFX10-LABEL: name: store_flat_v2s16
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
@@ -405,7 +396,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
      ; GFX10-LABEL: name: store_flat_v4s16
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
@@ -516,7 +506,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
      ; GFX10-LABEL: name: store_flat_v2s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: FLAT_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 16)
@@ -554,7 +543,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
      ; GFX10-LABEL: name: store_flat_p1
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 8)
@@ -629,7 +617,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
      ; GFX10-LABEL: name: store_flat_p3
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
@@ -703,7 +690,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store monotonic 4)
      ; GFX10-LABEL: name: store_atomic_flat_s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store monotonic 4)
@@ -741,7 +727,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store monotonic 8)
      ; GFX10-LABEL: name: store_atomic_flat_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: FLAT_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store monotonic 8)
@@ -799,7 +784,6 @@ body: |
      ; GFX9: FLAT_STORE_DWORD [[COPY]], [[COPY1]], 2047, 0, 0, 0, implicit $exec, implicit $flat_scr :: (store 4)
      ; GFX10-LABEL: name: store_flat_s32_gep_2047
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2047, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.mir

index 8713d92..8e231e8 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.mir
@@ -54,7 +54,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
      ; GFX10-LABEL: name: store_global_s32_to_4
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
@@ -111,7 +110,6 @@ body: |
      ; GFX9: GLOBAL_STORE_SHORT [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 2, addrspace 1)
      ; GFX10-LABEL: name: store_global_s32_to_2
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_SHORT [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 2, addrspace 1)
@@ -168,7 +166,6 @@ body: |
      ; GFX9: GLOBAL_STORE_BYTE [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 1, addrspace 1)
      ; GFX10-LABEL: name: store_global_s32_to_1
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_BYTE [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 1, addrspace 1)
@@ -216,7 +213,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
      ; GFX10-LABEL: name: store_global_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
@@ -263,7 +259,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
      ; GFX10-LABEL: name: store_global_s128
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
@@ -321,7 +316,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
      ; GFX10-LABEL: name: store_global_v2s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
@@ -378,7 +372,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
      ; GFX10-LABEL: name: store_global_v4s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
@@ -426,7 +419,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
      ; GFX10-LABEL: name: store_global_v2s16
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
@@ -474,7 +466,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
      ; GFX10-LABEL: name: store_global_v4s16
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
@@ -569,7 +560,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
      ; GFX10-LABEL: name: store_global_v2s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4_vgpr5
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_128 = COPY $vgpr2_vgpr3_vgpr4_vgpr5
      ; GFX10: GLOBAL_STORE_DWORDX4 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 16, addrspace 1)
@@ -617,7 +607,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
      ; GFX10-LABEL: name: store_global_p1
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 8, addrspace 1)
@@ -712,7 +701,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
      ; GFX10-LABEL: name: store_global_p3
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
@@ -806,7 +794,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store monotonic 4, addrspace 1)
      ; GFX10-LABEL: name: store_atomic_global_s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store monotonic 4, addrspace 1)
@@ -854,7 +841,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store monotonic 8, addrspace 1)
      ; GFX10-LABEL: name: store_atomic_global_s64
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr2_vgpr3
      ; GFX10: GLOBAL_STORE_DWORDX2 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store monotonic 8, addrspace 1)
@@ -932,7 +918,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 2047, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
      ; GFX10-LABEL: name: store_global_s32_gep_2047
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr2
      ; GFX10: GLOBAL_STORE_DWORD [[COPY]], [[COPY1]], 2047, 0, 0, 0, implicit $exec :: (store 4, addrspace 1)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.s96.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.s96.mir

index 4e4bfc2..3f00d0a 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.s96.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.s96.mir
@@ -44,7 +44,6 @@ body: |
      ; GFX9: GLOBAL_STORE_DWORDX3 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 12, align 16, addrspace 1)
      ; GFX10-LABEL: name: store_global_v3s32
      ; GFX10: liveins: $vgpr0_vgpr1, $vgpr2_vgpr3_vgpr4
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vreg_64 = COPY $vgpr0_vgpr1
      ; GFX10: [[COPY1:%[0-9]+]]:vreg_96 = COPY $vgpr2_vgpr3_vgpr4
      ; GFX10: GLOBAL_STORE_DWORDX3 [[COPY]], [[COPY1]], 0, 0, 0, 0, implicit $exec :: (store 12, align 16, addrspace 1)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sub.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sub.mir

index 5a1d8b8..d4fa6d5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sub.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sub.mir
@@ -37,7 +37,6 @@ body: |
      ; GFX9: S_ENDPGM 0, implicit [[V_SUB_U32_e64_2]]
      ; GFX10-LABEL: name: sub_s32
      ; GFX10: liveins: $sgpr0, $sgpr1, $vgpr0, $vgpr3_vgpr4
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.gfx10.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.gfx10.mir

index e592a5e..759366b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.gfx10.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.gfx10.mir
@@ -13,7 +13,6 @@ body: |
      liveins: $sgpr0, $vgpr0
  
      ; GFX10-LABEL: name: uadde_s32_s1_vsv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -46,7 +45,6 @@ body: |
      liveins: $sgpr0, $vgpr0
  
      ; GFX10-LABEL: name: uadde_s32_s1_vvs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.mir

index 42dcca0..3361c59 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.mir
@@ -27,7 +27,6 @@ body: |
      ; WAVE64: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
      ; WAVE64: S_ENDPGM 0, implicit [[S_ADDC_U32_]], implicit [[S_CSELECT_B32_]]
      ; WAVE32-LABEL: name: uadde_s32_s1_sss
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -69,7 +68,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_ADDC_U32_e64_1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_ADDC_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; WAVE32-LABEL: name: uadde_s32_s1_vvv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uaddo.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uaddo.mir

index 8c774a5..226d0a4 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uaddo.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uaddo.mir
@@ -38,7 +38,6 @@ body: |
      ; GFX9: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_ADD_U32_]], implicit [[S_CSELECT_B32_]]
      ; GFX10-LABEL: name: uaddo_s32_s1_sss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[S_ADD_U32_:%[0-9]+]]:sreg_32 = S_ADD_U32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -81,7 +80,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_ADD_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: uaddo_s32_s1_vvv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_ADD_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADD_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_ADD_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -128,7 +126,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[V_MOV_B32_e32_1]], 0, [[V_MOV_B32_e32_]], [[V_ADD_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: uaddo_s32_s1_vsv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_ADD_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADD_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_ADD_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -179,7 +176,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[V_MOV_B32_e32_1]], 0, [[V_MOV_B32_e32_]], [[V_ADD_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_ADD_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: uaddo_s32_s1_vvs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_ADD_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADD_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_ADD_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uitofp.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uitofp.mir

index 0714fe3..41fc438 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uitofp.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uitofp.mir
@@ -19,7 +19,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY [[V_CVT_F32_U32_e64_]]
      ; WAVE32-LABEL: name: uitofp_s32_to_s32_vv
      ; WAVE32: liveins: $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CVT_F32_U32_e64_:%[0-9]+]]:vgpr_32 = V_CVT_F32_U32_e64 [[COPY]], 0, 0, implicit $mode, implicit $exec
      ; WAVE32: $vgpr0 = COPY [[V_CVT_F32_U32_e64_]]
@@ -45,7 +44,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY [[V_CVT_F32_U32_e64_]]
      ; WAVE32-LABEL: name: uitofp_s32_to_s32_vs
      ; WAVE32: liveins: $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CVT_F32_U32_e64_:%[0-9]+]]:vgpr_32 = V_CVT_F32_U32_e64 [[COPY]], 0, 0, implicit $mode, implicit $exec
      ; WAVE32: $vgpr0 = COPY [[V_CVT_F32_U32_e64_]]
@@ -72,7 +70,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY %1
      ; WAVE32-LABEL: name: uitofp_s32_to_s16_vv
      ; WAVE32: liveins: $vgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[V_CVT_F32_U32_e32_:%[0-9]+]]:vgpr_32 = V_CVT_F32_U32_e32 [[COPY]], implicit $mode, implicit $exec
      ; WAVE32: %1:vgpr_32 = nofpexcept V_CVT_F16_F32_e32 [[V_CVT_F32_U32_e32_]], implicit $mode, implicit $exec
@@ -101,7 +98,6 @@ body: |
      ; WAVE64: $vgpr0 = COPY %1
      ; WAVE32-LABEL: name: uitofp_s32_to_s16_vs
      ; WAVE32: liveins: $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_CVT_F32_U32_e32_:%[0-9]+]]:vgpr_32 = V_CVT_F32_U32_e32 [[COPY]], implicit $mode, implicit $exec
      ; WAVE32: %1:vgpr_32 = nofpexcept V_CVT_F16_F32_e32 [[V_CVT_F32_U32_e32_]], implicit $mode, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.gfx10.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.gfx10.mir

index f3a700b..f4d0e84 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.gfx10.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.gfx10.mir
@@ -13,7 +13,6 @@ body: |
      liveins: $sgpr0, $vgpr0
  
      ; GFX10-LABEL: name: usube_s32_s1_vsv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -46,7 +45,6 @@ body: |
      liveins: $sgpr0, $vgpr0
  
      ; GFX10-LABEL: name: usube_s32_s1_vvs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.mir

index cd375ba..b9e7ff9 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.mir
@@ -27,7 +27,6 @@ body: |
      ; WAVE64: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
      ; WAVE64: S_ENDPGM 0, implicit [[S_SUBB_U32_]], implicit [[S_CSELECT_B32_]]
      ; WAVE32-LABEL: name: usube_s32_s1_sss
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -69,7 +68,6 @@ body: |
      ; WAVE64: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_SUBB_U32_e64_1]], implicit $exec
      ; WAVE64: S_ENDPGM 0, implicit [[V_SUBB_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; WAVE32-LABEL: name: usube_s32_s1_vvv
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usubo.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usubo.mir

index 6112845..87b131c 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usubo.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usubo.mir
@@ -38,7 +38,6 @@ body: |
      ; GFX9: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
      ; GFX9: S_ENDPGM 0, implicit [[S_SUB_U32_]], implicit [[S_CSELECT_B32_]]
      ; GFX10-LABEL: name: usubo_s32_s1_sss
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; GFX10: [[S_SUB_U32_:%[0-9]+]]:sreg_32 = S_SUB_U32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -81,7 +80,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_SUB_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_SUB_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: usubo_s32_s1_vvv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; GFX10: [[V_SUB_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_SUB_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_SUB_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -128,7 +126,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[V_MOV_B32_e32_1]], 0, [[V_MOV_B32_e32_]], [[V_SUB_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_SUB_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: usubo_s32_s1_vsv
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[V_SUB_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_SUB_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_SUB_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
@@ -179,7 +176,6 @@ body: |
      ; GFX9: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[V_MOV_B32_e32_1]], 0, [[V_MOV_B32_e32_]], [[V_SUB_CO_U32_e64_1]], implicit $exec
      ; GFX9: S_ENDPGM 0, implicit [[V_SUB_CO_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
      ; GFX10-LABEL: name: usubo_s32_s1_vvs
-    ; GFX10: $vcc_hi = IMPLICIT_DEF
      ; GFX10: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; GFX10: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; GFX10: [[V_SUB_CO_U32_e64_:%[0-9]+]]:vgpr_32, [[V_SUB_CO_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_SUB_CO_U32_e64 [[COPY]], [[COPY1]], 0, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-xor.mir b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-xor.mir

index 0364cb7..3f5964f 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-xor.mir
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-xor.mir
@@ -24,7 +24,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B64_]]
      ; WAVE32-LABEL: name: xor_s1_vcc_vcc_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
@@ -61,7 +60,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B32_]]
      ; WAVE32-LABEL: name: xor_s1_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_XOR_B32_:%[0-9]+]]:sreg_32 = S_XOR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -92,7 +90,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B32_]]
      ; WAVE32-LABEL: name: xor_s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_XOR_B32_:%[0-9]+]]:sreg_32 = S_XOR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -123,7 +120,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; WAVE32-LABEL: name: xor_s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_XOR_B32_e64_:%[0-9]+]]:vgpr_32 = V_XOR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -154,7 +150,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B32_]]
      ; WAVE32-LABEL: name: xor_s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_XOR_B32_:%[0-9]+]]:sreg_32 = S_XOR_B32 [[COPY]], [[COPY1]], implicit-def $scc
@@ -183,7 +178,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B64_]]
      ; WAVE32-LABEL: name: xor_s64_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_XOR_B64_:%[0-9]+]]:sreg_64 = S_XOR_B64 [[COPY]], [[COPY1]], implicit-def $scc
@@ -212,7 +206,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B32_]]
      ; WAVE32-LABEL: name: xor_v2s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0, $sgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
      ; WAVE32: [[S_XOR_B32_:%[0-9]+]]:sreg_32 = S_XOR_B32 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -241,7 +234,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B64_]]
      ; WAVE32-LABEL: name: xor_v2s32_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_XOR_B64_:%[0-9]+]]:sreg_64 = S_XOR_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -270,7 +262,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B64_]]
      ; WAVE32-LABEL: name: xor_v4s16_sgpr_sgpr_sgpr
      ; WAVE32: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:sreg_64 = COPY $sgpr0_sgpr1
      ; WAVE32: [[COPY1:%[0-9]+]]:sreg_64 = COPY $sgpr2_sgpr3
      ; WAVE32: [[S_XOR_B64_:%[0-9]+]]:sreg_64 = S_XOR_B64 [[COPY]], [[COPY1]], implicit-def dead $scc
@@ -299,7 +290,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; WAVE32-LABEL: name: xor_s32_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_XOR_B32_e64_:%[0-9]+]]:vgpr_32 = V_XOR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -328,7 +318,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[V_XOR_B32_e64_]]
      ; WAVE32-LABEL: name: xor_v2s16_vgpr_vgpr_vgpr
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_XOR_B32_e64_:%[0-9]+]]:vgpr_32 = V_XOR_B32_e64 [[COPY]], [[COPY1]], implicit $exec
@@ -391,7 +380,6 @@ body: |
      ; WAVE64: S_ENDPGM 0, implicit [[S_XOR_B64_]]
      ; WAVE32-LABEL: name: xor_s1_vcc_copy_to_vcc
      ; WAVE32: liveins: $vgpr0, $vgpr1
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -436,7 +424,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave32
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
@@ -483,7 +470,6 @@ body:             |
      ; WAVE64: S_ENDPGM 0, implicit [[COPY1]]
      ; WAVE32-LABEL: name: copy_select_constrain_vcc_result_reg_wave64
      ; WAVE32: liveins: $vgpr0, $sgpr0
-    ; WAVE32: $vcc_hi = IMPLICIT_DEF
      ; WAVE32: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
      ; WAVE32: %sgpr0:sreg_32 = COPY $sgpr0
      ; WAVE32: [[V_AND_B32_e32_:%[0-9]+]]:vgpr_32 = V_AND_B32_e32 1, [[COPY]], implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.ballot.i32.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.ballot.i32.ll

index 6627804..ce8c4da 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.ballot.i32.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.ballot.i32.ll
@@ -9,7 +9,6 @@ define amdgpu_cs i32 @constant_false() {
  ; CHECK-LABEL: constant_false:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    s_mov_b32 s0, 0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 0)
    ret i32 %ballot
@@ -21,7 +20,6 @@ define amdgpu_cs i32 @constant_true() {
  ; CHECK-LABEL: constant_true:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    s_mov_b32 s0, exec_lo
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 1)
    ret i32 %ballot
@@ -33,7 +31,6 @@ define amdgpu_cs i32 @non_compare(i32 %x) {
  ; CHECK-LABEL: non_compare:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_and_b32_e32 v0, 1, v0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    v_cmp_ne_u32_e64 s0, 0, v0
  ; CHECK-NEXT:    ; return to shader part epilog
    %trunc = trunc i32 %x to i1
@@ -47,7 +44,6 @@ define amdgpu_cs i32 @compare_ints(i32 %x, i32 %y) {
  ; CHECK-LABEL: compare_ints:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_eq_u32_e64 s0, v0, v1
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = icmp eq i32 %x, %y
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
@@ -58,7 +54,6 @@ define amdgpu_cs i32 @compare_int_with_constant(i32 %x) {
  ; CHECK-LABEL: compare_int_with_constant:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_le_i32_e64 s0, 0x63, v0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = icmp sge i32 %x, 99
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
@@ -69,7 +64,6 @@ define amdgpu_cs i32 @compare_floats(float %x, float %y) {
  ; CHECK-LABEL: compare_floats:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_gt_f32_e64 s0, v0, v1
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = fcmp ogt float %x, %y
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll

index 3cb7545..582274b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll
@@ -28,7 +28,6 @@ define float @v_div_fmas_f32(float %a, float %b, float %c, i1 %d) {
  ; GFX10_W32-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10_W32-NEXT:    v_and_b32_e32 v3, 1, v3
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e32 vcc_lo, 0, v3
  ; GFX10_W32-NEXT:    v_div_fmas_f32 v0, v0, v1, v2
  ; GFX10_W32-NEXT:    s_setpc_b64 s[30:31]
@@ -69,7 +68,6 @@ define double @v_div_fmas_f64(double %a, double %b, double %c, i1 %d) {
  ; GFX10_W32-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10_W32-NEXT:    v_and_b32_e32 v6, 1, v6
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e32 vcc_lo, 0, v6
  ; GFX10_W32-NEXT:    v_div_fmas_f64 v[0:1], v[0:1], v[2:3], v[4:5]
  ; GFX10_W32-NEXT:    s_setpc_b64 s[30:31]
@@ -119,7 +117,6 @@ define amdgpu_ps float @s_div_fmas_f32(float inreg %a, float inreg %b, float inr
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s1
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, s2
  ; GFX10_W32-NEXT:    s_cselect_b32 s3, 1, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_and_b32 s3, 1, s3
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e64 vcc_lo, 0, s3
  ; GFX10_W32-NEXT:    v_div_fmas_f32 v0, s0, v0, v1
@@ -185,7 +182,6 @@ define amdgpu_ps double @s_div_fmas_f64(double inreg %a, double inreg %b, double
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, s3
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v3, s5
  ; GFX10_W32-NEXT:    s_cselect_b32 s6, 1, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_and_b32 s6, 1, s6
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e64 vcc_lo, 0, s6
  ; GFX10_W32-NEXT:    v_div_fmas_f64 v[0:1], s[0:1], v[0:1], v[2:3]
@@ -261,7 +257,6 @@ define amdgpu_kernel void @test_div_fmas_f32(float addrspace(1)* %out, [8 x i32]
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x94
  ; GFX10_W32-NEXT:    s_load_dword s5, s[0:1], 0x4c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_and_b32 s2, 1, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s3
@@ -339,7 +334,6 @@ define amdgpu_kernel void @test_div_fmas_f32_inline_imm_0(float addrspace(1)* %o
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x70
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_and_b32 s2, 1, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s3
@@ -413,7 +407,6 @@ define amdgpu_kernel void @test_div_fmas_f32_inline_imm_1(float addrspace(1)* %o
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x2c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_and_b32 s2, 1, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s3
@@ -487,7 +480,6 @@ define amdgpu_kernel void @test_div_fmas_f32_inline_imm_2(float addrspace(1)* %o
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x4c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_and_b32 s2, 1, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s3
@@ -562,7 +554,6 @@ define amdgpu_kernel void @test_div_fmas_f64(double addrspace(1)* %out, double %
  ; GFX10_W32-NEXT:    s_clause 0x1
  ; GFX10_W32-NEXT:    s_load_dword s8, s[0:1], 0x44
  ; GFX10_W32-NEXT:    s_load_dwordx8 s[0:7], s[0:1], 0x24
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_and_b32 s8, 1, s8
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s4
@@ -640,7 +631,6 @@ define amdgpu_kernel void @test_div_fmas_f32_cond_to_vcc(float addrspace(1)* %ou
  ; GFX10_W32-NEXT:    s_clause 0x1
  ; GFX10_W32-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x2c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_cmp_eq_u32 s7, 0
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s5
@@ -718,7 +708,6 @@ define amdgpu_kernel void @test_div_fmas_f32_imm_false_cond_to_vcc(float addrspa
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x4c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e64 vcc_lo, 0, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, s3
@@ -790,7 +779,6 @@ define amdgpu_kernel void @test_div_fmas_f32_imm_true_cond_to_vcc(float addrspac
  ; GFX10_W32-NEXT:    s_load_dword s4, s[0:1], 0x4c
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e64 vcc_lo, 0, 1
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v0, s2
  ; GFX10_W32-NEXT:    v_mov_b32_e32 v1, s3
@@ -885,7 +873,6 @@ define amdgpu_kernel void @test_div_fmas_f32_logical_cond_to_vcc(float addrspace
  ; GFX10_W32-NEXT:    v_lshlrev_b32_e32 v1, 2, v0
  ; GFX10_W32-NEXT:    s_load_dword s0, s[0:1], 0x54
  ; GFX10_W32-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_clause 0x2
  ; GFX10_W32-NEXT:    global_load_dword v2, v1, s[6:7]
@@ -1017,13 +1004,12 @@ define amdgpu_kernel void @test_div_fmas_f32_i1_phi_vcc(float addrspace(1)* %out
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[2:3], s[0:1], 0x4c
  ; GFX10_W32-NEXT:    v_lshlrev_b32_e32 v1, 2, v0
  ; GFX10_W32-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
-; GFX10_W32-NEXT:    s_mov_b32 s4, 0
-; GFX10_W32-NEXT:    ; implicit-def: $vcc_hi
+; GFX10_W32-NEXT:    s_mov_b32 s5, 0
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    global_load_dwordx3 v[1:3], v1, s[2:3]
  ; GFX10_W32-NEXT:    s_waitcnt_depctr 0xffe3
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[2:3], s[0:1], 0x24
-; GFX10_W32-NEXT:    s_and_saveexec_b32 s5, vcc_lo
+; GFX10_W32-NEXT:    s_and_saveexec_b32 s4, vcc_lo
  ; GFX10_W32-NEXT:    s_cbranch_execz BB13_2
  ; GFX10_W32-NEXT:  ; %bb.1: ; %bb
  ; GFX10_W32-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x74
@@ -1031,10 +1017,10 @@ define amdgpu_kernel void @test_div_fmas_f32_i1_phi_vcc(float addrspace(1)* %out
  ; GFX10_W32-NEXT:    s_load_dword s0, s[0:1], 0x0
  ; GFX10_W32-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10_W32-NEXT:    s_cmp_lg_u32 s0, 0
-; GFX10_W32-NEXT:    s_cselect_b32 s4, 1, 0
+; GFX10_W32-NEXT:    s_cselect_b32 s5, 1, 0
  ; GFX10_W32-NEXT:  BB13_2: ; %exit
-; GFX10_W32-NEXT:    s_or_b32 exec_lo, exec_lo, s5
-; GFX10_W32-NEXT:    s_and_b32 s0, 1, s4
+; GFX10_W32-NEXT:    s_or_b32 exec_lo, exec_lo, s4
+; GFX10_W32-NEXT:    s_and_b32 s0, 1, s5
  ; GFX10_W32-NEXT:    v_cmp_ne_u32_e64 vcc_lo, 0, s0
  ; GFX10_W32-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10_W32-NEXT:    v_div_fmas_f32 v0, v1, v2, v3
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.scale.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.scale.ll

index 9c0cb28..838a6ea 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.scale.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.scale.ll
@@ -47,7 +47,6 @@ define amdgpu_kernel void @test_div_scale_f32_1(float addrspace(1)* %out, float
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
@@ -113,7 +112,6 @@ define amdgpu_kernel void @test_div_scale_f32_2(float addrspace(1)* %out, float
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
@@ -184,7 +182,6 @@ define amdgpu_kernel void @test_div_scale_f64_1(double addrspace(1)* %out, doubl
  ; GFX10-NEXT:    s_load_dwordx2 s[2:3], s[0:1], 0x34
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v2, s[2:3]
@@ -255,7 +252,6 @@ define amdgpu_kernel void @test_div_scale_f64_2(double addrspace(1)* %out, doubl
  ; GFX10-NEXT:    s_load_dwordx2 s[2:3], s[0:1], 0x34
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v2, s[2:3]
@@ -321,7 +317,6 @@ define amdgpu_kernel void @test_div_scale_f32_scalar_num_1(float addrspace(1)* %
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    s_load_dword s0, s[0:1], 0x54
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -382,7 +377,6 @@ define amdgpu_kernel void @test_div_scale_f32_scalar_num_2(float addrspace(1)* %
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    s_load_dword s0, s[0:1], 0x34
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -443,7 +437,6 @@ define amdgpu_kernel void @test_div_scale_f32_scalar_den_1(float addrspace(1)* %
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    s_load_dword s0, s[0:1], 0x34
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -504,7 +497,6 @@ define amdgpu_kernel void @test_div_scale_f32_scalar_den_2(float addrspace(1)* %
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    s_load_dword s0, s[0:1], 0x34
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -565,7 +557,6 @@ define amdgpu_kernel void @test_div_scale_f64_scalar_num_1(double addrspace(1)*
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x54
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -626,7 +617,6 @@ define amdgpu_kernel void @test_div_scale_f64_scalar_num_2(double addrspace(1)*
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x54
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -687,7 +677,6 @@ define amdgpu_kernel void @test_div_scale_f64_scalar_den_1(double addrspace(1)*
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x54
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -748,7 +737,6 @@ define amdgpu_kernel void @test_div_scale_f64_scalar_den_2(double addrspace(1)*
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 3, v0
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x54
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v0, s[6:7]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -800,7 +788,6 @@ define amdgpu_kernel void @test_div_scale_f32_all_scalar_1(float addrspace(1)* %
  ; GFX10-NEXT:    s_load_dword s3, s[0:1], 0x70
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f32 v0, s2, s3, s3, s2
  ; GFX10-NEXT:    global_store_dword v1, v0, s[0:1]
@@ -845,7 +832,6 @@ define amdgpu_kernel void @test_div_scale_f32_all_scalar_2(float addrspace(1)* %
  ; GFX10-NEXT:    s_load_dword s3, s[0:1], 0x70
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f32 v0, s2, s2, s3, s2
  ; GFX10-NEXT:    global_store_dword v1, v0, s[0:1]
@@ -892,7 +878,6 @@ define amdgpu_kernel void @test_div_scale_f64_all_scalar_1(double addrspace(1)*
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x74
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f64 v[0:1], s2, s[4:5], s[4:5], s[2:3]
  ; GFX10-NEXT:    global_store_dwordx2 v2, v[0:1], s[0:1]
@@ -939,7 +924,6 @@ define amdgpu_kernel void @test_div_scale_f64_all_scalar_2(double addrspace(1)*
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x74
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f64 v[0:1], s2, s[2:3], s[4:5], s[2:3]
  ; GFX10-NEXT:    global_store_dwordx2 v2, v[0:1], s[0:1]
@@ -990,7 +974,6 @@ define amdgpu_kernel void @test_div_scale_f32_inline_imm_num(float addrspace(1)*
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1047,7 +1030,6 @@ define amdgpu_kernel void @test_div_scale_f32_inline_imm_den(float addrspace(1)*
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v0, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1111,7 +1093,6 @@ define amdgpu_kernel void @test_div_scale_f32_fabs_num(float addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
@@ -1183,7 +1164,6 @@ define amdgpu_kernel void @test_div_scale_f32_fabs_den(float addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
@@ -1236,7 +1216,6 @@ define amdgpu_kernel void @test_div_scale_f32_val_undef_val(float addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f32 v0, s2, s0, s0, 0x41000000
  ; GFX10-NEXT:    global_store_dword v1, v0, s[0:1]
@@ -1275,7 +1254,6 @@ define amdgpu_kernel void @test_div_scale_f32_undef_val_val(float addrspace(1)*
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x41000000
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f32 v0, s2, v0, v0, s0
  ; GFX10-NEXT:    global_store_dword v1, v0, s[0:1]
@@ -1311,7 +1289,6 @@ define amdgpu_kernel void @test_div_scale_f32_undef_undef_val(float addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_div_scale_f32 v0, s2, s0, s0, s0
  ; GFX10-NEXT:    global_store_dword v1, v0, s[0:1]
@@ -1354,7 +1331,6 @@ define amdgpu_kernel void @test_div_scale_f64_val_undef_val(double addrspace(1)*
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
  ; GFX10-NEXT:    v_div_scale_f64 v[0:1], s2, s[0:1], s[0:1], s[2:3]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_store_dwordx2 v2, v[0:1], s[0:1]
  ; GFX10-NEXT:    s_endpgm
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.end.cf.i32.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.end.cf.i32.ll

index e38df28..ee866d4 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.end.cf.i32.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.end.cf.i32.ll
@@ -7,7 +7,6 @@ define amdgpu_kernel void @test_wave32(i32 %arg0, [8 x i32], i32 %saved) {
  ; GCN-NEXT:    s_clause 0x1
  ; GCN-NEXT:    s_load_dword s1, s[4:5], 0x0
  ; GCN-NEXT:    s_load_dword s0, s[4:5], 0x24
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt lgkmcnt(0)
  ; GCN-NEXT:    s_cmp_lg_u32 s1, 0
  ; GCN-NEXT:    s_cselect_b32 s1, 1, 0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fdot2.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fdot2.ll

index b22f188..449b4ca 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fdot2.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fdot2.ll
@@ -15,7 +15,6 @@ define float @v_fdot2(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call float @llvm.amdgcn.fdot2(<2 x half> %a, <2 x half> %b, float %c, i1 false)
    ret float %r
@@ -33,7 +32,6 @@ define float @v_fdot2_clamp(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call float @llvm.amdgcn.fdot2(<2 x half> %a, <2 x half> %b, float %c, i1 true)
    ret float %r
@@ -51,7 +49,6 @@ define float @v_fdot2_neg_a(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, v2 neg_lo:[1,0,0] neg_hi:[1,0,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
    %r = call float @llvm.amdgcn.fdot2(<2 x half> %neg.a, <2 x half> %b, float %c, i1 false)
@@ -70,7 +67,6 @@ define float @v_fdot2_neg_b(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, v2 neg_lo:[0,1,0] neg_hi:[0,1,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.b = fneg <2 x half> %b
    %r = call float @llvm.amdgcn.fdot2(<2 x half> %a, <2 x half> %neg.b, float %c, i1 false)
@@ -89,7 +85,6 @@ define float @v_fdot2_neg_a_neg_b(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v1, v1, v2 neg_lo:[1,1,0] neg_hi:[1,1,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %b
    %neg.b = fneg <2 x half> %b
@@ -110,7 +105,6 @@ define float @v_fdot2_neg_c(<2 x half> %a, <2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v2, 0x80000000, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg float %c
@@ -132,7 +126,6 @@ define float @v_fdot2_inline_literal_a(<2 x half> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_movk_i32 s4, 0x4000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s4, s4, s4
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, s4, v0, v1
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -154,7 +147,6 @@ define float @v_fdot2_inline_literal_b(<2 x half> %a, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_movk_i32 s4, 0x4000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s4, s4, s4
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, s4, v1
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -174,7 +166,6 @@ define float @v_fdot2_inline_literal_c(<2 x half> %a, <2 x half> %b) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_f32_f16 v0, v0, v1, 1.0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %ret = tail call float @llvm.amdgcn.fdot2(<2 x half> %a, <2 x half> %b, float 1.0, i1 false)
    ret float %ret
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fmul.legacy.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fmul.legacy.ll

index 9b6370d..8f672ec 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fmul.legacy.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fmul.legacy.ll
@@ -29,7 +29,6 @@ define float @v_mul_legacy_f32(float %a, float %b) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, v0, v1
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_f32:
@@ -37,7 +36,6 @@ define float @v_mul_legacy_f32(float %a, float %b) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, v0, v1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
    ret float %result
@@ -67,7 +65,6 @@ define float @v_mul_legacy_undef0_f32(float %a) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, s4, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_undef0_f32:
@@ -75,7 +72,6 @@ define float @v_mul_legacy_undef0_f32(float %a) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, s4, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float undef, float %a)
    ret float %result
@@ -105,7 +101,6 @@ define float @v_mul_legacy_undef1_f32(float %a) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, s4, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_undef1_f32:
@@ -113,7 +108,6 @@ define float @v_mul_legacy_undef1_f32(float %a) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, s4, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float %a, float undef)
    ret float %result
@@ -143,7 +137,6 @@ define float @v_mul_legacy_undef_f32() {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e64 v0, s4, s4
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_undef_f32:
@@ -151,7 +144,6 @@ define float @v_mul_legacy_undef_f32() {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e64 v0, s4, s4
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float undef, float undef)
    ret float %result
@@ -181,7 +173,6 @@ define float @v_mul_legacy_fabs_f32(float %a, float %b) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e64 v0, |v0|, |v1|
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_fabs_f32:
@@ -189,7 +180,6 @@ define float @v_mul_legacy_fabs_f32(float %a, float %b) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e64 v0, |v0|, |v1|
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %a.fabs = call float @llvm.fabs.f32(float %a)
    %b.fabs = call float @llvm.fabs.f32(float %b)
@@ -221,7 +211,6 @@ define float @v_mul_legacy_fneg_f32(float %a, float %b) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e64 v0, -v0, -v1
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_fneg_f32:
@@ -229,7 +218,6 @@ define float @v_mul_legacy_fneg_f32(float %a, float %b) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e64 v0, -v0, -v1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %a.fneg = fneg float %a
    %b.fneg = fneg float %b
@@ -265,7 +253,6 @@ define float @v_add_mul_legacy_f32(float %a, float %b, float %c) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, v0, v1
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    v_add_f32_e32 v0, v0, v2
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
@@ -274,7 +261,6 @@ define float @v_add_mul_legacy_f32(float %a, float %b, float %c) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, v0, v1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    v_add_f32_e32 v0, v0, v2
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
@@ -307,7 +293,6 @@ define float @v_mad_legacy_f32(float %a, float %b, float %c) #2 {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mac_legacy_f32_e64 v2, v0, v1
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    v_mov_b32_e32 v0, v2
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
@@ -316,7 +301,6 @@ define float @v_mad_legacy_f32(float %a, float %b, float %c) #2 {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, v0, v1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    v_add_f32_e32 v0, v0, v2
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %mul = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
@@ -348,7 +332,6 @@ define float @v_mad_legacy_fneg_f32(float %a, float %b, float %c) #2 {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mad_legacy_f32 v0, -v0, -v1, v2
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mad_legacy_fneg_f32:
@@ -356,7 +339,6 @@ define float @v_mad_legacy_fneg_f32(float %a, float %b, float %c) #2 {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e64 v0, -v0, -v1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    v_add_f32_e32 v0, v0, v2
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %a.fneg = fneg float %a
@@ -388,13 +370,11 @@ define amdgpu_ps float @s_mul_legacy_f32(float inreg %a, float inreg %b) {
  ; GFX101-LABEL: s_mul_legacy_f32:
  ; GFX101:       ; %bb.0:
  ; GFX101-NEXT:    v_mul_legacy_f32_e64 v0, s0, s1
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    ; return to shader part epilog
  ;
  ; GFX103-LABEL: s_mul_legacy_f32:
  ; GFX103:       ; %bb.0:
  ; GFX103-NEXT:    v_mul_legacy_f32_e64 v0, s0, s1
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    ; return to shader part epilog
    %result = call float @llvm.amdgcn.fmul.legacy(float %a, float %b)
    ret float %result
@@ -424,7 +404,6 @@ define float @v_mul_legacy_f32_1.0(float %a) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, 1.0, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_f32_1.0:
@@ -432,7 +411,6 @@ define float @v_mul_legacy_f32_1.0(float %a) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, 1.0, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float %a, float 1.0)
    ret float %result
@@ -462,7 +440,6 @@ define float @v_mul_legacy_f32_1.0_swap(float %b) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, 1.0, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_f32_1.0_swap:
@@ -470,7 +447,6 @@ define float @v_mul_legacy_f32_1.0_swap(float %b) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, 1.0, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float 1.0, float %b)
    ret float %result
@@ -500,7 +476,6 @@ define float @v_mul_legacy_f32_2.0(float %a) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, 2.0, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_f32_2.0:
@@ -508,7 +483,6 @@ define float @v_mul_legacy_f32_2.0(float %a) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, 2.0, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float %a, float 2.0)
    ret float %result
@@ -538,7 +512,6 @@ define float @v_mul_legacy_f32_2.0_swap(float %b) {
  ; GFX101-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX101-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX101-NEXT:    v_mul_legacy_f32_e32 v0, 2.0, v0
-; GFX101-NEXT:    ; implicit-def: $vcc_hi
  ; GFX101-NEXT:    s_setpc_b64 s[30:31]
  ;
  ; GFX103-LABEL: v_mul_legacy_f32_2.0_swap:
@@ -546,7 +519,6 @@ define float @v_mul_legacy_f32_2.0_swap(float %b) {
  ; GFX103-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX103-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX103-NEXT:    v_mul_legacy_f32_e32 v0, 2.0, v0
-; GFX103-NEXT:    ; implicit-def: $vcc_hi
  ; GFX103-NEXT:    s_setpc_b64 s[30:31]
    %result = call float @llvm.amdgcn.fmul.legacy(float 2.0, float %b)
    ret float %result
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.global.atomic.csub.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.global.atomic.csub.ll

index b46ac1b..ed286e8 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.global.atomic.csub.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.global.atomic.csub.ll
@@ -8,7 +8,6 @@ define i32 @global_atomic_csub(i32 addrspace(1)* %ptr, i32 %data) {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    global_atomic_csub v0, v[0:1], v2, off glc
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %ret = call i32 @llvm.amdgcn.global.atomic.csub.p1i32(i32 addrspace(1)* %ptr, i32 %data)
@@ -24,7 +23,6 @@ define i32 @global_atomic_csub_offset(i32 addrspace(1)* %ptr, i32 %data) {
  ; GCN-NEXT:    s_mov_b32 s5, 0
  ; GCN-NEXT:    v_mov_b32_e32 v3, s4
  ; GCN-NEXT:    v_mov_b32_e32 v4, s5
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, v3
  ; GCN-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, v1, v4, vcc_lo
  ; GCN-NEXT:    global_atomic_csub v0, v[0:1], v2, off glc
@@ -41,7 +39,6 @@ define void @global_atomic_csub_nortn(i32 addrspace(1)* %ptr, i32 %data) {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    global_atomic_csub v0, v[0:1], v2, off glc
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %ret = call i32 @llvm.amdgcn.global.atomic.csub.p1i32(i32 addrspace(1)* %ptr, i32 %data)
@@ -57,7 +54,6 @@ define void @global_atomic_csub_offset_nortn(i32 addrspace(1)* %ptr, i32 %data)
  ; GCN-NEXT:    s_mov_b32 s5, 0
  ; GCN-NEXT:    v_mov_b32_e32 v3, s4
  ; GCN-NEXT:    v_mov_b32_e32 v4, s5
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, v3
  ; GCN-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, v1, v4, vcc_lo
  ; GCN-NEXT:    global_atomic_csub v0, v[0:1], v2, off glc
@@ -75,7 +71,6 @@ define amdgpu_kernel void @global_atomic_csub_sgpr_base_offset(i32 addrspace(1)*
  ; GCN-NEXT:    s_load_dword s2, s[4:5], 0x8
  ; GCN-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0
  ; GCN-NEXT:    v_mov_b32_e32 v1, 0x1000
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt lgkmcnt(0)
  ; GCN-NEXT:    v_mov_b32_e32 v0, s2
  ; GCN-NEXT:    global_atomic_csub v0, v1, v0, s[0:1] glc
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.icmp.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.icmp.ll

index dc04f15..f0eedf6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.icmp.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.icmp.ll
@@ -18,7 +18,6 @@ define amdgpu_ps void @test_intr_icmp_ne_i32(i32 addrspace(1)* %out, i32 %src) #
  ; GCN-LABEL: test_intr_icmp_ne_i32:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    v_cmp_ne_u32_e64 s0, 0x64, v2
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_mov_b32_e32 v2, s0
  ; GCN-NEXT:    global_store_dword v[0:1], v2, off
  ; GCN-NEXT:    s_endpgm
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.if.break.i32.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.if.break.i32.ll

index 19c546b..67c9287 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.if.break.i32.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.if.break.i32.ll
@@ -7,7 +7,6 @@ define amdgpu_kernel void @test_wave32(i32 %arg0, [8 x i32], i32 %saved) {
  ; GCN-NEXT:    s_clause 0x1
  ; GCN-NEXT:    s_load_dword s0, s[4:5], 0x0
  ; GCN-NEXT:    s_load_dword s1, s[4:5], 0x24
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt lgkmcnt(0)
  ; GCN-NEXT:    s_cmp_eq_u32 s0, 0
  ; GCN-NEXT:    s_cselect_b32 s0, 1, 0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.a16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.a16.ll

index 6ef83e7..e0348da 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.a16.ll
@@ -27,7 +27,6 @@ define amdgpu_ps float @atomic_swap_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_swap v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -62,7 +61,6 @@ define amdgpu_ps float @atomic_add_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -97,7 +95,6 @@ define amdgpu_ps float @atomic_sub_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_sub v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -132,7 +129,6 @@ define amdgpu_ps float @atomic_smin_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smin v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -167,7 +163,6 @@ define amdgpu_ps float @atomic_umin_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umin v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -202,7 +197,6 @@ define amdgpu_ps float @atomic_smax_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smax v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -237,7 +231,6 @@ define amdgpu_ps float @atomic_umax_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umax v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -272,7 +265,6 @@ define amdgpu_ps float @atomic_and_i321d(<8 x i32> inreg %rsrc, i32 %data, i16 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_and v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -307,7 +299,6 @@ define amdgpu_ps float @atomic_or_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_or v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -342,7 +333,6 @@ define amdgpu_ps float @atomic_xor_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_xor v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -377,7 +367,6 @@ define amdgpu_ps float @atomic_inc_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_inc v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -412,7 +401,6 @@ define amdgpu_ps float @atomic_dec_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_dec v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -447,7 +435,6 @@ define amdgpu_ps float @atomic_cmpswap_i32_1d(<8 x i32> inreg %rsrc, i32 %cmp, i
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_cmpswap v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -487,7 +474,6 @@ define amdgpu_ps float @atomic_add_i32_2d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -532,7 +518,6 @@ define amdgpu_ps float @atomic_add_i32_3d(<8 x i32> inreg %rsrc, i32 %data, i16
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_3D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -577,7 +562,6 @@ define amdgpu_ps float @atomic_add_i32_cube(<8 x i32> inreg %rsrc, i32 %data, i1
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_CUBE unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -617,7 +601,6 @@ define amdgpu_ps float @atomic_add_i32_1darray(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -662,7 +645,6 @@ define amdgpu_ps float @atomic_add_i32_2darray(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -707,7 +689,6 @@ define amdgpu_ps float @atomic_add_i32_2dmsaa(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_MSAA unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -752,7 +733,6 @@ define amdgpu_ps float @atomic_add_i32_2darraymsaa(<8 x i32> inreg %rsrc, i32 %d
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -787,7 +767,6 @@ define amdgpu_ps float @atomic_add_i32_1d_slc(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc slc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -822,7 +801,6 @@ define amdgpu_ps <2 x float> @atomic_swap_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_swap v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -857,7 +835,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -892,7 +869,6 @@ define amdgpu_ps <2 x float> @atomic_sub_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_sub v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -927,7 +903,6 @@ define amdgpu_ps <2 x float> @atomic_smin_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smin v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -962,7 +937,6 @@ define amdgpu_ps <2 x float> @atomic_umin_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umin v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -997,7 +971,6 @@ define amdgpu_ps <2 x float> @atomic_smax_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smax v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1032,7 +1005,6 @@ define amdgpu_ps <2 x float> @atomic_umax_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umax v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1067,7 +1039,6 @@ define amdgpu_ps <2 x float> @atomic_and_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_and v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1102,7 +1073,6 @@ define amdgpu_ps <2 x float> @atomic_or_i64_1d(<8 x i32> inreg %rsrc, i64 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_or v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1137,7 +1107,6 @@ define amdgpu_ps <2 x float> @atomic_xor_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_xor v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1172,7 +1141,6 @@ define amdgpu_ps <2 x float> @atomic_inc_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_inc v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1207,7 +1175,6 @@ define amdgpu_ps <2 x float> @atomic_dec_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_dec v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1242,7 +1209,6 @@ define amdgpu_ps <2 x float> @atomic_cmpswap_i64_1d(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_cmpswap v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1282,7 +1248,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1327,7 +1292,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_3d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_3D unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1372,7 +1336,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_cube(<8 x i32> inreg %rsrc, i64 %da
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_CUBE unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1412,7 +1375,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1darray(<8 x i32> inreg %rsrc, i64
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1457,7 +1419,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2darray(<8 x i32> inreg %rsrc, i64
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1502,7 +1463,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2dmsaa(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_MSAA unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1547,7 +1507,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2darraymsaa(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm glc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1582,7 +1541,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1d_slc(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc slc a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.ll

index 48dbdf4..59d059d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.ll
@@ -43,7 +43,6 @@ define amdgpu_ps float @atomic_swap_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_swap v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -92,7 +91,6 @@ define amdgpu_ps float @atomic_add_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -141,7 +139,6 @@ define amdgpu_ps float @atomic_sub_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_sub v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -190,7 +187,6 @@ define amdgpu_ps float @atomic_smin_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smin v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -239,7 +235,6 @@ define amdgpu_ps float @atomic_umin_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umin v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -288,7 +283,6 @@ define amdgpu_ps float @atomic_smax_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smax v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -337,7 +331,6 @@ define amdgpu_ps float @atomic_umax_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umax v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -386,7 +379,6 @@ define amdgpu_ps float @atomic_and_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_and v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -435,7 +427,6 @@ define amdgpu_ps float @atomic_or_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_or v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -484,7 +475,6 @@ define amdgpu_ps float @atomic_xor_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_xor v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -533,7 +523,6 @@ define amdgpu_ps float @atomic_inc_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_inc v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -582,7 +571,6 @@ define amdgpu_ps float @atomic_dec_i32_1d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_dec v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -631,7 +619,6 @@ define amdgpu_ps float @atomic_cmpswap_i32_1d(<8 x i32> inreg %rsrc, i32 %cmp, i
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_cmpswap v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -680,7 +667,6 @@ define amdgpu_ps float @atomic_add_i32_2d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -729,7 +715,6 @@ define amdgpu_ps float @atomic_add_i32_3d(<8 x i32> inreg %rsrc, i32 %data, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:3], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_3D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -778,7 +763,6 @@ define amdgpu_ps float @atomic_add_i32_cube(<8 x i32> inreg %rsrc, i32 %data, i3
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:3], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_CUBE unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -827,7 +811,6 @@ define amdgpu_ps float @atomic_add_i32_1darray(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -876,7 +859,6 @@ define amdgpu_ps float @atomic_add_i32_2darray(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:3], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -925,7 +907,6 @@ define amdgpu_ps float @atomic_add_i32_2dmsaa(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:3], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_MSAA unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -974,7 +955,6 @@ define amdgpu_ps float @atomic_add_i32_2darraymsaa(<8 x i32> inreg %rsrc, i32 %d
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v[1:4], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1023,7 +1003,6 @@ define amdgpu_ps float @atomic_add_i32_1d_slc(<8 x i32> inreg %rsrc, i32 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v0, v1, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm glc slc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1072,7 +1051,6 @@ define amdgpu_ps <2 x float> @atomic_swap_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_swap v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1121,7 +1099,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1170,7 +1147,6 @@ define amdgpu_ps <2 x float> @atomic_sub_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_sub v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1219,7 +1195,6 @@ define amdgpu_ps <2 x float> @atomic_smin_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smin v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1268,7 +1243,6 @@ define amdgpu_ps <2 x float> @atomic_umin_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umin v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1317,7 +1291,6 @@ define amdgpu_ps <2 x float> @atomic_smax_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_smax v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1366,7 +1339,6 @@ define amdgpu_ps <2 x float> @atomic_umax_i64_1d(<8 x i32> inreg %rsrc, i64 %dat
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_umax v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1415,7 +1387,6 @@ define amdgpu_ps <2 x float> @atomic_and_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_and v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1464,7 +1435,6 @@ define amdgpu_ps <2 x float> @atomic_or_i64_1d(<8 x i32> inreg %rsrc, i64 %data,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_or v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1513,7 +1483,6 @@ define amdgpu_ps <2 x float> @atomic_xor_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_xor v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1562,7 +1531,6 @@ define amdgpu_ps <2 x float> @atomic_inc_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_inc v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1611,7 +1579,6 @@ define amdgpu_ps <2 x float> @atomic_dec_i64_1d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_dec v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1660,7 +1627,6 @@ define amdgpu_ps <2 x float> @atomic_cmpswap_i64_1d(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_cmpswap v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1709,7 +1675,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1758,7 +1723,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_3d(<8 x i32> inreg %rsrc, i64 %data
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:4], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_3D unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1807,7 +1771,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_cube(<8 x i32> inreg %rsrc, i64 %da
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:4], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_CUBE unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1856,7 +1819,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1darray(<8 x i32> inreg %rsrc, i64
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:3], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1905,7 +1867,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2darray(<8 x i32> inreg %rsrc, i64
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:4], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1954,7 +1915,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2dmsaa(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:4], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_MSAA unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -2003,7 +1963,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_2darraymsaa(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v[2:5], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm glc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -2052,7 +2011,6 @@ define amdgpu_ps <2 x float> @atomic_add_i64_1d_slc(<8 x i32> inreg %rsrc, i64 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_atomic_add v[0:1], v2, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm glc slc
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.a16.dim.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.a16.dim.ll

index 826e833..b438719 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.a16.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.a16.dim.ll
@@ -47,7 +47,6 @@ define amdgpu_ps <4 x float> @gather4_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10NSA-NEXT:    v_and_or_b32 v0, v0, 0xffff, v1
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v0, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -105,7 +104,6 @@ define amdgpu_ps <4 x float> @gather4_cube(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    v_and_or_b32 v1, v2, v3, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_CUBE a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -163,7 +161,6 @@ define amdgpu_ps <4 x float> @gather4_2darray(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    v_and_or_b32 v1, v2, v3, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D_ARRAY a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -216,7 +213,6 @@ define amdgpu_ps <4 x float> @gather4_c_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    v_and_or_b32 v1, v1, 0xffff, v2
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_c v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -274,7 +270,6 @@ define amdgpu_ps <4 x float> @gather4_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10NSA-NEXT:    v_and_or_b32 v1, v2, v3, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_cl v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -332,7 +327,6 @@ define amdgpu_ps <4 x float> @gather4_c_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    v_and_or_b32 v2, v3, v4, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_c_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -385,7 +379,6 @@ define amdgpu_ps <4 x float> @gather4_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    v_and_or_b32 v1, v1, 0xffff, v2
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_b v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -438,7 +431,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10NSA-NEXT:    v_and_or_b32 v2, v2, 0xffff, v3
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_c_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -496,7 +488,6 @@ define amdgpu_ps <4 x float> @gather4_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    v_and_or_b32 v2, v3, v4, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_b_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -554,7 +545,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10NSA-NEXT:    v_and_or_b32 v3, v4, v5, s12
  ; GFX10NSA-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10NSA-NEXT:    image_gather4_c_b_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
  main_body:
@@ -605,7 +595,6 @@ define amdgpu_ps <4 x float> @gather4_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    s_mov_b32 s7, s9
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_l v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -657,7 +646,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10NSA-NEXT:    s_mov_b32 s7, s9
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_l v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -704,7 +692,6 @@ define amdgpu_ps <4 x float> @gather4_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_lz v[0:3], v0, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -751,7 +738,6 @@ define amdgpu_ps <4 x float> @gather4_c_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.dim.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.dim.ll

index 166686c..6cd67de 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.dim.ll
@@ -41,7 +41,6 @@ define amdgpu_ps <4 x float> @gather4_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -89,7 +88,6 @@ define amdgpu_ps <4 x float> @gather4_cube(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_CUBE
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -137,7 +135,6 @@ define amdgpu_ps <4 x float> @gather4_2darray(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D_ARRAY
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -185,7 +182,6 @@ define amdgpu_ps <4 x float> @gather4_c_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -233,7 +229,6 @@ define amdgpu_ps <4 x float> @gather4_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -281,7 +276,6 @@ define amdgpu_ps <4 x float> @gather4_c_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -329,7 +323,6 @@ define amdgpu_ps <4 x float> @gather4_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -377,7 +370,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_b v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -425,7 +417,6 @@ define amdgpu_ps <4 x float> @gather4_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_b_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -473,7 +464,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_b_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -515,7 +505,6 @@ define amdgpu_ps <4 x float> @gather4_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_l v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -557,7 +546,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_l v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -599,7 +587,6 @@ define amdgpu_ps <4 x float> @gather4_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -641,7 +628,6 @@ define amdgpu_ps <4 x float> @gather4_c_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4_c_lz v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -689,7 +675,6 @@ define amdgpu_ps <4 x float> @gather4_2d_dmask_2(<8 x i32> inreg %rsrc, <4 x i32
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x2 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -737,7 +722,6 @@ define amdgpu_ps <4 x float> @gather4_2d_dmask_4(<8 x i32> inreg %rsrc, <4 x i32
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x4 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
@@ -785,7 +769,6 @@ define amdgpu_ps <4 x float> @gather4_2d_dmask_8(<8 x i32> inreg %rsrc, <4 x i32
  ; GFX10NSA-NEXT:    s_mov_b32 s9, s11
  ; GFX10NSA-NEXT:    s_mov_b32 s10, s12
  ; GFX10NSA-NEXT:    s_mov_b32 s11, s13
-; GFX10NSA-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10NSA-NEXT:    image_gather4 v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x8 dim:SQ_RSRC_IMG_2D
  ; GFX10NSA-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10NSA-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.o.dim.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.o.dim.ll

index b368359..66ccb8d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.o.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.o.dim.ll
@@ -41,7 +41,6 @@ define amdgpu_ps <4 x float> @gather4_o_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_o v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -89,7 +88,6 @@ define amdgpu_ps <4 x float> @gather4_c_o_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_o v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -137,7 +135,6 @@ define amdgpu_ps <4 x float> @gather4_cl_o_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_cl_o v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -185,7 +182,6 @@ define amdgpu_ps <4 x float> @gather4_c_cl_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_cl_o v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -233,7 +229,6 @@ define amdgpu_ps <4 x float> @gather4_b_o_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_b_o v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -281,7 +276,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_b_o v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -323,7 +317,6 @@ define amdgpu_ps <4 x float> @gather4_b_cl_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_b_cl_o v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -371,7 +364,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_cl_o_2d(<8 x i32> inreg %rsrc, <4 x i3
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_b_cl_o v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -413,7 +405,6 @@ define amdgpu_ps <4 x float> @gather4_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_l_o v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -455,7 +446,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_l_o v[0:3], v[0:7], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -497,7 +487,6 @@ define amdgpu_ps <4 x float> @gather4_lz_o_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_lz_o v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -539,7 +528,6 @@ define amdgpu_ps <4 x float> @gather4_c_lz_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_lz_o v[0:3], v[0:3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.a16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.a16.ll

index d4084ba..951d2b7 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.a16.ll
@@ -27,7 +27,6 @@ define amdgpu_ps <4 x float> @getresinfo_1d(<8 x i32> inreg %rsrc, i16 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -61,7 +60,6 @@ define amdgpu_ps <4 x float> @getresinfo_2d(<8 x i32> inreg %rsrc, i16 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -95,7 +93,6 @@ define amdgpu_ps <4 x float> @getresinfo_3d(<8 x i32> inreg %rsrc, i16 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -129,7 +126,6 @@ define amdgpu_ps <4 x float> @getresinfo_cube(<8 x i32> inreg %rsrc, i16 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -163,7 +159,6 @@ define amdgpu_ps <4 x float> @getresinfo_1darray(<8 x i32> inreg %rsrc, i16 %mip
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -197,7 +192,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darray(<8 x i32> inreg %rsrc, i16 %mip
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -231,7 +225,6 @@ define amdgpu_ps <4 x float> @getresinfo_2dmsaa(<8 x i32> inreg %rsrc, i16 %mip)
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -265,7 +258,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darraymsaa(<8 x i32> inreg %rsrc, i16
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -281,7 +273,6 @@ define amdgpu_ps <4 x float> @getresinfo_dmask0(<8 x i32> inreg %rsrc, <4 x floa
  ;
  ; GFX10-LABEL: getresinfo_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %r = call <4 x float> @llvm.amdgcn.image.getresinfo.1d.v4f32.i16(i32 0, i16 %mip, <8 x i32> %rsrc, i32 0, i32 0)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.ll

index 527a8fb..e0b8907 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.ll
@@ -42,7 +42,6 @@ define amdgpu_ps <4 x float> @getresinfo_1d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -90,7 +89,6 @@ define amdgpu_ps <4 x float> @getresinfo_2d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -138,7 +136,6 @@ define amdgpu_ps <4 x float> @getresinfo_3d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -186,7 +183,6 @@ define amdgpu_ps <4 x float> @getresinfo_cube(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -234,7 +230,6 @@ define amdgpu_ps <4 x float> @getresinfo_1darray(<8 x i32> inreg %rsrc, i32 %mip
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -282,7 +277,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darray(<8 x i32> inreg %rsrc, i32 %mip
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -330,7 +324,6 @@ define amdgpu_ps <4 x float> @getresinfo_2dmsaa(<8 x i32> inreg %rsrc, i32 %mip)
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -378,7 +371,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darraymsaa(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -426,7 +418,6 @@ define amdgpu_ps <3 x float> @getresinfo_dmask7(<8 x i32> inreg %rsrc, <4 x floa
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -474,7 +465,6 @@ define amdgpu_ps <2 x float> @getresinfo_dmask3(<8 x i32> inreg %rsrc, <4 x floa
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v[0:1], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -522,7 +512,6 @@ define amdgpu_ps float @getresinfo_dmask1(<8 x i32> inreg %rsrc, <4 x float> %vd
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_get_resinfo v0, v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -542,7 +531,6 @@ define amdgpu_ps <4 x float> @getresinfo_dmask0(<8 x i32> inreg %rsrc, <4 x floa
  ;
  ; GFX10-LABEL: getresinfo_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %r = call <4 x float> @llvm.amdgcn.image.getresinfo.1d.v4f32.i32(i32 0, i32 %mip, <8 x i32> %rsrc, i32 0, i32 0)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.d16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.d16.ll

index df5a26d..36f3e63 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.d16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.d16.ll
@@ -57,7 +57,6 @@ define amdgpu_ps half @load_1d_f16_x(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -118,7 +117,6 @@ define amdgpu_ps half @load_1d_f16_y(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -179,7 +177,6 @@ define amdgpu_ps half @load_1d_f16_z(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x4 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -240,7 +237,6 @@ define amdgpu_ps half @load_1d_f16_w(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -304,7 +300,6 @@ define amdgpu_ps <2 x half> @load_1d_v2f16_xy(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -368,7 +363,6 @@ define amdgpu_ps <2 x half> @load_1d_v2f16_xz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x5 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -432,7 +426,6 @@ define amdgpu_ps <2 x half> @load_1d_v2f16_xw(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x9 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -496,7 +489,6 @@ define amdgpu_ps <2 x half> @load_1d_v2f16_yz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x6 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -583,7 +575,6 @@ define amdgpu_ps <3 x half> @load_1d_v3f16_xyz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt_depctr 0xffe3
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_lshrrev_b32_e32 v2, 16, v0
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v3, s0
@@ -654,7 +645,6 @@ define amdgpu_ps <4 x half> @load_1d_v4f16_xyzw(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -718,7 +708,6 @@ define amdgpu_ps float @load_1d_f16_tfe_dmask_x(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
@@ -785,7 +774,6 @@ define amdgpu_ps float @load_1d_v2f16_tfe_dmask_xy(<8 x i32> inreg %rsrc, i32 %s
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm tfe d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
@@ -852,7 +840,6 @@ define amdgpu_ps float @load_1d_v3f16_tfe_dmask_xyz(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm tfe d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v2
@@ -919,7 +906,6 @@ define amdgpu_ps float @load_1d_v4f16_tfe_dmask_xyzw(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x10 dim:SQ_RSRC_IMG_1D unorm tfe d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.ll

index 0062118..a8e58e5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.ll
@@ -42,7 +42,6 @@ define amdgpu_ps float @load_1d_f32_x(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -89,7 +88,6 @@ define amdgpu_ps float @load_1d_f32_y(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -136,7 +134,6 @@ define amdgpu_ps float @load_1d_f32_z(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x4 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -183,7 +180,6 @@ define amdgpu_ps float @load_1d_f32_w(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -230,7 +226,6 @@ define amdgpu_ps <2 x float> @load_1d_v2f32_xy(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -277,7 +272,6 @@ define amdgpu_ps <2 x float> @load_1d_v2f32_xz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x5 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -324,7 +318,6 @@ define amdgpu_ps <2 x float> @load_1d_v2f32_xw(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x9 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -371,7 +364,6 @@ define amdgpu_ps <2 x float> @load_1d_v2f32_yz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x6 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -418,7 +410,6 @@ define amdgpu_ps <3 x float> @load_1d_v3f32_xyz(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -465,7 +456,6 @@ define amdgpu_ps <4 x float> @load_1d_v4f32_xyzw(<8 x i32> inreg %rsrc, i32 %s)
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -514,7 +504,6 @@ define amdgpu_ps float @load_1d_f32_tfe_dmask_x(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
@@ -566,7 +555,6 @@ define amdgpu_ps float @load_1d_v2f32_tfe_dmask_xy(<8 x i32> inreg %rsrc, i32 %s
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:2], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm tfe
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v2
@@ -618,7 +606,6 @@ define amdgpu_ps float @load_1d_v3f32_tfe_dmask_xyz(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm tfe
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v3
@@ -670,7 +657,6 @@ define amdgpu_ps float @load_1d_v4f32_tfe_dmask_xyzw(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x10 dim:SQ_RSRC_IMG_1D unorm tfe
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
@@ -722,7 +708,6 @@ define amdgpu_ps float @load_1d_f32_tfe_dmask_0(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2d.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2d.ll

index 956432f..0f9bb16 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2d.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2d.ll
@@ -27,7 +27,6 @@ define amdgpu_ps <4 x float> @load_2d_v4f32_xyzw(<8 x i32> inreg %rsrc, i32 %s,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -68,7 +67,6 @@ define amdgpu_ps <4 x float> @load_2d_v4f32_xyzw_tfe(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm tfe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
@@ -113,7 +111,6 @@ define amdgpu_ps <4 x float> @load_2d_v4f32_xyzw_tfe_lwe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm tfe lwe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.a16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.a16.ll

index 257615e..c00de20 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.a16.ll
@@ -37,7 +37,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -85,7 +84,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw_tfe(<8 x i32> inreg %r
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16 tfe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
@@ -137,7 +135,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw_tfe_lwe(<8 x i32> inre
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16 tfe lwe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.ll

index dd7111b..a85492e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.ll
@@ -27,7 +27,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -68,7 +67,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw_tfe(<8 x i32> inreg %r
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm tfe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
@@ -113,7 +111,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_v4f32_xyzw_tfe_lwe(<8 x i32> inre
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm tfe lwe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.a16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.a16.ll

index 011d767..9c8e760 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.a16.ll
@@ -37,7 +37,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw(<8 x i32> inreg %rsrc, i16 %s,
  ; GFX10-NEXT:    s_mov_b32 s3, s5
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -85,7 +84,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw_tfe(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 tfe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
@@ -137,7 +135,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw_tfe_lwe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 tfe lwe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.ll

index bfd3470..0299a5b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.ll
@@ -27,7 +27,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw(<8 x i32> inreg %rsrc, i32 %s,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -68,7 +67,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw_tfe(<8 x i32> inreg %rsrc, i32
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm tfe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
@@ -113,7 +111,6 @@ define amdgpu_ps <4 x float> @load_3d_v4f32_xyzw_tfe_lwe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0
  ; GFX10-NEXT:    image_load v[0:4], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm tfe lwe
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v5, v4, s[10:11]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.g16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.g16.ll

index d1c49af..d4d526b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.g16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.g16.ll
@@ -6,7 +6,6 @@ define amdgpu_ps <4 x float> @sample_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v3, s12
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v3, s12
  ; GFX10-NEXT:    image_sample_d_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -23,7 +22,6 @@ define amdgpu_ps <4 x float> @sample_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_mov_b32_e32 v6, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 16, v1
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v3, 16, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v7, v0, v6, v1
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v6, v3
  ; GFX10-NEXT:    image_sample_d_g16 v[0:3], [v7, v2, v4, v5], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -41,7 +39,6 @@ define amdgpu_ps <4 x float> @sample_d_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 16, v1
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v4, 16, v4
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v11, v1
  ; GFX10-NEXT:    v_and_or_b32 v1, v2, v11, s12
  ; GFX10-NEXT:    v_and_or_b32 v2, v3, v11, v4
@@ -59,7 +56,6 @@ define amdgpu_ps <4 x float> @sample_c_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v4, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v4, s12
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v4, s12
  ; GFX10-NEXT:    image_sample_c_d_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -76,7 +72,6 @@ define amdgpu_ps <4 x float> @sample_c_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 16, v2
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v4, 16, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v11, v1, v7, v2
  ; GFX10-NEXT:    v_and_or_b32 v2, v3, v7, v4
  ; GFX10-NEXT:    image_sample_c_d_g16 v[0:3], [v0, v11, v2, v5, v6], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -92,7 +87,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v7, s12
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v7, s12
  ; GFX10-NEXT:    image_sample_d_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -109,7 +103,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 16, v1
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v9, 16, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v11, v0, v7, v1
  ; GFX10-NEXT:    v_and_or_b32 v1, v2, v7, v9
  ; GFX10-NEXT:    image_sample_d_cl_g16 v[0:3], [v11, v1, v4, v5, v6], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -125,7 +118,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v7, s12
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v7, s12
  ; GFX10-NEXT:    image_sample_c_d_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -142,7 +134,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 16, v2
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v10, 16, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v8, v2
  ; GFX10-NEXT:    v_and_or_b32 v2, v3, v8, v10
  ; GFX10-NEXT:    image_sample_c_d_cl_g16 v[0:3], [v0, v1, v2, v5, v6, v7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -158,7 +149,6 @@ define amdgpu_ps <4 x float> @sample_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v3, s12
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v3, s12
  ; GFX10-NEXT:    image_sample_cd_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -175,7 +165,6 @@ define amdgpu_ps <4 x float> @sample_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_mov_b32_e32 v6, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 16, v1
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v3, 16, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v7, v0, v6, v1
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v6, v3
  ; GFX10-NEXT:    image_sample_cd_g16 v[0:3], [v7, v2, v4, v5], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -191,7 +180,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v4, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v4, s12
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v4, s12
  ; GFX10-NEXT:    image_sample_c_cd_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -208,7 +196,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 16, v2
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v4, 16, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v11, v1, v7, v2
  ; GFX10-NEXT:    v_and_or_b32 v2, v3, v7, v4
  ; GFX10-NEXT:    image_sample_c_cd_g16 v[0:3], [v0, v11, v2, v5, v6], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -224,7 +211,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v7, s12
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v7, s12
  ; GFX10-NEXT:    image_sample_cd_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -241,7 +227,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 16, v1
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v9, 16, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v11, v0, v7, v1
  ; GFX10-NEXT:    v_and_or_b32 v1, v2, v7, v9
  ; GFX10-NEXT:    image_sample_cd_cl_g16 v[0:3], [v11, v1, v4, v5, v6], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -257,7 +242,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
  ; GFX10-NEXT:    s_lshl_b32 s12, s0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v7, s12
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v7, s12
  ; GFX10-NEXT:    image_sample_c_cd_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
@@ -274,7 +258,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 16, v2
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v10, 16, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v8, v2
  ; GFX10-NEXT:    v_and_or_b32 v2, v3, v8, v10
  ; GFX10-NEXT:    image_sample_c_cd_cl_g16 v[0:3], [v0, v1, v2, v5, v6, v7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D
@@ -291,7 +274,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v3, 16, v3
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v11, 16, v5
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v9, v3
  ; GFX10-NEXT:    v_and_or_b32 v3, v4, v9, v11
  ; GFX10-NEXT:    image_sample_c_d_o_g16 v0, [v0, v1, v2, v3, v6, v7, v8], s[0:7], s[8:11] dmask:0x4 dim:SQ_RSRC_IMG_2D_ARRAY
@@ -308,7 +290,6 @@ define amdgpu_ps <2 x float> @sample_c_d_o_2darray_V2(<8 x i32> inreg %rsrc, <4
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v3, 16, v3
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v11, 16, v5
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v2, v2, v9, v3
  ; GFX10-NEXT:    v_and_or_b32 v3, v4, v9, v11
  ; GFX10-NEXT:    image_sample_c_d_o_g16 v[0:1], [v0, v1, v2, v3, v6, v7, v8], s[0:7], s[8:11] dmask:0x6 dim:SQ_RSRC_IMG_2D_ARRAY
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.ltolz.a16.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.ltolz.a16.ll

index 79dedd5..8ec7bbc 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.ltolz.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.ltolz.a16.ll
@@ -35,7 +35,6 @@ define amdgpu_ps <4 x float> @sample_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -82,7 +81,6 @@ define amdgpu_ps <4 x float> @sample_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -129,7 +127,6 @@ define amdgpu_ps <4 x float> @sample_c_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -176,7 +173,6 @@ define amdgpu_ps <4 x float> @sample_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -223,7 +219,6 @@ define amdgpu_ps <4 x float> @sample_l_o_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_lz_o v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -270,7 +265,6 @@ define amdgpu_ps <4 x float> @sample_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_lz_o v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -317,7 +311,6 @@ define amdgpu_ps <4 x float> @sample_c_l_o_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    s_mov_b32 s7, s9
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_c_lz_o v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -364,7 +357,6 @@ define amdgpu_ps <4 x float> @sample_c_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_sample_c_lz_o v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -411,7 +403,6 @@ define amdgpu_ps <4 x float> @gather4_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -458,7 +449,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -505,7 +495,6 @@ define amdgpu_ps <4 x float> @gather4_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_lz_o v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -552,7 +541,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_o_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_mov_b32 s9, s11
  ; GFX10-NEXT:    s_mov_b32 s10, s12
  ; GFX10-NEXT:    s_mov_b32 s11, s13
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_gather4_c_lz_o v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.store.2d.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.store.2d.ll

index ed2ed40..a8e8f99 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.store.2d.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.store.2d.ll
@@ -40,7 +40,6 @@ define amdgpu_ps void @image_store_f32(<8 x i32> inreg %rsrc, i32 %s, i32 %t, fl
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v2, v[0:1], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.f32.i32(float %data, i32 1, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -84,7 +83,6 @@ define amdgpu_ps void @image_store_v2f32(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:3], v[0:1], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v2f32.i32(<2 x float> %in, i32 3, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -128,7 +126,6 @@ define amdgpu_ps void @image_store_v3f32(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:4], v[0:1], s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v3f32.i32(<3 x float> %in, i32 7, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -172,7 +169,6 @@ define amdgpu_ps void @image_store_v4f32(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 15, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -216,7 +212,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_0001(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 1, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -260,7 +255,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_0010(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 2, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -304,7 +298,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_0100(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x4 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 4, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -348,7 +341,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_1000(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 8, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -392,7 +384,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_0011(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 3, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
@@ -436,7 +427,6 @@ define amdgpu_ps void @image_store_v4f32_dmask_0110(<8 x i32> inreg %rsrc, i32 %
  ; GFX10-NEXT:    s_mov_b32 s5, s7
  ; GFX10-NEXT:    s_mov_b32 s6, s8
  ; GFX10-NEXT:    s_mov_b32 s7, s9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x6 dim:SQ_RSRC_IMG_2D unorm
  ; GFX10-NEXT:    s_endpgm
    call void @llvm.amdgcn.image.store.2d.v4f32.i32(<4 x float> %in, i32 6, i32 %s, i32 %t, <8 x i32> %rsrc, i32 0, i32 0)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.intersect_ray.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.intersect_ray.ll

index ebb3cff..f363b4b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.intersect_ray.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.intersect_ray.ll
@@ -15,7 +15,6 @@ define amdgpu_ps <4 x float> @image_bvh_intersect_ray(i32 %node_ptr, float %ray_
  ; GCN-LABEL: image_bvh_intersect_ray:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    image_bvh_intersect_ray v[0:3], [v0, v1, v2, v3, v4, v6, v7, v8, v10, v11, v12], s[0:3]
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    ; return to shader part epilog
    %v = call <4 x i32> @llvm.amdgcn.image.bvh.intersect.ray.i32.v4f32(i32 %node_ptr, float %ray_extent, <4 x float> %ray_origin, <4 x float> %ray_dir, <4 x float> %ray_inv_dir, <4 x i32> %tdescr)
@@ -31,7 +30,6 @@ define amdgpu_ps <4 x float> @image_bvh_intersect_ray_a16(i32 %node_ptr, float %
  ; GCN-NEXT:    v_and_b32_e32 v10, s4, v8
  ; GCN-NEXT:    v_lshrrev_b32_e32 v8, 16, v8
  ; GCN-NEXT:    v_and_b32_e32 v9, s4, v9
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_lshlrev_b32_e32 v5, 16, v5
  ; GCN-NEXT:    v_lshlrev_b32_e32 v10, 16, v10
  ; GCN-NEXT:    v_and_or_b32 v5, v6, s4, v5
@@ -49,7 +47,6 @@ define amdgpu_ps <4 x float> @image_bvh64_intersect_ray(i64 %node_ptr, float %ra
  ; GCN-LABEL: image_bvh64_intersect_ray:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    image_bvh64_intersect_ray v[0:3], [v0, v1, v2, v3, v4, v5, v7, v8, v9, v11, v12, v13], s[0:3]
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    ; return to shader part epilog
    %v = call <4 x i32> @llvm.amdgcn.image.bvh.intersect.ray.i64.v4f32(i64 %node_ptr, float %ray_extent, <4 x float> %ray_origin, <4 x float> %ray_dir, <4 x float> %ray_inv_dir, <4 x i32> %tdescr)
@@ -65,7 +62,6 @@ define amdgpu_ps <4 x float> @image_bvh64_intersect_ray_a16(i64 %node_ptr, float
  ; GCN-NEXT:    v_and_b32_e32 v11, s4, v9
  ; GCN-NEXT:    v_lshrrev_b32_e32 v9, 16, v9
  ; GCN-NEXT:    v_and_b32_e32 v10, s4, v10
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_lshlrev_b32_e32 v6, 16, v6
  ; GCN-NEXT:    v_lshlrev_b32_e32 v11, 16, v11
  ; GCN-NEXT:    v_and_or_b32 v6, v7, s4, v6
@@ -83,7 +79,6 @@ define amdgpu_ps <4 x float> @image_bvh_intersect_ray_vgpr_descr(i32 %node_ptr,
  ; GCN-LABEL: image_bvh_intersect_ray_vgpr_descr:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    s_mov_b32 s1, exec_lo
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:  BB4_1: ; =>This Inner Loop Header: Depth=1
  ; GCN-NEXT:    v_readfirstlane_b32 s4, v14
  ; GCN-NEXT:    v_readfirstlane_b32 s5, v15
@@ -121,7 +116,6 @@ define amdgpu_ps <4 x float> @image_bvh_intersect_ray_a16_vgpr_descr(i32 %node_p
  ; GCN-NEXT:    s_mov_b32 s1, exec_lo
  ; GCN-NEXT:    v_lshlrev_b32_e32 v5, 16, v5
  ; GCN-NEXT:    v_lshlrev_b32_e32 v14, 16, v14
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_lshl_or_b32 v15, v15, 16, v8
  ; GCN-NEXT:    v_and_or_b32 v9, v6, s0, v5
  ; GCN-NEXT:    v_and_or_b32 v14, v7, s0, v14
@@ -155,7 +149,6 @@ define amdgpu_ps <4 x float> @image_bvh64_intersect_ray_vgpr_descr(i64 %node_ptr
  ; GCN-LABEL: image_bvh64_intersect_ray_vgpr_descr:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    s_mov_b32 s1, exec_lo
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:  BB6_1: ; =>This Inner Loop Header: Depth=1
  ; GCN-NEXT:    v_readfirstlane_b32 s4, v15
  ; GCN-NEXT:    v_readfirstlane_b32 s5, v16
@@ -193,7 +186,6 @@ define amdgpu_ps <4 x float> @image_bvh64_intersect_ray_a16_vgpr_descr(i64 %node
  ; GCN-NEXT:    s_mov_b32 s1, exec_lo
  ; GCN-NEXT:    v_lshlrev_b32_e32 v6, 16, v6
  ; GCN-NEXT:    v_lshlrev_b32_e32 v15, 16, v15
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_lshl_or_b32 v16, v16, 16, v9
  ; GCN-NEXT:    v_and_or_b32 v10, v7, s0, v6
  ; GCN-NEXT:    v_and_or_b32 v15, v8, s0, v15
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.mov.dpp.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.mov.dpp.ll

index 235f606..1610b84 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.mov.dpp.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.mov.dpp.ll
@@ -24,7 +24,6 @@ define amdgpu_kernel void @dpp_test(i32 addrspace(1)* %out, i32 %in) {
  ; GFX10-NEXT:    s_load_dword s2, s[0:1], 0x2c ; encoding: [0x80,0x00,0x00,0xf4,0x2c,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24 ; encoding: [0x00,0x00,0x04,0xf4,0x24,0x00,0x00,0xfa]
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0 ; encoding: [0x80,0x02,0x02,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s2 ; encoding: [0x02,0x02,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_dpp v0, v0 quad_perm:[1,0,0,0] row_mask:0x1 bank_mask:0x1 bound_ctrl:0 ; encoding: [0xfa,0x02,0x00,0x7e,0x00,0x01,0x08,0x11]
@@ -52,7 +51,6 @@ define amdgpu_kernel void @mov_dpp64_test(i64 addrspace(1)* %out, i64 %in1) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24 ; encoding: [0x00,0x00,0x08,0xf4,0x24,0x00,0x00,0xfa]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0 ; encoding: [0x80,0x02,0x04,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s2 ; encoding: [0x02,0x02,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s3 ; encoding: [0x03,0x02,0x02,0x7e]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll

index 2cead93..87cac6a 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll
@@ -5,7 +5,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -24,7 +23,6 @@ define amdgpu_ps <2 x float> @raw_tbuffer_load_v2f32__sgpr_rsrc__vgpr_voffset__s
    ; CHECK-LABEL: name: raw_tbuffer_load_v2f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -46,7 +44,6 @@ define amdgpu_ps <3 x float> @raw_tbuffer_load_v3f32__sgpr_rsrc__vgpr_voffset__s
    ; CHECK-LABEL: name: raw_tbuffer_load_v3f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -70,7 +67,6 @@ define amdgpu_ps <4 x float> @raw_tbuffer_load_v4f32__sgpr_rsrc__vgpr_voffset__s
    ; CHECK-LABEL: name: raw_tbuffer_load_v4f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -97,7 +93,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__vgpr_rsrc__sgpr_voffset__vgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $sgpr2, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -142,7 +137,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_glc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -161,7 +155,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_slc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -180,7 +173,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_slc_glc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
@@ -199,7 +191,6 @@ define amdgpu_ps float @raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_load_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_dlc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr3
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr4
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll

index 2404714..64c4f33 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll
@@ -6,7 +6,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -26,7 +25,6 @@ define amdgpu_ps void @raw_tbuffer_store_v2f32__sgpr_rsrc__vgpr_voffset__sgpr_so
    ; CHECK-LABEL: name: raw_tbuffer_store_v2f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1, $vgpr2
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
@@ -48,7 +46,6 @@ define amdgpu_ps void @raw_tbuffer_store_v3f32__sgpr_rsrc__vgpr_voffset__sgpr_so
    ; CHECK-LABEL: name: raw_tbuffer_store_v3f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1, $vgpr2, $vgpr3
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -71,7 +68,6 @@ define amdgpu_ps void @raw_tbuffer_store_v4f32__sgpr_rsrc__vgpr_voffset__sgpr_so
    ; CHECK-LABEL: name: raw_tbuffer_store_v4f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -95,7 +91,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__sgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__sgpr_voffset__sgpr_soffset
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $sgpr7, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -117,7 +112,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__vgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $sgpr2, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4, $vgpr5
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -160,7 +154,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__vgpr_rsrc__vgpr_voffset__vgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4, $vgpr5, $vgpr6
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -206,7 +199,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__vgpr_rsrc__sgpr_voffset__vgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $sgpr2, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4, $vgpr5
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -252,7 +244,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_glc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -272,7 +263,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_slc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -292,7 +282,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_slc_glc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -312,7 +301,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_dlc
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -333,7 +321,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vdpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vdpr_voffset__sgpr_soffset__voffset0
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -351,7 +338,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset__voffset4095
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -369,7 +355,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset__voffset4096
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -389,7 +374,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_voffset_add16
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -409,7 +393,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset__voffset_add4095
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -429,7 +412,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset__voffset_add4096
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -452,7 +434,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_soffset4095
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -471,7 +452,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_soffset4096
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -490,7 +470,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_soffset_add16
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -512,7 +491,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_soffset_add4095
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -534,7 +512,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK-LABEL: name: raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soffset_soffset_add4096
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0, $vgpr1
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr2
    ; CHECK:   [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr3
@@ -558,7 +535,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $sgpr2, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4, $vgpr5
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
@@ -604,7 +580,6 @@ define amdgpu_ps void @raw_tbuffer_store_f32__sgpr_rsrc__vgpr_voffset__sgpr_soff
    ; CHECK: bb.1 (%ir-block.0):
    ; CHECK:   successors: %bb.2(0x80000000)
    ; CHECK:   liveins: $sgpr2, $vgpr0, $vgpr1, $vgpr2, $vgpr3, $vgpr4, $vgpr5
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
    ; CHECK:   [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
    ; CHECK:   [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.setreg.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.setreg.ll

index d84282e..9e2a29e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.setreg.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.setreg.ll
@@ -29,7 +29,6 @@ define amdgpu_kernel void @test_setreg_f32_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_f32_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 0, 2), 3 ; encoding: [0x01,0x08,0x80,0xba,0x03,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -57,7 +56,6 @@ define amdgpu_kernel void @test_setreg_f64_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_f64_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 2), 3 ; encoding: [0x81,0x08,0x80,0xba,0x03,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -85,7 +83,6 @@ define amdgpu_kernel void @test_setreg_all_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_all_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 4), 7 ; encoding: [0x81,0x18,0x80,0xba,0x07,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -113,7 +110,6 @@ define amdgpu_cs void @test_setreg_roundingmode_var(i32 inreg %var.mode) {
  ;
  ; GFX10-LABEL: test_setreg_roundingmode_var:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 2), s0 ; encoding: [0x01,0x08,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -140,7 +136,6 @@ define amdgpu_kernel void @test_setreg_ieee_mode_off() {
  ;
  ; GFX10-LABEL: test_setreg_ieee_mode_off:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 9, 1), 0 ; encoding: [0x41,0x02,0x80,0xba,0x00,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -167,7 +162,6 @@ define amdgpu_kernel void @test_setreg_ieee_mode_on() {
  ;
  ; GFX10-LABEL: test_setreg_ieee_mode_on:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 9, 1), 1 ; encoding: [0x41,0x02,0x80,0xba,0x01,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -194,7 +188,6 @@ define amdgpu_kernel void @test_setreg_dx10_clamp_off() {
  ;
  ; GFX10-LABEL: test_setreg_dx10_clamp_off:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 8, 1), 0 ; encoding: [0x01,0x02,0x80,0xba,0x00,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -221,7 +214,6 @@ define amdgpu_kernel void @test_setreg_dx10_clamp_on() {
  ;
  ; GFX10-LABEL: test_setreg_dx10_clamp_on:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 8, 1), 1 ; encoding: [0x01,0x02,0x80,0xba,0x01,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -249,7 +241,6 @@ define amdgpu_cs void @test_setreg_full_both_round_mode_and_denorm_mode(i32 inre
  ;
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 8), s0 ; encoding: [0x01,0x38,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -277,7 +268,6 @@ define amdgpu_cs void @test_setreg_most_both_round_mode_and_denorm_mode() {
  ;
  ; GFX10-LABEL: test_setreg_most_both_round_mode_and_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 0, 7), 6 ; encoding: [0x01,0x30,0x80,0xba,0x06,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -305,7 +295,6 @@ define amdgpu_cs void @test_setreg_most_both_round_mode_and_denorm_mode_6() {
  ;
  ; GFX10-LABEL: test_setreg_most_both_round_mode_and_denorm_mode_6:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 1, 3), 6 ; encoding: [0x41,0x10,0x80,0xba,0x06,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -332,7 +321,6 @@ define amdgpu_cs void @test_setreg_f32_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_f32_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 4, 2), s0 ; encoding: [0x01,0x09,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -359,7 +347,6 @@ define amdgpu_cs void @test_setreg_f64_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_f64_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 6, 2), s0 ; encoding: [0x81,0x09,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -386,7 +373,6 @@ define amdgpu_cs void @test_setreg_full_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 4), s0 ; encoding: [0x01,0x18,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -413,7 +399,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_0() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_0:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -440,7 +425,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_1() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_1:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x1 ; encoding: [0x01,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -467,7 +451,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_2() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_2:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x2 ; encoding: [0x02,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -494,7 +477,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_4() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_4:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x4 ; encoding: [0x04,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -521,7 +503,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_8() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_8:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x8 ; encoding: [0x08,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -548,7 +529,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_15() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_15:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -576,7 +556,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_42() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_42:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0xa ; encoding: [0x0a,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -603,7 +582,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_0() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_0:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -630,7 +608,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_1() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_1:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -658,7 +635,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_2() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_2:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -685,7 +661,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_4() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_4:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -712,7 +687,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_8() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_8:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -739,7 +713,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_15() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_15:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -766,7 +739,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_42() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_42:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 10 ; encoding: [0x0a,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -795,10 +767,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_0()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 0)
    call void asm sideeffect "", ""()
@@ -823,10 +794,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_1()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x1 ; encoding: [0x01,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 1)
    call void asm sideeffect "", ""()
@@ -851,10 +821,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_2()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x2 ; encoding: [0x02,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 2)
    call void asm sideeffect "", ""()
@@ -879,10 +848,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_4()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_4:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x4 ; encoding: [0x04,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 4)
    call void asm sideeffect "", ""()
@@ -907,10 +875,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_8()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x8 ; encoding: [0x08,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 8)
    call void asm sideeffect "", ""()
@@ -935,10 +902,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_16()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 16)
    call void asm sideeffect "", ""()
@@ -963,10 +929,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_32()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 32)
    call void asm sideeffect "", ""()
@@ -991,10 +956,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_64()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_64:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 64)
    call void asm sideeffect "", ""()
@@ -1019,10 +983,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_128(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_128:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 128)
    call void asm sideeffect "", ""()
@@ -1047,10 +1010,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_15()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_15:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 15)
    call void asm sideeffect "", ""()
@@ -1075,10 +1037,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_255(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_255:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 255)
    call void asm sideeffect "", ""()
@@ -1104,10 +1065,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_597(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_597:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x5 ; encoding: [0x05,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 5 ; encoding: [0x05,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 5 ; encoding: [0x05,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 597)
    call void asm sideeffect "", ""()
@@ -1131,7 +1091,6 @@ define amdgpu_kernel void @test_setreg_set_8_bits_straddles_round_and_denorm() {
  ;
  ; GFX10-LABEL: test_setreg_set_8_bits_straddles_round_and_denorm:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 8), 0xff ; encoding: [0x81,0x38,0x80,0xba,0xff,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -1158,7 +1117,6 @@ define amdgpu_kernel void @test_setreg_set_4_bits_straddles_round_and_denorm() {
  ;
  ; GFX10-LABEL: test_setreg_set_4_bits_straddles_round_and_denorm:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 4), 15 ; encoding: [0x81,0x18,0x80,0xba,0x0f,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -1193,7 +1151,6 @@ define void @test_setreg_roundingmode_var_vgpr(i32 %var.mode) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_readfirstlane_b32 s4, v0 ; encoding: [0x00,0x05,0x08,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 3), s4 ; encoding: [0x01,0x10,0x84,0xb9]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot2.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot2.ll

index 172656f..26dc264 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot2.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot2.ll
@@ -22,7 +22,6 @@ define i32 @v_sdot2(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 false)
    ret i32 %r
@@ -46,7 +45,6 @@ define i32 @v_sdot2_clamp(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 true)
    ret i32 %r
@@ -70,7 +68,6 @@ define amdgpu_ps float @v_sdot2_sgpr_sgpr_sgpr(<2 x i16> inreg %a, <2 x i16> inr
  ; GFX10-LABEL: v_sdot2_sgpr_sgpr_sgpr:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, s0, s1, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 false)
@@ -96,7 +93,6 @@ define i32 @v_sdot2_inline_literal_a(<2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, 4, v0, v1 op_sel_hi:[0,1,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> <i16 4, i16 4>, <2 x i16> %b, i32 %c, i1 false)
    ret i32 %r
@@ -120,7 +116,6 @@ define i32 @v_sdot2_inline_literal_b(<2 x i16> %a, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, 4, v1 op_sel_hi:[1,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> %a, <2 x i16> <i16 4, i16 4>, i32 %c, i1 false)
    ret i32 %r
@@ -144,7 +139,6 @@ define i32 @v_sdot2_inline_literal_a_b(<2 x i16> %a, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, 8, 4, v1 op_sel_hi:[0,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> <i16 8, i16 8>, <2 x i16> <i16 4, i16 4>, i32 %c, i1 false)
    ret i32 %r
@@ -168,7 +162,6 @@ define i32 @v_sdot2_inline_literal_a_b_c() {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, 8, 4, 8 op_sel_hi:[0,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> <i16 8, i16 8>, <2 x i16> <i16 4, i16 4>, i32 8, i1 false)
    ret i32 %r
@@ -192,7 +185,6 @@ define i32 @v_sdot2_inline_literal_c(<2 x i16> %a, <2 x i16> %b) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, 7
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot2(<2 x i16> %a, <2 x i16> %b, i32 7, i1 false)
    ret i32 %r
@@ -216,7 +208,6 @@ define i32 @v_sdot2_fneg_a(<2 x half> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2 neg_lo:[1,0,0] neg_hi:[1,0,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
    %cast.neg.a = bitcast <2 x half> %neg.a to <2 x i16>
@@ -242,7 +233,6 @@ define i32 @v_sdot2_fneg_b(<2 x i16> %a, <2 x half> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2 neg_lo:[0,1,0] neg_hi:[0,1,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.b = fneg <2 x half> %b
    %cast.neg.b = bitcast <2 x half> %neg.b to <2 x i16>
@@ -270,7 +260,6 @@ define i32 @v_sdot2_fnegf32_c(<2 x i16> %a, <2 x i16> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v2, 0x80000000, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg float %c
@@ -299,7 +288,6 @@ define i32 @v_sdot2_fnegv2f16_c(<2 x i16> %a, <2 x i16> %b, <2 x half> %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v2, 0x80008000, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg <2 x half> %c
@@ -328,7 +316,6 @@ define i32 @v_sdot2_shuffle10_a(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_alignbit_b32 v0, v0, v0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %shuf.a = shufflevector <2 x i16> %a, <2 x i16> undef, <2 x i32> <i32 1, i32 0>
@@ -356,7 +343,6 @@ define i32 @v_sdot2_shuffle10_b(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_alignbit_b32 v1, v1, v1, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_i32_i16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %shuf.b = shufflevector <2 x i16> %b, <2 x i16> undef, <2 x i32> <i32 1, i32 0>
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot4.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot4.ll

index 7da6f66..156539d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot4.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot4.ll
@@ -15,7 +15,6 @@ define i32 @v_sdot4(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot4_i32_i8 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot4(i32 %a, i32 %b, i32 %c, i1 false)
    ret i32 %r
@@ -33,7 +32,6 @@ define i32 @v_sdot4_clamp(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot4_i32_i8 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot4(i32 %a, i32 %b, i32 %c, i1 true)
    ret i32 %r
@@ -70,7 +68,6 @@ define i32 @v_sdot4_cast_v4i8(<4 x i8> %a, <4 x i8> %b, i32 %c) {
  ; GFX10-NEXT:    s_mov_b32 s4, 8
  ; GFX10-NEXT:    s_movk_i32 s5, 0xff
  ; GFX10-NEXT:    v_lshlrev_b32_sdwa v1, s4, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, s5, v1
  ; GFX10-NEXT:    v_and_b32_e32 v1, s5, v2
  ; GFX10-NEXT:    v_and_b32_e32 v2, s5, v3
@@ -105,7 +102,6 @@ define i32 @v_sdot4_fnegf32_a(float %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80000000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot4_i32_i8 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg float %a
@@ -127,7 +123,6 @@ define i32 @v_sdot4_fnegv2f16_a(<2 x half> %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80008000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot4_i32_i8 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot8.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot8.ll

index c24c290..bd1d280 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot8.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot8.ll
@@ -15,7 +15,6 @@ define i32 @v_sdot8(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot8_i32_i4 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot8(i32 %a, i32 %b, i32 %c, i1 false)
    ret i32 %r
@@ -33,7 +32,6 @@ define i32 @v_sdot8_clamp(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot8_i32_i4 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.sdot8(i32 %a, i32 %b, i32 %c, i1 true)
    ret i32 %r
@@ -60,7 +58,6 @@ define i32 @v_sdot8_fnegf32_a(float %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80000000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot8_i32_i4 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg float %a
@@ -82,7 +79,6 @@ define i32 @v_sdot8_fnegv2f16_a(<2 x half> %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80008000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot8_i32_i4 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot2.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot2.ll

index 976536c..88fe59b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot2.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot2.ll
@@ -22,7 +22,6 @@ define i32 @v_udot2(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 false)
    ret i32 %r
@@ -46,7 +45,6 @@ define i32 @v_udot2_clamp(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 true)
    ret i32 %r
@@ -70,7 +68,6 @@ define amdgpu_ps float @v_udot2_sgpr_sgpr_sgpr(<2 x i16> inreg %a, <2 x i16> inr
  ; GFX10-LABEL: v_udot2_sgpr_sgpr_sgpr:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, s0, s1, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> %a, <2 x i16> %b, i32 %c, i1 false)
@@ -96,7 +93,6 @@ define i32 @v_udot2_inline_literal_a(<2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, 4, v0, v1 op_sel_hi:[0,1,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> <i16 4, i16 4>, <2 x i16> %b, i32 %c, i1 false)
    ret i32 %r
@@ -120,7 +116,6 @@ define i32 @v_udot2_inline_literal_b(<2 x i16> %a, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, 4, v1 op_sel_hi:[1,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> %a, <2 x i16> <i16 4, i16 4>, i32 %c, i1 false)
    ret i32 %r
@@ -144,7 +139,6 @@ define i32 @v_udot2_inline_literal_a_b(<2 x i16> %a, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, 8, 4, v1 op_sel_hi:[0,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> <i16 8, i16 8>, <2 x i16> <i16 4, i16 4>, i32 %c, i1 false)
    ret i32 %r
@@ -168,7 +162,6 @@ define i32 @v_udot2_inline_literal_a_b_c() {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, 8, 4, 8 op_sel_hi:[0,0,1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> <i16 8, i16 8>, <2 x i16> <i16 4, i16 4>, i32 8, i1 false)
    ret i32 %r
@@ -192,7 +185,6 @@ define i32 @v_udot2_inline_literal_c(<2 x i16> %a, <2 x i16> %b) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, 7
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot2(<2 x i16> %a, <2 x i16> %b, i32 7, i1 false)
    ret i32 %r
@@ -216,7 +208,6 @@ define i32 @v_udot2_fneg_a(<2 x half> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2 neg_lo:[1,0,0] neg_hi:[1,0,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
    %cast.neg.a = bitcast <2 x half> %neg.a to <2 x i16>
@@ -242,7 +233,6 @@ define i32 @v_udot2_fneg_b(<2 x i16> %a, <2 x half> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2 neg_lo:[0,1,0] neg_hi:[0,1,0]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.b = fneg <2 x half> %b
    %cast.neg.b = bitcast <2 x half> %neg.b to <2 x i16>
@@ -270,7 +260,6 @@ define i32 @v_udot2_fnegf32_c(<2 x i16> %a, <2 x i16> %b, float %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v2, 0x80000000, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg float %c
@@ -299,7 +288,6 @@ define i32 @v_udot2_fnegv2f16_c(<2 x i16> %a, <2 x i16> %b, <2 x half> %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v2, 0x80008000, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg <2 x half> %c
@@ -328,7 +316,6 @@ define i32 @v_udot2_shuffle10_a(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_alignbit_b32 v0, v0, v0, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %shuf.a = shufflevector <2 x i16> %a, <2 x i16> undef, <2 x i32> <i32 1, i32 0>
@@ -356,7 +343,6 @@ define i32 @v_udot2_shuffle10_b(<2 x i16> %a, <2 x i16> %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_alignbit_b32 v1, v1, v1, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot2_u32_u16 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %shuf.b = shufflevector <2 x i16> %b, <2 x i16> undef, <2 x i32> <i32 1, i32 0>
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot4.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot4.ll

index 248eb92..6bff376 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot4.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot4.ll
@@ -15,7 +15,6 @@ define i32 @v_udot4(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot4_u32_u8 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot4(i32 %a, i32 %b, i32 %c, i1 false)
    ret i32 %r
@@ -33,7 +32,6 @@ define i32 @v_udot4_clamp(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot4_u32_u8 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot4(i32 %a, i32 %b, i32 %c, i1 true)
    ret i32 %r
@@ -70,7 +68,6 @@ define i32 @v_udot4_cast_v4i8(<4 x i8> %a, <4 x i8> %b, i32 %c) {
  ; GFX10-NEXT:    s_mov_b32 s4, 8
  ; GFX10-NEXT:    s_movk_i32 s5, 0xff
  ; GFX10-NEXT:    v_lshlrev_b32_sdwa v1, s4, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:BYTE_0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, s5, v1
  ; GFX10-NEXT:    v_and_b32_e32 v1, s5, v2
  ; GFX10-NEXT:    v_and_b32_e32 v2, s5, v3
@@ -105,7 +102,6 @@ define i32 @v_udot4_fnegf32_a(float %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80000000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot4_u32_u8 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg float %a
@@ -127,7 +123,6 @@ define i32 @v_udot4_fnegv2f16_a(<2 x half> %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80008000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot4_u32_u8 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot8.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot8.ll

index 32d4a21..c9890e6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot8.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot8.ll
@@ -15,7 +15,6 @@ define i32 @v_udot8(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot8_u32_u4 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot8(i32 %a, i32 %b, i32 %c, i1 false)
    ret i32 %r
@@ -33,7 +32,6 @@ define i32 @v_udot8_clamp(i32 %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_dot8_u32_u4 v0, v0, v1, v2 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %r = call i32 @llvm.amdgcn.udot8(i32 %a, i32 %b, i32 %c, i1 true)
    ret i32 %r
@@ -60,7 +58,6 @@ define i32 @v_udot8_fnegf32_a(float %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80000000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot8_u32_u4 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg float %a
@@ -82,7 +79,6 @@ define i32 @v_udot8_fnegv2f16_a(<2 x half> %a, i32 %b, i32 %c) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_xor_b32_e32 v0, 0x80008000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_dot8_u32_u4 v0, v0, v1, v2
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %neg.a = fneg <2 x half> %a
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.update.dpp.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.update.dpp.ll

index 4badf1d..25c5411 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.update.dpp.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.update.dpp.ll
@@ -22,7 +22,6 @@ define amdgpu_kernel void @dpp_test(i32 addrspace(1)* %out, i32 %in1, i32 %in2)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    s_load_dwordx2 s[2:3], s[0:1], 0x2c
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s3
@@ -58,7 +57,6 @@ define amdgpu_kernel void @update_dpp64_test(i64 addrspace(1)* %arg, i64 %in1, i
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v4, 3, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dwordx2 v[0:1], v4, s[0:1]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s2
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.writelane.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.writelane.ll

index d40a034..23dad59 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.writelane.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.writelane.ll
@@ -21,7 +21,6 @@ define amdgpu_ps float @test_writelane_s_s_s(i32 inreg %data, i32 inreg %lane, i
  ; GFX10-LABEL: test_writelane_s_s_s:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, s3
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 %lane, i32 %vdst.in)
@@ -47,7 +46,6 @@ define amdgpu_ps float @test_writelane_s_s_imm(i32 inreg %data, i32 inreg %lane)
  ; GFX10-LABEL: test_writelane_s_s_imm:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 42
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, s3
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 %lane, i32 42)
@@ -74,7 +72,6 @@ define amdgpu_ps float @test_writelane_k_s_v(i32 inreg %lane, i32 %vdst.in) #0 {
  ; GFX10-LABEL: test_writelane_k_s_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_movk_i32 s0, 0x3e7
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v0, s0, s2
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 999, i32 %lane, i32 %vdst.in)
@@ -97,7 +94,6 @@ define amdgpu_ps float @test_writelane_imm_s_v(i32 inreg %lane, i32 %vdst.in) #0
  ; GFX10-LABEL: test_writelane_imm_s_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_writelane_b32 v0, 42, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 42, i32 %lane, i32 %vdst.in)
    %writelane.cast = bitcast i32 %writelane to float
@@ -121,7 +117,6 @@ define amdgpu_ps float @test_writelane_imminv2pi_s_v(i32 inreg %lane, i32 %vdst.
  ; GFX10-LABEL: test_writelane_imminv2pi_s_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_writelane_b32 v0, 0.15915494, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 bitcast (float 0x3FC45F3060000000 to i32), i32 %lane, i32 %vdst.in)
    %writelane.cast = bitcast i32 %writelane to float
@@ -144,7 +139,6 @@ define amdgpu_ps float @test_writelane_s_imm_v(i32 inreg %data, i32 %vdst.in) #0
  ; GFX10-LABEL: test_writelane_s_imm_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, 23
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 23, i32 %vdst.in)
    %writelane.cast = bitcast i32 %writelane to float
@@ -166,7 +160,6 @@ define amdgpu_ps float @test_writelane_s_k0_v(i32 inreg %data, i32 %vdst.in) #0
  ; GFX10-LABEL: test_writelane_s_k0_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_movk_i32 s0, 0x43
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, s0
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 67, i32 %vdst.in)
@@ -189,7 +182,6 @@ define amdgpu_ps float @test_writelane_s_k1_v(i32 inreg %data, i32 %vdst.in) #0
  ; GFX10-LABEL: test_writelane_s_k1_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, 32
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 32, i32 %vdst.in)
    %writelane.cast = bitcast i32 %writelane to float
@@ -219,7 +211,6 @@ define amdgpu_ps float @test_writelane_v_v_v(i32 %data, i32 %lane, i32 %vdst.in)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v2, s0, s1
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v2
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -248,7 +239,6 @@ define amdgpu_ps float @test_writelane_v_s_v(i32 %data, i32 inreg %lane, i32 %vd
  ; GFX10-LABEL: test_writelane_v_s_v:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v1, s0, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -286,7 +276,6 @@ define amdgpu_ps float @test_writelane_m0_s_v(i32 inreg %lane, i32 %vdst.in) #0
  ; GFX10-NEXT:    s_mov_b32 m0, -1
  ; GFX10-NEXT:    ;;#ASMEND
  ; GFX10-NEXT:    v_writelane_b32 v0, m0, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %m0 = call i32 asm "s_mov_b32 m0, -1", "={m0}"()
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %m0, i32 %lane, i32 %vdst.in)
@@ -317,7 +306,6 @@ define amdgpu_ps float @test_writelane_s_m0_v(i32 inreg %data, i32 %vdst.in) #0
  ; GFX10-NEXT:    s_mov_b32 m0, -1
  ; GFX10-NEXT:    ;;#ASMEND
  ; GFX10-NEXT:    v_writelane_b32 v0, s2, m0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %m0 = call i32 asm "s_mov_b32 m0, -1", "={m0}"()
    %writelane = call i32 @llvm.amdgcn.writelane(i32 %data, i32 %m0, i32 %vdst.in)
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/saddsat.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/saddsat.ll

index 26a8d81..8bb6c12 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/saddsat.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/saddsat.ll
@@ -50,7 +50,6 @@ define i7 @v_saddsat_i7(i7 %lhs, i7 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 9, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i16_e64 v0, 9, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -117,7 +116,6 @@ define amdgpu_ps i7 @s_saddsat_i7(i7 inreg %lhs, i7 inreg %rhs) {
  ; GFX10-LABEL: s_saddsat_i7:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 9, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_add_nc_i16 v0, s0, s1 clamp
@@ -174,7 +172,6 @@ define i8 @v_saddsat_i8(i8 %lhs, i8 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i16_e64 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -241,7 +238,6 @@ define amdgpu_ps i8 @s_saddsat_i8(i8 inreg %lhs, i8 inreg %rhs) {
  ; GFX10-LABEL: s_saddsat_i8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 8, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_add_nc_i16 v0, s0, s1 clamp
@@ -344,7 +340,6 @@ define i16 @v_saddsat_v2i8(i16 %lhs.arg, i16 %rhs.arg) {
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v3, s4, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v4, s4, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    s_movk_i32 s4, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v2, v3
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v2, v4
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -497,7 +492,6 @@ define amdgpu_ps i16 @s_saddsat_v2i8(i16 inreg %lhs.arg, i16 inreg %rhs.arg) {
  ; GFX10-NEXT:    s_lshl_b32 s2, s4, 8
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s0, s0, s3
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s1, s1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_add_i16 v0, s0, s1 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v0, 8, v0 op_sel_hi:[0,1]
@@ -693,7 +687,6 @@ define i32 @v_saddsat_v4i8(i32 %lhs.arg, i32 %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_and_or_b32 v2, v8, v5, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v3, 8, v3 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_add_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v2 op_sel_hi:[0,1]
@@ -979,7 +972,6 @@ define amdgpu_ps i32 @s_saddsat_v4i8(i32 inreg %lhs.arg, i32 inreg %rhs.arg) {
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_add_i16 v1, s2, s0 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_sdwa v2, v0, s0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 8, v2
@@ -1043,7 +1035,6 @@ define i24 @v_saddsat_i24(i24 %lhs, i24 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_i32 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -1102,7 +1093,6 @@ define amdgpu_ps i24 @s_saddsat_i24(i24 inreg %lhs, i24 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, 8
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, 8
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_i32 v0, s0, s1 clamp
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
@@ -1147,7 +1137,6 @@ define i32 @v_saddsat_i32(i32 %lhs, i32 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_i32 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i32 @llvm.sadd.sat.i32(i32 %lhs, i32 %rhs)
    ret i32 %result
@@ -1157,7 +1146,6 @@ define amdgpu_ps i32 @s_saddsat_i32(i32 inreg %lhs, i32 inreg %rhs) {
  ; GCN-LABEL: s_saddsat_i32:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    s_cmp_gt_i32 s0, 0
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_cselect_b32 s2, s0, 0
  ; GCN-NEXT:    s_sub_i32 s2, 0x7fffffff, s2
  ; GCN-NEXT:    s_cmp_lt_i32 s0, 0
@@ -1209,7 +1197,6 @@ define amdgpu_ps i32 @s_saddsat_i32(i32 inreg %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: s_saddsat_i32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i32 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.sadd.sat.i32(i32 %lhs, i32 %rhs)
@@ -1251,7 +1238,6 @@ define amdgpu_ps float @saddsat_i32_sv(i32 inreg %lhs, i32 %rhs) {
  ; GFX10-LABEL: saddsat_i32_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i32 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.sadd.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -1289,7 +1275,6 @@ define amdgpu_ps float @saddsat_i32_vs(i32 %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: saddsat_i32_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i32 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.sadd.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -1352,7 +1337,6 @@ define <2 x i32> @v_saddsat_v2i32(<2 x i32> %lhs, <2 x i32> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_i32 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i32> @llvm.sadd.sat.v2i32(<2 x i32> %lhs, <2 x i32> %rhs)
    ret <2 x i32> %result
@@ -1429,7 +1413,6 @@ define amdgpu_ps <2 x i32> @s_saddsat_v2i32(<2 x i32> inreg %lhs, <2 x i32> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i32 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1509,7 +1492,6 @@ define <3 x i32> @v_saddsat_v3i32(<3 x i32> %lhs, <3 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_i32 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <3 x i32> @llvm.sadd.sat.v3i32(<3 x i32> %lhs, <3 x i32> %rhs)
    ret <3 x i32> %result
@@ -1612,7 +1594,6 @@ define amdgpu_ps <3 x i32> @s_saddsat_v3i32(<3 x i32> inreg %lhs, <3 x i32> inre
  ; GFX10-NEXT:    v_add_nc_i32 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1709,7 +1690,6 @@ define <4 x i32> @v_saddsat_v4i32(<4 x i32> %lhs, <4 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_i32 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i32> @llvm.sadd.sat.v4i32(<4 x i32> %lhs, <4 x i32> %rhs)
    ret <4 x i32> %result
@@ -1838,7 +1818,6 @@ define amdgpu_ps <4 x i32> @s_saddsat_v4i32(<4 x i32> inreg %lhs, <4 x i32> inre
  ; GFX10-NEXT:    v_add_nc_i32 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1956,7 +1935,6 @@ define <5 x i32> @v_saddsat_v5i32(<5 x i32> %lhs, <5 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_i32 v2, v2, v7 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v3, v3, v8 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v4, v4, v9 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <5 x i32> @llvm.sadd.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -2116,7 +2094,6 @@ define amdgpu_ps <5 x i32> @s_saddsat_v5i32(<5 x i32> inreg %lhs, <5 x i32> inre
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
  ; GFX10-NEXT:    v_readfirstlane_b32 s3, v3
  ; GFX10-NEXT:    v_readfirstlane_b32 s4, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <5 x i32> @llvm.sadd.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -2406,7 +2383,6 @@ define <16 x i32> @v_saddsat_v16i32(<16 x i32> %lhs, <16 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_i32 v13, v13, v29 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v14, v14, v30 clamp
  ; GFX10-NEXT:    v_add_nc_i32 v15, v15, v31 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <16 x i32> @llvm.sadd.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -2863,7 +2839,6 @@ define amdgpu_ps <16 x i32> @s_saddsat_v16i32(<16 x i32> inreg %lhs, <16 x i32>
  ; GFX10-NEXT:    v_readfirstlane_b32 s13, v13
  ; GFX10-NEXT:    v_readfirstlane_b32 s14, v14
  ; GFX10-NEXT:    v_readfirstlane_b32 s15, v15
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <16 x i32> @llvm.sadd.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -2908,7 +2883,6 @@ define i16 @v_saddsat_i16(i16 %lhs, i16 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_i16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i16 @llvm.sadd.sat.i16(i16 %lhs, i16 %rhs)
    ret i16 %result
@@ -2964,7 +2938,6 @@ define amdgpu_ps i16 @s_saddsat_i16(i16 inreg %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: s_saddsat_i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.sadd.sat.i16(i16 %lhs, i16 %rhs)
@@ -3011,7 +2984,6 @@ define amdgpu_ps half @saddsat_i16_sv(i16 inreg %lhs, i16 %rhs) {
  ; GFX10-LABEL: saddsat_i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.sadd.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -3052,7 +3024,6 @@ define amdgpu_ps half @saddsat_i16_vs(i16 %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: saddsat_i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_i16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.sadd.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -3121,7 +3092,6 @@ define <2 x i16> @v_saddsat_v2i16(<2 x i16> %lhs, <2 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_add_i16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i16> @llvm.sadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    ret <2 x i16> %result
@@ -3222,7 +3192,6 @@ define amdgpu_ps i32 @s_saddsat_v2i16(<2 x i16> inreg %lhs, <2 x i16> inreg %rhs
  ; GFX10-LABEL: s_saddsat_v2i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_i16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.sadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
@@ -3305,7 +3274,6 @@ define amdgpu_ps float @saddsat_v2i16_sv(<2 x i16> inreg %lhs, <2 x i16> %rhs) {
  ; GFX10-LABEL: saddsat_v2i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_i16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.sadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -3375,7 +3343,6 @@ define amdgpu_ps float @saddsat_v2i16_vs(<2 x i16> %lhs, <2 x i16> inreg %rhs) {
  ; GFX10-LABEL: saddsat_v2i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_i16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.sadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -3504,7 +3471,6 @@ define <2 x float> @v_saddsat_v4i16(<4 x i16> %lhs, <4 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_add_i16 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i16> @llvm.sadd.sat.v4i16(<4 x i16> %lhs, <4 x i16> %rhs)
    %cast = bitcast <4 x i16> %result to <2 x float>
@@ -3680,7 +3646,6 @@ define amdgpu_ps <2 x i32> @s_saddsat_v4i16(<4 x i16> inreg %lhs, <4 x i16> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_i16 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -3855,7 +3820,6 @@ define <3 x float> @v_saddsat_v6i16(<6 x i16> %lhs, <6 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_add_i16 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <6 x i16> @llvm.sadd.sat.v6i16(<6 x i16> %lhs, <6 x i16> %rhs)
    %cast = bitcast <6 x i16> %result to <3 x float>
@@ -4105,7 +4069,6 @@ define amdgpu_ps <3 x i32> @s_saddsat_v6i16(<6 x i16> inreg %lhs, <6 x i16> inre
  ; GFX10-NEXT:    v_pk_add_i16 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -4312,7 +4275,6 @@ define <4 x float> @v_saddsat_v8i16(<8 x i16> %lhs, <8 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_add_i16 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <8 x i16> @llvm.sadd.sat.v8i16(<8 x i16> %lhs, <8 x i16> %rhs)
    %cast = bitcast <8 x i16> %result to <4 x float>
@@ -4636,7 +4598,6 @@ define amdgpu_ps <4 x i32> @s_saddsat_v8i16(<8 x i16> inreg %lhs, <8 x i16> inre
  ; GFX10-NEXT:    v_pk_add_i16 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_pk_add_i16 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -4726,7 +4687,6 @@ define i64 @v_saddsat_i64(i64 %lhs, i64 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v10, vcc_lo, v0, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v11, vcc_lo, v1, v3, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_i64_e32 vcc_lo, 0, v[2:3]
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v6, 31, v11
@@ -4832,7 +4792,6 @@ define amdgpu_ps i64 @s_saddsat_i64(i64 inreg %lhs, i64 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s5, 1, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s4
  ; GFX10-NEXT:    s_and_b32 s5, s5, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s5, 0
  ; GFX10-NEXT:    s_addc_u32 s5, s1, s3
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s0, s[4:5], s[0:1]
@@ -4906,7 +4865,6 @@ define amdgpu_ps <2 x float> @saddsat_i64_sv(i64 inreg %lhs, i64 %rhs) {
  ; GFX10-LABEL: saddsat_i64_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v2, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_i64_e32 vcc_lo, 0, v[0:1]
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v4, 31, v3
@@ -4974,7 +4932,6 @@ define amdgpu_ps <2 x float> @saddsat_i64_vs(i64 %lhs, i64 inreg %rhs) {
  ; GFX10-LABEL: saddsat_i64_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v2, vcc_lo, v0, s0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s1, s[0:1], 0
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v4, 31, v3
@@ -5082,7 +5039,6 @@ define <2 x i64> @v_saddsat_v2i64(<2 x i64> %lhs, <2 x i64> %rhs) {
  ; GFX10-NEXT:    v_cmp_gt_i64_e64 s6, 0, v[6:7]
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v9, vcc_lo, v15, v5, vcc_lo
  ; GFX10-NEXT:    v_add_co_u32_e64 v19, vcc_lo, v17, v6
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v20, vcc_lo, v18, v7, vcc_lo
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v12, 31, v9
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[8:9], v[14:15]
@@ -5273,7 +5229,6 @@ define amdgpu_ps <2 x i64> @s_saddsat_v2i64(<2 x i64> inreg %lhs, <2 x i64> inre
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_brev_b32 s10, 1
  ; GFX10-NEXT:    s_addc_u32 s9, s1, s5
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s0, s[8:9], s[0:1]
  ; GFX10-NEXT:    s_ashr_i32 s1, s9, 31
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s9
@@ -5592,7 +5547,6 @@ define amdgpu_ps i128 @s_saddsat_i128(i128 inreg %lhs, i128 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s9, 1, 0
  ; GFX10-NEXT:    s_movk_i32 s12, 0x7f
  ; GFX10-NEXT:    s_and_b32 s9, s9, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_addc_u32 s9, s1, s5
  ; GFX10-NEXT:    s_cselect_b32 s10, 1, 0
@@ -5862,7 +5816,6 @@ define amdgpu_ps <4 x float> @saddsat_i128_sv(i128 inreg %lhs, i128 %rhs) {
  ; GFX10-LABEL: saddsat_i128_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v4, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v5, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v6, vcc_lo, s2, v2, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v7, vcc_lo, s3, v3, vcc_lo
@@ -6126,7 +6079,6 @@ define amdgpu_ps <4 x float> @saddsat_i128_vs(i128 %lhs, i128 inreg %rhs) {
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[15:16], v[5:6]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v8, 0, 1, s0
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s0, s[2:3], 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v7, 31, v20
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[19:20], v[9:10]
@@ -6522,7 +6474,6 @@ define <2 x i128> @v_saddsat_v2i128(<2 x i128> %lhs, <2 x i128> %rhs) {
  ; GFX10-NEXT:    v_mov_b32_e32 v25, v7
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[18:19], v[20:21]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_eq_u64_e32 vcc_lo, v[18:19], v[20:21]
  ; GFX10-NEXT:    v_cndmask_b32_e32 v20, v1, v0, vcc_lo
@@ -7152,7 +7103,6 @@ define amdgpu_ps <2 x i128> @s_saddsat_v2i128(<2 x i128> inreg %lhs, <2 x i128>
  ; GFX10-NEXT:    s_and_b32 s17, s17, 1
  ; GFX10-NEXT:    s_mov_b32 s47, s1
  ; GFX10-NEXT:    s_cmp_lg_u32 s17, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_addc_u32 s29, s1, s9
  ; GFX10-NEXT:    s_cselect_b32 s18, 1, 0
  ; GFX10-NEXT:    v_cmp_lt_u64_e64 s0, s[28:29], s[46:47]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/ssubsat.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/ssubsat.ll

index 76aa2f5..6209f7e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/ssubsat.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/ssubsat.ll
@@ -50,7 +50,6 @@ define i7 @v_ssubsat_i7(i7 %lhs, i7 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 9, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i16_e64 v0, 9, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -117,7 +116,6 @@ define amdgpu_ps i7 @s_ssubsat_i7(i7 inreg %lhs, i7 inreg %rhs) {
  ; GFX10-LABEL: s_ssubsat_i7:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 9, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_sub_nc_i16 v0, s0, s1 clamp
@@ -174,7 +172,6 @@ define i8 @v_ssubsat_i8(i8 %lhs, i8 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i16_e64 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -241,7 +238,6 @@ define amdgpu_ps i8 @s_ssubsat_i8(i8 inreg %lhs, i8 inreg %rhs) {
  ; GFX10-LABEL: s_ssubsat_i8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 8, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_sub_nc_i16 v0, s0, s1 clamp
@@ -344,7 +340,6 @@ define i16 @v_ssubsat_v2i8(i16 %lhs.arg, i16 %rhs.arg) {
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v3, s4, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v4, s4, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    s_movk_i32 s4, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v2, v3
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v2, v4
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -497,7 +492,6 @@ define amdgpu_ps i16 @s_ssubsat_v2i8(i16 inreg %lhs.arg, i16 inreg %rhs.arg) {
  ; GFX10-NEXT:    s_lshl_b32 s2, s4, 8
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s0, s0, s3
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s1, s1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_sub_i16 v0, s0, s1 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v0, 8, v0 op_sel_hi:[0,1]
@@ -693,7 +687,6 @@ define i32 @v_ssubsat_v4i8(i32 %lhs.arg, i32 %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_and_or_b32 v2, v8, v5, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v3, 8, v3 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_sub_i16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v2 op_sel_hi:[0,1]
@@ -979,7 +972,6 @@ define amdgpu_ps i32 @s_ssubsat_v4i8(i32 inreg %lhs.arg, i32 inreg %rhs.arg) {
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_sub_i16 v1, s2, s0 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_sdwa v2, v0, s0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
  ; GFX10-NEXT:    v_pk_ashrrev_i16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 8, v2
@@ -1043,7 +1035,6 @@ define i24 @v_ssubsat_i24(i24 %lhs, i24 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_i32 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -1102,7 +1093,6 @@ define amdgpu_ps i24 @s_ssubsat_i24(i24 inreg %lhs, i24 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, 8
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, 8
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_i32 v0, s0, s1 clamp
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
@@ -1147,7 +1137,6 @@ define i32 @v_ssubsat_i32(i32 %lhs, i32 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_i32 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i32 @llvm.ssub.sat.i32(i32 %lhs, i32 %rhs)
    ret i32 %result
@@ -1194,7 +1183,6 @@ define amdgpu_ps i32 @s_ssubsat_i32(i32 inreg %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: s_ssubsat_i32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i32 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.ssub.sat.i32(i32 %lhs, i32 %rhs)
@@ -1236,7 +1224,6 @@ define amdgpu_ps float @ssubsat_i32_sv(i32 inreg %lhs, i32 %rhs) {
  ; GFX10-LABEL: ssubsat_i32_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i32 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.ssub.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -1274,7 +1261,6 @@ define amdgpu_ps float @ssubsat_i32_vs(i32 %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: ssubsat_i32_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i32 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.ssub.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -1337,7 +1323,6 @@ define <2 x i32> @v_ssubsat_v2i32(<2 x i32> %lhs, <2 x i32> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_i32 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i32> @llvm.ssub.sat.v2i32(<2 x i32> %lhs, <2 x i32> %rhs)
    ret <2 x i32> %result
@@ -1414,7 +1399,6 @@ define amdgpu_ps <2 x i32> @s_ssubsat_v2i32(<2 x i32> inreg %lhs, <2 x i32> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i32 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1494,7 +1478,6 @@ define <3 x i32> @v_ssubsat_v3i32(<3 x i32> %lhs, <3 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_i32 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <3 x i32> @llvm.ssub.sat.v3i32(<3 x i32> %lhs, <3 x i32> %rhs)
    ret <3 x i32> %result
@@ -1597,7 +1580,6 @@ define amdgpu_ps <3 x i32> @s_ssubsat_v3i32(<3 x i32> inreg %lhs, <3 x i32> inre
  ; GFX10-NEXT:    v_sub_nc_i32 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1694,7 +1676,6 @@ define <4 x i32> @v_ssubsat_v4i32(<4 x i32> %lhs, <4 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_i32 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i32> @llvm.ssub.sat.v4i32(<4 x i32> %lhs, <4 x i32> %rhs)
    ret <4 x i32> %result
@@ -1823,7 +1804,6 @@ define amdgpu_ps <4 x i32> @s_ssubsat_v4i32(<4 x i32> inreg %lhs, <4 x i32> inre
  ; GFX10-NEXT:    v_sub_nc_i32 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1941,7 +1921,6 @@ define <5 x i32> @v_ssubsat_v5i32(<5 x i32> %lhs, <5 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_i32 v2, v2, v7 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v3, v3, v8 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v4, v4, v9 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <5 x i32> @llvm.ssub.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -2101,7 +2080,6 @@ define amdgpu_ps <5 x i32> @s_ssubsat_v5i32(<5 x i32> inreg %lhs, <5 x i32> inre
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
  ; GFX10-NEXT:    v_readfirstlane_b32 s3, v3
  ; GFX10-NEXT:    v_readfirstlane_b32 s4, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <5 x i32> @llvm.ssub.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -2391,7 +2369,6 @@ define <16 x i32> @v_ssubsat_v16i32(<16 x i32> %lhs, <16 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_i32 v13, v13, v29 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v14, v14, v30 clamp
  ; GFX10-NEXT:    v_sub_nc_i32 v15, v15, v31 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <16 x i32> @llvm.ssub.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -2848,7 +2825,6 @@ define amdgpu_ps <16 x i32> @s_ssubsat_v16i32(<16 x i32> inreg %lhs, <16 x i32>
  ; GFX10-NEXT:    v_readfirstlane_b32 s13, v13
  ; GFX10-NEXT:    v_readfirstlane_b32 s14, v14
  ; GFX10-NEXT:    v_readfirstlane_b32 s15, v15
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <16 x i32> @llvm.ssub.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -2893,7 +2869,6 @@ define i16 @v_ssubsat_i16(i16 %lhs, i16 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_i16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i16 @llvm.ssub.sat.i16(i16 %lhs, i16 %rhs)
    ret i16 %result
@@ -2949,7 +2924,6 @@ define amdgpu_ps i16 @s_ssubsat_i16(i16 inreg %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: s_ssubsat_i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.ssub.sat.i16(i16 %lhs, i16 %rhs)
@@ -2996,7 +2970,6 @@ define amdgpu_ps half @ssubsat_i16_sv(i16 inreg %lhs, i16 %rhs) {
  ; GFX10-LABEL: ssubsat_i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.ssub.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -3037,7 +3010,6 @@ define amdgpu_ps half @ssubsat_i16_vs(i16 %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: ssubsat_i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_i16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.ssub.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -3106,7 +3078,6 @@ define <2 x i16> @v_ssubsat_v2i16(<2 x i16> %lhs, <2 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_sub_i16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i16> @llvm.ssub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    ret <2 x i16> %result
@@ -3207,7 +3178,6 @@ define amdgpu_ps i32 @s_ssubsat_v2i16(<2 x i16> inreg %lhs, <2 x i16> inreg %rhs
  ; GFX10-LABEL: s_ssubsat_v2i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_i16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.ssub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
@@ -3290,7 +3260,6 @@ define amdgpu_ps float @ssubsat_v2i16_sv(<2 x i16> inreg %lhs, <2 x i16> %rhs) {
  ; GFX10-LABEL: ssubsat_v2i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_i16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.ssub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -3360,7 +3329,6 @@ define amdgpu_ps float @ssubsat_v2i16_vs(<2 x i16> %lhs, <2 x i16> inreg %rhs) {
  ; GFX10-LABEL: ssubsat_v2i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_i16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.ssub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -3489,7 +3457,6 @@ define <2 x float> @v_ssubsat_v4i16(<4 x i16> %lhs, <4 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_sub_i16 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i16> @llvm.ssub.sat.v4i16(<4 x i16> %lhs, <4 x i16> %rhs)
    %cast = bitcast <4 x i16> %result to <2 x float>
@@ -3665,7 +3632,6 @@ define amdgpu_ps <2 x i32> @s_ssubsat_v4i16(<4 x i16> inreg %lhs, <4 x i16> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_i16 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -3840,7 +3806,6 @@ define <3 x float> @v_ssubsat_v6i16(<6 x i16> %lhs, <6 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_sub_i16 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <6 x i16> @llvm.ssub.sat.v6i16(<6 x i16> %lhs, <6 x i16> %rhs)
    %cast = bitcast <6 x i16> %result to <3 x float>
@@ -4090,7 +4055,6 @@ define amdgpu_ps <3 x i32> @s_ssubsat_v6i16(<6 x i16> inreg %lhs, <6 x i16> inre
  ; GFX10-NEXT:    v_pk_sub_i16 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -4297,7 +4261,6 @@ define <4 x float> @v_ssubsat_v8i16(<8 x i16> %lhs, <8 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_sub_i16 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <8 x i16> @llvm.ssub.sat.v8i16(<8 x i16> %lhs, <8 x i16> %rhs)
    %cast = bitcast <8 x i16> %result to <4 x float>
@@ -4621,7 +4584,6 @@ define amdgpu_ps <4 x i32> @s_ssubsat_v8i16(<8 x i16> inreg %lhs, <8 x i16> inre
  ; GFX10-NEXT:    v_pk_sub_i16 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_pk_sub_i16 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -4711,7 +4673,6 @@ define i64 @v_ssubsat_i64(i64 %lhs, i64 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_co_u32_e64 v10, vcc_lo, v0, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v11, vcc_lo, v1, v3, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, 0, v[2:3]
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v6, 31, v11
@@ -4817,7 +4778,6 @@ define amdgpu_ps i64 @s_ssubsat_i64(i64 inreg %lhs, i64 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s5, 1, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, s4
  ; GFX10-NEXT:    s_and_b32 s5, s5, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s5, 0
  ; GFX10-NEXT:    s_subb_u32 s5, s1, s3
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s0, s[4:5], s[0:1]
@@ -4891,7 +4851,6 @@ define amdgpu_ps <2 x float> @ssubsat_i64_sv(i64 inreg %lhs, i64 %rhs) {
  ; GFX10-LABEL: ssubsat_i64_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_co_u32_e64 v2, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, 0, v[0:1]
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v4, 31, v3
@@ -4959,7 +4918,6 @@ define amdgpu_ps <2 x float> @ssubsat_i64_vs(i64 %lhs, i64 inreg %rhs) {
  ; GFX10-LABEL: ssubsat_i64_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_co_u32_e64 v2, vcc_lo, v0, s0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_subrev_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_i64_e64 s1, s[0:1], 0
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v4, 31, v3
@@ -5067,7 +5025,6 @@ define <2 x i64> @v_ssubsat_v2i64(<2 x i64> %lhs, <2 x i64> %rhs) {
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s6, 0, v[6:7]
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v9, vcc_lo, v15, v5, vcc_lo
  ; GFX10-NEXT:    v_sub_co_u32_e64 v19, vcc_lo, v17, v6
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v20, vcc_lo, v18, v7, vcc_lo
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v12, 31, v9
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[8:9], v[14:15]
@@ -5258,7 +5215,6 @@ define amdgpu_ps <2 x i64> @s_ssubsat_v2i64(<2 x i64> inreg %lhs, <2 x i64> inre
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_brev_b32 s10, 1
  ; GFX10-NEXT:    s_subb_u32 s9, s1, s5
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cmp_lt_i64_e64 s0, s[8:9], s[0:1]
  ; GFX10-NEXT:    s_ashr_i32 s1, s9, 31
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s9
@@ -5577,7 +5533,6 @@ define amdgpu_ps i128 @s_ssubsat_i128(i128 inreg %lhs, i128 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s9, 1, 0
  ; GFX10-NEXT:    s_movk_i32 s12, 0x7f
  ; GFX10-NEXT:    s_and_b32 s9, s9, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_subb_u32 s9, s1, s5
  ; GFX10-NEXT:    s_cselect_b32 s10, 1, 0
@@ -5847,7 +5802,6 @@ define amdgpu_ps <4 x float> @ssubsat_i128_sv(i128 inreg %lhs, i128 %rhs) {
  ; GFX10-LABEL: ssubsat_i128_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_co_u32_e64 v4, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v5, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v6, vcc_lo, s2, v2, vcc_lo
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v7, vcc_lo, s3, v3, vcc_lo
@@ -6111,7 +6065,6 @@ define amdgpu_ps <4 x float> @ssubsat_i128_vs(i128 %lhs, i128 inreg %rhs) {
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[15:16], v[5:6]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v8, 0, 1, s0
  ; GFX10-NEXT:    v_cmp_gt_i64_e64 s0, s[2:3], 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_ashrrev_i32_e32 v7, 31, v20
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[19:20], v[9:10]
@@ -6507,7 +6460,6 @@ define <2 x i128> @v_ssubsat_v2i128(<2 x i128> %lhs, <2 x i128> %rhs) {
  ; GFX10-NEXT:    v_mov_b32_e32 v25, v7
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_i64_e32 vcc_lo, v[18:19], v[20:21]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_eq_u64_e32 vcc_lo, v[18:19], v[20:21]
  ; GFX10-NEXT:    v_cndmask_b32_e32 v20, v1, v0, vcc_lo
@@ -7137,7 +7089,6 @@ define amdgpu_ps <2 x i128> @s_ssubsat_v2i128(<2 x i128> inreg %lhs, <2 x i128>
  ; GFX10-NEXT:    s_and_b32 s17, s17, 1
  ; GFX10-NEXT:    s_mov_b32 s47, s1
  ; GFX10-NEXT:    s_cmp_lg_u32 s17, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_subb_u32 s29, s1, s9
  ; GFX10-NEXT:    s_cselect_b32 s18, 1, 0
  ; GFX10-NEXT:    v_cmp_lt_u64_e64 s0, s[28:29], s[46:47]
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/uaddsat.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/uaddsat.ll

index 8c2d184..5234d02 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/uaddsat.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/uaddsat.ll
@@ -40,7 +40,6 @@ define i7 @v_uaddsat_i7(i7 %lhs, i7 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 9, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -85,7 +84,6 @@ define amdgpu_ps i7 @s_uaddsat_i7(i7 inreg %lhs, i7 inreg %rhs) {
  ; GFX10-LABEL: s_uaddsat_i7:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 9, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, s0, s1 clamp
@@ -132,7 +130,6 @@ define i8 @v_uaddsat_i8(i8 %lhs, i8 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -177,7 +174,6 @@ define amdgpu_ps i8 @s_uaddsat_i8(i8 inreg %lhs, i8 inreg %rhs) {
  ; GFX10-LABEL: s_uaddsat_i8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 8, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, s0, s1 clamp
@@ -252,7 +248,6 @@ define i16 @v_uaddsat_v2i8(i16 %lhs.arg, i16 %rhs.arg) {
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v3, s4, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v4, s4, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    s_movk_i32 s4, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v2, v3
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v2, v4
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -350,7 +345,6 @@ define amdgpu_ps i16 @s_uaddsat_v2i8(i16 inreg %lhs.arg, i16 inreg %rhs.arg) {
  ; GFX10-NEXT:    s_lshl_b32 s2, s4, 8
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s0, s0, s3
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s1, s1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_add_u16 v0, s0, s1 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -494,7 +488,6 @@ define i32 @v_uaddsat_v4i8(i32 %lhs.arg, i32 %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_and_or_b32 v2, v8, v5, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v3, 8, v3 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_add_u16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v2 op_sel_hi:[0,1]
@@ -677,7 +670,6 @@ define amdgpu_ps i32 @s_uaddsat_v4i8(i32 inreg %lhs.arg, i32 inreg %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_add_u16 v1, s2, s0 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_sdwa v2, v0, s0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 8, v2
@@ -731,7 +723,6 @@ define i24 @v_uaddsat_i24(i24 %lhs, i24 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -775,7 +766,6 @@ define amdgpu_ps i24 @s_uaddsat_i24(i24 inreg %lhs, i24 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, 8
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, 8
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, s0, s1 clamp
  ; GFX10-NEXT:    v_lshrrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
@@ -810,7 +800,6 @@ define i32 @v_uaddsat_i32(i32 %lhs, i32 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i32 @llvm.uadd.sat.i32(i32 %lhs, i32 %rhs)
    ret i32 %result
@@ -842,7 +831,6 @@ define amdgpu_ps i32 @s_uaddsat_i32(i32 inreg %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: s_uaddsat_i32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.uadd.sat.i32(i32 %lhs, i32 %rhs)
@@ -870,7 +858,6 @@ define amdgpu_ps float @uaddsat_i32_sv(i32 inreg %lhs, i32 %rhs) {
  ; GFX10-LABEL: uaddsat_i32_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.uadd.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -898,7 +885,6 @@ define amdgpu_ps float @uaddsat_i32_vs(i32 %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: uaddsat_i32_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.uadd.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -937,7 +923,6 @@ define <2 x i32> @v_uaddsat_v2i32(<2 x i32> %lhs, <2 x i32> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i32> @llvm.uadd.sat.v2i32(<2 x i32> %lhs, <2 x i32> %rhs)
    ret <2 x i32> %result
@@ -980,7 +965,6 @@ define amdgpu_ps <2 x i32> @s_uaddsat_v2i32(<2 x i32> inreg %lhs, <2 x i32> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -1026,7 +1010,6 @@ define <3 x i32> @v_uaddsat_v3i32(<3 x i32> %lhs, <3 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <3 x i32> @llvm.uadd.sat.v3i32(<3 x i32> %lhs, <3 x i32> %rhs)
    ret <3 x i32> %result
@@ -1080,7 +1063,6 @@ define amdgpu_ps <3 x i32> @s_uaddsat_v3i32(<3 x i32> inreg %lhs, <3 x i32> inre
  ; GFX10-NEXT:    v_add_nc_u32_e64 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1133,7 +1115,6 @@ define <4 x i32> @v_uaddsat_v4i32(<4 x i32> %lhs, <4 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i32> @llvm.uadd.sat.v4i32(<4 x i32> %lhs, <4 x i32> %rhs)
    ret <4 x i32> %result
@@ -1198,7 +1179,6 @@ define amdgpu_ps <4 x i32> @s_uaddsat_v4i32(<4 x i32> inreg %lhs, <4 x i32> inre
  ; GFX10-NEXT:    v_add_nc_u32_e64 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1258,7 +1238,6 @@ define <5 x i32> @v_uaddsat_v5i32(<5 x i32> %lhs, <5 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_u32_e64 v2, v2, v7 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v3, v3, v8 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v4, v4, v9 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <5 x i32> @llvm.uadd.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -1339,7 +1318,6 @@ define amdgpu_ps <5 x i32> @s_uaddsat_v5i32(<5 x i32> inreg %lhs, <5 x i32> inre
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
  ; GFX10-NEXT:    v_readfirstlane_b32 s3, v3
  ; GFX10-NEXT:    v_readfirstlane_b32 s4, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <5 x i32> @llvm.uadd.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -1461,7 +1439,6 @@ define <16 x i32> @v_uaddsat_v16i32(<16 x i32> %lhs, <16 x i32> %rhs) {
  ; GFX10-NEXT:    v_add_nc_u32_e64 v13, v13, v29 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v14, v14, v30 clamp
  ; GFX10-NEXT:    v_add_nc_u32_e64 v15, v15, v31 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <16 x i32> @llvm.uadd.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -1674,7 +1651,6 @@ define amdgpu_ps <16 x i32> @s_uaddsat_v16i32(<16 x i32> inreg %lhs, <16 x i32>
  ; GFX10-NEXT:    v_readfirstlane_b32 s13, v13
  ; GFX10-NEXT:    v_readfirstlane_b32 s14, v14
  ; GFX10-NEXT:    v_readfirstlane_b32 s15, v15
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <16 x i32> @llvm.uadd.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -1709,7 +1685,6 @@ define i16 @v_uaddsat_i16(i16 %lhs, i16 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i16 @llvm.uadd.sat.i16(i16 %lhs, i16 %rhs)
    ret i16 %result
@@ -1744,7 +1719,6 @@ define amdgpu_ps i16 @s_uaddsat_i16(i16 inreg %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: s_uaddsat_i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.uadd.sat.i16(i16 %lhs, i16 %rhs)
@@ -1775,7 +1749,6 @@ define amdgpu_ps half @uaddsat_i16_sv(i16 inreg %lhs, i16 %rhs) {
  ; GFX10-LABEL: uaddsat_i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.uadd.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -1806,7 +1779,6 @@ define amdgpu_ps half @uaddsat_i16_vs(i16 %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: uaddsat_i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u16_e64 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.uadd.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -1852,7 +1824,6 @@ define <2 x i16> @v_uaddsat_v2i16(<2 x i16> %lhs, <2 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_add_u16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i16> @llvm.uadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    ret <2 x i16> %result
@@ -1903,7 +1874,6 @@ define amdgpu_ps i32 @s_uaddsat_v2i16(<2 x i16> inreg %lhs, <2 x i16> inreg %rhs
  ; GFX10-LABEL: s_uaddsat_v2i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_u16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.uadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
@@ -1949,7 +1919,6 @@ define amdgpu_ps float @uaddsat_v2i16_sv(<2 x i16> inreg %lhs, <2 x i16> %rhs) {
  ; GFX10-LABEL: uaddsat_v2i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_u16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.uadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -1994,7 +1963,6 @@ define amdgpu_ps float @uaddsat_v2i16_vs(<2 x i16> %lhs, <2 x i16> inreg %rhs) {
  ; GFX10-LABEL: uaddsat_v2i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_u16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.uadd.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -2073,7 +2041,6 @@ define <2 x float> @v_uaddsat_v4i16(<4 x i16> %lhs, <4 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_add_u16 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i16> @llvm.uadd.sat.v4i16(<4 x i16> %lhs, <4 x i16> %rhs)
    %cast = bitcast <4 x i16> %result to <2 x float>
@@ -2154,7 +2121,6 @@ define amdgpu_ps <2 x i32> @s_uaddsat_v4i16(<4 x i16> inreg %lhs, <4 x i16> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_add_u16 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -2256,7 +2222,6 @@ define <3 x float> @v_uaddsat_v6i16(<6 x i16> %lhs, <6 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_add_u16 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <6 x i16> @llvm.uadd.sat.v6i16(<6 x i16> %lhs, <6 x i16> %rhs)
    %cast = bitcast <6 x i16> %result to <3 x float>
@@ -2366,7 +2331,6 @@ define amdgpu_ps <3 x i32> @s_uaddsat_v6i16(<6 x i16> inreg %lhs, <6 x i16> inre
  ; GFX10-NEXT:    v_pk_add_u16 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -2478,7 +2442,6 @@ define <4 x float> @v_uaddsat_v8i16(<8 x i16> %lhs, <8 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_add_u16 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <8 x i16> @llvm.uadd.sat.v8i16(<8 x i16> %lhs, <8 x i16> %rhs)
    %cast = bitcast <8 x i16> %result to <4 x float>
@@ -2617,7 +2580,6 @@ define amdgpu_ps <4 x i32> @s_uaddsat_v8i16(<8 x i16> inreg %lhs, <8 x i16> inre
  ; GFX10-NEXT:    v_pk_add_u16 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_pk_add_u16 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -2689,7 +2651,6 @@ define i64 @v_uaddsat_i64(i64 %lhs, i64 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, v1, v3, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[0:1], v[2:3]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v0, -1, vcc_lo
@@ -2758,7 +2719,6 @@ define amdgpu_ps i64 @s_uaddsat_i64(i64 inreg %lhs, i64 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_add_u32 s0, s0, s2
  ; GFX10-NEXT:    s_cselect_b32 s4, 1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_and_b32 s4, s4, 1
  ; GFX10-NEXT:    s_cmp_lg_u32 s4, 0
  ; GFX10-NEXT:    s_addc_u32 s1, s1, s3
@@ -2806,7 +2766,6 @@ define amdgpu_ps <2 x float> @uaddsat_i64_sv(i64 inreg %lhs, i64 %rhs) {
  ; GFX10-LABEL: uaddsat_i64_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v2, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[2:3], v[0:1]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v2, -1, vcc_lo
@@ -2851,7 +2810,6 @@ define amdgpu_ps <2 x float> @uaddsat_i64_vs(i64 %lhs, i64 inreg %rhs) {
  ; GFX10-LABEL: uaddsat_i64_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, s0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_u64_e32 vcc_lo, s[0:1], v[0:1]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v0, -1, vcc_lo
@@ -2916,7 +2874,6 @@ define <2 x i64> @v_uaddsat_v2i64(<2 x i64> %lhs, <2 x i64> %rhs) {
  ; GFX10-NEXT:    v_mov_b32_e32 v11, v5
  ; GFX10-NEXT:    v_mov_b32_e32 v15, v6
  ; GFX10-NEXT:    v_mov_b32_e32 v16, v7
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, v10
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, v1, v11, vcc_lo
  ; GFX10-NEXT:    v_add_co_u32_e64 v5, vcc_lo, v2, v15
@@ -3033,7 +2990,6 @@ define amdgpu_ps <2 x i64> @s_uaddsat_v2i64(<2 x i64> inreg %lhs, <2 x i64> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_add_u32 s0, s0, s4
  ; GFX10-NEXT:    s_cselect_b32 s8, 1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_and_b32 s8, s8, 1
  ; GFX10-NEXT:    s_cmp_lg_u32 s8, 0
  ; GFX10-NEXT:    s_addc_u32 s1, s1, s5
@@ -3191,7 +3147,6 @@ define amdgpu_ps i128 @s_uaddsat_i128(i128 inreg %lhs, i128 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_add_u32 s0, s0, s4
  ; GFX10-NEXT:    s_cselect_b32 s8, 1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_and_b32 s8, s8, 1
  ; GFX10-NEXT:    s_cmp_lg_u32 s8, 0
  ; GFX10-NEXT:    s_addc_u32 s1, s1, s5
@@ -3300,7 +3255,6 @@ define amdgpu_ps <4 x float> @uaddsat_i128_sv(i128 inreg %lhs, i128 %rhs) {
  ; GFX10-LABEL: uaddsat_i128_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v10, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v11, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v4, vcc_lo, s2, v2, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v5, vcc_lo, s3, v3, vcc_lo
@@ -3395,7 +3349,6 @@ define amdgpu_ps <4 x float> @uaddsat_i128_vs(i128 %lhs, i128 inreg %rhs) {
  ; GFX10-LABEL: uaddsat_i128_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, s0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v2, vcc_lo, s2, v2, vcc_lo
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v3, vcc_lo, s3, v3, vcc_lo
@@ -3546,7 +3499,6 @@ define <2 x i128> @v_uaddsat_v2i128(<2 x i128> %lhs, <2 x i128> %rhs) {
  ; GFX10-NEXT:    v_mov_b32_e32 v21, v15
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v3, vcc_lo, v3, v17, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[0:1], v[18:19]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v8, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_add_co_u32_e64 v4, vcc_lo, v4, v10
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v5, vcc_lo, v5, v11, vcc_lo
@@ -3830,7 +3782,6 @@ define amdgpu_ps <2 x i128> @s_uaddsat_v2i128(<2 x i128> inreg %lhs, <2 x i128>
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_add_u32 s0, s0, s8
  ; GFX10-NEXT:    s_cselect_b32 s16, 1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_and_b32 s16, s16, 1
  ; GFX10-NEXT:    s_cmp_lg_u32 s16, 0
  ; GFX10-NEXT:    s_addc_u32 s1, s1, s9
diff --git a/llvm/test/CodeGen/AMDGPU/GlobalISel/usubsat.ll b/llvm/test/CodeGen/AMDGPU/GlobalISel/usubsat.ll

index 6dabfc3..3a44903 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/GlobalISel/usubsat.ll
+++ b/llvm/test/CodeGen/AMDGPU/GlobalISel/usubsat.ll
@@ -39,7 +39,6 @@ define i7 @v_usubsat_i7(i7 %lhs, i7 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 9, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b16_e64 v0, 9, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -83,7 +82,6 @@ define amdgpu_ps i7 @s_usubsat_i7(i7 inreg %lhs, i7 inreg %rhs) {
  ; GFX10-LABEL: s_usubsat_i7:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 9, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, s0, s1 clamp
@@ -129,7 +127,6 @@ define i8 @v_usubsat_i8(i8 %lhs, i8 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b16_e64 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -173,7 +170,6 @@ define amdgpu_ps i8 @s_usubsat_i8(i8 inreg %lhs, i8 inreg %rhs) {
  ; GFX10-LABEL: s_usubsat_i8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_bfe_u32 s2, 8, 0x100000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, s2
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, s2
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, s0, s1 clamp
@@ -246,7 +242,6 @@ define i16 @v_usubsat_v2i8(i16 %lhs.arg, i16 %rhs.arg) {
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v3, s4, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    v_lshrrev_b32_sdwa v4, s4, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
  ; GFX10-NEXT:    s_movk_i32 s4, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v2, v3
  ; GFX10-NEXT:    v_and_or_b32 v1, v1, v2, v4
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -342,7 +337,6 @@ define amdgpu_ps i16 @s_usubsat_v2i8(i16 inreg %lhs.arg, i16 inreg %rhs.arg) {
  ; GFX10-NEXT:    s_lshl_b32 s2, s4, 8
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s0, s0, s3
  ; GFX10-NEXT:    s_pack_ll_b32_b16 s1, s1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_sub_u16 v0, s0, s1 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v0, 8, v0 op_sel_hi:[0,1]
@@ -482,7 +476,6 @@ define i32 @v_usubsat_v4i8(i32 %lhs.arg, i32 %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_and_or_b32 v2, v8, v5, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v3, 8, v3 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_sub_u16 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_pk_lshlrev_b16 v1, 8, v2 op_sel_hi:[0,1]
@@ -661,7 +654,6 @@ define amdgpu_ps i32 @s_usubsat_v4i8(i32 inreg %lhs.arg, i32 inreg %rhs.arg) {
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v0, 8, v0 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_pk_sub_u16 v1, s2, s0 clamp
  ; GFX10-NEXT:    s_movk_i32 s0, 0xff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_sdwa v2, v0, s0 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
  ; GFX10-NEXT:    v_pk_lshrrev_b16 v1, 8, v1 op_sel_hi:[0,1]
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v2, 8, v2
@@ -714,7 +706,6 @@ define i24 @v_usubsat_i24(i24 %lhs, i24 %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 8, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, v0, v1 clamp
  ; GFX10-NEXT:    v_lshrrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -757,7 +748,6 @@ define amdgpu_ps i24 @s_usubsat_i24(i24 inreg %lhs, i24 inreg %rhs) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_lshl_b32 s0, s0, 8
  ; GFX10-NEXT:    s_lshl_b32 s1, s1, 8
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, s0, s1 clamp
  ; GFX10-NEXT:    v_lshrrev_b32_e32 v0, 8, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
@@ -791,7 +781,6 @@ define i32 @v_usubsat_i32(i32 %lhs, i32 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i32 @llvm.usub.sat.i32(i32 %lhs, i32 %rhs)
    ret i32 %result
@@ -822,7 +811,6 @@ define amdgpu_ps i32 @s_usubsat_i32(i32 inreg %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: s_usubsat_i32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.usub.sat.i32(i32 %lhs, i32 %rhs)
@@ -849,7 +837,6 @@ define amdgpu_ps float @usubsat_i32_sv(i32 inreg %lhs, i32 %rhs) {
  ; GFX10-LABEL: usubsat_i32_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.usub.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -876,7 +863,6 @@ define amdgpu_ps float @usubsat_i32_vs(i32 %lhs, i32 inreg %rhs) {
  ; GFX10-LABEL: usubsat_i32_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i32 @llvm.usub.sat.i32(i32 %lhs, i32 %rhs)
    %cast = bitcast i32 %result to float
@@ -913,7 +899,6 @@ define <2 x i32> @v_usubsat_v2i32(<2 x i32> %lhs, <2 x i32> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i32> @llvm.usub.sat.v2i32(<2 x i32> %lhs, <2 x i32> %rhs)
    ret <2 x i32> %result
@@ -954,7 +939,6 @@ define amdgpu_ps <2 x i32> @s_usubsat_v2i32(<2 x i32> inreg %lhs, <2 x i32> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -997,7 +981,6 @@ define <3 x i32> @v_usubsat_v3i32(<3 x i32> %lhs, <3 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <3 x i32> @llvm.usub.sat.v3i32(<3 x i32> %lhs, <3 x i32> %rhs)
    ret <3 x i32> %result
@@ -1048,7 +1031,6 @@ define amdgpu_ps <3 x i32> @s_usubsat_v3i32(<3 x i32> inreg %lhs, <3 x i32> inre
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1097,7 +1079,6 @@ define <4 x i32> @v_usubsat_v4i32(<4 x i32> %lhs, <4 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i32> @llvm.usub.sat.v4i32(<4 x i32> %lhs, <4 x i32> %rhs)
    ret <4 x i32> %result
@@ -1158,7 +1139,6 @@ define amdgpu_ps <4 x i32> @s_usubsat_v4i32(<4 x i32> inreg %lhs, <4 x i32> inre
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -1213,7 +1193,6 @@ define <5 x i32> @v_usubsat_v5i32(<5 x i32> %lhs, <5 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v2, v2, v7 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v3, v3, v8 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v4, v4, v9 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <5 x i32> @llvm.usub.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -1289,7 +1268,6 @@ define amdgpu_ps <5 x i32> @s_usubsat_v5i32(<5 x i32> inreg %lhs, <5 x i32> inre
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
  ; GFX10-NEXT:    v_readfirstlane_b32 s3, v3
  ; GFX10-NEXT:    v_readfirstlane_b32 s4, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <5 x i32> @llvm.usub.sat.v5i32(<5 x i32> %lhs, <5 x i32> %rhs)
    ret <5 x i32> %result
@@ -1395,7 +1373,6 @@ define <16 x i32> @v_usubsat_v16i32(<16 x i32> %lhs, <16 x i32> %rhs) {
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v13, v13, v29 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v14, v14, v30 clamp
  ; GFX10-NEXT:    v_sub_nc_u32_e64 v15, v15, v31 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <16 x i32> @llvm.usub.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -1592,7 +1569,6 @@ define amdgpu_ps <16 x i32> @s_usubsat_v16i32(<16 x i32> inreg %lhs, <16 x i32>
  ; GFX10-NEXT:    v_readfirstlane_b32 s13, v13
  ; GFX10-NEXT:    v_readfirstlane_b32 s14, v14
  ; GFX10-NEXT:    v_readfirstlane_b32 s15, v15
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <16 x i32> @llvm.usub.sat.v16i32(<16 x i32> %lhs, <16 x i32> %rhs)
    ret <16 x i32> %result
@@ -1626,7 +1602,6 @@ define i16 @v_usubsat_i16(i16 %lhs, i16 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call i16 @llvm.usub.sat.i16(i16 %lhs, i16 %rhs)
    ret i16 %result
@@ -1660,7 +1635,6 @@ define amdgpu_ps i16 @s_usubsat_i16(i16 inreg %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: s_usubsat_i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.usub.sat.i16(i16 %lhs, i16 %rhs)
@@ -1690,7 +1664,6 @@ define amdgpu_ps half @usubsat_i16_sv(i16 inreg %lhs, i16 %rhs) {
  ; GFX10-LABEL: usubsat_i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.usub.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -1720,7 +1693,6 @@ define amdgpu_ps half @usubsat_i16_vs(i16 %lhs, i16 inreg %rhs) {
  ; GFX10-LABEL: usubsat_i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_nc_u16_e64 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call i16 @llvm.usub.sat.i16(i16 %lhs, i16 %rhs)
    %cast = bitcast i16 %result to half
@@ -1764,7 +1736,6 @@ define <2 x i16> @v_usubsat_v2i16(<2 x i16> %lhs, <2 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_sub_u16 v0, v0, v1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <2 x i16> @llvm.usub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    ret <2 x i16> %result
@@ -1813,7 +1784,6 @@ define amdgpu_ps i32 @s_usubsat_v2i16(<2 x i16> inreg %lhs, <2 x i16> inreg %rhs
  ; GFX10-LABEL: s_usubsat_v2i16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_u16 v0, s0, s1 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.usub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
@@ -1857,7 +1827,6 @@ define amdgpu_ps float @usubsat_v2i16_sv(<2 x i16> inreg %lhs, <2 x i16> %rhs) {
  ; GFX10-LABEL: usubsat_v2i16_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_u16 v0, s0, v0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.usub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -1900,7 +1869,6 @@ define amdgpu_ps float @usubsat_v2i16_vs(<2 x i16> %lhs, <2 x i16> inreg %rhs) {
  ; GFX10-LABEL: usubsat_v2i16_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_u16 v0, v0, s0 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %result = call <2 x i16> @llvm.usub.sat.v2i16(<2 x i16> %lhs, <2 x i16> %rhs)
    %cast = bitcast <2 x i16> %result to float
@@ -1975,7 +1943,6 @@ define <2 x float> @v_usubsat_v4i16(<4 x i16> %lhs, <4 x i16> %rhs) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_pk_sub_u16 v0, v0, v2 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v1, v1, v3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <4 x i16> @llvm.usub.sat.v4i16(<4 x i16> %lhs, <4 x i16> %rhs)
    %cast = bitcast <4 x i16> %result to <2 x float>
@@ -2052,7 +2019,6 @@ define amdgpu_ps <2 x i32> @s_usubsat_v4i16(<4 x i16> inreg %lhs, <4 x i16> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_pk_sub_u16 v0, s0, s2 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v1, s1, s3 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    ; return to shader part epilog
@@ -2148,7 +2114,6 @@ define <3 x float> @v_usubsat_v6i16(<6 x i16> %lhs, <6 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_sub_u16 v0, v0, v3 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v1, v1, v4 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v2, v2, v5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <6 x i16> @llvm.usub.sat.v6i16(<6 x i16> %lhs, <6 x i16> %rhs)
    %cast = bitcast <6 x i16> %result to <3 x float>
@@ -2252,7 +2217,6 @@ define amdgpu_ps <3 x i32> @s_usubsat_v6i16(<6 x i16> inreg %lhs, <6 x i16> inre
  ; GFX10-NEXT:    v_pk_sub_u16 v0, s0, s3 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v1, s1, s4 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v2, s2, s5 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -2356,7 +2320,6 @@ define <4 x float> @v_usubsat_v8i16(<8 x i16> %lhs, <8 x i16> %rhs) {
  ; GFX10-NEXT:    v_pk_sub_u16 v1, v1, v5 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v2, v2, v6 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v3, v3, v7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %result = call <8 x i16> @llvm.usub.sat.v8i16(<8 x i16> %lhs, <8 x i16> %rhs)
    %cast = bitcast <8 x i16> %result to <4 x float>
@@ -2487,7 +2450,6 @@ define amdgpu_ps <4 x i32> @s_usubsat_v8i16(<8 x i16> inreg %lhs, <8 x i16> inre
  ; GFX10-NEXT:    v_pk_sub_u16 v1, s1, s5 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v2, s2, s6 clamp
  ; GFX10-NEXT:    v_pk_sub_u16 v3, s3, s7 clamp
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readfirstlane_b32 s0, v0
  ; GFX10-NEXT:    v_readfirstlane_b32 s1, v1
  ; GFX10-NEXT:    v_readfirstlane_b32 s2, v2
@@ -2559,7 +2521,6 @@ define i64 @v_usubsat_i64(i64 %lhs, i64 %rhs) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_sub_co_u32_e64 v4, vcc_lo, v0, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v5, vcc_lo, v1, v3, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[0:1], v[2:3]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v4, 0, vcc_lo
@@ -2630,7 +2591,6 @@ define amdgpu_ps i64 @s_usubsat_i64(i64 inreg %lhs, i64 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s5, 1, 0
  ; GFX10-NEXT:    v_cmp_lt_u64_e64 s0, s[0:1], s[2:3]
  ; GFX10-NEXT:    s_and_b32 s5, s5, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s5, 0
  ; GFX10-NEXT:    s_subb_u32 s1, s1, s3
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, s4, 0, s0
@@ -2676,7 +2636,6 @@ define amdgpu_ps <2 x float> @usubsat_i64_sv(i64 inreg %lhs, i64 %rhs) {
  ; GFX10-LABEL: usubsat_i64_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_co_u32_e64 v2, vcc_lo, s0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, s[0:1], v[0:1]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v2, 0, vcc_lo
@@ -2721,7 +2680,6 @@ define amdgpu_ps <2 x float> @usubsat_i64_vs(i64 %lhs, i64 inreg %rhs) {
  ; GFX10-LABEL: usubsat_i64_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_sub_co_u32_e64 v2, vcc_lo, v0, s0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_subrev_co_ci_u32_e32 v3, vcc_lo, s1, v1, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_u64_e32 vcc_lo, s[0:1], v[0:1]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v0, v2, 0, vcc_lo
@@ -2786,7 +2744,6 @@ define <2 x i64> @v_usubsat_v2i64(<2 x i64> %lhs, <2 x i64> %rhs) {
  ; GFX10-NEXT:    v_mov_b32_e32 v11, v1
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v2
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_sub_co_u32_e64 v8, vcc_lo, v10, v4
  ; GFX10-NEXT:    v_sub_co_ci_u32_e32 v9, vcc_lo, v11, v5, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[10:11], v[4:5]
@@ -2903,7 +2860,6 @@ define amdgpu_ps <2 x i64> @s_usubsat_v2i64(<2 x i64> inreg %lhs, <2 x i64> inre
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_sub_u32 s8, s0, s4
  ; GFX10-NEXT:    s_cselect_b32 s9, 1, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_and_b32 s9, s9, 1
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_subb_u32 s9, s1, s5
@@ -3063,7 +3019,6 @@ define amdgpu_ps i128 @s_usubsat_i128(i128 inreg %lhs, i128 inreg %rhs) {
  ; GFX10-NEXT:    s_cselect_b32 s9, 1, 0
  ; GFX10-NEXT:    v_cmp_lt_u64_e64 s0, s[0:1], s[4:5]
  ; GFX10-NEXT:    s_and_b32 s9, s9, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s9, 0
  ; GFX10-NEXT:    s_subb_u32 s9, s1, s5
  ; GFX10-NEXT:    s_cselect_b32 s10, 1, 0
@@ -3170,7 +3125,6 @@ define amdgpu_ps <4 x float> @usubsat_i128_sv(i128 inreg %lhs, i128 %rhs) {
  ; GFX10-LABEL: usubsat_i128_sv:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, s[0:1], v[0:1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v4, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, s[2:3], v[2:3]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v5, 0, 1, vcc_lo
@@ -3265,7 +3219,6 @@ define amdgpu_ps <4 x float> @usubsat_i128_vs(i128 %lhs, i128 inreg %rhs) {
  ; GFX10-LABEL: usubsat_i128_vs:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_cmp_gt_u64_e32 vcc_lo, s[0:1], v[0:1]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v4, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_gt_u64_e32 vcc_lo, s[2:3], v[2:3]
  ; GFX10-NEXT:    v_cndmask_b32_e64 v5, 0, 1, vcc_lo
@@ -3412,7 +3365,6 @@ define <2 x i128> @v_usubsat_v2i128(<2 x i128> %lhs, <2 x i128> %rhs) {
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[22:23], v[8:9]
  ; GFX10-NEXT:    v_mov_b32_e32 v24, v6
  ; GFX10-NEXT:    v_mov_b32_e32 v25, v7
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_cndmask_b32_e64 v16, 0, 1, vcc_lo
  ; GFX10-NEXT:    v_cmp_lt_u64_e32 vcc_lo, v[20:21], v[10:11]
  ; GFX10-NEXT:    v_cmp_eq_u64_e64 s5, v[24:25], v[14:15]
@@ -3702,7 +3654,6 @@ define amdgpu_ps <2 x i128> @s_usubsat_v2i128(<2 x i128> inreg %lhs, <2 x i128>
  ; GFX10-NEXT:    s_cselect_b32 s17, 1, 0
  ; GFX10-NEXT:    v_cmp_lt_u64_e64 s0, s[0:1], s[8:9]
  ; GFX10-NEXT:    s_and_b32 s17, s17, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_cmp_lg_u32 s17, 0
  ; GFX10-NEXT:    s_subb_u32 s17, s1, s9
  ; GFX10-NEXT:    s_cselect_b32 s18, 1, 0
diff --git a/llvm/test/CodeGen/AMDGPU/SRSRC-GIT-clobber-check.mir b/llvm/test/CodeGen/AMDGPU/SRSRC-GIT-clobber-check.mir

index 3737d38..f634b8a 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/SRSRC-GIT-clobber-check.mir
+++ b/llvm/test/CodeGen/AMDGPU/SRSRC-GIT-clobber-check.mir
@@ -33,7 +33,6 @@ body:             |
      renamable $vgpr0 = V_MBCNT_LO_U32_B32_e64 -1, 0, implicit $exec
      renamable $sgpr0 = S_BFE_U32 killed renamable $sgpr0, 589836, implicit-def dead $scc
      renamable $vcc_lo = V_CMP_GT_U32_e64 killed $sgpr0, killed $vgpr0, implicit $exec
-    $vcc_hi = IMPLICIT_DEF
      $sgpr0 = S_AND_SAVEEXEC_B32 $vcc_lo, implicit-def $exec, implicit-def $scc, implicit $exec
      S_CBRANCH_EXECZ %bb.2, implicit $exec
      S_BRANCH %bb.1
diff --git a/llvm/test/CodeGen/AMDGPU/add3.ll b/llvm/test/CodeGen/AMDGPU/add3.ll

index a5da970..7c4ea82 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/add3.ll
+++ b/llvm/test/CodeGen/AMDGPU/add3.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @add3(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add3:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = add i32 %x, %c
@@ -47,7 +46,6 @@ define amdgpu_ps float @mad_no_add3(i32 %a, i32 %b, i32 %c, i32 %d, i32 %e) {
  ; GFX10-LABEL: mad_no_add3:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_mad_u32_u24 v0, v0, v1, v4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mad_u32_u24 v0, v2, v3, v0
  ; GFX10-NEXT:    ; return to shader part epilog
    %a0 = shl i32 %a, 8
@@ -87,7 +85,6 @@ define amdgpu_ps float @add3_vgpr_b(i32 inreg %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: add3_vgpr_b:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, s3, s2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = add i32 %x, %c
@@ -110,7 +107,6 @@ define amdgpu_ps float @add3_vgpr_all2(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add3_vgpr_all2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, v1, v2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %b, %c
    %result = add i32 %a, %x
@@ -133,7 +129,6 @@ define amdgpu_ps float @add3_vgpr_bc(i32 inreg %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add3_vgpr_bc:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, s2, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = add i32 %x, %c
@@ -156,7 +151,6 @@ define amdgpu_ps float @add3_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: add3_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, v0, v1, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = add i32 %x, 16
@@ -181,7 +175,6 @@ define amdgpu_ps <2 x float> @add3_multiuse_outer(i32 %a, i32 %b, i32 %c, i32 %x
  ; GFX10-LABEL: add3_multiuse_outer:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add3_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mul_lo_u32 v1, v0, v3
  ; GFX10-NEXT:    ; return to shader part epilog
    %inner = add i32 %a, %b
@@ -209,7 +202,6 @@ define amdgpu_ps <2 x float> @add3_multiuse_inner(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add3_multiuse_inner:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_nc_u32_e32 v0, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u32_e32 v1, v0, v2
  ; GFX10-NEXT:    ; return to shader part epilog
    %inner = add i32 %a, %b
@@ -248,7 +240,6 @@ define amdgpu_ps float @add3_uniform_vgpr(float inreg %a, float inreg %b, float
  ; GFX10-NEXT:    v_add_f32_e64 v0, s2, 1.0
  ; GFX10-NEXT:    v_add_f32_e64 v1, s3, 2.0
  ; GFX10-NEXT:    v_add_f32_e64 v2, 0x40400000, s4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_nc_u32_e32 v0, v0, v1
  ; GFX10-NEXT:    v_add_nc_u32_e32 v0, v0, v2
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/add_shl.ll b/llvm/test/CodeGen/AMDGPU/add_shl.ll

index 37bedb6..0476538 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/add_shl.ll
+++ b/llvm/test/CodeGen/AMDGPU/add_shl.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @add_shl(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: add_shl:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, %c
@@ -46,7 +45,6 @@ define amdgpu_ps float @add_shl_vgpr_c(i32 inreg %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: add_shl_vgpr_c:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, s2, s3, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, %c
@@ -69,7 +67,6 @@ define amdgpu_ps float @add_shl_vgpr_ac(i32 %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: add_shl_vgpr_ac:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, s2, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, %c
@@ -92,7 +89,6 @@ define amdgpu_ps float @add_shl_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: add_shl_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_add_lshl_u32 v0, v0, v1, 9
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, %b
    %result = shl i32 %x, 9
@@ -116,7 +112,6 @@ define amdgpu_ps float @add_shl_vgpr_const_inline_const(i32 %a) {
  ; GFX10-LABEL: add_shl_vgpr_const_inline_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 9, 0x7e800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, 1012
    %result = shl i32 %x, 9
@@ -143,7 +138,6 @@ define amdgpu_ps float @add_shl_vgpr_inline_const_x2(i32 %a) {
  ; GFX10-LABEL: add_shl_vgpr_inline_const_x2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 9, 0x600
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = add i32 %a, 3
    %result = shl i32 %x, 9
diff --git a/llvm/test/CodeGen/AMDGPU/amdpal-elf.ll b/llvm/test/CodeGen/AMDGPU/amdpal-elf.ll

index 4025513..961ada4 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/amdpal-elf.ll
+++ b/llvm/test/CodeGen/AMDGPU/amdpal-elf.ll
@@ -1,7 +1,7 @@
  ; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=kaveri -filetype=obj | llvm-readobj -symbols -s -sd - | FileCheck --check-prefix=ELF %s
  ; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=kaveri | llvm-mc -filetype=obj -triple amdgcn--amdpal -mcpu=kaveri | llvm-readobj -symbols -s -sd - | FileCheck %s --check-prefix=ELF
-; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=gfx1010 -mattr=+wavefrontsize32,-wavefrontsize64 | FileCheck --check-prefix=GFX10-W32 %s
-; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=gfx1010 -mattr=-wavefrontsize32,+wavefrontsize64 | FileCheck --check-prefix=GFX10-W64 %s
+; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=gfx1010 -mattr=+wavefrontsize32,-wavefrontsize64 | FileCheck --check-prefix=GFX10 %s
+; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=gfx1010 -mattr=-wavefrontsize32,+wavefrontsize64 | FileCheck --check-prefix=GFX10 %s
  
  ; ELF: Section {
  ; ELF: Name: .text
@@ -21,10 +21,8 @@
  ; ELF: Section: .text (0x2)
  ; ELF: }
  
-; GFX10-W32: NumSGPRsForWavesPerEU: 4
-; GFX10-W32: NumVGPRsForWavesPerEU: 1
-; GFX10-W64: NumSGPRsForWavesPerEU: 2
-; GFX10-W64: NumVGPRsForWavesPerEU: 1
+; GFX10: NumSGPRsForWavesPerEU: 2
+; GFX10: NumVGPRsForWavesPerEU: 1
  
  define amdgpu_kernel void @simple(i32 addrspace(1)* %out) {
  entry:
diff --git a/llvm/test/CodeGen/AMDGPU/and_or.ll b/llvm/test/CodeGen/AMDGPU/and_or.ll

index 6356e67..9f4b049 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/and_or.ll
+++ b/llvm/test/CodeGen/AMDGPU/and_or.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @and_or(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: and_or:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 %a, %b
    %result = or i32 %x, %c
@@ -47,7 +46,6 @@ define amdgpu_ps float @and_or_vgpr_b(i32 inreg %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: and_or_vgpr_b:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, s2, v0, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 %a, %b
    %result = or i32 %x, %c
@@ -70,7 +68,6 @@ define amdgpu_ps float @and_or_vgpr_ab(i32 %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: and_or_vgpr_ab:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, v1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 %a, %b
    %result = or i32 %x, %c
@@ -93,7 +90,6 @@ define amdgpu_ps float @and_or_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: and_or_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, 4, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 4, %a
    %result = or i32 %x, %b
@@ -117,7 +113,6 @@ define amdgpu_ps float @and_or_vgpr_const_inline_const(i32 %a) {
  ; GFX10-LABEL: and_or_vgpr_const_inline_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, 20, 0x808
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 20, %a
    %result = or i32 %x, 2056
@@ -140,7 +135,6 @@ define amdgpu_ps float @and_or_vgpr_inline_const_x2(i32 %a) {
  ; GFX10-LABEL: and_or_vgpr_inline_const_x2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_and_or_b32 v0, v0, 4, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = and i32 4, %a
    %result = or i32 %x, 1
diff --git a/llvm/test/CodeGen/AMDGPU/atomic_optimizations_local_pointer.ll b/llvm/test/CodeGen/AMDGPU/atomic_optimizations_local_pointer.ll

index ce5eae0..ac752b7 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/atomic_optimizations_local_pointer.ll
+++ b/llvm/test/CodeGen/AMDGPU/atomic_optimizations_local_pointer.ll
@@ -139,9 +139,8 @@ define amdgpu_kernel void @add_i32_constant(i32 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s2, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB0_2
@@ -315,9 +314,8 @@ define amdgpu_kernel void @add_i32_uniform(i32 addrspace(1)* %out, i32 %additive
  ; GFX1032-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x24
  ; GFX1032-NEXT:    s_load_dword s0, s[0:1], 0x2c
  ; GFX1032-NEXT:    s_mov_b32 s2, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s1, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB1_2
@@ -560,7 +558,6 @@ define amdgpu_kernel void @add_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB2_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -800,7 +797,6 @@ define amdgpu_kernel void @add_i32_varying_gfx1032(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB3_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -1040,7 +1036,6 @@ define amdgpu_kernel void @add_i32_varying_gfx1064(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB4_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -1213,9 +1208,8 @@ define amdgpu_kernel void @add_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s3, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s3, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1_vgpr2
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s3, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB5_2
@@ -1429,9 +1423,8 @@ define amdgpu_kernel void @add_i64_uniform(i64 addrspace(1)* %out, i64 %additive
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s5, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s5, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1_vgpr2
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s5, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s4, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB6_2
@@ -1546,7 +1539,6 @@ define amdgpu_kernel void @add_i64_varying(i64 addrspace(1)* %out) {
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s3, 0x31016000
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
  ; GFX1032-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX1032-NEXT:    ds_add_rtn_u64 v[0:1], v2, v[0:1]
@@ -1691,9 +1683,8 @@ define amdgpu_kernel void @sub_i32_constant(i32 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s2, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB8_2
@@ -1867,9 +1858,8 @@ define amdgpu_kernel void @sub_i32_uniform(i32 addrspace(1)* %out, i32 %subitive
  ; GFX1032-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x24
  ; GFX1032-NEXT:    s_load_dword s0, s[0:1], 0x2c
  ; GFX1032-NEXT:    s_mov_b32 s2, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s2, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s1, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB9_2
@@ -2112,7 +2102,6 @@ define amdgpu_kernel void @sub_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB10_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -2289,9 +2278,8 @@ define amdgpu_kernel void @sub_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s3, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s3, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1_vgpr2
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s3, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB11_2
@@ -2507,9 +2495,8 @@ define amdgpu_kernel void @sub_i64_uniform(i64 addrspace(1)* %out, i64 %subitive
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s5, exec_lo
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
-; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s5, 0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr1_vgpr2
+; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, s5, 0
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_and_saveexec_b32 s4, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB12_2
@@ -2624,7 +2611,6 @@ define amdgpu_kernel void @sub_i64_varying(i64 addrspace(1)* %out) {
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    s_mov_b32 s3, 0x31016000
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
  ; GFX1032-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX1032-NEXT:    ds_sub_rtn_u64 v[0:1], v2, v[0:1]
@@ -2851,7 +2837,6 @@ define amdgpu_kernel void @and_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB14_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -3091,7 +3076,6 @@ define amdgpu_kernel void @or_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB15_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -3331,7 +3315,6 @@ define amdgpu_kernel void @xor_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB16_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -3575,7 +3558,6 @@ define amdgpu_kernel void @max_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB17_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -3754,7 +3736,6 @@ define amdgpu_kernel void @max_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0_vgpr1
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
@@ -4004,7 +3985,6 @@ define amdgpu_kernel void @min_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB19_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -4183,7 +4163,6 @@ define amdgpu_kernel void @min_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0_vgpr1
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
@@ -4429,7 +4408,6 @@ define amdgpu_kernel void @umax_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB21_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -4605,7 +4583,6 @@ define amdgpu_kernel void @umax_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0_vgpr1
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
@@ -4851,7 +4828,6 @@ define amdgpu_kernel void @umin_i32_varying(i32 addrspace(1)* %out) {
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    s_mov_b32 s2, -1
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s3, vcc_lo
  ; GFX1032-NEXT:    s_cbranch_execz BB23_2
  ; GFX1032-NEXT:  ; %bb.1:
@@ -5027,7 +5003,6 @@ define amdgpu_kernel void @umin_i64_constant(i64 addrspace(1)* %out) {
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX1032-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, exec_lo, 0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    v_cmp_eq_u32_e32 vcc_lo, 0, v0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0_vgpr1
  ; GFX1032-NEXT:    s_and_saveexec_b32 s2, vcc_lo
diff --git a/llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll b/llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll

index 0d816dc..95d3e0d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll
+++ b/llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll
@@ -149,7 +149,6 @@ define amdgpu_ps void @add_i32_constant(<4 x i32> inreg %out, <4 x i32> inreg %i
  ; GFX1032:       ; %bb.0: ; %entry
  ; GFX1032-NEXT:    s_mov_b32 s9, exec_lo
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s8, s9
  ; GFX1032-NEXT:    s_cbranch_execz BB0_4
  ; GFX1032-NEXT:  ; %bb.1:
@@ -382,7 +381,6 @@ define amdgpu_ps void @add_i32_varying(<4 x i32> inreg %out, <4 x i32> inreg %in
  ; GFX1032-NEXT:    s_mov_b32 s9, exec_lo
  ; GFX1032-NEXT:    v_mov_b32_e32 v1, v0
  ; GFX1032-NEXT:    ; implicit-def: $vgpr0
-; GFX1032-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1032-NEXT:    s_and_saveexec_b32 s8, s9
  ; GFX1032-NEXT:    s_cbranch_execz BB1_4
  ; GFX1032-NEXT:  ; %bb.1:
diff --git a/llvm/test/CodeGen/AMDGPU/cc-update.ll b/llvm/test/CodeGen/AMDGPU/cc-update.ll

index 41d0cb8..7b71a9d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/cc-update.ll
+++ b/llvm/test/CodeGen/AMDGPU/cc-update.ll
@@ -50,7 +50,6 @@ define amdgpu_kernel void @test_kern_stack() local_unnamed_addr #0 {
  ; GFX1010-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX1010-NEXT:    s_add_u32 s0, s0, s7
  ; GFX1010-NEXT:    s_addc_u32 s1, s1, 0
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    buffer_store_dword v0, off, s[0:3], 0 offset:4
  ; GFX1010-NEXT:    s_endpgm
  entry:
@@ -99,7 +98,6 @@ define amdgpu_kernel void @test_kern_call() local_unnamed_addr #0 {
  ; GFX1010-NEXT:    s_getpc_b64 s[4:5]
  ; GFX1010-NEXT:    s_add_u32 s4, s4, ex@rel32@lo+4
  ; GFX1010-NEXT:    s_addc_u32 s5, s5, ex@rel32@hi+12
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX1010-NEXT:    s_endpgm
  entry:
@@ -152,7 +150,6 @@ define amdgpu_kernel void @test_kern_stack_and_call() local_unnamed_addr #0 {
  ; GFX1010-NEXT:    s_getpc_b64 s[4:5]
  ; GFX1010-NEXT:    s_add_u32 s4, s4, ex@rel32@lo+4
  ; GFX1010-NEXT:    s_addc_u32 s5, s5, ex@rel32@hi+12
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    buffer_store_dword v0, off, s[0:3], 0 offset:4
  ; GFX1010-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX1010-NEXT:    s_endpgm
@@ -216,7 +213,6 @@ define amdgpu_kernel void @test_force_fp_kern_stack() local_unnamed_addr #2 {
  ; GFX1010-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX1010-NEXT:    s_add_u32 s0, s0, s7
  ; GFX1010-NEXT:    s_addc_u32 s1, s1, 0
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    buffer_store_dword v0, off, s[0:3], s33 offset:4
  ; GFX1010-NEXT:    s_endpgm
  entry:
@@ -268,7 +264,6 @@ define amdgpu_kernel void @test_force_fp_kern_call() local_unnamed_addr #2 {
  ; GFX1010-NEXT:    s_getpc_b64 s[4:5]
  ; GFX1010-NEXT:    s_add_u32 s4, s4, ex@rel32@lo+4
  ; GFX1010-NEXT:    s_addc_u32 s5, s5, ex@rel32@hi+12
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX1010-NEXT:    s_endpgm
  entry:
@@ -324,7 +319,6 @@ define amdgpu_kernel void @test_force_fp_kern_stack_and_call() local_unnamed_add
  ; GFX1010-NEXT:    s_getpc_b64 s[4:5]
  ; GFX1010-NEXT:    s_add_u32 s4, s4, ex@rel32@lo+4
  ; GFX1010-NEXT:    s_addc_u32 s5, s5, ex@rel32@hi+12
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    buffer_store_dword v0, off, s[0:3], s33 offset:4
  ; GFX1010-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX1010-NEXT:    s_endpgm
@@ -383,7 +377,6 @@ define amdgpu_kernel void @test_sgpr_offset_kernel() #1 {
  ; GFX1010-NEXT:    s_addc_u32 s1, s1, 0
  ; GFX1010-NEXT:    s_mov_b32 s6, 0x20000
  ; GFX1010-NEXT:    buffer_load_dword v0, off, s[0:3], 0 offset:8
-; GFX1010-NEXT:    ; implicit-def: $vcc_hi
  ; GFX1010-NEXT:    s_waitcnt vmcnt(0)
  ; GFX1010-NEXT:    buffer_store_dword v0, off, s[0:3], s6 ; 4-byte Folded Spill
  ; GFX1010-NEXT:    s_waitcnt_depctr 0xffe3
diff --git a/llvm/test/CodeGen/AMDGPU/cgp-addressing-modes-gfx1030.ll b/llvm/test/CodeGen/AMDGPU/cgp-addressing-modes-gfx1030.ll

index 450bd02..7aa07ad 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/cgp-addressing-modes-gfx1030.ll
+++ b/llvm/test/CodeGen/AMDGPU/cgp-addressing-modes-gfx1030.ll
@@ -27,7 +27,6 @@ define amdgpu_kernel void @test_sink_small_offset_global_atomic_csub_i32(i32 add
  ; GCN:       ; %bb.0: ; %entry
  ; GCN-NEXT:    s_load_dwordx4 s[0:3], s[4:5], 0x0
  ; GCN-NEXT:    v_mbcnt_lo_u32_b32_e64 v0, -1, 0
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_cmp_ne_u32_e32 vcc_lo, 0, v0
  ; GCN-NEXT:    v_mov_b32_e32 v0, 0
  ; GCN-NEXT:    s_and_saveexec_b32 s4, vcc_lo
diff --git a/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll b/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll

index 4a5039b..468f600 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll
+++ b/llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll
@@ -43,7 +43,6 @@ define i32 @s_add_co_select_user() {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_mov_b64 s[4:5], 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_load_dword s4, s[4:5], 0x0
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s5, s4, s4
@@ -124,7 +123,6 @@ define amdgpu_kernel void @s_add_co_br_user(i32 %i) {
  ; GFX10-LABEL: s_add_co_br_user:
  ; GFX10:       ; %bb.0: ; %bb
  ; GFX10-NEXT:    s_load_dword s0, s[4:5], 0x0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_i32 s1, s0, s0
  ; GFX10-NEXT:    v_cmp_lt_u32_e64 s1, s1, s0
diff --git a/llvm/test/CodeGen/AMDGPU/flat-scratch.ll b/llvm/test/CodeGen/AMDGPU/flat-scratch.ll

index 09b9f34..2628ae5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/flat-scratch.ll
+++ b/llvm/test/CodeGen/AMDGPU/flat-scratch.ll
@@ -34,7 +34,6 @@ define amdgpu_kernel void @zero_init_kernel() {
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_LO), s0
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_HI), s1
  ; GFX10-NEXT:    s_mov_b32 s0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s1, s0
  ; GFX10-NEXT:    s_mov_b32 s2, s0
  ; GFX10-NEXT:    s_mov_b32 s3, s0
@@ -87,7 +86,6 @@ define amdgpu_kernel void @zero_init_kernel() {
  ; GFX10-PAL-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_LO), s2
  ; GFX10-PAL-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_HI), s3
  ; GFX10-PAL-NEXT:    s_mov_b32 s0, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    s_mov_b32 s1, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s2, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s3, s0
@@ -130,7 +128,6 @@ define void @zero_init_foo() {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_mov_b32 s0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s1, s0
  ; GFX10-NEXT:    s_mov_b32 s2, s0
  ; GFX10-NEXT:    s_mov_b32 s3, s0
@@ -168,7 +165,6 @@ define void @zero_init_foo() {
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    s_mov_b32 s0, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    s_mov_b32 s1, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s2, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s3, s0
@@ -462,7 +458,6 @@ define void @store_load_vindex_foo(i32 %idx) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s32
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
  ; GFX10-NEXT:    v_lshl_add_u32 v2, v3, 2, v2
@@ -491,7 +486,6 @@ define void @store_load_vindex_foo(i32 %idx) {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, s32
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-PAL-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
  ; GFX10-PAL-NEXT:    v_lshl_add_u32 v2, v3, 2, v2
@@ -527,7 +521,6 @@ define void @private_ptr_foo(float addrspace(5)* nocapture %arg) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0x41200000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dword v0, v1, off offset:4
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
@@ -545,7 +538,6 @@ define void @private_ptr_foo(float addrspace(5)* nocapture %arg) {
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 0x41200000
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dword v0, v1, off offset:4
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    s_setpc_b64 s[30:31]
@@ -588,7 +580,6 @@ define amdgpu_kernel void @zero_init_small_offset_kernel() {
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_HI), s1
  ; GFX10-NEXT:    scratch_load_dword v0, off, off offset:4
  ; GFX10-NEXT:    s_mov_b32 s0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s1, s0
  ; GFX10-NEXT:    s_mov_b32 s2, s0
  ; GFX10-NEXT:    s_mov_b32 s3, s0
@@ -646,7 +637,6 @@ define amdgpu_kernel void @zero_init_small_offset_kernel() {
  ; GFX10-PAL-NEXT:    s_setreg_b32 hwreg(HW_REG_FLAT_SCR_HI), s3
  ; GFX10-PAL-NEXT:    scratch_load_dword v0, off, off offset:4
  ; GFX10-PAL-NEXT:    s_mov_b32 s0, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    s_mov_b32 s1, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s2, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s3, s0
@@ -696,7 +686,6 @@ define void @zero_init_small_offset_foo() {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    scratch_load_dword v0, off, s32
  ; GFX10-NEXT:    s_mov_b32 s0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_mov_b32 s1, s0
  ; GFX10-NEXT:    s_mov_b32 s2, s0
  ; GFX10-NEXT:    s_mov_b32 s3, s0
@@ -738,7 +727,6 @@ define void @zero_init_small_offset_foo() {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    scratch_load_dword v0, off, s32
  ; GFX10-PAL-NEXT:    s_mov_b32 s0, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    s_mov_b32 s1, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s2, s0
  ; GFX10-PAL-NEXT:    s_mov_b32 s3, s0
@@ -1076,7 +1064,6 @@ define void @store_load_vindex_small_offset_foo(i32 %idx) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    s_add_u32 vcc_lo, s32, 0x100
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v2, vcc_lo
  ; GFX10-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
@@ -1110,7 +1097,6 @@ define void @store_load_vindex_small_offset_foo(i32 %idx) {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    s_add_u32 vcc_lo, s32, 0x100
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, vcc_lo
  ; GFX10-PAL-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-PAL-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
@@ -1180,7 +1166,6 @@ define amdgpu_kernel void @zero_init_large_offset_kernel() {
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v3, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo
  ; GFX10-NEXT:    s_movk_i32 vcc_lo, 0x4010
  ; GFX10-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo offset:16
@@ -1242,7 +1227,6 @@ define amdgpu_kernel void @zero_init_large_offset_kernel() {
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, s2
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v3, s3
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo
  ; GFX10-PAL-NEXT:    s_movk_i32 vcc_lo, 0x4010
  ; GFX10-PAL-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo offset:16
@@ -1300,7 +1284,6 @@ define void @zero_init_large_offset_foo() {
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_mov_b32_e32 v2, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v3, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo
  ; GFX10-NEXT:    s_add_u32 vcc_lo, s32, 0x4000
  ; GFX10-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo offset:16
@@ -1350,7 +1333,6 @@ define void @zero_init_large_offset_foo() {
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, s2
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v3, s3
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo
  ; GFX10-PAL-NEXT:    s_add_u32 vcc_lo, s32, 0x4000
  ; GFX10-PAL-NEXT:    scratch_store_dwordx4 off, v[0:3], vcc_lo offset:16
@@ -1683,7 +1665,6 @@ define void @store_load_vindex_large_offset_foo(i32 %idx) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    s_add_u32 vcc_lo, s32, 0x4000
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v2, vcc_lo
  ; GFX10-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
@@ -1717,7 +1698,6 @@ define void @store_load_vindex_large_offset_foo(i32 %idx) {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    s_add_u32 vcc_lo, s32, 0x4000
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, vcc_lo
  ; GFX10-PAL-NEXT:    v_and_b32_e32 v3, v0, v1
  ; GFX10-PAL-NEXT:    v_lshl_add_u32 v0, v0, 2, v2
@@ -1844,7 +1824,6 @@ define void @store_load_large_imm_offset_foo() {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 13
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    s_movk_i32 s0, 0x3800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_add_u32 s0, s32, s0
  ; GFX10-NEXT:    scratch_store_dword off, v0, s32
  ; GFX10-NEXT:    scratch_store_dword off, v1, s0 offset:1664
@@ -1873,7 +1852,6 @@ define void @store_load_large_imm_offset_foo() {
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v0, 13
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    s_movk_i32 s0, 0x3800
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    s_add_u32 s0, s32, s0
  ; GFX10-PAL-NEXT:    scratch_store_dword off, v0, s32
  ; GFX10-PAL-NEXT:    scratch_store_dword off, v1, s0 offset:1664
@@ -1987,7 +1965,6 @@ define void @store_load_i64_aligned(i64 addrspace(5)* nocapture %arg) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx2 v0, v[1:2], off
  ; GFX10-NEXT:    scratch_load_dwordx2 v[0:1], v0, off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2010,7 +1987,6 @@ define void @store_load_i64_aligned(i64 addrspace(5)* nocapture %arg) {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx2 v0, v[1:2], off
  ; GFX10-PAL-NEXT:    scratch_load_dwordx2 v[0:1], v0, off
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0)
@@ -2039,7 +2015,6 @@ define void @store_load_i64_unaligned(i64 addrspace(5)* nocapture %arg) {
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx2 v0, v[1:2], off
  ; GFX10-NEXT:    scratch_load_dwordx2 v[0:1], v0, off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2062,7 +2037,6 @@ define void @store_load_i64_unaligned(i64 addrspace(5)* nocapture %arg) {
  ; GFX10-PAL-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 15
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx2 v0, v[1:2], off
  ; GFX10-PAL-NEXT:    scratch_load_dwordx2 v[0:1], v0, off
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0)
@@ -2093,7 +2067,6 @@ define void @store_load_v3i32_unaligned(<3 x i32> addrspace(5)* nocapture %arg)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 1
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 2
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx3 v0, v[1:3], off
  ; GFX10-NEXT:    scratch_load_dwordx3 v[0:2], v0, off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2118,7 +2091,6 @@ define void @store_load_v3i32_unaligned(<3 x i32> addrspace(5)* nocapture %arg)
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v1, 1
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, 2
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v3, 3
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx3 v0, v[1:3], off
  ; GFX10-PAL-NEXT:    scratch_load_dwordx3 v[0:2], v0, off
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0)
@@ -2151,7 +2123,6 @@ define void @store_load_v4i32_unaligned(<4 x i32> addrspace(5)* nocapture %arg)
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 2
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 3
  ; GFX10-NEXT:    v_mov_b32_e32 v4, 4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    scratch_store_dwordx4 v0, v[1:4], off
  ; GFX10-NEXT:    scratch_load_dwordx4 v[0:3], v0, off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2178,7 +2149,6 @@ define void @store_load_v4i32_unaligned(<4 x i32> addrspace(5)* nocapture %arg)
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v2, 2
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v3, 3
  ; GFX10-PAL-NEXT:    v_mov_b32_e32 v4, 4
-; GFX10-PAL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-PAL-NEXT:    scratch_store_dwordx4 v0, v[1:4], off
  ; GFX10-PAL-NEXT:    scratch_load_dwordx4 v[0:3], v0, off
  ; GFX10-PAL-NEXT:    s_waitcnt vmcnt(0)
diff --git a/llvm/test/CodeGen/AMDGPU/gfx-callable-argument-types.ll b/llvm/test/CodeGen/AMDGPU/gfx-callable-argument-types.ll

index ec5227d..849db08 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/gfx-callable-argument-types.ll
+++ b/llvm/test/CodeGen/AMDGPU/gfx-callable-argument-types.ll
@@ -135,7 +135,6 @@ define amdgpu_gfx void @test_call_external_void_func_i1_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i1@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i1@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    buffer_store_byte v0, off, s[0:3], s32
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -198,7 +197,6 @@ define amdgpu_gfx void @test_call_external_void_func_i1_signext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i1_signext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i1_signext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -265,7 +263,6 @@ define amdgpu_gfx void @test_call_external_void_func_i1_zeroext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i1_zeroext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i1_zeroext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -330,7 +327,6 @@ define amdgpu_gfx void @test_call_external_void_func_i8_imm(i32) #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i8@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i8@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -389,7 +385,6 @@ define amdgpu_gfx void @test_call_external_void_func_i8_signext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i8_signext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i8_signext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -450,7 +445,6 @@ define amdgpu_gfx void @test_call_external_void_func_i8_zeroext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i8_zeroext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i8_zeroext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -512,7 +506,6 @@ define amdgpu_gfx void @test_call_external_void_func_i16_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i16@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -571,7 +564,6 @@ define amdgpu_gfx void @test_call_external_void_func_i16_signext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i16_signext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i16_signext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -632,7 +624,6 @@ define amdgpu_gfx void @test_call_external_void_func_i16_zeroext(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i16_zeroext@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i16_zeroext@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -694,7 +685,6 @@ define amdgpu_gfx void @test_call_external_void_func_i32_imm(i32) #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -756,7 +746,6 @@ define amdgpu_gfx void @test_call_external_void_func_i64_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i64@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -815,12 +804,11 @@ define amdgpu_gfx void @test_call_external_void_func_v2i64() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    global_load_dwordx4 v[0:3], v[0:1], off
-; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2i64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2i64@rel32@hi+12
+; GFX10-NEXT:    global_load_dwordx4 v[0:3], v[0:1], off
+; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -887,7 +875,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i64_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2i64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2i64@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -955,7 +942,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i64() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3i64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3i64@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1031,7 +1017,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i64() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v4i64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v4i64@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -1092,7 +1077,6 @@ define amdgpu_gfx void @test_call_external_void_func_f16_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_f16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_f16@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1152,7 +1136,6 @@ define amdgpu_gfx void @test_call_external_void_func_f32_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_f32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_f32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1214,7 +1197,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f32_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2f32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2f32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1278,7 +1260,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f32_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3f32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3f32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1347,7 +1328,6 @@ define amdgpu_gfx void @test_call_external_void_func_v5f32_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v5f32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v5f32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -1408,7 +1388,6 @@ define amdgpu_gfx void @test_call_external_void_func_f64_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_f64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_f64@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1474,7 +1453,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f64_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2f64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2f64@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1545,7 +1523,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f64_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3f64@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3f64@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -1603,7 +1580,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i16() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2i16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -1664,7 +1640,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i16() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3i16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -1725,7 +1700,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f16() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3f16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3f16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -1789,7 +1763,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i16_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3i16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1851,7 +1824,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f16_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3f16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3f16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -1910,7 +1882,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i16() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v4i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v4i16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -1974,7 +1945,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i16_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v4i16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v4i16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -2033,7 +2003,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f16() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2f16@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2f16@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -2094,7 +2063,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i32() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -2158,7 +2126,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i32_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v2i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v2i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -2222,7 +2189,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i32_imm(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -2288,7 +2254,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i32_i32(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v3i32_i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v3i32_i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -2347,7 +2312,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i32() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v4i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v4i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -2415,7 +2379,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i32_imm() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v4i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v4i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -2484,7 +2447,6 @@ define amdgpu_gfx void @test_call_external_void_func_v5i32_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v5i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v5i32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -2544,7 +2506,6 @@ define amdgpu_gfx void @test_call_external_void_func_v8i32() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
@@ -2630,7 +2591,6 @@ define amdgpu_gfx void @test_call_external_void_func_v8i32_imm() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_v8i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_v8i32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -2692,7 +2652,6 @@ define amdgpu_gfx void @test_call_external_void_func_v16i32() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
@@ -2772,7 +2731,6 @@ define amdgpu_gfx void @test_call_external_void_func_v32i32() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
@@ -2860,7 +2818,6 @@ define amdgpu_gfx void @test_call_external_void_func_v32i32_i32(i32) #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    global_load_dword v32, v[0:1], off
@@ -2952,7 +2909,6 @@ define amdgpu_gfx void @test_call_external_i32_func_i32_imm(i32 addrspace(1)* %o
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_i32_func_i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_i32_func_i32@rel32@hi+12
  ; GFX10-NEXT:    v_mov_b32_e32 v41, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v42, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    global_store_dword v[40:41], v0, off
@@ -3019,7 +2975,6 @@ define amdgpu_gfx void @test_call_external_void_func_struct_i8_i32() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
@@ -3098,7 +3053,6 @@ define amdgpu_gfx void @test_call_external_void_func_byval_struct_i8_i32() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_byval_struct_i8_i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_byval_struct_i8_i32@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3176,7 +3130,6 @@ define amdgpu_gfx void @test_call_external_void_func_sret_struct_i8_i32_byval_st
  ; GFX10-NEXT:    v_lshrrev_b32_e64 v0, 5, s33
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_lshrrev_b32_e64 v1, 5, s33
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_sret_struct_i8_i32_byval_struct_i8_i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_sret_struct_i8_i32_byval_struct_i8_i32@rel32@hi+12
@@ -3279,7 +3232,6 @@ define amdgpu_gfx void @test_call_external_void_func_v16i8() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
@@ -3373,7 +3325,6 @@ define void @tail_call_byval_align16(<32 x i32> %val, double %tmp) #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, byval_align16_f64_arg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, byval_align16_f64_arg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt vmcnt(1)
  ; GFX10-NEXT:    buffer_store_dword v32, off, s[0:3], s32 offset:4
@@ -3441,7 +3392,6 @@ define amdgpu_gfx void @test_call_external_void_func_i1_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_i1_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_i1_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    buffer_store_byte v0, off, s[0:3], s32
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -3502,7 +3452,6 @@ define amdgpu_gfx void @test_call_external_void_func_i8_imm_inreg(i32) #0 {
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_i8_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_i8_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3562,7 +3511,6 @@ define amdgpu_gfx void @test_call_external_void_func_i16_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_i16_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3622,7 +3570,6 @@ define amdgpu_gfx void @test_call_external_void_func_i32_imm_inreg(i32) #0 {
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_i32_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3684,7 +3631,6 @@ define amdgpu_gfx void @test_call_external_void_func_i64_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_i64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_i64_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3746,7 +3692,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i64_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v2i64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v2i64_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3813,7 +3758,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i64_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v2i64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v2i64_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3879,7 +3823,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i64_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[10:11]
  ; GFX10-NEXT:    s_add_u32 s10, s10, external_void_func_v3i64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s11, s11, external_void_func_v3i64_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[10:11]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -3953,7 +3896,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i64_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s12, s12, external_void_func_v4i64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s13, s13, external_void_func_v4i64_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[12:13]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -4014,7 +3956,6 @@ define amdgpu_gfx void @test_call_external_void_func_f16_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_f16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_f16_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4074,7 +4015,6 @@ define amdgpu_gfx void @test_call_external_void_func_f32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_f32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_f32_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4136,7 +4076,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v2f32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v2f32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4200,7 +4139,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v3f32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v3f32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4269,7 +4207,6 @@ define amdgpu_gfx void @test_call_external_void_func_v5f32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s10, s10, external_void_func_v5f32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s11, s11, external_void_func_v5f32_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[10:11]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -4330,7 +4267,6 @@ define amdgpu_gfx void @test_call_external_void_func_f64_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_f64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_f64_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4396,7 +4332,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f64_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v2f64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v2f64_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4467,7 +4402,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f64_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s10, s10, external_void_func_v3f64_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s11, s11, external_void_func_v3f64_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[10:11]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -4525,7 +4459,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i16_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v2i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v2i16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -4586,7 +4519,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i16_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v3i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v3i16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -4647,7 +4579,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f16_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v3f16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v3f16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -4711,7 +4642,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i16_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v3i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v3i16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4773,7 +4703,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3f16_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v3f16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v3f16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4832,7 +4761,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i16_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v4i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v4i16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -4896,7 +4824,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i16_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v4i16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v4i16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -4955,7 +4882,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2f16_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v2f16_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v2f16_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -5016,7 +4942,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i32_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v2i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v2i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
@@ -5080,7 +5005,6 @@ define amdgpu_gfx void @test_call_external_void_func_v2i32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[6:7]
  ; GFX10-NEXT:    s_add_u32 s6, s6, external_void_func_v2i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s7, s7, external_void_func_v2i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[6:7]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -5144,7 +5068,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i32_imm_inreg(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v3i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v3i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -5210,7 +5133,6 @@ define amdgpu_gfx void @test_call_external_void_func_v3i32_i32_inreg(i32) #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v3i32_i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v3i32_i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -5269,7 +5191,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i32_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v4i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v4i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
@@ -5337,7 +5258,6 @@ define amdgpu_gfx void @test_call_external_void_func_v4i32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[8:9]
  ; GFX10-NEXT:    s_add_u32 s8, s8, external_void_func_v4i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s9, s9, external_void_func_v4i32_inreg@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[8:9]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
@@ -5406,7 +5326,6 @@ define amdgpu_gfx void @test_call_external_void_func_v5i32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s10, s10, external_void_func_v5i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s11, s11, external_void_func_v5i32_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[10:11]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -5463,7 +5382,6 @@ define amdgpu_gfx void @test_call_external_void_func_v8i32_inreg() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_getpc_b64 s[12:13]
  ; GFX10-NEXT:    s_add_u32 s12, s12, external_void_func_v8i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s13, s13, external_void_func_v8i32_inreg@rel32@hi+12
@@ -5546,7 +5464,6 @@ define amdgpu_gfx void @test_call_external_void_func_v8i32_imm_inreg() #0 {
  ; GFX10-NEXT:    s_add_u32 s12, s12, external_void_func_v8i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s13, s13, external_void_func_v8i32_inreg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[12:13]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -5603,7 +5520,6 @@ define amdgpu_gfx void @test_call_external_void_func_v16i32_inreg() #0 {
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 2
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_getpc_b64 s[20:21]
  ; GFX10-NEXT:    s_add_u32 s20, s20, external_void_func_v16i32_inreg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s21, s21, external_void_func_v16i32_inreg@rel32@hi+12
@@ -5725,7 +5641,6 @@ define amdgpu_gfx void @test_call_external_void_func_v32i32_inreg() #0 {
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[4:5], 0x0
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s36, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s37, 1
  ; GFX10-NEXT:    v_writelane_b32 v40, s38, 2
@@ -5907,7 +5822,6 @@ define amdgpu_gfx void @test_call_external_void_func_v32i32_i32_inreg(i32) #0 {
  ; GFX10-NEXT:    s_load_dwordx2 s[4:5], s[4:5], 0x0
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s36, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s37, 1
  ; GFX10-NEXT:    v_writelane_b32 v40, s38, 2
@@ -6043,7 +5957,6 @@ define amdgpu_gfx void @stack_passed_arg_alignment_v32i32_f64(<32 x i32> %val, d
  ; GFX10-NEXT:    s_add_u32 s4, s4, stack_passed_f64_arg@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, stack_passed_f64_arg@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_waitcnt vmcnt(1)
  ; GFX10-NEXT:    buffer_store_dword v32, off, s[0:3], s32
@@ -6187,7 +6100,6 @@ define amdgpu_gfx void @stack_12xv3i32() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_12xv3i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_12xv3i32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -6354,7 +6266,6 @@ define amdgpu_gfx void @stack_8xv5i32() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_8xv5i32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_8xv5i32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
@@ -6517,7 +6428,6 @@ define amdgpu_gfx void @stack_8xv5f32() #0 {
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_8xv5f32@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_8xv5f32@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
  ; GFX10-NEXT:    v_readlane_b32 s4, v40, 0
  ; GFX10-NEXT:    v_readlane_b32 s5, v40, 1
diff --git a/llvm/test/CodeGen/AMDGPU/gfx-callable-preserved-registers.ll b/llvm/test/CodeGen/AMDGPU/gfx-callable-preserved-registers.ll

index bf946eb..cc66005 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/gfx-callable-preserved-registers.ll
+++ b/llvm/test/CodeGen/AMDGPU/gfx-callable-preserved-registers.ll
@@ -48,7 +48,6 @@ define amdgpu_gfx void @test_call_external_void_func_void_clobber_s30_s31_call_e
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 4
  ; GFX10-NEXT:    s_mov_b32 s33, s32
  ; GFX10-NEXT:    s_add_u32 s32, s32, 0x200
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s34, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s35, 1
  ; GFX10-NEXT:    s_getpc_b64 s[34:35]
@@ -93,7 +92,6 @@ define amdgpu_gfx void @void_func_void_clobber_s30_s31() #1 {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    s_mov_b64 s[4:5], s[30:31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; clobber
  ; GFX10-NEXT:    ;;#ASMEND
@@ -152,7 +150,6 @@ define amdgpu_gfx void @test_call_void_func_void_mayclobber_s31(i32 addrspace(1)
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s34, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 1
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 2
@@ -237,7 +234,6 @@ define amdgpu_gfx void @test_call_void_func_void_mayclobber_v31(i32 addrspace(1)
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v40, v31
  ; GFX10-NEXT:    v_writelane_b32 v41, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -311,7 +307,6 @@ define amdgpu_gfx void @test_call_void_func_void_preserves_s33(i32 addrspace(1)*
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s33, 0
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; def s33
@@ -387,7 +382,6 @@ define amdgpu_gfx void @test_call_void_func_void_preserves_s34(i32 addrspace(1)*
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s34, 0
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; def s34
@@ -465,7 +459,6 @@ define amdgpu_gfx void @test_call_void_func_void_preserves_v40(i32 addrspace(1)*
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
  ; GFX10-NEXT:    v_writelane_b32 v41, s30, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; def v40
  ; GFX10-NEXT:    ;;#ASMEND
@@ -510,7 +503,6 @@ define hidden void @void_func_void_clobber_s33() #1 {
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; clobber
  ; GFX10-NEXT:    ;;#ASMEND
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readlane_b32 s33, v0, 0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    call void asm sideeffect "; clobber", "~{s33}"() #0
@@ -536,7 +528,6 @@ define hidden void @void_func_void_clobber_s34() #1 {
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; clobber
  ; GFX10-NEXT:    ;;#ASMEND
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_readlane_b32 s34, v0, 0
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    call void asm sideeffect "; clobber", "~{s34}"() #0
@@ -583,7 +574,6 @@ define amdgpu_gfx void @test_call_void_func_void_clobber_s33() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, void_func_void_clobber_s33@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, void_func_void_clobber_s33@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -641,7 +631,6 @@ define amdgpu_gfx void @test_call_void_func_void_clobber_s34() #0 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, void_func_void_clobber_s34@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, void_func_void_clobber_s34@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s30, 0
  ; GFX10-NEXT:    v_writelane_b32 v40, s31, 1
  ; GFX10-NEXT:    s_swappc_b64 s[30:31], s[4:5]
@@ -707,7 +696,6 @@ define amdgpu_gfx void @callee_saved_sgpr_kernel() #1 {
  ; GFX10-NEXT:    s_getpc_b64 s[4:5]
  ; GFX10-NEXT:    s_add_u32 s4, s4, external_void_func_void@rel32@lo+4
  ; GFX10-NEXT:    s_addc_u32 s5, s5, external_void_func_void@rel32@hi+12
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_writelane_b32 v40, s40, 0
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; def s40
@@ -800,7 +788,6 @@ define amdgpu_gfx void @callee_saved_sgpr_vgpr_kernel() #1 {
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ; def v32
  ; GFX10-NEXT:    ;;#ASMEND
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v40, v32
  ; GFX10-NEXT:    v_writelane_b32 v41, s30, 1
  ; GFX10-NEXT:    v_writelane_b32 v41, s31, 2
diff --git a/llvm/test/CodeGen/AMDGPU/global-saddr-atomics.gfx1030.ll b/llvm/test/CodeGen/AMDGPU/global-saddr-atomics.gfx1030.ll

index fae9832..e9784ef 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/global-saddr-atomics.gfx1030.ll
+++ b/llvm/test/CodeGen/AMDGPU/global-saddr-atomics.gfx1030.ll
@@ -9,7 +9,6 @@ define amdgpu_ps float @global_csub_saddr_i32_rtn(i8 addrspace(1)* inreg %sbase,
  ; GCN-LABEL: global_csub_saddr_i32_rtn:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    global_atomic_csub v0, v0, v1, s[2:3] glc
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    ; return to shader part epilog
    %zext.offset = zext i32 %voffset to i64
@@ -24,7 +23,6 @@ define amdgpu_ps float @global_csub_saddr_i32_rtn_neg128(i8 addrspace(1)* inreg
  ; GCN-LABEL: global_csub_saddr_i32_rtn_neg128:
  ; GCN:       ; %bb.0:
  ; GCN-NEXT:    global_atomic_csub v0, v0, v1, s[2:3] offset:-128 glc
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0)
  ; GCN-NEXT:    ; return to shader part epilog
    %zext.offset = zext i32 %voffset to i64
diff --git a/llvm/test/CodeGen/AMDGPU/hsa-metadata-kernel-code-props-v3.ll b/llvm/test/CodeGen/AMDGPU/hsa-metadata-kernel-code-props-v3.ll

index 069658c..227d4fa 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/hsa-metadata-kernel-code-props-v3.ll
+++ b/llvm/test/CodeGen/AMDGPU/hsa-metadata-kernel-code-props-v3.ll
@@ -15,8 +15,7 @@
  ; CHECK:     .max_flat_workgroup_size: 1024
  ; CHECK:     .name:           test
  ; CHECK:     .private_segment_fixed_size: 0
-; WAVE64:    .sgpr_count:     8
-; WAVE32:    .sgpr_count:     10
+; CHECK:     .sgpr_count:     8
  ; CHECK:     .symbol:         test.kd
  ; CHECK:     .vgpr_count:     {{3|6}}
  ; WAVE64:    .wavefront_size: 64
diff --git a/llvm/test/CodeGen/AMDGPU/idot2.ll b/llvm/test/CodeGen/AMDGPU/idot2.ll

index a7b137b..1f21e3e 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/idot2.ll
+++ b/llvm/test/CodeGen/AMDGPU/idot2.ll
@@ -104,7 +104,6 @@ define amdgpu_kernel void @udot2(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -244,7 +243,6 @@ define amdgpu_kernel void @udot2_MulMul(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s2, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s3, s[6:7], 0x0
@@ -375,7 +373,6 @@ define amdgpu_kernel void @idot2(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -507,7 +504,6 @@ define amdgpu_kernel void @idot2_MixedTypedMul(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -642,7 +638,6 @@ define amdgpu_kernel void @udot2_alt_AddOperands(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -774,7 +769,6 @@ define amdgpu_kernel void @idot2_MixedExt(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -895,7 +889,6 @@ define amdgpu_kernel void @notudot2_SameVec(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s2, s[6:7], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s3, s[0:1], 0x0
@@ -1027,7 +1020,6 @@ define amdgpu_kernel void @udot2_v4i16(<4 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1157,7 +1149,6 @@ define amdgpu_kernel void @udot2_v4i16_Hi(<4 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x4
@@ -1295,7 +1286,6 @@ define amdgpu_kernel void @notudot2_v4i16_Even(<4 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_mov_b32 s7, 0xffff
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x0
@@ -1438,7 +1428,6 @@ define amdgpu_kernel void @notudot2_v4i16_Middle(<4 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_mov_b32 s7, 0xffff
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x0
@@ -1580,7 +1569,6 @@ define amdgpu_kernel void @notudot2_DiffIndex(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1727,7 +1715,6 @@ define amdgpu_kernel void @udot2_MultipleUses_add1(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1872,7 +1859,6 @@ define amdgpu_kernel void @idot2_MultipleUses_add1(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2021,7 +2007,6 @@ define amdgpu_kernel void @udot2_MultipleUses_mul1(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2167,7 +2152,6 @@ define amdgpu_kernel void @idot2_MultipleUses_mul1(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2317,7 +2301,6 @@ define amdgpu_kernel void @udot2_MultipleUses_mul2(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2463,7 +2446,6 @@ define amdgpu_kernel void @idot2_MultipleUses_mul2(<2 x i16> addrspace(1)* %src1
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2600,7 +2582,6 @@ define amdgpu_kernel void @udot2_acc16(<2 x i16> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2740,7 +2721,6 @@ define amdgpu_kernel void @notsdot2_sext8(<2 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x34
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_clause 0x1
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
diff --git a/llvm/test/CodeGen/AMDGPU/idot4s.ll b/llvm/test/CodeGen/AMDGPU/idot4s.ll

index c941080..15e7147 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/idot4s.ll
+++ b/llvm/test/CodeGen/AMDGPU/idot4s.ll
@@ -121,7 +121,6 @@ define amdgpu_kernel void @idot4_acc32(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -295,7 +294,6 @@ define amdgpu_kernel void @idot4_acc16(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -460,7 +458,6 @@ define amdgpu_kernel void @idot4_acc8(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -633,7 +630,6 @@ define amdgpu_kernel void @idot4_multiuse_mul1(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -828,7 +824,6 @@ define amdgpu_kernel void @idot4_acc32_vecMul(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_clause 0x1
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x34
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s2, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s3, s[6:7], 0x0
@@ -1025,7 +1020,6 @@ define amdgpu_kernel void @idot4_acc16_vecMul(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0xffff
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/idot4u.ll b/llvm/test/CodeGen/AMDGPU/idot4u.ll

index b491db0..4159349 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/idot4u.ll
+++ b/llvm/test/CodeGen/AMDGPU/idot4u.ll
@@ -124,7 +124,6 @@ define amdgpu_kernel void @udot4_acc32(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -291,7 +290,6 @@ define amdgpu_kernel void @udot4_acc16(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -457,7 +455,6 @@ define amdgpu_kernel void @udot4_acc8(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -599,7 +596,6 @@ define amdgpu_kernel void @udot2_8(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s2, s[2:3], 0x0
@@ -753,7 +749,6 @@ define amdgpu_kernel void @udot4_CommutationInsideMAD(<4 x i8> addrspace(1)* %sr
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -928,7 +923,6 @@ define amdgpu_kernel void @udot4_CommutationAccrossMADs(<4 x i8> addrspace(1)* %
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_movk_i32 s6, 0xff
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1118,7 +1112,6 @@ define amdgpu_kernel void @udot4_multiuse_mul1(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1324,7 +1317,6 @@ define amdgpu_kernel void @udot4_multiuse_add1(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_movk_i32 s7, 0xff
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1519,7 +1511,6 @@ define amdgpu_kernel void @notdot4_mixedtypes(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1714,7 +1705,6 @@ define amdgpu_kernel void @udot4_acc32_vecMul(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_clause 0x1
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[4:7], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x34
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s2, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s3, s[6:7], 0x0
@@ -1906,7 +1896,6 @@ define amdgpu_kernel void @udot4_acc16_vecMul(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0xffff
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2122,7 +2111,6 @@ define amdgpu_kernel void @udot4_acc8_vecMul(<4 x i8> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/idot8s.ll b/llvm/test/CodeGen/AMDGPU/idot8s.ll

index 2e3411f..f4609ca 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/idot8s.ll
+++ b/llvm/test/CodeGen/AMDGPU/idot8s.ll
@@ -201,7 +201,6 @@ define amdgpu_kernel void @idot8_acc32(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -532,7 +531,6 @@ define amdgpu_kernel void @idot8_acc16(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s12, s12, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s13, s13, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -902,7 +900,6 @@ define amdgpu_kernel void @idot8_acc8(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s12, s12, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s13, s13, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1244,7 +1241,6 @@ define amdgpu_kernel void @idot8_multiuses_mul1(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1543,7 +1539,6 @@ define amdgpu_kernel void @idot8_acc32_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1863,7 +1858,6 @@ define amdgpu_kernel void @idot8_acc16_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s12, s12, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s13, s13, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2319,7 +2313,6 @@ define amdgpu_kernel void @idot8_acc8_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s20, s20, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s21, s21, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/idot8u.ll b/llvm/test/CodeGen/AMDGPU/idot8u.ll

index b37d1d1..1937cca 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/idot8u.ll
+++ b/llvm/test/CodeGen/AMDGPU/idot8u.ll
@@ -199,7 +199,6 @@ define amdgpu_kernel void @udot8_acc32(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -504,7 +503,6 @@ define amdgpu_kernel void @udot8_acc16(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -833,7 +831,6 @@ define amdgpu_kernel void @udot8_acc8(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1172,7 +1169,6 @@ define amdgpu_kernel void @udot8_acc4(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1498,7 +1494,6 @@ define amdgpu_kernel void @udot8_CommutationInsideMAD(<8 x i4> addrspace(1)* %sr
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -1818,7 +1813,6 @@ define amdgpu_kernel void @udot8_multiuses_mul1(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v2, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2116,7 +2110,6 @@ define amdgpu_kernel void @udot8_acc32_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2410,7 +2403,6 @@ define amdgpu_kernel void @udot8_acc16_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ushort v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -2798,7 +2790,6 @@ define amdgpu_kernel void @udot8_acc8_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s12, s12, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s13, s13, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -3123,7 +3114,6 @@ define amdgpu_kernel void @udot8_acc4_vecMul(<8 x i4> addrspace(1)* %src1,
  ; GFX10-DL-NEXT:    s_add_u32 s8, s8, s3
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    s_addc_u32 s9, s9, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    global_load_ubyte v1, v0, s[4:5]
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
@@ -3353,7 +3343,6 @@ define amdgpu_kernel void @udot8_variant1(i32 addrspace(1)* %v1addr,
  ; GFX10-DL-NEXT:    s_load_dwordx2 s[4:5], s[0:1], 0x34
  ; GFX10-DL-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-DL-NEXT:    v_mov_b32_e32 v1, 0
-; GFX10-DL-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-DL-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-DL-NEXT:    s_load_dword s6, s[4:5], 0x0
  ; GFX10-DL-NEXT:    s_load_dword s0, s[0:1], 0x0
diff --git a/llvm/test/CodeGen/AMDGPU/image-load-d16-tfe.ll b/llvm/test/CodeGen/AMDGPU/image-load-d16-tfe.ll

index f52aa1e..b317d72 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/image-load-d16-tfe.ll
+++ b/llvm/test/CodeGen/AMDGPU/image-load-d16-tfe.ll
@@ -35,7 +35,6 @@ define amdgpu_ps void @load_1d_f16_tfe_dmask0(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s4, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    image_load v[1:2], v0, s[4:11] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_short v[0:1], v1, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v2, off
@@ -98,7 +97,6 @@ define amdgpu_ps void @load_1d_f16_tfe_dmask1(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s4, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    image_load v[1:2], v0, s[4:11] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_short v[0:1], v1, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v2, off
@@ -161,7 +159,6 @@ define amdgpu_ps void @load_1d_v2f16_tfe_dmask0(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s4, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    image_load v[1:2], v0, s[4:11] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v[0:1], v1, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v2, off
@@ -224,7 +221,6 @@ define amdgpu_ps void @load_1d_v2f16_tfe_dmask1(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s4, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    image_load v[1:2], v0, s[4:11] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v[0:1], v1, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v2, off
@@ -287,7 +283,6 @@ define amdgpu_ps void @load_1d_v2f16_tfe_dmask3(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    s_mov_b32 s4, s2
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    image_load v[1:2], v0, s[4:11] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dword v[0:1], v1, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v2, off
@@ -356,7 +351,6 @@ define amdgpu_ps void @load_1d_v3f16_tfe_dmask7(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v1
  ; GFX10-NEXT:    image_load v[1:3], v0, s[4:11] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off
  ; GFX10-NEXT:    global_store_dword v[0:1], v1, off
@@ -427,7 +421,6 @@ define amdgpu_ps void @load_1d_v4f16_tfe_dmask15(<8 x i32> inreg %rsrc, i32 %s)
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v1
  ; GFX10-NEXT:    image_load v[1:3], v0, s[4:11] dmask:0xf dim:SQ_RSRC_IMG_1D unorm tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    global_store_dwordx2 v[0:1], v[1:2], off
  ; GFX10-NEXT:    global_store_dword v[0:1], v3, off
diff --git a/llvm/test/CodeGen/AMDGPU/imm16.ll b/llvm/test/CodeGen/AMDGPU/imm16.ll

index e54b578..89918a0 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/imm16.ll
+++ b/llvm/test/CodeGen/AMDGPU/imm16.ll
@@ -12,7 +12,6 @@ define amdgpu_kernel void @store_inline_imm_neg_0.0_i16(i16 addrspace(1)* %out)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffff8000 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x80,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -47,7 +46,6 @@ define amdgpu_kernel void @store_inline_imm_0.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0 ; encoding: [0x80,0x02,0x00,0x7e]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -82,7 +80,6 @@ define amdgpu_kernel void @store_imm_neg_0.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffff8000 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x80,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -117,7 +114,6 @@ define amdgpu_kernel void @store_inline_imm_0.5_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x3800 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x38,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -152,7 +148,6 @@ define amdgpu_kernel void @store_inline_imm_m_0.5_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffffb800 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0xb8,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -187,7 +182,6 @@ define amdgpu_kernel void @store_inline_imm_1.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x3c00 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x3c,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -222,7 +216,6 @@ define amdgpu_kernel void @store_inline_imm_m_1.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffffbc00 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0xbc,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -257,7 +250,6 @@ define amdgpu_kernel void @store_inline_imm_2.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x4000 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x40,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -292,7 +284,6 @@ define amdgpu_kernel void @store_inline_imm_m_2.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffffc000 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0xc0,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -327,7 +318,6 @@ define amdgpu_kernel void @store_inline_imm_4.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x4400 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x44,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -362,7 +352,6 @@ define amdgpu_kernel void @store_inline_imm_m_4.0_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffffc400 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0xc4,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -397,7 +386,6 @@ define amdgpu_kernel void @store_inline_imm_inv_2pi_f16(half addrspace(1)* %out)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x3118 ; encoding: [0xff,0x02,0x00,0x7e,0x18,0x31,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -432,7 +420,6 @@ define amdgpu_kernel void @store_inline_imm_m_inv_2pi_f16(half addrspace(1)* %ou
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0xffffb118 ; encoding: [0xff,0x02,0x00,0x7e,0x18,0xb1,0xff,0xff]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -467,7 +454,6 @@ define amdgpu_kernel void @store_literal_imm_f16(half addrspace(1)* %out) {
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x6c00 ; encoding: [0xff,0x02,0x00,0x7e,0x00,0x6c,0x00,0x00]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    buffer_store_short v0, off, s[0:3], 0 ; encoding: [0x00,0x00,0x68,0xe0,0x00,0x00,0x00,0x80]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -502,7 +488,6 @@ define amdgpu_kernel void @add_inline_imm_0.0_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x00,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -544,7 +529,6 @@ define amdgpu_kernel void @add_inline_imm_0.5_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 0.5 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xe0,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -586,7 +570,6 @@ define amdgpu_kernel void @add_inline_imm_neg_0.5_f16(half addrspace(1)* %out, h
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, -0.5 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xe2,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -628,7 +611,6 @@ define amdgpu_kernel void @add_inline_imm_1.0_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 1.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xe4,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -670,7 +652,6 @@ define amdgpu_kernel void @add_inline_imm_neg_1.0_f16(half addrspace(1)* %out, h
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, -1.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xe6,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -712,7 +693,6 @@ define amdgpu_kernel void @add_inline_imm_2.0_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 2.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xe8,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -754,7 +734,6 @@ define amdgpu_kernel void @add_inline_imm_neg_2.0_f16(half addrspace(1)* %out, h
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, -2.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xea,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -796,7 +775,6 @@ define amdgpu_kernel void @add_inline_imm_4.0_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 4.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xec,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -838,7 +816,6 @@ define amdgpu_kernel void @add_inline_imm_neg_4.0_f16(half addrspace(1)* %out, h
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, -4.0 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0xee,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -881,7 +858,6 @@ define amdgpu_kernel void @commute_add_inline_imm_0.5_f16(half addrspace(1)* %ou
  ; GFX10-NEXT:    s_mov_b32 s7, 0x31016000 ; encoding: [0xff,0x03,0x87,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s10, s6 ; encoding: [0x06,0x03,0x8a,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s11, s7 ; encoding: [0x07,0x03,0x8b,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    s_mov_b32 s8, s2 ; encoding: [0x02,0x03,0x88,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s9, s3 ; encoding: [0x03,0x03,0x89,0xbe]
@@ -944,7 +920,6 @@ define amdgpu_kernel void @commute_add_literal_f16(half addrspace(1)* %out, half
  ; GFX10-NEXT:    s_mov_b32 s7, 0x31016000 ; encoding: [0xff,0x03,0x87,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s10, s6 ; encoding: [0x06,0x03,0x8a,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s11, s7 ; encoding: [0x07,0x03,0x8b,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    s_mov_b32 s8, s2 ; encoding: [0x02,0x03,0x88,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s9, s3 ; encoding: [0x03,0x03,0x89,0xbe]
@@ -1006,7 +981,6 @@ define amdgpu_kernel void @add_inline_imm_1_f16(half addrspace(1)* %out, half %x
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 1 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x02,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -1048,7 +1022,6 @@ define amdgpu_kernel void @add_inline_imm_2_f16(half addrspace(1)* %out, half %x
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 2 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x04,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -1090,7 +1063,6 @@ define amdgpu_kernel void @add_inline_imm_16_f16(half addrspace(1)* %out, half %
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 16 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x20,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -1133,7 +1105,6 @@ define amdgpu_kernel void @add_inline_imm_neg_1_f16(half addrspace(1)* %out, i16
  ; GFX10-NEXT:    s_mov_b32 s7, 0x31016000 ; encoding: [0xff,0x03,0x87,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s10, s6 ; encoding: [0x06,0x03,0x8a,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s11, s7 ; encoding: [0x07,0x03,0x8b,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    s_mov_b32 s8, s2 ; encoding: [0x02,0x03,0x88,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s9, s3 ; encoding: [0x03,0x03,0x89,0xbe]
@@ -1195,7 +1166,6 @@ define amdgpu_kernel void @add_inline_imm_neg_2_f16(half addrspace(1)* %out, i16
  ; GFX10-NEXT:    s_mov_b32 s7, 0x31016000 ; encoding: [0xff,0x03,0x87,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s10, s6 ; encoding: [0x06,0x03,0x8a,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s11, s7 ; encoding: [0x07,0x03,0x8b,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    s_mov_b32 s8, s2 ; encoding: [0x02,0x03,0x88,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s9, s3 ; encoding: [0x03,0x03,0x89,0xbe]
@@ -1257,7 +1227,6 @@ define amdgpu_kernel void @add_inline_imm_neg_16_f16(half addrspace(1)* %out, i1
  ; GFX10-NEXT:    s_mov_b32 s7, 0x31016000 ; encoding: [0xff,0x03,0x87,0xbe,0x00,0x60,0x01,0x31]
  ; GFX10-NEXT:    s_mov_b32 s10, s6 ; encoding: [0x06,0x03,0x8a,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s11, s7 ; encoding: [0x07,0x03,0x8b,0xbe]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    s_mov_b32 s8, s2 ; encoding: [0x02,0x03,0x88,0xbe]
  ; GFX10-NEXT:    s_mov_b32 s9, s3 ; encoding: [0x03,0x03,0x89,0xbe]
@@ -1318,7 +1287,6 @@ define amdgpu_kernel void @add_inline_imm_63_f16(half addrspace(1)* %out, half %
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 63 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x7e,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -1360,7 +1328,6 @@ define amdgpu_kernel void @add_inline_imm_64_f16(half addrspace(1)* %out, half %
  ; GFX10-NEXT:    s_load_dword s2, s[4:5], 0x8 ; encoding: [0x82,0x00,0x00,0xf4,0x08,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[4:5], 0x0 ; encoding: [0x02,0x00,0x04,0xf4,0x00,0x00,0x00,0xfa]
  ; GFX10-NEXT:    s_mov_b32 s3, 0x31016000 ; encoding: [0xff,0x03,0x83,0xbe,0x00,0x60,0x01,0x31]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0) ; encoding: [0x7f,0xc0,0x8c,0xbf]
  ; GFX10-NEXT:    v_add_f16_e64 v0, s2, 64 ; encoding: [0x00,0x00,0x32,0xd5,0x02,0x80,0x01,0x00]
  ; GFX10-NEXT:    s_mov_b32 s2, -1 ; encoding: [0xc1,0x03,0x82,0xbe]
@@ -1403,7 +1370,6 @@ define void @mul_inline_imm_0.5_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0x3800, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0x38,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1439,7 +1405,6 @@ define void @mul_inline_imm_neg_0.5_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0xb800, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0xb8,0xff,0xff]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1475,7 +1440,6 @@ define void @mul_inline_imm_1.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0x3c00, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0x3c,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1511,7 +1475,6 @@ define void @mul_inline_imm_neg_1.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0xbc00, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0xbc,0xff,0xff]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1547,7 +1510,6 @@ define void @shl_inline_imm_2.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v2, v2, 0x4000 ; encoding: [0x02,0x00,0x14,0xd7,0x02,0xff,0x01,0x00,0x00,0x40,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1584,7 +1546,6 @@ define void @shl_inline_imm_neg_2.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_lshlrev_b16_e64 v2, v2, 0xc000 ; encoding: [0x02,0x00,0x14,0xd7,0x02,0xff,0x01,0x00,0x00,0xc0,0xff,0xff]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1621,7 +1582,6 @@ define void @mul_inline_imm_4.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0x4400, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0x44,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1657,7 +1617,6 @@ define void @mul_inline_imm_neg_4.0_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0xc400, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x00,0xc4,0xff,0xff]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
@@ -1693,7 +1652,6 @@ define void @mul_inline_imm_inv2pi_i16(i16 addrspace(1)* %out, i16 %x) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0) ; encoding: [0x00,0x00,0x8c,0xbf]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    v_mul_lo_u16_e64 v2, 0x3118, v2 ; encoding: [0x02,0x00,0x05,0xd7,0xff,0x04,0x02,0x00,0x18,0x31,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    global_store_short v[0:1], v2, off ; encoding: [0x00,0x80,0x68,0xdc,0x00,0x02,0x7d,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
  ; GFX10-NEXT:    s_setpc_b64 s[30:31] ; encoding: [0x1e,0x20,0x80,0xbe]
diff --git a/llvm/test/CodeGen/AMDGPU/insert-branch-w32.mir b/llvm/test/CodeGen/AMDGPU/insert-branch-w32.mir

index 5ccf84d..85a6b71 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/insert-branch-w32.mir
+++ b/llvm/test/CodeGen/AMDGPU/insert-branch-w32.mir
@@ -12,7 +12,6 @@ body:             |
    bb.0:
      $vgpr1 = V_MOV_B32_e32 1050, implicit $exec
      $sgpr0 = S_MOV_B32 1123418112
-    $vcc_hi = IMPLICIT_DEF
    bb.1:
      $vgpr0 = COPY killed $vgpr1, implicit $exec
      V_CMP_GT_U32_e32 5, $vgpr1, implicit-def $vcc_lo, implicit $exec, implicit-def $vcc
@@ -34,7 +33,6 @@ body:             |
    bb.0:
      $vgpr1 = V_MOV_B32_e32 1050, implicit $exec
      $sgpr0 = S_MOV_B32 1123418112
-    $vcc_hi = IMPLICIT_DEF
    bb.1:
      $vgpr0 = COPY killed $vgpr1, implicit $exec
      S_CBRANCH_VCCNZ %bb.1, implicit undef $vcc_lo, implicit undef $vcc
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ballot.i32.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ballot.i32.ll

index 20ef90d..2286543 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ballot.i32.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ballot.i32.ll
@@ -9,7 +9,6 @@ define amdgpu_cs i32 @constant_false() {
  ; CHECK-LABEL: constant_false:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    s_mov_b32 s0, 0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 0)
    ret i32 %ballot
@@ -21,7 +20,6 @@ define amdgpu_cs i32 @constant_true() {
  ; CHECK-LABEL: constant_true:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    s_mov_b32 s0, exec_lo
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 1)
    ret i32 %ballot
@@ -33,7 +31,6 @@ define amdgpu_cs i32 @non_compare(i32 %x) {
  ; CHECK-LABEL: non_compare:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_and_b32_e32 v0, 1, v0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    v_cmp_ne_u32_e64 s0, 0, v0
  ; CHECK-NEXT:    ; return to shader part epilog
    %trunc = trunc i32 %x to i1
@@ -47,7 +44,6 @@ define amdgpu_cs i32 @compare_ints(i32 %x, i32 %y) {
  ; CHECK-LABEL: compare_ints:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_eq_u32_e64 s0, v0, v1
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = icmp eq i32 %x, %y
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
@@ -58,7 +54,6 @@ define amdgpu_cs i32 @compare_int_with_constant(i32 %x) {
  ; CHECK-LABEL: compare_int_with_constant:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_lt_i32_e64 s0, 0x62, v0
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = icmp sge i32 %x, 99
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
@@ -69,7 +64,6 @@ define amdgpu_cs i32 @compare_floats(float %x, float %y) {
  ; CHECK-LABEL: compare_floats:
  ; CHECK:       ; %bb.0:
  ; CHECK-NEXT:    v_cmp_gt_f32_e64 s0, v0, v1
-; CHECK-NEXT:    ; implicit-def: $vcc_hi
  ; CHECK-NEXT:    ; return to shader part epilog
    %cmp = fcmp ogt float %x, %y
    %ballot = call i32 @llvm.amdgcn.ballot.i32(i1 %cmp)
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fma.legacy.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fma.legacy.ll

index 28e2c7a..27ba74c 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fma.legacy.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fma.legacy.ll
@@ -8,7 +8,6 @@ define float @v_fma(float %a, float %b, float %c)  {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    v_fmac_legacy_f32_e64 v2, v0, v1
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    v_mov_b32_e32 v0, v2
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %fma = call float @llvm.amdgcn.fma.legacy(float %a, float %b, float %c)
@@ -21,7 +20,6 @@ define float @v_fabs_fma(float %a, float %b, float %c)  {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    v_fma_legacy_f32 v0, |v0|, v1, v2
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %fabs.a = call float @llvm.fabs.f32(float %a)
    %fma = call float @llvm.amdgcn.fma.legacy(float %fabs.a, float %b, float %c)
@@ -34,7 +32,6 @@ define float @v_fneg_fabs_fma(float %a, float %b, float %c)  {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    v_fma_legacy_f32 v0, v0, -|v1|, v2
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %fabs.b = call float @llvm.fabs.f32(float %b)
    %neg.fabs.b = fneg float %fabs.b
@@ -48,7 +45,6 @@ define float @v_fneg_fma(float %a, float %b, float %c)  {
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:    v_fma_legacy_f32 v0, v0, v1, -v2
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_setpc_b64 s[30:31]
    %neg.c = fneg float %c
    %fma = call float @llvm.amdgcn.fma.legacy(float %a, float %b, float %neg.c)
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.dim.ll

index c92f5ff..329fa50 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.dim.ll
@@ -12,7 +12,6 @@ define amdgpu_ps <4 x float> @load_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords)
  ; GFX10-LABEL: load_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -31,7 +30,6 @@ define amdgpu_ps <4 x float> @load_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords)
  ; GFX10-LABEL: load_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -51,7 +49,6 @@ define amdgpu_ps <4 x float> @load_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ; GFX10-LABEL: load_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -72,7 +69,6 @@ define amdgpu_ps <4 x float> @load_cube(<8 x i32> inreg %rsrc, <2 x i16> %coords
  ; GFX10-LABEL: load_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -93,7 +89,6 @@ define amdgpu_ps <4 x float> @load_1darray(<8 x i32> inreg %rsrc, <2 x i16> %coo
  ; GFX10-LABEL: load_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -113,7 +108,6 @@ define amdgpu_ps <4 x float> @load_2darray(<8 x i32> inreg %rsrc, <2 x i16> %coo
  ; GFX10-LABEL: load_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -134,7 +128,6 @@ define amdgpu_ps <4 x float> @load_2dmsaa(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -155,7 +148,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -177,7 +169,6 @@ define amdgpu_ps <4 x float> @load_mip_1d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -197,7 +188,6 @@ define amdgpu_ps <4 x float> @load_mip_2d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -218,7 +208,6 @@ define amdgpu_ps <4 x float> @load_mip_3d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -240,7 +229,6 @@ define amdgpu_ps <4 x float> @load_mip_cube(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: load_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -262,7 +250,6 @@ define amdgpu_ps <4 x float> @load_mip_1darray(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -283,7 +270,6 @@ define amdgpu_ps <4 x float> @load_mip_2darray(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -303,7 +289,6 @@ define amdgpu_ps void @store_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -320,7 +305,6 @@ define amdgpu_ps void @store_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -338,7 +322,6 @@ define amdgpu_ps void @store_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -357,7 +340,6 @@ define amdgpu_ps void @store_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2
  ;
  ; GFX10-LABEL: store_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -376,7 +358,6 @@ define amdgpu_ps void @store_1darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -394,7 +375,6 @@ define amdgpu_ps void @store_2darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -413,7 +393,6 @@ define amdgpu_ps void @store_2dmsaa(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -432,7 +411,6 @@ define amdgpu_ps void @store_2darraymsaa(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -452,7 +430,6 @@ define amdgpu_ps void @store_mip_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -470,7 +447,6 @@ define amdgpu_ps void @store_mip_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -489,7 +465,6 @@ define amdgpu_ps void @store_mip_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -509,7 +484,6 @@ define amdgpu_ps void @store_mip_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -529,7 +503,6 @@ define amdgpu_ps void @store_mip_1darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -548,7 +521,6 @@ define amdgpu_ps void @store_mip_2darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -570,7 +542,6 @@ define amdgpu_ps <4 x float> @getresinfo_1d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -589,7 +560,6 @@ define amdgpu_ps <4 x float> @getresinfo_2d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -608,7 +578,6 @@ define amdgpu_ps <4 x float> @getresinfo_3d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -627,7 +596,6 @@ define amdgpu_ps <4 x float> @getresinfo_cube(<8 x i32> inreg %rsrc, <2 x i16> %
  ; GFX10-LABEL: getresinfo_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -646,7 +614,6 @@ define amdgpu_ps <4 x float> @getresinfo_1darray(<8 x i32> inreg %rsrc, <2 x i16
  ; GFX10-LABEL: getresinfo_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -665,7 +632,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darray(<8 x i32> inreg %rsrc, <2 x i16
  ; GFX10-LABEL: getresinfo_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -684,7 +650,6 @@ define amdgpu_ps <4 x float> @getresinfo_2dmsaa(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: getresinfo_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -703,7 +668,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darraymsaa(<8 x i32> inreg %rsrc, <2 x
  ; GFX10-LABEL: getresinfo_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -722,7 +686,6 @@ define amdgpu_ps float @load_1d_V1(<8 x i32> inreg %rsrc, <2 x i16> %coords) {
  ; GFX10-LABEL: load_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_1D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -741,7 +704,6 @@ define amdgpu_ps <2 x float> @load_1d_V2(<8 x i32> inreg %rsrc, <2 x i16> %coord
  ; GFX10-LABEL: load_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x9 dim:SQ_RSRC_IMG_1D unorm a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -758,7 +720,6 @@ define amdgpu_ps void @store_1d_V1(<8 x i32> inreg %rsrc, float %vdata, <2 x i16
  ;
  ; GFX10-LABEL: store_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v0, v1, s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -775,7 +736,6 @@ define amdgpu_ps void @store_1d_V2(<8 x i32> inreg %rsrc, <2 x float> %vdata, <2
  ;
  ; GFX10-LABEL: store_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:1], v2, s[0:7] dmask:0xc dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -794,7 +754,6 @@ define amdgpu_ps <4 x float> @load_1d_glc(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -813,7 +772,6 @@ define amdgpu_ps <4 x float> @load_1d_slc(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -832,7 +790,6 @@ define amdgpu_ps <4 x float> @load_1d_glc_slc(<8 x i32> inreg %rsrc, <2 x i16> %
  ; GFX10-LABEL: load_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -849,7 +806,6 @@ define amdgpu_ps void @store_1d_glc(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -866,7 +822,6 @@ define amdgpu_ps void @store_1d_slc(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -883,7 +838,6 @@ define amdgpu_ps void @store_1d_glc_slc(<8 x i32> inreg %rsrc, <4 x float> %vdat
  ;
  ; GFX10-LABEL: store_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -899,7 +853,6 @@ define amdgpu_ps <4 x float> @getresinfo_dmask0(<8 x i32> inreg %rsrc, <4 x floa
  ;
  ; GFX10-LABEL: getresinfo_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %mip = extractelement <2 x i16> %coords, i32 0
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.encode.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.encode.ll

index af76eb3..abee5b6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.encode.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.encode.ll
@@ -12,7 +12,6 @@ define amdgpu_ps <4 x float> @load_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords)
  ; GFX10-LABEL: load_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -31,7 +30,6 @@ define amdgpu_ps <4 x float> @load_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords)
  ; GFX10-LABEL: load_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 ; encoding: [0x08,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -51,7 +49,6 @@ define amdgpu_ps <4 x float> @load_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ; GFX10-LABEL: load_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 ; encoding: [0x10,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -72,7 +69,6 @@ define amdgpu_ps <4 x float> @load_cube(<8 x i32> inreg %rsrc, <2 x i16> %coords
  ; GFX10-LABEL: load_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16 ; encoding: [0x18,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -93,7 +89,6 @@ define amdgpu_ps <4 x float> @load_1darray(<8 x i32> inreg %rsrc, <2 x i16> %coo
  ; GFX10-LABEL: load_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16 ; encoding: [0x20,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -113,7 +108,6 @@ define amdgpu_ps <4 x float> @load_2darray(<8 x i32> inreg %rsrc, <2 x i16> %coo
  ; GFX10-LABEL: load_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16 ; encoding: [0x28,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -134,7 +128,6 @@ define amdgpu_ps <4 x float> @load_2dmsaa(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16 ; encoding: [0x30,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -155,7 +148,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16 ; encoding: [0x38,0x1f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -177,7 +169,6 @@ define amdgpu_ps <4 x float> @load_mip_1d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -197,7 +188,6 @@ define amdgpu_ps <4 x float> @load_mip_2d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 ; encoding: [0x08,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -218,7 +208,6 @@ define amdgpu_ps <4 x float> @load_mip_3d(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 ; encoding: [0x10,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -240,7 +229,6 @@ define amdgpu_ps <4 x float> @load_mip_cube(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: load_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16 ; encoding: [0x18,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -262,7 +250,6 @@ define amdgpu_ps <4 x float> @load_mip_1darray(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16 ; encoding: [0x20,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -283,7 +270,6 @@ define amdgpu_ps <4 x float> @load_mip_2darray(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: load_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16 ; encoding: [0x28,0x1f,0x04,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -303,7 +289,6 @@ define amdgpu_ps void @store_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -320,7 +305,6 @@ define amdgpu_ps void @store_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 ; encoding: [0x08,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -338,7 +322,6 @@ define amdgpu_ps void @store_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2 x
  ;
  ; GFX10-LABEL: store_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 ; encoding: [0x10,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -357,7 +340,6 @@ define amdgpu_ps void @store_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata, <2
  ;
  ; GFX10-LABEL: store_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16 ; encoding: [0x18,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -376,7 +358,6 @@ define amdgpu_ps void @store_1darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16 ; encoding: [0x20,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -394,7 +375,6 @@ define amdgpu_ps void @store_2darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16 ; encoding: [0x28,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -413,7 +393,6 @@ define amdgpu_ps void @store_2dmsaa(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16 ; encoding: [0x30,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -432,7 +411,6 @@ define amdgpu_ps void @store_2darraymsaa(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16 ; encoding: [0x38,0x1f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -452,7 +430,6 @@ define amdgpu_ps void @store_mip_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -470,7 +447,6 @@ define amdgpu_ps void @store_mip_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 ; encoding: [0x08,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -489,7 +465,6 @@ define amdgpu_ps void @store_mip_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 ; encoding: [0x10,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -509,7 +484,6 @@ define amdgpu_ps void @store_mip_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16 ; encoding: [0x18,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -529,7 +503,6 @@ define amdgpu_ps void @store_mip_1darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16 ; encoding: [0x20,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -548,7 +521,6 @@ define amdgpu_ps void @store_mip_2darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16 ; encoding: [0x28,0x1f,0x24,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -570,7 +542,6 @@ define amdgpu_ps <4 x float> @getresinfo_1d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -589,7 +560,6 @@ define amdgpu_ps <4 x float> @getresinfo_2d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 ; encoding: [0x08,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -608,7 +578,6 @@ define amdgpu_ps <4 x float> @getresinfo_3d(<8 x i32> inreg %rsrc, <2 x i16> %co
  ; GFX10-LABEL: getresinfo_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 ; encoding: [0x10,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -627,7 +596,6 @@ define amdgpu_ps <4 x float> @getresinfo_cube(<8 x i32> inreg %rsrc, <2 x i16> %
  ; GFX10-LABEL: getresinfo_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm a16 ; encoding: [0x18,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -646,7 +614,6 @@ define amdgpu_ps <4 x float> @getresinfo_1darray(<8 x i32> inreg %rsrc, <2 x i16
  ; GFX10-LABEL: getresinfo_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm a16 ; encoding: [0x20,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -665,7 +632,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darray(<8 x i32> inreg %rsrc, <2 x i16
  ; GFX10-LABEL: getresinfo_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm a16 ; encoding: [0x28,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -684,7 +650,6 @@ define amdgpu_ps <4 x float> @getresinfo_2dmsaa(<8 x i32> inreg %rsrc, <2 x i16>
  ; GFX10-LABEL: getresinfo_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm a16 ; encoding: [0x30,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -703,7 +668,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darraymsaa(<8 x i32> inreg %rsrc, <2 x
  ; GFX10-LABEL: getresinfo_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm a16 ; encoding: [0x38,0x1f,0x38,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -722,7 +686,6 @@ define amdgpu_ps float @load_1d_V1(<8 x i32> inreg %rsrc, <2 x i16> %coords) {
  ; GFX10-LABEL: load_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x18,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -741,7 +704,6 @@ define amdgpu_ps <2 x float> @load_1d_V2(<8 x i32> inreg %rsrc, <2 x i16> %coord
  ; GFX10-LABEL: load_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x9 dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x19,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -758,7 +720,6 @@ define amdgpu_ps void @store_1d_V1(<8 x i32> inreg %rsrc, float %vdata, <2 x i16
  ;
  ; GFX10-LABEL: store_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v0, v1, s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x12,0x20,0xf0,0x01,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -775,7 +736,6 @@ define amdgpu_ps void @store_1d_V2(<8 x i32> inreg %rsrc, <2 x float> %vdata, <2
  ;
  ; GFX10-LABEL: store_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:1], v2, s[0:7] dmask:0xc dim:SQ_RSRC_IMG_1D unorm a16 ; encoding: [0x00,0x1c,0x20,0xf0,0x02,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -794,7 +754,6 @@ define amdgpu_ps <4 x float> @load_1d_glc(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc a16 ; encoding: [0x00,0x3f,0x00,0xf0,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -813,7 +772,6 @@ define amdgpu_ps <4 x float> @load_1d_slc(<8 x i32> inreg %rsrc, <2 x i16> %coor
  ; GFX10-LABEL: load_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc a16 ; encoding: [0x00,0x1f,0x00,0xf2,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -832,7 +790,6 @@ define amdgpu_ps <4 x float> @load_1d_glc_slc(<8 x i32> inreg %rsrc, <2 x i16> %
  ; GFX10-LABEL: load_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc a16 ; encoding: [0x00,0x3f,0x00,0xf2,0x00,0x00,0x00,0x40]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -849,7 +806,6 @@ define amdgpu_ps void @store_1d_glc(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc a16 ; encoding: [0x00,0x3f,0x20,0xf0,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -866,7 +822,6 @@ define amdgpu_ps void @store_1d_slc(<8 x i32> inreg %rsrc, <4 x float> %vdata, <
  ;
  ; GFX10-LABEL: store_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc a16 ; encoding: [0x00,0x1f,0x20,0xf2,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -883,7 +838,6 @@ define amdgpu_ps void @store_1d_glc_slc(<8 x i32> inreg %rsrc, <4 x float> %vdat
  ;
  ; GFX10-LABEL: store_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc a16 ; encoding: [0x00,0x3f,0x20,0xf2,0x04,0x00,0x00,0x40]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -899,7 +853,6 @@ define amdgpu_ps <4 x float> @getresinfo_dmask0(<8 x i32> inreg %rsrc, <4 x floa
  ;
  ; GFX10-LABEL: getresinfo_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %mip = extractelement <2 x i16> %coords, i32 0
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.dim.ll

index 562e0f5..dedda14 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.dim.ll
@@ -33,7 +33,6 @@ define amdgpu_ps <4 x float> @load_1d(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -107,7 +106,6 @@ define amdgpu_ps <4 x float> @load_1d_tfe(<8 x i32> inreg %rsrc, i32 addrspace(1
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v6, 0 ; encoding: [0x80,0x02,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v6 ; encoding: [0x06,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v6 ; encoding: [0x06,0x03,0x10,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v6 ; encoding: [0x06,0x03,0x12,0x7e]
@@ -196,7 +194,6 @@ define amdgpu_ps <4 x float> @load_1d_lwe(<8 x i32> inreg %rsrc, i32 addrspace(1
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v6, 0 ; encoding: [0x80,0x02,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v6 ; encoding: [0x06,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v6 ; encoding: [0x06,0x03,0x10,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v6 ; encoding: [0x06,0x03,0x12,0x7e]
@@ -247,7 +244,6 @@ define amdgpu_ps <4 x float> @load_2d(<8 x i32> inreg %rsrc, i32 %s, i32 %t) {
  ; GFX10-LABEL: load_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -325,7 +321,6 @@ define amdgpu_ps <4 x float> @load_2d_tfe(<8 x i32> inreg %rsrc, i32 addrspace(1
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0 ; encoding: [0x80,0x02,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v7 ; encoding: [0x07,0x03,0x10,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v7 ; encoding: [0x07,0x03,0x12,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v10, v7 ; encoding: [0x07,0x03,0x14,0x7e]
@@ -376,7 +371,6 @@ define amdgpu_ps <4 x float> @load_3d(<8 x i32> inreg %rsrc, i32 %s, i32 %t, i32
  ; GFX10-LABEL: load_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm ; encoding: [0x10,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -458,7 +452,6 @@ define amdgpu_ps <4 x float> @load_3d_tfe_lwe(<8 x i32> inreg %rsrc, i32 addrspa
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v2 ; encoding: [0x02,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v13, v11 ; encoding: [0x0b,0x03,0x1a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v14, v11 ; encoding: [0x0b,0x03,0x1c,0x7e]
@@ -509,7 +502,6 @@ define amdgpu_ps <4 x float> @load_cube(<8 x i32> inreg %rsrc, i32 %s, i32 %t, i
  ; GFX10-LABEL: load_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm ; encoding: [0x18,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -591,7 +583,6 @@ define amdgpu_ps <4 x float> @load_cube_lwe(<8 x i32> inreg %rsrc, i32 addrspace
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v2 ; encoding: [0x02,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v13, v11 ; encoding: [0x0b,0x03,0x1a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v14, v11 ; encoding: [0x0b,0x03,0x1c,0x7e]
@@ -642,7 +633,6 @@ define amdgpu_ps <4 x float> @load_1darray(<8 x i32> inreg %rsrc, i32 %s, i32 %s
  ; GFX10-LABEL: load_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm ; encoding: [0x20,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -720,7 +710,6 @@ define amdgpu_ps <4 x float> @load_1darray_tfe(<8 x i32> inreg %rsrc, i32 addrsp
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0 ; encoding: [0x80,0x02,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v7 ; encoding: [0x07,0x03,0x10,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v7 ; encoding: [0x07,0x03,0x12,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v10, v7 ; encoding: [0x07,0x03,0x14,0x7e]
@@ -771,7 +760,6 @@ define amdgpu_ps <4 x float> @load_2darray(<8 x i32> inreg %rsrc, i32 %s, i32 %t
  ; GFX10-LABEL: load_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm ; encoding: [0x28,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -853,7 +841,6 @@ define amdgpu_ps <4 x float> @load_2darray_lwe(<8 x i32> inreg %rsrc, i32 addrsp
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v2 ; encoding: [0x02,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v13, v11 ; encoding: [0x0b,0x03,0x1a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v14, v11 ; encoding: [0x0b,0x03,0x1c,0x7e]
@@ -904,7 +891,6 @@ define amdgpu_ps <4 x float> @load_2dmsaa(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-LABEL: load_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm ; encoding: [0x30,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -986,7 +972,6 @@ define amdgpu_ps <4 x float> @load_2dmsaa_both(<8 x i32> inreg %rsrc, i32 addrsp
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v2 ; encoding: [0x02,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v13, v11 ; encoding: [0x0b,0x03,0x1a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v14, v11 ; encoding: [0x0b,0x03,0x1c,0x7e]
@@ -1037,7 +1022,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-LABEL: load_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm ; encoding: [0x38,0x1f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1133,7 +1117,6 @@ define amdgpu_ps <4 x float> @load_2darraymsaa_tfe(<8 x i32> inreg %rsrc, i32 ad
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v12 ; encoding: [0x0c,0x03,0x06,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v13 ; encoding: [0x0d,0x03,0x08,0x7e]
  ; GFX10-NEXT:    image_load v[0:4], v[5:8], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm tfe ; encoding: [0x38,0x1f,0x01,0xf0,0x05,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    global_store_dword v9, v4, s[8:9] ; encoding: [0x00,0x80,0x70,0xdc,0x09,0x04,0x08,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
@@ -1174,7 +1157,6 @@ define amdgpu_ps <4 x float> @load_mip_1d(<8 x i32> inreg %rsrc, i32 %s, i32 %mi
  ; GFX10-LABEL: load_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1252,7 +1234,6 @@ define amdgpu_ps <4 x float> @load_mip_1d_lwe(<8 x i32> inreg %rsrc, i32 addrspa
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0 ; encoding: [0x80,0x02,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v7 ; encoding: [0x07,0x03,0x10,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v7 ; encoding: [0x07,0x03,0x12,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v10, v7 ; encoding: [0x07,0x03,0x14,0x7e]
@@ -1303,7 +1284,6 @@ define amdgpu_ps <4 x float> @load_mip_2d(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-LABEL: load_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1385,7 +1365,6 @@ define amdgpu_ps <4 x float> @load_mip_2d_tfe(<8 x i32> inreg %rsrc, i32 addrspa
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v2 ; encoding: [0x02,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v1 ; encoding: [0x01,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0 ; encoding: [0x00,0x03,0x0a,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v13, v11 ; encoding: [0x0b,0x03,0x1a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v14, v11 ; encoding: [0x0b,0x03,0x1c,0x7e]
@@ -1447,7 +1426,6 @@ define amdgpu_ps float @load_1d_V2_tfe_dmask0(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_V2_tfe_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0 ; encoding: [0x80,0x02,0x02,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1 ; encoding: [0x01,0x03,0x04,0x7e]
  ; GFX10-NEXT:    image_load v[1:2], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe ; encoding: [0x00,0x11,0x01,0xf0,0x00,0x01,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1499,7 +1477,6 @@ define amdgpu_ps float @load_1d_V1_tfe_dmask0(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_V1_tfe_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v1, 0 ; encoding: [0x80,0x02,0x02,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v1 ; encoding: [0x01,0x03,0x04,0x7e]
  ; GFX10-NEXT:    image_load v[1:2], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm tfe ; encoding: [0x00,0x11,0x01,0xf0,0x00,0x01,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1551,7 +1528,6 @@ define amdgpu_ps float @load_mip_2d_tfe_dmask0(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-LABEL: load_mip_2d_tfe_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    image_load_mip v[3:4], v[0:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm tfe ; encoding: [0x08,0x11,0x05,0xf0,0x00,0x03,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1603,7 +1579,6 @@ define amdgpu_ps float @load_mip_2d_tfe_nouse(<8 x i32> inreg %rsrc, i32 %s, i32
  ; GFX10-LABEL: load_mip_2d_tfe_nouse:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    image_load_mip v[3:4], v[0:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm tfe ; encoding: [0x08,0x11,0x05,0xf0,0x00,0x03,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1655,7 +1630,6 @@ define amdgpu_ps float @load_mip_2d_tfe_nouse_V2(<8 x i32> inreg %rsrc, i32 %s,
  ; GFX10-LABEL: load_mip_2d_tfe_nouse_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    image_load_mip v[3:4], v[0:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm tfe ; encoding: [0x08,0x11,0x05,0xf0,0x00,0x03,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1707,7 +1681,6 @@ define amdgpu_ps float @load_mip_2d_tfe_nouse_V1(<8 x i32> inreg %rsrc, i32 %s,
  ; GFX10-LABEL: load_mip_2d_tfe_nouse_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    image_load_mip v[3:4], v[0:2], s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_2D unorm tfe ; encoding: [0x08,0x12,0x05,0xf0,0x00,0x03,0x00,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
@@ -1782,7 +1755,6 @@ define amdgpu_ps <4 x float> @load_1d_tfe_V4_dmask3(<8 x i32> inreg %rsrc, i32 a
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v5, 0 ; encoding: [0x80,0x02,0x0a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v0 ; encoding: [0x00,0x03,0x08,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v5 ; encoding: [0x05,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v7, v5 ; encoding: [0x05,0x03,0x0e,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v8, v5 ; encoding: [0x05,0x03,0x10,0x7e]
@@ -1861,7 +1833,6 @@ define amdgpu_ps <4 x float> @load_1d_tfe_V4_dmask2(<8 x i32> inreg %rsrc, i32 a
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v4, 0 ; encoding: [0x80,0x02,0x08,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v0 ; encoding: [0x00,0x03,0x06,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v4 ; encoding: [0x04,0x03,0x0a,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v6, v4 ; encoding: [0x04,0x03,0x0c,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v4 ; encoding: [0x04,0x03,0x00,0x7e]
@@ -1934,7 +1905,6 @@ define amdgpu_ps <4 x float> @load_1d_tfe_V4_dmask1(<8 x i32> inreg %rsrc, i32 a
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0 ; encoding: [0x00,0x03,0x04,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v3 ; encoding: [0x03,0x03,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v4 ; encoding: [0x04,0x03,0x02,0x7e]
@@ -2005,7 +1975,6 @@ define amdgpu_ps <2 x float> @load_1d_tfe_V2_dmask1(<8 x i32> inreg %rsrc, i32 a
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v3, 0 ; encoding: [0x80,0x02,0x06,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0 ; encoding: [0x00,0x03,0x04,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v3 ; encoding: [0x03,0x03,0x08,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v3 ; encoding: [0x03,0x03,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v4 ; encoding: [0x04,0x03,0x02,0x7e]
@@ -2051,7 +2020,6 @@ define amdgpu_ps <4 x float> @load_mip_3d(<8 x i32> inreg %rsrc, i32 %s, i32 %t,
  ; GFX10-LABEL: load_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm ; encoding: [0x10,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2087,7 +2055,6 @@ define amdgpu_ps <4 x float> @load_mip_cube(<8 x i32> inreg %rsrc, i32 %s, i32 %
  ; GFX10-LABEL: load_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm ; encoding: [0x18,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2123,7 +2090,6 @@ define amdgpu_ps <4 x float> @load_mip_1darray(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-LABEL: load_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:2], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm ; encoding: [0x20,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2159,7 +2125,6 @@ define amdgpu_ps <4 x float> @load_mip_2darray(<8 x i32> inreg %rsrc, i32 %s, i3
  ; GFX10-LABEL: load_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load_mip v[0:3], v[0:3], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm ; encoding: [0x28,0x1f,0x04,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2190,7 +2155,6 @@ define amdgpu_ps void @store_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i32 %
  ;
  ; GFX10-LABEL: store_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2221,7 +2185,6 @@ define amdgpu_ps void @store_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i32 %
  ;
  ; GFX10-LABEL: store_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2252,7 +2215,6 @@ define amdgpu_ps void @store_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i32 %
  ;
  ; GFX10-LABEL: store_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm ; encoding: [0x10,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2283,7 +2245,6 @@ define amdgpu_ps void @store_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata, i32
  ;
  ; GFX10-LABEL: store_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm ; encoding: [0x18,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2314,7 +2275,6 @@ define amdgpu_ps void @store_1darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm ; encoding: [0x20,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2345,7 +2305,6 @@ define amdgpu_ps void @store_2darray(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm ; encoding: [0x28,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2376,7 +2335,6 @@ define amdgpu_ps void @store_2dmsaa(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm ; encoding: [0x30,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2407,7 +2365,6 @@ define amdgpu_ps void @store_2darraymsaa(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v[4:7], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm ; encoding: [0x38,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2438,7 +2395,6 @@ define amdgpu_ps void @store_mip_1d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_mip_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:5], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2469,7 +2425,6 @@ define amdgpu_ps void @store_mip_2d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_mip_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2500,7 +2455,6 @@ define amdgpu_ps void @store_mip_3d(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_mip_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:7], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm ; encoding: [0x10,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2531,7 +2485,6 @@ define amdgpu_ps void @store_mip_cube(<8 x i32> inreg %rsrc, <4 x float> %vdata,
  ;
  ; GFX10-LABEL: store_mip_cube:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:7], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm ; encoding: [0x18,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2562,7 +2515,6 @@ define amdgpu_ps void @store_mip_1darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:6], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm ; encoding: [0x20,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2593,7 +2545,6 @@ define amdgpu_ps void @store_mip_2darray(<8 x i32> inreg %rsrc, <4 x float> %vda
  ;
  ; GFX10-LABEL: store_mip_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store_mip v[0:3], v[4:7], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm ; encoding: [0x28,0x1f,0x24,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -2629,7 +2580,6 @@ define amdgpu_ps <4 x float> @getresinfo_1d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-LABEL: getresinfo_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2665,7 +2615,6 @@ define amdgpu_ps <4 x float> @getresinfo_2d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-LABEL: getresinfo_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2701,7 +2650,6 @@ define amdgpu_ps <4 x float> @getresinfo_3d(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-LABEL: getresinfo_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm ; encoding: [0x10,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2737,7 +2685,6 @@ define amdgpu_ps <4 x float> @getresinfo_cube(<8 x i32> inreg %rsrc, i32 %mip) {
  ; GFX10-LABEL: getresinfo_cube:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_CUBE unorm ; encoding: [0x18,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2773,7 +2720,6 @@ define amdgpu_ps <4 x float> @getresinfo_1darray(<8 x i32> inreg %rsrc, i32 %mip
  ; GFX10-LABEL: getresinfo_1darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY unorm ; encoding: [0x20,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2809,7 +2755,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darray(<8 x i32> inreg %rsrc, i32 %mip
  ; GFX10-LABEL: getresinfo_2darray:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY unorm ; encoding: [0x28,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2845,7 +2790,6 @@ define amdgpu_ps <4 x float> @getresinfo_2dmsaa(<8 x i32> inreg %rsrc, i32 %mip)
  ; GFX10-LABEL: getresinfo_2dmsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA unorm ; encoding: [0x30,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2881,7 +2825,6 @@ define amdgpu_ps <4 x float> @getresinfo_2darraymsaa(<8 x i32> inreg %rsrc, i32
  ; GFX10-LABEL: getresinfo_2darraymsaa:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D_MSAA_ARRAY unorm ; encoding: [0x38,0x1f,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2917,7 +2860,6 @@ define amdgpu_ps float @load_1d_V1(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v0, v0, s[0:7] dmask:0x8 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x18,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2953,7 +2895,6 @@ define amdgpu_ps <2 x float> @load_1d_V2(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:1], v0, s[0:7] dmask:0x9 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x19,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2984,7 +2925,6 @@ define amdgpu_ps void @store_1d_V1(<8 x i32> inreg %rsrc, float %vdata, i32 %s)
  ;
  ; GFX10-LABEL: store_1d_V1:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v0, v1, s[0:7] dmask:0x2 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x12,0x20,0xf0,0x01,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -3015,7 +2955,6 @@ define amdgpu_ps void @store_1d_V2(<8 x i32> inreg %rsrc, <2 x float> %vdata, i3
  ;
  ; GFX10-LABEL: store_1d_V2:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:1], v2, s[0:7] dmask:0xc dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1c,0x20,0xf0,0x02,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -3051,7 +2990,6 @@ define amdgpu_ps <4 x float> @load_1d_glc(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc ; encoding: [0x00,0x3f,0x00,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3087,7 +3025,6 @@ define amdgpu_ps <4 x float> @load_1d_slc(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc ; encoding: [0x00,0x1f,0x00,0xf2,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3123,7 +3060,6 @@ define amdgpu_ps <4 x float> @load_1d_glc_slc(<8 x i32> inreg %rsrc, i32 %s) {
  ; GFX10-LABEL: load_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_load v[0:3], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc ; encoding: [0x00,0x3f,0x00,0xf2,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3154,7 +3090,6 @@ define amdgpu_ps void @store_1d_glc(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_1d_glc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc ; encoding: [0x00,0x3f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -3185,7 +3120,6 @@ define amdgpu_ps void @store_1d_slc(<8 x i32> inreg %rsrc, <4 x float> %vdata, i
  ;
  ; GFX10-LABEL: store_1d_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm slc ; encoding: [0x00,0x1f,0x20,0xf2,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -3216,7 +3150,6 @@ define amdgpu_ps void @store_1d_glc_slc(<8 x i32> inreg %rsrc, <4 x float> %vdat
  ;
  ; GFX10-LABEL: store_1d_glc_slc:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm glc slc ; encoding: [0x00,0x3f,0x20,0xf2,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
  main_body:
@@ -3280,7 +3213,6 @@ define amdgpu_ps <3 x float> @getresinfo_dmask7(<8 x i32> inreg %rsrc, <4 x floa
  ; GFX10-LABEL: getresinfo_dmask7:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x17,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3344,7 +3276,6 @@ define amdgpu_ps <2 x float> @getresinfo_dmask3(<8 x i32> inreg %rsrc, <4 x floa
  ; GFX10-LABEL: getresinfo_dmask3:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v[0:1], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x13,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3408,7 +3339,6 @@ define amdgpu_ps float @getresinfo_dmask1(<8 x i32> inreg %rsrc, <4 x float> %vd
  ; GFX10-LABEL: getresinfo_dmask1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_get_resinfo v0, v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x11,0x38,0xf0,0x00,0x00,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -3435,7 +3365,6 @@ define amdgpu_ps <4 x float> @getresinfo_dmask0(<8 x i32> inreg %rsrc, <4 x floa
  ;
  ; GFX10-LABEL: getresinfo_dmask0:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %r = call <4 x float> @llvm.amdgcn.image.getresinfo.1d.v4f32.i32(i32 0, i32 %mip, <8 x i32> %rsrc, i32 0, i32 0)
@@ -3481,7 +3410,6 @@ define amdgpu_ps void @image_store_wait(<8 x i32> inreg %arg, <8 x i32> inreg %a
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_store v[0:3], v4, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x20,0xf0,0x04,0x00,0x00,0x00]
  ; GFX10-NEXT:    image_load v[0:3], v4, s[8:15] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x00,0xf0,0x04,0x00,0x02,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    image_store v[0:3], v4, s[16:23] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x20,0xf0,0x04,0x00,0x04,0x00]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
@@ -3541,7 +3469,6 @@ define amdgpu_ps float @image_load_mmo(<8 x i32> inreg %rsrc, float addrspace(3)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    image_load v1, v[1:2], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm ; encoding: [0x08,0x11,0x00,0xf0,0x01,0x01,0x00,0x00]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, 0 ; encoding: [0x80,0x02,0x04,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ds_write2_b32 v0, v2, v2 offset1:4 ; encoding: [0x00,0x04,0x38,0xd8,0x00,0x02,0x02,0x00]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v1 ; encoding: [0x01,0x03,0x00,0x7e]
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.gather4.a16.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.gather4.a16.dim.ll

index ea907a7..25cdd0f 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.gather4.a16.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.gather4.a16.dim.ll
@@ -22,7 +22,6 @@ define amdgpu_ps <4 x float> @gather4_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4 v[0:3], v0, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -50,7 +49,6 @@ define amdgpu_ps <4 x float> @gather4_cube(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4 v[0:3], v[1:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_CUBE a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -78,7 +76,6 @@ define amdgpu_ps <4 x float> @gather4_2darray(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4 v[0:3], v[1:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D_ARRAY a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -106,7 +103,6 @@ define amdgpu_ps <4 x float> @gather4_c_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_c v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -134,7 +130,6 @@ define amdgpu_ps <4 x float> @gather4_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_cl v[0:3], v[1:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -164,7 +159,6 @@ define amdgpu_ps <4 x float> @gather4_c_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_c_cl v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -192,7 +186,6 @@ define amdgpu_ps <4 x float> @gather4_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_b v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -220,7 +213,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_c_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -250,7 +242,6 @@ define amdgpu_ps <4 x float> @gather4_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_b_cl v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -281,7 +272,6 @@ define amdgpu_ps <4 x float> @gather4_c_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_gather4_c_b_cl v[0:3], [v0, v1, v2, v4], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -301,7 +291,6 @@ define amdgpu_ps <4 x float> @gather4_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: gather4_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v0, 0xffff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    image_gather4_l v[0:3], v[1:2], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -325,7 +314,6 @@ define amdgpu_ps <4 x float> @gather4_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: gather4_c_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v1, 0xffff, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    image_gather4_c_l v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -347,7 +335,6 @@ define amdgpu_ps <4 x float> @gather4_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: gather4_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v0, 0xffff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    image_gather4_lz v[0:3], v0, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -369,7 +356,6 @@ define amdgpu_ps <4 x float> @gather4_c_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: gather4_c_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v1, 0xffff, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    image_gather4_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.a16.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.a16.dim.ll

index 23d614e..0e0ea50 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.a16.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.a16.dim.ll
@@ -18,7 +18,6 @@ define amdgpu_ps <4 x float> @sample_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -46,7 +45,6 @@ define amdgpu_ps <4 x float> @sample_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -74,7 +72,6 @@ define amdgpu_ps <4 x float> @sample_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v[1:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_3D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -102,7 +99,6 @@ define amdgpu_ps <4 x float> @sample_cube(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v[1:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_CUBE a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -130,7 +126,6 @@ define amdgpu_ps <4 x float> @sample_1darray(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -158,7 +153,6 @@ define amdgpu_ps <4 x float> @sample_2darray(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v[0:3], v[1:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -182,7 +176,6 @@ define amdgpu_ps <4 x float> @sample_c_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -210,7 +203,6 @@ define amdgpu_ps <4 x float> @sample_c_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -238,7 +230,6 @@ define amdgpu_ps <4 x float> @sample_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_cl v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -266,7 +257,6 @@ define amdgpu_ps <4 x float> @sample_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_cl v[0:3], v[1:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -294,7 +284,6 @@ define amdgpu_ps <4 x float> @sample_c_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_cl v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -324,7 +313,6 @@ define amdgpu_ps <4 x float> @sample_c_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_cl v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -348,7 +336,6 @@ define amdgpu_ps <4 x float> @sample_b_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -376,7 +363,6 @@ define amdgpu_ps <4 x float> @sample_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -400,7 +386,6 @@ define amdgpu_ps <4 x float> @sample_c_b_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -428,7 +413,6 @@ define amdgpu_ps <4 x float> @sample_c_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -456,7 +440,6 @@ define amdgpu_ps <4 x float> @sample_b_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b_cl v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -486,7 +469,6 @@ define amdgpu_ps <4 x float> @sample_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b_cl v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -514,7 +496,6 @@ define amdgpu_ps <4 x float> @sample_c_b_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_b_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -545,7 +526,6 @@ define amdgpu_ps <4 x float> @sample_c_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_c_b_cl v[0:3], [v0, v1, v2, v4], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -563,7 +543,6 @@ define amdgpu_ps <4 x float> @sample_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -588,7 +567,6 @@ define amdgpu_ps <4 x float> @sample_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v7, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
@@ -623,7 +601,6 @@ define amdgpu_ps <4 x float> @sample_d_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v6, v9, v6
  ; GFX10-NEXT:    v_and_b32_e32 v3, v9, v3
  ; GFX10-NEXT:    v_and_b32_e32 v0, v9, v0
@@ -648,7 +625,6 @@ define amdgpu_ps <4 x float> @sample_c_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -675,7 +651,6 @@ define amdgpu_ps <4 x float> @sample_c_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v5, v10, v5
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1
@@ -702,7 +677,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v2, 0xffff, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    image_sample_d_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -729,7 +703,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v7, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
@@ -756,7 +729,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v3, 0xffff, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
  ; GFX10-NEXT:    image_sample_c_d_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -785,7 +757,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v5, v8, v5
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1
@@ -810,7 +781,6 @@ define amdgpu_ps <4 x float> @sample_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -835,7 +805,6 @@ define amdgpu_ps <4 x float> @sample_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v7, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
@@ -860,7 +829,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -887,7 +855,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v5, v10, v5
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1
@@ -914,7 +881,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v2, 0xffff, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
  ; GFX10-NEXT:    image_sample_cd_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -941,7 +907,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v7, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
@@ -968,7 +933,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v3, 0xffff, v3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
  ; GFX10-NEXT:    image_sample_c_cd_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -997,7 +961,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v5, v8, v5
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1
@@ -1024,7 +987,6 @@ define amdgpu_ps <4 x float> @sample_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_l_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v0, 0xffff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    image_sample_l v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1046,7 +1008,6 @@ define amdgpu_ps <4 x float> @sample_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v0, 0xffff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v1, 16, v0
  ; GFX10-NEXT:    image_sample_l v[0:3], v[1:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1068,7 +1029,6 @@ define amdgpu_ps <4 x float> @sample_c_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_l_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v1, 0xffff, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    image_sample_c_l v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1092,7 +1052,6 @@ define amdgpu_ps <4 x float> @sample_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v1, 0xffff, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    image_sample_c_l v[0:3], [v0, v1, v3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1112,7 +1071,6 @@ define amdgpu_ps <4 x float> @sample_lz_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_lz_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1132,7 +1090,6 @@ define amdgpu_ps <4 x float> @sample_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v0, 0xffff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v1, 16, v0
  ; GFX10-NEXT:    image_sample_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1152,7 +1109,6 @@ define amdgpu_ps <4 x float> @sample_c_lz_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_lz_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D a16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1172,7 +1128,6 @@ define amdgpu_ps <4 x float> @sample_c_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_and_b32_e32 v1, 0xffff, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_lshl_or_b32 v1, v2, 16, v1
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D a16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1202,7 +1157,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_o_2darray_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v6, v9, v6
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2
@@ -1237,7 +1191,6 @@ define amdgpu_ps <2 x float> @sample_c_d_o_2darray_V2(<8 x i32> inreg %rsrc, <4
  ; GFX10-LABEL: sample_c_d_o_2darray_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v6, v9, v6
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.d16.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.d16.dim.ll

index d09ecc8..47765ca 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.d16.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.d16.dim.ll
@@ -38,7 +38,6 @@ define amdgpu_ps half @image_sample_2d_f16(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample v0, v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -105,7 +104,6 @@ define amdgpu_ps half @image_sample_2d_f16_tfe(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v5
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s28
  ; GFX10-NEXT:    image_sample v[2:3], v[0:1], s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_2D tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v2
  ; GFX10-NEXT:    global_store_dword v4, v3, s[12:13]
@@ -143,7 +141,6 @@ define amdgpu_ps float @image_sample_c_d_1d_v2f16(<8 x i32> inreg %rsrc, <4 x i3
  ; GFX10-LABEL: image_sample_c_d_1d_v2f16:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d v0, v[0:3], s[0:7], s[8:11] dmask:0x3 dim:SQ_RSRC_IMG_1D d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -190,7 +187,6 @@ define amdgpu_ps <2 x float> @image_sample_c_d_1d_v2f16_tfe(<8 x i32> inreg %rsr
  ; GFX10-NEXT:    v_mov_b32_e32 v5, v0
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0
  ; GFX10-NEXT:    image_sample_c_d v[0:1], [v5, v4, v2, v3], s[0:7], s[8:11] dmask:0x3 dim:SQ_RSRC_IMG_1D tfe d16
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -243,7 +239,6 @@ define amdgpu_ps <2 x float> @image_sample_b_2d_v3f16(<8 x i32> inreg %rsrc, <4
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:1], v[0:2], s[0:7], s[8:11] dmask:0x7 dim:SQ_RSRC_IMG_2D d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -313,7 +308,6 @@ define amdgpu_ps <4 x float> @image_sample_b_2d_v3f16_tfe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:2], v[3:5], s[0:7], s[8:11] dmask:0x7 dim:SQ_RSRC_IMG_2D tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -369,7 +363,6 @@ define amdgpu_ps <2 x float> @image_sample_b_2d_v4f16(<8 x i32> inreg %rsrc, <4
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:1], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -440,7 +433,6 @@ define amdgpu_ps <4 x float> @image_sample_b_2d_v4f16_tfe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12
  ; GFX10-NEXT:    image_sample_b v[0:2], v[3:5], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D tfe d16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.dim.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.dim.ll

index 56a2165..f75fe13 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.dim.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.dim.ll
@@ -28,7 +28,6 @@ define amdgpu_ps <4 x float> @sample_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -95,7 +94,6 @@ define amdgpu_ps <4 x float> @sample_1d_tfe(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v10 ; encoding: [0x0a,0x03,0x08,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s28 ; encoding: [0x7e,0x1c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:4], v5, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x0f,0x81,0xf0,0x05,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    global_store_dword v6, v4, s[12:13] ; encoding: [0x00,0x80,0x70,0xdc,0x06,0x04,0x0c,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
@@ -142,7 +140,6 @@ define amdgpu_ps <2 x float> @sample_1d_tfe_adjust_writemask_1(<8 x i32> inreg %
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0 ; encoding: [0x00,0x03,0x02,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v2, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x01,0x81,0xf0,0x02,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -190,7 +187,6 @@ define amdgpu_ps <2 x float> @sample_1d_tfe_adjust_writemask_2(<8 x i32> inreg %
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0 ; encoding: [0x00,0x03,0x02,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v2, s[0:7], s[8:11] dmask:0x2 dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x02,0x81,0xf0,0x02,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -238,7 +234,6 @@ define amdgpu_ps <2 x float> @sample_1d_tfe_adjust_writemask_3(<8 x i32> inreg %
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0 ; encoding: [0x00,0x03,0x02,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v2, s[0:7], s[8:11] dmask:0x4 dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x04,0x81,0xf0,0x02,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -286,7 +281,6 @@ define amdgpu_ps <2 x float> @sample_1d_tfe_adjust_writemask_4(<8 x i32> inreg %
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0 ; encoding: [0x00,0x03,0x02,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v2, s[0:7], s[8:11] dmask:0x8 dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x08,0x81,0xf0,0x02,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -337,7 +331,6 @@ define amdgpu_ps <4 x float> @sample_1d_tfe_adjust_writemask_12(<8 x i32> inreg
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0 ; encoding: [0x00,0x03,0x04,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:2], v3, s[0:7], s[8:11] dmask:0x3 dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x03,0x81,0xf0,0x03,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -390,7 +383,6 @@ define amdgpu_ps <4 x float> @sample_1d_tfe_adjust_writemask_24(<8 x i32> inreg
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0 ; encoding: [0x00,0x03,0x04,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:2], v3, s[0:7], s[8:11] dmask:0xa dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x0a,0x81,0xf0,0x03,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -446,7 +438,6 @@ define amdgpu_ps <4 x float> @sample_1d_tfe_adjust_writemask_134(<8 x i32> inreg
  ; GFX10-NEXT:    v_mov_b32_e32 v3, v0 ; encoding: [0x00,0x03,0x06,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v4, s[0:7], s[8:11] dmask:0xd dim:SQ_RSRC_IMG_1D tfe ; encoding: [0x00,0x0d,0x81,0xf0,0x04,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -523,7 +514,6 @@ define amdgpu_ps <4 x float> @sample_1d_lwe(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    v_mov_b32_e32 v4, v10 ; encoding: [0x0a,0x03,0x08,0x7e]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s28 ; encoding: [0x7e,0x1c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:4], v5, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D lwe ; encoding: [0x00,0x0f,0x82,0xf0,0x05,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    global_store_dword v6, v4, s[12:13] ; encoding: [0x00,0x80,0x70,0xdc,0x06,0x04,0x0c,0x00]
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0 ; encoding: [0x00,0x00,0xfd,0xbb]
@@ -561,7 +551,6 @@ define amdgpu_ps <4 x float> @sample_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -594,7 +583,6 @@ define amdgpu_ps <4 x float> @sample_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg %
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_3D ; encoding: [0x10,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -627,7 +615,6 @@ define amdgpu_ps <4 x float> @sample_cube(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_CUBE ; encoding: [0x18,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -660,7 +647,6 @@ define amdgpu_ps <4 x float> @sample_1darray(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D_ARRAY ; encoding: [0x20,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -693,7 +679,6 @@ define amdgpu_ps <4 x float> @sample_2darray(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D_ARRAY ; encoding: [0x28,0x0f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -726,7 +711,6 @@ define amdgpu_ps <4 x float> @sample_c_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa0,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -759,7 +743,6 @@ define amdgpu_ps <4 x float> @sample_c_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa0,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -792,7 +775,6 @@ define amdgpu_ps <4 x float> @sample_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_cl v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x84,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -825,7 +807,6 @@ define amdgpu_ps <4 x float> @sample_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x84,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -858,7 +839,6 @@ define amdgpu_ps <4 x float> @sample_c_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa4,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -891,7 +871,6 @@ define amdgpu_ps <4 x float> @sample_c_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa4,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -924,7 +903,6 @@ define amdgpu_ps <4 x float> @sample_b_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_b v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x94,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -957,7 +935,6 @@ define amdgpu_ps <4 x float> @sample_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x94,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -990,7 +967,6 @@ define amdgpu_ps <4 x float> @sample_c_b_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_b v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xb4,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1023,7 +999,6 @@ define amdgpu_ps <4 x float> @sample_c_b_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_b v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xb4,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1056,7 +1031,6 @@ define amdgpu_ps <4 x float> @sample_b_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_b_cl v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x98,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1089,7 +1063,6 @@ define amdgpu_ps <4 x float> @sample_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_b_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x98,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1122,7 +1095,6 @@ define amdgpu_ps <4 x float> @sample_c_b_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_b_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xb8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1155,7 +1127,6 @@ define amdgpu_ps <4 x float> @sample_c_b_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample_c_b_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xb8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1179,7 +1150,6 @@ define amdgpu_ps <4 x float> @sample_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x88,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1203,7 +1173,6 @@ define amdgpu_ps <4 x float> @sample_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x88,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1227,7 +1196,6 @@ define amdgpu_ps <4 x float> @sample_c_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1251,7 +1219,6 @@ define amdgpu_ps <4 x float> @sample_c_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1275,7 +1242,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x8c,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1299,7 +1265,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x8c,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1323,7 +1288,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xac,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1347,7 +1311,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xac,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1371,7 +1334,6 @@ define amdgpu_ps <4 x float> @sample_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa0,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1395,7 +1357,6 @@ define amdgpu_ps <4 x float> @sample_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa0,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1419,7 +1380,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa8,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1443,7 +1403,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa8,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1467,7 +1426,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_cl v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xa4,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1491,7 +1449,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xa4,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1515,7 +1472,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xac,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1539,7 +1495,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_cl v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xac,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1563,7 +1518,6 @@ define amdgpu_ps <4 x float> @sample_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_l_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_l v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x90,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1587,7 +1541,6 @@ define amdgpu_ps <4 x float> @sample_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_l v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x90,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1611,7 +1564,6 @@ define amdgpu_ps <4 x float> @sample_c_l_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_l_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_l v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xb0,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1635,7 +1587,6 @@ define amdgpu_ps <4 x float> @sample_c_l_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_l_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_l v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xb0,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1659,7 +1610,6 @@ define amdgpu_ps <4 x float> @sample_lz_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_lz_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_lz v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0x9c,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1683,7 +1633,6 @@ define amdgpu_ps <4 x float> @sample_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0x9c,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1707,7 +1656,6 @@ define amdgpu_ps <4 x float> @sample_c_lz_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_lz_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:1], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0f,0xbc,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1731,7 +1679,6 @@ define amdgpu_ps <4 x float> @sample_c_lz_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_lz_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_lz v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_2D ; encoding: [0x08,0x0f,0xbc,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1755,7 +1702,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_o_2darray_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_o v0, v[0:15], s[0:7], s[8:11] dmask:0x4 dim:SQ_RSRC_IMG_2D_ARRAY ; encoding: [0x28,0x04,0xe8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1795,7 +1741,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1_tfe(<8 x i32> inreg %rsrc, <4 x
  ; GFX10-NEXT:    v_mov_b32_e32 v11, 0 ; encoding: [0x80,0x02,0x16,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v1 ; encoding: [0x01,0x03,0x12,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v10, v0 ; encoding: [0x00,0x03,0x14,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v12, v11 ; encoding: [0x0b,0x03,0x18,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v0, v11 ; encoding: [0x0b,0x03,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v12 ; encoding: [0x0c,0x03,0x02,0x7e]
@@ -1828,7 +1773,6 @@ define amdgpu_ps <2 x float> @sample_c_d_o_2darray_V2(<8 x i32> inreg %rsrc, <4
  ; GFX10-LABEL: sample_c_d_o_2darray_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_o v[0:1], v[0:15], s[0:7], s[8:11] dmask:0x6 dim:SQ_RSRC_IMG_2D_ARRAY ; encoding: [0x28,0x06,0xe8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1867,7 +1811,6 @@ define amdgpu_ps <4 x float> @sample_c_d_o_2darray_V2_tfe(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0 ; encoding: [0x80,0x02,0x00,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v9, v2 ; encoding: [0x02,0x03,0x12,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v10, v1 ; encoding: [0x01,0x03,0x14,0x7e]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mov_b32_e32 v1, v0 ; encoding: [0x00,0x03,0x02,0x7e]
  ; GFX10-NEXT:    v_mov_b32_e32 v2, v0 ; encoding: [0x00,0x03,0x04,0x7e]
  ; GFX10-NEXT:    image_sample_c_d_o v[0:2], [v11, v10, v9, v3, v4, v5, v6, v7, v8], s[0:7], s[8:11] dmask:0x6 dim:SQ_RSRC_IMG_2D_ARRAY tfe ; encoding: [0x2c,0x06,0xe9,0xf0,0x0b,0x00,0x40,0x00,0x0a,0x09,0x03,0x04,0x05,0x06,0x07,0x08]
@@ -1911,7 +1854,6 @@ define amdgpu_ps <4 x float> @sample_1d_unorm(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D unorm ; encoding: [0x00,0x1f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1944,7 +1886,6 @@ define amdgpu_ps <4 x float> @sample_1d_glc(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D glc ; encoding: [0x00,0x2f,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -1977,7 +1918,6 @@ define amdgpu_ps <4 x float> @sample_1d_slc(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D slc ; encoding: [0x00,0x0f,0x80,0xf2,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2010,7 +1950,6 @@ define amdgpu_ps <4 x float> @sample_1d_glc_slc(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:3], v0, s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D glc slc ; encoding: [0x00,0x2f,0x80,0xf2,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2043,7 +1982,6 @@ define amdgpu_ps float @adjust_writemask_sample_0(<8 x i32> inreg %rsrc, <4 x i3
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v0, v0, s[0:7], s[8:11] dmask:0x1 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x01,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2077,7 +2015,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_01(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0x3 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x03,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2111,7 +2048,6 @@ define amdgpu_ps <3 x float> @adjust_writemask_sample_012(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:2], v0, s[0:7], s[8:11] dmask:0x7 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x07,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2145,7 +2081,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_12(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0x6 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x06,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2179,7 +2114,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_03(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0x9 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x09,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2213,7 +2147,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_13(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0xa dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0a,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2247,7 +2180,6 @@ define amdgpu_ps <3 x float> @adjust_writemask_sample_123(<8 x i32> inreg %rsrc,
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:2], v0, s[0:7], s[8:11] dmask:0xe dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0e,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2267,7 +2199,6 @@ define amdgpu_ps <4 x float> @adjust_writemask_sample_none_enabled(<8 x i32> inr
  ;
  ; GFX10-LABEL: adjust_writemask_sample_none_enabled:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
    %r = call <4 x float> @llvm.amdgcn.image.sample.1d.v4f32.f32(i32 0, float %s, <8 x i32> %rsrc, <4 x i32> %samp, i1 0, i32 0, i32 0)
@@ -2299,7 +2230,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_123_to_12(<8 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0x6 dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x06,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -2333,7 +2263,6 @@ define amdgpu_ps <2 x float> @adjust_writemask_sample_013_to_13(<8 x i32> inreg
  ; GFX10-NEXT:    s_wqm_b32 exec_lo, exec_lo ; encoding: [0x7e,0x09,0xfe,0xbe]
  ; GFX10-NEXT:    s_and_b32 exec_lo, exec_lo, s12 ; encoding: [0x7e,0x0c,0x7e,0x87]
  ; GFX10-NEXT:    image_sample v[0:1], v0, s[0:7], s[8:11] dmask:0xa dim:SQ_RSRC_IMG_1D ; encoding: [0x00,0x0a,0x80,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.encode.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.encode.ll

index 0ca7ed9..b4f89e5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.encode.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.encode.ll
@@ -5,7 +5,6 @@ define amdgpu_ps <4 x float> @sample_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0x88,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -17,7 +16,6 @@ define amdgpu_ps <4 x float> @sample_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff ; encoding: [0xff,0x02,0x0e,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2 ; encoding: [0x07,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0 ; encoding: [0x07,0x01,0x00,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2 ; encoding: [0x02,0x00,0x6f,0xd7,0x03,0x21,0x09,0x04]
@@ -34,7 +32,6 @@ define amdgpu_ps <4 x float> @sample_d_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff ; encoding: [0xff,0x02,0x12,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v9, v3 ; encoding: [0x09,0x07,0x06,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v0, v9, v0 ; encoding: [0x09,0x01,0x00,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3 ; encoding: [0x03,0x00,0x6f,0xd7,0x04,0x21,0x0d,0x04]
@@ -51,7 +48,6 @@ define amdgpu_ps <4 x float> @sample_c_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xa8,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -63,7 +59,6 @@ define amdgpu_ps <4 x float> @sample_c_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff ; encoding: [0xff,0x02,0x14,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3 ; encoding: [0x0a,0x07,0x06,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1 ; encoding: [0x0a,0x03,0x02,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3 ; encoding: [0x03,0x00,0x6f,0xd7,0x04,0x21,0x0d,0x04]
@@ -80,7 +75,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0x8c,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -92,7 +86,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff ; encoding: [0xff,0x02,0x0e,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2 ; encoding: [0x07,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0 ; encoding: [0x07,0x01,0x00,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2 ; encoding: [0x02,0x00,0x6f,0xd7,0x03,0x21,0x09,0x04]
@@ -109,7 +102,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xac,0xf0,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -121,7 +113,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff ; encoding: [0xff,0x02,0x10,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3 ; encoding: [0x08,0x07,0x06,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1 ; encoding: [0x08,0x03,0x02,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3 ; encoding: [0x03,0x00,0x6f,0xd7,0x04,0x21,0x0d,0x04]
@@ -138,7 +129,6 @@ define amdgpu_ps <4 x float> @sample_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xa0,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -150,7 +140,6 @@ define amdgpu_ps <4 x float> @sample_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff ; encoding: [0xff,0x02,0x0e,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2 ; encoding: [0x07,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0 ; encoding: [0x07,0x01,0x00,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2 ; encoding: [0x02,0x00,0x6f,0xd7,0x03,0x21,0x09,0x04]
@@ -167,7 +156,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xa8,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -179,7 +167,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff ; encoding: [0xff,0x02,0x14,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3 ; encoding: [0x0a,0x07,0x06,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1 ; encoding: [0x0a,0x03,0x02,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3 ; encoding: [0x03,0x00,0x6f,0xd7,0x04,0x21,0x0d,0x04]
@@ -196,7 +183,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xa4,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -208,7 +194,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff ; encoding: [0xff,0x02,0x0e,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2 ; encoding: [0x07,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0 ; encoding: [0x07,0x01,0x00,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2 ; encoding: [0x02,0x00,0x6f,0xd7,0x03,0x21,0x09,0x04]
@@ -225,7 +210,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D ; encoding: [0x01,0x0f,0xac,0xf1,0x00,0x00,0x40,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) ; encoding: [0x70,0x3f,0x8c,0xbf]
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -237,7 +221,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff ; encoding: [0xff,0x02,0x10,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3 ; encoding: [0x08,0x07,0x06,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1 ; encoding: [0x08,0x03,0x02,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3 ; encoding: [0x03,0x00,0x6f,0xd7,0x04,0x21,0x0d,0x04]
@@ -254,7 +237,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_o_2darray_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff ; encoding: [0xff,0x02,0x12,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4 ; encoding: [0x09,0x09,0x08,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2 ; encoding: [0x09,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v4, v5, 16, v4 ; encoding: [0x04,0x00,0x6f,0xd7,0x05,0x21,0x11,0x04]
@@ -271,7 +253,6 @@ define amdgpu_ps <2 x float> @sample_c_d_o_2darray_V2(<8 x i32> inreg %rsrc, <4
  ; GFX10-LABEL: sample_c_d_o_2darray_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff ; encoding: [0xff,0x02,0x12,0x7e,0xff,0xff,0x00,0x00]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4 ; encoding: [0x09,0x09,0x08,0x36]
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2 ; encoding: [0x09,0x05,0x04,0x36]
  ; GFX10-NEXT:    v_lshl_or_b32 v4, v5, 16, v4 ; encoding: [0x04,0x00,0x6f,0xd7,0x05,0x21,0x11,0x04]
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.ll

index 7f7d5b3..002d4e6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.ll
@@ -5,7 +5,6 @@ define amdgpu_ps <4 x float> @sample_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -17,7 +16,6 @@ define amdgpu_ps <4 x float> @sample_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
@@ -34,7 +32,6 @@ define amdgpu_ps <4 x float> @sample_d_3d(<8 x i32> inreg %rsrc, <4 x i32> inreg
  ; GFX10-LABEL: sample_d_3d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v9, v3
  ; GFX10-NEXT:    v_and_b32_e32 v0, v9, v0
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
@@ -51,7 +48,6 @@ define amdgpu_ps <4 x float> @sample_c_d_1d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -63,7 +59,6 @@ define amdgpu_ps <4 x float> @sample_c_d_2d(<8 x i32> inreg %rsrc, <4 x i32> inr
  ; GFX10-LABEL: sample_c_d_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
@@ -80,7 +75,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_d_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -92,7 +86,6 @@ define amdgpu_ps <4 x float> @sample_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
@@ -109,7 +102,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_d_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -121,7 +113,6 @@ define amdgpu_ps <4 x float> @sample_c_d_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
@@ -138,7 +129,6 @@ define amdgpu_ps <4 x float> @sample_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_g16 v[0:3], v[0:2], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -150,7 +140,6 @@ define amdgpu_ps <4 x float> @sample_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> inre
  ; GFX10-LABEL: sample_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
@@ -167,7 +156,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_1d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -179,7 +167,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_2d(<8 x i32> inreg %rsrc, <4 x i32> in
  ; GFX10-LABEL: sample_c_cd_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v10, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v10, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v10, v1
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
@@ -196,7 +183,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_cd_cl_g16 v[0:3], v[0:3], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -208,7 +194,6 @@ define amdgpu_ps <4 x float> @sample_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32> i
  ; GFX10-LABEL: sample_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v7, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v2, v7, v2
  ; GFX10-NEXT:    v_and_b32_e32 v0, v7, v0
  ; GFX10-NEXT:    v_lshl_or_b32 v2, v3, 16, v2
@@ -225,7 +210,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_1d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_1d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    image_sample_c_cd_cl_g16 v[0:3], v[0:7], s[0:7], s[8:11] dmask:0xf dim:SQ_RSRC_IMG_1D
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    ; return to shader part epilog
  main_body:
@@ -237,7 +221,6 @@ define amdgpu_ps <4 x float> @sample_c_cd_cl_2d(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_cd_cl_2d:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v8, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v3, v8, v3
  ; GFX10-NEXT:    v_and_b32_e32 v1, v8, v1
  ; GFX10-NEXT:    v_lshl_or_b32 v3, v4, 16, v3
@@ -254,7 +237,6 @@ define amdgpu_ps float @sample_c_d_o_2darray_V1(<8 x i32> inreg %rsrc, <4 x i32>
  ; GFX10-LABEL: sample_c_d_o_2darray_V1:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2
  ; GFX10-NEXT:    v_lshl_or_b32 v4, v5, 16, v4
@@ -271,7 +253,6 @@ define amdgpu_ps <2 x float> @sample_c_d_o_2darray_V2(<8 x i32> inreg %rsrc, <4
  ; GFX10-LABEL: sample_c_d_o_2darray_V2:
  ; GFX10:       ; %bb.0: ; %main_body
  ; GFX10-NEXT:    v_mov_b32_e32 v9, 0xffff
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_and_b32_e32 v4, v9, v4
  ; GFX10-NEXT:    v_and_b32_e32 v2, v9, v2
  ; GFX10-NEXT:    v_lshl_or_b32 v4, v5, 16, v4
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.d16.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.d16.ll

index 488a07b..ce329ef 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.d16.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.d16.ll
@@ -10,7 +10,6 @@ define amdgpu_ps void @store_f16_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords, <2
  ;
  ; GFX10-LABEL: store_f16_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -28,7 +27,6 @@ define amdgpu_ps void @store_v2f16_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v2f16_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -46,7 +44,6 @@ define amdgpu_ps void @store_v3f16_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v3f16_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -64,7 +61,6 @@ define amdgpu_ps void @store_v4f16_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v4f16_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -82,7 +78,6 @@ define amdgpu_ps void @store_f16_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords, <2
  ;
  ; GFX10-LABEL: store_f16_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -101,7 +96,6 @@ define amdgpu_ps void @store_v2f16_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v2f16_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -120,7 +114,6 @@ define amdgpu_ps void @store_v3f16_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v3f16_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_2D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -139,7 +132,6 @@ define amdgpu_ps void @store_v4f16_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v4f16_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:2], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -158,7 +150,6 @@ define amdgpu_ps void @store_f16_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_lo,
  ;
  ; GFX10-LABEL: store_f16_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:3], v[0:1], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_3D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -178,7 +169,6 @@ define amdgpu_ps void @store_v2f16_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v2f16_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:3], v[0:1], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_3D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -198,7 +188,6 @@ define amdgpu_ps void @store_v3f16_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v3f16_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:3], v[0:1], s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_3D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -218,7 +207,6 @@ define amdgpu_ps void @store_v4f16_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v4f16_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:3], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16 d16
  ; GFX10-NEXT:    s_endpgm
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.ll

index 1217d29..77cbe55 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.ll
@@ -10,7 +10,6 @@ define amdgpu_ps void @store_f32_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords, <4
  ;
  ; GFX10-LABEL: store_f32_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -27,7 +26,6 @@ define amdgpu_ps void @store_v2f32_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v2f32_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -44,7 +42,6 @@ define amdgpu_ps void @store_v3f32_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v3f32_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -61,7 +58,6 @@ define amdgpu_ps void @store_v4f32_1d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v4f32_1d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_1D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -78,7 +74,6 @@ define amdgpu_ps void @store_f32_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords, <4
  ;
  ; GFX10-LABEL: store_f32_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -96,7 +91,6 @@ define amdgpu_ps void @store_v2f32_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v2f32_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -114,7 +108,6 @@ define amdgpu_ps void @store_v3f32_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v3f32_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -132,7 +125,6 @@ define amdgpu_ps void @store_v4f32_2d(<8 x i32> inreg %rsrc, <2 x i16> %coords,
  ;
  ; GFX10-LABEL: store_v4f32_2d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[1:4], v0, s[0:7] dmask:0xf dim:SQ_RSRC_IMG_2D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -150,7 +142,6 @@ define amdgpu_ps void @store_f32_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_lo,
  ;
  ; GFX10-LABEL: store_f32_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x1 dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -169,7 +160,6 @@ define amdgpu_ps void @store_v2f32_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v2f32_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x3 dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -188,7 +178,6 @@ define amdgpu_ps void @store_v3f32_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v3f32_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0x7 dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
@@ -207,7 +196,6 @@ define amdgpu_ps void @store_v4f32_3d(<8 x i32> inreg %rsrc, <2 x i16> %coords_l
  ;
  ; GFX10-LABEL: store_v4f32_3d:
  ; GFX10:       ; %bb.0: ; %main_body
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    image_store v[2:5], v[0:1], s[0:7] dmask:0xf dim:SQ_RSRC_IMG_3D unorm a16
  ; GFX10-NEXT:    s_endpgm
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.setreg.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.setreg.ll

index 7580690..50c28c3 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.setreg.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.setreg.ll
@@ -29,7 +29,6 @@ define amdgpu_kernel void @test_setreg_f32_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_f32_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 0, 2), 3 ; encoding: [0x01,0x08,0x80,0xba,0x03,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -57,7 +56,6 @@ define amdgpu_kernel void @test_setreg_f64_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_f64_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 2), 3 ; encoding: [0x81,0x08,0x80,0xba,0x03,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -85,7 +83,6 @@ define amdgpu_kernel void @test_setreg_all_round_mode_rtz() {
  ;
  ; GFX10-LABEL: test_setreg_all_round_mode_rtz:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 4), 7 ; encoding: [0x81,0x18,0x80,0xba,0x07,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -113,7 +110,6 @@ define amdgpu_cs void @test_setreg_roundingmode_var(i32 inreg %var.mode) {
  ;
  ; GFX10-LABEL: test_setreg_roundingmode_var:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 2), s0 ; encoding: [0x01,0x08,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -140,7 +136,6 @@ define amdgpu_kernel void @test_setreg_ieee_mode_off() {
  ;
  ; GFX10-LABEL: test_setreg_ieee_mode_off:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 9, 1), 0 ; encoding: [0x41,0x02,0x80,0xba,0x00,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -167,7 +162,6 @@ define amdgpu_kernel void @test_setreg_ieee_mode_on() {
  ;
  ; GFX10-LABEL: test_setreg_ieee_mode_on:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 9, 1), 1 ; encoding: [0x41,0x02,0x80,0xba,0x01,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -194,7 +188,6 @@ define amdgpu_kernel void @test_setreg_dx10_clamp_off() {
  ;
  ; GFX10-LABEL: test_setreg_dx10_clamp_off:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 8, 1), 0 ; encoding: [0x01,0x02,0x80,0xba,0x00,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -221,7 +214,6 @@ define amdgpu_kernel void @test_setreg_dx10_clamp_on() {
  ;
  ; GFX10-LABEL: test_setreg_dx10_clamp_on:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 8, 1), 1 ; encoding: [0x01,0x02,0x80,0xba,0x01,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -249,7 +241,6 @@ define amdgpu_cs void @test_setreg_full_both_round_mode_and_denorm_mode(i32 inre
  ;
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 8), s0 ; encoding: [0x01,0x38,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -277,7 +268,6 @@ define amdgpu_cs void @test_setreg_most_both_round_mode_and_denorm_mode() {
  ;
  ; GFX10-LABEL: test_setreg_most_both_round_mode_and_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 0, 7), 6 ; encoding: [0x01,0x30,0x80,0xba,0x06,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -305,7 +295,6 @@ define amdgpu_cs void @test_setreg_most_both_round_mode_and_denorm_mode_6() {
  ;
  ; GFX10-LABEL: test_setreg_most_both_round_mode_and_denorm_mode_6:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 1, 3), 6 ; encoding: [0x41,0x10,0x80,0xba,0x06,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -332,7 +321,6 @@ define amdgpu_cs void @test_setreg_f32_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_f32_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 4, 2), s0 ; encoding: [0x01,0x09,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -359,7 +347,6 @@ define amdgpu_cs void @test_setreg_f64_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_f64_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 6, 2), s0 ; encoding: [0x81,0x09,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -386,7 +373,6 @@ define amdgpu_cs void @test_setreg_full_denorm_mode(i32 inreg %val) {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 4), s0 ; encoding: [0x01,0x18,0x80,0xb9]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -413,7 +399,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_0() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_0:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -440,7 +425,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_1() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_1:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x1 ; encoding: [0x01,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -467,7 +451,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_2() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_2:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x2 ; encoding: [0x02,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -494,7 +477,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_4() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_4:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x4 ; encoding: [0x04,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -521,7 +503,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_8() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_8:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0x8 ; encoding: [0x08,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -548,7 +529,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_15() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_15:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -576,7 +556,6 @@ define amdgpu_kernel void @test_setreg_full_round_mode_42() {
  ;
  ; GFX10-LABEL: test_setreg_full_round_mode_42:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_round_mode 0xa ; encoding: [0x0a,0x00,0xa4,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -603,7 +582,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_0() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_0:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -630,7 +608,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_1() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_1:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -658,7 +635,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_2() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_2:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -685,7 +661,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_4() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_4:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -712,7 +687,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_8() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_8:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -739,7 +713,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_15() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_15:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -766,7 +739,6 @@ define amdgpu_kernel void @test_setreg_full_denorm_mode_42() {
  ;
  ; GFX10-LABEL: test_setreg_full_denorm_mode_42:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_denorm_mode 10 ; encoding: [0x0a,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -795,10 +767,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_0()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 0)
    call void asm sideeffect "", ""()
@@ -823,10 +794,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_1()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x1 ; encoding: [0x01,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 1)
    call void asm sideeffect "", ""()
@@ -851,10 +821,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_2()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x2 ; encoding: [0x02,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 2)
    call void asm sideeffect "", ""()
@@ -879,10 +848,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_4()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_4:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x4 ; encoding: [0x04,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 4)
    call void asm sideeffect "", ""()
@@ -907,10 +875,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_8()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_8:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x8 ; encoding: [0x08,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 8)
    call void asm sideeffect "", ""()
@@ -935,10 +902,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_16()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_16:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 1 ; encoding: [0x01,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 16)
    call void asm sideeffect "", ""()
@@ -963,10 +929,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_32()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_32:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 2 ; encoding: [0x02,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 32)
    call void asm sideeffect "", ""()
@@ -991,10 +956,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_64()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_64:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 4 ; encoding: [0x04,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 64)
    call void asm sideeffect "", ""()
@@ -1019,10 +983,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_128(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_128:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x0 ; encoding: [0x00,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 8 ; encoding: [0x08,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 128)
    call void asm sideeffect "", ""()
@@ -1047,10 +1010,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_15()
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_15:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 0 ; encoding: [0x00,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 15)
    call void asm sideeffect "", ""()
@@ -1075,10 +1037,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_255(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_255:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0xf ; encoding: [0x0f,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 15 ; encoding: [0x0f,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 255)
    call void asm sideeffect "", ""()
@@ -1104,10 +1065,9 @@ define amdgpu_kernel void @test_setreg_full_both_round_mode_and_denorm_mode_597(
  ; GFX10-LABEL: test_setreg_full_both_round_mode_and_denorm_mode_597:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_round_mode 0x5 ; encoding: [0x05,0x00,0xa4,0xbf]
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
-; GFX10-NEXT:    s_denorm_mode 5 ; encoding: [0x05,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
+; GFX10-NEXT:    s_denorm_mode 5 ; encoding: [0x05,0x00,0xa5,0xbf]
  ; GFX10-NEXT:    s_endpgm ; encoding: [0x00,0x00,0x81,0xbf]
    call void @llvm.amdgcn.s.setreg(i32 14337, i32 597)
    call void asm sideeffect "", ""()
@@ -1131,7 +1091,6 @@ define amdgpu_kernel void @test_setreg_set_8_bits_straddles_round_and_denorm() {
  ;
  ; GFX10-LABEL: test_setreg_set_8_bits_straddles_round_and_denorm:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 8), 0xff ; encoding: [0x81,0x38,0x80,0xba,0xff,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
@@ -1158,7 +1117,6 @@ define amdgpu_kernel void @test_setreg_set_4_bits_straddles_round_and_denorm() {
  ;
  ; GFX10-LABEL: test_setreg_set_4_bits_straddles_round_and_denorm:
  ; GFX10:       ; %bb.0:
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_setreg_imm32_b32 hwreg(HW_REG_MODE, 2, 4), 15 ; encoding: [0x81,0x18,0x80,0xba,0x0f,0x00,0x00,0x00]
  ; GFX10-NEXT:    ;;#ASMSTART
  ; GFX10-NEXT:    ;;#ASMEND
diff --git a/llvm/test/CodeGen/AMDGPU/offset-split-flat.ll b/llvm/test/CodeGen/AMDGPU/offset-split-flat.ll

index 1b36d30..1657f69 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/offset-split-flat.ll
+++ b/llvm/test/CodeGen/AMDGPU/offset-split-flat.ll
@@ -18,7 +18,6 @@ define i8 @flat_inst_valu_offset_1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, v0, 1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -41,7 +40,6 @@ define i8 @flat_inst_valu_offset_11bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x7ff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -64,7 +62,6 @@ define i8 @flat_inst_valu_offset_12bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -89,7 +86,6 @@ define i8 @flat_inst_valu_offset_13bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1fff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -114,7 +110,6 @@ define i8 @flat_inst_valu_offset_neg_11bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfffff800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -139,7 +134,6 @@ define i8 @flat_inst_valu_offset_neg_12bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfffff000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -164,7 +158,6 @@ define i8 @flat_inst_valu_offset_neg_13bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffe000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -187,7 +180,6 @@ define i8 @flat_inst_valu_offset_2x_11bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -212,7 +204,6 @@ define i8 @flat_inst_valu_offset_2x_12bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1fff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -237,7 +228,6 @@ define i8 @flat_inst_valu_offset_2x_13bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x3fff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -262,7 +252,6 @@ define i8 @flat_inst_valu_offset_2x_neg_11bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfffff000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -287,7 +276,6 @@ define i8 @flat_inst_valu_offset_2x_neg_12bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffe000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -312,7 +300,6 @@ define i8 @flat_inst_valu_offset_2x_neg_13bit_max(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffc000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -338,7 +325,6 @@ define i8 @flat_inst_valu_offset_64bit_11bit_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x7ff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -364,7 +350,6 @@ define i8 @flat_inst_valu_offset_64bit_11bit_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -390,7 +375,6 @@ define i8 @flat_inst_valu_offset_64bit_12bit_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -416,7 +400,6 @@ define i8 @flat_inst_valu_offset_64bit_12bit_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -442,7 +425,6 @@ define i8 @flat_inst_valu_offset_64bit_13bit_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1fff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -468,7 +450,6 @@ define i8 @flat_inst_valu_offset_64bit_13bit_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -495,7 +476,6 @@ define i8 @flat_inst_valu_offset_64bit_11bit_neg_high_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x7ff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -522,7 +502,6 @@ define i8 @flat_inst_valu_offset_64bit_11bit_neg_high_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -549,7 +528,6 @@ define i8 @flat_inst_valu_offset_64bit_12bit_neg_high_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -576,7 +554,6 @@ define i8 @flat_inst_valu_offset_64bit_12bit_neg_high_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -603,7 +580,6 @@ define i8 @flat_inst_valu_offset_64bit_13bit_neg_high_split0(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1fff, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -630,7 +606,6 @@ define i8 @flat_inst_valu_offset_64bit_13bit_neg_high_split1(i8* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    flat_load_ubyte v0, v[0:1]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
@@ -655,7 +630,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_1(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 1
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -686,7 +660,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_11bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_11bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x7ff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -717,7 +690,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_12bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -750,7 +722,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_13bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1fff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -783,7 +754,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_neg_11bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_neg_11bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfffff800
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -816,7 +786,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_neg_12bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_neg_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfffff000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -849,7 +818,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_neg_13bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_neg_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xffffe000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -880,7 +848,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_11bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_11bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -913,7 +880,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_12bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1fff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -946,7 +912,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_13bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x3fff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0
@@ -979,7 +944,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_neg_11bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_neg_11bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfffff000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -1012,7 +976,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_neg_12bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_neg_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xffffe000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -1045,7 +1008,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_2x_neg_13bit_max(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_2x_neg_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xffffc000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, -1
@@ -1078,7 +1040,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_11bit_split0(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_11bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x7ff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1111,7 +1072,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_11bit_split1(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_11bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x800
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1144,7 +1104,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_12bit_split0(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_12bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1178,7 +1137,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_12bit_split1(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_12bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1212,7 +1170,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_13bit_split0(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_13bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1fff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1246,7 +1203,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_13bit_split1(i8* %p) {
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_13bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x2000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 2
@@ -1281,7 +1237,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_11bit_neg_high_split0(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_11bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x7ff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
@@ -1316,7 +1271,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_11bit_neg_high_split1(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_11bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x800
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
@@ -1351,7 +1305,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_12bit_neg_high_split0(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_12bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0xfff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
@@ -1386,7 +1339,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_12bit_neg_high_split1(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_12bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
@@ -1421,7 +1373,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_13bit_neg_high_split0(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_13bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x1fff
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
@@ -1456,7 +1407,6 @@ define amdgpu_kernel void @flat_inst_salu_offset_64bit_13bit_neg_high_split1(i8*
  ; GFX10-LABEL: flat_inst_salu_offset_64bit_13bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_add_u32 s0, s0, 0x2000
  ; GFX10-NEXT:    s_addc_u32 s1, s1, 0x80000000
diff --git a/llvm/test/CodeGen/AMDGPU/offset-split-global.ll b/llvm/test/CodeGen/AMDGPU/offset-split-global.ll

index 27d01ef..c515dc1 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/offset-split-global.ll
+++ b/llvm/test/CodeGen/AMDGPU/offset-split-global.ll
@@ -18,7 +18,6 @@ define i8 @global_inst_valu_offset_1(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %gep = getelementptr i8, i8 addrspace(1)* %p, i64 1
@@ -39,7 +38,6 @@ define i8 @global_inst_valu_offset_11bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %gep = getelementptr i8, i8 addrspace(1)* %p, i64 2047
@@ -60,7 +58,6 @@ define i8 @global_inst_valu_offset_12bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -85,7 +82,6 @@ define i8 @global_inst_valu_offset_13bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -108,7 +104,6 @@ define i8 @global_inst_valu_offset_neg_11bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:-2048
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
  ; GFX10-NEXT:    s_setpc_b64 s[30:31]
    %gep = getelementptr i8, i8 addrspace(1)* %p, i64 -2048
@@ -129,7 +124,6 @@ define i8 @global_inst_valu_offset_neg_12bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfffff000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -154,7 +148,6 @@ define i8 @global_inst_valu_offset_neg_13bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffe000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -177,7 +170,6 @@ define i8 @global_inst_valu_offset_2x_11bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -202,7 +194,6 @@ define i8 @global_inst_valu_offset_2x_12bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -227,7 +218,6 @@ define i8 @global_inst_valu_offset_2x_13bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x3800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -250,7 +240,6 @@ define i8 @global_inst_valu_offset_2x_neg_11bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xfffff000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -275,7 +264,6 @@ define i8 @global_inst_valu_offset_2x_neg_12bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffe000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -300,7 +288,6 @@ define i8 @global_inst_valu_offset_2x_neg_13bit_max(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0xffffc000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, -1, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -326,7 +313,6 @@ define i8 @global_inst_valu_offset_64bit_11bit_split0(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -352,7 +338,6 @@ define i8 @global_inst_valu_offset_64bit_11bit_split1(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -378,7 +363,6 @@ define i8 @global_inst_valu_offset_64bit_12bit_split0(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -404,7 +388,6 @@ define i8 @global_inst_valu_offset_64bit_12bit_split1(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -430,7 +413,6 @@ define i8 @global_inst_valu_offset_64bit_13bit_split0(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -456,7 +438,6 @@ define i8 @global_inst_valu_offset_64bit_13bit_split1(i8 addrspace(1)* %p) {
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 2, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -483,7 +464,6 @@ define i8 @global_inst_valu_offset_64bit_11bit_neg_high_split0(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:-1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -510,7 +490,6 @@ define i8 @global_inst_valu_offset_64bit_11bit_neg_high_split1(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -537,7 +516,6 @@ define i8 @global_inst_valu_offset_64bit_12bit_neg_high_split0(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:-1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -564,7 +542,6 @@ define i8 @global_inst_valu_offset_64bit_12bit_neg_high_split1(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -591,7 +568,6 @@ define i8 @global_inst_valu_offset_64bit_13bit_neg_high_split0(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off offset:-1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -618,7 +594,6 @@ define i8 @global_inst_valu_offset_64bit_13bit_neg_high_split1(i8 addrspace(1)*
  ; GFX10-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GFX10-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_add_co_ci_u32_e32 v1, vcc_lo, 0x80000000, v1, vcc_lo
  ; GFX10-NEXT:    global_load_ubyte v0, v[0:1], off
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -643,7 +618,6 @@ define amdgpu_kernel void @global_inst_salu_offset_1(i8 addrspace(1)* %p) {
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:1
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -670,7 +644,6 @@ define amdgpu_kernel void @global_inst_salu_offset_11bit_max(i8 addrspace(1)* %p
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -697,7 +670,6 @@ define amdgpu_kernel void @global_inst_salu_offset_12bit_max(i8 addrspace(1)* %p
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -724,7 +696,6 @@ define amdgpu_kernel void @global_inst_salu_offset_13bit_max(i8 addrspace(1)* %p
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x1800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -751,7 +722,6 @@ define amdgpu_kernel void @global_inst_salu_offset_neg_11bit_max(i8 addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:-2048
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -777,7 +747,6 @@ define amdgpu_kernel void @global_inst_salu_offset_neg_12bit_max(i8 addrspace(1)
  ; GFX10-LABEL: global_inst_salu_offset_neg_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0xfffff000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, -1, s1, s0
@@ -808,7 +777,6 @@ define amdgpu_kernel void @global_inst_salu_offset_neg_13bit_max(i8 addrspace(1)
  ; GFX10-LABEL: global_inst_salu_offset_neg_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0xffffe000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, -1, s1, s0
@@ -837,7 +805,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_11bit_max(i8 addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -864,7 +831,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_12bit_max(i8 addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x1800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -891,7 +857,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_13bit_max(i8 addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
  ; GFX10-NEXT:    v_mov_b32_e32 v0, 0x3800
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ubyte v0, v0, s[0:1] offset:2047
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -917,7 +882,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_neg_11bit_max(i8 addrspace
  ; GFX10-LABEL: global_inst_salu_offset_2x_neg_11bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0xfffff000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, -1, s1, s0
@@ -948,7 +912,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_neg_12bit_max(i8 addrspace
  ; GFX10-LABEL: global_inst_salu_offset_2x_neg_12bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0xffffe000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, -1, s1, s0
@@ -979,7 +942,6 @@ define amdgpu_kernel void @global_inst_salu_offset_2x_neg_13bit_max(i8 addrspace
  ; GFX10-LABEL: global_inst_salu_offset_2x_neg_13bit_max:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0xffffc000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, -1, s1, s0
@@ -1010,7 +972,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_11bit_split0(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_11bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1041,7 +1002,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_11bit_split1(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_11bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0x800, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1072,7 +1032,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_12bit_split0(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_12bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0x800, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1104,7 +1063,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_12bit_split1(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_12bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0x1000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1136,7 +1094,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_13bit_split0(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_13bit_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0x1800, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1168,7 +1125,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_13bit_split1(i8 addrspa
  ; GFX10-LABEL: global_inst_salu_offset_64bit_13bit_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, s0, 0x2000, s0
  ; GFX10-NEXT:    v_add_co_ci_u32_e64 v1, s0, 2, s1, s0
@@ -1201,7 +1157,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_11bit_neg_high_split0(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_11bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, s0
@@ -1235,7 +1190,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_11bit_neg_high_split1(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_11bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x800, s0
@@ -1269,7 +1223,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_12bit_neg_high_split0(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_12bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, s0
@@ -1303,7 +1256,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_12bit_neg_high_split1(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_12bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x1000, s0
@@ -1337,7 +1289,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_13bit_neg_high_split0(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_13bit_neg_high_split0:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, s0
@@ -1371,7 +1322,6 @@ define amdgpu_kernel void @global_inst_salu_offset_64bit_13bit_neg_high_split1(i
  ; GFX10-LABEL: global_inst_salu_offset_64bit_13bit_neg_high_split1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx2 s[0:1], s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    v_mov_b32_e32 v1, s1
  ; GFX10-NEXT:    v_add_co_u32_e64 v0, vcc_lo, 0x2000, s0
diff --git a/llvm/test/CodeGen/AMDGPU/or3.ll b/llvm/test/CodeGen/AMDGPU/or3.ll

index 8d74e85..7164072 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/or3.ll
+++ b/llvm/test/CodeGen/AMDGPU/or3.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @or3(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: or3:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_or3_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = or i32 %a, %b
    %result = or i32 %x, %c
@@ -48,7 +47,6 @@ define amdgpu_ps float @or3_vgpr_a(i32 %a, i32 inreg %b, i32 inreg %c) {
  ; GFX10-LABEL: or3_vgpr_a:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_or3_b32 v0, v0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = or i32 %a, %b
    %result = or i32 %x, %c
@@ -71,7 +69,6 @@ define amdgpu_ps float @or3_vgpr_all2(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: or3_vgpr_all2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_or3_b32 v0, v1, v2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = or i32 %b, %c
    %result = or i32 %a, %x
@@ -94,7 +91,6 @@ define amdgpu_ps float @or3_vgpr_bc(i32 inreg %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: or3_vgpr_bc:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_or3_b32 v0, s2, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = or i32 %a, %b
    %result = or i32 %x, %c
@@ -117,7 +113,6 @@ define amdgpu_ps float @or3_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: or3_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_or3_b32 v0, v1, v0, 64
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = or i32 64, %b
    %result = or i32 %x, %a
diff --git a/llvm/test/CodeGen/AMDGPU/preserve-hi16.ll b/llvm/test/CodeGen/AMDGPU/preserve-hi16.ll

index a0b0336..2db373f 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/preserve-hi16.ll
+++ b/llvm/test/CodeGen/AMDGPU/preserve-hi16.ll
@@ -3,7 +3,6 @@
  
  ; GCN-LABEL: {{^}}shl_i16:
  ; GCN: v_lshlrev_b16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @shl_i16(i16 %x, i16 %y) {
    %res = shl i16 %x, %y
@@ -12,7 +11,6 @@ define i16 @shl_i16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}lshr_i16:
  ; GCN: v_lshrrev_b16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @lshr_i16(i16 %x, i16 %y) {
    %res = lshr i16 %x, %y
@@ -21,7 +19,6 @@ define i16 @lshr_i16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}ashr_i16:
  ; GCN: v_ashrrev_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @ashr_i16(i16 %x, i16 %y) {
    %res = ashr i16 %x, %y
@@ -30,7 +27,6 @@ define i16 @ashr_i16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}add_u16:
  ; GCN: v_add_{{(nc_)*}}u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @add_u16(i16 %x, i16 %y) {
    %res = add i16 %x, %y
@@ -39,7 +35,6 @@ define i16 @add_u16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}sub_u16:
  ; GCN: v_sub_{{(nc_)*}}u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @sub_u16(i16 %x, i16 %y) {
    %res = sub i16 %x, %y
@@ -48,7 +43,6 @@ define i16 @sub_u16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}mul_lo_u16:
  ; GCN: v_mul_lo_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @mul_lo_u16(i16 %x, i16 %y) {
    %res = mul i16 %x, %y
@@ -57,7 +51,6 @@ define i16 @mul_lo_u16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}min_u16:
  ; GCN: v_min_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @min_u16(i16 %x, i16 %y) {
    %cmp = icmp ule i16 %x, %y
@@ -67,7 +60,6 @@ define i16 @min_u16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}min_i16:
  ; GCN: v_min_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @min_i16(i16 %x, i16 %y) {
    %cmp = icmp sle i16 %x, %y
@@ -77,7 +69,6 @@ define i16 @min_i16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}max_u16:
  ; GCN: v_max_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @max_u16(i16 %x, i16 %y) {
    %cmp = icmp uge i16 %x, %y
@@ -87,7 +78,6 @@ define i16 @max_u16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}max_i16:
  ; GCN: v_max_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_setpc_b64
  define i16 @max_i16(i16 %x, i16 %y) {
    %cmp = icmp sge i16 %x, %y
@@ -97,7 +87,6 @@ define i16 @max_i16(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}shl_i16_zext_i32:
  ; GCN: v_lshlrev_b16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @shl_i16_zext_i32(i16 %x, i16 %y) {
@@ -108,7 +97,6 @@ define i32 @shl_i16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}lshr_i16_zext_i32:
  ; GCN: v_lshrrev_b16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @lshr_i16_zext_i32(i16 %x, i16 %y) {
@@ -119,7 +107,6 @@ define i32 @lshr_i16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}ashr_i16_zext_i32:
  ; GCN: v_ashrrev_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @ashr_i16_zext_i32(i16 %x, i16 %y) {
@@ -130,7 +117,6 @@ define i32 @ashr_i16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}add_u16_zext_i32:
  ; GCN: v_add_{{(nc_)*}}u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @add_u16_zext_i32(i16 %x, i16 %y) {
@@ -141,7 +127,6 @@ define i32 @add_u16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}sub_u16_zext_i32:
  ; GCN: v_sub_{{(nc_)*}}u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @sub_u16_zext_i32(i16 %x, i16 %y) {
@@ -152,7 +137,6 @@ define i32 @sub_u16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}mul_lo_u16_zext_i32:
  ; GCN: v_mul_lo_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @mul_lo_u16_zext_i32(i16 %x, i16 %y) {
@@ -163,7 +147,6 @@ define i32 @mul_lo_u16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}min_u16_zext_i32:
  ; GCN: v_min_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @min_u16_zext_i32(i16 %x, i16 %y) {
@@ -175,7 +158,6 @@ define i32 @min_u16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}min_i16_zext_i32:
  ; GCN: v_min_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @min_i16_zext_i32(i16 %x, i16 %y) {
@@ -187,7 +169,6 @@ define i32 @min_i16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}max_u16_zext_i32:
  ; GCN: v_max_u16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @max_u16_zext_i32(i16 %x, i16 %y) {
@@ -199,7 +180,6 @@ define i32 @max_u16_zext_i32(i16 %x, i16 %y) {
  
  ; GCN-LABEL: {{^}}max_i16_zext_i32:
  ; GCN: v_max_i16_e{{32|64}} [[OP:v[0-9]+]],
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: v_and_b32_e32 v{{[0-9]+}}, 0xffff, [[OP]]
  ; GCN-NEXT: s_setpc_b64
  define i32 @max_i16_zext_i32(i16 %x, i16 %y) {
diff --git a/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir b/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir

index a4db76a..4e56625 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir
+++ b/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir
@@ -22,7 +22,6 @@ body:             |
      ; GCN: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (dereferenceable invariant load 4, align 16, addrspace 4)
      ; GCN: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
      ; GCN: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
-    ; GCN: $vcc_hi = IMPLICIT_DEF
      ; GCN: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2, implicit $exec
      ; GCN: DS_WRITE_B32_gfx9 [[V_MOV_B32_e32_1]], [[V_MOV_B32_e32_]], 0, 0, implicit $exec :: (store 4, addrspace 3)
      ; GCN: $vgpr0 = COPY [[S_LOAD_DWORD_IMM]]
@@ -33,7 +32,6 @@ body:             |
      ; GCN: }
      ; GCN: DS_WRITE_B32_gfx9 [[V_MOV_B32_e32_1]], [[V_MOV_B32_e32_2]], 0, 0, implicit $exec :: (store 4, addrspace 3)
      ; GCN: S_ENDPGM 0
-    $vcc_hi = IMPLICIT_DEF
      %2:sgpr_64 = COPY $sgpr4_sgpr5
      %5:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM %2, 0, 0, 0 :: (dereferenceable invariant load 4, align 16, addrspace 4)
      %6:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
diff --git a/llvm/test/CodeGen/AMDGPU/shl_add.ll b/llvm/test/CodeGen/AMDGPU/shl_add.ll

index c1e7965..048b5c5 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/shl_add.ll
+++ b/llvm/test/CodeGen/AMDGPU/shl_add.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @shl_add(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: shl_add:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = add i32 %x, %c
@@ -47,7 +46,6 @@ define amdgpu_ps float @shl_add_vgpr_a(i32 %a, i32 inreg %b, i32 inreg %c) {
  ; GFX10-LABEL: shl_add_vgpr_a:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = add i32 %x, %c
@@ -70,7 +68,6 @@ define amdgpu_ps float @shl_add_vgpr_all(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: shl_add_vgpr_all:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = add i32 %x, %c
@@ -93,7 +90,6 @@ define amdgpu_ps float @shl_add_vgpr_ab(i32 %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: shl_add_vgpr_ab:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, v1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = add i32 %x, %c
@@ -116,7 +112,6 @@ define amdgpu_ps float @shl_add_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: shl_add_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_add_u32 v0, v0, 3, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, 3
    %result = add i32 %x, %b
diff --git a/llvm/test/CodeGen/AMDGPU/shl_or.ll b/llvm/test/CodeGen/AMDGPU/shl_or.ll

index 84118d8..fb276a1 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/shl_or.ll
+++ b/llvm/test/CodeGen/AMDGPU/shl_or.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @shl_or(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: shl_or:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = or i32 %x, %c
@@ -46,7 +45,6 @@ define amdgpu_ps float @shl_or_vgpr_c(i32 inreg %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: shl_or_vgpr_c:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, s2, s3, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = or i32 %x, %c
@@ -69,7 +67,6 @@ define amdgpu_ps float @shl_or_vgpr_all2(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: shl_or_vgpr_all2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = or i32 %c, %x
@@ -92,7 +89,6 @@ define amdgpu_ps float @shl_or_vgpr_ac(i32 %a, i32 inreg %b, i32 %c) {
  ; GFX10-LABEL: shl_or_vgpr_ac:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, s2, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = or i32 %x, %c
@@ -115,7 +111,6 @@ define amdgpu_ps float @shl_or_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: shl_or_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, v1, 6
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, %b
    %result = or i32 %x, 6
@@ -138,7 +133,6 @@ define amdgpu_ps float @shl_or_vgpr_const2(i32 %a, i32 %b) {
  ; GFX10-LABEL: shl_or_vgpr_const2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, 6, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, 6
    %result = or i32 %x, %b
@@ -161,7 +155,6 @@ define amdgpu_ps float @shl_or_vgpr_const_scalar1(i32 inreg %a, i32 %b) {
  ; GFX10-LABEL: shl_or_vgpr_const_scalar1:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, s2, 6, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, 6
    %result = or i32 %x, %b
@@ -184,7 +177,6 @@ define amdgpu_ps float @shl_or_vgpr_const_scalar2(i32 %a, i32 inreg %b) {
  ; GFX10-LABEL: shl_or_vgpr_const_scalar2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_lshl_or_b32 v0, v0, 6, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = shl i32 %a, 6
    %result = or i32 %x, %b
diff --git a/llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll b/llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll

index 778572d..1939d65 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll
+++ b/llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll
@@ -56,7 +56,6 @@ define amdgpu_kernel void @v_test_i32_x_sub_64(i32 addrspace(1)* %out, i32 addrs
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -134,7 +133,6 @@ define amdgpu_kernel void @v_test_i32_x_sub_64_multi_use(i32 addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
@@ -208,7 +206,6 @@ define amdgpu_kernel void @v_test_i32_64_sub_x(i32 addrspace(1)* %out, i32 addrs
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -274,7 +271,6 @@ define amdgpu_kernel void @v_test_i32_x_sub_65(i32 addrspace(1)* %out, i32 addrs
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -340,7 +336,6 @@ define amdgpu_kernel void @v_test_i32_65_sub_x(i32 addrspace(1)* %out, i32 addrs
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -406,7 +401,6 @@ define amdgpu_kernel void @v_test_i32_x_sub_neg16(i32 addrspace(1)* %out, i32 ad
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -472,7 +466,6 @@ define amdgpu_kernel void @v_test_i32_neg16_sub_x(i32 addrspace(1)* %out, i32 ad
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -538,7 +531,6 @@ define amdgpu_kernel void @v_test_i32_x_sub_neg17(i32 addrspace(1)* %out, i32 ad
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -604,7 +596,6 @@ define amdgpu_kernel void @v_test_i32_neg17_sub_x(i32 addrspace(1)* %out, i32 ad
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -655,7 +646,6 @@ define amdgpu_kernel void @s_test_i32_x_sub_64(i32 %x) #0 {
  ; GFX10-LABEL: s_test_i32_x_sub_64:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dword s0, s[0:1], 0x24
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_sub_i32 s0, s0, 64
  ; GFX10-NEXT:    ;;#ASMSTART
@@ -716,7 +706,6 @@ define amdgpu_kernel void @v_test_i16_x_sub_64(i16 addrspace(1)* %out, i16 addrs
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 1, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ushort v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -787,7 +776,6 @@ define amdgpu_kernel void @v_test_i16_x_sub_64_zext_to_i32(i32 addrspace(1)* %ou
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v1, 1, v0
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_ushort v1, v1, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -867,7 +855,6 @@ define amdgpu_kernel void @v_test_i16_x_sub_64_multi_use(i16 addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 1, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    s_clause 0x1
  ; GFX10-NEXT:    global_load_ushort v1, v0, s[2:3]
@@ -947,7 +934,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_64_64(<2 x i16> addrspace(1)* %out
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1020,7 +1006,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_7_64(<2 x i16> addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1093,7 +1078,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_64_123(<2 x i16> addrspace(1)* %ou
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1164,7 +1148,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_7_0(<2 x i16> addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1233,7 +1216,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_0_16(<2 x i16> addrspace(1)* %out,
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1302,7 +1284,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_0_1_0(<2 x i16> addrspace(1)* %out
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1371,7 +1352,6 @@ define amdgpu_kernel void @v_test_v2i16_x_sub_0_neg1_0(<2 x i16> addrspace(1)* %
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1444,7 +1424,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg32_neg32(<2 x i16> addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1512,7 +1491,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_0_neg32(<2 x i16> addrspace(1)* %o
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1582,7 +1560,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg32_0(<2 x i16> addrspace(1)* %o
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1655,7 +1632,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg16_neg16(<2 x i16> addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1723,7 +1699,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_0_neg16(<2 x i16> addrspace(1)* %o
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1793,7 +1768,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg16_0(<2 x i16> addrspace(1)* %o
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1867,7 +1841,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg_fpone(<2 x i16> addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -1941,7 +1914,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg_negfpone(<2 x i16> addrspace(1
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2015,7 +1987,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg_fptwo(<2 x i16> addrspace(1)*
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2089,7 +2060,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg_negfptwo(<2 x i16> addrspace(1
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2157,7 +2127,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_undef_neg32(<2 x i16> addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
@@ -2224,7 +2193,6 @@ define amdgpu_kernel void @v_test_v2i16_x_add_neg32_undef(<2 x i16> addrspace(1)
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    s_load_dwordx4 s[0:3], s[0:1], 0x24
  ; GFX10-NEXT:    v_lshlrev_b32_e32 v0, 2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT:    global_load_dword v1, v0, s[2:3]
  ; GFX10-NEXT:    s_waitcnt vmcnt(0)
diff --git a/llvm/test/CodeGen/AMDGPU/smrd.ll b/llvm/test/CodeGen/AMDGPU/smrd.ll

index 639ed31..2818de6 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/smrd.ll
+++ b/llvm/test/CodeGen/AMDGPU/smrd.ll
@@ -120,7 +120,6 @@ entry:
  ; GCN-DAG: s_mov_b32 s1, 1
  ; GCN-DAG: s_mov_b32 s0, 0
  ; SI-NEXT: nop 3
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GCN-NEXT: s_buffer_load_dword s0, s[0:3], 0x0
  define amdgpu_ps float @smrd_hazard(<4 x i32> inreg %desc) #0 {
  main_body:
diff --git a/llvm/test/CodeGen/AMDGPU/splitkit-getsubrangeformask.ll b/llvm/test/CodeGen/AMDGPU/splitkit-getsubrangeformask.ll

index a81efea..d041657 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/splitkit-getsubrangeformask.ll
+++ b/llvm/test/CodeGen/AMDGPU/splitkit-getsubrangeformask.ll
@@ -355,7 +355,6 @@ define amdgpu_gs void @_amdgpu_gs_main(i32 inreg %primShaderTableAddrLow, <31 x
    ; CHECK:   [[V_OR_B32_e32_67:%[0-9]+]]:vgpr_32 = V_OR_B32_e32 [[S_ADD_I32_24]], [[V_OR_B32_e32_66]], implicit $exec
    ; CHECK:   [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_32_xm0_xexec = V_CMP_EQ_U32_e64 0, [[V_OR_B32_e32_67]], implicit $exec
    ; CHECK:   undef %691.sub3:vreg_128 = V_CNDMASK_B32_e64 0, 0, 0, 1, [[V_CMP_EQ_U32_e64_]], implicit $exec
-  ; CHECK:   $vcc_hi = IMPLICIT_DEF
    ; CHECK:   IMAGE_STORE_V4_V2_gfx10 %691, undef %578:vreg_64, [[S_LOAD_DWORDX8_IMM]], 15, 1, -1, 0, 0, 0, 0, 0, 0, 0, 0, implicit $exec :: (dereferenceable store 16 into custom "TargetCustom8")
    ; CHECK:   S_ENDPGM 0
  .expVert:
diff --git a/llvm/test/CodeGen/AMDGPU/stack-pointer-offset-relative-frameindex.ll b/llvm/test/CodeGen/AMDGPU/stack-pointer-offset-relative-frameindex.ll

index ffdc949..4c7841d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/stack-pointer-offset-relative-frameindex.ll
+++ b/llvm/test/CodeGen/AMDGPU/stack-pointer-offset-relative-frameindex.ll
@@ -29,7 +29,6 @@ define amdgpu_kernel void @kernel_background_evaluate(float addrspace(5)* %kg, <
  ; MUBUF-NEXT:    v_mov_b32_e32 v4, 0x400000
  ; MUBUF-NEXT:    s_mov_b32 s32, 0xc0000
  ; MUBUF-NEXT:    v_add_nc_u32_e64 v40, 4, 0x4000
-; MUBUF-NEXT:    ; implicit-def: $vcc_hi
  ; MUBUF-NEXT:    s_getpc_b64 s[4:5]
  ; MUBUF-NEXT:    s_add_u32 s4, s4, svm_eval_nodes@rel32@lo+4
  ; MUBUF-NEXT:    s_addc_u32 s5, s5, svm_eval_nodes@rel32@hi+12
@@ -65,7 +64,6 @@ define amdgpu_kernel void @kernel_background_evaluate(float addrspace(5)* %kg, <
  ; FLATSCR-NEXT:    v_mov_b32_e32 v2, 0x4000
  ; FLATSCR-NEXT:    v_mov_b32_e32 v3, 0
  ; FLATSCR-NEXT:    v_mov_b32_e32 v4, 0x400000
-; FLATSCR-NEXT:    ; implicit-def: $vcc_hi
  ; FLATSCR-NEXT:    s_getpc_b64 s[0:1]
  ; FLATSCR-NEXT:    s_add_u32 s0, s0, svm_eval_nodes@rel32@lo+4
  ; FLATSCR-NEXT:    s_addc_u32 s1, s1, svm_eval_nodes@rel32@hi+12
diff --git a/llvm/test/CodeGen/AMDGPU/vgpr-descriptor-waterfall-loop-idom-update.ll b/llvm/test/CodeGen/AMDGPU/vgpr-descriptor-waterfall-loop-idom-update.ll

index 85859fb..d9b4149 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/vgpr-descriptor-waterfall-loop-idom-update.ll
+++ b/llvm/test/CodeGen/AMDGPU/vgpr-descriptor-waterfall-loop-idom-update.ll
@@ -4,7 +4,6 @@
  define void @vgpr_descriptor_waterfall_loop_idom_update(<4 x i32>* %arg) #0 {
  ; GCN-LABEL: vgpr_descriptor_waterfall_loop_idom_update:
  ; GCN:       ; %bb.0: ; %entry
-; GCN-NEXT:    ; implicit-def: $vcc_hi
  ; GCN-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
  ; GCN-NEXT:    s_waitcnt_vscnt null, 0x0
  ; GCN-NEXT:  BB0_1: ; %bb0
diff --git a/llvm/test/CodeGen/AMDGPU/vgpr-tuple-allocation.ll b/llvm/test/CodeGen/AMDGPU/vgpr-tuple-allocation.ll

index 09b14be..75e579b 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/vgpr-tuple-allocation.ll
+++ b/llvm/test/CodeGen/AMDGPU/vgpr-tuple-allocation.ll
@@ -59,7 +59,6 @@ define <4 x float> @non_preserved_vgpr_tuple8(<8 x i32> %rsrc, <4 x i32> %samp,
  ; GFX10-NEXT: s_add_u32 s4, s4, extern_func@gotpcrel32@lo+4
  ; GFX10-NEXT: s_addc_u32 s5, s5, extern_func@gotpcrel32@hi+12
  ; GFX10: s_load_dwordx2 s[4:5], s[4:5], 0x0
-; GFX10-NEXT:                                 ; implicit-def: $vcc_hi
  ; GFX10: s_waitcnt lgkmcnt(0)
  ; GFX10-NEXT: s_swappc_b64 s[30:31], s[4:5]
  
@@ -140,7 +139,6 @@ define <4 x float> @call_preserved_vgpr_tuple8(<8 x i32> %rsrc, <4 x i32> %samp,
  ; GFX10-NEXT: v_mov_b32_e32 v42, v14
  ; GFX10-NEXT: v_mov_b32_e32 v43, v13
  ; GFX10-NEXT: v_mov_b32_e32 v44, v12
-; GFX10-NEXT: ; implicit-def: $vcc_hi
  ; GFX10-NEXT: s_waitcnt vmcnt(0)
  ; GFX10-NEXT: global_store_dwordx4 v[0:1], v[0:3], off
  ; GFX10-NEXT: s_waitcnt lgkmcnt(0)
diff --git a/llvm/test/CodeGen/AMDGPU/xor3.ll b/llvm/test/CodeGen/AMDGPU/xor3.ll

index 9005e3f..5cd41c0 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/xor3.ll
+++ b/llvm/test/CodeGen/AMDGPU/xor3.ll
@@ -16,7 +16,6 @@ define amdgpu_ps float @xor3(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor3:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = xor i32 %x, %c
@@ -34,7 +33,6 @@ define amdgpu_ps float @xor3_vgpr_b(i32 inreg %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: xor3_vgpr_b:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, s2, v0, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = xor i32 %x, %c
@@ -52,7 +50,6 @@ define amdgpu_ps float @xor3_vgpr_all2(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor3_vgpr_all2:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, v1, v2, v0
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %b, %c
    %result = xor i32 %a, %x
@@ -70,7 +67,6 @@ define amdgpu_ps float @xor3_vgpr_bc(i32 inreg %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor3_vgpr_bc:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, s2, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = xor i32 %x, %c
@@ -88,7 +84,6 @@ define amdgpu_ps float @xor3_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: xor3_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, v0, v1, 16
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = xor i32 %x, 16
@@ -107,7 +102,6 @@ define amdgpu_ps <2 x float> @xor3_multiuse_outer(i32 %a, i32 %b, i32 %c, i32 %x
  ; GFX10-LABEL: xor3_multiuse_outer:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor3_b32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_mul_lo_u32 v1, v0, v3
  ; GFX10-NEXT:    ; return to shader part epilog
    %inner = xor i32 %a, %b
@@ -129,7 +123,6 @@ define amdgpu_ps <2 x float> @xor3_multiuse_inner(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor3_multiuse_inner:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xor_b32_e32 v0, v0, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_xor_b32_e32 v1, v0, v2
  ; GFX10-NEXT:    ; return to shader part epilog
    %inner = xor i32 %a, %b
@@ -158,7 +151,6 @@ define amdgpu_ps float @xor3_uniform_vgpr(float inreg %a, float inreg %b, float
  ; GFX10-NEXT:    v_add_f32_e64 v0, s2, 1.0
  ; GFX10-NEXT:    v_add_f32_e64 v1, s3, 2.0
  ; GFX10-NEXT:    v_add_f32_e64 v2, 0x40400000, s4
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    v_xor_b32_e32 v0, v0, v1
  ; GFX10-NEXT:    v_xor_b32_e32 v0, v0, v2
  ; GFX10-NEXT:    ; return to shader part epilog
diff --git a/llvm/test/CodeGen/AMDGPU/xor_add.ll b/llvm/test/CodeGen/AMDGPU/xor_add.ll

index 19a2a71..fb551a2 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/xor_add.ll
+++ b/llvm/test/CodeGen/AMDGPU/xor_add.ll
@@ -22,7 +22,6 @@ define amdgpu_ps float @xor_add(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor_add:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xad_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = add i32 %x, %c
@@ -47,7 +46,6 @@ define amdgpu_ps float @xor_add_vgpr_a(i32 %a, i32 inreg %b, i32 inreg %c) {
  ; GFX10-LABEL: xor_add_vgpr_a:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xad_u32 v0, v0, s2, s3
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = add i32 %x, %c
@@ -70,7 +68,6 @@ define amdgpu_ps float @xor_add_vgpr_all(i32 %a, i32 %b, i32 %c) {
  ; GFX10-LABEL: xor_add_vgpr_all:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xad_u32 v0, v0, v1, v2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = add i32 %x, %c
@@ -93,7 +90,6 @@ define amdgpu_ps float @xor_add_vgpr_ab(i32 %a, i32 %b, i32 inreg %c) {
  ; GFX10-LABEL: xor_add_vgpr_ab:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xad_u32 v0, v0, v1, s2
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, %b
    %result = add i32 %x, %c
@@ -116,7 +112,6 @@ define amdgpu_ps float @xor_add_vgpr_const(i32 %a, i32 %b) {
  ; GFX10-LABEL: xor_add_vgpr_const:
  ; GFX10:       ; %bb.0:
  ; GFX10-NEXT:    v_xad_u32 v0, v0, 3, v1
-; GFX10-NEXT:    ; implicit-def: $vcc_hi
  ; GFX10-NEXT:    ; return to shader part epilog
    %x = xor i32 %a, 3
    %result = add i32 %x, %b
author	Jay Foad <jay.foad@amd.com>
	Tue, 1 Dec 2020 11:55:50 +0000 (11:55 +0000)
committer	Jay Foad <jay.foad@amd.com>
	Wed, 2 Dec 2020 10:11:42 +0000 (10:11 +0000)
llvm/lib/Target/AMDGPU/SIISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/add_shl.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/dynamic-alloca-uniform.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/image_ls_mipmap_zero.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-add.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgcn.class.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-flat.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-amdgpu-atomic-cmpxchg-global.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-and.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ashr.v2s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-flat.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-atomicrmw-add-global.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-constant.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-copy.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fcmp.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fma.s32.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fmad.s32.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-fract.f64.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-freeze.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-icmp.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-constant.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-flat.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global-saddr.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-load-global.s96.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-lshr.v2s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-or.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-add3.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-and-or.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-or3.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-pattern-xor3.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-ptr-add.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-shl.v2s16.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sitofp.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-flat.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-store-global.s96.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-sub.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.gfx10.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uadde.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uaddo.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-uitofp.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.gfx10.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usube.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-usubo.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/inst-select-xor.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.ballot.i32.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.scale.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.end.cf.i32.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fdot2.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.fmul.legacy.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.global.atomic.csub.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.icmp.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.if.break.i32.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.atomic.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.a16.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.gather4.o.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.getresinfo.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.d16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.1d.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2d.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.2darraymsaa.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.load.3d.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.g16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.sample.ltolz.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.image.store.2d.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.intersect_ray.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.mov.dpp.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.setreg.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot2.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot4.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sdot8.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot2.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot4.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.udot8.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.update.dpp.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.writelane.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/saddsat.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/ssubsat.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/uaddsat.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/GlobalISel/usubsat.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/SRSRC-GIT-clobber-check.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/add3.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/add_shl.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/amdpal-elf.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/and_or.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/atomic_optimizations_local_pointer.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/cc-update.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/cgp-addressing-modes-gfx1030.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/expand-scalar-carry-out-select-user.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/flat-scratch.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/gfx-callable-argument-types.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/gfx-callable-preserved-registers.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/global-saddr-atomics.gfx1030.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/hsa-metadata-kernel-code-props-v3.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/idot2.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/idot4s.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/idot4u.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/idot8s.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/idot8u.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/image-load-d16-tfe.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/imm16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/insert-branch-w32.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.ballot.i32.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.fma.legacy.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.a16.encode.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.gather4.a16.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.a16.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.d16.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.dim.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.encode.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.sample.g16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.d16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.image.store.a16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.setreg.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/offset-split-flat.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/offset-split-global.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/or3.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/preserve-hi16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/shl_add.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/shl_or.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/shrink-add-sub-constant.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/smrd.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/splitkit-getsubrangeformask.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/stack-pointer-offset-relative-frameindex.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/vgpr-descriptor-waterfall-loop-idom-update.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/vgpr-tuple-allocation.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/xor3.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/xor_add.ll		patch \| blob \| history