[AMDGPU] Fix getInstrLatency() always returning 1

author Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>

Mon, 13 Jan 2020 22:30:21 +0000 (14:30 -0800)

committer Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>

Tue, 14 Jan 2020 09:08:30 +0000 (01:08 -0800)
author Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>
Mon, 13 Jan 2020 22:30:21 +0000 (14:30 -0800)
committer Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>
Tue, 14 Jan 2020 09:08:30 +0000 (01:08 -0800)
diff --git a/llvm/lib/Target/AMDGPU/SIInstrInfo.cpp b/llvm/lib/Target/AMDGPU/SIInstrInfo.cpp

index 4f81c25e81516c789a7beea87fd015eb414c157c..d53950ca4465537795c8772eaf7dd8729f8c252c 100644 (file)
--- a/llvm/lib/Target/AMDGPU/SIInstrInfo.cpp
+++ b/llvm/lib/Target/AMDGPU/SIInstrInfo.cpp
@@ -85,7 +85,9 @@ BranchOffsetBits("amdgpu-s-branch-bits", cl::ReallyHidden, cl::init(16),
  
  SIInstrInfo::SIInstrInfo(const GCNSubtarget &ST)
    : AMDGPUGenInstrInfo(AMDGPU::ADJCALLSTACKUP, AMDGPU::ADJCALLSTACKDOWN),
-    RI(ST), ST(ST) {}
+    RI(ST), ST(ST) {
+  SchedModel.init(&ST);
+}
  
  //===----------------------------------------------------------------------===//
  // TargetInstrInfo callbacks
@@ -6635,10 +6637,10 @@ unsigned SIInstrInfo::getInstrLatency(const InstrItineraryData *ItinData,
      unsigned Lat = 0, Count = 0;
      for (++I; I != E && I->isBundledWithPred(); ++I) {
        ++Count;
-      Lat = std::max(Lat, getInstrLatency(ItinData, *I, PredCost));
+      Lat = std::max(Lat, SchedModel.computeInstrLatency(&*I));
      }
      return Lat + Count - 1;
    }
  
-  return AMDGPUGenInstrInfo::getInstrLatency(ItinData, MI, PredCost);
+  return SchedModel.computeInstrLatency(&MI);
  }
diff --git a/llvm/lib/Target/AMDGPU/SIInstrInfo.h b/llvm/lib/Target/AMDGPU/SIInstrInfo.h

index 899eba7d2a19f2969d302ae24c095d226e69678c..b151a94b0d118ac728dc98d819e04f6776ecc879 100644 (file)
--- a/llvm/lib/Target/AMDGPU/SIInstrInfo.h
+++ b/llvm/lib/Target/AMDGPU/SIInstrInfo.h
@@ -25,6 +25,7 @@
  #include "llvm/CodeGen/MachineInstr.h"
  #include "llvm/CodeGen/MachineInstrBuilder.h"
  #include "llvm/CodeGen/MachineOperand.h"
+#include "llvm/CodeGen/TargetSchedule.h"
  #include "llvm/MC/MCInstrDesc.h"
  #include "llvm/Support/Compiler.h"
  #include <cassert>
@@ -46,6 +47,7 @@ class SIInstrInfo final : public AMDGPUGenInstrInfo {
  private:
    const SIRegisterInfo RI;
    const GCNSubtarget &ST;
+  TargetSchedModel SchedModel;
  
    // The inverse predicate should have the negative value.
    enum BranchPredicate {
diff --git a/llvm/test/CodeGen/AMDGPU/max.i16.ll b/llvm/test/CodeGen/AMDGPU/max.i16.ll

index 5839eccf60867849a84798b4c7ad8aee8fa69abe..ff624ec1d0c0eab5c6e1cb59a8c516478a5e893f 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/max.i16.ll
+++ b/llvm/test/CodeGen/AMDGPU/max.i16.ll
@@ -175,11 +175,12 @@ define amdgpu_kernel void @v_test_imax_sge_v3i16(<3 x i16> addrspace(1)* %out, <
  ; GFX9-NEXT:    s_waitcnt vmcnt(1)
  ; GFX9-NEXT:    v_mov_b32_e32 v8, v6
  ; GFX9-NEXT:    s_waitcnt vmcnt(0)
-; GFX9-NEXT:    v_pk_max_i16 v6, v6, v7
-; GFX9-NEXT:    global_load_short_d16 v7, v[2:3], off offset:4
+; GFX9-NEXT:    v_mov_b32_e32 v9, v7
  ; GFX9-NEXT:    global_load_short_d16 v8, v[0:1], off offset:4
+; GFX9-NEXT:    global_load_short_d16 v9, v[2:3], off offset:4
+; GFX9-NEXT:    v_pk_max_i16 v6, v6, v7
  ; GFX9-NEXT:    s_waitcnt vmcnt(0)
-; GFX9-NEXT:    v_pk_max_i16 v0, v8, v7
+; GFX9-NEXT:    v_pk_max_i16 v0, v8, v9
  ; GFX9-NEXT:    global_store_dword v[4:5], v6, off
  ; GFX9-NEXT:    global_store_short v[4:5], v0, off offset:4
  ; GFX9-NEXT:    s_endpgm
diff --git a/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir b/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir

index b46bee82210b42d14632e31dff8fa3e40f551151..63523167ac14c954f77e9404b0efbca0a19ea93d 100644 (file)
--- a/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir
+++ b/llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir
@@ -23,8 +23,8 @@ body:             |
      ; GCN: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
      ; GCN: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0, 0 :: (dereferenceable invariant load 4, align 16, addrspace 4)
      ; GCN: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
-    ; GCN: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2, implicit $exec
      ; GCN: DS_WRITE_B32_gfx9 [[V_MOV_B32_e32_1]], [[V_MOV_B32_e32_]], 0, 0, implicit $exec :: (store 4, addrspace 3)
+    ; GCN: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2, implicit $exec
      ; GCN: $m0 = S_MOV_B32 0
      ; GCN: $vgpr0 = COPY [[S_LOAD_DWORD_IMM]]
      ; GCN: BUNDLE implicit $vgpr0, implicit $m0, implicit $exec {
author	Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>
	Mon, 13 Jan 2020 22:30:21 +0000 (14:30 -0800)
committer	Stanislav Mekhanoshin <Stanislav.Mekhanoshin@amd.com>
	Tue, 14 Jan 2020 09:08:30 +0000 (01:08 -0800)
llvm/lib/Target/AMDGPU/SIInstrInfo.cpp		patch \| blob \| history
llvm/lib/Target/AMDGPU/SIInstrInfo.h		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/max.i16.ll		patch \| blob \| history
llvm/test/CodeGen/AMDGPU/scheduler-handle-move-bundle.mir		patch \| blob \| history