[AMDGPU] Fix the gfx10 scheduling model for f32 conversions

author Jay Foad <jay.foad@amd.com>

Fri, 28 Feb 2020 23:38:41 +0000 (23:38 +0000)

committer Jay Foad <jay.foad@amd.com>

Tue, 10 Mar 2020 19:31:24 +0000 (19:31 +0000)
author Jay Foad <jay.foad@amd.com>
Fri, 28 Feb 2020 23:38:41 +0000 (23:38 +0000)
committer Jay Foad <jay.foad@amd.com>
Tue, 10 Mar 2020 19:31:24 +0000 (19:31 +0000)
diff --git a/llvm/lib/Target/AMDGPU/SISchedule.td b/llvm/lib/Target/AMDGPU/SISchedule.td

index 5236e6c..fdd1ad4 100644 (file)
--- a/llvm/lib/Target/AMDGPU/SISchedule.td
+++ b/llvm/lib/Target/AMDGPU/SISchedule.td
@@ -29,6 +29,7 @@ def MIMFMARead  : SchedRead;
  
  // Vector ALU instructions
  def Write32Bit         : SchedWrite;
+def WriteFloatCvt      : SchedWrite;
  def WriteQuarterRate32 : SchedWrite;
  
  def WriteFloatFMA   : SchedWrite;
@@ -126,6 +127,7 @@ multiclass SICommonWriteRes {
  
    def : HWVALUWriteRes<Write32Bit,         1>;
    def : HWVALUWriteRes<Write64Bit,         2>;
+  def : HWVALUWriteRes<WriteFloatCvt,      4>;
    def : HWVALUWriteRes<WriteQuarterRate32, 4>;
    def : HWVALUWriteRes<Write2PassMAI,      2>;
    def : HWVALUWriteRes<Write8PassMAI,      8>;
@@ -185,6 +187,7 @@ let SchedModel = GFX10SpeedModel in {
  // The latency values are 1 / (operations / cycle).
  // Add 1 stall cycle for VGPR read.
  def : HWWriteRes<Write32Bit,         [HWVALU, HWRC],   5>;
+def : HWWriteRes<WriteFloatCvt,      [HWVALU, HWRC],   5>;
  def : HWWriteRes<Write64Bit,         [HWVALU, HWRC],   9>;
  def : HWWriteRes<WriteQuarterRate32, [HWVALU, HWRC],   17>;
  def : HWWriteRes<WriteFloatFMA,      [HWVALU, HWRC],   5>;
diff --git a/llvm/lib/Target/AMDGPU/VOP1Instructions.td b/llvm/lib/Target/AMDGPU/VOP1Instructions.td

index 5546124..d39e698 100644 (file)
--- a/llvm/lib/Target/AMDGPU/VOP1Instructions.td
+++ b/llvm/lib/Target/AMDGPU/VOP1Instructions.td
@@ -190,7 +190,7 @@ defm V_CVT_U32_F64 : VOP1Inst <"v_cvt_u32_f64", VOP_I32_F64,  fp_to_uint>;
  defm V_CVT_F64_U32 : VOP1Inst <"v_cvt_f64_u32", VOP1_F64_I32, uint_to_fp>;
  } // End SchedRW = [WriteDoubleCvt]
  
-let SchedRW = [WriteQuarterRate32] in {
+let SchedRW = [WriteFloatCvt] in {
  defm V_CVT_F32_I32 : VOP1Inst <"v_cvt_f32_i32", VOP1_F32_I32, sint_to_fp>;
  defm V_CVT_F32_U32 : VOP1Inst <"v_cvt_f32_u32", VOP1_F32_I32, uint_to_fp>;
  defm V_CVT_U32_F32 : VOP1Inst <"v_cvt_u32_f32", VOP_I32_F32, fp_to_uint>;
@@ -202,7 +202,7 @@ defm V_CVT_F32_F16 : VOP1Inst <"v_cvt_f32_f16", VOP_F32_F16, fpextend>;
  defm V_CVT_RPI_I32_F32 : VOP1Inst <"v_cvt_rpi_i32_f32", VOP_I32_F32, cvt_rpi_i32_f32>;
  defm V_CVT_FLR_I32_F32 : VOP1Inst <"v_cvt_flr_i32_f32", VOP_I32_F32, cvt_flr_i32_f32>;
  defm V_CVT_OFF_F32_I4 : VOP1Inst  <"v_cvt_off_f32_i4", VOP1_F32_I32>;
-} // End SchedRW = [WriteQuarterRate32]
+} // End SchedRW = [WriteFloatCvt]
  
  defm V_CVT_F32_UBYTE0 : VOP1Inst <"v_cvt_f32_ubyte0", VOP1_F32_I32, AMDGPUcvt_f32_ubyte0>;
  defm V_CVT_F32_UBYTE1 : VOP1Inst <"v_cvt_f32_ubyte1", VOP1_F32_I32, AMDGPUcvt_f32_ubyte1>;
author	Jay Foad <jay.foad@amd.com>
	Fri, 28 Feb 2020 23:38:41 +0000 (23:38 +0000)
committer	Jay Foad <jay.foad@amd.com>
	Tue, 10 Mar 2020 19:31:24 +0000 (19:31 +0000)
llvm/lib/Target/AMDGPU/SISchedule.td		patch \| blob \| history
llvm/lib/Target/AMDGPU/VOP1Instructions.td		patch \| blob \| history