[X86] Add OptForSize to a couple load folding patterns. Remove some bad FIXME comments.

author Craig Topper <craig.topper@intel.com>

Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)

committer Craig Topper <craig.topper@intel.com>

Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)
author Craig Topper <craig.topper@intel.com>
Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)
committer Craig Topper <craig.topper@intel.com>
Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)
diff --git a/llvm/lib/Target/X86/X86InstrAVX512.td b/llvm/lib/Target/X86/X86InstrAVX512.td

index 1a3e3f022abc4b4746b537ed32c83c734fc4668d..5bb2521a16ca3967361790e88ef7880cc020964b 100644 (file)
--- a/llvm/lib/Target/X86/X86InstrAVX512.td
+++ b/llvm/lib/Target/X86/X86InstrAVX512.td
@@ -7194,7 +7194,7 @@ def : Pat<(f64 (fpextend FR32X:$src)),
            Requires<[HasAVX512]>;
  def : Pat<(f64 (fpextend (loadf32 addr:$src))),
            (VCVTSS2SDZrm (f64 (IMPLICIT_DEF)), addr:$src)>,
-          Requires<[HasAVX512]>;
+          Requires<[HasAVX512, OptForSize]>;
  
  def : Pat<(f64 (extloadf32 addr:$src)),
            (VCVTSS2SDZrm (f64 (IMPLICIT_DEF)), addr:$src)>,
diff --git a/llvm/lib/Target/X86/X86InstrSSE.td b/llvm/lib/Target/X86/X86InstrSSE.td

index 438fb84b094e8246408b08ab2e32016d7721672d..22bf465a2b272367bd242a977a2934969ef8b593 100644 (file)
--- a/llvm/lib/Target/X86/X86InstrSSE.td
+++ b/llvm/lib/Target/X86/X86InstrSSE.td
@@ -897,8 +897,6 @@ let Constraints = "$src1 = $dst", AddedComplexity = 20 in {
  // SSE 1 & 2 - Conversion Instructions
  //===----------------------------------------------------------------------===//
  
-// FIXME: We probably want to match the rm form only when optimizing for
-// size, to avoid false depenendecies (see sse_fp_unop_s for details)
  multiclass sse12_cvt_s<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,
                       SDNode OpNode, X86MemOperand x86memop, PatFrag ld_frag,
                       string asm, X86FoldableSchedWrite sched> {
@@ -925,8 +923,6 @@ let hasSideEffects = 0 in {
  }
  }
  
-// FIXME: We probably want to match the rm form only when optimizing for
-// size, to avoid false depenendecies (see sse_fp_unop_s for details)
  multiclass sse12_vcvt_avx<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,
                            X86MemOperand x86memop, string asm,
                            X86FoldableSchedWrite sched> {
@@ -1301,24 +1297,25 @@ def CVTSD2SSrm_Int: I<0x5A, MRMSrcMem,
  
  // Convert scalar single to scalar double
  // SSE2 instructions with XS prefix
-let hasSideEffects = 0, Predicates = [UseAVX] in {
+let hasSideEffects = 0 in {
  def VCVTSS2SDrr : I<0x5A, MRMSrcReg, (outs FR64:$dst),
                      (ins FR64:$src1, FR32:$src2),
                      "vcvtss2sd\t{$src2, $src1, $dst|$dst, $src1, $src2}", []>,
                      XS, VEX_4V, VEX_LIG, VEX_WIG, NotMemoryFoldable,
-                    Sched<[WriteCvtSS2SD]>;
+                    Sched<[WriteCvtSS2SD]>, Requires<[UseAVX]>;
  let mayLoad = 1 in
  def VCVTSS2SDrm : I<0x5A, MRMSrcMem, (outs FR64:$dst),
                      (ins FR64:$src1, f32mem:$src2),
                      "vcvtss2sd\t{$src2, $src1, $dst|$dst, $src1, $src2}", []>,
                      XS, VEX_4V, VEX_LIG, VEX_WIG, NotMemoryFoldable,
-                    Sched<[WriteCvtSS2SD.Folded, ReadAfterLd]>;
+                    Sched<[WriteCvtSS2SD.Folded, ReadAfterLd]>,
+                    Requires<[UseAVX, OptForSize]>;
  }
  
  def : Pat<(f64 (fpextend FR32:$src)),
      (VCVTSS2SDrr (f64 (IMPLICIT_DEF)), FR32:$src)>, Requires<[UseAVX]>;
  def : Pat<(fpextend (loadf32 addr:$src)),
-    (VCVTSS2SDrm (f64 (IMPLICIT_DEF)), addr:$src)>, Requires<[UseAVX]>;
+    (VCVTSS2SDrm (f64 (IMPLICIT_DEF)), addr:$src)>, Requires<[UseAVX, OptForSize]>;
  
  def : Pat<(extloadf32 addr:$src),
      (VCVTSS2SDrm (f64 (IMPLICIT_DEF)), addr:$src)>,
@@ -1343,7 +1340,7 @@ def CVTSS2SDrm : I<0x5A, MRMSrcMem, (outs FR64:$dst), (ins f32mem:$src),
  // Since these loads aren't folded into the fpextend, we have to match it
  // explicitly here.
  def : Pat<(fpextend (loadf32 addr:$src)),
-          (CVTSS2SDrm addr:$src)>, Requires<[UseSSE2]>;
+          (CVTSS2SDrm addr:$src)>, Requires<[UseSSE2, OptForSize]>;
  def : Pat<(extloadf32 addr:$src),
            (CVTSS2SDrr (MOVSSrm addr:$src))>, Requires<[UseSSE2, OptForSpeed]>;
author	Craig Topper <craig.topper@intel.com>
	Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)
committer	Craig Topper <craig.topper@intel.com>
	Thu, 17 May 2018 05:41:11 +0000 (05:41 +0000)
llvm/lib/Target/X86/X86InstrAVX512.td		patch \| blob \| history
llvm/lib/Target/X86/X86InstrSSE.td		patch \| blob \| history