[ARM] Do not select SMULW[BT] or SMLAW[BT]

author Oliver Stannard <oliver.stannard@arm.com>

Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)

committer Oliver Stannard <oliver.stannard@arm.com>

Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)
author Oliver Stannard <oliver.stannard@arm.com>
Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)
committer Oliver Stannard <oliver.stannard@arm.com>
Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)
diff --git a/llvm/lib/Target/ARM/ARMInstrInfo.td b/llvm/lib/Target/ARM/ARMInstrInfo.td

index 1c2f1900bcb0526daa4312334c8e32bc5d5fe68f..c03901cb5e5ac3a468018f32ae8db04f2eb86919 100644 (file)
--- a/llvm/lib/Target/ARM/ARMInstrInfo.td
+++ b/llvm/lib/Target/ARM/ARMInstrInfo.td
@@ -3942,14 +3942,12 @@ multiclass AI_smul<string opc, PatFrag opnode> {
  
    def WB : AMulxyI<0b0001001, 0b01, (outs GPR:$Rd), (ins GPR:$Rn, GPR:$Rm),
                IIC_iMUL16, !strconcat(opc, "wb"), "\t$Rd, $Rn, $Rm",
-              [(set GPR:$Rd, (sra (opnode GPR:$Rn,
-                                    (sext_inreg GPR:$Rm, i16)), (i32 16)))]>,
+              []>,
             Requires<[IsARM, HasV5TE]>;
  
    def WT : AMulxyI<0b0001001, 0b11, (outs GPR:$Rd), (ins GPR:$Rn, GPR:$Rm),
                IIC_iMUL16, !strconcat(opc, "wt"), "\t$Rd, $Rn, $Rm",
-              [(set GPR:$Rd, (sra (opnode GPR:$Rn,
-                                    (sra GPR:$Rm, (i32 16))), (i32 16)))]>,
+              []>,
              Requires<[IsARM, HasV5TE]>;
  }
  
@@ -3991,17 +3989,13 @@ multiclass AI_smla<string opc, PatFrag opnode> {
    def WB : AMulxyIa<0b0001001, 0b00, (outs GPRnopc:$Rd),
                (ins GPRnopc:$Rn, GPRnopc:$Rm, GPR:$Ra),
                IIC_iMAC16, !strconcat(opc, "wb"), "\t$Rd, $Rn, $Rm, $Ra",
-              [(set GPRnopc:$Rd,
-                    (add GPR:$Ra, (sra (opnode GPRnopc:$Rn,
-                                  (sext_inreg GPRnopc:$Rm, i16)), (i32 16))))]>,
+              []>,
             Requires<[IsARM, HasV5TE, UseMulOps]>;
  
    def WT : AMulxyIa<0b0001001, 0b10, (outs GPRnopc:$Rd),
                (ins GPRnopc:$Rn, GPRnopc:$Rm, GPR:$Ra),
                IIC_iMAC16, !strconcat(opc, "wt"), "\t$Rd, $Rn, $Rm, $Ra",
-              [(set GPRnopc:$Rd,
-                 (add GPR:$Ra, (sra (opnode GPRnopc:$Rn,
-                                    (sra GPRnopc:$Rm, (i32 16))), (i32 16))))]>,
+              []>,
              Requires<[IsARM, HasV5TE, UseMulOps]>;
    }
  }
@@ -5326,11 +5320,6 @@ def : ARMV5TEPat<(mul (sra GPR:$a, (i32 16)),
                   (SMULTB GPR:$a, GPR:$b)>;
  def : ARMV5TEPat<(mul (sra GPR:$a, (i32 16)), sext_16_node:$b),
                  (SMULTB GPR:$a, GPR:$b)>;
-def : ARMV5TEPat<(sra (mul GPR:$a, (sra (shl GPR:$b, (i32 16)), (i32 16))),
-                      (i32 16)),
-                 (SMULWB GPR:$a, GPR:$b)>;
-def : ARMV5TEPat<(sra (mul GPR:$a, sext_16_node:$b), (i32 16)),
-                 (SMULWB GPR:$a, GPR:$b)>;
  
  def : ARMV5MOPat<(add GPR:$acc,
                        (mul (sra (shl GPR:$a, (i32 16)), (i32 16)),
@@ -5353,13 +5342,6 @@ def : ARMV5MOPat<(add GPR:$acc,
  def : ARMV5MOPat<(add GPR:$acc,
                        (mul (sra GPR:$a, (i32 16)), sext_16_node:$b)),
                   (SMLATB GPR:$a, GPR:$b, GPR:$acc)>;
-def : ARMV5MOPat<(add GPR:$acc,
-                      (sra (mul GPR:$a, (sra (shl GPR:$b, (i32 16)), (i32 16))),
-                           (i32 16))),
-                 (SMLAWB GPR:$a, GPR:$b, GPR:$acc)>;
-def : ARMV5MOPat<(add GPR:$acc,
-                      (sra (mul GPR:$a, sext_16_node:$b), (i32 16))),
-                 (SMLAWB GPR:$a, GPR:$b, GPR:$acc)>;
  
  
  // Pre-v7 uses MCR for synchronization barriers.
diff --git a/llvm/lib/Target/ARM/ARMInstrThumb2.td b/llvm/lib/Target/ARM/ARMInstrThumb2.td

index ac190585409452e214b9dae2a67ff71b0bd6fbb1..df034fc3ebe217039c0c2bd19fdc6085ee42c12c 100644 (file)
--- a/llvm/lib/Target/ARM/ARMInstrThumb2.td
+++ b/llvm/lib/Target/ARM/ARMInstrThumb2.td
@@ -2726,8 +2726,7 @@ multiclass T2I_smul<string opc, PatFrag opnode> {
  
    def WB : T2ThreeReg<(outs rGPR:$Rd), (ins rGPR:$Rn, rGPR:$Rm), IIC_iMUL16,
                !strconcat(opc, "wb"), "\t$Rd, $Rn, $Rm",
-              [(set rGPR:$Rd, (sra (opnode rGPR:$Rn,
-                                    (sext_inreg rGPR:$Rm, i16)), (i32 16)))]>,
+              []>,
            Requires<[IsThumb2, HasThumb2DSP]> {
      let Inst{31-27} = 0b11111;
      let Inst{26-23} = 0b0110;
@@ -2739,8 +2738,7 @@ multiclass T2I_smul<string opc, PatFrag opnode> {
  
    def WT : T2ThreeReg<(outs rGPR:$Rd), (ins rGPR:$Rn, rGPR:$Rm), IIC_iMUL16,
                !strconcat(opc, "wt"), "\t$Rd, $Rn, $Rm",
-              [(set rGPR:$Rd, (sra (opnode rGPR:$Rn,
-                                    (sra rGPR:$Rm, (i32 16))), (i32 16)))]>,
+              []>,
            Requires<[IsThumb2, HasThumb2DSP]> {
      let Inst{31-27} = 0b11111;
      let Inst{26-23} = 0b0110;
@@ -2809,8 +2807,7 @@ multiclass T2I_smla<string opc, PatFrag opnode> {
    def WB : T2FourReg<
          (outs rGPR:$Rd), (ins rGPR:$Rn, rGPR:$Rm, rGPR:$Ra), IIC_iMAC16,
                !strconcat(opc, "wb"), "\t$Rd, $Rn, $Rm, $Ra",
-              [(set rGPR:$Rd, (add rGPR:$Ra, (sra (opnode rGPR:$Rn,
-                                    (sext_inreg rGPR:$Rm, i16)), (i32 16))))]>,
+              []>,
             Requires<[IsThumb2, HasThumb2DSP, UseMulOps]> {
      let Inst{31-27} = 0b11111;
      let Inst{26-23} = 0b0110;
@@ -2822,8 +2819,7 @@ multiclass T2I_smla<string opc, PatFrag opnode> {
    def WT : T2FourReg<
          (outs rGPR:$Rd), (ins rGPR:$Rn, rGPR:$Rm, rGPR:$Ra), IIC_iMAC16,
                !strconcat(opc, "wt"), "\t$Rd, $Rn, $Rm, $Ra",
-              [(set rGPR:$Rd, (add rGPR:$Ra, (sra (opnode rGPR:$Rn,
-                                      (sra rGPR:$Rm, (i32 16))), (i32 16))))]>,
+              []>,
             Requires<[IsThumb2, HasThumb2DSP, UseMulOps]> {
      let Inst{31-27} = 0b11111;
      let Inst{26-23} = 0b0110;
diff --git a/llvm/test/CodeGen/ARM/smulw.ll b/llvm/test/CodeGen/ARM/smulw.ll

new file mode 100644 (file)

index 0000000..8653903
--- /dev/null
+++ b/llvm/test/CodeGen/ARM/smulw.ll
@@ -0,0 +1,26 @@
+; RUN: llc -mtriple=arm--none-eabi -mcpu=cortex-a8 %s -o - | FileCheck %s
+; RUN: llc -mtriple=thumb--none-eabi -mcpu=cortex-a8 %s -o - | FileCheck %s
+
+; We cannot codegen the smulw[bt] or smlaw[bt] instructions for these functions,
+; as the top 16 bits of the result would differ
+
+define i32 @f1(i32 %a, i16 %b) {
+; CHECK-LABEL: f1:
+; CHECK: mul
+; CHECK: asr
+  %tmp1 = sext i16 %b to i32
+  %tmp2 = mul i32 %a, %tmp1
+  %tmp3 = ashr i32 %tmp2, 16
+  ret i32 %tmp3
+}
+
+define i32 @f2(i32 %a, i16 %b, i32 %c) {
+; CHECK-LABEL: f2:
+; CHECK: mul
+; CHECK: add{{.*}}, asr #16
+  %tmp1 = sext i16 %b to i32
+  %tmp2 = mul i32 %a, %tmp1
+  %tmp3 = ashr i32 %tmp2, 16
+  %tmp4 = add i32 %tmp3, %c
+  ret i32 %tmp4
+}
author	Oliver Stannard <oliver.stannard@arm.com>
	Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)
committer	Oliver Stannard <oliver.stannard@arm.com>
	Mon, 20 Oct 2014 11:30:35 +0000 (11:30 +0000)
llvm/lib/Target/ARM/ARMInstrInfo.td		patch \| blob \| history
llvm/lib/Target/ARM/ARMInstrThumb2.td		patch \| blob \| history
llvm/test/CodeGen/ARM/smulw.ll	[new file with mode: 0644]	patch \| blob