[Hexagon] Improve lowering of returns of i1
authorKrzysztof Parzyszek <kparzysz@quicinc.com>
Thu, 22 Apr 2021 21:18:39 +0000 (16:18 -0500)
committerKrzysztof Parzyszek <kparzysz@quicinc.com>
Thu, 22 Apr 2021 21:47:52 +0000 (16:47 -0500)
Emit explicit any-extend to avoid weird tstbit sequences.

llvm/lib/Target/Hexagon/HexagonISelLowering.cpp
llvm/test/CodeGen/Hexagon/isel/logical.ll
llvm/test/CodeGen/Hexagon/predicate-copy.ll
llvm/test/MC/Hexagon/inst_cmp_eq.ll
llvm/test/MC/Hexagon/inst_cmp_eqi.ll
llvm/test/MC/Hexagon/inst_cmp_gt.ll
llvm/test/MC/Hexagon/inst_cmp_gti.ll
llvm/test/MC/Hexagon/inst_cmp_lt.ll
llvm/test/MC/Hexagon/inst_cmp_ugt.ll
llvm/test/MC/Hexagon/inst_cmp_ugti.ll
llvm/test/MC/Hexagon/inst_cmp_ult.ll

index 153c7e9..edb8d7f 100644 (file)
@@ -219,8 +219,29 @@ HexagonTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
   // Copy the result values into the output registers.
   for (unsigned i = 0; i != RVLocs.size(); ++i) {
     CCValAssign &VA = RVLocs[i];
+    SDValue Val = OutVals[i];
 
-    Chain = DAG.getCopyToReg(Chain, dl, VA.getLocReg(), OutVals[i], Flag);
+    switch (VA.getLocInfo()) {
+      default:
+        // Loc info must be one of Full, BCvt, SExt, ZExt, or AExt.
+        llvm_unreachable("Unknown loc info!");
+      case CCValAssign::Full:
+        break;
+      case CCValAssign::BCvt:
+        Val = DAG.getBitcast(VA.getLocVT(), Val);
+        break;
+      case CCValAssign::SExt:
+        Val = DAG.getNode(ISD::SIGN_EXTEND, dl, VA.getLocVT(), Val);
+        break;
+      case CCValAssign::ZExt:
+        Val = DAG.getNode(ISD::ZERO_EXTEND, dl, VA.getLocVT(), Val);
+        break;
+      case CCValAssign::AExt:
+        Val = DAG.getNode(ISD::ANY_EXTEND, dl, VA.getLocVT(), Val);
+        break;
+    }
+
+    Chain = DAG.getCopyToReg(Chain, dl, VA.getLocReg(), Val, Flag);
 
     // Guarantee that all emitted copies are stuck together with flags.
     Flag = Chain.getValue(1);
index 6c6ac7e..987fb02 100644 (file)
@@ -16,12 +16,6 @@ define i1 @f0(i32 %a0, i32 %a1) #1 {
 ; CHECK-NEXT:     p0 = and(p0,p1)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -49,12 +43,6 @@ define i1 @f1(i32 %a0, i32 %a1) #1 {
 ; CHECK-NEXT:     p0 = or(p0,p1)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -82,12 +70,6 @@ define i1 @f2(i32 %a0, i32 %a1) #1 {
 ; CHECK-NEXT:     p0 = xor(p0,p1)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -127,7 +109,7 @@ define i1 @f3(i32 %a0, i32 %a1) #1 {
 ; CHECK-NEXT:     p0 = and(p0,!p1)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
@@ -167,7 +149,7 @@ define i1 @f4(i32 %a0, i32 %a1) #1 {
 ; CHECK-NEXT:     p0 = or(p0,!p1)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
@@ -198,12 +180,6 @@ define i1 @f5(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = and(p2,and(p0,p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -237,12 +213,6 @@ define i1 @f6(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = and(p2,or(p0,p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -276,12 +246,6 @@ define i1 @f7(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = or(p2,and(p0,p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -315,12 +279,6 @@ define i1 @f8(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = or(p2,or(p0,p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r2 = p0
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
-; CHECK-NEXT:     p0 = tstbit(r2,#0)
-; CHECK-NEXT:    }
-; CHECK-NEXT:    {
 ; CHECK-NEXT:     r0 = p0
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
@@ -372,7 +330,7 @@ define i1 @f9(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = and(p2,and(p0,!p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
@@ -424,7 +382,7 @@ define i1 @f10(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = and(p2,or(p0,!p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
@@ -476,7 +434,7 @@ define i1 @f11(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = or(p2,and(p0,!p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
@@ -528,7 +486,7 @@ define i1 @f12(i32 %a0, i32 %a1, i32 %a2) #1 {
 ; CHECK-NEXT:     p0 = or(p2,or(p0,!p1))
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
-; CHECK-NEXT:     r0 = p0
+; CHECK-NEXT:     r0 = mux(p0,#1,#0)
 ; CHECK-NEXT:    }
 ; CHECK-NEXT:    {
 ; CHECK-NEXT:     jumpr r31
index 1b58ec9..8939a75 100644 (file)
@@ -1,10 +1,19 @@
-; RUN: llc -march=hexagon -O3 < %s | FileCheck %s
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -march=hexagon < %s | FileCheck %s
 
-; CHECK: r{{[0-9]+}} = p{{[0-9]+}}
-
-define i1 @f0() #0 {
+define i1 @f0(i32 %a0) #0 {
+; CHECK-LABEL: f0:
+; CHECK:       // %bb.0: // %b0
+; CHECK-NEXT:    {
+; CHECK-NEXT:     p0 = cmp.eq(r0,#0)
+; CHECK-NEXT:    }
+; CHECK-NEXT:    {
+; CHECK-NEXT:     r0 = mux(p0,#0,#1)
+; CHECK-NEXT:     jumpr r31
+; CHECK-NEXT:    }
 b0:
-  ret i1 false
+  %v0 = icmp ne i32 %a0, 0
+  ret i1 %v0
 }
 
-attributes #0 = { nounwind "target-cpu"="hexagonv5" }
+attributes #0 = { nounwind "target-cpu"="hexagonv66" }
index 5c48345..5ceec21 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a, i32 %b)
-{
-  %1 = icmp eq i32 %a, %b
-  ret i1 %1
+define i1 @f0(i32 %a0, i32 %a1) {
+  %v0 = icmp eq i32 %a0, %a1
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.eq(r0,r1)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index 5d8132b..1ec6af1 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a)
-{
-  %1 = icmp eq i32 %a, 42
-  ret i1 %1
+define i1 @f0(i32 %a0) {
+  %v0 = icmp eq i32 %a0, 42
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.eq(r0,#42)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index 45a4e33..6611240 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a, i32 %b)
-{
-  %1 = icmp sgt i32 %a, %b
-  ret i1 %1
+define i1 @f0(i32 %a0, i32 %a1) {
+  %v0 = icmp sgt i32 %a0, %a1
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gt(r0,r1)
-; CHECK: r0 = p0
-; CHECK: jumpr r31 }
+; CHECK: r0 = mux(p0,#1,#0)
+; CHECK: jumpr r31
index 67cdc4c..fac0cac 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a)
-{
-  %1 = icmp sgt i32 %a, 42
-  ret i1 %1
+define i1 @f0(i32 %a0) {
+  %v0 = icmp sgt i32 %a0, 42
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gt(r0,#42)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index b19a4a6..2f00660 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a, i32 %b)
-{
-  %1 = icmp slt i32 %a, %b
-  ret i1 %1
+define i1 @f0(i32 %a0, i32 %a1) {
+  %v0 = icmp slt i32 %a0, %a1
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gt(r1,r0)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index 7af40c6..8938492 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a, i32 %b)
-{
-  %1 = icmp ugt i32 %a, %b
-  ret i1 %1
+define i1 @f0(i32 %a0, i32 %a1) {
+  %v0 = icmp ugt i32 %a0, %a1
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gtu(r0,r1)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index 63d94e4..ba1953a 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a)
-{
-  %1 = icmp ugt i32 %a, 42
-  ret i1 %1
+define i1 @f0(i32 %a0) {
+  %v0 = icmp ugt i32 %a0, 42
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gtu(r0,#42)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31
index ecda120..a6df6a4 100644 (file)
@@ -1,12 +1,11 @@
 ;; RUN: llc -mtriple=hexagon-unknown-elf -filetype=obj %s -o - \
 ;; RUN: | llvm-objdump -d - | FileCheck %s
 
-define i1 @foo (i32 %a, i32 %b)
-{
-  %1 = icmp ult i32 %a, %b
-  ret i1 %1
+define i1 @f0(i32 %a0, i32 %a1) {
+  %v0 = icmp ult i32 %a0, %a1
+  ret i1 %v0
 }
 
 ; CHECK: p0 = cmp.gtu(r1,r0)
-; CHECK: r0 = p0
+; CHECK: r0 = mux(p0,#1,#0)
 ; CHECK: jumpr r31