[AArch64][SVE] Improve codegen when extracting first lane of active lane mask

author Rosie Sumpter <rosie.sumpter@arm.com>

Mon, 9 May 2022 08:35:13 +0000 (09:35 +0100)

committer Rosie Sumpter <rosie.sumpter@arm.com>

Mon, 9 May 2022 12:56:04 +0000 (13:56 +0100)
author Rosie Sumpter <rosie.sumpter@arm.com>
Mon, 9 May 2022 08:35:13 +0000 (09:35 +0100)
committer Rosie Sumpter <rosie.sumpter@arm.com>
Mon, 9 May 2022 12:56:04 +0000 (13:56 +0100)
diff --git a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

index dc99ed0..3187430 100644 (file)
--- a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
+++ b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
@@ -14666,7 +14666,9 @@ static bool isPredicateCCSettingOp(SDValue N) {
          N.getConstantOperandVal(0) == Intrinsic::aarch64_sve_whilele ||
          N.getConstantOperandVal(0) == Intrinsic::aarch64_sve_whilelo ||
          N.getConstantOperandVal(0) == Intrinsic::aarch64_sve_whilels ||
-        N.getConstantOperandVal(0) == Intrinsic::aarch64_sve_whilelt)))
+        N.getConstantOperandVal(0) == Intrinsic::aarch64_sve_whilelt ||
+        // get_active_lane_mask is lowered to a whilelo instruction.
+        N.getConstantOperandVal(0) == Intrinsic::get_active_lane_mask)))
      return true;
  
    return false;
diff --git a/llvm/test/CodeGen/AArch64/sve-cmp-folds.ll b/llvm/test/CodeGen/AArch64/sve-cmp-folds.ll

index 380501c..6812f0b 100644 (file)
--- a/llvm/test/CodeGen/AArch64/sve-cmp-folds.ll
+++ b/llvm/test/CodeGen/AArch64/sve-cmp-folds.ll
@@ -170,6 +170,17 @@ define i1 @whilelt_first(i64 %next, i64 %end) {
    ret i1 %bit
  }
  
+define i1 @lane_mask_first(i64 %next, i64 %end) {
+; CHECK-LABEL: lane_mask_first:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    whilelo p0.s, x0, x1
+; CHECK-NEXT:    cset w0, mi
+; CHECK-NEXT:    ret
+  %predicate = call <vscale x 4 x i1> @llvm.get.active.lane.mask.nxv4i1.i64(i64 %next, i64 %end)
+  %bit = extractelement <vscale x 4 x i1> %predicate, i64 0
+  ret i1 %bit
+}
+
  declare i64 @llvm.vscale.i64()
  declare <vscale x 4 x i1> @llvm.aarch64.sve.whilege.nxv4i1.i64(i64, i64)
  declare <vscale x 4 x i1> @llvm.aarch64.sve.whilegt.nxv4i1.i64(i64, i64)
@@ -179,3 +190,4 @@ declare <vscale x 4 x i1> @llvm.aarch64.sve.whilele.nxv4i1.i64(i64, i64)
  declare <vscale x 4 x i1> @llvm.aarch64.sve.whilelo.nxv4i1.i64(i64, i64)
  declare <vscale x 4 x i1> @llvm.aarch64.sve.whilels.nxv4i1.i64(i64, i64)
  declare <vscale x 4 x i1> @llvm.aarch64.sve.whilelt.nxv4i1.i64(i64, i64)
+declare <vscale x 4 x i1> @llvm.get.active.lane.mask.nxv4i1.i64(i64, i64)
author	Rosie Sumpter <rosie.sumpter@arm.com>
	Mon, 9 May 2022 08:35:13 +0000 (09:35 +0100)
committer	Rosie Sumpter <rosie.sumpter@arm.com>
	Mon, 9 May 2022 12:56:04 +0000 (13:56 +0100)
llvm/lib/Target/AArch64/AArch64ISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/AArch64/sve-cmp-folds.ll		patch \| blob \| history