[Inliner] Propagate SROA analysis through invariant group intrinsics
authorArthur Eubanks <aeubanks@google.com>
Sat, 10 Apr 2021 18:59:04 +0000 (11:59 -0700)
committerArthur Eubanks <aeubanks@google.com>
Mon, 12 Apr 2021 17:54:22 +0000 (10:54 -0700)
SROA can handle invariant group intrinsics, let the inliner know that
for better heuristics when the intrinsics are present.

This fixes size issues in a couple files when turning on
-fstrict-vtable-pointers in Chrome.

Reviewed By: rnk, mtrofin

Differential Revision: https://reviews.llvm.org/D100249

llvm/lib/Analysis/InlineCost.cpp
llvm/test/Transforms/Inline/invariant-group-sroa.ll [new file with mode: 0644]

index 06cc778..b367efa 100644 (file)
@@ -1884,6 +1884,11 @@ bool CallAnalyzer::visitCallBase(CallBase &Call) {
     case Intrinsic::vastart:
       InitsVargArgs = true;
       return false;
+    case Intrinsic::launder_invariant_group:
+    case Intrinsic::strip_invariant_group:
+      if (auto *SROAArg = getSROAArgForValueOrNull(II->getOperand(0)))
+        SROAArgValues[II] = SROAArg;
+      return true;
     }
   }
 
diff --git a/llvm/test/Transforms/Inline/invariant-group-sroa.ll b/llvm/test/Transforms/Inline/invariant-group-sroa.ll
new file mode 100644 (file)
index 0000000..086e8b6
--- /dev/null
@@ -0,0 +1,26 @@
+; RUN: opt -passes='print<inline-cost>' -disable-output %s 2>&1 | FileCheck %s
+
+; SROA analysis should yield non-zero savings for allocas passed through invariant group intrinsics
+; CHECK: SROACostSavings: 10
+
+declare i8* @llvm.launder.invariant.group.p0i8(i8*)
+declare i8* @llvm.strip.invariant.group.p0i8(i8*)
+
+declare void @b()
+
+define i32 @f() {
+  %a = alloca i32
+  %r = call i32 @g(i32* %a)
+  ret i32 %r
+}
+
+define i32 @g(i32* %a) {
+  %a_i8 = bitcast i32* %a to i8*
+  %a_inv_i8 = call i8* @llvm.launder.invariant.group.p0i8(i8* %a_i8)
+  %a_inv = bitcast i8* %a_inv_i8 to i32*
+  %i1 = load i32, i32* %a_inv
+  %i2 = load i32, i32* %a_inv
+  %i3 = add i32 %i1, %i2
+  %t = call i8* @llvm.strip.invariant.group.p0i8(i8* %a_inv_i8)
+  ret i32 %i3
+}