[StackColoring] Handle SEH catch object stack slots conservatively
authorNikita Popov <npopov@redhat.com>
Thu, 21 Sep 2023 07:13:27 +0000 (09:13 +0200)
committerTobias Hieta <tobias@hieta.se>
Wed, 27 Sep 2023 15:53:46 +0000 (17:53 +0200)
The write to the SEH catch object happens before cleanuppads are
executed, while the first reference to the object will typically
be in a catchpad.

If we make use of first-use analysis, we may end up allocating
an alloca used inside the cleanuppad and the catch object at the
same stack offset, which would be incorrect.

https://reviews.llvm.org/D86673 was a previous attempt to fix it.
It used the heuristic "a slot loaded in a WinEH pad and never
written" to detect catch objects. However, because it checks
for more than one load (while probably more than zero was
intended), the fix does not actually work.

The general approach also seems dubious to me, so this patch
reverts that change entirely, and instead marks all catch object
slots as conservative (i.e. excluded from first-use analysis)
based on the WinEHFuncInfo. As far as I can tell we don't need
any heuristics here, we know exactly which slots are affected.

Fixes https://github.com/llvm/llvm-project/issues/66984.

(cherry picked from commit b3cb4f069c2cb99bdae68d6906156af20e76314f)

llvm/lib/CodeGen/StackColoring.cpp
llvm/test/CodeGen/X86/stack-coloring-seh.ll [deleted file]
llvm/test/CodeGen/X86/stack-coloring-wineh.ll [new file with mode: 0644]

index 66b9086e1d88335763352d63000099d77c379628..10597daff54fc84a7821ad29158d6c16d7423374 100644 (file)
@@ -370,37 +370,6 @@ STATISTIC(EscapedAllocas, "Number of allocas that escaped the lifetime region");
 // If in RPO ordering chosen to walk the CFG  we happen to visit the b[k]
 // before visiting the memcpy block (which will contain the lifetime start
 // for "b" then it will appear that 'b' has a degenerate lifetime.
-//
-// Handle Windows Exception with LifetimeStartOnFirstUse:
-// -----------------
-//
-// There was a bug for using LifetimeStartOnFirstUse in win32.
-// class Type1 {
-// ...
-// ~Type1(){ write memory;}
-// }
-// ...
-// try{
-// Type1 V
-// ...
-// } catch (Type2 X){
-// ...
-// }
-// For variable X in catch(X), we put point pX=&(&X) into ConservativeSlots
-// to prevent using LifetimeStartOnFirstUse. Because pX may merged with
-// object V which may call destructor after implicitly writing pX. All these
-// are done in C++ EH runtime libs (through CxxThrowException), and can't
-// obviously check it in IR level.
-//
-// The loader of pX, without obvious writing IR, is usually the first LOAD MI
-// in EHPad, Some like:
-// bb.x.catch.i (landing-pad, ehfunclet-entry):
-// ; predecessors: %bb...
-//   successors: %bb...
-//  %n:gr32 = MOV32rm %stack.pX ...
-//  ...
-// The Type2** %stack.pX will only be written in EH runtime libs, so we
-// check the StoreSlots to screen it out.
 
 namespace {
 
@@ -462,9 +431,6 @@ class StackColoring : public MachineFunctionPass {
   /// slots lifetime-start-on-first-use is disabled).
   BitVector ConservativeSlots;
 
-  /// Record the FI slots referenced by a 'may write to memory'.
-  BitVector StoreSlots;
-
   /// Number of iterations taken during data flow analysis.
   unsigned NumIterations;
 
@@ -660,13 +626,10 @@ unsigned StackColoring::collectMarkers(unsigned NumSlot) {
   InterestingSlots.resize(NumSlot);
   ConservativeSlots.clear();
   ConservativeSlots.resize(NumSlot);
-  StoreSlots.clear();
-  StoreSlots.resize(NumSlot);
 
   // number of start and end lifetime ops for each slot
   SmallVector<int, 8> NumStartLifetimes(NumSlot, 0);
   SmallVector<int, 8> NumEndLifetimes(NumSlot, 0);
-  SmallVector<int, 8> NumLoadInCatchPad(NumSlot, 0);
 
   // Step 1: collect markers and populate the "InterestingSlots"
   // and "ConservativeSlots" sets.
@@ -722,13 +685,6 @@ unsigned StackColoring::collectMarkers(unsigned NumSlot) {
           if (! BetweenStartEnd.test(Slot)) {
             ConservativeSlots.set(Slot);
           }
-          // Here we check the StoreSlots to screen catch point out. For more
-          // information, please refer "Handle Windows Exception with
-          // LifetimeStartOnFirstUse" at the head of this file.
-          if (MI.mayStore())
-            StoreSlots.set(Slot);
-          if (MF->getWinEHFuncInfo() && MBB->isEHPad() && MI.mayLoad())
-            NumLoadInCatchPad[Slot] += 1;
         }
       }
     }
@@ -739,14 +695,23 @@ unsigned StackColoring::collectMarkers(unsigned NumSlot) {
     return 0;
   }
 
-  // 1) PR27903: slots with multiple start or end lifetime ops are not
+  // PR27903: slots with multiple start or end lifetime ops are not
   // safe to enable for "lifetime-start-on-first-use".
-  // 2) And also not safe for variable X in catch(X) in windows.
   for (unsigned slot = 0; slot < NumSlot; ++slot) {
-    if (NumStartLifetimes[slot] > 1 || NumEndLifetimes[slot] > 1 ||
-        (NumLoadInCatchPad[slot] > 1 && !StoreSlots.test(slot)))
+    if (NumStartLifetimes[slot] > 1 || NumEndLifetimes[slot] > 1)
       ConservativeSlots.set(slot);
   }
+
+  // The write to the catch object by the personality function is not propely
+  // modeled in IR: It happens before any cleanuppads are executed, even if the
+  // first mention of the catch object is in a catchpad. As such, mark catch
+  // object slots as conservative, so they are excluded from first-use analysis.
+  if (WinEHFuncInfo *EHInfo = MF->getWinEHFuncInfo())
+    for (WinEHTryBlockMapEntry &TBME : EHInfo->TryBlockMap)
+      for (WinEHHandlerType &H : TBME.HandlerArray)
+        if (H.CatchObj.FrameIndex != std::numeric_limits<int>::max())
+          ConservativeSlots.set(H.CatchObj.FrameIndex);
+
   LLVM_DEBUG(dumpBV("Conservative slots", ConservativeSlots));
 
   // Step 2: compute begin/end sets for each block
diff --git a/llvm/test/CodeGen/X86/stack-coloring-seh.ll b/llvm/test/CodeGen/X86/stack-coloring-seh.ll
deleted file mode 100644 (file)
index 3995bfa..0000000
+++ /dev/null
@@ -1,109 +0,0 @@
-; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 3
-; RUN: llc -mtriple=i686-windows-msvc < %s | FileCheck %s
-
-@type_info = external global ptr
-
-; FIXME: This is a miscompile.
-define void @pr66984(ptr %arg) personality ptr @__CxxFrameHandler3 {
-; CHECK-LABEL: pr66984:
-; CHECK:       # %bb.0: # %bb
-; CHECK-NEXT:    pushl %ebp
-; CHECK-NEXT:    movl %esp, %ebp
-; CHECK-NEXT:    pushl %ebx
-; CHECK-NEXT:    pushl %edi
-; CHECK-NEXT:    pushl %esi
-; CHECK-NEXT:    subl $20, %esp
-; CHECK-NEXT:    movl %esp, -28(%ebp)
-; CHECK-NEXT:    movl $-1, -16(%ebp)
-; CHECK-NEXT:    leal -24(%ebp), %eax
-; CHECK-NEXT:    movl $___ehhandler$pr66984, -20(%ebp)
-; CHECK-NEXT:    movl %fs:0, %ecx
-; CHECK-NEXT:    movl %ecx, -24(%ebp)
-; CHECK-NEXT:    movl %eax, %fs:0
-; CHECK-NEXT:    movl $1, -16(%ebp)
-; CHECK-NEXT:    calll _throw
-; CHECK-NEXT:  # %bb.1: # %bb14
-; CHECK-NEXT:  LBB0_3: # Block address taken
-; CHECK-NEXT:    # %bb17
-; CHECK-NEXT:    addl $12, %ebp
-; CHECK-NEXT:    jmp LBB0_4
-; CHECK-NEXT:  LBB0_4: # %exit
-; CHECK-NEXT:  $ehgcr_0_4:
-; CHECK-NEXT:    movl -24(%ebp), %eax
-; CHECK-NEXT:    movl %eax, %fs:0
-; CHECK-NEXT:    addl $20, %esp
-; CHECK-NEXT:    popl %esi
-; CHECK-NEXT:    popl %edi
-; CHECK-NEXT:    popl %ebx
-; CHECK-NEXT:    popl %ebp
-; CHECK-NEXT:    retl
-; CHECK-NEXT:    .def "?catch$2@?0?pr66984@4HA";
-; CHECK-NEXT:    .scl 3;
-; CHECK-NEXT:    .type 32;
-; CHECK-NEXT:    .endef
-; CHECK-NEXT:    .p2align 4, 0x90
-; CHECK-NEXT:  "?catch$2@?0?pr66984@4HA":
-; CHECK-NEXT:  LBB0_2: # %bb17
-; CHECK-NEXT:    pushl %ebp
-; CHECK-NEXT:    addl $12, %ebp
-; CHECK-NEXT:    movl %esp, -28(%ebp)
-; CHECK-NEXT:    movl -32(%ebp), %ecx
-; CHECK-NEXT:    movl $2, -16(%ebp)
-; CHECK-NEXT:    calll _cleanup
-; CHECK-NEXT:    movl $LBB0_3, %eax
-; CHECK-NEXT:    popl %ebp
-; CHECK-NEXT:    retl # CATCHRET
-; CHECK-NEXT:    .def "?dtor$5@?0?pr66984@4HA";
-; CHECK-NEXT:    .scl 3;
-; CHECK-NEXT:    .type 32;
-; CHECK-NEXT:    .endef
-; CHECK-NEXT:    .p2align 4, 0x90
-; CHECK-NEXT:  "?dtor$5@?0?pr66984@4HA":
-; CHECK-NEXT:  LBB0_5: # %bb8
-; CHECK-NEXT:    pushl %ebp
-; CHECK-NEXT:    addl $12, %ebp
-; CHECK-NEXT:    movl 8(%ebp), %eax
-; CHECK-NEXT:    movl %eax, -32(%ebp)
-; CHECK-NEXT:    leal -32(%ebp), %ecx
-; CHECK-NEXT:    calll _foo
-; CHECK-NEXT:    popl %ebp
-; CHECK-NEXT:    retl # CLEANUPRET
-; CHECK-NEXT:  Lfunc_end0:
-bb:
-  %a1 = alloca ptr, align 4
-  %a2 = alloca ptr, align 4
-  call void @llvm.lifetime.start.p0(i64 4, ptr nonnull %a2)
-  invoke void @throw()
-          to label %bb14 unwind label %bb8
-
-bb8:                                              ; preds = %bb7
-  %i9 = cleanuppad within none []
-  call void @llvm.lifetime.start.p0(i64 4, ptr nonnull %a1)
-  store ptr %arg, ptr %a1, align 4
-  call fastcc void @foo(ptr %a1) [ "funclet"(token %i9) ]
-  call void @llvm.lifetime.end.p0(i64 4, ptr nonnull %a1)
-  cleanupret from %i9 unwind label %bb15
-
-bb14:                                             ; preds = %bb7
-  unreachable
-
-bb15:                                             ; preds = %bb13, %bb5
-  %cs = catchswitch within none [label %bb17] unwind to caller
-
-bb17:                                             ; preds = %bb15
-  %cp = catchpad within %cs [ptr @type_info, i32 8, ptr %a2]
-  %p = load ptr, ptr %a2, align 4
-  call fastcc void @cleanup(ptr %p) [ "funclet"(token %cp) ]
-  catchret from %cp to label %exit
-
-exit:
-  call void @llvm.lifetime.end.p0(i64 4, ptr nonnull %a2)
-  ret void
-}
-
-declare i32 @__CxxFrameHandler3(...)
-declare void @throw()
-declare void @cleanup(ptr)
-declare void @foo(ptr)
-declare void @llvm.lifetime.start.p0(i64 immarg, ptr nocapture)
-declare void @llvm.lifetime.end.p0(i64 immarg, ptr nocapture)
diff --git a/llvm/test/CodeGen/X86/stack-coloring-wineh.ll b/llvm/test/CodeGen/X86/stack-coloring-wineh.ll
new file mode 100644 (file)
index 0000000..892c81a
--- /dev/null
@@ -0,0 +1,109 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 3
+; RUN: llc -mtriple=i686-windows-msvc < %s | FileCheck %s
+
+@type_info = external global ptr
+
+; Make sure %a1 and %a2 don't share the same stack offset.
+define void @pr66984(ptr %arg) personality ptr @__CxxFrameHandler3 {
+; CHECK-LABEL: pr66984:
+; CHECK:       # %bb.0: # %bb
+; CHECK-NEXT:    pushl %ebp
+; CHECK-NEXT:    movl %esp, %ebp
+; CHECK-NEXT:    pushl %ebx
+; CHECK-NEXT:    pushl %edi
+; CHECK-NEXT:    pushl %esi
+; CHECK-NEXT:    subl $24, %esp
+; CHECK-NEXT:    movl %esp, -28(%ebp)
+; CHECK-NEXT:    movl $-1, -16(%ebp)
+; CHECK-NEXT:    leal -24(%ebp), %eax
+; CHECK-NEXT:    movl $___ehhandler$pr66984, -20(%ebp)
+; CHECK-NEXT:    movl %fs:0, %ecx
+; CHECK-NEXT:    movl %ecx, -24(%ebp)
+; CHECK-NEXT:    movl %eax, %fs:0
+; CHECK-NEXT:    movl $1, -16(%ebp)
+; CHECK-NEXT:    calll _throw
+; CHECK-NEXT:  # %bb.1: # %bb14
+; CHECK-NEXT:  LBB0_3: # Block address taken
+; CHECK-NEXT:    # %bb17
+; CHECK-NEXT:    addl $12, %ebp
+; CHECK-NEXT:    jmp LBB0_4
+; CHECK-NEXT:  LBB0_4: # %exit
+; CHECK-NEXT:  $ehgcr_0_4:
+; CHECK-NEXT:    movl -24(%ebp), %eax
+; CHECK-NEXT:    movl %eax, %fs:0
+; CHECK-NEXT:    addl $24, %esp
+; CHECK-NEXT:    popl %esi
+; CHECK-NEXT:    popl %edi
+; CHECK-NEXT:    popl %ebx
+; CHECK-NEXT:    popl %ebp
+; CHECK-NEXT:    retl
+; CHECK-NEXT:    .def "?catch$2@?0?pr66984@4HA";
+; CHECK-NEXT:    .scl 3;
+; CHECK-NEXT:    .type 32;
+; CHECK-NEXT:    .endef
+; CHECK-NEXT:    .p2align 4, 0x90
+; CHECK-NEXT:  "?catch$2@?0?pr66984@4HA":
+; CHECK-NEXT:  LBB0_2: # %bb17
+; CHECK-NEXT:    pushl %ebp
+; CHECK-NEXT:    addl $12, %ebp
+; CHECK-NEXT:    movl %esp, -28(%ebp)
+; CHECK-NEXT:    movl -36(%ebp), %ecx
+; CHECK-NEXT:    movl $2, -16(%ebp)
+; CHECK-NEXT:    calll _cleanup
+; CHECK-NEXT:    movl $LBB0_3, %eax
+; CHECK-NEXT:    popl %ebp
+; CHECK-NEXT:    retl # CATCHRET
+; CHECK-NEXT:    .def "?dtor$5@?0?pr66984@4HA";
+; CHECK-NEXT:    .scl 3;
+; CHECK-NEXT:    .type 32;
+; CHECK-NEXT:    .endef
+; CHECK-NEXT:    .p2align 4, 0x90
+; CHECK-NEXT:  "?dtor$5@?0?pr66984@4HA":
+; CHECK-NEXT:  LBB0_5: # %bb8
+; CHECK-NEXT:    pushl %ebp
+; CHECK-NEXT:    addl $12, %ebp
+; CHECK-NEXT:    movl 8(%ebp), %eax
+; CHECK-NEXT:    movl %eax, -32(%ebp)
+; CHECK-NEXT:    leal -32(%ebp), %ecx
+; CHECK-NEXT:    calll _foo
+; CHECK-NEXT:    popl %ebp
+; CHECK-NEXT:    retl # CLEANUPRET
+; CHECK-NEXT:  Lfunc_end0:
+bb:
+  %a1 = alloca ptr, align 4
+  %a2 = alloca ptr, align 4
+  call void @llvm.lifetime.start.p0(i64 4, ptr nonnull %a2)
+  invoke void @throw()
+          to label %bb14 unwind label %bb8
+
+bb8:                                              ; preds = %bb7
+  %i9 = cleanuppad within none []
+  call void @llvm.lifetime.start.p0(i64 4, ptr nonnull %a1)
+  store ptr %arg, ptr %a1, align 4
+  call fastcc void @foo(ptr %a1) [ "funclet"(token %i9) ]
+  call void @llvm.lifetime.end.p0(i64 4, ptr nonnull %a1)
+  cleanupret from %i9 unwind label %bb15
+
+bb14:                                             ; preds = %bb7
+  unreachable
+
+bb15:                                             ; preds = %bb13, %bb5
+  %cs = catchswitch within none [label %bb17] unwind to caller
+
+bb17:                                             ; preds = %bb15
+  %cp = catchpad within %cs [ptr @type_info, i32 8, ptr %a2]
+  %p = load ptr, ptr %a2, align 4
+  call fastcc void @cleanup(ptr %p) [ "funclet"(token %cp) ]
+  catchret from %cp to label %exit
+
+exit:
+  call void @llvm.lifetime.end.p0(i64 4, ptr nonnull %a2)
+  ret void
+}
+
+declare i32 @__CxxFrameHandler3(...)
+declare void @throw()
+declare void @cleanup(ptr)
+declare void @foo(ptr)
+declare void @llvm.lifetime.start.p0(i64 immarg, ptr nocapture)
+declare void @llvm.lifetime.end.p0(i64 immarg, ptr nocapture)