[InstCombine] Generate better code for std::bit_floor from libstdc++
authorKazu Hirata <kazu@google.com>
Sat, 15 Apr 2023 18:32:33 +0000 (11:32 -0700)
committerKazu Hirata <kazu@google.com>
Sat, 15 Apr 2023 18:32:33 +0000 (11:32 -0700)
commitd775fc390d3c78cc81872e276c4b1314f19af577
tree5d25566823ba8d7ba9cbc4aed5602b4549a098ec
parent44d38022ab29a3156349602733b3459df5beef93
[InstCombine] Generate better code for std::bit_floor from libstdc++

Without this patch, std::bit_floor<uint32_t> in libstdc++ is compiled
as:

  %eq0 = icmp eq i32 %x, 0
  %lshr = lshr i32 %x, 1
  %ctlz = tail call i32 @llvm.ctlz.i32(i32 %lshr, i1 false)
  %sub = sub i32 32, %ctlz
  %shl = shl i32 1, %sub
  %sel = select i1 %eq0, i32 0, i32 %shl

With this patch:

  %eq0 = icmp eq i32 %x, 0
  %ctlz = call i32 @llvm.ctlz.i32(i32 %x, i1 false)
  %lshr = lshr i32 -2147483648, %1
  %sel = select i1 %eq0, i32 0, i32 %lshr

This patch recognizes the specific pattern emitted for std::bit_floor
in libstdc++.

https://alive2.llvm.org/ce/z/piMdFX

This patch fixes:

https://github.com/llvm/llvm-project/issues/61183

Differential Revision: https://reviews.llvm.org/D145890
llvm/lib/Transforms/InstCombine/InstCombineSelect.cpp
llvm/test/Transforms/InstCombine/bit_floor.ll