[CodeGenPrepare] use branch weight metadata to decide if a select should be turned...
authorSanjay Patel <spatel@rotateright.com>
Tue, 26 Apr 2016 17:11:17 +0000 (17:11 +0000)
committerSanjay Patel <spatel@rotateright.com>
Tue, 26 Apr 2016 17:11:17 +0000 (17:11 +0000)
commitd66607bd8cd137e6c90b46ac6d4979c6942ea427
tree70a0aaa54c79b02809ba8d87dcc1a309fc6c11c8
parentce36c1f2ec83581d4a83b6f5f012287368a6c951
[CodeGenPrepare] use branch weight metadata to decide if a select should be turned into a branch

This is part of solving PR27344:
https://llvm.org/bugs/show_bug.cgi?id=27344

CGP should undo the SimplifyCFG transform for the same reason that earlier patches have used this
same mechanism: it's possible that passes between SimplifyCFG and CGP may be able to optimize the
IR further with a select in place.

For the TLI hook default, >99% taken or not taken is chosen as the default threshold for a highly
predictable branch. Even the most limited HW branch predictors will be correct on this branch almost
all the time, so even a massive mispredict penalty perf loss would be overcome by the win from all
the times the branch was predicted correctly.

As a follow-up, we could make the default target hook less conservative by using the SchedMachineModel's
MispredictPenalty. Or we could just let targets override the default by implementing the hook with that
and other target-specific options. Note that trying to statically determine mispredict rates for
close-to-balanced profile weight data is generally impossible if the HW is sufficiently advanced. Ie,
50/50 taken/not-taken might still be 100% predictable.

Finally, note that this patch as-is will not solve PR27344 because the current __builtin_unpredictable()
branch weight default values are 4 and 64. A proposal to change that is in D19435.

Differential Revision: http://reviews.llvm.org/D19488

llvm-svn: 267572
llvm/include/llvm/IR/Instruction.h
llvm/include/llvm/IR/Instructions.h
llvm/include/llvm/Target/TargetLowering.h
llvm/lib/CodeGen/CodeGenPrepare.cpp
llvm/lib/CodeGen/TargetLoweringBase.cpp
llvm/lib/IR/Instructions.cpp
llvm/lib/IR/Metadata.cpp
llvm/test/CodeGen/X86/cmov-into-branch.ll