[AMDGPU] Fix infinite loop with fma combines
authorAustin Kerbow <Austin.Kerbow@amd.com>
Tue, 4 Feb 2020 01:08:26 +0000 (17:08 -0800)
committerAustin Kerbow <Austin.Kerbow@amd.com>
Tue, 4 Feb 2020 21:11:09 +0000 (13:11 -0800)
commit0f116fd9d86da3bb7f99f617284c3f562b6711af
tree046bce763b882f5088b65b805a66985ba986a2a9
parentdd921cb89b9d9011155625c094fd12fbe5be7892
[AMDGPU] Fix infinite loop with fma combines

https://reviews.llvm.org/D72312 introduced an infinite loop which involves
DAGCombiner::visitFMA and AMDGPUTargetLowering::performFNegCombine.

fma( a, fneg(b), fneg(c) ) => fneg( fma (a, b, c) ) => fma( a, fneg(b), fneg(c) ) ...

This only breaks with types where 'isFNegFree' returns flase, e.g. v4f32.
Reproducing the issue also needs the attribute 'no-signed-zeros-fp-math',
and no source mods allowed on one of the users of the Op.

This fix makes changes to indicate that it is not free to negate a fma if it
has users with source mods.

Differential Revision: https://reviews.llvm.org/D73939
llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp
llvm/lib/Target/AMDGPU/AMDGPUISelLowering.h
llvm/test/CodeGen/AMDGPU/fma-combine.ll
llvm/test/CodeGen/AMDGPU/fneg-combines.ll