[DAGCombiner] Add more rules to fold shuffles.
authorAndrea Di Biagio <Andrea_DiBiagio@sn.scee.net>
Tue, 15 Jul 2014 13:26:28 +0000 (13:26 +0000)
committerAndrea Di Biagio <Andrea_DiBiagio@sn.scee.net>
Tue, 15 Jul 2014 13:26:28 +0000 (13:26 +0000)
commitbd5555cc3f1c0d31c96511c6e041a8f1b2f34302
treed1a8ed5ced1fe463c05d7a88fc1c6990b8c042cf
parent2b584f3cab7ce5be6f7e6edad6ec81193505e5a5
[DAGCombiner] Add more rules to fold shuffles.

This patch adds two new rules to the DAGCombiner:
 1.  shuffle (shuffle A, Undef, M0), B, M1 -> shuffle A, B, M2
 2.  shuffle (shuffle A, Undef, M0), A, M1 -> shuffle A, Undef, M2

We only do this if the combined shuffle is legal for the target.

Example:
;;
define <4 x float> @test(<4 x float> %a, <4 x float> %b) {
  %1 = shufflevector <4 x float> %a, <4 x float> undef, <4 x i32><i32 6, i32 0, i32 1, i32 7>
  %2 = shufflevector <4 x float> %1, <4 x float> %b, <4 x i32><i32 1, i32 2, i32 4, i32 5>
  ret <4 x i32> %2
}
;;

(using llc -mcpu=corei7 -march=x86-64)
Before, the x86 backend generated:
  pshufd $120, %xmm0, %xmm0
  shufps $-108, %xmm0, %xmm1
  movaps %xmm1, %xmm0

Now the x86 backend generates:
  movsd %xmm1, %xmm0

llvm-svn: 213069
llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
llvm/test/CodeGen/X86/combine-vec-shuffle-4.ll [new file with mode: 0644]