[X86][AVX] Fix wrong lowering of v4x64 shuffles into concat_vector plus extract_subve...
authorAndrea Di Biagio <Andrea_DiBiagio@sn.scee.net>
Fri, 13 Mar 2015 17:29:49 +0000 (17:29 +0000)
committerAndrea Di Biagio <Andrea_DiBiagio@sn.scee.net>
Fri, 13 Mar 2015 17:29:49 +0000 (17:29 +0000)
commit510feca1b86530f4c48fb69180a612cdb47fcaf2
treee78d72aa78597f7524f29d25665ddf70bf5837ca
parent76e37aa334f72d842e779b5014d1b1875f2d21a7
[X86][AVX] Fix wrong lowering of v4x64 shuffles into concat_vector plus extract_subvector nodes.

This patch fixes a bug in the shuffle lowering logic implemented by function
'lowerV2X128VectorShuffle'.

The are few cases where function 'lowerV2X128VectorShuffle' wrongly expands a
shuffle of two v4X64 vectors into a CONCAT_VECTORS of two EXTRACT_SUBVECTOR
nodes. The problematic expansion only occurs when the shuffle mask M has an
'undef' element at position 2, and M is equivalent to mask <0,1,4,5>.
In that case, the algorithm propagates the wrong vector to one of the two
new EXTRACT_SUBVECTOR nodes.

Example:
;;
define <4 x double> @test(<4 x double> %A, <4 x double> %B) {
entry:
  %0 = shufflevector <4 x double> %A, <4 x double> %B, <4 x i32><i32 undef, i32 1, i32 undef, i32 5>
  ret <4 x double> %0
}
;;

Before this patch, llc (-mattr=+avx) generated:
  vinsertf128 $1, %xmm0, %ymm0, %ymm0

With this patch, llc correctly generates:
  vinsertf128 $1, %xmm1, %ymm0, %ymm0

Added test lower-vec-shuffle-bug.ll

Differential Revision: http://reviews.llvm.org/D8259

llvm-svn: 232179
llvm/lib/Target/X86/X86ISelLowering.cpp
llvm/test/CodeGen/X86/lower-vec-shuffle-bug.ll [new file with mode: 0644]