[X86][AVX] truncateVectorWithPACK - avoid bitcasted shuffles

author Simon Pilgrim <llvm-dev@redking.me.uk>

Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)

committer Simon Pilgrim <llvm-dev@redking.me.uk>

Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)
author Simon Pilgrim <llvm-dev@redking.me.uk>
Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)
committer Simon Pilgrim <llvm-dev@redking.me.uk>
Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp

index 31c795c47d0ba41253eaba8104efa314688abdea..0639940bf025822ce473af8d13054b4b9e5aa896 100644 (file)
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -18766,8 +18766,11 @@ static SDValue truncateVectorWithPACK(unsigned Opcode, EVT DstVT, SDValue In,
  
      // 256-bit PACK(ARG0, ARG1) leaves us with ((LO0,LO1),(HI0,HI1)),
      // so we need to shuffle to get ((LO0,HI0),(LO1,HI1)).
-    Res = DAG.getBitcast(MVT::v4i64, Res);
-    Res = DAG.getVectorShuffle(MVT::v4i64, DL, Res, Res, {0, 2, 1, 3});
+    // Scale shuffle mask to avoid bitcasts and help ComputeNumSignBits.
+    SmallVector<int, 64> Mask;
+    int Scale = 64 / OutVT.getScalarSizeInBits();
+    scaleShuffleMask<int>(Scale, makeArrayRef<int>({ 0, 2, 1, 3 }), Mask);
+    Res = DAG.getVectorShuffle(OutVT, DL, Res, Res, Mask);
  
      if (DstVT.is256BitVector())
        return DAG.getBitcast(DstVT, Res);
diff --git a/llvm/test/CodeGen/X86/bitcast-setcc-512.ll b/llvm/test/CodeGen/X86/bitcast-setcc-512.ll

index 177be1fd6a69543fc18aac88bb3dad6eb51ae1ec..9f5097bab3c6a1ebf3e75aa1dc529d23de6a1bd8 100644 (file)
--- a/llvm/test/CodeGen/X86/bitcast-setcc-512.ll
+++ b/llvm/test/CodeGen/X86/bitcast-setcc-512.ll
@@ -624,9 +624,6 @@ define void @bitcast_8i64_store(i8* %p, <8 x i64> %a0) {
  ;
  ; AVX2-LABEL: bitcast_8i64_store:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
diff --git a/llvm/test/CodeGen/X86/bitcast-vector-bool.ll b/llvm/test/CodeGen/X86/bitcast-vector-bool.ll

index adcee2abe33b6eff4f1342bbef6043a75a2e2539..1e402ae0e7123d3e8040b178d02e915d757144ff 100644 (file)
--- a/llvm/test/CodeGen/X86/bitcast-vector-bool.ll
+++ b/llvm/test/CodeGen/X86/bitcast-vector-bool.ll
@@ -539,9 +539,6 @@ define i4 @bitcast_v8i64_to_v2i4(<8 x i64> %a0) nounwind {
  ;
  ; AVX2-LABEL: bitcast_v8i64_to_v2i4:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
diff --git a/llvm/test/CodeGen/X86/movmsk-cmp.ll b/llvm/test/CodeGen/X86/movmsk-cmp.ll

index 6f7ec7d3a207f37d04d77eeb84bdc8b11dd2f259..c144ca6183d7cec740b00879bc13b3bc32d446ce 100644 (file)
--- a/llvm/test/CodeGen/X86/movmsk-cmp.ll
+++ b/llvm/test/CodeGen/X86/movmsk-cmp.ll
@@ -1079,9 +1079,6 @@ define i1 @allones_v8i64_sign(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allones_v8i64_sign:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
@@ -1180,9 +1177,6 @@ define i1 @allzeros_v8i64_sign(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allzeros_v8i64_sign:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
@@ -2515,11 +2509,8 @@ define i1 @allones_v8i64_and1(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allones_v8i64_and1:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
  ; AVX2-NEXT:    vpsllq $63, %ymm1, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
  ; AVX2-NEXT:    vpsllq $63, %ymm0, %ymm0
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
@@ -2589,11 +2580,8 @@ define i1 @allzeros_v8i64_and1(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allzeros_v8i64_and1:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
  ; AVX2-NEXT:    vpsllq $63, %ymm1, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
  ; AVX2-NEXT:    vpsllq $63, %ymm0, %ymm0
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
@@ -3926,11 +3914,8 @@ define i1 @allones_v8i64_and4(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allones_v8i64_and4:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
  ; AVX2-NEXT:    vpsllq $61, %ymm1, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
  ; AVX2-NEXT:    vpsllq $61, %ymm0, %ymm0
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
@@ -4000,11 +3985,8 @@ define i1 @allzeros_v8i64_and4(<8 x i64> %arg) {
  ;
  ; AVX2-LABEL: allzeros_v8i64_and4:
  ; AVX2:       # %bb.0:
-; AVX2-NEXT:    vpxor %xmm2, %xmm2, %xmm2
  ; AVX2-NEXT:    vpsllq $61, %ymm1, %ymm1
-; AVX2-NEXT:    vpcmpgtq %ymm1, %ymm2, %ymm1
  ; AVX2-NEXT:    vpsllq $61, %ymm0, %ymm0
-; AVX2-NEXT:    vpcmpgtq %ymm0, %ymm2, %ymm0
  ; AVX2-NEXT:    vpackssdw %ymm1, %ymm0, %ymm0
  ; AVX2-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
  ; AVX2-NEXT:    vmovmskps %ymm0, %eax
author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Wed, 26 Jun 2019 09:50:11 +0000 (09:50 +0000)
llvm/lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
llvm/test/CodeGen/X86/bitcast-setcc-512.ll		patch \| blob \| history
llvm/test/CodeGen/X86/bitcast-vector-bool.ll		patch \| blob \| history
llvm/test/CodeGen/X86/movmsk-cmp.ll		patch \| blob \| history