review.tizen.org Git - platform/upstream/llvm.git/commit

projects / platform / upstream / llvm.git / commit

author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Sun, 23 Apr 2023 10:48:50 +0000 (11:48 +0100)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Sun, 23 Apr 2023 10:48:50 +0000 (11:48 +0100)
commit	e9f9467da063875bd684e46660e2ff36ba4f55e2
tree	c2050da494466a58a5b14c07d002bd6019683cf3	tree \| snapshot
parent	b92839c9548a55bc7a3267b05d11c9d9c530b792	commit \| diff

[X86] X86FixupInstTunings - add VPERMILPDri -> VSHUFPDrri mapping

Similar to the original VPERMILPSri -> VSHUFPSrri mapping added in D143787, replacing VPERMILPDri -> VSHUFPDrri should never be any slower and saves an encoding byte.

The sibling VPERMILPDmi -> VPSHUFDmi mapping is trickier as we need the same shuffle mask in every lane (and it needs to be adjusted) - I haven't attempted that yet but we can investigate it in the future if there's interest.

Fixes #61060

Differential Revision: https://reviews.llvm.org/D148999

72 files changed:

llvm/lib/Target/X86/X86FixupInstTuning.cpp		diff \| blob \| history
llvm/test/CodeGen/X86/avx-intrinsics-fast-isel.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx-intrinsics-x86-upgrade.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx-intrinsics-x86.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx-vbroadcast.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512-cvt.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512-hadd-hsub.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512-intrinsics-fast-isel.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512-intrinsics-upgrade.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512-shuffles/in_lane_permute.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512fp16-mov.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512fp16-mscatter.ll		diff \| blob \| history
llvm/test/CodeGen/X86/avx512vl-intrinsics-upgrade.ll		diff \| blob \| history
llvm/test/CodeGen/X86/combine-and.ll		diff \| blob \| history
llvm/test/CodeGen/X86/complex-fastmath.ll		diff \| blob \| history
llvm/test/CodeGen/X86/copy-low-subvec-elt-to-high-subvec-elt.ll		diff \| blob \| history
llvm/test/CodeGen/X86/extract-concat.ll		diff \| blob \| history
llvm/test/CodeGen/X86/fmaddsub-combine.ll		diff \| blob \| history
llvm/test/CodeGen/X86/fmf-reduction.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub-2.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub-3.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub-broadcast.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub-shuf.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub-undef.ll		diff \| blob \| history
llvm/test/CodeGen/X86/haddsub.ll		diff \| blob \| history
llvm/test/CodeGen/X86/half.ll		diff \| blob \| history
llvm/test/CodeGen/X86/horizontal-reduce-fadd.ll		diff \| blob \| history
llvm/test/CodeGen/X86/horizontal-sum.ll		diff \| blob \| history
llvm/test/CodeGen/X86/known-signbits-vector.ll		diff \| blob \| history
llvm/test/CodeGen/X86/load-partial-dot-product.ll		diff \| blob \| history
llvm/test/CodeGen/X86/matrix-multiply.ll		diff \| blob \| history
llvm/test/CodeGen/X86/oddshuffles.ll		diff \| blob \| history
llvm/test/CodeGen/X86/pr40730.ll		diff \| blob \| history
llvm/test/CodeGen/X86/scalar-int-to-fp.ll		diff \| blob \| history
llvm/test/CodeGen/X86/scalarize-fp.ll		diff \| blob \| history
llvm/test/CodeGen/X86/shuffle-of-splat-multiuses.ll		diff \| blob \| history
llvm/test/CodeGen/X86/sse-scalar-fp-arith.ll		diff \| blob \| history
llvm/test/CodeGen/X86/sse2-intrinsics-fast-isel.ll		diff \| blob \| history
llvm/test/CodeGen/X86/sse3-avx-addsub-2.ll		diff \| blob \| history
llvm/test/CodeGen/X86/tuning-shuffle-permilpd-avx512.ll		diff \| blob \| history
llvm/test/CodeGen/X86/tuning-shuffle-permilpd.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vec-strict-fptoint-128.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vec-strict-fptoint-256.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vec-strict-fptoint-512.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vec_fp_to_int.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-half-conversions.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleave.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-load-i32-stride-5.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-store-i32-stride-3.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-store-i32-stride-4.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-store-i32-stride-5.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-store-i64-stride-3.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-interleaved-store-i64-stride-7.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-narrow-binop.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fadd-fast.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fadd.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmax-fmin-fast.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmax-nnan.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmax.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmin-nnan.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmin.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmul-fast.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-reduce-fmul.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-128-v2.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-256-v4.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-256-v8.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-512-v16.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-512-v8.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-combining-avx.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-combining-xop.ll		diff \| blob \| history
llvm/test/CodeGen/X86/vector-shuffle-combining.ll		diff \| blob \| history
llvm/test/CodeGen/X86/x86-interleaved-access.ll		diff \| blob \| history

Domain: System / Toolchain;

RSS Atom