[NVPTX] Enhance vectorization of ld.param & st.param
authorDaniil Kovalev <daniil@kovalev.website>
Thu, 24 Mar 2022 09:34:25 +0000 (12:34 +0300)
committerDaniil Kovalev <daniil@kovalev.website>
Thu, 24 Mar 2022 09:36:52 +0000 (12:36 +0300)
commit828b63c309439d3b0915205f1e5a159c69cb36b8
tree844e7b2ecd0f8043e441f08e420a177405f31dea
parent2af845a6519c9cde5c8f58db5554f8b1084ce1ed
[NVPTX] Enhance vectorization of ld.param & st.param

Since function parameters and return values are passed via param space, we
can force special alignment for values hold in it which will add vectorization
options. This change may be done if the function has private or internal
linkage. Special alignment is forced during 2 phases.

1) Instruction selection lowering. Here we use special alignment for function
   prototypes (changing both own return value and parameters alignment), call
   lowering (changing both callee's return value and parameters alignment).

2) IR pass nvptx-lower-args. Here we change alignment of byval parameters that
   belong to param space (or are casted to it). We only handle cases when all
   uses of such parameters are loads from it. For such loads, we can change the
   alignment according to special type alignment and the load offset. Then,
   load-store-vectorizer IR pass will perform vectorization where alignment
   allows it.

Special alignment calculated as maximum from default ABI type alignment and
alignment 16. Alignment 16 is chosen because it's the maximum size of
vectorized ld.param & st.param.

Before specifying such special alignment, we should check if it is a multiple
of the alignment that the type already has. For example, if a value has an
enforced alignment of 64, default ABI alignment of 4 and special alignment
of 16, we should preserve 64.

This patch will be followed by a refactoring patch that removes duplicating
code in handling byval and non-byval arguments.

Differential Revision: https://reviews.llvm.org/D120129
clang/test/CodeGenCUDA/device-fun-linkage.cu
llvm/lib/Target/NVPTX/NVPTXAsmPrinter.cpp
llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
llvm/lib/Target/NVPTX/NVPTXISelLowering.h
llvm/lib/Target/NVPTX/NVPTXLowerArgs.cpp
llvm/test/CodeGen/NVPTX/param-vectorize-device.ll [new file with mode: 0644]
llvm/test/CodeGen/NVPTX/param-vectorize-kernel.ll [new file with mode: 0644]