[MLIR][GPU] Add debug output to enable dumping GPU assembly
authorKrzysztof Drewniak <Krzysztof.Drewniak@amd.com>
Mon, 10 Jan 2022 23:53:58 +0000 (23:53 +0000)
committerKrzysztof Drewniak <Krzysztof.Drewniak@amd.com>
Thu, 20 Jan 2022 20:52:12 +0000 (20:52 +0000)
commit40aef79db0b02b171a65b3a13053ae963a3e8753
treebe83c75eb1477f6d8a3221635a213da1f80dc982
parent118babe67adfe3eed1a6d89e3c2d5a70ba8322a4
[MLIR][GPU] Add debug output to enable dumping GPU assembly

- Set the DEBUG_TYPE of SerializeToBlob to serialize-to-blob
- Add debug output to print the assembly or PTX for GPU modules before
  they are assembled and linked

Note that, as SerializeToBlob is a superclass of SerializeToCubin and
SerializeToHsaco, --debug-only=serialize-to-blom will dump the
intermediate compiler result for both of these passes.

In addition, if LLVM options such as --stop-after are used to control
the GPU kernel compilation process, the debug output will contain the
appropriate intermediate IR.

Reviewed By: herhut

Differential Revision: https://reviews.llvm.org/D117519
mlir/include/mlir/Dialect/GPU/Passes.h
mlir/lib/Dialect/GPU/Transforms/SerializeToBlob.cpp
mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp