Auto TensorCore CodeGen (#4234)
authorMinmin Sun (孙敏敏) <mmsun@foxmail.com>
Sat, 9 Nov 2019 21:01:36 +0000 (05:01 +0800)
committerTianqi Chen <tqchen@users.noreply.github.com>
Sat, 9 Nov 2019 21:01:36 +0000 (13:01 -0800)
commitd64bf6b51b1d720cd437bd356bd8aed9ef655575
treec8c0a0fca6651c7656962a063918bdf8fdeceaa0
parent281f643cd2b4cde9f5b9329aeb6b1a32b96f9dfe
Auto TensorCore CodeGen (#4234)

* Add Auto TensorCore TensorCore Unit Test

* Rebase to tvm master branch & Add auto tensor core

* Code Refine

* Add tensor core switch by pragma

* Add pragma in tensor core example code

* Get real tile size to replace hard coded 16

* support more than 2 dimensions (e.g. batchmatmul) for buffer bind scope

* support batch matmul

* Move cuda env check to tensor_core.cc

* Coderefine for tensor_core.cc

* Refine comments

* Some refinements of code and comment

* Update TensorCore UT to pass the CPU test

* remove redundant code

* matmul's storage align for different layout

* Add support for differenct position of type cast

* Add formal tutorial for auto tensorcore codegen

* move tensorcore check up to tutorial code

* code and doc refine

* comment out tune_and_evaluate in tutorial

* fix cpplint error
include/tvm/ir.h
include/tvm/ir_pass.h
python/tvm/build_module.py
src/api/api_pass.cc
src/pass/tensor_core.cc [new file with mode: 0644]
tests/python/unittest/test_pass_rewrite_for_tensor_core.py [new file with mode: 0644]
tutorials/optimize/opt_matmul_auto_tensorcore.py [new file with mode: 0644]