./launch.sh
-
第一章 概述
-
第二章 张量程序抽象(TensorIR)
- 张量元函数(tvm.script.tir.prim_func)
- IRModule(tvm.ir.module.IRModule)
- Schedule(tvm.tir.Schedule)
- 编译运行IRModule(tvm.build)
- 张量表达式(tvm.te)
-
第三章 端到端模型执行(relax)
- tvm.script.relax.function(call_tir)
- extern prim_func
- bind params(tvm.relax.transform.BindParams)
-
第四章 自动程序优化(meta_schedule)
- sample_perfect_tile
- tune_tir
- space_generator
- 替换IRModule中的prim_func(update_func)
-
第五章 与机器学习框架整合(torch.fx)
- 张量表达式(tvm.te)
- BlockBuilder
- map call_function
- map call_module
- map to relax(暂时还不能build,需要先lowering到prim_func)
-
第七章 计算图优化
- tvm.relax.PyExprMutator
- lowering
- fuse tir
-
第六章 GPU硬件加速
-
GPU常规优化
- GPU线程绑定
- GPU优化之Tile
- GPU优化之Shared Memory(Cooperative Data Fetching)
-
专有设备优化(TensorCore)
- register storage
- tensorcore extern call
- lowering
-