Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 268 Bytes

File metadata and controls

7 lines (4 loc) · 268 Bytes

文件结构

cpp_file目录里是kernel的实现,直接运行bench.py即可观察运行结果。

online-softmax目录里是softmax与V点积的优化实现,用cmake先build再运行即可。

可以尝试根据自己GPU的SRAM大小更改Br与Bc的值。