课程简介#
授课教师:王鹏帅(助理教授),楚梦渝(助理教授),梁一韬(助理教授)
课程参考书:
第一个 PyTorch 程序#
对于编写第一个PyTorch程序,推荐以下资源:
第一个 CUDA 程序#
GPU 硬件实现#
并行编程算法#
本课程讲解的并行算法有:Reduce、Scan、Transpose、Compact、Sort 等等。
Transpose#
An Efficient Matrix Transpose in CUDA C/C++ | NVIDIA Technical Blog