CUDA入門
1. GPU并行計算
2. 深度學習與GPU:
(1)深度學習介紹以及GPU在其中的作用
(2)caffe框架介紹及mnist訓練和測試講解
3. GPU體系架構
4. OpenMP介紹
5. CUDA環境搭建
CUDA入門
1. CUDA C編程基礎
(1)CUDA編程模式:block和thread
(2)CUDA存儲模式:global memory/shared memory
(3)CUDA C關鍵字及內核調用
(4)示例:向量加法
(5)課上練習:矩陣加法
2. CUDA線程調度
3. CUDA調試方法
4. 課上練習:調試方法練習
CUDA高級編程
1. 存儲器優化技巧:
(1)矩陣乘法-global memory
(2)矩陣乘法-shared memory
2. 訪存優化:bank conflict,bandwidth
3. 流與事件
4. 多GPU編程
5. 測試時間方法
6. 課上練習:
CUDA高級編程
1. 并行算法設計的一般原則
2. 并行算法設計方法
3. 優化技巧實戰:卷積計算step by step優化性能
4. 調優工具:NSight分析性能瓶頸
|