
GPU高性能計算培訓(xùn)
GPU離性能計算一
OpenACC編程基礎(chǔ)
與優(yōu)化進(jìn)階
1. OpenACC基礎(chǔ):概念、與CUDA區(qū)別、編譯器、生態(tài);共享存儲結(jié)
2.0penACC開發(fā)環(huán)境搭建配置
3.0penACC四步開發(fā)流程:判斷并行性、并行化表達(dá)、顯式數(shù)據(jù)傳遂、優(yōu)化
?判斷并行性:Profile工具pgprof
?并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop
?顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data
?優(yōu)化:統(tǒng)一內(nèi)存管理、線程并行層級、collapse、tile
OpenACC上機(jī)實操
? Hellow world ?矢量點乘
GPU高性能計S—
CUDA編程基礎(chǔ)
與優(yōu)化進(jìn)階
1. CUDA基礎(chǔ):API、數(shù)據(jù)并行、線程模型、存儲播型、控制、同步、并發(fā)和通信、加
速比
2. CUDA幵發(fā)環(huán)境搭建和工具配置
3. CUDA優(yōu)化進(jìn)階:線程組織調(diào)度、分支語句、訪存優(yōu)化、數(shù)據(jù)傳輸、原子操作
4. GPU并行計算模式及案例分析
分析調(diào)試:parallel nsight、visual profiler、cuda-gdb
5. CUDA生態(tài)系統(tǒng)和相關(guān)專業(yè)領(lǐng)域軟件介紹
GPU高性能計算一
深度學(xué)習(xí)
1.深度學(xué)習(xí)GPU解決方案:
? 基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺:DIGITS
? 深度學(xué)習(xí)框架的GPU加速:TensorFlow、Caffe等
? NVIDIA深度學(xué)習(xí) SDK:cuDNN, TensorRT, NCCL, CUDA-X
? 深度學(xué)習(xí)顯卡選擇