亚洲国产天堂久久综合226114,亚洲va中文字幕无码毛片,亚洲av无码片vr一区二区三区,亚洲av无码乱码在线观看,午夜爽爽爽男女免费观看影院

課程目錄:GPU高性能計算培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

          GPU高性能計算培訓(xùn)

 

 

 

GPU離性能計算一
OpenACC編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. OpenACC基礎(chǔ):概念、與CUDA區(qū)別、編譯器、生態(tài);共享存儲結(jié)
2.0penACC開發(fā)環(huán)境搭建配置

3.0penACC四步開發(fā)流程:判斷并行性、并行化表達(dá)、顯式數(shù)據(jù)傳遂、優(yōu)化

?判斷并行性:Profile工具pgprof

?并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop

?顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data

?優(yōu)化:統(tǒng)一內(nèi)存管理、線程并行層級、collapse、tile

OpenACC上機(jī)實操

? Hellow world ?矢量點乘

GPU高性能計S—
CUDA編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. CUDA基礎(chǔ):API、數(shù)據(jù)并行、線程模型、存儲播型、控制、同步、并發(fā)和通信、加
速比

2. CUDA幵發(fā)環(huán)境搭建和工具配置

3. CUDA優(yōu)化進(jìn)階:線程組織調(diào)度、分支語句、訪存優(yōu)化、數(shù)據(jù)傳輸、原子操作

4. GPU并行計算模式及案例分析

分析調(diào)試:parallel nsight、visual profiler、cuda-gdb

5. CUDA生態(tài)系統(tǒng)和相關(guān)專業(yè)領(lǐng)域軟件介紹

GPU高性能計算一
深度學(xué)習(xí)

1.深度學(xué)習(xí)GPU解決方案:

? 基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺:DIGITS
? 深度學(xué)習(xí)框架的GPU加速:TensorFlow、Caffe等
? NVIDIA深度學(xué)習(xí) SDK:cuDNN, TensorRT, NCCL, CUDA-X
? 深度學(xué)習(xí)顯卡選擇