?近年來(lái),隨著深度學(xué)習(xí)的高速發(fā)展,大數(shù)據(jù)技術(shù)的普及,接下來(lái)緊接的會(huì)普及發(fā)展的想必就是硬件層面的配合,而GPU無(wú)疑是最重要的趨勢(shì)。過(guò)去幾年,計(jì)算領(lǐng)域我們目睹了英偉達(dá)(NVIDIA)公司帶來(lái)的變革。計(jì)算統(tǒng)一設(shè)備架構(gòu)(Compute Unified Device Architecture, CUDA)編程語(yǔ)言的引入,第一次使這些非常強(qiáng)大的圖形處理器為程序員日常所用,以應(yīng)對(duì)日益復(fù)雜的計(jì)算工作。從嵌入式設(shè)備行業(yè)到家庭用戶,再到超級(jí)計(jì)算機(jī),所有的一切都因此而改變。
? ???
計(jì)算機(jī)軟件界較大的變遷是從串行編程轉(zhuǎn)向了并行編程。其中,CUDA起到了重要的作用。究其本質(zhì),圖形處理單元(Graphics Processor Unit,GPU)是為高速圖形處理而設(shè)計(jì)的,它具有天然的并行性。CUDA采用了一種簡(jiǎn)單的數(shù)據(jù)并行模型,再結(jié)合編程模型,從而無(wú)需操縱復(fù)雜的圖形基元。
一. GPU與CUDA背景基礎(chǔ)介紹
第1部份 CUDA硬件環(huán)境,體系結(jié)構(gòu),軟件環(huán)境介紹,包括平臺(tái)、架構(gòu)、開(kāi)發(fā)工具和熱點(diǎn)技術(shù)
第2部份 并行編程介紹,CUDA核心概念,包括網(wǎng)格、線程塊,不同類型內(nèi)存的工作機(jī)制
二. CUDA編程基礎(chǔ)
第3部份 CUDA設(shè)備內(nèi)存、常量?jī)?nèi)存、共享內(nèi)存和紋理內(nèi)存,CUDA流和事件
第4部份 CUDA執(zhí)行模式、線程調(diào)度、內(nèi)核執(zhí)行和CUDA存儲(chǔ)器的使用
第5部份 CUDA流處理器簇、多GPU編程、紋理操作
三. CUDA性能優(yōu)化與設(shè)計(jì)
第6部份 CPU/GPU協(xié)同編程,串行/并行程序中提高并行度的常用策略
第7部份 流式負(fù)載以及使用GPU做應(yīng)用程序性能優(yōu)化常用策略
第8部份 在集群中使用CUDA
四. 實(shí)戰(zhàn)項(xiàng)目經(jīng)驗(yàn)
第9部份 應(yīng)用CUDA做高維數(shù)據(jù)處理
第10部份 CUDA+OpenGL做圖形渲染
第11部份 CPGPU實(shí)現(xiàn)視頻流實(shí)時(shí)光流跟蹤
第12部份 深度學(xué)習(xí)框架中的GPU應(yīng)用
|