青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Heath's Blog

There is no end, it is just the beginning! - A Game Developer's Notes

針對CUDA的GPU架構(gòu)知識與性能對比

     5年前將《GPU Gems 2》中的“Octree Textures on the GPU”用到了論文的實時紋理創(chuàng)作一節(jié),那時候CUDA才剛出生,OpenCL應(yīng)該還在規(guī)范階段,所以將GPU用于加速和通用計算的成熟方法還是compution by texturing。至于同樣的計算量在CPU和GPU上跑,性能到底提升多少,也沒有做過對比實驗。周末翻了下《CUDA by Example: An Introduction to General-Purpose GPU Programming》,基本掌握了用CUDA編寫GPU思想和語法,比起將數(shù)據(jù)做為紋理、Shader寫算法來,進(jìn)步了不少:1)開發(fā)人員不需要熟悉渲染管線及圖形API;2)不用花時間去搭建DX或者OpenGL的框架;3)Host與Device代碼混編;4)不必采用Hacking思想處理包裝成紋理的數(shù)據(jù);5)可指定參與計算的線程數(shù)。有了如此方便的編程環(huán)境,就隨手來做一下對比吧,這個例子來自《CUDA by Example》的4.2.2生成Julia集。

     測試代碼需要做一些調(diào)整,才能更好地體現(xiàn)出GPU的平行計算優(yōu)勢,這其中牽涉到支持CUDA的GPU架構(gòu)知識,在這里做一下梳理。

     在Nvidia推出Fermi架構(gòu)之前,支持CUDA的Nvidia顯示芯片都是由多個Streaming Multiprocessor(簡稱SM)組成,每個SM包含了八個Stream Processor(簡稱SP),每四個SP組成一個組,也就是說SM實際上可以看成包含兩組4D的SIMD處理器。此外,每個SM還包含Register、share memory、texture cache以及constant cache。在執(zhí)行 CUDA 程序的時候,每個SM對應(yīng)一個 block,而每個SP就是對應(yīng)一個 thread。雖然一個SM只有八個SP,但是由于SP進(jìn)行各種運算都有延遲,更不用提內(nèi)存存取的延遲了,因此 CUDA 在執(zhí)行程序的時候,實際是以 warp 為單位。目前的支持CUDA顯卡,一個 warp 里面有32個 threads,分成兩組16 threads的half-warp。由于SP的運算至少有4個時鐘周期的延遲,因此對一個4D的SP來說,一次至少執(zhí)行16個 threads(即 half-warp)才能有效覆蓋掉各種運算的延遲[1]。

Image

圖 1

     在GeForce GTX 400系列上,Nvidia采用了全新的Fermi架構(gòu)[2],之后的顯卡的Compute Capability也從1.3躍升至2.0。SP改名為CUDA Core,提升到了32個/SM[3]。圖2為Fermi核心演變,從GF104和由其發(fā)展起來的GF114、GF106、GF108的CUDA Core都上升到了48個/SM,支持2.1的Compute Capability,而GF100和GF110依舊是32個。最新基于Kepler架構(gòu)的GeForce GTX 680支持3.0的Compute Capability,CUDA Core數(shù)量達(dá)到了192個/SM。

Image(1)

圖 2

     由于測試平臺采用的是GTX 560 Ti,所以需要分析一下它的架構(gòu)。GTX 560 Ti由8個SM組成,下圖中,左邊是從程序獲取的設(shè)備屬性,右邊為單個SM內(nèi)部結(jié)構(gòu)示例圖。可以看到,GTX 560 Ti的每個SM配備了兩個Warp調(diào)度器,因此每個周期對兩個包含32個線程的Warp進(jìn)行分發(fā)。另外,對于一個二維圖像,為kernel指定2D的grid和block可使代碼更加直觀。為此,block采用(16,16),總共分配256個(64*4)threads在一個SM上執(zhí)行,如果需要產(chǎn)生1024*1024的Julia分形圖,則需要grid為(64,64)。

Image(2) Image(3)

圖 3

     測試平臺為:

Image(4)

     測試代碼說明:

     1)代碼分為CPU實現(xiàn)和CUDA實現(xiàn);

     2)均采用CPU計時方法;

     3)只針對計算部分測試,不包括內(nèi)存分配、傳輸以及文件寫入;

     下面列出main函數(shù)代碼,左邊為CPU實現(xiàn),右邊為CUDA實現(xiàn),均編譯為release版本。

Image(5)Image(6)

     測試結(jié)論:CPU版本耗時244ms,CUDA版本耗時2.1087ms。這可是100倍的效率提升啊。不過CPU版本沒有經(jīng)過多核優(yōu)化,所以這樣這樣對比實在不公平,但這卻凸顯出CUDA C將并行思想融入語言規(guī)則的優(yōu)勢。

out

     在驚訝GPU用作通用計算的執(zhí)行效率時,別忘了它還是有諸多應(yīng)用上的問題:

     1)初始化耗時,需要在顯存分配空間,然后將數(shù)據(jù)從內(nèi)存copy到顯存;
     2)數(shù)據(jù)量受GPU顯存限制;
     3)對本身就需要GPU參與運算的程序,如:3D游戲,通用計算會爭奪GPU資源,如果做平衡?
     4)計算數(shù)據(jù)之間的不相關(guān)性限制了GPU通用計算的應(yīng)用范圍;

     5)CPU算法到適合GPU架構(gòu)算法的移植;

     最后,GPU硬件設(shè)計本身就已經(jīng)決定了它的強(qiáng)項是密集數(shù)據(jù)處理(如:科學(xué)計算、醫(yī)療圖像處理),在邏輯處理方面還是CPU的天下,所以它們是互補(bǔ)的,只會有整合而非替代的趨勢。

[1] http://www2.kimicat.com/gpu%E7%9A%84%E7%A1%AC%E9%AB%94%E6%9E%B6%E6%A7%8B

[2] http://www.chip.cn/index.php?option=com_content&view=article&id=2857:geforce-gtx-400-gpu&catid=7:test-technology&Itemid=15

[3] http://www.geeks3d.com/20100606/gpu-computing-nvidia-cuda-compute-capability-comparative-table

[4] http://www.expreview.com/13590-2.html

[5] http://en.wikipedia.org/wiki/CUDA

posted on 2012-11-27 23:13 Heath 閱讀(3878) 評論(4)  編輯 收藏 引用 所屬分類: Graphics Programming

Feedback

# re: 針對CUDA的GPU架構(gòu)知識與性能對比[未登錄] 2012-11-28 15:17 Hunter

好文要頂!  回復(fù)  更多評論   

# re: 針對CUDA的GPU架構(gòu)知識與性能對比 2012-11-29 13:04 bukebushuo

CUDA的最大缺點是需要特定硬件  回復(fù)  更多評論   

# re: 針對CUDA的GPU架構(gòu)知識與性能對比 2012-12-13 20:02 moondark

博主,我想問一下, 對于cuda5.0,結(jié)合opencv能否在debug版本下進(jìn)行編譯?
我的在debug版本下編譯會顯示cuda的dll“并沒有debug版本”(Binary was not built with debug information.)所以不能執(zhí)行, 但在release下進(jìn)行編譯,就沒問題~
  回復(fù)  更多評論   

# re: 針對CUDA的GPU架構(gòu)知識與性能對比[未登錄] 2012-12-15 22:18 Heath

@moondark
cuda對外不會有debug版,有沒有試過用opencv去link release版的cuda庫?  回復(fù)  更多評論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲经典一区| 国产综合精品| 快播亚洲色图| 久久久久久一区二区三区| 日韩写真在线| 禁久久精品乱码| 欧美日韩精品不卡| 欧美日韩午夜视频在线观看| 亚洲理伦在线| 欧美黄色aaaa| 蜜臀a∨国产成人精品| 亚洲精品一区二区三| 精品91视频| 欧美理论在线播放| 欧美成熟视频| 欧美三区在线观看| 欧美专区在线观看| 亚洲精品1区2区| 国产精品xxx在线观看www| 男人的天堂亚洲| 国产精品腿扒开做爽爽爽挤奶网站| 亚洲精品乱码久久久久久蜜桃91| 亚洲日本激情| 亚洲天堂视频在线观看| 免费在线观看成人av| 欧美成人69av| 亚洲一区精彩视频| 一区二区三区精品| 久久本道综合色狠狠五月| 久久一区二区三区超碰国产精品| 99热在这里有精品免费| 中文av字幕一区| 久久乐国产精品| 蜜桃久久av| 久久久噜噜噜久久中文字免 | 欧美激情精品久久久久久| 久久久久久婷| 午夜精品久久久久久99热软件| 亚洲国产精品成人| 亚洲欧美日韩在线一区| 欧美日韩亚洲系列| 好看的日韩视频| 久久久久久夜| 欧美日韩的一区二区| ●精品国产综合乱码久久久久| 午夜精品国产| 亚洲色诱最新| 久久综合久久综合久久| 洋洋av久久久久久久一区| 免费观看30秒视频久久| 亚洲精品久久久久久久久| 久久精品国产99精品国产亚洲性色 | 欧美日韩一区二区免费视频| 午夜欧美大片免费观看| 国产伪娘ts一区| 免费观看欧美在线视频的网站| 国产精品亚洲综合色区韩国| 这里只有精品视频| 在线午夜精品| 国产精品视频内| 欧美成年人网| 欧美激情精品久久久久久蜜臀 | 好看不卡的中文字幕| 1769国产精品| 一个色综合av| 国产一区美女| 久久影院午夜论| 久久久精品国产99久久精品芒果| 亚洲国产日韩在线一区模特| 久久久www成人免费毛片麻豆| 亚洲视频福利| 麻豆国产精品777777在线| 性欧美xxxx视频在线观看| 中文一区字幕| 激情一区二区三区| 亚洲一区二区三区精品在线观看| 国产欧美一区二区三区在线看蜜臀| 国产亚洲精品v| 欧美激情一区| 一区二区三区日韩精品| 久久夜色精品国产| 日韩视频三区| 久久精品在线播放| 午夜精品久久久久久久久久久久久| 亚洲精品社区| 在线成人av| 国产精品你懂的在线| 午夜精品久久一牛影视| 久久裸体艺术| 国产欧美一区二区三区久久| 亚洲午夜极品| 亚洲在线网站| 欧美激情精品久久久久久黑人| 免费人成精品欧美精品| 欧美一二三视频| 国产精品一区二区三区久久久| 免费看av成人| 午夜一区不卡| 在线不卡a资源高清| 亚洲午夜一区| 亚洲欧美一区二区三区极速播放 | 久久久人成影片一区二区三区观看| 一区二区三欧美| 久久成人精品电影| 欧美韩国日本一区| 亚洲精品五月天| 国产精品欧美经典| 欧美日本精品| 午夜精品久久久久久久99热浪潮| 先锋影音久久| 一区二区三区中文在线观看| 久久天天狠狠| 一区二区三区四区国产精品| 午夜精品短视频| 欧美不卡三区| 欧美.www| 欧美va亚洲va国产综合| 亚洲免费久久| 国产精品一二一区| 精品成人国产| 国产精品乱人伦一区二区 | 99国产一区| 99re6热只有精品免费观看 | 欧美精品手机在线| 中文亚洲欧美| 亚洲精品午夜| 亚洲视频你懂的| 亚洲精品1区2区| 亚洲另类自拍| 亚洲在线1234| 久久爱另类一区二区小说| 久久国产视频网| 国产精品视频自拍| 国产一区999| 久久精品国产99国产精品澳门| 亚洲国产精品激情在线观看| 欧美 日韩 国产在线| 亚洲国产日韩一区二区| 亚洲综合不卡| 一区三区视频| 国产精品99一区二区| 久久久成人网| 亚洲一区二区四区| 亚洲国产成人在线视频| 久久超碰97中文字幕| 亚洲免费av网站| 狠狠做深爱婷婷久久综合一区 | 久久成人免费| 一本一本久久a久久精品牛牛影视| 国产日本欧美视频| 欧美日韩一区二区三区高清| 欧美在线观看视频一区二区三区| 亚洲精品久久久久久久久久久久| 久久精品99无色码中文字幕 | 亚洲一级在线| 在线不卡免费欧美| 国产人成精品一区二区三| 欧美久色视频| 免费不卡视频| 久久精品视频亚洲| 亚洲欧美一级二级三级| 在线亚洲精品| 日韩亚洲视频在线| 亚洲国产成人porn| 久久免费视频网| 欧美一二三视频| 亚洲香蕉视频| 夜夜嗨av色一区二区不卡| 亚洲黄色影院| 亚洲国产天堂久久国产91| 黄色成人免费观看| 国内成人在线| 国产欧美日韩综合一区在线观看| 欧美亚州一区二区三区| 欧美日韩色综合| 欧美日韩亚洲高清一区二区| 欧美激情久久久久| 欧美国产日韩视频| 欧美激情欧美狂野欧美精品| 欧美国产高潮xxxx1819| 欧美v亚洲v综合ⅴ国产v| 欧美69wwwcom| 欧美激情一区二区三区蜜桃视频| 老司机午夜精品视频| 久久夜色撩人精品| 免费视频最近日韩| 欧美日本精品| 国产精品永久免费在线| 国产午夜亚洲精品不卡| 国产综合视频在线观看| 国产亚洲视频在线| 一区二区亚洲欧洲国产日韩| 在线观看福利一区| 1024亚洲| 亚洲少妇一区| 欧美专区日韩视频| 欧美88av| 日韩一二三在线视频播| 亚洲特黄一级片| 欧美在线观看视频|