青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Heath's Blog

There is no end, it is just the beginning! - A Game Developer's Notes

針對(duì)CUDA的GPU架構(gòu)知識(shí)與性能對(duì)比

     5年前將《GPU Gems 2》中的“Octree Textures on the GPU”用到了論文的實(shí)時(shí)紋理創(chuàng)作一節(jié),那時(shí)候CUDA才剛出生,OpenCL應(yīng)該還在規(guī)范階段,所以將GPU用于加速和通用計(jì)算的成熟方法還是compution by texturing。至于同樣的計(jì)算量在CPU和GPU上跑,性能到底提升多少,也沒(méi)有做過(guò)對(duì)比實(shí)驗(yàn)。周末翻了下《CUDA by Example: An Introduction to General-Purpose GPU Programming》,基本掌握了用CUDA編寫(xiě)GPU思想和語(yǔ)法,比起將數(shù)據(jù)做為紋理、Shader寫(xiě)算法來(lái),進(jìn)步了不少:1)開(kāi)發(fā)人員不需要熟悉渲染管線及圖形API;2)不用花時(shí)間去搭建DX或者OpenGL的框架;3)Host與Device代碼混編;4)不必采用Hacking思想處理包裝成紋理的數(shù)據(jù);5)可指定參與計(jì)算的線程數(shù)。有了如此方便的編程環(huán)境,就隨手來(lái)做一下對(duì)比吧,這個(gè)例子來(lái)自《CUDA by Example》的4.2.2生成Julia集。

     測(cè)試代碼需要做一些調(diào)整,才能更好地體現(xiàn)出GPU的平行計(jì)算優(yōu)勢(shì),這其中牽涉到支持CUDA的GPU架構(gòu)知識(shí),在這里做一下梳理。

     在Nvidia推出Fermi架構(gòu)之前,支持CUDA的Nvidia顯示芯片都是由多個(gè)Streaming Multiprocessor(簡(jiǎn)稱(chēng)SM)組成,每個(gè)SM包含了八個(gè)Stream Processor(簡(jiǎn)稱(chēng)SP),每四個(gè)SP組成一個(gè)組,也就是說(shuō)SM實(shí)際上可以看成包含兩組4D的SIMD處理器。此外,每個(gè)SM還包含Register、share memory、texture cache以及constant cache。在執(zhí)行 CUDA 程序的時(shí)候,每個(gè)SM對(duì)應(yīng)一個(gè) block,而每個(gè)SP就是對(duì)應(yīng)一個(gè) thread。雖然一個(gè)SM只有八個(gè)SP,但是由于SP進(jìn)行各種運(yùn)算都有延遲,更不用提內(nèi)存存取的延遲了,因此 CUDA 在執(zhí)行程序的時(shí)候,實(shí)際是以 warp 為單位。目前的支持CUDA顯卡,一個(gè) warp 里面有32個(gè) threads,分成兩組16 threads的half-warp。由于SP的運(yùn)算至少有4個(gè)時(shí)鐘周期的延遲,因此對(duì)一個(gè)4D的SP來(lái)說(shuō),一次至少執(zhí)行16個(gè) threads(即 half-warp)才能有效覆蓋掉各種運(yùn)算的延遲[1]。

Image

圖 1

     在GeForce GTX 400系列上,Nvidia采用了全新的Fermi架構(gòu)[2],之后的顯卡的Compute Capability也從1.3躍升至2.0。SP改名為CUDA Core,提升到了32個(gè)/SM[3]。圖2為Fermi核心演變,從GF104和由其發(fā)展起來(lái)的GF114、GF106、GF108的CUDA Core都上升到了48個(gè)/SM,支持2.1的Compute Capability,而GF100和GF110依舊是32個(gè)。最新基于Kepler架構(gòu)的GeForce GTX 680支持3.0的Compute Capability,CUDA Core數(shù)量達(dá)到了192個(gè)/SM。

Image(1)

圖 2

     由于測(cè)試平臺(tái)采用的是GTX 560 Ti,所以需要分析一下它的架構(gòu)。GTX 560 Ti由8個(gè)SM組成,下圖中,左邊是從程序獲取的設(shè)備屬性,右邊為單個(gè)SM內(nèi)部結(jié)構(gòu)示例圖??梢钥吹?,GTX 560 Ti的每個(gè)SM配備了兩個(gè)Warp調(diào)度器,因此每個(gè)周期對(duì)兩個(gè)包含32個(gè)線程的Warp進(jìn)行分發(fā)。另外,對(duì)于一個(gè)二維圖像,為kernel指定2D的grid和block可使代碼更加直觀。為此,block采用(16,16),總共分配256個(gè)(64*4)threads在一個(gè)SM上執(zhí)行,如果需要產(chǎn)生1024*1024的Julia分形圖,則需要grid為(64,64)。

Image(2) Image(3)

圖 3

     測(cè)試平臺(tái)為:

Image(4)

     測(cè)試代碼說(shuō)明:

     1)代碼分為CPU實(shí)現(xiàn)和CUDA實(shí)現(xiàn);

     2)均采用CPU計(jì)時(shí)方法;

     3)只針對(duì)計(jì)算部分測(cè)試,不包括內(nèi)存分配、傳輸以及文件寫(xiě)入;

     下面列出main函數(shù)代碼,左邊為CPU實(shí)現(xiàn),右邊為CUDA實(shí)現(xiàn),均編譯為release版本。

Image(5)Image(6)

     測(cè)試結(jié)論:CPU版本耗時(shí)244ms,CUDA版本耗時(shí)2.1087ms。這可是100倍的效率提升啊。不過(guò)CPU版本沒(méi)有經(jīng)過(guò)多核優(yōu)化,所以這樣這樣對(duì)比實(shí)在不公平,但這卻凸顯出CUDA C將并行思想融入語(yǔ)言規(guī)則的優(yōu)勢(shì)。

out

     在驚訝GPU用作通用計(jì)算的執(zhí)行效率時(shí),別忘了它還是有諸多應(yīng)用上的問(wèn)題:

     1)初始化耗時(shí),需要在顯存分配空間,然后將數(shù)據(jù)從內(nèi)存copy到顯存;
     2)數(shù)據(jù)量受GPU顯存限制;
     3)對(duì)本身就需要GPU參與運(yùn)算的程序,如:3D游戲,通用計(jì)算會(huì)爭(zhēng)奪GPU資源,如果做平衡?
     4)計(jì)算數(shù)據(jù)之間的不相關(guān)性限制了GPU通用計(jì)算的應(yīng)用范圍;

     5)CPU算法到適合GPU架構(gòu)算法的移植;

     最后,GPU硬件設(shè)計(jì)本身就已經(jīng)決定了它的強(qiáng)項(xiàng)是密集數(shù)據(jù)處理(如:科學(xué)計(jì)算、醫(yī)療圖像處理),在邏輯處理方面還是CPU的天下,所以它們是互補(bǔ)的,只會(huì)有整合而非替代的趨勢(shì)。

[1] http://www2.kimicat.com/gpu%E7%9A%84%E7%A1%AC%E9%AB%94%E6%9E%B6%E6%A7%8B

[2] http://www.chip.cn/index.php?option=com_content&view=article&id=2857:geforce-gtx-400-gpu&catid=7:test-technology&Itemid=15

[3] http://www.geeks3d.com/20100606/gpu-computing-nvidia-cuda-compute-capability-comparative-table

[4] http://www.expreview.com/13590-2.html

[5] http://en.wikipedia.org/wiki/CUDA

posted on 2012-11-27 23:13 Heath 閱讀(3872) 評(píng)論(4)  編輯 收藏 引用 所屬分類(lèi): Graphics Programming

Feedback

# re: 針對(duì)CUDA的GPU架構(gòu)知識(shí)與性能對(duì)比[未登錄](méi) 2012-11-28 15:17 Hunter

好文要頂!  回復(fù)  更多評(píng)論   

# re: 針對(duì)CUDA的GPU架構(gòu)知識(shí)與性能對(duì)比 2012-11-29 13:04 bukebushuo

CUDA的最大缺點(diǎn)是需要特定硬件  回復(fù)  更多評(píng)論   

# re: 針對(duì)CUDA的GPU架構(gòu)知識(shí)與性能對(duì)比 2012-12-13 20:02 moondark

博主,我想問(wèn)一下, 對(duì)于cuda5.0,結(jié)合opencv能否在debug版本下進(jìn)行編譯?
我的在debug版本下編譯會(huì)顯示cuda的dll“并沒(méi)有debug版本”(Binary was not built with debug information.)所以不能執(zhí)行, 但在release下進(jìn)行編譯,就沒(méi)問(wèn)題~
  回復(fù)  更多評(píng)論   

# re: 針對(duì)CUDA的GPU架構(gòu)知識(shí)與性能對(duì)比[未登錄](méi) 2012-12-15 22:18 Heath

@moondark
cuda對(duì)外不會(huì)有debug版,有沒(méi)有試過(guò)用opencv去link release版的cuda庫(kù)?  回復(fù)  更多評(píng)論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲综合色噜噜狠狠| 美国十次了思思久久精品导航| 午夜影视日本亚洲欧洲精品| av不卡在线| 夜夜嗨av色一区二区不卡| 夜夜嗨av一区二区三区四季av| 在线亚洲高清视频| 亚洲自拍电影| 狂野欧美激情性xxxx| 欧美成人一品| 亚洲精华国产欧美| 亚洲国产日韩欧美在线图片| 亚洲裸体视频| 亚洲欧美一区二区精品久久久| 欧美一区二区视频在线观看2020| 久久精品亚洲精品国产欧美kt∨| 欧美不卡视频一区发布| 欧美日韩第一区日日骚| 国产日韩精品久久久| 亚洲国产视频一区二区| 亚洲图片欧洲图片日韩av| 欧美在线亚洲一区| 欧美激情一区二区三区在线| 日韩午夜av| 久久久噜噜噜久久中文字幕色伊伊| 欧美成人在线网站| 国产揄拍国内精品对白| 亚洲美女黄网| 久久艳片www.17c.com| 99精品欧美一区二区三区综合在线| 亚洲欧美卡通另类91av| 男人插女人欧美| 国产伦精品一区二区三区高清| 91久久视频| 久久国产婷婷国产香蕉| 亚洲精选一区| 久久av在线看| 国产精品一区二区视频 | 亚洲午夜一二三区视频| 亚洲欧洲视频| 国产精品欧美一区二区三区奶水| 国产一区自拍视频| 亚洲一二三区精品| 亚洲欧洲另类国产综合| 久久激情五月丁香伊人| 国产精品人人爽人人做我的可爱| 最新国产精品拍自在线播放| 久久大香伊蕉在人线观看热2| 亚洲精品日韩在线观看| 欧美不卡视频一区发布| 欲色影视综合吧| 久久成人精品无人区| 亚洲视频一区二区免费在线观看| 欧美激情bt| 最新高清无码专区| 亚洲第一精品影视| 另类酷文…触手系列精品集v1小说| 国产精品网站在线播放| 亚洲一区二区黄| 夜久久久久久| 欧美日韩一区二区欧美激情| aⅴ色国产欧美| 最新国产乱人伦偷精品免费网站 | 可以看av的网站久久看| 亚洲免费在线电影| 国产欧美一级| 久久久亚洲国产美女国产盗摄| 亚洲欧美一区二区在线观看| 国产精品夜夜嗨| 欧美在线地址| 久久国产日韩| 亚洲第一黄网| 亚洲精品国产视频| 欧美日韩直播| 欧美亚洲日本国产| 久久精品二区| 亚洲美女淫视频| 一区二区电影免费观看| 国产精品任我爽爆在线播放| 久久高清免费观看| 久久一区视频| 一本色道久久精品| 一本色道**综合亚洲精品蜜桃冫 | 亚洲精品麻豆| 一区二区三区高清在线观看| 国产精品嫩草久久久久| 久久国产精彩视频| 久久国产精品黑丝| 亚洲欧洲免费视频| 妖精视频成人观看www| 国产视频欧美视频| 亚洲国产高潮在线观看| 欧美三级欧美一级| 久久久久欧美精品| 欧美激情亚洲精品| 欧美一乱一性一交一视频| 久久久九九九九| 一本色道久久综合精品竹菊 | 国产精品免费观看在线| 亚洲网站在线| 国产情侣一区| 免费人成精品欧美精品| 亚洲国产精品一区二区三区| 日韩视频免费看| 国产欧美一区二区在线观看| 欧美成人首页| 久久全国免费视频| 午夜视频久久久久久| 亚洲毛片视频| 亚洲欧洲一区二区在线观看| 久久免费高清视频| 久久精品欧洲| 新狼窝色av性久久久久久| 一区二区免费看| 亚洲最新视频在线| 99re66热这里只有精品3直播| 国语自产在线不卡| 国产精品毛片a∨一区二区三区| 欧美成人午夜影院| 欧美精品一卡| 欧美四级在线观看| 国产精品素人视频| 国产综合色精品一区二区三区| 国产亚洲精品久久飘花| 国产一区二区无遮挡| 亚洲国产一区二区精品专区| 亚洲国产精品va在看黑人| 亚洲国产成人久久| 99国产精品视频免费观看| 一区二区三区免费观看| 亚洲一区二区不卡免费| 欧美一区二区三区视频免费播放| 久久综合精品一区| 蜜臀av一级做a爰片久久 | 亚洲一区图片| 麻豆精品网站| 一本大道av伊人久久综合| 亚洲欧美中文字幕| 欧美激情精品久久久久久大尺度 | 欧美sm重口味系列视频在线观看| 欧美精品18+| 韩国欧美一区| 性娇小13――14欧美| 亚洲二区精品| 久久亚洲综合网| 国产一区二区三区免费在线观看 | 红桃视频亚洲| 亚洲专区在线| 亚洲免费观看高清在线观看| 欧美一区二区在线看| 国产精品久久午夜夜伦鲁鲁| 亚洲精品色婷婷福利天堂| 久久久青草婷婷精品综合日韩 | 亚洲私拍自拍| 欧美视频在线观看免费网址| 亚洲国产成人不卡| 女女同性精品视频| 久久久五月婷婷| 亚洲成色777777女色窝| 欧美成人一区二区三区在线观看| 欧美在线亚洲一区| 国产精品视频久久一区| 欧美在线精品免播放器视频| 亚洲欧美日韩一区| 黄色日韩精品| 国产婷婷97碰碰久久人人蜜臀| 亚洲欧美成人一区二区在线电影| 亚洲视频精品| 一区二区亚洲| 一本色道久久综合亚洲二区三区| 欧美三级电影网| 两个人的视频www国产精品| 欧美激情一区二区三区四区| 夜夜爽av福利精品导航 | 中日韩美女免费视频网址在线观看 | 国产精品视频网站| 国产亚洲精品久久久久久| 国产精品日本| 国产视频一区三区| 亚洲第一页中文字幕| 亚洲一区一卡| 免费在线视频一区| 亚洲国产va精品久久久不卡综合| 欧美激情第9页| 亚洲天堂av综合网| 欧美bbbxxxxx| 亚洲国产网站| 亚洲欧洲美洲综合色网| 久久久久久一区| 日韩一级黄色av| 亚洲激情二区| 欧美日韩午夜视频在线观看| 黄色成人av网| 99精品视频免费| 最新国产乱人伦偷精品免费网站| 亚洲欧美日韩在线观看a三区 | 另类酷文…触手系列精品集v1小说| 欧美 日韩 国产一区二区在线视频 | 国产精品呻吟| 一本色道久久综合亚洲精品不|