1、在CPU上進(jìn)行的邏輯計(jì)算(比如骨骼動(dòng)畫(huà)粒子發(fā)射等)不影響渲染速度
2、較差的GPU渲染速度的低下不影響邏輯速度
第一個(gè)目標(biāo)已經(jīng)很明確了,我來(lái)解釋下需要達(dá)到第二個(gè)目標(biāo)的原因:許多動(dòng)作游戲的邏輯判定是基于幀的,所以在渲染較慢的情況下,邏輯不能跳幀,而仍然需要嚴(yán)格執(zhí)行才能保證游戲邏輯的正確性,這就導(dǎo)致了游戲速度的放慢,而實(shí)際上個(gè)人認(rèn)為渲染保持15幀以上就已經(jīng)可以正常進(jìn)行游戲了。
在較差的GPU上跑《鬼泣4》《刺客信條》《波斯王子4》簡(jiǎn)直就像是慢鏡頭一樣,完全沒(méi)法玩。而實(shí)際上CPU跑滿幀是沒(méi)有問(wèn)題的,如果能把邏輯幀和渲染幀徹底分離,即使渲染幀達(dá)不到要求,但CPU仍能正確的執(zhí)行游戲邏輯,就可以解決動(dòng)作游戲?qū)PU要求過(guò)高的問(wèn)題。
我們先來(lái)看多線程Ogre的兩種架構(gòu),第一種是middle-level multithread

如上圖所示,每個(gè)需渲染的實(shí)體被復(fù)制成了兩份,主線程和渲染線程交替更新和渲染同一個(gè)實(shí)體的兩個(gè)備份,并在一幀結(jié)束時(shí)同步,這種解決方案達(dá)到了第一個(gè)目標(biāo)而并沒(méi)有達(dá)到第二個(gè)目標(biāo),同時(shí)兩份實(shí)體的維護(hù)也相對(duì)復(fù)雜,并且沒(méi)法為更多核數(shù)的CPU進(jìn)行擴(kuò)展優(yōu)化。
第二種Ogre多線程的方法是 low-level multithread

如圖,將D3D對(duì)象復(fù)制兩份,同樣是在幀結(jié)束時(shí)同步并交換,和上面的優(yōu)缺點(diǎn)類似。兩種多線程Ogre的解決方案都是在引擎層完成的,對(duì)上層應(yīng)用透明,對(duì)于用戶而言無(wú)需考慮多線程細(xì)節(jié),這點(diǎn)是非常不錯(cuò)的。
接下來(lái)我們來(lái)看SIGGRAPH2008上,id soft提出的多線程3D引擎的方案

這里是已PS3的引擎結(jié)構(gòu)為例的,與PC有較大的差別,其中SPU是Cell芯片的8個(gè)協(xié)處理器,擁有強(qiáng)大的并行能力,id的解決方案在SPU上進(jìn)行了諸如骨骼動(dòng)畫(huà)、形變動(dòng)畫(huà)、頂點(diǎn)和索引緩存的壓縮、Progressive Mesh的計(jì)算等諸多內(nèi)容,同時(shí)與PPU上的物理計(jì)算RSX上的渲染工作交錯(cuò)進(jìn)行,最大化的利用了PS3的硬件結(jié)構(gòu),最終的游戲產(chǎn)品《Rage》很快就會(huì)面世了!
最后是我的解決方案

特點(diǎn)是邏輯完全分離,無(wú)需同步,雖然成功的達(dá)到了文章開(kāi)始提出的兩個(gè)目標(biāo),但對(duì)于引擎的使用者必須考慮多線程的諸多問(wèn)題,各種計(jì)算需放在哪個(gè)線程,如何在兩個(gè)線程間交互,都需要深入思考,所以要應(yīng)用到實(shí)際的游戲制作,恐怕還有很長(zhǎng)的一段路要走。
結(jié)合目前的架構(gòu)和上面看到的幾種多線程架構(gòu),同時(shí)也為了迎接DX11的到來(lái),我準(zhǔn)備將我的方案進(jìn)一步改進(jìn)成如下所示

場(chǎng)景剪裁與提交渲染交替進(jìn)行,并在渲染幀末進(jìn)行一次同步,而多個(gè)渲染表面的場(chǎng)景剪裁可再并行執(zhí)行。
圖片多,文字少,需更詳細(xì)資料請(qǐng)自行g(shù)oogle,本文就此結(jié)束!