• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            flagship的理想與現(xiàn)實(shí)

            創(chuàng)新+實(shí)踐

              C++博客 :: 首頁 :: 聯(lián)系 :: 聚合  :: 管理
              8 Posts :: 0 Stories :: 27 Comments :: 0 Trackbacks

            常用鏈接

            留言簿(8)

            我參與的團(tuán)隊(duì)

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

                    目前的3D引擎的渲染幀和邏輯幀都是在一個(gè)線程上運(yùn)行的,在網(wǎng)絡(luò)游戲中大量玩家聚集,繁重的骨骼動畫計(jì)算和粒子計(jì)算極大的拖累了渲染幀數(shù),有兩種有效措施:1、控制同屏顯示人數(shù),但玩家體驗(yàn)不好 2、幀數(shù)低于某值時(shí)減少動畫Tick頻率,但帶來的問題是動畫不連貫。
                    如果考慮使用多線程優(yōu)化,最容易想到的就是采用平行分解模式,將骨骼動畫計(jì)算和粒子計(jì)算寫成兩個(gè)for循環(huán),然后用OpenMP將其多線程化,但事實(shí)上這樣并不會提高多少效率,這兩者計(jì)算仍然要阻滯渲染幀,線程的創(chuàng)建也有一定的消耗。于是我想到了一種極端的解決方案,采用任務(wù)分解模式,將渲染和邏輯完全分離到兩個(gè)線程去,互不影響,當(dāng)然這樣線程同步會是大問題,畢竟線程的數(shù)量和BUG的數(shù)量是成正比的。
                    我們首先來分析下這兩個(gè)線程分別需要做什么工作,需要那些數(shù)據(jù)。渲染線程需要獲取實(shí)體的位置、材質(zhì)等信息,并交給GPU渲染,邏輯線程需要更新實(shí)體的位置、材質(zhì)、骨骼動畫等數(shù)據(jù),很顯然一個(gè)寫入一個(gè)讀取,這為我們實(shí)現(xiàn)一個(gè)沒有線程同步的多線程3D渲染系統(tǒng)提供了可能。
                    為了讓讀取和寫入不需要Lock,我們需要為每一份數(shù)據(jù)設(shè)計(jì)一個(gè)帶有冗余緩存的結(jié)構(gòu),讀取線程讀取的是上次寫入完成的副本,而寫入線程則向新的副本寫入數(shù)據(jù),并在完成后置上最新標(biāo)記,置標(biāo)記的操作為原子操作即可。以Vector為例,這個(gè)結(jié)構(gòu)大致是這樣的:
            struct VectorData 
            {
                    Vector4f    m_pVector[DATACENTER_CACHE];
                   
            int         m_iIndex;

                    VectorData()
                
            {
                        memset( m_pVector, 
            0, DATACENTER_CACHE * sizeof(Vector4f) );
                        m_iIndex 
            = 0;
                    }


                   
            void    Write( Vector4f& rVector )
                
            {
                       
            int iNewIndex = m_iIndex == DATACENTER_CACHE - 1 ? 0 : m_iIndex + 1;
                        m_pVector[iNewIndex] 
            = rVector;
                        m_iIndex 
            = iNewIndex;
                    }


                    Vector4f
            &    Read()
              
            {
                        
            return m_pVector[m_iIndex];
                    }

            }
            ;
                    當(dāng)然我們可以用模板來寫這個(gè)結(jié)構(gòu),讓其適用于int,float,matrix等多種數(shù)據(jù)類型,余下的工作就簡單了,將所有有共享數(shù)據(jù)的類的成員變量都定義為以上這種數(shù)據(jù)類型,例如我們可以定義:
                    SharedData<Matrix4f>  m_matWorld;
                    在渲染線程中調(diào)用pDevice->SetWorldMatrix( m_matWorld.Read() );
                    在邏輯線程中調(diào)用m_matWorld.Write( matNewWorld );

                    需要注意的是,這種方案并非絕對健壯,當(dāng)渲染線程極慢且邏輯線程極快的情況下,有可能寫入了超過了DATACENTER_CACHE次,而讀取卻尚未完成,那么數(shù)據(jù)就亂套了,當(dāng)然真要出現(xiàn)了這種情況,游戲早已經(jīng)是沒法玩了,我測試的結(jié)果是渲染幀小于1幀,邏輯幀大于10000幀,尚未出現(xiàn)問題。
                    FlagshipEngine采用了這一設(shè)想,實(shí)際Demo測試結(jié)果是,計(jì)算25個(gè)角色的骨骼動畫,從靜止到開始奔跑,單線程的情況下,幀數(shù)下降了20%~30%,而使用多線程的情況下,幀數(shù)完全沒有變化!
            posted on 2009-01-04 21:15 flagship 閱讀(5606) 評論(7)  編輯 收藏 引用 所屬分類: FlagshipEngine

            Feedback

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-05 09:20 LOGOS
            yf同學(xué)吧。使勁的踩一下,oye,處女踩
            我看過的一個(gè)同步方案,和你的不同
            邏輯線程在每幀結(jié)束的時(shí)候,將新的渲染context同步到渲染線程中
            渲染線程在沒有新的context的仍用老的context渲染

            你使用了過于底層的數(shù)據(jù)結(jié)構(gòu)作為數(shù)據(jù)的同步方案,看起來以后的拓展性不是太好。
            另外,jl同學(xué)說了,m_index=index在intel的CPU上也許是原子操作,但是其他CPU就不一定了。所以read方法讀取到的是不是一個(gè)合法的索引值很難說
              回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-05 10:41 flagship
            ?。”话l(fā)現(xiàn)了。。hwh同學(xué)。。你也在這里啊
            你看過的同步方案,給我個(gè)鏈接吧

            安全性的問題,我查過,在32位x86 CPU上int的賦值應(yīng)該是原子操作,不過考慮保險(xiǎn),想試著改成InterlockedIncrement試試看,不知道會不會損失效率
            @LOGOS
              回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-05 11:08 LOGOS
            http://www.cnblogs.com/cproom/archive/2007/11/26/972548.html
              回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-16 11:06 落魄江湖-隨風(fēng)而行
            第一次嘗試評論,先測試一下  回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-16 11:22 落魄江湖-隨風(fēng)而行
            關(guān)于多線程(或smp)渲染,是一個(gè)比較麻煩的手段,通過doom3 sdk結(jié)合quake3源代碼,我這里也總結(jié)一下DOOM3/QUAKE3的多線程(SMP)渲染技術(shù)框架,供參考。
            首先定義邏輯,邏輯端不涉及任何渲染操作和資源載入,僅僅是各個(gè)ENTITY的動態(tài)變化和物理碰撞檢測等,可以形成一套腳本語言,分配一個(gè)線程,稱為腳本線程,專門從事業(yè)務(wù)邏輯處理,邏輯代碼由邏輯程序員編寫。
            其次,定義渲染,渲染分為兩個(gè)線程,即渲染前端線程和渲染后端線程
            渲染前端線程的主要作用是進(jìn)行場景管理,可視性檢測,形成COMMAND BUFFFER命令,在渲染前端線程里面不涉及到任何的渲染API的調(diào)用,例如GL/D3D等,然后由渲染前端將可視化的渲染數(shù)據(jù)提交給渲染后端,渲染后端從COMMANDBUFFER中獲得渲染數(shù)據(jù)后,進(jìn)行BATCH,設(shè)置渲染狀態(tài)等,提交給渲染API進(jìn)入GPU硬件流水線
            使用COMMAND BUFFER事實(shí)上已經(jīng)成為并行渲染系統(tǒng)的標(biāo)準(zhǔn)解決方案了,D3D FOR XBOX版本的API函數(shù)里面包含COMMAND BUFFER接口,事實(shí)上QUAKE3是第一個(gè)引擎使用COMMAND BUFFER實(shí)現(xiàn)SMP渲染的引擎。

            隨風(fēng)而行 QQ群 38224573 3D引擎研發(fā)[1]

              回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-01-16 16:06 flagship
            @落魄江湖-隨風(fēng)而行
            COMMAND BUFFER 我不太了解,這就去查一下
            我想問的是:邏輯線程如何與渲染前端線程同步的?  回復(fù)  更多評論
              

            # re: 3D引擎多線程:渲染與邏輯分離 2009-02-05 16:21 conan
            這個(gè)就是和ringbuffer差不多  回復(fù)  更多評論
              

            久久久久久免费一区二区三区| 麻豆精品久久久一区二区| 久久国产乱子伦精品免费强| 久久国产亚洲精品| 青春久久| 久久婷婷午色综合夜啪| 亚洲综合久久夜AV | 亚州日韩精品专区久久久| 少妇被又大又粗又爽毛片久久黑人| 亚洲综合精品香蕉久久网97| 国产精品18久久久久久vr| 精品久久久久久久无码| 久久久久久久久久久久中文字幕 | 国产精品无码久久综合 | 亚洲AV无码久久精品色欲| 中文字幕无码精品亚洲资源网久久| 精品国产乱码久久久久软件| 久久久久久综合网天天| 亚洲精品午夜国产VA久久成人| 亚洲欧美日韩中文久久| 久久91精品国产91久久户| 亚洲一本综合久久| 7777精品伊人久久久大香线蕉 | 狠狠色丁香婷综合久久| 精品久久久久久久久久中文字幕 | 亚洲国产成人精品91久久久| 国产欧美久久久精品影院| 色偷偷偷久久伊人大杳蕉| 久久亚洲国产中v天仙www| 久久综合给合综合久久| 亚洲AV日韩AV永久无码久久| 免费观看久久精彩视频| 天堂无码久久综合东京热| 久久精品国产亚洲av麻豆蜜芽| 国产精品无码久久综合| 人妻无码久久精品| 精品熟女少妇av免费久久| 亚洲国产成人久久综合区| 99久久er这里只有精品18| 亚洲а∨天堂久久精品| 91久久精一区二区三区大全|