• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            3d Game Walkman

            3d圖形渲染,網絡引擎 — tonykee's Blog
            隨筆 - 45, 文章 - 0, 評論 - 309, 引用 - 0
            數據加載中……

            Early ZBuffer [轉]

            看到這篇文章寫的還不錯,順手轉過來了^_^
              
               一、最近在優化客戶端性能的時候,看到了Early ZBuffer。在VSPS中間GPU會對進行Z-buffer預判機制,對無效像素進行剔除,ATI、NVIDIA都有自己的Z-buffer預判機制。其實Doom3的時候已經開始使用預填充ZBuffer了,因為Doom3的PS需要處理陰影、NormalMap、LightMap及其他貼圖處理,PS指令非常多,所以無效像素的剔除對性能影響是很大的,越早將無效像素剔除,顯卡便能獲得更多的時間對有效像素進行渲染。

             

                二、Early-Z技術介紹(這段摘自http://tech.sina.com.cn/h/2008-06-17/09302262913.shtml

              當代的GPU都會采用Z-buffer去記錄哪些像素是可見,而哪些像素是被遮擋而不可見。一個3D Frame最終要轉換成為2D圖像才能表示在屏幕上面,來自GPU連續的頂點流(vertices)會構建這個frame,從這個頂點流獲取相應的2D坐 標去生成多邊形。多邊形的連續產生會覆蓋原來的區域,因而Z-buffer的信息就是告訴ROP,哪些像素是可見哪些是不可見的。提前進行的Early- Z對比可以節省大量資源,因為同一個區域被多個多邊形覆蓋的次數輕而易舉地達到原來的四倍甚至更高





            目前甚少方法可以利用Z-buffer信息去挑選或者排出被遮擋像素的渲染,Z-Cull就是這樣的一個方法。Z-comparision通常 會發生在ROP的后期。問題就產生,意味著pixel要通過完整的ROP管線才能被發現是否可見。一些復雜的包含數千步驟的shader程序,即使是被遮 擋的pixel也全部通過流水線,這顯然浪費了GPU的性能。Early-Z移去不可見像素在它們進入流水線之前,這樣顯然會提高性能,NVIDIA認為 這個操作提升22%附近的性能。

             

                三、具體實現:場景渲染兩遍:
                void Render()
                {
                    DrawZPass();    
                    DrawColorPass();    
                }
                
                // 關閉ColorBuffer寫入,以最簡單的渲染狀態繪制場景
                void DrawZPass()
                {
                    // Disable color writes
                    pD3DDevice->SetRenderState( D3DRS_COLORWRITEENABLE, 0x00000000);

                    // Ensure alpha off
                    pD3DDevice->SetRenderState( D3DRS_ALPHABLENDENABLE, false );
                    pD3DDevice->SetRenderState( D3DRS_ALPHATESTENABLE, false );

                    // Ensure z-enabled
                    pD3DDevice->SetRenderState( D3DRS_ZENABLE, true );
                    pD3DDevice->SetRenderState( D3DRS_ZWRITEENABLE, true );

                    DrawScene();

                    pD3DDevice->SetRenderState( D3DRS_COLORWRITEENABLE, 0x0000000F );
                }

                // 正常渲染
                void DrawColorPass()
                {
                    pD3DDevice->SetRenderState( D3DRS_DEPTHBIAS, F2DW(-0.001f) );    
                    DrawScene()
                }

                1.DrawZPass:應該跳過AlphaBlend、AlphaTest的實體。
                2.DrawColorPass:對于那些預寫入ZBuffer的實體,在這個Pass中只需開啟ZBufferTest、并且可以關閉ZBufferWrite。
                3.使用了EarlyZBuffer,就不用再排序了。

                4.在第二遍渲染的時候,因為浮點的誤差,會有ZFighting現象,所以應允許一定的誤差。

                5.Early ZBuffer不一定適用所有場景,比如有大量實體的室外場景,因為DrawZPass畢竟也要繪制所有的實體,如果調用太多DP,性能反而會有所下降。


                 四、另外一個性能優化提示:先畫UI;最后繪制天空盒。這也于ZBuffer有關,因為天空盒總是顯示在最后,而天空盒總是被前面的實體遮擋了大部分區域。

            不過最后繪制天空盒時候,大家會問如何避免被FarPlane裁剪,有一個技巧可以解決,在SkyShader的VS輸出投影后的位置時,這樣設置:

                 Out.position = mul(mvp, vertex).xyww。// 不是Out.position = mul(mvp, vertex);

                這樣天空盒投影后的總是映射到FarPlane,這樣就完美了,哈哈。這個方法時我在ATI的《Depth In Depth》文檔中看到的。UI也是,游戲里的UI區域如果預先寫入ZBuffer,也可以避免大量的無效PS處理。


                 五、最后希望大家可以仔細看看《Depth In Depth》,里邊有很多優化提示。

            posted on 2009-12-01 14:20 李侃 閱讀(2563) 評論(0)  編輯 收藏 引用 所屬分類: 前臺客戶端

            久久男人中文字幕资源站| 久久精品亚洲乱码伦伦中文| 久久福利资源国产精品999| 国内精品久久久久久久涩爱| 99久久国产综合精品麻豆| 欧美精品一区二区久久| 一本一道久久a久久精品综合| 合区精品久久久中文字幕一区| 久久精品人妻中文系列| 久久精品国产亚洲网站| 久久久久亚洲av毛片大 | 国产福利电影一区二区三区,免费久久久久久久精 | 久久精品国产99久久久古代| 99久久精品免费看国产一区二区三区| 国产精品久久久香蕉| 亚洲日韩欧美一区久久久久我 | 久久久久久久免费视频| 丁香狠狠色婷婷久久综合| 熟妇人妻久久中文字幕| 久久www免费人成看片| 久久精品青青草原伊人| 久久久精品午夜免费不卡| 欧美久久久久久午夜精品| 欧美喷潮久久久XXXXx| 久久狠狠一本精品综合网| 久久亚洲精品成人av无码网站| 国产精品无码久久久久久| 久久本道久久综合伊人| 影音先锋女人AV鲁色资源网久久 | 亚洲va中文字幕无码久久不卡| 一本久久a久久精品亚洲| 久久久久久A亚洲欧洲AV冫| 精品久久人妻av中文字幕| 久久成人小视频| 亚洲国产精品综合久久一线| 青青青青久久精品国产| 浪潮AV色综合久久天堂| 久久久免费精品re6| 国产精品无码久久久久久| 日本久久久精品中文字幕| 91久久香蕉国产熟女线看|