PerfHUD是NVidia提高的免費DX圖形程序性能分析工具,目前最新版本為6.1。PerfHUD使用起來也很方便,只需在CreateDevice時將設(shè)備ID設(shè)置為PerfHUD虛擬設(shè)備的ID(如果只有一個顯卡,該ID通常為1),類型設(shè)置為D3DDEVTYPE_REF,然后將編譯好的可執(zhí)行文件通過右鍵菜單的“Send to”或者直接拖到PerfHUD圖標(biāo)上的方式就可以運行該分析工具。

然而對于手上沒有源碼的圖形程序,如發(fā)行的游戲,我們就無法直接使用PerfHUD了。當(dāng)遇到這個問題時,我想了兩種辦法:1)使用D3D Hook;2)逆向分析直接修改調(diào)用CreateDevice傳入的前兩個參數(shù)。
對于第一種方案,我使用了DLL function forwarders的方式只hook了Direct3DCreate9,然后將d3d9.Direct3DCreate9的返回值保存后替換成自己的實現(xiàn)的IDirect3D9接口指針,這樣我?guī)缀蹩梢员O(jiān)視所有d3d9提供的接口方法。理論上,采用第一種方案,只需在CreateDevice方法中將傳入的前兩個參數(shù)修改讓后調(diào)用d3d9.CreateDevice即可。然而,事實卻往往不如人意,后來仔細分析了一下PerfHUD的實現(xiàn)原理:實際上PerfHUD也是一個D3D Hook,當(dāng)程序作為PerfHUD參數(shù)啟動時,PerfHUD判斷前兩個參數(shù),然后如果允許分析,就載入幾個包含分析功能的DLL,最終PerfHUD還是會將真正創(chuàng)建D3D設(shè)備的前兩個參數(shù)恢復(fù)成應(yīng)用程序使用的參數(shù),因為PerfHUD僅僅是虛擬了一個設(shè)備和Hook了一下D3D。然而,使用第一種方案你自己就可以寫出另外一個PerfHUD來了(不過就得花些功夫了),而且普適性很強。
對于第二種方案,可使用動態(tài)分析軟件,先定位d3d39.Direct3DCreate9,然后根據(jù)其返回值定位CreateDevice入口,最后找到調(diào)用CreateDevice的地方,修改前兩個參數(shù)就OK了。筆者用此方法,測試了Wow和Call of Duty-World at War,其中Wow由于直接使用立即數(shù)作為CreateDevice前兩個參數(shù),所以不需要調(diào)整代碼,而Call of Duty-World at War采用了直接尋址來得到第1個參數(shù),修改起來就有點麻煩了。 此方案不具有普適性,針對每個圖形程序,需要去修改其二進制代碼。