RTTI、虛函數(shù)和虛基類的實現(xiàn)方式、開銷分析及使用指導
白楊
http://baiy.cn
“在正確的場合使用恰當?shù)奶匦?#8221; 對稱職的C++程序員來說是一個基本標準。想要做到這點,首先要了解語言中每個特性的實現(xiàn)方式及其開銷。本文主要討論相對于傳統(tǒng) C 而言,對效率有影響的幾個C++新特性。
相對于傳統(tǒng)的 C 語言,C++ 引入的額外開銷體現(xiàn)在以下兩個方面:
編譯時開銷

模板、類層次結構、強類型檢查等新特性,以及大量使用了這些新特性的 STL 標準庫都增加了編譯器負擔。但是應當看到,這些新機能在不降低,甚至(由于模板的內(nèi)聯(lián)能力)提升了程序執(zhí)行效率的前提下,明顯減輕了廣大 C++ 程序員的工作量。
用幾秒鐘的CPU時間換取幾人日的辛勤勞動,附帶節(jié)省了日后調(diào)試和維護代碼的時間,這點開銷當算超值。
當然,在使用這些特性的時候,也有不少優(yōu)化技巧。比如:編譯一個 廣泛依賴模板庫的大型軟件時,幾條顯式實例化指令就可能使編譯速度提高幾十倍;恰當?shù)亟M合使用部分專門化和完全專門化,不但可以最優(yōu)化程序的執(zhí)行效率,還可以讓同時使用多種不同參數(shù)實例化一套模板的程序體積顯著減小……
|
運行時開銷

運行時開銷恐怕是程序員最關心的問題之一了。相對與傳統(tǒng)C程序而言,C++中有可能引入額外運行時開銷的新特性包括:
- 虛基類
- 虛函數(shù)
- RTTI(dynamic_cast和typeid)
- 異常
- 對象的構造和析構
關于其中第四點:異常,對于大多數(shù)現(xiàn)代編譯器來說,在正常情況(未拋出異常)下,try塊中的代碼執(zhí)行效率和普通代碼一樣高,而且由于不再需要使用傳統(tǒng)上通過返回值或函數(shù)調(diào)用來判斷錯誤的方式,代碼的實際執(zhí)行效率還可能進一步提高。拋出和捕捉異常的效率也只是在某些情況下才會稍低于函數(shù)正常返回的效率,何況對于一個編寫良好的程序,拋出和捕捉異常的機會應該不多。關于異常使用的詳細討論,參見:C++編碼規(guī)范正文中的相關部分和C++異常機制的實現(xiàn)方式和開銷分析一節(jié)。
而第五點,對象的構造和析構開銷也不總是存在。對于不需要初始化/銷毀的類型,并沒有構造和析構的開銷,相反對于那些需要初始化/銷毀的類型來說,即使用傳統(tǒng)的C方式實現(xiàn),也至少需要與之相當?shù)拈_銷。這里要注意的一點是盡量不要讓構造和析構函數(shù)過于臃腫,特別是在一個類層次結構中更要注意。時刻保持你的構造、析構函數(shù)中只有最必要的初始化和銷毀操作,把那些并不是每個(子)對象都需要執(zhí)行的操作留給其他方法和派生類去解決。
其實對一個優(yōu)秀的編譯器而言,C++的各種特性本身就是使用C/匯編加以千錘百煉而最優(yōu)化實現(xiàn)的。可以說,想用C甚至匯編比編譯器更高效地實現(xiàn)某個C++特性幾乎是不可能的。要是真能做到這一點的話,大俠就應該去寫個編譯器造福廣大程序員才對~
C++之所以 被廣泛認為比C“低效”,其根本原因在于:由于程序員對某些特性的實現(xiàn)方式及其產(chǎn)生的開銷不夠了解,致使他們在錯誤的場合使用了錯誤的特性。而這些錯誤基本都集中在:
- 把異常當作另一種流控機制,而不是僅將其用于錯誤處理中
- 一個類和/或其基類的構造、析構函數(shù)過于臃腫,包含了很多非初始化/銷毀范疇的代碼
- 濫用或不正確地使用RTTI、虛函數(shù)和虛基類機制
其中前兩點上文已經(jīng)講過,下面討論第三點。
為了說明RTTI、虛函數(shù)和虛基類的實現(xiàn)方式,這里首先給出一個經(jīng)典的菱形繼承實例,及其具體實現(xiàn)(為了便于理解,這里故意忽略了一些無關緊要的優(yōu)化):
|
存布局.png)
圖中虛箭頭代表偏移,實箭頭代表指針
由上圖得到每種特性的運行時開銷如下:
特性 |
時間開銷 |
空間開銷 |
RTTI |
幾次整形比較和一次取址操作(可能還會有1、2次整形加法) |
每類型一個type_info對象(包括類型ID和類名稱),典型情況下小于32字節(jié)
|
虛函數(shù) |
一次整形加法和一次指針間接引用 |
每類型一個虛表,典型情況下小于128字節(jié)
每對象若干個(大部分情況下是一個)虛表指針,典型情況下小于8字節(jié)
|
虛基類 |
從虛繼承的子類中訪問虛基類的數(shù)據(jù)成員或其虛函數(shù)時,將增加兩次指針間接引用和一次整形加法(部分情況下可以優(yōu)化為一次指針間接引用)。 |
每類型一個虛基類表,典型情況下小于32字節(jié)
每對象若干虛基類表指針,典型情況下小于8字節(jié)
在同時使用了虛函數(shù)的時候,虛基類表可以合并到虛表(virtual table)中,每對象的虛基類表指針(vbptr)也可以省略(只需vptr即可)。實際上, 很多實現(xiàn)都是這么做的。
|
* 其中“每類型”或“每對象”是指用到該特性的類型/對象。對于未用到這些功能的類型及其對象,則不會增加上述開銷 |
可見,關于老天“餓時掉餡餅、睡時掉老婆”等美好傳說純屬謠言。但凡人工制品必不完美,總有設計上的取舍,有其適應的場合也有其不適用的地方。
C++中的每個特性,都是從程序員平時的生產(chǎn)生活中逐漸精化而來的。在不正確的場合使用它們必然會引起邏輯、行為和性能上的問題。對于上述特性,應該只在必要、合理的前提下才使用。
"dynamic_cast" 用于在類層次結構中漫游,對指針或引用進行自由的向上、向下或交叉強制。"typeid" 則用于獲取一個對象或引用的確切類型,與 "dynamic_cast" 不同,將 "typeid" 作用于指針通常是一個錯誤,要得到一個指針指向之對象的type_info,應當先將其解引用(例如:"typeid(*p);")。
一般地講,能用虛函數(shù)解決的問題就不要用 "dynamic_cast",能夠用 "dynamic_cast" 解決的就不要用 "typeid"。比如:

void rotate(IN const CShape& iS) { if (typeid(iS) == typeid(CCircle)) { // ... } else if (typeid(iS) == typeid(CTriangle)) { // ... } else if (typeid(iS) == typeid(CSqucre)) { // ... }
// ... } |
以上代碼用 "dynamic_cast" 寫會稍好一點,當然最好的方式還是在CShape里定義名為 "rotate" 的虛函數(shù)。
虛函數(shù)是C++眾多運行時多態(tài)特性中開銷最小,也最常用的機制。虛函數(shù)的好處和作用這里不再多說,應當注意在對性能有苛刻要求的場合,或者需要頻繁調(diào)用,對性能影響較大的地方(比如每秒鐘要調(diào)用成千上萬次,而自身內(nèi)容又很簡單的事件處理函數(shù))要慎用虛函數(shù)。
需要特別說明的一點是:虛函數(shù)的調(diào)用開銷與通過函數(shù)指針的間接函數(shù)調(diào)用(例如:經(jīng)典C程序中常見的,通過指向結構中的一個函數(shù)指針成員調(diào)用;以及調(diào)用DLL/SO中的函數(shù)等常見情況)是相當?shù)摹1绕鸷瘮?shù)調(diào)用本身的開銷(保存現(xiàn)場->傳遞參數(shù)->傳遞返回值->恢復現(xiàn)場)來說,一次指針間接引用是微不足道的。這就使得在絕大部分可以使用函數(shù)的場合中都能夠負擔得起虛方法的些微額外開銷。
作為一種支持多繼承的面向?qū)ο笳Z言,虛基類有時是保證類層次結構正確一致的一種必不可少的手段。但在需要頻繁使用基類提供的服務,又對性能要求較高的場合,應該盡量避免使用它。在基類中沒有數(shù)據(jù)成員的場合,也可以解除使用虛基類。例如,在上圖中,如果類 "BB" 中不存在數(shù)據(jù)成員,那么 "BB" 就可以作為一個普通基類分別被 "B1" 和 "B2" 繼承。這樣的優(yōu)化在達到相同效果的前提下,解除了虛基類引起的開銷。不過這種優(yōu)化也會帶來一些問題:從 "DD" 向上強制到 "BB" 時會引起歧義,破壞了類層次結構的邏輯關系。
上述特性的空間開銷一般都是可以接受的,當然也存在一些特例,比如:在存儲布局需要和傳統(tǒng)C結構兼容的場合、在考慮對齊的場合、在需要為一個本來尺寸很小的類同時實例化許多對象的場合等等。
|