內(nèi)聯(lián)函數(shù)——多么振奮人心的一項發(fā)明!它們看上去與函數(shù)很相像,它們擁有與函數(shù)類似的行為,它們要比宏(參見條目2)好用的多,同時你在調(diào)用它們時帶來的開銷比一般函數(shù)小得多。可謂“內(nèi)聯(lián)在手,別無他求。”
你得到的遠(yuǎn)遠(yuǎn)比你想象的要多,因為節(jié)約函數(shù)調(diào)用的開銷僅僅是冰山一角。我們知道編譯器優(yōu)化通常是針對那些沒有函數(shù)調(diào)用的代碼,因此當(dāng)你編寫內(nèi)聯(lián)函數(shù)時,編譯器就會針對函數(shù)體的上下文進(jìn)行優(yōu)化工作。大多數(shù)編譯器都不會針對“外聯(lián)”函數(shù)調(diào)用進(jìn)行這樣的優(yōu)化。
然而,在你的編程生涯中,“沒有免費的午餐”這句生活哲言同樣奏效,內(nèi)聯(lián)函數(shù)也沒有例外。內(nèi)聯(lián)函數(shù)背后蘊含的理念是:用代碼本體來取代每次函數(shù)調(diào)用,這樣做很可能會使目標(biāo)代碼的體積增大不少,這一點并不是非要統(tǒng)計學(xué)博士才能看得清。對于內(nèi)存空間有限的機(jī)器而言,過分熱衷于使用內(nèi)聯(lián)則會造成過多的空間占用。即使在虛擬內(nèi)存中,那些冗余的內(nèi)聯(lián)代碼也會帶來不少無謂的分頁,從而使緩存讀取命中率降低,最終帶來性能的犧牲。
另一方面,如果一個內(nèi)聯(lián)函數(shù)體非常的短,那么為函數(shù)體所生成代碼的體積則可能會比調(diào)用函數(shù)所生成的代碼小一些。此時,內(nèi)聯(lián)函數(shù)才真正做到了減小目標(biāo)代碼和提高緩存讀取命中率的目的。
請時刻牢記,Inline是對編譯器的一次請求,而不是一條命令。這種請求可以顯式提出也可以隱式提出。隱式請求的途徑就是:在類定義的內(nèi)部定義函數(shù):
class Person {
public:
...
int age() const { return theAge; } // 隱式內(nèi)聯(lián)請求:
... // 年齡age在類定義中做出定義
private:
int theAge;
};
這樣的函數(shù)通常是成員函數(shù),但是類中定義的函數(shù)也可以是友元(參見條目46),如果函數(shù)是友元,那么它們會被隱式定義為內(nèi)聯(lián)函數(shù)。
顯式聲明內(nèi)聯(lián)函數(shù)的方法為:在函數(shù)定義之前添加inline關(guān)鍵字。比如說,下面是標(biāo)準(zhǔn)max模板(來自<algorithm>)常見的定義方式:
template<typename T> // 顯式內(nèi)聯(lián)請求:
inline const T& std::max(const T& a, const T& b)
{ return a < b ? b : a; } // 在std::max的前邊添加”inline”
“max是模板”這一事實,讓我們不免得出這樣的推論:內(nèi)聯(lián)函數(shù)和模板都應(yīng)該定義在頭文件中。這就使一些程序員做出“函數(shù)模板必須是內(nèi)聯(lián)函數(shù)”的論斷。這一結(jié)論不僅站不住腳,而且也存在潛在的害處,所以這里還是要稍稍深入了解一下。
由于大多數(shù)編程環(huán)境的內(nèi)聯(lián)操作都是在編譯過程中進(jìn)行的,因此內(nèi)聯(lián)函數(shù)一般都應(yīng)該定義在頭文件中。編譯器必須首先了解函數(shù)的情況,以便于用所調(diào)用函數(shù)體來代替這次函數(shù)調(diào)用。(一些構(gòu)建環(huán)境在連接過程中進(jìn)行內(nèi)聯(lián),還有個別基于.NET通用語言基礎(chǔ)結(jié)構(gòu)(CLI)的環(huán)境甚至是在運行時進(jìn)行內(nèi)聯(lián)。這樣的環(huán)境屬于例外,不是守則。在大多數(shù)C++程序中,內(nèi)聯(lián)是一個編譯時行為。)
模板通常保存在頭文件中,這是因為編譯器需要了解這些模板,以便于在使用時進(jìn)行正確的實例化。(再次說明,這并不是一成不變的。一些編程環(huán)境在連接時進(jìn)行模板實例化。但是編譯時實例化是更通用的方式。)
模板實例化相對于內(nèi)聯(lián)是獨立的。如果你正在編寫一個模板,而你又確信由這個模板所實例化出的所有函數(shù)都應(yīng)該是內(nèi)聯(lián)的,那么這個模板就應(yīng)該添加inline關(guān)鍵字;這也就是上文中std::max實現(xiàn)的做法。但是如果你正在編寫的模板并不需要內(nèi)聯(lián)函數(shù),那么就不要聲明內(nèi)聯(lián)模板(無論是顯式還是隱式)。內(nèi)聯(lián)也是有開銷的,不計成本的引入內(nèi)聯(lián)并不明智。我們已經(jīng)介紹過內(nèi)聯(lián)是如何使代碼膨脹起來的(對于模板的作者而言,還應(yīng)該做更周密的考慮——參見條目44),但是內(nèi)聯(lián)還會帶來其他的開銷,這就是我們即將討論的問題。
“inline是對編譯器的一次請求,但編譯器可能會忽略它。”在我們的討論開始之前,我們首先要弄清這一點。大多數(shù)編譯器如果認(rèn)為當(dāng)前的函數(shù)過于復(fù)雜(比如包含循環(huán)或遞歸的函數(shù)),或者這個函數(shù)是虛函數(shù)(即使是最平常的虛函數(shù)調(diào)用),就會拒絕將其內(nèi)聯(lián)。后一個結(jié)論很好理解。因為virtual意味著“等到運行時再指出要調(diào)用哪個程序,”而inline意味著“在執(zhí)行程序之前,使用要調(diào)用的函數(shù)來代替這次調(diào)用。”如果編譯器不知道要調(diào)用哪個函數(shù),那么它們拒絕內(nèi)聯(lián)函數(shù)體的做法就無可厚非了。
綜上所述,我們得出下面的結(jié)論:一個給定的內(nèi)聯(lián)函數(shù)是否真正的得到內(nèi)聯(lián),取決于你正在使用的構(gòu)建環(huán)境——主要是編譯器。幸運的是,大多數(shù)編譯器擁有診斷機(jī)制,如果在內(nèi)聯(lián)某個函數(shù)時失敗了,那么編譯器將會做出警告(參見條目53)。
有些時候,即使編譯器認(rèn)為某個函數(shù)非常適合內(nèi)聯(lián),可是還是會為它生成一個函數(shù)體。舉例說,如果你的程序要取得某個內(nèi)聯(lián)函數(shù)的地址,那么一般情況下編譯器必須為其創(chuàng)建一個外聯(lián)的函數(shù)體。編譯器怎么能讓一個指針去指向一個不存在的函數(shù)呢?再加上“編譯器一般不會通過對函數(shù)指針的調(diào)用進(jìn)行內(nèi)聯(lián)”這一事實,更能肯定這一結(jié)論:對于一個內(nèi)聯(lián)函數(shù)的調(diào)用是否應(yīng)該得到內(nèi)聯(lián),取決于這一調(diào)用是如何進(jìn)行的:
inline void f() {...} // 假設(shè)編譯器樂意于將f的調(diào)用進(jìn)行內(nèi)聯(lián)
void (*pf)() = f; // pf指向f
...
f(); // 此調(diào)用將被內(nèi)聯(lián),因為這是一次“正常”的調(diào)用
pf(); // 此調(diào)用很可能不會被內(nèi)聯(lián),
// 因為它是通過一個函數(shù)指針進(jìn)行的
即使你從未使用函數(shù)指針,未得到內(nèi)聯(lián)處理的內(nèi)聯(lián)函數(shù)依然會“陰魂不散”,這是因為調(diào)用函數(shù)指針的不僅僅是程序員。在對數(shù)組內(nèi)的對象進(jìn)行構(gòu)造或析構(gòu)的過程中,編譯器有時會生成構(gòu)造函數(shù)和析構(gòu)函數(shù)的不恰當(dāng)?shù)陌姹荆瑥亩顾鼈兛梢缘玫竭@些函數(shù)的指針以便使用。
實際上,為構(gòu)造函數(shù)和析構(gòu)函數(shù)進(jìn)行內(nèi)聯(lián)通常不是一個最佳選擇。請看下面示例中Derived類的構(gòu)造函數(shù):
class Base {
public:
...
private:
std::string bm1, bm2; // 基類成員1和2
};
class Derived: public Base {
public:
Derived() {} // 派生類的構(gòu)造函數(shù)為空 — 還有別的可能?
...
private:
std::string dm1, dm2, dm3; // 派生類成員 1–3
};
乍看上去,將這個構(gòu)造函數(shù)進(jìn)行內(nèi)聯(lián)再適合不過了,因為它不包含任何代碼。但是你的眼睛欺騙了你。
C++對于在創(chuàng)建和銷毀對象的過程中發(fā)生的事件進(jìn)行了多方面的保證。比如,當(dāng)你使用new時,你動態(tài)創(chuàng)建的對象就會通過構(gòu)造函數(shù)將其自動初始化;當(dāng)你使用delete時,將調(diào)用相關(guān)的析構(gòu)函數(shù)。當(dāng)你創(chuàng)建一個對象時,該對象的所有基類和所有數(shù)據(jù)成員將自動得到構(gòu)造,在銷毀這個對象時,相關(guān)的析構(gòu)過程將會以反方向自動進(jìn)行。如果在對象的構(gòu)造過程中有異常拋出,那么對象中已經(jīng)得到構(gòu)造的部分將統(tǒng)統(tǒng)被自動銷毀。在所有這些場景中,C++告訴你什么一定會發(fā)生,但它沒有說明如何發(fā)生。這一點取決于編譯器的實現(xiàn)者,但是必須要清楚的一點是,這些事情并不是自發(fā)的。你必須要在程序中添加一些代碼來實現(xiàn)它們。這些代碼一定存在于某處,它們由編譯器代勞,在編譯過程中插入你的程序中。一些時候它們就存在于構(gòu)造函數(shù)和析構(gòu)函數(shù)中,所以,上文中Derived構(gòu)造函數(shù)雖然看似是空的,但我們可以想象其與以下的具體實現(xiàn)中生成的代碼是等價的:
Derived::Derived() // Derived“空”構(gòu)造函數(shù)實現(xiàn):概念版
{
Base::Base(); // 初始化Base部分
try { dm1.std::string::string(); } // 嘗試構(gòu)造dm1
catch (...) { // 如果拋出異常,
Base::~Base(); // 銷毀基類部分,
throw; // 并且傳播該異常
}
try { dm2.std::string::string(); } // 嘗試構(gòu)造dm2
catch(...) { // 如果拋出異常,
dm1.std::string::~string(); // 銷毀dm1,
Base::~Base(); // 銷毀基類部分,
throw; // 并且傳播該異常
}
try { dm3.std::string::string(); } // 嘗試構(gòu)造dm3
catch(...) { // 如果拋出異常,
dm2.std::string::~string(); // 銷毀dm2,
dm1.std::string::~string(); // 銷毀dm1,
Base::~Base(); // 銷毀基類部分,
throw; // 并且傳播該異常
}
}
這段代碼并不能完全反映出真實的編譯器所做的事情,因為真實的編譯器采用的做法更加精密。然而,上面的代碼可以精確地反映出Derived的“空”構(gòu)造函數(shù)必須提供的內(nèi)容。無論編譯器處理異常的實現(xiàn)方式多么精密,Derived的構(gòu)造函數(shù)必須至少為其數(shù)據(jù)成員和基類調(diào)用構(gòu)造函數(shù),這些調(diào)用(可能就是內(nèi)聯(lián)的)會使Derived顯得不那么適合進(jìn)行內(nèi)聯(lián)。
這一推理過程對于Base的構(gòu)造函數(shù)同樣適用,因此如果將Base內(nèi)聯(lián),所有添加進(jìn)其中的代碼同樣也會添加進(jìn)Derived的構(gòu)造函數(shù)中(通過Derived構(gòu)造函數(shù)調(diào)用Base構(gòu)造函數(shù)的過程)。同時,如果string的構(gòu)造函數(shù)恰巧是內(nèi)聯(lián)的,那么Derived的構(gòu)造函數(shù)將為其復(fù)制出五份副本,分別對應(yīng)Derived對象中包含的五個字符串(兩個繼承而來,另外三個系對象本身包括)。至于為什么“Derived的構(gòu)造函數(shù)是否該內(nèi)聯(lián)須深思熟慮”,現(xiàn)在可能就很容易理解了。對于Derived的析構(gòu)函數(shù)也一樣,無論如何,由Derived的構(gòu)造函數(shù)所初始化的所有對象必須全部恰當(dāng)?shù)牡玫戒N毀。
庫設(shè)計者必須估算出將函數(shù)內(nèi)聯(lián)所帶來的影響,因為你無法為庫中的客戶可見的內(nèi)聯(lián)函數(shù)提供目標(biāo)代碼級別的升級。換句話說,如果f是庫中的一個內(nèi)聯(lián)函數(shù),那么庫的客戶就會將f的函數(shù)體編譯進(jìn)他們的程序中。如果一個庫實現(xiàn)者在后期修改了f的內(nèi)容,那么所有曾經(jīng)使用過f的客戶必須要重新編譯。這一點是我們所不希望看到的。另一個角度講,如果f不是內(nèi)聯(lián)函數(shù),那么修改f只需要客戶重新連接一下就可以了。這樣要比重新編譯減少很多繁雜的工作,并且,如果庫中需要使用的函數(shù)是動態(tài)鏈接的,那么它對于客戶就是完全透明的。
從開發(fā)優(yōu)質(zhì)程序的角度講,這些重要問題應(yīng)時刻牢記。但是以編寫代碼實際操作的角度來說,這一個事實將淹沒一切:大多數(shù)調(diào)試人員面對內(nèi)聯(lián)函數(shù)時會遇到麻煩。這并不會令人意外,你如何為一個不存在的函數(shù)設(shè)定一個跟蹤點呢?盡管一些構(gòu)建環(huán)境提供了內(nèi)聯(lián)函數(shù)調(diào)試的支持,但是大多數(shù)環(huán)境都在調(diào)試過程中直接禁止內(nèi)聯(lián)。
對于“哪個函數(shù)應(yīng)該聲明為inline而哪些不應(yīng)該”這一問題,我們可以由上文中引出一個邏輯上的策略。起初,不要內(nèi)聯(lián)任何內(nèi)容,或者僅挑選出那些不得不內(nèi)聯(lián)的函數(shù)(參見條目46)或者那些確實是很細(xì)小的程序(比如本節(jié)開篇處出現(xiàn)的Person::age)進(jìn)行內(nèi)聯(lián)。謹(jǐn)慎引入內(nèi)聯(lián),你就為調(diào)試工作提供了方便,但是你仍然要為內(nèi)聯(lián)擺正位置:它屬于手工的優(yōu)化操作。不要忘記80-20經(jīng)驗決定主義原則:一個典型的程序?qū)⒒ㄈ?0%的時間僅僅運行20%的代碼。這是一個非常重要的原則,因為它提醒著我們軟件開發(fā)者的目標(biāo):找出你的代碼中20%的這部分進(jìn)行優(yōu)化,從而從整體上提高程序的性能。你可以花費漫長的時間進(jìn)行內(nèi)聯(lián)、修改函數(shù)等等,但如果你沒有鎖定正確的目標(biāo),那么你做再多的努力也是徒勞。
時刻牢記
l 僅僅對小型的、調(diào)用頻率高的程序進(jìn)行內(nèi)聯(lián)。這將簡化你的調(diào)試操作,提供更靈活的目標(biāo)代碼可更新性,降低潛在的代碼膨脹發(fā)生的可能,并且可以讓程序獲得更高的速度。
l 不要將模板聲明為inline的,因為它們一般在頭文件中出現(xiàn)。