[轉(zhuǎn)]http://m.shnenglu.com/tiandejian/archive/2007/04/15/ecpp_04.html
第1項(xiàng): 確保對(duì)象在使用前得到初始化
C++ 在對(duì)象初始值問(wèn)題上顯得變化多端。比如說(shuō),你寫下了下面的代碼:
在許多情況下, x 會(huì)確保得到初始化(為零),但是另一些情況下則不會(huì),如果你這樣編寫:
class Point {
int x, y;
};
...
Point p;
p 的數(shù)據(jù)成員在一些情況下會(huì)確保得到初始化(為零),但是另一些情況就不會(huì)了。如果你以前學(xué)習(xí)的語(yǔ)言沒(méi)有對(duì)象初始化的概念,那么請(qǐng)你注意了,因?yàn)檫@很重要。
讀取未初始化的數(shù)據(jù)時(shí),程序?qū)⒊尸F(xiàn)出無(wú)法預(yù)知的行為。在一些語(yǔ)言平臺(tái)中,通常情況下讀取未初始化的數(shù)據(jù)將使你的程序無(wú)法運(yùn)行。更可能的情況時(shí),也許會(huì)得到內(nèi)存中某些位置上的半隨機(jī)的數(shù)據(jù),這些數(shù)據(jù)將會(huì)“污染”需要賦值的對(duì)象,最終,程序的行為將變得十分令人費(fèi)解,你也會(huì)陷入令人惱火的除錯(cuò)工作。
現(xiàn)在,人們制定了規(guī)則來(lái)規(guī)定:對(duì)象在什么時(shí)候確保會(huì)得到初始化,以及什么時(shí)候不會(huì)。但是遺憾的是,這些規(guī)則太過(guò)復(fù)雜了——在我看來(lái),你根本沒(méi)必要去記憶它們。整體上講,如果你正在使用 C++ 中 C 語(yǔ)言的一部分(參見(jiàn)第 1 項(xiàng)),那么初始化會(huì)引入一些額外的運(yùn)行時(shí)開(kāi)銷,這一部分中對(duì)象不會(huì)確保初始化。但當(dāng)你使用 非 C 的 C++ 部 分時(shí),情況就有所改變。這便可以解釋為什么數(shù)組( C++ 中的 C 語(yǔ)言)不會(huì)確保得到初始化,而一個(gè) vector ( C++ 中的 STL )會(huì)。
解決這類表面上的不確定性問(wèn)題最好的途徑就是:總是在使用對(duì)象之前對(duì)它們進(jìn)行初始化。對(duì)于內(nèi)建類型的非成員對(duì)象,你需要手動(dòng)完成這一工作。請(qǐng)看下邊的示例:
int x = 0; // 手動(dòng)初始化一個(gè) int 值
const char * text = "A C-style string"; // 手動(dòng)初始化一個(gè)指針(見(jiàn)第 3 項(xiàng))
double d;
std::cin >> d ; // 通過(guò)讀取輸入流進(jìn)行“初始化”
對(duì)于其他大多數(shù)情況而言,初始化的重?fù)?dān)就落在了構(gòu)造器的肩上。這里的規(guī)則很簡(jiǎn)單:確保所有的構(gòu)造器初始化了對(duì)象中的所有東西。
遵守這一規(guī)則是件很容易的事情,但是還有件重要的事:不要把賦值和初始化搞混了。請(qǐng)看下邊的示例,你可以看到表示通訊錄中一個(gè)條目的類的構(gòu)造器:
class PhoneNumber { ... };
class ABEntry { // ABEntry = "Address Book Entry"
public:
ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones);
private:
std::string theName;
std::string theAddress;
std::list<PhoneNumber> thePhones;
int num TimesConsulted;
};
ABEntry::ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones)
{
theName = name; // 以下這些是賦值,而不是初始化
theAddress = address;
thePhones = phones
numTimesConsulted = 0;
}
上邊的做法可以使得 ABEntry 的對(duì)象包含你所期望的值,但是這仍不是最優(yōu)的做法。 C++ 的規(guī) 則約定一個(gè)對(duì)象的數(shù)據(jù)成員要在進(jìn)入構(gòu)造器內(nèi)部之前得到初始化。在 ABEntry 的構(gòu)造器內(nèi)部, theName 、 theAddress 以及 thePhones 并不是得到了初始化,而是被賦值了。初始化工作應(yīng)該在更早的時(shí)候進(jìn)行:在進(jìn)入 ABEntry 構(gòu)造器內(nèi)部之前,這些數(shù)據(jù)成員的默認(rèn)構(gòu)造器應(yīng)該自動(dòng)得到調(diào)用。注意這對(duì)于 numTimesConsulted 不成立,因?yàn)樗莾?nèi)建數(shù)據(jù)類型的。對(duì)它而言,在被賦值以前,誰(shuí)也不能確保它得到了初始化。
編寫 ABEntry 的構(gòu)造器的更好的辦法是使用成員初始化表,而不是為它們一一賦值:
ABEntry::ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones)
: theName(name),
theAddress(address), // 現(xiàn)在這些是初始化
thePhones(phones),
numTimesConsulted(0)
{} // 現(xiàn)在構(gòu)造器內(nèi)部是空的
如果僅看運(yùn)行結(jié)果,上面的構(gòu)造器與更靠前一些的那個(gè)是等價(jià)的,但是后者的效率更高些。為數(shù)據(jù)成員賦值的版本首先調(diào)用了 theName 、 theAddress 以及 thePhones 的默認(rèn)構(gòu)造器來(lái)初始化它們,在默認(rèn)構(gòu)造器已經(jīng)為它們分配好了值之后,立即又為它們重新賦了一遍值。于是默認(rèn)構(gòu)造器的所有工作就都白費(fèi)了。使用成員初始化表的方法可以避免這一浪費(fèi),這是因?yàn)椋撼跏蓟碇械膮?shù)對(duì)于各種數(shù)據(jù)成員均使用構(gòu)造器參數(shù)的形式出現(xiàn)。這樣, theName 就通過(guò)復(fù)制 name 的值完成了構(gòu)造, theAddress 通過(guò)復(fù)制 address 的值完成構(gòu)造, thePhones 通過(guò)復(fù)制 phones 的值完成構(gòu)造。對(duì)于大多數(shù)類型而言,通過(guò)單一的調(diào)用拷貝構(gòu)造器更加高效——在一些情況下尤其明顯——相對(duì)于首先調(diào)用默認(rèn)構(gòu)造器,然后再調(diào)用拷貝運(yùn)算符而言。
對(duì)于內(nèi)建類型的對(duì)象,比如 numTimeConsulted ,初始化與賦值的開(kāi)銷是完全相同的,但是為了保證持久性,最好在初始化時(shí)不要忘記這類成員。類似地,即使你期望讓默認(rèn)構(gòu)造器來(lái)構(gòu)造一個(gè)數(shù)據(jù)成員,你仍可以使用成員初始化表,只是不為初始化參數(shù)指定一個(gè)具體的值而已。比如,如果 ABEntry 擁有一個(gè)無(wú)參構(gòu)造器,它可以這樣實(shí)現(xiàn):
ABEntry::ABEntry()
:theName(), // 調(diào)用 theName 的默認(rèn)構(gòu)造器;
theAddress(), // theAddress 和 thePhones
thePhones(), // 做同樣的工作;
numTimesConsulted(0) // 但是 numTimesConsulted
{} // 一定要顯性初始化為零
這是因?yàn)椋寒?dāng)用戶定義類型的數(shù)據(jù)成員沒(méi)有構(gòu)造器列在成員初始化表中的時(shí)候,編譯器會(huì)自動(dòng)為其調(diào)用默認(rèn)構(gòu)造器,一些程序員認(rèn)為這樣做有些過(guò)分了。這可以理解。但是“總將每個(gè)數(shù)據(jù)成員列在初始化表中”這一策略可以使你不必在出現(xiàn)疏忽以后,返回去查找哪些數(shù)據(jù)成員沒(méi)有進(jìn)行初始化——疏忽是不存在的。比如說(shuō),如果你因?yàn)?/span> numTimesConsulted 是內(nèi)建數(shù)據(jù)類型的,就不將其列入成員初始化表中,那么你的代碼便極有可能呈現(xiàn)出無(wú)法預(yù)知的行為。
有些時(shí)候必須使用初始化表,即使是對(duì)于內(nèi)建類型。舉例說(shuō), const 或者引用的數(shù)據(jù)成員必須得到初始化。它們不能被賦值(另請(qǐng)參看第 5 項(xiàng))。對(duì)于那些既可以初始化又可以賦值的數(shù)據(jù)成員,為了省去記憶何時(shí)必須使用成員初始化表來(lái)初始化它們,最簡(jiǎn)便的選擇就是永遠(yuǎn)都使用初始化表。一些時(shí)候初始化表是必須的,在更多情況下這樣做是為了獲得比賦值更高的效率。
許多類設(shè)計(jì)有多個(gè)構(gòu)造器,每個(gè)構(gòu)造器都有自己的成員初始化表。如果有非常多的數(shù)據(jù)成員和 / 或基類時(shí),就會(huì)存在多個(gè)初始化表,這時(shí)列表中將存在不少無(wú)意義的重復(fù),程序員們也會(huì)變得十分厭煩。在這種情況下,你也可以考慮忽略表中的一些項(xiàng)目,這些忽略的數(shù)據(jù)成員應(yīng)符合這一條件:對(duì)它們進(jìn)行賦值還是真正的初始化沒(méi)有什么差別。可以把這些賦值語(yǔ)句放在一個(gè)單一(當(dāng)然是私有的)的函數(shù)里,并讓所有的構(gòu)造器在必要的時(shí)候調(diào)用這個(gè)函數(shù)。這一方法在數(shù)據(jù)成員要接收的真實(shí)的初始化數(shù)據(jù)保存在一個(gè)文件中,或者要到一個(gè)數(shù)據(jù)庫(kù)中去查找時(shí),尤其有用。但是大致上講,真正的成員初始化終究要比通過(guò)賦值進(jìn)行偽初始化要好。
C++ 還是存在 穩(wěn)定的方面的,其中之一就是:對(duì)象中數(shù)據(jù)的初始化的順序是恒定的。這個(gè)次序通常情況下是這樣的:基類應(yīng)在派生類之前得到初始化(另參見(jiàn)第 12 項(xiàng)),在類的內(nèi)部,數(shù)據(jù)成員應(yīng)以它們聲明的順序得到初始化。比如說(shuō)在 ABEntry 內(nèi)部, theName 永遠(yuǎn)都是第一個(gè)得到初始化的, theAddress 第二, thePhones 第三, numTimesConsulted 最后。即使它們?cè)诔蓡T初始化表中的排列順序不同于聲明次序,(這樣做看上去不應(yīng)該算作法,但不幸的是事實(shí)不是這樣。)上述初始化順序也會(huì)得到遵循。為了不使讀者陷入困惑,也為了避免日后出現(xiàn)讓人難以理解的 bug ,你應(yīng)該保證初始化表中成員的順序與它們被聲明時(shí)的順序嚴(yán)格一致。
在你完成了對(duì)內(nèi)建類型的非成員對(duì)象的顯式初始化,并且確保了構(gòu)造器使用成員初始化表對(duì)基類和數(shù)據(jù)成員進(jìn)行了初始化之后,需要你關(guān)心的工作就僅剩下了一個(gè),那就是(先長(zhǎng)舒一口氣):在不同的置換單元中,非局部靜態(tài)對(duì)象的初始化次序是怎樣的。
讓我們一步一步地解決這個(gè)問(wèn)題:
一個(gè)靜態(tài)對(duì)象在被構(gòu)造之后,它的壽命一直延續(xù)到程序結(jié)束。保存在?;蚨阎械膶?duì)象都不是這樣。靜態(tài)對(duì)象包括:全局對(duì)象、名字空間域?qū)ο蟆㈩悆?nèi)部的 static 對(duì)象、函數(shù)內(nèi)部的 static 對(duì)象,文件域的 static 對(duì)象。函數(shù)內(nèi)部的靜態(tài)對(duì)象通常叫做局部靜態(tài)對(duì)象(這是因?yàn)樗鼈儗?duì)于函數(shù)而言是局部的),其它類型的靜態(tài)對(duì)象稱為非局部靜態(tài)對(duì)象。靜態(tài)對(duì)象在程序退出的時(shí)候會(huì)被自動(dòng)銷毀,換句話說(shuō),在 main 中止運(yùn)行的時(shí)候,靜態(tài)對(duì)象的析構(gòu)器會(huì)自動(dòng)得到調(diào)用。
一個(gè)置換單元是這樣一段源代碼:由它可以生成一個(gè)目標(biāo)文件。通常一個(gè)置換單元是以單一一個(gè)代碼文件為基礎(chǔ),還要包括所有被 #include 進(jìn)來(lái)的文件。
于是,我們所要解決的問(wèn)題中,至少包含兩個(gè)需要單獨(dú)編譯的源碼文件,每一個(gè)都至少包含一個(gè)非局部靜態(tài)對(duì)象(換句話說(shuō),是一個(gè)全局的,或者名字空間域的,抑或類內(nèi)部或者文件域的 static 對(duì)象)。問(wèn)題的本質(zhì)在于:如果一個(gè)置換單元內(nèi)的一個(gè)非局部靜態(tài)對(duì)象的初始化工作利用了另一個(gè)置換空間內(nèi)的另一個(gè)非局部靜態(tài)變量,那么所使用的對(duì)象應(yīng)該是未經(jīng)初始化的,這是因?yàn)椋?em>定義在不同置換單元內(nèi)的非靜態(tài)對(duì)象的初始化工作的順序是未定義的。
這里一個(gè)示例可以幫助我們理解這一問(wèn)題。假設(shè)你編寫了一個(gè) FileSystem 類,它可以讓 Internet 上的文件看上去像是本地的。由于你的類要使得整個(gè)世界看上去像是一個(gè)單一的文件系統(tǒng),你應(yīng)該創(chuàng)建一個(gè)專門的類來(lái)代表這個(gè)單一的文件系統(tǒng),讓這個(gè)類擁有全局的或者名字空間的作用域:
class FileSystem { // 來(lái)自你的庫(kù)
public:
...
std::size_t numDisks() const; // 許多成員函數(shù)中的一個(gè)
...
};
extern FileSystem tfs; // 供客戶端使用的對(duì)象
// "tfs" = "the file system"
一個(gè) FileSystem 對(duì)象絕對(duì)是重量級(jí)的,所以說(shuō)在 tfs 對(duì)象被構(gòu)造之前使用它會(huì)帶來(lái)災(zāi)難性后果。
現(xiàn)在設(shè)想一下,一些客戶端程序員為文件系統(tǒng)創(chuàng)建了一個(gè)文件夾的類。很自然地,他們的類會(huì)使用 tfs 對(duì)象。
class Directory { // 由客戶端程序員創(chuàng)建
public:
Directory( params );
...
};
Directory::Directory( params )
{
...
std::size_t disks = tfs.numDisks(); // 使用 tfs 對(duì)象
...
}
進(jìn)一步設(shè)想, 客戶端程序員 可能會(huì)為臨時(shí)文件創(chuàng)建 一個(gè)單獨(dú)的 Directory 對(duì)象:
Directory tempDir( params ); // 存放臨時(shí)文件的文件夾
現(xiàn)在,出示化次序的重要性已然浮出水面:除非 tfs 在 tempDir 得到初始化, tempDir 的構(gòu)造器將會(huì)嘗試在 tfs 被初始化之前使用它。但是 tfs 和 tempDir 是由不同的人、在不同的時(shí)間、在不同的源碼文件中創(chuàng)建的——這兩者都是非局部靜態(tài)對(duì)象,它們定義于不同的置換單元中。那么你如何保證 tfs 在 tempDir 之前得到初始化呢?
事實(shí)上這是不可能的。重申一遍, 定義在不同置換單元內(nèi)的非靜態(tài)對(duì)象的初始化工作的順序是未定義的 。當(dāng)然這是有理由的:為非局部靜態(tài)對(duì)象確定“恰當(dāng)?shù)?#8221;初始化順序是一件很有難度的工作。非常有難度。根本無(wú)法解決。在其大多數(shù)形式——由隱式模板實(shí)例化產(chǎn)生的多個(gè)置換單元和非局部靜態(tài)對(duì)象(也許它們是自己產(chǎn)生的,只是產(chǎn)生的過(guò)程借助了隱式模板實(shí)例化的力量)——這不僅使得確認(rèn)初始化的順序變得不可能,甚至尋找一種可行的初始化順序的特殊情況,都顯得毫無(wú)意義。
幸運(yùn)的是,一個(gè)小小的方法可以完全排除這個(gè)難題。所要做的僅僅是把每個(gè)非局部靜態(tài)對(duì)象移入為它創(chuàng)建的專用函數(shù)中,函數(shù)要聲明為 static 的。這些函數(shù)返回一個(gè)它們所包含的對(duì)象的引用。于是客戶端程序員就可以調(diào)用這些函數(shù),而不是直接使用那些對(duì)象。也就是說(shuō),非局部靜態(tài)對(duì)象被局部靜態(tài)對(duì)象取代了。(設(shè)計(jì)模式迷們很容易發(fā)現(xiàn),這是 Singleton 模式一個(gè)通用實(shí)現(xiàn)。)
這一方法基于 C++ 的一個(gè)約定,那就是:對(duì) 于局部靜態(tài)對(duì)象來(lái)說(shuō), 在其被上述函數(shù)調(diào)用的時(shí)候,程序中第一次引入了對(duì) 該對(duì)象的定義,它在此時(shí)就一定會(huì)得到初始化。所以說(shuō)對(duì)于局部靜態(tài)對(duì)象,如果你不使用直接訪問(wèn),而改用“通過(guò)函數(shù)返回的引用來(lái)調(diào)用”,你就保證了你得到的這一引用所引用的是一個(gè)經(jīng)初始化的對(duì)象。作為獎(jiǎng)勵(lì),如果你從未調(diào)用過(guò)模仿非局部靜態(tài)對(duì)象的函數(shù),你的程序就永遠(yuǎn)不會(huì)引入對(duì)這類對(duì)象進(jìn)行構(gòu)造和析構(gòu)的開(kāi)銷,而這對(duì)于真正的非局部靜態(tài)對(duì)象來(lái)說(shuō)是不可能的。
下面是對(duì)這一技術(shù)的應(yīng)用,以 tfs 和 tempDir 為示例:
class FileSystem { ... }; // 同上
FileSystem& tfs() // 這一函數(shù)代替了 tfs 對(duì)象;它在
// FileSystem 類中應(yīng)該是 static 的
{
static FileSystem fs; // 對(duì)局部靜態(tài)對(duì)象的定義和初始化
return fs; // 返回該對(duì)象的引用
}
class Directory { ... }; // 同上
Directory::Directory( params )// 同上,但對(duì) tfs 的引用現(xiàn)在為對(duì) tfs()
{
...
std::size_t disks = tfs().numDisks();
...
}
Directory& tempDir() // 這個(gè)函數(shù)取代了 tempDir 對(duì)象;它在 it
// Directory 類中可以是 static 的
{
static Directory td; // 對(duì)局部靜態(tài)對(duì)象的定義和初始化
return td; // 返回該對(duì)象的引用
}
這一改進(jìn)系統(tǒng)不需要客戶端程序員做出任何改變,除了他們所引用的是 tfs() 和 tempDir() 而不是 tfs 和 tempDir 。也就是說(shuō),他們使用的是函數(shù)返回的引用而不是直接使用對(duì)象本身。
編寫這一類返回引用的函數(shù)所需要遵循的方針總是十分簡(jiǎn)單的 :在第 1 行定義和初始化一個(gè)局部靜態(tài)對(duì)象,在第 2 行返回它的引用。如 此的簡(jiǎn)單易用使得這類函數(shù)非常適合作為內(nèi)聯(lián)函數(shù),尤其是對(duì)它們的調(diào)用非常頻繁時(shí)(參見(jiàn)第 30 項(xiàng))。另外,這些函數(shù)中包含著靜態(tài)對(duì)象,在多線程系統(tǒng)中它們也許會(huì)遇到問(wèn)題。在此聲明,任何種類的非 const 靜態(tài)對(duì)象,無(wú)論是局部的還是非局部的,它們面對(duì)多線程都會(huì)碰到這樣那樣的問(wèn)題。解決這一問(wèn)題的方法之一是:在程序還以單線程狀態(tài)運(yùn)行時(shí),手動(dòng)調(diào)用所有的這類返回引用的函數(shù)。這可以排除與初始化相關(guān)的競(jìng)爭(zhēng)狀態(tài)的出現(xiàn)。
當(dāng)然,使用此類返回引用的函數(shù)來(lái)防止初始化次序問(wèn)題的理念,首先基于此處存在一個(gè)合理的初始化次序。如果你的 系統(tǒng)要求對(duì)象 A 必須在對(duì)象 B 之前得到初始化,但是 A 的初始化需要以 B 的初始化 為前提,你將會(huì)面臨一個(gè)問(wèn)題,坦白說(shuō),你是咎由自取。然而,如果你能夠駕馭這一不正常的境況,這里介紹的解決方法仍然可以良好的為你服務(wù),至少對(duì)于單線程應(yīng)用程序來(lái)說(shuō)是這樣的。
為了避免在對(duì)象初始化之前使用它,你僅僅需要做三件事。第一,手動(dòng)初始化基本類型的非成員對(duì)象。第二,使用成員初始化表來(lái)初始化對(duì)象的每一部分。最后,初始化次序的不確定性會(huì)使定義于不同置換單元中的非局部靜態(tài)對(duì)象之間產(chǎn)生沖突,要避免這樣的設(shè)計(jì)。
需要記住的
l 由于 C++ 只在某些情況下對(duì)于基本類型對(duì)象進(jìn)行初始化,所以對(duì)它們要進(jìn)行手動(dòng)初始化。
l 對(duì)于構(gòu)造器,要盡量使用成員初始化表,避免在構(gòu)造器內(nèi)部進(jìn)行復(fù)制。初始化表中的次序要與成員在類中被聲明的次序相一致。
l 要避免跨置換單元的初始化次序問(wèn)題發(fā)生,可以使用局部靜態(tài)對(duì)象來(lái)代替非局部靜態(tài)對(duì)象。