大約每隔十年,都會(huì)出現(xiàn)一個(gè)編程新概念,宣布自己是以往概念的繼承者。我們也再一次相信,從今往后軟件比以前更可靠,更容易build,或者更有意思(沒(méi)有人相信它會(huì)比以前更小或者更快)。在70年代,有結(jié)構(gòu)編程;在80年代,開(kāi)始了面向?qū)ο缶幊?;?0年代中期,出現(xiàn)了范型編程(generic programming)。范型編程得名于其用模板而使代碼重用的高效技術(shù)(范型類(lèi)和范型函數(shù))。
模板類(lèi)和模板函數(shù)都是非常有用的工具。例如sqr()函數(shù)可以計(jì)算平方數(shù),任何定義了乘法運(yùn)算的數(shù)據(jù)類(lèi)型(數(shù)字,矩陣)都適用。標(biāo)準(zhǔn)容器類(lèi)(如list)都是模板,這樣對(duì)于每個(gè)新類(lèi)型無(wú)需重寫(xiě)了,這正是使用舊版的C++時(shí)真正頭疼的事情,因此我認(rèn)為ISO的標(biāo)準(zhǔn)是個(gè)偉大的進(jìn)步。然而,在這個(gè)過(guò)程中有些東西用得過(guò)頭了。
例如:標(biāo)準(zhǔn)庫(kù)中得string 和iostream 都是使用"character traits"類(lèi)型作為參數(shù)。這意味著同一個(gè)basic_string<>類(lèi)可以用于ASCII字符串,也可用于Unicode,甚至用于火星人的三字節(jié)字符串(原則雖然如此,但許多版本都只是實(shí)現(xiàn)了ASCII字符串,看起來(lái)有點(diǎn)滑稽)。標(biāo)準(zhǔn)要求這些常用類(lèi)必須實(shí)現(xiàn)成模板形式,而這些類(lèi)幾乎涉及到所有C++應(yīng)用。
但是這對(duì)性能和調(diào)試會(huì)帶來(lái)許多麻煩。下面幾個(gè)試驗(yàn)解釋了這個(gè)問(wèn)題(本試驗(yàn)使用的編譯器為VC++6.0)。編譯器同時(shí)支持新風(fēng)格的iostream(使用模板)和經(jīng)典風(fēng)格的iostream, 因此我們能比較他們二者的版本實(shí)現(xiàn)。第一個(gè)測(cè)試程序當(dāng)然是使用"Hello, Word"了,新風(fēng)格的編譯時(shí)間是經(jīng)典風(fēng)格的2倍。另一個(gè)更正規(guī)的例子大約有200行,每行輸出10個(gè)變量用于計(jì)數(shù)。這個(gè)測(cè)試程序最顯著的結(jié)論是編譯速度:新風(fēng)格版本花了10秒編譯完成,而舊版本只使用了1.5秒。10秒時(shí)間可并不少,可以完成很多事情。另外,新風(fēng)格版本的可執(zhí)行文件的大小為115K,而舊版本只有70K。你的測(cè)試數(shù)據(jù)可能有些出入,但是整體結(jié)論是一樣的:當(dāng)使用新版本時(shí),會(huì)有更慢的編譯速度和更大的可執(zhí)行文件。這并不是因?yàn)槲④浌揪幾g器的問(wèn)題,使用GCC測(cè)試也會(huì)得到同樣的結(jié)論。
當(dāng)然,和過(guò)去不一樣,可執(zhí)行文件的大小并不是那么重要,現(xiàn)在,可編程設(shè)備種類(lèi)正快速增長(zhǎng),包括許多信息應(yīng)用,如遙控、手機(jī)、智能冰箱、基于藍(lán)牙技術(shù)的咖啡機(jī)等等,在這些應(yīng)用中內(nèi)存近幾年都會(huì)是十分寶貴的資源。使用標(biāo)準(zhǔn)iostream 而產(chǎn)生的額外的二進(jìn)制文件,來(lái)源于內(nèi)聯(lián)了整個(gè)模板類(lèi)的代碼,要是沒(méi)有code bload工具,你很難優(yōu)化那些重要的操作。對(duì)我來(lái)說(shuō),編譯時(shí)間問(wèn)題更嚴(yán)重一些,因?yàn)檫@樣意味著更長(zhǎng)的等待,從而失去了開(kāi)發(fā)中非常重要原則:互動(dòng)原則。
現(xiàn)在我們來(lái)考慮調(diào)試的問(wèn)題。標(biāo)準(zhǔn)庫(kù)中string 類(lèi)的模板實(shí)現(xiàn)非常聰明,但并不適合于調(diào)試。你會(huì)面臨使用超長(zhǎng)名字的編譯器和調(diào)試器的信息:
class std::basic_string<char,struct std::char_traits<char>,class std::allocator<char>>
同樣對(duì)于非常有用的容器 map < string,string > , 你可以去想象其復(fù)雜性。這些名字太長(zhǎng)了,以至于產(chǎn)生數(shù)十個(gè)內(nèi)部名字被截?cái)嗟木妗?duì)于初學(xué)者來(lái)說(shuō),std::string 應(yīng)該設(shè)計(jì)得盡可能透明,而不應(yīng)該讓他們面臨許多語(yǔ)言?xún)?nèi)置得一些特性。當(dāng)輸出了編譯錯(cuò)誤信息后,在技術(shù)上講,應(yīng)該是可以查找到所有的 typedef 。我在 UnderC 項(xiàng)目中就試圖這么做。Verity Stob 建議編寫(xiě)一個(gè)后置的處理器來(lái)翻譯這些錯(cuò)誤信息,我倒希望這是她這么做只是開(kāi)個(gè)玩笑。如果不使用這么復(fù)雜的類(lèi)型,這個(gè)問(wèn)題就會(huì)容易處理的多。我在C++開(kāi)發(fā)上的秘訣就是(我首次坦誠(chéng)的公開(kāi)這個(gè)秘密): 在稍微大一點(diǎn)的工程中使用一個(gè)兼容的string 類(lèi)來(lái)替換std::string 的頭文件. 有時(shí)我會(huì)重新build 這些標(biāo)準(zhǔn)的頭文件,用來(lái)檢測(cè)是否我的庫(kù)還能正常使用,但讓其他人為如何提高其性能而努力。
當(dāng)然,在許多應(yīng)用中我們都需要這種std::string提供的靈活性,例如,需要同時(shí)處理ASCII 和Unicode字符串,或者需要定制自己的allocator 等等。但這并不是普遍需求(通常程序員要么只處理ASCII,要么只處理Unicode ), 看起來(lái)對(duì)于程序員承擔(dān)這種范型機(jī)制有些不公平。這種機(jī)制確實(shí)讓標(biāo)準(zhǔn)庫(kù)的設(shè)計(jì)者覺(jué)得很有意思,但增加了應(yīng)用開(kāi)發(fā)程序員使用的復(fù)雜度。這似乎顛倒了這個(gè)原則:良好的標(biāo)準(zhǔn)庫(kù)設(shè)計(jì)應(yīng)該隱藏其實(shí)現(xiàn)的復(fù)雜度,而讓用戶(hù)直接使用。但std::string 對(duì)其實(shí)現(xiàn)的復(fù)雜度隱藏得并不夠,導(dǎo)致在用戶(hù)使用過(guò)程中不斷的遇到設(shè)計(jì)中的問(wèn)題。我們不能要求標(biāo)準(zhǔn)庫(kù)的用戶(hù)都是專(zhuān)家。標(biāo)準(zhǔn)堅(jiān)持要求這種特定的實(shí)現(xiàn)方式,和標(biāo)準(zhǔn)庫(kù)的設(shè)計(jì)初衷相違背,其初衷是只提供公共的接口和包含一些特定功能的類(lèi)庫(kù)。自然,這種范型模板對(duì)于那些真正去要他們的人是一直有效的。
這些細(xì)節(jié)考慮同樣應(yīng)用于標(biāo)準(zhǔn)容器,例如list<>容器,list 有一些額外的默認(rèn)模板參數(shù),用于定義了默認(rèn)的allocator。當(dāng)然自己定義allocator 十分有用,但絕大多數(shù)人不需要自己去實(shí)現(xiàn)。這些泛化的版本完全可以作為單獨(dú)的模板提供。我承認(rèn)這樣做會(huì)讓標(biāo)準(zhǔn)庫(kù)的設(shè)計(jì)在技術(shù)上變得沒(méi)有以前有意思,但這些庫(kù)在設(shè)計(jì)之初就應(yīng)該考慮到最終用戶(hù)。篡改一下C++的頌歌:用戶(hù)不應(yīng)該為他們不需要的東西買(mǎi)單。
當(dāng)我們不需要模板的時(shí)候,我們不得不使用模板。除此之外,在C++中用范型編程還會(huì)遇到另一個(gè)的問(wèn)題。大多數(shù)人都同意,標(biāo)準(zhǔn)的algorithm 十分有用。如果你有一個(gè)整型的vector, 你可以直接使用下面的語(yǔ)句來(lái)排序:
sort(v.begin(),v.end());
因?yàn)閕nt型數(shù)據(jù)的比較函數(shù)時(shí)內(nèi)聯(lián)的,而且這種范型算法比舊版本的qsort()函數(shù)速度還快,也更容易使用,特別是使用用戶(hù)自定義類(lèi)型的vector. copy()函數(shù)也可以在任何時(shí)候高效率地拷貝任何數(shù)據(jù)。
但有些應(yīng)用理解起來(lái)十分晦澀:
copy_if(v.begin(),v.end(),ostream_iterator<int>(cout) bind2nd(greater<int>(),7));
如果要寫(xiě)得嚴(yán)格一點(diǎn),每個(gè)名字都應(yīng)該加上std::前綴,這里假定所有變量都是使用全局命名空間,或單獨(dú)使用命令或用其他方法。用Stroustrup (C++的創(chuàng)始人)的例子更容易說(shuō)明問(wèn)題,這個(gè)例子把所有的整型數(shù)輸出到終端:
vector<int>::iterator li;
for (li = v.begin(); li != v.end(); ++li)
if (*li > 7) cout << *li;
Stroustrup 告訴我們?nèi)绻褂蔑@示的循環(huán)是"麻煩而又容易產(chǎn)生錯(cuò)誤", 但我看不出使用第一個(gè)版本有什么優(yōu)勢(shì)。顯然,人們能習(xí)慣這種方式,人類(lèi)的適應(yīng)性很強(qiáng),作為專(zhuān)業(yè)人士,我們也不得不學(xué)習(xí)這個(gè)新概念。但是,這樣做并沒(méi)有減少多少麻煩,而且我們可以證明這樣做可讀性更差,更不靈活。同時(shí),它還會(huì)限制你的設(shè)計(jì)。例如,假設(shè)我們有一個(gè)Shape * 的指針list, 我們可以通過(guò)下面的調(diào)用方式來(lái)畫(huà)出他們自己的形狀:
for_each(ls.begin(),ls.end(),
bind2nd(mem_fun(&Shape::draw),canvas));
也可以選擇這種方式:
ShapeList::iterator li;
for (li = ls.begin(); li != ls.end(); ++li)
(*li)->draw(canvas);
現(xiàn)在假設(shè)我需要修改我的設(shè)計(jì),我只想畫(huà)那些滿(mǎn)足某種要求的圖形(而且不希望把這些需求包在shape類(lèi)里面), 那么我只需要在顯式的循環(huán)中增加一條if條件語(yǔ)句。如果要使用范型概念,我唯一能想到的方式定義一個(gè)函數(shù),然后使用for_each()算法。使用設(shè)計(jì)模式一書(shū)中的術(shù)語(yǔ),第一個(gè)例子是一個(gè)內(nèi)部迭代器(internal iterator),第二個(gè)例子式一個(gè)外部跌倒器(external iterator). 作者認(rèn)為C++ 并不擅長(zhǎng)使用內(nèi)部迭代器,我想我們還是應(yīng)該考慮語(yǔ)言的局限性。其實(shí)問(wèn)題在于在C++中過(guò)度應(yīng)用范型概念--從而導(dǎo)致不必要的難度。C++ 完全不支持一般的匿名函數(shù)(anonymous functions)如LIST, SmallTalk, Ruby等。C++中的匿名函數(shù)或許看起來(lái)和下面一樣,可能某天有人會(huì)實(shí)現(xiàn)它:
for_each(ls.begin(),ls.end(),
void lambda(Shape *p) { p->draw(canvas); });
C++ 是一種不可思議的編程語(yǔ)言,小到手機(jī),大到跨國(guó)際網(wǎng)絡(luò),都有其應(yīng)用。它非常靈活,能夠支持多種編程風(fēng)格,但這種靈活同樣也是其問(wèn)題所在。編程的藝術(shù)在于為特定的問(wèn)題選擇合適編程風(fēng)格,就像老師總提醒寫(xiě)作文是要選擇好的風(fēng)格一樣。我并不想詆毀 C++ 標(biāo)準(zhǔn)庫(kù),這里面包含了許多人的辛勤勞動(dòng),并為大家提供了一個(gè)公共平臺(tái)。我對(duì)于這個(gè)標(biāo)準(zhǔn)的態(tài)度是,它和范型編程聯(lián)系過(guò)于緊密,從而變成了在說(shuō)明什么風(fēng)格是好的編程風(fēng)格(例如,算法中明顯傾向于不要使用顯式循環(huán)), 同時(shí)它也讓程序員們不得不介入一些實(shí)現(xiàn)細(xì)節(jié)(如basic_string<>),這樣做讓人們更加覺(jué)得C++ 是只是內(nèi)核工程師們的編程語(yǔ)言。