1、什么是STL
不知道你是否有過(guò)這樣的經(jīng)歷。在你準(zhǔn)備著手完成數(shù)據(jù)結(jié)構(gòu)老師所布置的家庭作業(yè)時(shí),或者在你為你所負(fù)責(zé)的某個(gè)軟件項(xiàng)目中添加一項(xiàng)新功能時(shí),你發(fā)現(xiàn)需要用到一個(gè)鏈表(List)或者是映射表(Map)之類的東西,但是手頭并沒(méi)有現(xiàn)成的代碼。于是在你開(kāi)始正式考慮程序功能之前,手工實(shí)現(xiàn)List或者M(jìn)ap是不可避免的。于是……,最終你順利完成了任務(wù)。或許此時(shí),作為一個(gè)具有較高素養(yǎng)的程序員的你還不肯罷休(或者是一個(gè)喜歡偷懶的優(yōu)等生:),因?yàn)槟銜?huì)想到,如果以后還遇到這樣的情況怎么辦?沒(méi)有必要再做一遍同樣的事情吧!
如果說(shuō)上述這種情形每天都在發(fā)生,或許有點(diǎn)夸張。但是,如果說(shuō)整個(gè)軟件領(lǐng)域里,數(shù)十年來(lái)確實(shí)都在為了一個(gè)目標(biāo)而奮斗--可復(fù)用性(reusability),這看起來(lái)似乎并不夸張。從最早的面向過(guò)程的函數(shù)庫(kù),到面向?qū)ο蟮某绦蛟O(shè)計(jì)思想,到各種組件技術(shù)(如:COM、EJB),到設(shè)計(jì)模式(design pattern)等等。而STL也在做著類似的事情,同時(shí)在它背后蘊(yùn)涵著一種新的程序設(shè)計(jì)思想--泛型化設(shè)計(jì)(generic programming)。
STL(Standard Template Library),即標(biāo)準(zhǔn)模板庫(kù),是一個(gè)具有工業(yè)強(qiáng)度的,高效的C++程序庫(kù)。它被容納于C++標(biāo)準(zhǔn)程序庫(kù)(C++ Standard Library)中,是ANSI/ISO C++標(biāo)準(zhǔn)中最新的也是極具革命性的一部分。該庫(kù)包含了諸多在計(jì)算機(jī)科學(xué)領(lǐng)域里所常用的基本數(shù)據(jù)結(jié)構(gòu)和基本算法。為廣大C++程序員們提供了一個(gè)可擴(kuò)展的應(yīng)用框架,高度體現(xiàn)了軟件的可復(fù)用性。這種現(xiàn)象有些類似于Microsoft Visual C++中的MFC(Microsoft Foundation Class Library),或者是Borland C++ Builder中的VCL(Visual Component Library),對(duì)于此二者,大家一定不會(huì)陌生吧。
從邏輯層次來(lái)看,在STL中體現(xiàn)了泛型化程序設(shè)計(jì)的思想(generic programming),引入了諸多新的名詞,比如像需求(requirements),概念(concept),模型(model),容器(container),算法(algorithmn),迭代子(iterator)等。與OOP(object-oriented programming)中的多態(tài)(polymorphism)一樣,泛型也是一種軟件的復(fù)用技術(shù)。
從實(shí)現(xiàn)層次看,整個(gè)STL是以一種類型參數(shù)化(type parameterized)的方式實(shí)現(xiàn)的,這種方式基于一個(gè)在早先C++標(biāo)準(zhǔn)中沒(méi)有出現(xiàn)的語(yǔ)言特性--模板(template)。如果查閱任何一個(gè)版本的STL源代碼,你就會(huì)發(fā)現(xiàn),模板作為構(gòu)成整個(gè)STL的基石是一件千真萬(wàn)確的事情。除此之外,還有許多C++的新特性為STL的實(shí)現(xiàn)提供了方便。
1.3.1 STL和C++
沒(méi)有C++語(yǔ)言就沒(méi)有STL,這么說(shuō)毫不為過(guò)。一般而言,STL作為一個(gè)泛型化的數(shù)據(jù)結(jié)構(gòu)和算法庫(kù),并不牽涉具體語(yǔ)言(當(dāng)然,在C++里,它被稱為 STL)。也就是說(shuō),如果條件允許,用其他語(yǔ)言也可以實(shí)現(xiàn)之。這里所說(shuō)的條件,主要是指類似于"模板"這樣的語(yǔ)法機(jī)制。如果你沒(méi)有略過(guò)前一節(jié)內(nèi)容的話,應(yīng)該可以看到,Alexander Stepanov在選擇C++語(yǔ)言作為實(shí)現(xiàn)工具之前,早以采用過(guò)多種程序設(shè)計(jì)語(yǔ)言。但是,為什么最終還是C++幸運(yùn)的承擔(dān)了這個(gè)歷史性任務(wù)呢?原因不僅在于前述那個(gè)條件,還在于C++在某些方面所表現(xiàn)出來(lái)的優(yōu)越特性,比如:高效而靈活的指針。但是如果把C++作為一種OOP(Object- Oriented Programming,面向?qū)ο蟪绦蛟O(shè)計(jì))語(yǔ)言來(lái)看待的話(事實(shí)上我們一般都是這么認(rèn)為的,不是嗎?),其功能強(qiáng)大的繼承機(jī)制卻沒(méi)有給STL的實(shí)現(xiàn)幫上多大的忙。在STL的源代碼里,并沒(méi)有太多太復(fù)雜的繼承關(guān)系。繼承的思想,甚而面向?qū)ο蟮乃枷耄€不足以實(shí)現(xiàn)類似STL這樣的泛型庫(kù)。C++只有在引入了 "模板"之后,才直接導(dǎo)致了STL的誕生。這也正是為什么,用其他比C++更純的面向?qū)ο笳Z(yǔ)言無(wú)法實(shí)現(xiàn)泛型思想的一個(gè)重要原因。當(dāng)然,事情總是在變化之中,像Java在這方面,就是一個(gè)很好的例子,jdk1.4中已經(jīng)加入了泛型的特性。
此外,STL對(duì)于C++的發(fā)展,尤其是模板機(jī)制,也起到了促進(jìn)作用。比如:模板函數(shù)的偏特化(template function partial specialization),它被用于在特定應(yīng)用場(chǎng)合,為一般模板函數(shù)提供一系列特殊化版本。這一特性是繼STL被ANSI/ISO C++標(biāo)準(zhǔn)委員會(huì)通過(guò)之后,在Bjarne和Stepanov共同商討之下并由Bjarne向委員會(huì)提出建議的,最終該項(xiàng)建議被通過(guò)。這使得STL中的一些算法在處理特殊情形時(shí)可以選擇非一般化的方式,從而保證了執(zhí)行的效率。
1.3.2 STL和C++標(biāo)準(zhǔn)函數(shù)庫(kù)
STL是最新的C++標(biāo)準(zhǔn)函數(shù)庫(kù)中的一個(gè)子集,這個(gè)龐大的子集占據(jù)了整個(gè)庫(kù)的大約80%的分量。而作為在實(shí)現(xiàn)STL過(guò)程中扮演關(guān)鍵角色的模板則充斥了幾乎整個(gè)C++標(biāo)準(zhǔn)函數(shù)庫(kù)。在這里,我們有必要看一看C++標(biāo)準(zhǔn)函數(shù)庫(kù)里包含了哪些內(nèi)容,其中又有哪些是屬于標(biāo)準(zhǔn)模板庫(kù)(即STL)的。
C++標(biāo)準(zhǔn)函數(shù)庫(kù)為C++程序員們提供了一個(gè)可擴(kuò)展的基礎(chǔ)性框架。我們從中可以獲得極大的便利,同時(shí)也可以通過(guò)繼承現(xiàn)有類,自己編制符合接口規(guī)范的容器、算法、迭代子等方式對(duì)之進(jìn)行擴(kuò)展。它大致包含了如下幾個(gè)組件:
C標(biāo)準(zhǔn)函數(shù)庫(kù),基本保持了與原有C語(yǔ)言程序庫(kù)的良好兼容,盡管有些微變化。人們總會(huì)忍不住留戀過(guò)去的美好歲月,如果你曾經(jīng)是一個(gè)C程序員,對(duì)這一點(diǎn)一定體會(huì)頗深。或許有一點(diǎn)會(huì)讓你覺(jué)得奇怪,那就是在C++標(biāo)準(zhǔn)庫(kù)中存在兩套C的函數(shù)庫(kù),一套是帶有.h擴(kuò)展名的(比如<stdio.h>),而另一套則沒(méi)有(比如<cstdio>)。它們確實(shí)沒(méi)有太大的不同。
語(yǔ)言支持(language support)部分,包含了一些標(biāo)準(zhǔn)類型的定義以及其他特性的定義,這些內(nèi)容,被用于標(biāo)準(zhǔn)庫(kù)的其他地方或是具體的應(yīng)用程序中。
診斷(diagnostics)部分,提供了用于程序診斷和報(bào)錯(cuò)的功能,包含了異常處理(exception handling),斷言(assertions),錯(cuò)誤代碼(error number codes)三種方式。
通用工具(general utilities)部分,這部分內(nèi)容為C++標(biāo)準(zhǔn)庫(kù)的其他部分提供支持,當(dāng)然你也可以在自己的程序中調(diào)用相應(yīng)功能。比如:動(dòng)態(tài)內(nèi)存管理工具,日期/時(shí)間處理工具。記住,這里的內(nèi)容也已經(jīng)被泛化了(即采用了模板機(jī)制)。
字符串(string)部分,用來(lái)代表和處理文本。它提供了足夠豐富的功能。事實(shí)上,文本是一個(gè)string對(duì)象,它可以被看作是一個(gè)字符序列,字符類型可能是char,或者wchar_t等等。string可以被轉(zhuǎn)換成char*類型,這樣便可以和以前所寫(xiě)的C/C++代碼和平共處了。因?yàn)槟菚r(shí)侯除了 char*,沒(méi)有別的。
國(guó)際化(internationalization)部分,作為OOP特性之一的封裝機(jī)制在這里扮演著消除文化和地域差異的角色,采用locale和facet可以為程序提供眾多國(guó)際化支持,包括對(duì)各種字符集的支持,日期和時(shí)間的表示,數(shù)值和貨幣的處理等等。畢竟,在中國(guó)和在美國(guó),人們表示日期的習(xí)慣是不同的。
容器(containers)部分,STL的一個(gè)重要組成部分,涵蓋了許多數(shù)據(jù)結(jié)構(gòu),比如前面曾經(jīng)提到的鏈表,還有:vector(類似于大小可動(dòng)態(tài)增加的數(shù)組)、queue(隊(duì)列)、stack(堆棧)……。string 也可以看作是一個(gè)容器,適用于容器的方法同樣也適用于string。現(xiàn)在你可以輕松的完成數(shù)據(jù)結(jié)構(gòu)課程的家庭作業(yè)了。
算法(algorithms)部分,STL的一個(gè)重要組成部分,包含了大約70個(gè)通用算法,用于操控各種容器,同時(shí)也可以操控內(nèi)建數(shù)組。比如:find用于在容器中查找等于某個(gè)特定值的元素,for_each用于將某個(gè)函數(shù)應(yīng)用到容器中的各個(gè)元素上,sort用于對(duì)容器中的元素排序。所有這些操作都是在保證執(zhí)行效率的前提下進(jìn)行的,所以,如果在你使用了這些算法之后程序變得效率底下,首先一定不要懷疑這些算法本身,仔細(xì)檢查一下程序的其他地方。
迭代器(iterators)部分,STL的一個(gè)重要組成部分,如果沒(méi)有迭代器的撮合,容器和算法便無(wú)法結(jié)合的如此完美。事實(shí)上,每個(gè)容器都有自己的迭代器,只有容器自己才知道如何訪問(wèn)自己的元素。它有點(diǎn)像指針,算法通過(guò)迭代器來(lái)定位和操控容器中的元素。
數(shù)值(numerics)部分,包含了一些數(shù)學(xué)運(yùn)算功能,提供了復(fù)數(shù)運(yùn)算的支持。
輸入/輸出(input/output)部分,就是經(jīng)過(guò)模板化了的原有標(biāo)準(zhǔn)庫(kù)中的iostream部分,它提供了對(duì)C++程序輸入輸出的基本支持。在功能上保持了與原有iostream的兼容,并且增加了異常處理的機(jī)制,并支持國(guó)際化(internationalization)。
總體上,在C++標(biāo)準(zhǔn)函數(shù)庫(kù)中,STL主要包含了容器、算法、迭代器。string也可以算做是STL的一部分。
圖1:STL和C++標(biāo)準(zhǔn)函數(shù)庫(kù)
1.3.3 STL和GP,GP和OOP
正如前面所提到的,在STL的背后蘊(yùn)含著泛型化程序設(shè)計(jì)(GP)的思想,在這種思想里,大部分基本算法被抽象,被泛化,獨(dú)立于與之對(duì)應(yīng)的數(shù)據(jù)結(jié)構(gòu),用于以相同或相近的方式處理各種不同情形。這一思想和面向?qū)ο蟮某绦蛟O(shè)計(jì)思想(OOP)不盡相同,因?yàn)椋贠OP中更注重的是對(duì)數(shù)據(jù)的抽象,即所謂抽象數(shù)據(jù)類型(Abstract Data Type),而算法則通常被附屬于數(shù)據(jù)類型之中。幾乎所有的事情都可以被看作類或者對(duì)象(即類的實(shí)例),通常,我們所看到的算法被作為成員函數(shù)(member function)包含在類(class)中,類和類則構(gòu)成了錯(cuò)綜復(fù)雜的繼承體系。
盡管在象C++這樣的程序設(shè)計(jì)語(yǔ)言中,你還可以用全局函數(shù)來(lái)表示算法,但是在類似于Java這樣的純面向?qū)ο蟮恼Z(yǔ)言中,全局函數(shù)已經(jīng)被"勒令禁止"了。因此,用Java來(lái)模擬GP思想是頗為困難的。如果你對(duì)前述的STL歷史還有印象的話,應(yīng)該記得Alexander Stepanove也曾用基于OOP的語(yǔ)言嘗試過(guò)實(shí)現(xiàn)GP思想,但是效果并不好,包括沒(méi)有引入模板之前的C++語(yǔ)言。站在巨人的肩膀上,我們可以得出這樣的結(jié)論,在OOP中所體現(xiàn)的思想與GP的思想確實(shí)是相異的。C++并不是一種純面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言,它的絕妙之處,就在于既滿足了OOP,又成全了 GP。對(duì)于后者,模板立下了汗馬功勞。另外,需要指出的是,盡管GP和OOP有諸多不同,但這種不同還不至于到"水火不容"的地步。并且,在實(shí)際運(yùn)用的時(shí)候,兩者的結(jié)合使用往往可以使問(wèn)題的解決更為有效。作為GP思想實(shí)例的STL本身便是一個(gè)很好的范例,如果沒(méi)有繼承,不知道STL會(huì)是什么樣子,似乎沒(méi)有人做過(guò)這樣的試驗(yàn)。
1.4 STL的不同實(shí)現(xiàn)版本
1.4.1 HP STL 1.4.2 P.J. Plauger STL 1.4.3 Rouge Wave STL
1.4.4 STLport
STLport最初源于俄國(guó)人Boris Fomitchev的一個(gè)開(kāi)發(fā)項(xiàng)目,主要用于將SGI STL的基本代碼移植到其他諸如C++Builder或者是Visual C++這樣的主流編譯器上。因?yàn)镾GI STL屬于開(kāi)放源碼,所以STLport才有權(quán)這樣做。目前STLport的最新版本是4.5。可以從如下網(wǎng)站得到更詳細(xì)的情況介紹://www.stlport.org,可以免費(fèi)下載其源代碼。STLport已經(jīng)被C/C++技術(shù)委員會(huì)接受成為工業(yè)標(biāo)準(zhǔn),且在許多平臺(tái)上都支持。根據(jù)測(cè)試STLport的效率比VC中的STL要快。比Rouge Wave STL更符合標(biāo)準(zhǔn),也更容易移植。Borland C++ Builder已經(jīng)在其6.0版中加入了對(duì)STLport的支持,它使用的STLport就是4.5版的,C++ Builder 6.0同時(shí)還提供了STLport的使用說(shuō)明。你可以在C++ Builder的Include\Stlport子目錄下找到所有頭文件(比如:C:\Program Files\Borland\Cbuilder6\Include\Stlport)。
1.4.5 SGI STL
SGI STL是由Silicon Graphics Computer System, Inc公司實(shí)現(xiàn)的,其設(shè)計(jì)者和編寫(xiě)者包括Alexander Stepanov和Matt Austern,同樣它也是HP STL的一個(gè)繼承版本。它屬于開(kāi)放源碼,因此你可以修改和銷售它。SGI STL被GCC(linux下的C++編譯器)所采用,你可以在GCC的Include子目錄下找到所有頭文件(比如:C:\cygnus\cygwin -b20\include\g++\include)。由于GCC對(duì)C++語(yǔ)言標(biāo)準(zhǔn)的支持很好,SGI STL在linux平臺(tái)上的性能相當(dāng)出色。此外,其源代碼的可讀性也很好。可以從如下網(wǎng)站得到更詳細(xì)的情況介紹:http://www.sgi.com,可以免費(fèi)下載其源代碼。目前的最新版本是3.3。
非常遺憾,我不得不舍棄"Hello World"這個(gè)經(jīng)典的范例,盡管它不只一次的被各種介紹計(jì)算機(jī)語(yǔ)言的教科書(shū)所引用,幾乎成為了一個(gè)默認(rèn)的“標(biāo)準(zhǔn)”。其原因在于它太過(guò)簡(jiǎn)單了,以至于不具備代表性,無(wú)法展現(xiàn)STL的巨大魅力。我選用了一個(gè)稍稍復(fù)雜一點(diǎn)的例子,它的大致功能是:從標(biāo)準(zhǔn)輸入設(shè)備(一般是鍵盤)讀入一些整型數(shù)據(jù),然后對(duì)它們進(jìn)行排序,最終將結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備(一般是顯示器屏幕)。這是一種典型的處理方式,程序本身具備了一個(gè)系統(tǒng)所應(yīng)該具有的幾乎所有的基本特征:輸入 + 處理 + 輸出。你將會(huì)看到三個(gè)不同版本的程序。第一個(gè)是沒(méi)有使用STL的普通C++程序,你將會(huì)看到完成這樣看似簡(jiǎn)單的事情,需要花多大的力氣,而且還未必沒(méi)有一點(diǎn)問(wèn)題(真是吃力不討好)。第二個(gè)程序的主體部分使用了STL特性,此時(shí)在第一個(gè)程序中所遇到的問(wèn)題就基本可以解決了。同時(shí),你會(huì)發(fā)現(xiàn)采用了STL之后,程序變得簡(jiǎn)潔明快,清晰易讀。第三個(gè)程序則將STL的功能發(fā)揮到了及至,你可以看到程序里幾乎每一行代碼都是和STL相關(guān)的。這樣的機(jī)會(huì)并不總是隨處可見(jiàn)的,它展現(xiàn)了STL中的幾乎所有的基本組成部分,盡管這看起來(lái)似乎有點(diǎn)過(guò)分了。
有幾點(diǎn)是需要說(shuō)明的:
這個(gè)例程的目的,在于向你演示如何在C++程序中使用STL,同時(shí)希望通過(guò)實(shí)踐,證明STL所帶給你的確確實(shí)實(shí)的好處。程序中用到的一些STL基本組件,比如:vector(一種容器)、sort(一種排序算法),你只需要有一個(gè)大致的概念就可以了,這并不影響閱讀代碼和理解程序的含義。
2.2.1 第一版:史前時(shí)代--轉(zhuǎn)木取火
在STL還沒(méi)有降生的"黑暗時(shí)代",C++程序員要完成前面所提到的那些功能,需要做很多事情(不過(guò)這比起C程序來(lái),似乎好一點(diǎn)),程序大致是如下這個(gè)樣子的:
// name:example2_1.cpp
// alias:Rubish
#include <stdlib.h>
#include <iostream.h>
int compare(const void *arg1, const void *arg2);
void main(void)
{
const int max_size = 10; // 數(shù)組允許元素的最大個(gè)數(shù)
int num[max_size]; // 整型數(shù)組
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),同時(shí)累計(jì)輸入個(gè)數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
int n;
for (n = 0; cin >> num[n]; n ++);
// C標(biāo)準(zhǔn)庫(kù)中的快速排序(quick-sort)函數(shù)
qsort(num, n, sizeof(int), compare);
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
for (int i = 0; i < n; i ++)
cout << num[i] << "\n";
}
// 比較兩個(gè)數(shù)的大小,
// 如果*(int *)arg1比*(int *)arg2小,則返回-1
// 如果*(int *)arg1比*(int *)arg2大,則返回1
// 如果*(int *)arg1等于*(int *)arg2,則返回0
int compare(const void *arg1, const void *arg2)
{
return (*(int *)arg1 < *(int *)arg2) ? -1 :
(*(int *)arg1 > *(int *)arg2) ? 1 : 0;
}
這是一個(gè)和STL沒(méi)有絲毫關(guān)系的傳統(tǒng)風(fēng)格的C++程序。因?yàn)槌绦虻淖⑨屢呀?jīng)很詳盡了,所以不需要我再做更多的解釋。總的說(shuō)來(lái),這個(gè)程序看起來(lái)并不十分復(fù)雜(本來(lái)就沒(méi)有太多功能)。只是,那個(gè)compare函數(shù),看起來(lái)有點(diǎn)費(fèi)勁。指向它的函數(shù)指針被作為最后一個(gè)實(shí)參傳入qsort函數(shù),qsort是C程序庫(kù)stdlib.h中的一個(gè)函數(shù)。以下是qsort的函數(shù)原型:
void qsort(void *base, size_t num, size_t width, int (__cdecl *compare )(const void *elem1, const void *elem2 ) ); 看起來(lái)有點(diǎn)令人作嘔,尤其是最后一個(gè)參數(shù)。大概的意思是,第一個(gè)參數(shù)指明了要排序的數(shù)組(比如:程序中的num),第二個(gè)參數(shù)給出了數(shù)組的大小(qsort沒(méi)有足夠的智力預(yù)知你傳給它的數(shù)組的實(shí)際大小),第三個(gè)參數(shù)給出了數(shù)組中每個(gè)元素以字節(jié)為單位的大小。最后那個(gè)長(zhǎng)長(zhǎng)的家伙,給出了排序時(shí)比較元素的方式(還是因?yàn)閝sort的智商問(wèn)題)。
以下是某次運(yùn)行的結(jié)果:
輸入:0 9 2 1 5
輸出:0 1 2 5 9有一個(gè)問(wèn)題,這個(gè)程序并不像看起來(lái)那么健壯(Robust)。如果我們輸入的數(shù)字個(gè)數(shù)超過(guò)max_size所規(guī)定的上限,就會(huì)出現(xiàn)數(shù)組越界問(wèn)題。如果你在Visual C++的IDE環(huán)境下以控制臺(tái)方式運(yùn)行這個(gè)程序時(shí),會(huì)彈出非法內(nèi)存訪問(wèn)的錯(cuò)誤對(duì)話框。這個(gè)問(wèn)題很嚴(yán)重,嚴(yán)重到足以使你開(kāi)始重新審視這個(gè)程序的代碼。為了彌補(bǔ)程序中的這一缺陷。我們不得不考慮采用如下三種方案中的一種:
- 采用大容量的靜態(tài)數(shù)組分配。
- 限定輸入的數(shù)據(jù)個(gè)數(shù)。
- 采用動(dòng)態(tài)內(nèi)存分配。
第一種方案比較簡(jiǎn)單,你所做的只是將max_size改大一點(diǎn),比如:1000或者10000。但是,嚴(yán)格講這并不能最終解決問(wèn)題,隱患仍然存在。假如有人足夠耐心,還是可以使你的這個(gè)經(jīng)過(guò)糾正后的程序崩潰的。此外,分配一個(gè)大數(shù)組,通常是在浪費(fèi)空間,因?yàn)榇蠖鄶?shù)情況下,數(shù)組中的一部分空間并沒(méi)有被利用。
再來(lái)看看第二種方案,通過(guò)在第一個(gè)for循環(huán)中加入一個(gè)限定條件,可以使問(wèn)題得到解決。比如:for (int n = 0; cin >> num[n] && n < max_size; n ++); 但是這個(gè)方案同樣不甚理想,盡管不會(huì)使程序崩潰,但失去了靈活性,你無(wú)法輸入更多的數(shù)。
看來(lái)只有選擇第三種方案了。是的,你可以利用指針,以及動(dòng)態(tài)內(nèi)存分配妥善的解決上述問(wèn)題,并且使程序具有良好的靈活性。這需要用到new,delete操作符,或者古老的malloc(), realloc()和free()函數(shù)。但是為此,你將犧牲程序的簡(jiǎn)潔性,使程序代碼陡增,代碼的處理邏輯也不再像原先看起來(lái)那么清晰了。一個(gè) compare函數(shù)或許就已經(jīng)令你不耐煩了,更何況要實(shí)現(xiàn)這些復(fù)雜的處理機(jī)制呢?很難保證你不會(huì)在處理這個(gè)問(wèn)題的時(shí)候出錯(cuò),很多程序的bug往往就是這樣產(chǎn)生的。同時(shí),你還應(yīng)該感謝stdlib.h,它為你提供了qsort函數(shù),否則,你還需要自己實(shí)現(xiàn)排序算法。如果你用的是冒泡法排序,那效率就不會(huì)很理想。……,問(wèn)題真是越來(lái)越讓人頭疼了!
關(guān)于第一個(gè)程序的討論就到此為止,如果你對(duì)第三種方案感興趣的話,可以嘗試著自己編寫(xiě)一個(gè)程序,作為思考題。這里就不準(zhǔn)備再浪費(fèi)筆墨去實(shí)現(xiàn)這樣一個(gè)讓人不甚愉快的程序了。
2.2.2 第二版:工業(yè)時(shí)代--組件化大生產(chǎn)
我們應(yīng)該慶幸自己所生活的年代。工業(yè)時(shí)代,科技的發(fā)展所帶來(lái)的巨大便利已經(jīng)影響到了我們生活中的每個(gè)細(xì)節(jié)。如果你還在以原始人類的方式生活著,那我真該懷疑你是否屬于某個(gè)生活在非洲或者南美叢林里的原始部落中的一員了,難道是瑪雅文明又重現(xiàn)了?
STL便是這個(gè)時(shí)代的產(chǎn)物,正如其他科技成果一樣,C++程序員也應(yīng)該努力使自己適應(yīng)并充分利用這個(gè)"高科技成果"。讓我們重新審視第一版的那個(gè)破爛不堪的程序。試著使用一下STL,看看效果如何。
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
void main(void)
{
vector<int> num; // STL中的vector容器
int element;
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
while (cin >> element)
num.push_back(element);
// STL中的排序算法
sort(num.begin(), num.end());
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
for (int i = 0; i < num.size(); i ++)
cout << num[i] << "\n";
}
這個(gè)程序的主要部分改用了STL的部件,看起來(lái)要比第一個(gè)程序簡(jiǎn)潔一點(diǎn),你已經(jīng)找不到那個(gè)討厭的compare函數(shù)了。它真的能很好的運(yùn)行嗎?你可以試試,因?yàn)槌绦虻倪\(yùn)行結(jié)果和前面的大致差不多,所以在此略去。我可以向你保證,這個(gè)程序是足夠健壯的。不過(guò),可能你還沒(méi)有完全看明白程序的代碼,所以我需要為你解釋一下。畢竟,這個(gè)戲法變得太快了,較之第一個(gè)程序,一眨眼的功夫,那些老的C++程序員所熟悉的代碼都不見(jiàn)了,取而代之的是一些新鮮玩意兒。
程序的前三行是包含的頭文件,它們提供了程序所要用到的所有C++特性(包括輸入輸出處理,STL中的容器和算法)。不必在意那個(gè).h,并不是我的疏忽,程序保證可以編譯通過(guò),只要你的C++編譯器支持標(biāo)準(zhǔn)C++規(guī)范的相關(guān)部分。你只需要把它們看作是一些普通的C++頭文件就可以了。事實(shí)上,也正是如此,如果你對(duì)這個(gè)變化細(xì)節(jié)感興趣的化,可以留意一下你身旁的佐餐。
同樣可以忽略第四行的存在。加入那個(gè)聲明只是為了表明程序引用到了std這個(gè)標(biāo)準(zhǔn)名字空間(namespace),因?yàn)镾TL中的那些玩意兒全都包含在那里面。只有通過(guò)這行聲明,編譯器才能允許你使用那些有趣的特性。
程序中用到了vector,它是STL中的一個(gè)標(biāo)準(zhǔn)容器,可以用來(lái)存放一些元素。你可以把vector理解為int [?],一個(gè)整型的數(shù)組。之所以大小未知是因?yàn)椋瑅ector是一個(gè)可以動(dòng)態(tài)調(diào)整大小的容器,當(dāng)容器已滿時(shí),如果再放入元素則vector會(huì)悄悄擴(kuò)大自己的容量。push_back是vector容器的一個(gè)類屬成員函數(shù),用來(lái)在容器尾端插入一個(gè)元素。main函數(shù)中第一個(gè)while循環(huán)做的事情就是不斷向 vector容器尾端插入整型數(shù)據(jù),同時(shí)自動(dòng)維護(hù)容器空間的大小。
sort是STL中的標(biāo)準(zhǔn)算法,用來(lái)對(duì)容器中的元素進(jìn)行排序。它需要兩個(gè)參數(shù)用來(lái)決定容器中哪個(gè)范圍內(nèi)的元素可以用來(lái)排序。這里用到了vector的另兩個(gè)類屬成員函數(shù)。begin()用以指向vector的首端,而end()則指向vector的末端。這里有兩個(gè)問(wèn)題,begin()和end()的返回值是什么?這涉及到STL的另一個(gè)重要部件--迭代器(Iterator),不過(guò)這里并不需要對(duì)它做詳細(xì)了解。你只需要把它當(dāng)作是一個(gè)指針就可以了,一個(gè)指向整型數(shù)據(jù)的指針。相應(yīng)的sort函數(shù)聲明也可以看作是void sort(int* first, int* last),盡管這實(shí)際上很不精確。另一個(gè)問(wèn)題是和end()函數(shù)有關(guān),盡管前面說(shuō)它的返回值指向vector的末端,但這種說(shuō)法不能算正確。事實(shí)上,它的返回值所指向的是vector中最末端元素的后面一個(gè)位置,即所謂pass-the-end value。這聽(tīng)起來(lái)有點(diǎn)費(fèi)解,不過(guò)不必在意,這里只是稍帶一提。總的來(lái)說(shuō),sort函數(shù)所做的事情是對(duì)那個(gè)準(zhǔn)整型數(shù)組中的元素進(jìn)行排序,一如第一個(gè)程序中的那個(gè)qsort,不過(guò)比起qsort來(lái),sort似乎要簡(jiǎn)單了許多。
程序的最后是輸出部分,在這里vector完全可以以假亂真了,它所提供的對(duì)元素的訪問(wèn)方式簡(jiǎn)直和普通的C++內(nèi)建數(shù)組一模一樣。那個(gè)size函數(shù)用來(lái)返回vector中的元素個(gè)數(shù),就相當(dāng)于第一個(gè)程序中的變量n。這兩行代碼直觀的不用我再多解釋了。
我想我的耐心講解應(yīng)該可以使你大致看懂上面的程序了,事實(shí)上STL的運(yùn)用使程序的邏輯更加清晰,使代碼更易于閱讀。試問(wèn),有誰(shuí)會(huì)不明白begin、 end、size這樣的字眼所表達(dá)的含義呢(除非他不懂英語(yǔ))?試著運(yùn)行一下,看看效果。再試著多輸入幾個(gè)數(shù),看看是否會(huì)發(fā)生數(shù)組越界現(xiàn)象。實(shí)踐證明,程序運(yùn)行良好。是的,由于vector容器自行維護(hù)了自身的大小,C++程序員就不用操心動(dòng)態(tài)內(nèi)存分配了,指針的錯(cuò)誤使用畢竟會(huì)帶來(lái)很多麻煩,同時(shí)程序也會(huì)變得冗長(zhǎng)無(wú)比。這正是前面第三種方案的缺點(diǎn)所在
2.2.3 第三版:唯美主義的杰作
事態(tài)的發(fā)展有時(shí)候總會(huì)趨向極端,這在那些唯美主義者當(dāng)中猶是如此。首先聲明,我并不是一個(gè)唯美主義者,提供第二版程序的改進(jìn)版,完全是為了讓你更深刻的感受到STL的魅力所在。在看完第三版之后,你會(huì)強(qiáng)烈感受到這一點(diǎn)。或許你也會(huì)變成一個(gè)唯美主義者了,至少在STL方面。這應(yīng)該不是我的錯(cuò),因?yàn)闆Q定權(quán)在你手里。下面我們來(lái)看看這個(gè)絕版的C++程序。
// name:example2_3.cpp
// alias:aesthetic version
#include <iostream>
#include <vector>
#include <algorithm>
#include <iterator>
using namespace std;
void main(void)
{
typedef vector<int> int_vector;
typedef istream_iterator<int> istream_itr;
typedef ostream_iterator<int> ostream_itr;
typedef back_insert_iterator< int_vector > back_ins_itr;
// STL中的vector容器
int_vector num;
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
copy(istream_itr(cin), istream_itr(), back_ins_itr(num));
// STL中的排序算法
sort(num.begin(), num.end());
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
copy(num.begin(), num.end(), ostream_itr(cout, "\n"));
}
在這個(gè)程序里幾乎每行代碼都是和STL有關(guān)的(除了main和那對(duì)花括號(hào),當(dāng)然還有注釋),并且它包含了STL中幾乎所有的各大部件(容器 container,迭代器iterator, 算法algorithm, 適配器adaptor),唯一的遺憾是少了函數(shù)對(duì)象(functor)的身影。
還記得開(kāi)頭提到的一個(gè)典型系統(tǒng)所具有的基本特征嗎?--輸入+處理+輸出。所有這些功能,在上面的程序里,僅僅是通過(guò)三行語(yǔ)句來(lái)實(shí)現(xiàn)的,其中每一行語(yǔ)句對(duì)應(yīng)一種操作。對(duì)于數(shù)據(jù)的操作被高度的抽象化了,而算法和容器之間的組合,就像搭積木一樣輕松自如,系統(tǒng)的耦合度被降到了極低點(diǎn)。這就是閃耀著泛型之光的STL的偉大力量。如此簡(jiǎn)潔,如此巧妙,如此神奇!就像魔術(shù)一般,以至于再一次讓你摸不著頭腦。怎么實(shí)現(xiàn)的?為什么在看第二版程序的時(shí)候如此清晰的你,又墜入了五里霧中(竊喜)。
請(qǐng)留意此處的標(biāo)題(唯美主義的杰作),在實(shí)際環(huán)境中,你未必要做到這樣完美。畢竟美好愿望的破滅,在生活中時(shí)常會(huì)發(fā)生。過(guò)于理想化,并不是一件好事,至少我是這么認(rèn)為的。正如前面提到的,這個(gè)程序只是為了展示STL的獨(dú)特魅力,你不得不為它的出色表現(xiàn)所折服,也許只有深諳STL之道的人才會(huì)想出這樣的玩意兒來(lái)。如果你只是一般性的使用STL,做到第二版這樣的程度也就可以了。
實(shí)在是因?yàn)檫@個(gè)程序太過(guò)"簡(jiǎn)單",以至于我無(wú)法肯定,在你還沒(méi)有完全掌握STL之前,通過(guò)我的講解,是否能夠領(lǐng)會(huì)這區(qū)區(qū)三行代碼,我將盡我的最大努力。
前面提到的迭代器可以對(duì)容器內(nèi)的任意元素進(jìn)行定位和訪問(wèn)。在STL里,這種特性被加以推廣了。一個(gè)cin代表了來(lái)自輸入設(shè)備的一段數(shù)據(jù)流,從概念上講它對(duì)數(shù)據(jù)流的訪問(wèn)功能類似于一般意義上的迭代器,但是C++中的cin在很多地方操作起來(lái)并不像是一個(gè)迭代器,原因就在于其接口和迭代器的接口不一致(比如:不能對(duì)cin進(jìn)行++運(yùn)算,也不能對(duì)之進(jìn)行取值運(yùn)算--即*運(yùn)算)。為了解決這個(gè)矛盾,就需要引入適配器的概念。istream_iterator便是一個(gè)適配器,它將cin進(jìn)行包裝,使之看起來(lái)像是一個(gè)普通的迭代器,這樣我們就可以將之作為實(shí)參傳給一些算法了(比如這里的copy算法)。因?yàn)樗惴ㄖ徽J(rèn)得迭代器,而不會(huì)接受cin。對(duì)于上面程序中的第一個(gè)copy函數(shù)而言,其第一個(gè)參數(shù)展開(kāi)后的形式是:istream_iterator(cin),其第二個(gè)參數(shù)展開(kāi)后的形式是:istream_iterator()(如果你對(duì)typedef的語(yǔ)法不清楚,可以參考有關(guān)的c++語(yǔ)言書(shū)籍)。其效果是產(chǎn)生兩個(gè)迭代器的臨時(shí)對(duì)象,前一個(gè)指向整型輸入數(shù)據(jù)流的開(kāi)始,后一個(gè)則指向"pass-the-end value"。這個(gè)函數(shù)的作用就是將整型輸入數(shù)據(jù)流從頭至尾逐一"拷貝"到vector這個(gè)準(zhǔn)整型數(shù)組里,第一個(gè)迭代器從開(kāi)始位置每次累進(jìn),最后到達(dá)第二個(gè)迭代器所指向的位置。或許你要問(wèn),如果那個(gè)copy函數(shù)的行為真如我所說(shuō)的那樣,為什么不寫(xiě)成如下這個(gè)樣子呢?
copy(istream_iterator<int>(cin), istream_iterator<int>(), num.begin());
你確實(shí)可以這么做,但是有一個(gè)小小的麻煩。還記得第一版程序里的那個(gè)數(shù)組越界問(wèn)題嗎?如果你這么寫(xiě)的話,就會(huì)遇到類似的麻煩。原因在于copy函數(shù)在" 拷貝"數(shù)據(jù)的時(shí)候,如果輸入的數(shù)據(jù)個(gè)數(shù)超過(guò)了vector容器的范圍時(shí),數(shù)據(jù)將會(huì)拷貝到容器的外面。此時(shí),容器不會(huì)自動(dòng)增長(zhǎng)容量,因?yàn)檫@只是簡(jiǎn)單地拷貝,并不是從末端插入。為了解決這個(gè)問(wèn)題,另一個(gè)適配器back_insert_iterator登場(chǎng)了,它的作用就是引導(dǎo)copy算法每次在容器末端插入一個(gè)數(shù)據(jù)。程序中的那個(gè)back_ins_itr(num)展開(kāi)后就是:back_insert_iterator(num),其效果是生成一個(gè)這樣的迭待器對(duì)象。終于將講完了三分之一(真不容易!),好在第二句和前一版程序沒(méi)有差別,這里就略過(guò)了。至于第三句,ostream_itr(cout, "\n")展開(kāi)后的形式是:ostream_iterator(cout, "\n"),其效果是產(chǎn)生一個(gè)處理輸出數(shù)據(jù)流的迭待器對(duì)象,其位置指向數(shù)據(jù)流的起始處,并且以"\n"作為分割符。第二個(gè)copy函數(shù)將會(huì)從頭至尾將 vector中的內(nèi)容"拷貝"到輸出設(shè)備,第一個(gè)參數(shù)所代表的迭代器將會(huì)從開(kāi)始位置每次累進(jìn),最后到達(dá)第二個(gè)參數(shù)所代表的迭代器所指向的位置。
這就是全部的內(nèi)容。
2.3 歷史的評(píng)價(jià)
歷史的車輪總是滾滾向前的,工業(yè)時(shí)代的文明較之史前時(shí)代,當(dāng)然是先進(jìn)并且發(fā)達(dá)的。回顧那兩個(gè)時(shí)代的C++程序,你會(huì)真切的感受到這種差別。簡(jiǎn)潔易用,具有工業(yè)強(qiáng)度,較好的可移植性,高效率,加之第三個(gè)令人目眩的絕版程序所體現(xiàn)出來(lái)的高度抽象性,高度靈活性和組件化特性,使你對(duì)STL背后所蘊(yùn)含的泛型化思想都有了些微的感受。
真幸運(yùn),你可以橫跨兩個(gè)時(shí)代,有機(jī)會(huì)目睹這種"文明"的差異。同時(shí),這也應(yīng)該使你越加堅(jiān)定信念,使自己順應(yīng)時(shí)代的潮流。
2.4 如何運(yùn)行
在你還沒(méi)有真正開(kāi)始運(yùn)行前面后兩個(gè)程序之前,最好先瀏覽一下本節(jié)。這里簡(jiǎn)單介紹了在特定編譯器環(huán)境下運(yùn)行STL程序的一些細(xì)節(jié),并提供了一些可能遇到的問(wèn)題的解決辦法。
此處,我選用了目前在Windows平臺(tái)下較為常見(jiàn)的Microsoft Visual C++ 6.0和Borland C++ Builder 6.0作為例子。盡管Visual C++ 6.0對(duì)最新的ANSI/ISO C++標(biāo)準(zhǔn)支持的并不是很好。不過(guò)據(jù)稱Visual C++ .NET(也就是VC7.0)在這方面的性能有所改善。
你可以選用多種方式運(yùn)行前面的程序,比如在Visual C++下,你可以直接在DOS命令行狀態(tài)下編譯運(yùn)行,也可以在VC的IDE下采用控制臺(tái)應(yīng)用程序(Console Application)的方式運(yùn)行。對(duì)于C++ Builder,情況也類似。
對(duì)于Visual C++而言,如果是在DOS命令行狀態(tài)下,你首先需要找到它的編譯器。假定你的Visual C++裝在C:\Program Files\Microsoft Visual Studio\VC98下面,則其編譯器所在路徑應(yīng)該是C:\Program Files\Microsoft Visual Studio\VC98\Bin,在那里你可以找到cl.exe文件。編譯時(shí)請(qǐng)加上/GX和/MT參數(shù)。如果一切正常,結(jié)果就會(huì)產(chǎn)生一個(gè)可執(zhí)行文件。如下所示:
cl /GX /MT example2_2.cpp
前一個(gè)參數(shù)用于告知編譯器允許異常處理(Exception Handling)。在P. J. Plauger STL中的很多地方使用了異常處理機(jī)制(即try…throw…catch語(yǔ)法),所以應(yīng)該加上這個(gè)參數(shù),否則會(huì)有如下警告信息:
warning C4530: C++ exception handler used, but unwind semantics are not enabled.
后一個(gè)參數(shù)則用于使程序支持多線程,它需要在鏈接時(shí)使用LIBCMT.LIB庫(kù)文件。不過(guò)P. J. Plauger STL并不是線程安全的(thread safety)。如果你是在VC環(huán)境下使用像STLport這樣的STL實(shí)現(xiàn)版本,則需要加上這個(gè)參數(shù),因?yàn)镾TLport是線程安全的。
如果在IDE環(huán)境下,可以在新建工程的時(shí)候選擇控制臺(tái)應(yīng)用程序。
圖3:在Visual C++ IDE環(huán)境下運(yùn)行STL程序
至于那些參數(shù)的設(shè)置,則可以通過(guò)在Project功能菜單項(xiàng)中的Settings功能【Alt+F7】中設(shè)置編譯選項(xiàng)來(lái)完成。
;
圖4:在Visual C++ IDE環(huán)境下設(shè)置編譯參數(shù)
有時(shí),在IDE環(huán)境下編譯STL程序時(shí),可能會(huì)出現(xiàn)如下警告信息(前面那幾個(gè)示例程序不會(huì)出現(xiàn)這種情況):
warning C4786: '……' : identifier was truncated to '255' characters in the debug information
這是因?yàn)榫幾g器在Debug狀態(tài)下編譯時(shí),把程序中所出現(xiàn)的標(biāo)識(shí)符長(zhǎng)度限制在了255個(gè)字符范圍內(nèi)。如果超過(guò)最大長(zhǎng)度,這些標(biāo)識(shí)符就無(wú)法在調(diào)試階段查看和計(jì)算了。而在STL程序中大量的用到了模板函數(shù)和模板類,編譯器在實(shí)例化這些內(nèi)容時(shí),展開(kāi)之后所產(chǎn)生的標(biāo)識(shí)符往往很長(zhǎng)(沒(méi)準(zhǔn)會(huì)有一千多個(gè)字符!)。如果你想認(rèn)識(shí)一下這個(gè)warning的話,很簡(jiǎn)單,在程序里加上如下一行代碼:
vector<string> string_array; // 類似于字符串?dāng)?shù)組變量
對(duì)于這樣的warning,當(dāng)然可以置之不理,不過(guò)也是有解決辦法的。 你可以在文件開(kāi)頭加入下面這一行:#pragma warning(disable: 4786)。它強(qiáng)制編譯器忽略這個(gè)警告信息,這種做法雖然有點(diǎn)粗魯,但是很有效。
至于C++ Builder,其DOS命令行狀態(tài)下的運(yùn)行方式是這樣的。假如你的C++ Builder裝在C:\Program Files\Borland\CBuilder6。則其編譯器所在路徑應(yīng)該是C:\Program Files\ Borland\CBuilder6\Bin,在那里你可以找到bcc32.exe文件,輸入如下命令,即大功告成了:
bcc32 example2_2.cpp
至于IDE環(huán)境下,則可以在新建應(yīng)用程序的時(shí)候,選擇控制臺(tái)向?qū)В–onsole Wizard)。
圖5:在C++ Builder IDE環(huán)境下運(yùn)行STL程序
現(xiàn)在你可以在你的機(jī)器上運(yùn)行前面的示例程序了。不過(guò),請(qǐng)恕我多嘴,有些細(xì)節(jié)不得不提請(qǐng)你注意。小心編譯器給你留下的陷阱。比如前面第三個(gè)程序中有如下這一行代碼:
typedef back_insert_iterator< int_vector > back_ins_itr;
請(qǐng)留意">"前面的空格,最好不要省去。如果你吝惜這點(diǎn)空格所占用的磁盤空間的話,那就太不劃算了。其原因還是在于C++編譯器本身的缺陷。上述代碼,相當(dāng)于如下代碼(編譯器做的也正是這樣的翻譯工作):
typedef back_insert_iterator< vector<int> > back_ins_itr;
如果你沒(méi)有加空格的話,編譯器會(huì)把">>"誤認(rèn)為是單一標(biāo)識(shí)(看起來(lái)很像那個(gè)數(shù)據(jù)流輸入操作符">>")。為了回避這個(gè)難題, C++要求使用者必須在兩個(gè)右尖括號(hào)之間插入空格。所以,你最好還是老老實(shí)實(shí)照我的話做,以避免不必要的麻煩。不過(guò)有趣的是,對(duì)于上述那行展開(kāi)前的代碼,在Visual C++里即使你沒(méi)有加空格,編譯器也不會(huì)報(bào)錯(cuò)。而同樣的代碼在C++ Builder中沒(méi)有那么幸運(yùn)了。不過(guò),最好還是不要心存僥幸,如果你采用展開(kāi)后的書(shū)寫(xiě)方式,則兩個(gè)編譯器都不會(huì)給你留情面了。
引用地址:http://blog.programfan.com/trackback.asp?id=31227