C++廣泛應用在不同領(lǐng)域,使用者以數(shù)百萬計。根據(jù)近十年的調(diào)查,C++的流行程度約穩(wěn)定排行第3位(于C/Java之后)。 C++經(jīng)歷長期的實踐和演化,才成為今日的樣貌。1998年,C++標準委員會排除萬難,使C++成為ISO標準(俗稱C++98),當中含非常強大的標準模版庫(standard template library, STL)。之后委員會在2005年提交了有關(guān)標準庫的第一個技術(shù)報告(簡稱TR1),并為下一個標準C++0x而努力。可惜C++0x并不能在200x年完成,各界希望新標準能于2011年內(nèi)出臺。
流行的C++編譯器中,微軟Visual C++ 2010已實現(xiàn)部分C++0x語法并加入TR1擴充庫,而gcc對C++0x語法和庫的支持比VC2010更多。
應否選擇C++
哪些程序適宜使用C++?
C++并非萬能丹,我按經(jīng)驗舉出一些C++的適用時機。
- C++適合構(gòu)造程序中需求較穩(wěn)定的部分,需求變化較大的部分可使用腳本語言;
- 程序須盡量發(fā)揮硬件的最高性能,且性能瓶頸在于CPU和內(nèi)存;
- 程序須頻繁地與操作系統(tǒng)或硬件溝通;
- 程序必須使用C++框架/庫,如大部分游戲引擎(如Unreal/Source)及中間件(如Havok/FMOD),雖然有些C++庫提供其他語言的綁定,但通常原生的API性能最好、最新;
- 項目中某個目標平臺只提供C++編譯器的支持。
按應用領(lǐng)域來說,C++適用于開發(fā)服務器軟件、桌面應用、游戲、實時系統(tǒng)、高性能計算、嵌入式系統(tǒng)等。
使用C++還是C?
C++和C的設(shè)計哲學并不一樣,兩者取舍不同,所以不同的程序員和軟件項目會有不同選擇,難以一概而論。與C++相比,C具備編譯速度快、容易學 習、顯式描述程序細節(jié)、較少更新標準(后兩者也可同時視為缺點)等優(yōu)點。在語言層面上,C++包含絕大部分C語言的功能(例外之一,C++沒有C99的變長數(shù)組VLA),且提供OOP和GP的特性。但其實用C也可實現(xiàn)OOP思想,亦可利用宏去實現(xiàn)某程度的GP,只不過C++的語法能較簡潔、自動地實現(xiàn)OOP/GP。C++的RAII(resource acquisition is initialization,資源獲取就是初始化)特性比較獨特,C/C#/Java沒有相應功能。回顧歷史,Stroustrup開發(fā)的早期C++編譯器Cpre/Cfront是把C++源代碼翻譯為C,再用C編譯器編譯的。由此可知,C++編寫的程序,都能用等效的C程序代替,但C++在語言層面上提供了OOP/GP語法、更嚴格的類型檢查系統(tǒng)、大量額外的語言特性(如異常、RTTI等), 并且C++標準庫也較豐富。有時候C++的語法可使程序更簡潔,如運算符重載、隱式轉(zhuǎn)換。但另一方面,C語言的API通常比C++簡潔,能較容易供其他語 言程序調(diào)用。因此,一些C++庫會提供C的API封裝,同時也可供C程序調(diào)用。相反,有時候也會把C的API封裝成C++形式,以支持RAII和其他 C++庫整合等。
為何C++性能可優(yōu)于其他語言?
相對運行于虛擬機語言(如C#/Java),C/C++直接以靜態(tài)形式把源程序編譯為目標平臺的機器碼。一般而言,C/C++程序在編譯及鏈接時可 進行的優(yōu)化最豐富,啟動時的速度最快,運行時的額外內(nèi)存開銷最少。而C/C++相對動態(tài)語言(如Python/Lua)也減少了運行時的動態(tài)類型檢測。此 外,C/C++的運行行為是確定的,且不會有額外行為(例如C#/Java必然會初始化變量),也不會有如垃圾收集(GC)而造成的不確定性延遲,而且C /C++的數(shù)據(jù)結(jié)構(gòu)在內(nèi)存中的布局也是確定的。有時C++的一些功能會使程序性能優(yōu)于C,當中以內(nèi)聯(lián)和模版最為突出,這兩項功能使C++標準庫的 sort()通常比C標準庫的qsort()快多倍(C可用宏或人手編碼去解決此問題)。另一方面,C/C++能直接映射機器碼,之間沒有另一層中間語言,因此可以做底層優(yōu)化,例如使用內(nèi)部(intrinsic)函數(shù)和嵌入?yún)R編語言。然而,許多C++的性能優(yōu)點并非免費午餐,代價包括較長的編譯鏈接時間和較易出錯,因而增加開發(fā)時間和成本,這點稍后補充。
我進行了一個簡單全局渲染性能測試(512x512像素,每像素10000個采樣),C++ 1小時36分、Java 3小時18分、Python約18天、Ruby約351天。評測方式和其他語言的結(jié)果詳見博文。
C++常見問題
C++源代碼跨平臺嗎?
C++有不錯的跨平臺能力,但由于直接映射硬件,因性能優(yōu)化的關(guān)系,跨平臺能力不及Java及多數(shù)腳本語言。然而,實踐跨平臺的C++軟件還是可行的,但須注意以下問題:
- C++標準沒有規(guī)定原始數(shù)據(jù)類型(如int)的大小,需要特定大小的類型時,可自訂類型(如int32_t),同時對任何類型使用sizeof()而不假設(shè)其大小;
- 字節(jié)序(byte order)按CPU有所不同,特別要注意二進制輸入輸出、reinterpret_cast法;
- 原始數(shù)據(jù)和結(jié)構(gòu)類型的地址對齊有差異;
- 編譯器提供的一些編譯器或平臺專用擴充指令;
- 避免作應用二進制接口(application binary interface, ABI)的假設(shè),例如調(diào)用函數(shù)時參數(shù)的取值順序在C/C++中沒定義,在C++中也不可隨便假設(shè)RTTI/虛表等實現(xiàn)方式。
總括而言,跨平臺C++軟件可在頭文件中用宏檢測編譯器和平臺,再用宏、typedef、自定平臺相關(guān)實現(xiàn)等方法去實踐跨平臺,C++標準不會提供這類幫助。
C++程序容易崩潰?
和許多語言相比,C/C++提供不安全的功能以最優(yōu)化性能,有可能造成崩潰。但要注意,很多運行時錯誤,如向空指針/引用解引用、數(shù)組越界、堆棧溢 出等,其他語言也會報錯或拋出異常,這些都是程序問題,而不是語言本身的問題。有些意見認為,出現(xiàn)這類運行時錯誤,應該盡量寫入日志并立即崩潰,不該讓程 序繼續(xù)運行,以免造成更大的影響(例如程序繼續(xù)把內(nèi)存中錯誤的數(shù)據(jù)覆寫文件)。若要容錯,可按業(yè)務把程序分割為多進程,像Chrome或使用fork()的形式。然而,C++有許多機制可以減少錯誤,例如以string代替C字符串;以vector或array(TR1)代替原始數(shù)組(有些實現(xiàn)可在調(diào)試模式檢測越界);使用智能指針也能減少一些原始指針的問題。另外,我最常遇到的Bug,就是沒有初始化成員變量,有時會導致崩潰,而且調(diào)試版和發(fā)行版的行為可能不同。
C++要手動做內(nèi)存管理?
C++同時提供在堆棧上的自動局部變量,以及從自由存儲(free store)分配的對象。對于后者,程序員需手動釋放,或使用不同的容器和智能指針。 C++程序員經(jīng)常進一步優(yōu)化內(nèi)存,自定義內(nèi)存分配策略以提升效能,例如使用對象池、自定義的單向/雙向堆棧區(qū)等。雖然C++0x還沒加入GC功能,但也可 以自行編寫或使用現(xiàn)成庫。此外,C/C++也可以直接使用操作系統(tǒng)提供的內(nèi)存相關(guān)功能,例如內(nèi)存映射文件、共享內(nèi)存等。
使用C++常要重造輪子?
我曾參與的C++項目,都會重造不少標準庫已提供的功能,此情況在其他語言中較少出現(xiàn)。我試圖分析個中原因。首先,C++標準庫相對很多語言來說是 貧乏的,各開發(fā)者便會重復地制造自訂庫。從另一個角度看,C++標準庫是用C++編寫的(很多其他語言不用自身而是用C/C++去編寫庫),在能力和性能 上,自訂庫和標準庫并無本質(zhì)差別;另外,標準庫為通用而設(shè),對不同平臺及多種使用需求作取舍,性能上有所影響,例如EA公司就曾發(fā)表自制的EASTL規(guī) 格,描述游戲開發(fā)方面對STL的性能及功能需求的特點;此外,多個C++庫一起使用,經(jīng)常會因規(guī)范不同而引起沖突,又或功能重疊,所以項目可能須自行開 發(fā),或引入其他庫的概念或?qū)崿F(xiàn)(如Boost/TR1/Loki),改寫以符合項目規(guī)范。
C++編譯速度很慢?
錯,是非常慢。我認為C++可能是實用程序語言中編譯速度最慢的。此問題涉及C++沿用C的編譯鏈接方式,又加入了復雜的類/泛型聲明和內(nèi)聯(lián)機制,使編譯時間倍增。在C++對編譯方法改革之前(如module提案),可使用以下技巧改善:第一,使用pimpl手法,因性能損耗應用于調(diào)用次數(shù)不多的類;第二,僅包含必要頭文件,并盡量使用及提供前置聲明版本的頭文件(如iosfwd);第三采用基于接口的設(shè)計,但須注意虛函數(shù)調(diào)用成本;第四,采用unity build,即把多個cpp文件結(jié)合在一個編譯單元進行編譯;第五,采用分布式生成系統(tǒng)如IncrediBuild。
C++缺乏什么功能?
雖然C++已經(jīng)非常復雜,但仍缺少很多常見功能。 C++0x作出了不少改善,例如語言方面加入Lambda函數(shù)、閉包、類型推導聲明等,而庫方面則加入正則表達式、采用哈希表的 unordered_set/unordered_map、引用計數(shù)智能指針shared_ptr/weak_ptr等。但最值得留意的是C++0x引入 多線程的語法和庫功能,這是C++演進的一大步。然而,模組、GC、反射機制等功能雖有提案,卻未加進C++0x。
C++使用建議
為應用挑選特性集
我同意Stroustrup關(guān)于使用C++各種技術(shù)的回應:“你可以做,不意味著你必須這么做。(Just because you can do it, doesn't mean that you have to.)” C++充滿豐富的特性,但同時帶來不同問題,例如過分復雜、編譯及運行性能的損耗。一般可考慮是否使用多重繼承、異常、RTTI,并調(diào)節(jié)使用模版及模版元 編程的程度。使用過分復雜的設(shè)計和功能,可能會令部分團隊成員更難理解和維護。
為團隊建立編程規(guī)范
C++的編碼自由度很高,容易編寫風格迥異的代碼,C++本身也沒有定義一些標準規(guī)范。而且,C++的源文件物理構(gòu)成,較許多語言復雜。因此,除了決定特性集,每個團隊應建立一套編程規(guī)范,包括源文件格式(可使用文件模版)、花括號風格。
盡量使用C++風格而非C風格
由于C++有對C兼容的包袱,一些功能可以使用C風格實現(xiàn),但最好使用C++提供的新功能。最基本的是盡量以具名常量、內(nèi)聯(lián)函數(shù)和泛型取代宏,只把 宏用在條件式編譯及特殊情況。舊式的C要求局部變量聲明在作用域開端,C++則無此限制,應把變量聲明盡量置于鄰近其使用的地方,for()的循環(huán)變量聲 明可置于for的括號內(nèi)。 C++中能加強類型安全的功能應盡量使用,例如避免“萬能”指針void *,而使用個別或泛型類型;用bool而非int表示布爾值;選用4種C++ cast關(guān)鍵字代替簡單的強制轉(zhuǎn)換。
結(jié)合其他語言
如前文所述,C++并非適合所有應用情境,有時可以混合其他語言使用,包括用C++擴展其他語言,或在C++程序中嵌入腳本語言引擎。對于后者,除了使用各種腳本語言的專門API,還可使用Boost或SWIG作整合。
C++學習建議
C++缺點之一,是相對許多語言復雜,而且難學難精。許多人說學習C語言只需一本K&R《C程序設(shè)計語言》即可,但C++書籍卻是多不勝數(shù)。我是從C進入C++,皆是靠閱讀自學。在此分享一點學習心得。個人認為,學習C++可分為4個層次:
- 第一層次,C++基礎(chǔ):挑選一本入門書籍,如《C++ Primer》、《C++大學教程》、或Stroustrup撰寫的經(jīng)典《C++程序設(shè)計語言》或他一年半前的新作《C++程序設(shè)計原理與實踐》,而一般C++課程也止于此,另外《C++ 標準程序庫》及《The C++ Standard Library Extensions》可供參考;
- 第二層次,正確高效地使用C++:此層次開始必須自修,閱讀過《(More)Effective C++》、《(More)Exceptional C++》、《Effective STL》及《C++編程規(guī)范》等,才適宜踏入專業(yè)C++開發(fā)之路;
- 第三層次,深入了解C++:關(guān)于全局問題可讀《深入探索C++對象模型》、《Imperfect C++》、《C++沉思錄》、《STL源碼剖析》,要挑戰(zhàn)智商,可看關(guān)于模版及模版元編程的書籍如《C++ Templates》、《C++設(shè)計新思維》、《C++模版元編程》;
- 第四層次,研究C++:閱讀《C++語言的設(shè)計和演化》、《編程的本質(zhì)》(含STL設(shè)計背后的數(shù)學根基)、C++標準文件《ISO/IEC 14882:2003》、C++標準委員會的提案書和報告書、關(guān)于C++的學術(shù)文獻。
由于我主要是應用C++,大約只停留于第二、三個層次。然而,C++只是軟件開發(fā)的一環(huán)而已,單憑語言并不能應付業(yè)務和工程上的問題。建議讀者不要 強求幾年內(nèi)“徹底學會C++的知識”,到達第二層左右便從工作實戰(zhàn)中汲取經(jīng)驗,有興趣才慢慢繼續(xù)學習更高層次的知識。雖然學習C++有難度,但也是相當有 趣且有滿足感的。