什么是traits,為什么人們把它認(rèn)為是C++ Generic Programming的重要技術(shù)?
簡短截說,traits如此重要,是因?yàn)榇隧?xiàng)技術(shù)允許系統(tǒng)在編譯時(shí)根據(jù)類型作一些決斷,就好像在運(yùn)行時(shí)根據(jù)值來作出決斷一樣。更進(jìn)一步,此技術(shù)遵循“另增一個(gè)間接層”的諺語,解決了不少軟件工程問題,traits使您能根據(jù)其產(chǎn)生的背景(context)來作出抉擇。這樣最終的代碼就變得清晰易讀,容易維護(hù)。如果你正確運(yùn)用了traits技術(shù),你就能在不付出任何性能和安全代價(jià)的同時(shí)得到這些好處,或者能夠契合其他解決方案上的需求。
例子:Traits不僅是泛型程序設(shè)計(jì)的核心工具,而且我希望以下的例子能夠使你相信,在非常特定的問題中,它也是很有用的。假設(shè)你現(xiàn)在正在編寫一個(gè)關(guān)系數(shù)據(jù)庫應(yīng)用程序。可能您一開始用數(shù)據(jù)庫供應(yīng)商提供的API庫來進(jìn)行反問數(shù)據(jù)庫的操作。但是理所當(dāng)然的,不久之后你會感到不得不寫一些包裝函數(shù)來組織那些原始的API,一方面是為了簡潔,另一方面也可以更好地適應(yīng)你手上的任務(wù)。這就是生活的樂趣所在,不是嗎?
一個(gè)典型的API是這樣的:提供一個(gè)基本的方法用來把游標(biāo)(cursor, 一個(gè)行集和或者查詢結(jié)果)處的原始數(shù)據(jù)傳送到內(nèi)存中。現(xiàn)在我們來寫一個(gè)高級的函數(shù),用來把某一列的值取出來,同時(shí)避免暴露底層的細(xì)節(jié)。這個(gè)函數(shù)可能會是這個(gè)樣子:
(假想的DB API用db或DB開頭)
// Example 1: Wrapping a raw cursor int fetch
// operation.
// Fetch an integer from the
// cursor "cr"
// at column "col"
// in the value "val"
void FetchIntField(db_cursor& cr,
unsigned int col, int& val)
{
// Verify type match
if (cr.column_type[col] != DB_INTEGER)
throw std::runtime_error(
"Column type mismatch");
// Do the fetch
db_integer temp;
if (!db_Access_column(&cr, col))
throw std::runtime_error(
"Cannot transfer data");
memcpy(&temp, cr.column_data[col],
sizeof(temp));
// Required by the DB API for cleanup
db_release_column(&cr, col);
// Convert from the database native type to int
val = static_cast<int>(temp);
}
這種接口函數(shù)我們所有人都可能不得不在某個(gè)時(shí)候?qū)懮弦槐椋缓脤Ω兜址浅V匾幚砹舜罅考?xì)節(jié),而且這還只是一個(gè)簡單的例子。FetchIntField抽象,提供了高一層次的功能,它能夠從游標(biāo)處取得一個(gè)整數(shù),不必再擔(dān)心那些紛繁的細(xì)節(jié)。既然這個(gè)函數(shù)如此有用,我們當(dāng)然希望盡可能重用它。但是怎么做?一個(gè)很重要的泛化步驟就是讓這個(gè)函數(shù)能夠處理int之外的類型。為了做到這一點(diǎn),我們得仔細(xì) 考慮代碼中跟int類型相關(guān)的部分。但首先,DB_INTEGER和db_integer是什么意思,它們是打哪兒來的?是這樣,關(guān)系數(shù)據(jù)庫供應(yīng)商通常隨 API提供一些type-mapping helpers,為其所支持的每種類型和簡單的結(jié)構(gòu)定義一個(gè)符號常量或者typedef,把數(shù)據(jù)庫類型對應(yīng)到C/C++類型上。下面是一段假想的數(shù)據(jù)庫API頭文件:
#define DB_INTEGER 1
#define DB_STRING 2
#define DB_CURRENCY 3
...
typedef long int db_integer;
typedef char db_string[255];
typedef strUCt {
int integral_part;
unsigned char fractionary_part;
} db_currency;
...
我們試著來寫一個(gè)FetchDoubleField函數(shù),作為走向泛型化的第一步。此函數(shù)從游標(biāo)處得到一個(gè)double值。數(shù)據(jù)庫本身提供的類型映像 (type mapping)是db_currency,但是我們希望能用double的形式來操作。FetchDoubleField看上去跟 FetchIntField很相似,簡直就是孿生兄弟。例2:
// Example 2: Wrapping a raw cursor double fetch operation.
//
void FetchDoubleField(db_cursor& cr, unsigned int col, double& val)
{
if (cr.column_type[col] != DB_CURRENCY)
throw std::runtime_error("Column type mismatch");
if (!db_access_column(&cr, col))
throw std::runtime_error("Cannot transfer data");
db_currency temp;
memcpy(&temp, cr.column_data[col], sizeof(temp));
db_release_column(&cr, col);
val = temp.integral_part + temp.fractionary_part / 100.;
}
看上去很像FetchIntField吧!我們可不想對每一個(gè)類型都寫一個(gè)單獨(dú)的函數(shù),所以如果能夠在一個(gè)地方把FetchIntField, FetchDoubleField以及其他的Fetch函數(shù)合為一體就好了。我們把這兩片代碼的不同之處列舉如下:
·輸入類型:double/int
·內(nèi)部類型:db_currency/db_integer
·常數(shù)值類型:DB_CURRENCY/DB_INTEGER
·算法:一個(gè)表達(dá)式/static_cast
輸入類型(int/double)與其他幾點(diǎn)之間的對應(yīng)關(guān)系看上去沒什么規(guī)律可循,而是很隨意,跟數(shù)據(jù)庫供應(yīng)商(恰好)提供的類型關(guān)系密切。 Template機(jī)制本身無能為力,它沒有提供如此先進(jìn)的類型推理機(jī)制。也沒法把不同的類型用繼承關(guān)系組織起來,因?yàn)槲覀兲幚淼氖窃碱愋汀J艿?span lang="EN-US">API的 限制以及問題本身的底層特性,乍看上去我們好像沒轍了。不過我們還有一條活路。
進(jìn)入TRAITS大門:Traits技術(shù)就是用來解決上述問題的:把與各種類型相關(guān)的代碼片斷合體,并且具有類似and/or結(jié)構(gòu)的能力,到時(shí)可以根據(jù)不同的類型產(chǎn)生不同的變體。Traits依賴顯式模版特殊化(eXPlicit template specialization)機(jī)制來獲得這種結(jié)果。這一特性使你可以為每一個(gè)特定的類型提供模板類的一個(gè)單獨(dú)實(shí)現(xiàn),見例3:
// Example 3: A traits example
//
template <class T>
class SomeTemplate
{
// generic implementation (1)
...
};
// 注意下面特異的語法
template <>
class SomeTemplate<char>
{
// implementation tuned for char (2)
...
};
...
SomeTemplate<int> a; // will use (1)
SomeTemplate<char*> b; // will use (1)
SomeTemplate<char> c; // will use (2)
如果你用char類型來實(shí)例化SomeTemplate類模板,編譯器會用那個(gè)顯式的模板聲明來特殊化。至于其他的類型,當(dāng)然就用那個(gè)通用模板來實(shí)例化。這就像一個(gè)由類型驅(qū)動if-statement。通常最通用的模板(相當(dāng)于else部分)最先定義,if-statement靠后一點(diǎn)。你甚至可以決定完全不提供通用的模板,這樣只有特定的實(shí)例化是允許的,其他的都會導(dǎo)致編譯錯(cuò)誤。
現(xiàn)在我們把這個(gè)語言特性跟手上的問題聯(lián)系起來。我們要實(shí)現(xiàn)一個(gè)模板函數(shù)FetchField,用需要讀取的類型作為參數(shù)來實(shí)例化。在該函數(shù)內(nèi)部,我會用一個(gè)叫做TypeId的東西代表那個(gè)符號常量,當(dāng)要獲取int型 值時(shí)它的值就是DB_INTEGER,當(dāng)要獲取double型值時(shí)它的值就是DB_CURRENCY。否則,就必須在編譯時(shí)報(bào)錯(cuò)。類似的,根據(jù)要獲取的類型的不同,我們還需要操作不同的API類型(db_integer/db_currency)和不同的轉(zhuǎn)換算法(表達(dá)式/static_cast).讓我們用顯式模板特殊化機(jī)制來解決這個(gè)問題。我們得有一個(gè)FetchField,可以針對一個(gè)模板類來產(chǎn)生不同的變體,而那個(gè)模板類又能夠針對int和double進(jìn)行顯式特殊化。每個(gè)特殊化都必須為這些變體提供統(tǒng)一的名稱。
// Example 4: Defining DbTraits
//
// Most general case not implemented 最通用的情況沒有實(shí)現(xiàn)
template <typename T> struct DbTraits;
// Specialization for int
template <>
struct DbTraits<int>
{
enum { TypeId = DB_INTEGER };
typedef db_integer DbNativeType;
// 注意下面的Convert是static member function —— 譯者
static void Convert(DbNativeType from, int& to)
{
to = static_cast<int>(from);
}
};
// Specialization for double
template <>
struct DbTraits<double>
{
enum { TypeId = DB_CURRENCY };
typedef db_currency DbNativeType;
// 注意下面的Convert是static member function —— 譯者
static void Convert(const DbNativeType& from, double& to)
{
to = from.integral_part + from.fractionary_part / 100.;
}
};
現(xiàn)在,如果你寫DbTraits<int>::TypeId,你得到的就是DB_INTEGER,而對于DbTraits<double>::TypeId,得到的就是DB_CURRENCY,對于DbTraits<anything_else>::TypeId,得到的是什么呢?Compile-time error!因?yàn)槟0孱惐旧碇皇锹暶髁耍]有定義。是不是一勞永逸了?看看我們?nèi)绾卫?span lang="EN-US">DbTraits來實(shí)現(xiàn)FetchField就放心了。我們把所有變化的部分——枚舉類型、API類型、轉(zhuǎn)換算法——都放在了DbTraits里,這下我們的函數(shù)里只包含FetchIntField和FetchDoubleField的相同部分了:
// Example 5: A generic, extensible FetchField using DbTraits
//
template <class T>
void FetchField(db_cursor& cr, unsigned int col, T& val)
{
// Define the traits type
typedef DbTraits<T> Traits;
if (cr.column_type[col] != Traits::TypeId)
throw std::runtime_error("Column type mismatch");
if (!db_access_column(&cr, col))
throw std::runtime_error("Cannot transfer data");
typename Traits::DbNativeType temp;
memcpy(&temp, cr.column_data[col], sizeof(temp));
Traits::Convert(temp, val);
db_release_column(&cr, col);
}
搞定了!我們只不過實(shí)現(xiàn)和使用了一個(gè)traits模板類而已!Traits依靠顯式模板特殊化來把代碼中因類型不同而發(fā)生變化的片斷拖出來,用統(tǒng)一的接口來包裝。這個(gè)接口可以包含一個(gè)C++類所能包含的任何東西:內(nèi)嵌類型,成員函數(shù),成員變量,作為客戶的模板代碼可以通過traits模板類所公開的接口來間接訪問之。這樣的traits接口通常是隱式的,隱式接口不如函數(shù)簽名(function signatures)那么嚴(yán)格,例如,盡管DbTraits<int>::Convert和DbTraits<double>::Convert有著非常不同的簽名,但它們都可以正常工作。 Traits模板類在各種類型上建立一個(gè)統(tǒng)一的接口,而又針對各種類型提供不同的實(shí)現(xiàn)細(xì)節(jié)。由于Traits抓住了一個(gè)概念,一個(gè)相關(guān)聯(lián)的選擇集,所以能夠在相似的contexts中被重用。
定義: A traits template is a template class, possibly explicitly
specialized, that provides a uniform symbolic interface over a coherent
set of design choices that vary from one type to another.
Traits模板是一個(gè)模板類,很可能是顯式特殊化的模板類,它為一系列根據(jù)不同類型做出的設(shè)計(jì)選擇提供了一個(gè)統(tǒng)一的、符號化的接口。TRAITS AS ADAPTERS: 用作適配子的TRAITS數(shù)據(jù)庫的問題說得夠多了,現(xiàn)在我們來看一個(gè)更一般的例子——smart pointers。假 設(shè)你正在設(shè)計(jì)一個(gè)SmartPtr模板類。對于一個(gè)smart pointer來說,最美妙的事情是它們可以自動管理內(nèi)存問題,同時(shí)在其他方面又像一個(gè)常規(guī)指針。而不那么美妙的事情是,它們的實(shí)現(xiàn)代碼可不是好對付的,有些C++的smart pointer實(shí)現(xiàn)技術(shù)簡直就是在黑暗中變戲法。這一殘酷的事實(shí)帶來了一個(gè)重要實(shí)踐經(jīng)驗(yàn):你最好盡一切可能一勞永逸,寫出一個(gè)出色的、具有工業(yè)強(qiáng)度的 smart pointer來滿足你所有的需求。此外,你通常不能修改一個(gè)類來適應(yīng)你的smart pointer,所以你的SmartPtr一定要足夠靈活。
有不少類層次使用引用計(jì)數(shù)(reference counting)以及相應(yīng)的函數(shù)管理對象的生存期。然而,并沒有reference counting的標(biāo)準(zhǔn)實(shí)現(xiàn)方法,每一個(gè)C++庫的供應(yīng)商在實(shí)現(xiàn)的語法和/或語義上都有所不同。例如,在你的應(yīng)用程序中有這樣兩個(gè)interfaces:大部分的類實(shí)現(xiàn)了RefCounted接口:
class RefCounted
{
public:
void IncRef() = 0;
bool DecRef() = 0; // if you DecRef() to zero
// references, the object is destroyed
// automatically and DecRef() returns true
virtual ~RefCounted() {}
};
而由第三方提供的Widget類使用不同的接口:
class Widget
{
public:
void AddReference();
int RemoveReference(); // returns the remaining
// number of references; it's the client's
// responsibility to destroy the object
...
};
不過你并不想維護(hù)兩個(gè)smart pointer類,你想讓兩種類共享一個(gè)SmartPtr。一個(gè)基于traits的解決方案把兩種不同的接口用語法和語義上統(tǒng)一的接口包裝起來,建立針對普通類的通用模板,而針對Widget建立一個(gè)特殊化版本,如下:
// Example 6: Reference counting traits
//
template <class T>
class RefCountingTraits
{
static void Refer(T* p)
{
p->IncRef(); // assume RefCounted interface
}
static void Unrefer(T* p)
{
p->DecRef(); // assume RefCounted interface
}
};
template <>
class RefCountingTraits<Widget>
{
static void Refer(Widget* p)
{
p->AddReference(); // use Widget interface
}
static void Unrefer(Widget* p)
{
// use Widget interface
if (p->RemoveReference() == 0)
delete p;
}
};
在SmartPtr里,我們像這樣使用RefCountingTraits:
template <class T>
class SmartPtr
{
private:
typedef RefCountingTraits<T> RCTraits;
T* pointee_;
public:
...
~SmartPtr()
{
RCTraits::Unrefer(pointee_);
}
};
當(dāng)然在上面的例子里,你可能會爭論說你可以直接特殊化Widget類的SmartPtr的構(gòu)造與析構(gòu)函數(shù)。你可以使用把模板特殊化技術(shù)用在SmartPtr 本身,而不是用在trait上頭,這樣還可以消除額外的類。盡管對這個(gè)問題來說這種想法沒錯(cuò),但還是由一些你需要注意的缺陷:[譯者為了說明起見,提供一個(gè)針對SmartPtr本身進(jìn)行顯式特殊化的范例供作者批判:]
// 通用類型版
template <class T>
class SmartPtr {
private:
T *pointee_;
public:
SmartPtr(T* pobj) {
pointee_ = pobj;
pobj->IncRef();
}
...
~SmartPtr() {
pointee_->DecRef();
}
};
// Widget類專用版
template <>
class SmartPtr<Widget> {
private:
T *pointee_;
public:
SmartPtr(T* pobj) {
pointee_ = pobj;
pobj->AddReference();
}
...
~SmartPtr() {
if (pointee_->RemoveReference() == 0)
delete pointee_;
}
};
這么干缺乏可擴(kuò)展性。如果給給SmartPtr再增加一個(gè)模板參數(shù),喏,全完蛋了!你不能特殊 化這樣一個(gè)SmartPtr<T. U>,其中模板參數(shù)T是Widget,而U可以為其他任何類型。不,你做不到。附帶說一句,smart pointer經(jīng)常用作模板參數(shù)。[譯者附釋:也就是說,顯式模板特殊化的if-statement部分,針對特別的模板參數(shù)提供特別 的特殊化方案,要求定義時(shí)必須指定全部的參數(shù)類型,不能只是“部分指定”。例如:
// else-part, 針對其他所有類型
template <class T, class U>
class Demo {...};
template <>
class Demo<type1, type2> {...}; //可以,T和U都指定了
template <>
class Demo<type3, U> {...}; // 不行,不能只指定部分模板參數(shù)
template <class U>
class Demo<type4, U> {...}; // 想蒙混過關(guān)?對不住,C++不允許]
·最終代碼不那么清晰。Trait有一個(gè)名字,而且把相關(guān)的東西很好的組織起來,因此使用traits的代碼更加容易理解。相比之下,用直接特殊化SmartPtr成員函數(shù)的代碼,看上去更招黑客的喜歡。
·你沒法對一種類型使用多種traits。
用繼承機(jī)制的解決方案,就算本身完美無瑕,也至少存在上述的缺陷。解決這樣一個(gè)變體問題,使用繼承實(shí)在是太笨重了。此外,通常用以取代繼承方案的另一種經(jīng)典機(jī)制——containment,用在這里也顯得畫蛇添足,繁瑣不堪。相反,traits方案干凈利落,簡明有效,物合其用,恰到好處。
Traits的一個(gè)重要的應(yīng)用是“interface glue”(接口膠合劑),通用的、可適應(yīng)性極強(qiáng)的適配子。如果不同的類對于一個(gè)給定的概念有著不同的實(shí)現(xiàn),traits可以把這些實(shí)現(xiàn)再組織統(tǒng)一成一個(gè)公共的接口。對于一個(gè)給定類型提供多種TRAITS:現(xiàn)在,我們假設(shè)所有的人都很喜歡你的SmartPtr模板類,直到有一天,在你的多線程應(yīng)用程序里開始現(xiàn)了神秘的 bug,美夢被驚醒了。你發(fā)現(xiàn)罪魁禍?zhǔn)资?span lang="EN-US">Widget,它的引用計(jì)數(shù)函數(shù)并不是線程安全的。現(xiàn)在你不得不親自實(shí)現(xiàn)Widget:: AddReference和Widget::RemoveReference,最合理的位置應(yīng)該是在RefCountingTraits中,打上個(gè)補(bǔ)丁 吧:
// Example 7: Patching Widget's traits for thread safety
//
template <>
class RefCountingTraits<Widget>
{
static void Refer(Widget* p)
{
Sentry s(lock_); // serialize access
p->AddReference();
}
static void Unrefer(Widget* p)
{
Sentry s(lock_); // serialize access
if (p->RemoveReference() == 0)
delete p;
}
private:
static Lock lock_;
};
不幸的是,雖然你重新編譯、測試之后正確運(yùn)行,但是程序慢得像蝸牛。仔細(xì)分析之后發(fā)現(xiàn),你剛才的所作所為往程序里塞了一個(gè)糟糕的瓶頸。實(shí)際上只有少數(shù)幾個(gè) Widget是需要能夠被好幾個(gè)線程訪問的,余下的絕大多數(shù)Widget都是只被一個(gè)線程訪問的。你要做的是告訴編譯器按你的需求分別使用多線程 traits和單線程traits這兩個(gè)不同版本。你的代碼主要使用單線程traits.如何告訴編譯器使用那個(gè)traits?這么干:把traits作為另一個(gè)模板參數(shù)傳給SmartPtr。缺省情況下傳遞老式的traits模板,而用特定的類型實(shí)例化特定的模板。
template <class T, class RCTraits = RefCountingTraits<T> >
class SmartPtr
{
...
};
你對單線程版的RefCountingTraits<Widget>不做改動,而把多線程版放在一個(gè)單獨(dú)的類中:
class MtRefCountingTraits
{
static void Refer(Widget* p)
{
Sentry s(lock_); // serialize access
p->AddReference();
}
static void Unrefer(Widget* p)
{
Sentry s(lock_); // serialize access
if (p->RemoveReference() == 0)
delete p;
}
private:
static Lock lock_;
};
現(xiàn)在你可將SmartPtr<Widget>用于單線程目的,將SmartPtr<Widget, MtRefCountingTraits>用于多線程目的。這就是了!就跟Scott Meyers可能會說的那樣,“你要是沒體會過快樂,就不知道怎么找樂。”如果一種類型只要一個(gè)trait由可以應(yīng)付,那么只要用顯式模板特殊化就夠了。現(xiàn)在即使一個(gè)類型需要多個(gè)trait來應(yīng)付我們也搞得定。所以,traits必須能夠從外界塞進(jìn)來,而不是在內(nèi)部“算出來”。一個(gè)應(yīng)當(dāng)謹(jǐn)記的慣用法是提供一個(gè)traits類作為最后一個(gè)模板參數(shù)。缺省的traits通過模板參數(shù)缺省值給定。定義:一個(gè)traits類(與traits模板類相對)或者是一個(gè)traits模板類的實(shí)例,或者是一個(gè)與traits模板類展現(xiàn)出相同接口的單獨(dú)的類。