C++的營(yíng)養(yǎng)
莫華楓
上一篇《C++的營(yíng)養(yǎng)——RAII》中介紹了RAII,以及如何在C#中實(shí)現(xiàn)。這次介紹另一個(gè)重要的基礎(chǔ)技術(shù)——swap手法。
swap手法
swap手法不應(yīng)當(dāng)是C++獨(dú)有的技術(shù),很多語(yǔ)言都可以實(shí)現(xiàn),并且從中得到好處。只是C++存在的一些缺陷迫使大牛們發(fā)掘,并開(kāi)始重視這種有用的手法。這 個(gè)原本被用來(lái)解決C++的資源安全和異常保證問(wèn)題的技術(shù)在使用中逐步體現(xiàn)出越來(lái)越多的應(yīng)用,有助于我們編寫(xiě)更加簡(jiǎn)潔、優(yōu)雅和高效的代碼。接下來(lái),我們先來(lái)和swap打個(gè)招呼。然后看看在C#里如何玩出swap。最后展示swap手法的幾種應(yīng)用,從中我們將看到它是如何的可愛(ài)。
假設(shè),我要做一個(gè)類(lèi),實(shí)現(xiàn)統(tǒng)計(jì)并保存一個(gè)字符串中字母的出現(xiàn)次數(shù),以及總的字母和數(shù)字的個(gè)數(shù)。
class CountStr
{
public:
explicit CountStr(std::string const& val)
:m_str(val), m_nLetter(0), m_nNumber(0) {
do_count(val);
}
CountStr(CountStr const& cs)
:m_str(cs.m_str), m_counts(cs.m_counts)
, m_nLetter(cs.m_nLetter), m_nNumber(cs.m_nNumber)
{}
void swap(CountStr& cs) {
std::swap(m_str, cs.m_str);
m_counts.swap(m_str);
std::swap(m_nLetter, cs.m_nLetter);
std::swap(m_nNumber, cs.m_nNumber);
}
private:
std::string m_str;
std::map<char, int> m_counts;
int m_nLetter;
int m_nNumber;
}順便提一下,在未來(lái)的C++0x中,由于引入了concept機(jī)制,可以允許一個(gè)函數(shù)模板自動(dòng)識(shí)別出所有“具有swap()成員”的類(lèi)型,并使用相應(yīng)的特化版本。這樣便只需使用std::swap(),而不必考慮是什么樣的類(lèi)型了。
言歸正傳。這里,swap()成員函數(shù)有兩個(gè)要求,其一是復(fù)雜度為O(1),其二是具備無(wú)拋擲的異常保證。前者對(duì)于性能而言至關(guān)重要,否則swap操作將 會(huì)由于性能問(wèn)題而無(wú)法在實(shí)際項(xiàng)目中使用。對(duì)于后者,是確保強(qiáng)異常保證(commit or rollback語(yǔ)義)的基石。要達(dá)到這兩個(gè)要求,有幾個(gè)關(guān)鍵要點(diǎn):首先,對(duì)于類(lèi)型為內(nèi)置類(lèi)型或小型POD(8~16字節(jié)以?xún)?nèi))的成員數(shù)據(jù),可以直接使用 std::swap();其次,對(duì)于非平凡的類(lèi)型(擁有資源引用,復(fù)制構(gòu)造和賦值操作會(huì)引發(fā)深拷貝),并且擁有符合上述要求的swap()成員函數(shù)的,直 接使用swap()成員函數(shù);最后,其余的類(lèi)型,則保有其指針,或智能指針,以確保滿(mǎn)足上述兩個(gè)要求。
聽(tīng)上去有些復(fù)雜,但在實(shí)際開(kāi)發(fā)中做到并不難。首先,盡量使用標(biāo)準(zhǔn)庫(kù)容器,因?yàn)闃?biāo)準(zhǔn)庫(kù)容器都擁有滿(mǎn)足兩個(gè)條件的swap()成員。其次,在編寫(xiě)的每一個(gè)類(lèi)中 實(shí)現(xiàn)滿(mǎn)足兩個(gè)條件的swap()成員。最后,對(duì)于那些不具備swap()成員函數(shù)的第三方類(lèi)型,則使用指針,最好是智能指針。(也就是Sutter所謂的 PImpl手法)。只要堅(jiān)持這些方針,必能收到很好的效果。
下面,就來(lái)看一下這個(gè)swap()的第一個(gè)妙用。假設(shè),這個(gè)類(lèi)需要復(fù)制。通常可以通過(guò)operator=操作符,或者copy(或其他有明確的復(fù)制含義 的)成員函數(shù)實(shí)現(xiàn),這兩者實(shí)際上是等價(jià)的,只是形式不同而已。這里選擇operator=,因?yàn)樗容^C++:)。
最直白的實(shí)現(xiàn)方式是這樣:
class CountStr
{
public:
...
CountStr& operator=(CountStr& val) {
m_str=val.m_str;
m_counts=val.m_counts;
m_nLetter=val.m_nLetter;
m_nNumber=val.m_nNumber;
}
...
}先解釋一下異常保證。異常保證有三個(gè)級(jí)別:基本保證、強(qiáng)異常保證和無(wú)拋擲保證。基本保證是指異常拋出時(shí),程序的各個(gè)部分應(yīng)當(dāng)處于有效狀態(tài),不能有資源泄 漏。這個(gè)級(jí)別可以輕而易舉地利用RAII確保,這在前一篇已經(jīng)展示過(guò)了。強(qiáng)異常保證則更加嚴(yán)格,要求異常拋出后,程序非但要滿(mǎn)足基本保證,其各個(gè)部分的數(shù) 據(jù)應(yīng)保持原狀。也就是要滿(mǎn)足“Commit or Rollback”語(yǔ)義,熟悉數(shù)據(jù)庫(kù)的人,可以聯(lián)想一下Transaction的行為。而無(wú)拋擲保證要求函數(shù)在任何情況下都不會(huì)拋出異常。無(wú)拋擲保證不是 說(shuō)用一個(gè)catch(...)或throw()把異常統(tǒng)統(tǒng)吞掉。而是說(shuō)在無(wú)拋擲保證的函數(shù)中的任何操作,都不會(huì)拋出異常。能滿(mǎn)足無(wú)拋擲保證的操作還是很多 的,比如內(nèi)置POD類(lèi)型(int、指針等等)的復(fù)制,swap手法便以此為基礎(chǔ)。(多說(shuō)一句,用catch(...)吞掉異常來(lái)確保無(wú)拋擲并非絕對(duì)不行, 在特定情況下,還是可以偶爾一用。不過(guò)這等爛事也只能在西構(gòu)函數(shù)中進(jìn)行,而且也只有在迫不得已的情況下用那么一下)。
如果這四個(gè)賦值操作 中,任意一個(gè)拋出異常,便會(huì)退出這個(gè)函數(shù)(操作符)。此時(shí),至少有一個(gè)成員數(shù)據(jù)沒(méi)有正確修改,而其他的則全部或部分地發(fā)生改變。于是,一部分成員數(shù)據(jù)是新 的,另一部分是舊的,甚至還有一些是不完全的。這在軟件中往往會(huì)引發(fā)很多令人苦惱的bug。無(wú)論如何,此時(shí)應(yīng)當(dāng)運(yùn)用強(qiáng)異常保證,使得數(shù)據(jù)要么是新的值,要 么沒(méi)有改變。那么如何獲得強(qiáng)異常保證?在swap()的幫助下,驚人的簡(jiǎn)單:
class CountStr
{
public:
...
CountStr& operator=(CountStr& val) {
swap(CountStr(val)); // 或者CountStr(val).swap(*this);
raturn *this;
}
...
}那么拋出異常的情況又是怎樣的呢?
先來(lái)看看operator=里執(zhí)行了哪些步驟,并考察這些步驟的異常拋擲的情況。如果將代碼改寫(xiě)成另一個(gè)等價(jià)的形式,就很容易理解了:
CountStr& operator=(CountStr& val) {
CountStr t_(val); //此處可能拋出異常,但只有t_的值發(fā)生變化
t_.swap(*this); //由于swap擁有無(wú)拋擲保證,所以不會(huì)拋出異常
return *this;
}在C#中,實(shí)現(xiàn)swap非常容易,甚至比C++更容易。因?yàn)樵贑#中,大部分對(duì)象都在堆上,代碼中定義的所謂對(duì)象實(shí)際上是引用。對(duì)于引用的賦值操作是無(wú)拋擲的,因此在C#中可以采用同C++幾乎一樣的代碼實(shí)現(xiàn)swap:
class CountStr
{
public CountStr(string val) {
m_str=val;
m_nLetter=0;
m_nNumber=0;
do_count(val);
}
public CountStr(CountStr cs) {
m_str=new string(cs.m_str);
m_counts=new Dictionary<char, int>(cs.m_counts);
m_nLetter=cs.m_nLetter;
m_nNumber=cs.m_nNumber
}
public void swap(CountStr& cs) {
utility.swap(ref m_str, ref cs.m_str);
utility.swap(ref m_counts, ref cs.m_counts);
utility.swap(ref m_nLetter, ref cs.m_nLetter);
utility.swap(ref m_nNumber, ref cs.m_nNumber);
}
public void copy(CountStr& cs) {
this.swap(new CountStr(cs));
}
private string m_str;
private Dictionary<char, int> m_counts;
private int m_nLetter;
private int m_nNumber;
}
class utility
{
public static void swap<T>(ref T lhs, ref T rhs) {
T t_=lhs;
lhs=rhs;
rhs=t_;
}
}
public void copy(CountStr& cs) {
using(CountStr t_=new CountStr(cs))
{
t_.swap(this);
}
}swap的基本作用是維持強(qiáng)異常保證語(yǔ)義。但是,作為一種基礎(chǔ)性的技術(shù),它還可以擁有更多的用途。下面介紹幾種主要的應(yīng)用,為了節(jié)省篇幅,案例直接使用C#,不再給出C++的代碼。
在我們的開(kāi)發(fā)過(guò)程中,有時(shí)需要是一些對(duì)象復(fù)位,即回復(fù)對(duì)象的初始狀態(tài)。一般情況下,我們會(huì)在類(lèi)中增加一個(gè)reset()之類(lèi)的成員,在這個(gè)函數(shù)中釋放資源,恢復(fù)各成員數(shù)據(jù)的初值。但是,在擁有swap的情況下,這種操作變得非常容易:
class X
{
public X() {
... //初始化對(duì)象
}
public X(int v) {
... //以v初始化對(duì)象
}
public void swap(X val) {...}
public void reset() {
this.swap(new X());
}
...
}
class X
{
...
public void reset(int v) {
this.swap(new X(v));
}
...
}
X x=new X();
... //對(duì)x的操作,改變了內(nèi)容
x.swap(new X()); //復(fù)位了
class X : IDisposable
{
...
public void reset() {
using(X t=new X())
{
this.swap(t);
}
}
public void Dispose() {...}
...
}有時(shí),我們會(huì)做一些類(lèi),在構(gòu)造函數(shù)中執(zhí)行一些復(fù)雜的操作,比如解析一個(gè)文本文件,然后向外公布解析后的結(jié)果。之后,我們需要在這個(gè)對(duì)象上load另一個(gè)文 件,那么通常都寫(xiě)一個(gè)load成員函數(shù),先釋放掉原先占用的資源,然后再加載新的文件。如果有了swap,那么這個(gè)load函數(shù)同樣極其簡(jiǎn)單:
class Y : IDisposable
{
public Y(string filename) {
... //打開(kāi)文件,執(zhí)行解析
}
public void swap(Y val) {...}
public load(string filename) {
using(Y t=new Y(filename))
{
this.swap(t);
}
}
public void Dispose() {
... //關(guān)閉文件,釋放資源
}
}
class Z
{
public Z(int a, float b) {
m_a=a;
m_b=b;
}
public void swap(Z val) {...}
public int a { get{return m_a;}}
public float b { get{return m_b;}}
private int m_a;
private float m_b;
}
Z z=new Z(3, 4.5);
z.swap(new Z(5, 5.4)); //z的值已修改有些類(lèi),構(gòu)造函數(shù)需要一些數(shù)據(jù)初始化對(duì)象,并且會(huì)創(chuàng)建的過(guò)程中會(huì)驗(yàn)證其有效性,和執(zhí)行一些計(jì)算。也就是構(gòu)造函數(shù)存在一定的數(shù)據(jù)邏輯。如果需要修改對(duì)象的某 些值,會(huì)牽涉到相應(yīng)的復(fù)雜數(shù)據(jù)邏輯。通常都是把這些邏輯獨(dú)立在private成員函數(shù)中,由構(gòu)造函數(shù)和數(shù)據(jù)修改操作共享。這樣的做法往往不能帶來(lái)強(qiáng)異常保 證,在構(gòu)造函數(shù)里的數(shù)據(jù)驗(yàn)證往往會(huì)拋出異常。因此,如果使用swap,便可以消除這類(lèi)問(wèn)題,并且使代碼簡(jiǎn)化:
class A
{
public A(int a, string b, Rectangle c) {
... //數(shù)據(jù)邏輯、計(jì)算等
}
public int a {
set{ this.swap(new A(value, m_b, m_c));}
}
public string b {
set{ this.swap(new A(m_a, value, m_c));}
}
public Rectangle c {
set{ this.swap(new A(m_a, m_b, value));}
}
...
}
A a=new A(2, "zzz", Rectangle(1,1, 10,10));
a.swap(new A(3, "zzz", Rectangle(1,1, 10,10)));所有這些與對(duì)象狀態(tài)設(shè)置有關(guān)的swap用法,都集中表現(xiàn)了一個(gè)特性,即使得我們可以將對(duì)象的初始化代碼集中在構(gòu)造函數(shù)中,數(shù)據(jù)和資源清理的代碼集中在 Dispose()中。這種做法可以大大提高代碼的可維護(hù)性。如果一個(gè)軟件項(xiàng)目中,每個(gè)類(lèi)都實(shí)現(xiàn)swap和復(fù)制構(gòu)造函數(shù)(除非該類(lèi)不允許復(fù)制),并盡可能 集中數(shù)據(jù)邏輯代碼,那么會(huì)使得代碼質(zhì)量有答復(fù)的提高。
在上一篇《C++的營(yíng)養(yǎng)——RAII》中,我提到守衛(wèi)一個(gè)結(jié)構(gòu)復(fù)雜的類(lèi):在代碼中修改一個(gè)對(duì)象,然后再回復(fù)原來(lái)的狀態(tài)。如果單純手工地保存對(duì)象數(shù)據(jù),通常 很困難(有時(shí)甚至是不可能的),而且也難以維持異常安全性(強(qiáng)異常保證)。但是如果使用了swap,那么將會(huì)易如反掌:
void ScopeObject(MyCls obj) {
using(MyCls t_=new MyCls(obj))
{
... //操作obj,改變其狀態(tài)或數(shù)據(jù)
obj.swap(t_); //恢復(fù)原來(lái)的狀態(tài)
}
}作為更進(jìn)一步的發(fā)展,可以構(gòu)造一個(gè)ISwapable泛型接口:
interface ISwapable<T>
{
void swap(T v);
}
class B : ISwapable<B>
{
public B() {...}
public void swap(B v) {...}
...
}
class utility
{
public static void reset<T>(T obj)
where T : ISwapable
where T : new()
{
obj.swap(new T());
}
}
X x;
Y y;
utility.reset(x);
utility.reset(y);
...或許swap手法非常基礎(chǔ),非常細(xì)小,而且很多人不用swap也過(guò)來(lái)了。但是,聚沙成塔,每一處細(xì)小的優(yōu)化,積累起來(lái)則是巨大的進(jìn)步。還是劉皇叔說(shuō)得好:“勿以善小而不為,勿以惡小而為之”。


:m_str(val), m_nLetter(