1、構造函數能不能是虛函數:
1.1從存儲空間角度
虛函數對應一個vtable,這大家都知道,可是這個vtable其實是存儲在對象的內存空間的。問題出來了,如果構造函數是虛的,就需要通過 vtable來調用,可是對象還沒有實例化,也就是內存空間還沒有,怎么找vtable呢?所以構造函數不能是虛函數。
1.2從使用角度
虛函數主要用于在信息不全的情況下,能使重載的函數得到對應的調用。構造函數本身就是要初始化實例,那使用虛函數也沒有實際意義呀。所以構造函數沒有必要是虛函數。
1.3從作用
虛函數的作用在于通過父類的指針或者引用來調用它的時候能夠變成調用子類的那個成員函數。而構造函數是在創建對象時自動調用的,不可能通過父類的指針或者引用去調用,因此也就規定構造函數不能是虛函數。
1.4
vbtl在構造函數調用后才建立,因而構造函數不可能成為虛函數。在調用構造函數時還不能確定對象的真實類型(因為子類會調父類的構造函數);而且構造函數的作用是提供初始化,在對象生命期只執行一次,不是對象的動態行為,也沒有太大的必要成為虛函數
2、析構函數可以為虛函數,甚至是純虛的
我們往往通過基類的指針來銷毀對象。這時候如果析構函數不是虛函數,就不能正確識別對象類型從而不能正確調用析構函數。
class A
{
public:
virtual ~A()=0; // 純虛析構函數
};
當一個類打算被用作其它類的基類時,它的析構函數必須是虛的。考慮下面的例子:
class A
{
public:
A() { ptra_ = new char[10];}
~A() { delete[] ptra_;} // 非虛析構函數
private:
char * ptra_;
};
class B: public A
{
public:
B() { ptrb_ = new char[20];}
~B() { delete[] ptrb_;}
private:
char * ptrb_;
};
void foo()
{
A * a = new B;
delete a;
}
在這個例子中,程序也許不會象你想象的那樣運行,在執行delete a的時候,實際上只有A::~A()被調用了,而B類的析構函數并沒有被調用!這是否有點兒可怕?
如果將上面A::~A()改為virtual,就可以保證B::~B()也在delete a的時候被調用了。因此基類的析構函數都必須是virtual的。
純虛的析構函數并沒有什么作用,是虛的就夠了。通常只有在希望將一個類變成抽象類(不能實例化的類),而這個類又沒有合適的函數可以被純虛化的時候,可以使用純虛的析構函數來達到目的。
3、關于構造函數
編譯器對每個包含虛函數的類創建一個表(稱為VTABLE)。在VTABLE中,編譯器放置特定類的虛函數地址。在每個帶有虛函數的類中,編譯器秘密地置一指針,稱為vpointer(縮寫為VPTR),指向這個對象的VTABLE。
當一個構造函數被調用時,它做的首要的事情之一是初始化它的VPTR。因此,它只能知道它是“當前”類的,而完全忽視這個對象后面是否還有繼承者。當編譯器為這個構造函數產生代碼時,它是為這個類的構造函數產生代碼--既不是為基類,也不是為它的派生類(因為類不知道誰繼承它)。
所以它使用的VPTR必須是對于這個類的VTABLE。而且,只要它是最后的構造函數調用,那么在這個對象的生命期內,VPTR將保持被初始化為指向這個VTABLE。但如果接著還有一個更晚派生的構造函數被調用,這個構造函數又將設置VPTR指向它的 VTABLE,等.直到最后的構造函數結束。VPTR的狀態是由被最后調用的構造函數確定的。這就是為什么構造函數調用是從基類到派生類順序的另一個理由。
但是,當這一系列構造函數調用正發生時,每個構造函數都已經設置VPTR指向它自己的VTABLE。如果函數調用使用虛機制,它將只產生通過它自己的VTABLE的調用,而不是最后的VTABLE(所有構造函數被調用后才會有最后的VTABLE)。
4、 虛函數
是C++中用于實現多態(polymorphism)的機制。核心理念就是通過基類訪問派生類定義的函數。假設我們有下面的類層次:
class A
{
public:
virtual void foo() { cout << "A::foo() is called" << endl;}
};
class B: public A
{
public:
virtual void foo() { cout << "B::foo() is called" << endl;}
};
那么,在使用的時候,
A * a = new B();
a->foo(); // 在這里,a雖然是指向A的指針,但是被調用的函數(foo)卻是B的!
這個例子是虛函數的一個典型應用,通過這個例子,也許你就對虛函數有了一些概念。它虛就虛在所謂“推遲聯編”或者“動態聯編”上,一個類函數的調用并不是在編譯時刻被確定的,而是在運行時刻被確定的。由于編寫代碼的時候并不能確定被調用的是基類的函數還是哪個派生類的函數,所以被成為“虛”函數。
虛函數只能借助于指針或者引用來達到多態的效果,如果是下面這樣的代碼,則雖然是虛函數,但它不是多態的:
class A
{
public:
virtual void foo();
};
class B: public A
{
virtual void foo();
};
void bar()
{
A a;
a.foo(); // A::foo()被調用
}
5、 多態
在了解了虛函數的意思之后,再考慮什么是多態就很容易了。仍然針對上面的類層次,但是使用的方法變的復雜了一些:
void bar(A * a)
{
a->foo(); // 被調用的是A::foo() 還是B::foo()?
}
因為foo()是個虛函數,所以在bar這個函數中,只根據這段代碼,無從確定這里被調用的是A::foo()還是B::foo(),但是可以肯定的說:如果a指向的是A類的實例,則A::foo()被調用,如果a指向的是B類的實例,則B::foo()被調用。
這種同一代碼可以產生不同效果的特點,被稱為“多態”。
5.1 多態有什么用?
多態這么神奇,但是能用來做什么呢?這個命題我難以用一兩句話概括,一般的C++教程(或者其它面向對象語言的教程)都用一個畫圖的例子來展示多態的用途,我就不再重復這個例子了,如果你不知道這個例子,隨便找本書應該都有介紹。我試圖從一個抽象的角度描述一下,回頭再結合那個畫圖的例子,也許你就更容易理解。
在面向對象的編程中,首先會針對數據進行抽象(確定基類)和繼承(確定派生類),構成類層次。這個類層次的使用者在使用它們的時候,如果仍然在需要基類的時候寫針對基類的代碼,在需要派生類的時候寫針對派生類的代碼,就等于類層次完全暴露在使用者面前。如果這個類層次有任何的改變(增加了新類),都需要使用者“知道”(針對新類寫代碼)。這樣就增加了類層次與其使用者之間的耦合,有人把這種情況列為程序中的“bad smell”之一。
多態可以使程序員脫離這種窘境。再回頭看看上面的例子,bar()作為A-B這個類層次的使用者,它并不知道這個類層次中有多少個類,每個類都叫什么,但是一樣可以很好的工作,當有一個C類從A類派生出來后,bar()也不需要“知道”(修改)。這完全歸功于多態--編譯器針對虛函數產生了可以在運行時刻確定被調用函數的代碼。
5.2 如何“動態聯編”
編譯器是如何針對虛函數產生可以再運行時刻確定被調用函數的代碼呢?也就是說,虛函數實際上是如何被編譯器處理的呢?Lippman在深度探索C++對象模型[1]中的不同章節講到了幾種方式,這里把“標準的”方式簡單介紹一下。
所說的“標準”方式,也就是所謂的“VTABLE”機制。編譯器發現一個類中有被聲明為virtual的函數,就會為其搞一個虛函數表,也就是VTABLE。VTABLE實際上是一個函數指針的數組,每個虛函數占用這個數組的一個slot。一個類只有一個VTABLE,不管它有多少個實例。派生類有自己的VTABLE,但是派生類的VTABLE與基類的VTABLE有相同的函數排列順序,同名的虛函數被放在兩個數組的相同位置上。在創建類實例的時候,編譯器還會在每個實例的內存布局中增加一個vptr字段,該字段指向本類的VTABLE。通過這些手段,編譯器在看到一個虛函數調用的時候,就會將這個調用改寫。
void bar(A * a){ a->foo(); }
會被改寫為:
void bar(A * a){ (a->vptr[1])(); }
因為派生類和基類的foo()函數具有相同的VTABLE索引,而他們的vptr又指向不同的VTABLE,因此通過這樣的方法可以在運行時刻決定調用哪個foo()函數。雖然實際情況遠非這么簡單,但是基本原理大致如此。
5.3 overload和override
虛函數總是在派生類中被改寫,這種改寫被稱為“override”。我經常混淆“overload”和“override”這兩個單詞。澄清一下:
override是指派生類重寫基類的虛函數,就象我們前面B類中重寫了A類中的foo()函數。重寫的函數必須有一致的參數表和返回值(C++標準允許返回值不同的情況,這個我會在“語法”部分簡單介紹,但是很少編譯器支持這個feature)。這個單詞好象一直沒有什么合適的中文詞匯來對應,有人譯為“覆蓋”,還貼切一些。
overload約定成俗的被翻譯為“重載”。是指編寫一個與已有函數同名但是參數表不同的函數。例如一個函數即可以接受整型數作為參數,也可以接受浮點數作為參數。
6、 虛函數的語法
6.1 virtual關鍵字
class A
{
public:
virtual void foo();
};
class B: public A
{
public:
void foo(); // 沒有virtual關鍵字!
};
class C: public B // 從B繼承,不是從A繼承!
{
public:
void foo(); // 也沒有virtual關鍵字!
};
這種情況下,B::foo()是虛函數,C::foo()也同樣是虛函數。因此,可以說,基類聲明的虛函數,在派生類中也是虛函數,即使不再使用virtual關鍵字。
6.2 private的虛函數
class A
{
public:
void foo() { bar();}
private:
virtual void bar() { ...}
};
class B: public A
{
private:
virtual void bar() { ...}
};
在這個例子中,雖然bar()在A類中是private的,但是仍然可以出現在派生類中,并仍然可以與public或者protected的虛函數一樣產生多態的效果。并不會因為它是private的,就發生A::foo()不能訪問B::bar()的情況,也不會發生B::bar()對A::bar()的override不起作用的情況。
這種寫法的語意是:A告訴B,你最好override我的bar()函數,但是你不要管它如何使用,也不要自己調用這個函數。
6.3 構造函數和析構函數中的虛函數調用
一個類的虛函數在它自己的構造函數和析構函數中被調用的時候,它們就變成普通函數了,不“虛”了。也就是說不能在構造函數和析構函數中讓自己“多態”。
當構造函數內部有虛函數時,會出現什么情況呢?結果是,只有在該類中的虛函數被調用,也就是說,在構造函數中,虛函數機制不起作用了,調用虛函數如同調用一般的成員函數一樣。
當析構函數內部有虛函數時,又如何工作呢?與構造函數相同,只有“局部”的版本被調用。但是,行為相同,原因是不一樣的。構造函數只能調用“局部”版本,是因為調用時還沒有派生類版本的信息。析構函數則是因為派生類版本的信息已經不可靠了。我們知道,析構函數的調用順序與構造函數相反,是從派生類的析構函數到基類的析構函數。當某個類的析構函數被調用時,其下一級的析構函數已經被調用了,相應的數據也已被丟失,如果再調用虛函數的最后一級的版本,就相當于對一些不可靠的數據進行操作,這是非常危險的。因此,在析構函數中,虛函數機制也是不起作用的。例如:
class A
{
public:
A() { foo();} // 在這里,無論如何都是A::foo()被調用!
~A() { foo();} // 同上
virtual void foo();
};
class B: public A
{
public:
virtual void foo();
};
void bar()
{
A * a = new B;
delete a;
}
如果你希望delete a的時候,會導致B::foo()被調用,那么你就錯了。同樣,在new B的時候,A的構造函數被調用,但是在A的構造函數中,被調用的是A::foo()而不是B::foo()。
6.4 什么時候使用虛函數
在你設計一個基類的時候,如果發現一個函數需要在派生類里有不同的表現,那么它就應該是虛的。從設計的角度講,出現在基類中的虛函數是接口,出現在派生類中的虛函數是接口的具體實現。通過這樣的方法,就可以將對象的行為抽象化。
“如果你發現基類提供了虛函數,那么你最好override它”。
7、Things to Remember
定義一個函數為虛函數,不代表函數為不被實現的函數。定義他為虛函數是為了允許用基類的指針來調用子類的這個函數。
定義一個函數為純虛函數,才代表函數沒有被實現。定義他是為了實現一個接口,起到一個規范的作用,規范繼承這個。類的程序員必須實現這個函數。
有純虛函數的類是不可能生成類對象的,如果沒有純虛函數則可以。
多態一般就是通過指向基類的指針來實現的。
4.有一點你必須明白,就是用父類的指針在運行時刻來調用子類:
例如,有個函數是這樣的:
void animal::fun1(animal *maybedog_maybehorse)
{
maybedog_maybehorse->born();
}
參數maybedog_maybehorse在編譯時刻并不知道傳進來的是dog類還是horse類,所以就把它設定為animal類,具體到運行時決定了才決定用那個函數。也就是說用父類指針通過虛函數來決定運行時刻到底是誰而指向誰的函數。
8、用虛函數和不用虛函數
class animal
{
public:
animal();
~animal();
void fun1(animal *maybedog_maybehorse);
virtual void born();
};
void animal::fun1(animal *maybedog_maybehorse)
{
maybedog_maybehorse->born();
}
animal::animal() { }
animal::~animal() { }
void animal::born()
{
cout<< "animal";
}
class horse:public animal
{
public:
horse();
~horse();
virtual void born();
};
horse::horse() { }
horse::~horse() { }
void horse::born()
{
cout<<"horse";
}
void main()
{
animal a;
horse b;
a.fun1(&b); //output: horse //如果不用虛函數則輸出animal
}
9、例子
class CBase{
public:
CBase(){
cout<<"CBase Constructor! ";
func();
}
~CBase(){
cout<<"CBase deconstructor! ";
func();
}
virtual void func(){ cout<<"CBase::func() called! "; }
};
class CDerive: public CBase{
public:
CDerive(){
cout<<"CDerive Constructor! ";
func();
}
~CDerive(){
cout<<"CDerive deconstructor! ";
func();
}
void func(){ cout<<"CDerive::func() called! ";}
void func1(){ func(); } //調用虛函數
};
class CSubDerive: public CDerive{
public:
CSubDerive(){
cout<<"CSubDerive Constructor! ";
func();
}
~CSubDerive(){
cout<<"CSubDerive deconstructor! ";
func();
}
void func(){ cout<<"CSubDerive::func() called! ";}
};
void main(){
CSubDerive obj; //will produce "CBase::func() called!"
obj.func1(); //will produce "CSubDerive::func() called!"
}