這是一篇一年多之前便已寫就的文章,那時(shí),因?yàn)楹芏郕ava程序員只求追隨新生的事物,卻連基本的概念都沒有,很多討論中,很明顯是基本功不過硬,于是萌生寫一個(gè)系列文章,討論Java的基本功,下面便是在這個(gè)想法下催生出的第一篇文章。可事實(shí)上,真正完成的也只有這一篇。因?yàn)槲茨芗皶r(shí)發(fā)布,它就被我遺忘在硬盤的角落中。今天,JavaEye上關(guān)于Java傳值還是傳引用的論戰(zhàn)讓我記起了自己曾經(jīng)寫過的這篇文章,愿與大家共享。
Java基本功——Reference
有這樣一種說法,如今爭鋒于IT戰(zhàn)場的兩大勢力,MS一族偏重于底層實(shí)現(xiàn),Java一族偏重于系統(tǒng)架構(gòu)。說法根據(jù)無從考證,但從兩大勢力各自的社區(qū)力量和圖書市場已有佳作不難看出,此說法不虛。于是,事情的另一面讓人忽略了。
偏巧,我是一個(gè)喜歡探究底層實(shí)現(xiàn)的Java程序員,雖然我的喜好并非純正咖啡,劍走偏鋒卻別是一番風(fēng)味。
Reference
Java世界泰山北斗級大作《Thinking In Java》切入Java就提出“Everything is Object”。在Java這個(gè)充滿Object的世界中,reference是一切謎題的根源,所有的故事都是從這里開始的。
Reference是什么?
如果你和我一樣在進(jìn)入Java世界之前曾經(jīng)浪跡于C/C++世界,就一定不會對指針陌生。談到指針,往日種種不堪回首的經(jīng)歷一下子涌上心頭,這里不是抱怨的地方,讓我們暫時(shí)忘記指針的痛苦,回憶一下最初接觸指針的甜蜜吧!還記得你看過的教科書中,如何講解指針嗎?留在我印象中的一種說法是,指針就是地址,如同門牌號碼一樣,有了地址,你可以輕而易舉找到一個(gè)人家,而不必費(fèi)盡心力的大海撈針。
C++登上歷史舞臺,reference也隨之而來,容我問個(gè)小問題,指針和reference區(qū)別何在?我的答案來自于在C++世界享譽(yù)盛名的《More Effective C++》。
- 沒有null reference。
- reference必須有初值。
- 使用reference要比使用指針效率高。因?yàn)閞eference不需要測試其有效性。
- 指針可以重新賦值,而reference總是指向它最初獲得的對象
設(shè)計(jì)選擇:
當(dāng)你指向你需要指向的某個(gè)東西,而且絕不會改指向其它東西,或是當(dāng)你實(shí)作一個(gè)運(yùn)算符而其語法需要無法有指針達(dá)成,你就應(yīng)該選擇reference。其它任何時(shí)候,請采用指針。
這和Java有什么關(guān)系?
初學(xué)Java,鑒于reference的名稱,我毫不猶豫的將它和C++中的reference等同起來。不過,我錯(cuò)了。在Java中,reference可以隨心所欲的賦值置空,對比一下上面列出的差異,就不難發(fā)現(xiàn),Java的reference如果要與C/C++對應(yīng),它不過是一個(gè)穿著reference外衣的指針而已。
于是,所有關(guān)于C中關(guān)于指針的理解方式,可以照搬到Java中,簡而言之,reference就是一個(gè)地址。我們可以把它想象成一個(gè)把手,抓住它,就抓住了我們想要操縱的數(shù)據(jù)。如同掌握C的關(guān)鍵在于掌握指針,探索Java的鑰匙就是reference。
一段小程序
我知道,太多的文字總是令人犯困,那就來段代碼吧!
public class ReferenceTricks {
public static void main(String[] args) {
ReferenceTricks r = new ReferenceTricks();
// reset integer
r.i = 0;
System.out.println("Before changeInteger:" + r.i);
changeInteger(r);
System.out.println("After changeInteger:" + r.i);
// just for format
System.out.println();
// reset integer
r.i = 0;
System.out.println("Before changeReference:" + r.i);
changeReference(r);
System.out.println("After changeReference:" + r.i);
}
private static void changeReference(ReferenceTricks r) {
r = new ReferenceTricks();
r.i = 5;
System.out.println("In changeReference: " + r.i);
}
private static void changeInteger(ReferenceTricks r) {
r.i = 5;
System.out.println("In changeInteger:" + r.i);
}
public int i;
}
對不起,我知道,把一個(gè)字段設(shè)成public是一種不好的編碼習(xí)慣,這里只是為了說明問題。
如果你有興趣自己運(yùn)行一下這個(gè)程序,我等你!
OK,你已經(jīng)運(yùn)行過了嗎?結(jié)果如何?是否如你預(yù)期?下面是我在自己的機(jī)器上運(yùn)行的結(jié)果:
Before changeInteger:0
In changeInteger:5
After changeInteger:5
Before changeReference:0
In changeReference: 5
After changeReference:0
這里,我們關(guān)注的是兩個(gè)change——changeReference和changeInteger。從輸出的內(nèi)容中,我們可以看出,兩個(gè)方法在調(diào)用前和調(diào)用中完全一樣,差異出現(xiàn)在調(diào)用后的結(jié)果。
糊涂的講解
先讓我們來分析一下changeInteger的行為。
前面說過了,Java中的reference就是一個(gè)地址,它指向了一個(gè)內(nèi)存空間,這個(gè)空間存放著一個(gè)對象的相關(guān)信息。這里我們暫時(shí)不去關(guān)心這個(gè)內(nèi)存具體如何排布,只要知道,通過地址,我們可以找到r這個(gè)對象的i字段,然后我們給它賦成5。既然這個(gè)字段的內(nèi)容得到了修改,從函數(shù)中返回之后,它自然就是改動后的結(jié)果了,所以調(diào)用之后,r對象的i字段依然是5。下圖展示了changeInteger調(diào)用前后內(nèi)存變化。
Reference +--------+ Reference +--------+
---------->| i = 0 | ---------->| i = 5 |
|--------| |--------|
| Memory | | Memory |
| | | |
| | | |
+--------+ +--------+
調(diào)用changeInteger之前 調(diào)用changeInteger之后
讓我們把目光轉(zhuǎn)向changeReference。
從代碼上,我們可以看出,同changeInteger之間的差別僅僅在于多了這么一句。
r = new ReferenceTricks();
這條語句的作用是分配一塊新的內(nèi)存,然后將r指向它。
執(zhí)行完這條語句,r就不再是原來的r,但它依然是一個(gè)ReferenceTricks的對象,所以我們依然可以對這個(gè)r的i字段賦值。到此為止,一切都是那么自然。
Reference +--------+ +--------+
---------->| i = 0 | | i = 0 |
|--------| |--------|
| Memory | | Memory |
| | Reference |--------|
| | ---------->| i = 5 |
+--------+ +--------+
調(diào)用changeReference之前 調(diào)用changeReference之后
順著這個(gè)思路繼續(xù)下去的話,執(zhí)行完changeReference,輸出的r的i字段,那么應(yīng)該是應(yīng)該是新內(nèi)存中的i,所以應(yīng)該是5。至于那塊被我們拋棄的內(nèi)存,Java的GC功能自然會替我們善后的。
事與愿違。
實(shí)際的結(jié)果我們已經(jīng)看到了,輸出的是0。
肯定哪個(gè)地方錯(cuò)了,究竟是哪個(gè)地方呢?
參數(shù)傳遞的秘密
知道方法參數(shù)如何傳遞嗎?
記得剛開始學(xué)編程那會兒,老師教導(dǎo),所謂參數(shù),有形式參數(shù)和實(shí)際參數(shù)之分,參數(shù)列表中寫的那些東西都叫形式參數(shù),在實(shí)際調(diào)用的時(shí)候,它們會被實(shí)際參數(shù)所替代。
編譯程序不可能知道每次調(diào)用的實(shí)際參數(shù)都是什么,于是寫編譯器的高手就出個(gè)辦法,讓實(shí)際參數(shù)按照一定順序放到一個(gè)大家都可以找得到的地方,以此作為方法調(diào)用的一種約定。所謂“沒有規(guī)矩,不成方圓”,有了這個(gè)規(guī)矩,大家協(xié)作起來就容易多了。這個(gè)公共數(shù)據(jù)區(qū),現(xiàn)在編譯器的選擇通常是“棧”,而所謂的順序就是形式參數(shù)聲明的順序。
顯然,程序運(yùn)行的過程中,作為實(shí)際參數(shù)的變量可能遍布于內(nèi)存的各個(gè)位置,而并不一定要老老實(shí)實(shí)的呆在棧里。為了守“規(guī)矩”,程序只好將變量復(fù)制一份到棧中,也就是通常所說的將參數(shù)壓入棧中。
打起精神,謎底就要揭曉了。
我剛才說什么來著?將變量復(fù)制一份到棧中,沒錯(cuò),“復(fù)制”!
這就是所謂的值傳遞。
C語言的曠世經(jīng)典《The C Programming Language》開篇的第一章中,談到實(shí)際參數(shù)時(shí)說,“在C中,所有函數(shù)的實(shí)際參數(shù)都是傳‘值'的”。
馬上會有人站出來,“錯(cuò)了,還有傳地址,比如以指針傳遞就是傳地址”。
不錯(cuò),傳指針就是傳地址。在把指針視為地址的時(shí)候,是否考慮過這樣一個(gè)問題,它也是一個(gè)變量。前面的討論中說過了,參數(shù)傳遞必須要把參數(shù)壓入棧中,作為地址的指針也不例外。所以,必須把這個(gè)指針也復(fù)制一份。函數(shù)中對于指針操作實(shí)際上是對于這個(gè)指針副本的操作。
Java的reference等于C的指針。所以,在Java的方法調(diào)用中,reference也要復(fù)制一份壓入堆棧。在方法中對reference的操作就是對這個(gè)reference副本的操作。
謎底揭曉
好,讓我們回到最初的問題上。
在changeReference中對于reference的賦值實(shí)際上是對這個(gè)reference的副本進(jìn)行賦值,而對于reference的本尊沒有產(chǎn)生絲毫的影響。
回到調(diào)用點(diǎn),本尊醒來,它并不知道自己睡去的這段時(shí)間內(nèi)發(fā)生過什么,所以只好當(dāng)作什么都沒發(fā)生過一般。就這樣,副本消失了,在方法中對它的修改也就煙消云散了。
也許你會問出這樣的問題,“聽了你的解釋,我反而對changeInteger感到迷惑了,既然是對于副本的操作,為什么changeInteger可以運(yùn)作正常?”
呵呵,很有趣的大腦短路現(xiàn)象。
好,那我就用前面的說法解釋一下changeInteger的運(yùn)作。
所謂復(fù)制,其結(jié)果必然是副本完全等同于本尊。reference復(fù)制的結(jié)果必然是兩個(gè)reference指向同一塊內(nèi)存空間。
雖然在方法中對于副本的操作并不會影響到本尊,但對內(nèi)存空間的修改確實(shí)實(shí)實(shí)在在的。
回到調(diào)用點(diǎn),雖然本尊依然不知道曾經(jīng)發(fā)生過的一切,但它按照原來的方式訪問內(nèi)存的時(shí)候,取到的確是經(jīng)過方法修改之后的內(nèi)容。
于是方法可以把自己的影響擴(kuò)展到方法之外。
多說幾句
這個(gè)問題起源于我對C/C++中同樣問題的思考。同C/C++相比,在changeReference中對reference賦值可能并不會造成什么很嚴(yán)重的后果,而在C/C++中,這么做卻會造成臭名昭著的“內(nèi)存泄漏”,根本的原因在于Java擁有了可愛的GC功能。即便這樣,我仍不推薦使用這種的手法,畢竟GC已經(jīng)很忙了,我們怎么好意思再麻煩人家。
在C/C++中,這個(gè)問題還可以繼續(xù)引申。既然在函數(shù)中對于指針直接賦值行不通,那么如何在函數(shù)中修改指針呢?答案很簡單,指針的指針,也就是把原來的指針看作一個(gè)普通的數(shù)據(jù),把一個(gè)指向它的指針傳到函數(shù)中就可以了。
同樣的問題到了Java中就沒有那么美妙的解決方案了,因?yàn)镴ava中可沒有reference的reference這樣的語法。可能的變通就是將reference進(jìn)行封裝成類。至于值不值,公道自在人心。