已經忘了是去年還是前年聽到微軟說要在C# 3.0里為C#添加lambda表達式,與此同時Java的團隊也一直在說想為Java添加lambda表達式。到了今天,C#似乎已經把這個特性加進去了,Java還沒有。Java說這個特性還在計劃列表之中,不過暫時可以使用匿名類來代替。想必是因為在Java中表示函數指針的方法比較奇怪罷……
其實無論是lambda表達式(事實上應該叫匿名函數)或是匿名類,都能歸屬到一種叫閉包的東西上面。閉包原來是代數中的用語,只是那些研究理論的老大們覺得這玩意兒也能拉到“閉包”里面去,于是就叫閉包了。匿名函數原本是丘奇發明的一個lambda-calculus的其中一部分,后來計算機的老大們突然發現lambda-calculus非常適合用來充當程序設計語言的模型,于是就對它進行了非常多的擴充,還弄了個什么類型理論出來。好像扯遠了。
想象一下如下使用閉包的代碼:
MyClosure=func(Number1)
{
return func(Number2)
{
return Number1+Number2;
};
};
a=MyClosure(1);
b=MyClosure(2);
writeln(a(10));
writeln(b(10));
輸出的結果是11和12。MyClosure函數接受一個參數,返回一個新的函數。新的函數將MyClosure的參數與自己的參數相加,返回結果。我們會看到a和b在接受相同的參數的時候,產生了不同的結果。所以實際上MyClosure返回的內部函數已經把MyClosure的參數“記下來”了。所以在具有閉包功能的語言,函數不能僅僅用一個函數指針來表示,還需要一些其他的東西。
考察一下a(10)的運行過程。首先程序將參數10傳遞給閉包a,閉包a接收到參數之后,執行代碼“return Number1+Number2;”此時Number2必然是10,但是Number1是什么呢?要找。在一般的語言里,函數的參數都是放在堆棧的。如果閉包也將參數放在堆棧的話,那么Number1在MyClosure運行結束的時候就會消失掉,這個時候a(10)再通過堆棧去搜索Number1顯然就是不可能的。既然“參數放在堆棧”導出了矛盾,那么參數也就不能放在堆棧了。放在哪里呢?需要一張表。
對于形式化有所了解的人應該立刻能想到解決的辦法了。因為有關形式化的讀物在描述對一個名字進行求值的時候使用的方法是“在環境中通過名字搜索出一個指向某空間的引用”。如果我們可以在運行的時候一邊跑代碼,一邊建立一張變量表附著在閉包上的話,這個問題就能夠順利解決了。那怎么做呢?
可以想象一下在程序執行的過程之中有一張全局的表,表內放了若干變量(MyClosure,a,b,writeln)。MyClosure在返回內部函數的時候,將全局的表跟自己的參數構成的表聯通內部函數的指針一起傳遞給變量a(或者b)。內部函數看得見Number1,全局部分卻看不見Number1,因此我們可以知道在程序的執行過程中,表并不只有一張。那么一張表加上一張表還是等于一張表,所以表本身是遞歸的。我們可以用一個鏈表來實現它。
現在知道了表的結構之后,讓我們看一下程序的執行過程中究竟發生了什么事情。現在我們定義一張全局表global,global在剛開始的時候僅僅有writeln一項。執行了MyClosure=func...的時候global添加了MyClosure,執行到a=MyClosure(1)的時候,MyClosure內部構造了一張表鏈接到global身上,我們把這張表命名為internal。程序如果能夠訪問internal就能夠訪問global,反之不可。所以外部的代碼連接到的環境節點是global,而MyClosure里面的東西鏈接到的節點是internal -> global。這個時候閉包已經構造好了,其結構是<內部函數的指針,internal->global>。這個時候a=MyClosure(1)已經執行完畢了,global添加了a。
現在,global=(writeln,MyClosure,a),internal=(Number1)->global。a附帶的環境是internal。同理,b也執行完畢,b得到的表是internal2=(Number1)->global。a和b具有兩張不同的表internal和internal2,但是它們都連接到了global身上,因此可以共同訪問到相同的MyClosure、a、b和writeln,但是訪問到的Number1確是不同的。
于是執行a(10)和b(10)能夠訪問不同的結果的機制也就很明朗了。調用a和b的時候,他們各自通過自己的Number2與自己附帶的表的Number1相加。10+internal[Number1]=10+1=11,10+internal2[Number1]=10+2=12。這個時候我們發現,MyClosure的參數Number1并不在堆棧上面,而在不同的internal和intenral2上。這就是為什么用有閉包的語言,函數的參數不能放進堆棧的原因。因為堆棧的作用僅僅跟寄存器相似——用來保存臨時數據,而不能用來保留整個call stack上的函數的參數。
好像聽微軟說過,C#并不存在堆棧?好象是吧……
posted on 2008-04-20 21:55
陳梓瀚(vczh) 閱讀(7715)
評論(5) 編輯 收藏 引用 所屬分類:
腳本技術