隨筆-341 評(píng)論-2670 文章-0 trackbacks-0

    可擴(kuò)展編譯器架構(gòu)的構(gòu)想是最近幾天在洗澡的時(shí)候才最終完成的。我在思考如何開(kāi)發(fā)一個(gè)可以同時(shí)給C、Pascal、Basic、Fortran和未知的類似語(yǔ)言使用的前端+后端。這只是VL++3.0的其中一個(gè)小部分，我把語(yǔ)言歸為幾類，C一類，C#一類，Javascript一類，還有其他的等等。這些類型會(huì)分別提供不同的前端支持。在設(shè)計(jì)第一類的編譯器期間遇到了點(diǎn)困難。

    第一個(gè)困難是語(yǔ)法樹(shù)很難統(tǒng)一。其實(shí)這并不是說(shuō)那些語(yǔ)言完全不同，而是在于我想讓這N種語(yǔ)言的區(qū)別只有從字符串到語(yǔ)法樹(shù)的部分，從語(yǔ)法樹(shù)開(kāi)始都執(zhí)行相同的代碼來(lái)編譯。這就遇到了點(diǎn)麻煩。在語(yǔ)法分析的過(guò)程中，對(duì)于Pascal我不知道Name(Param)究竟是函數(shù)調(diào)用還是強(qiáng)制類型轉(zhuǎn)換，對(duì)于Basic來(lái)說(shuō)我不知道Name(Param)是函數(shù)調(diào)用還是數(shù)組下標(biāo)。還有Pascal和Basic的and等操作符可以同時(shí)作用于整數(shù)和布爾型（C使用了&&和&，而且它們?cè)趯?shí)現(xiàn)上有巨大差別）。Pascal自己還擴(kuò)展了一些類型譬如說(shuō)set，Pascal和Basic還有字符串。所以在語(yǔ)法分析的時(shí)候很難構(gòu)直接造出FunctionInvokeExpression、SubscribeExpression和TypeCastExpression。

    第二個(gè)困難是擴(kuò)展的類型。上面提到了Pascal有自己的set，我如何讓我的編譯器從前端開(kāi)始就可以應(yīng)付一門(mén)類似的未知語(yǔ)言他自己的新東西。譬如說(shuō)未知的set類型，他也有自己的操作符（連已經(jīng)存在的操作符operator+也可以用的），代碼生成的時(shí)候還有自己的方法。這不僅要求語(yǔ)法樹(shù)是可擴(kuò)展的，接下來(lái)的一切包括符號(hào)表、語(yǔ)義分析、代碼生成等所有部分都需要可擴(kuò)展的。

    第三個(gè)困難是C自己造成的，他有一個(gè)十分討厭的地方。當(dāng)我得到ABC*DEF;的時(shí)候，語(yǔ)義分析沒(méi)開(kāi)始，我不可能知道這是乘法還是定義一個(gè)變量。

    思考了許久，得出一個(gè)大概的方案：我先定義一門(mén)比較嚴(yán)格的語(yǔ)言，然后讓C、Pascal、Basic和Fortran來(lái)定義自己與該語(yǔ)言的不同之處，從而盡可能復(fù)用編譯器其余相同的部分。想到這里我得到一個(gè)比較奇怪的做法：

    第一個(gè)做法是在語(yǔ)義分析的時(shí)候修改語(yǔ)法樹(shù)。對(duì)于C語(yǔ)言的ABC*DEF;，這是一個(gè)statement。我給出一個(gè)接口，這個(gè)接口在語(yǔ)義分析的過(guò)程中被調(diào)用。語(yǔ)義分析產(chǎn)生了大量的信息全部傳遞過(guò)去，然后再第一次接觸到一個(gè)statement的時(shí)候，調(diào)用其中的ReplaceStatement函數(shù)。這個(gè)時(shí)候接口的ReplaceStatement可以通過(guò)語(yǔ)義分析的結(jié)果看看需不需要修改這個(gè)節(jié)點(diǎn)。如果上下文是int a,b;，那么a*b;就會(huì)被替換為乘法表達(dá)式。如果上下文是typedef int a;，那么a*b;保持不變（因?yàn)槲夷J(rèn)是優(yōu)先看成變量聲明）。ReplaceStatement對(duì)于同一個(gè)statement只會(huì)調(diào)用一次。至于Pascal的集合操作也可以通過(guò)這個(gè)來(lái)完成。對(duì)于a+b，可以在ReplaceExpression里面查看a和b是不是集合類型，如果是的話替換成自己的PascalSetBinaryExpression。這個(gè)小技巧解決了語(yǔ)法分析的時(shí)候遇到的歧義問(wèn)題。這也是沒(méi)有辦法的辦法，因?yàn)檫@一次設(shè)計(jì)出來(lái)的結(jié)構(gòu)的目的是為了讓新的語(yǔ)言可以用很小的代價(jià)來(lái)實(shí)現(xiàn)。

    第二個(gè)做法是語(yǔ)法樹(shù)的所有部分譬如Type、Expression、Statement和Declaration都存在一個(gè)ExtendedType、ExtendedExpression、ExtendedStatement和ExtendedDeclaration，語(yǔ)言可以通過(guò)繼承這四個(gè)“擴(kuò)展類”來(lái)提供未知的東西，當(dāng)然這個(gè)時(shí)候就要連帶提供所有操作了，譬如說(shuō)根據(jù)語(yǔ)義分析的上下文來(lái)判斷他自己的ExtendedExpression的返回類型啦。

    至于符號(hào)表的可擴(kuò)展性，我設(shè)計(jì)了一個(gè)可以應(yīng)付絕大多數(shù)情況的通用符號(hào)表，因此隨時(shí)加入新的東西還是比較容易的。

    最新的代碼可以在http://vlpp.codeplex.com/這里獲得。

posted on 2010-01-31 00:13 陳梓瀚(vczh) 閱讀(2476) 評(píng)論(5) 編輯收藏引用所屬分類: VL++3.0開(kāi)發(fā)紀(jì)事

評(píng)論:

# re: Vczh Library++3.0之可擴(kuò)展編譯器架構(gòu) 2010-01-31 07:29 | heixia108

gcc 就可以擴(kuò)展 :) 回復(fù) 更多評(píng)論

# re: Vczh Library++3.0之可擴(kuò)展編譯器架構(gòu) 2010-01-31 09:09 | 陳梓瀚(vczh)

@heixia108
擴(kuò)展gcc的方法是重寫(xiě)整個(gè)前端，顯然這不叫擴(kuò)展，應(yīng)該叫g(shù)cc提供了組件給你自己拼裝成新編譯器。回復(fù) 更多評(píng)論

# re: Vczh Library++3.0之可擴(kuò)展編譯器架構(gòu) 2010-02-01 04:50 | SOS

我發(fā)現(xiàn)很多人都在洗澡時(shí)得到有用的信息。回復(fù) 更多評(píng)論

# re: Vczh Library++3.0之可擴(kuò)展編譯器架構(gòu) 2010-02-01 21:22 | xxzh

@陳梓瀚(vczh)
Open Source 的LLVM，微軟的Phoenix，應(yīng)該和你想做編譯器擴(kuò)展差不多，或者更強(qiáng)大。回復(fù) 更多評(píng)論

# re: Vczh Library++3.0之可擴(kuò)展編譯器架構(gòu) 2010-02-02 00:35 | 陳梓瀚(vczh)

@xxzh
目的還是不同的，我是想讓完全不同等級(jí)或范式的語(yǔ)言可以無(wú)縫協(xié)作。不過(guò)這個(gè)idea到底行不行還有待驗(yàn)證…… 回復(fù) 更多評(píng)論

刷新評(píng)論列表

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開(kāi)源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 淺談面向?qū)ο笳Z(yǔ)言的類型運(yùn)算 Vczh Library++3.0之ManagedX語(yǔ)言檢查類型的可見(jiàn)性 Vczh Library++3.0之山寨mscorlib.dll Vczh Library++3.0之如何把C#屬性parse出來(lái)的超長(zhǎng)pair鏈表賦值到語(yǔ)法書(shū)上 Vczhl Library++3.0之Parser Combinator為常見(jiàn)的語(yǔ)法結(jié)構(gòu)做優(yōu)化 Vczh Library++3.0托管語(yǔ)言語(yǔ)法樹(shù)完成 Vczh Library++3.0第一階段宣告結(jié)束 Vczh Library++3.0開(kāi)發(fā)紀(jì)事之流式xml和json讀寫(xiě) Vczh Library++3.0第一個(gè)Release提供下載！ Vczh Library++ 3.0之烏龜畫(huà)圖Demo接近完工

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

留言簿(70)

隨筆分類(347)

好友博客

Graphixer
何詠師弟的圖形學(xué)網(wǎng)站
jetricy
Jetricy的技術(shù)博客
KlayGE游戲引擎
叛叛大神
Lomox UI框架
Lomox UI框架
MiGL
Tyeah的博客
vczh的百度空間
vczh的百度空間
YMK的后花園
YMK的技術(shù)博客
德利菲
德利菲的技術(shù)博客
怪盜KID的游戲開(kāi)發(fā)博客
怪盜KID的游戲開(kāi)發(fā)博客
華工微軟俱樂(lè)部
華南理工大學(xué)微軟俱樂(lè)部科技部博客
開(kāi)發(fā)視界
開(kāi)發(fā)視界 - 移動(dòng)開(kāi)發(fā)社區(qū)
老趙點(diǎn)滴
趙姐夫的.net博客
臨淵羨魚(yú)，不如退而山寨
另一個(gè)SOS團(tuán)的C++程序員……
某白食(Lyt)
某白食的C++博客
歲月流轉(zhuǎn)，往昔空明
空明流轉(zhuǎn)的blog
微軟一站式實(shí)例代碼庫(kù)
500個(gè)經(jīng)典示例，速學(xué)速用，效率倍增。
我在博客園的blog
我在博客園的blog
一個(gè)不靠譜的程序員
JeffChen的技術(shù)博客

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

留言簿(70)

隨筆分類(347)

好友博客

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜