青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0

手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法)

 

陳梓瀚

華南理工大學軟件本科05

vczh@163.com

http://m.shnenglu.com/vczh/

 

    有了全盤的計劃之后,我們必須先處理輸入的腳本,才能夠進行下一步的工作。字符串處理方面可以參照一下三篇文章:《構造可配置語法分析器》、《構造正則表達式引擎》以及《如何手寫語法分析器》。作為補充,這里再說一說其他的辦法。

 

    首先是詞法分析器。我們仍然能夠使用《構造可配置語法分析器》前半部分的方法人腦畫出一張合適的DFA,這個時候我們可以手工來實現。用于詞法分析器的DFA只有兩種狀態,一種是普通狀態,另一種是終結狀態。所以我們可以很機械地將DFAC++寫出來。

 

    我們要為狀態編號。編號要連續,而且要從0開始,這樣的話C++的編譯器一般都會為switch-case的代碼生成一張表,用于快速跳轉。然后用下面的方法。

 

    1:將輸入的指針Input復制出一個副本,叫Current;給出一個同類型的指針Last,將其賦值為NULL;使用一個變量Status來記錄當前的狀態。初始化狀態,一般為了方便我們把初始狀態編號成0

 

    2:做一個死循環不斷的計算新Status。對于某個Status我們總是能夠知道輸入什么字符跳轉到什么新的Status上去。不同的人寫出來的DFA可能會有所區別。我們首先判斷當前的Status是不是終結狀態,如果是的話將Current賦值給Last,然后繼續往下走。我們從Current指針拿出一個字符,然后計算新Status。如果Current不滿足要求那么結束循環,如果Current滿足要求那么改變Status并讓Current指向新的位置。

 

    3:因為字符串總是有限的,所以這個循環總是會結束。結束了之后,我們檢查Last。如果Last仍然是NULL,那么代表輸入的字符串是有問題的。如果不是,那么我們所需要的一個記號就從Input開始到Last結束了。如果記號的類型有需要保留的話,那么我們只需要添加一個新的代表類型的變量,在每一次修改Last的時候修改這個保存類型的變量就行了。因為一個終結狀態只能代表一種類型的結束(反過來不成立,一種類型可能有好幾個終結狀態)。

 

    然后是語法分析。一般來說,使用《如何手寫語法分析器》中描述的方法實現一個語法分析器的話是很容易的,但是一個主要問題就是如果一門語言很復雜,特別是操作符特別多的話,這些函數寫起來會很亂,因此每一個文法產生式的處理函數的命名和注釋就變得相當重要了。為了簡化這件事情,我們還有另一種專門用來處理操作符的方法,而且是高度可配置的。為了簡化,我僅給出二元操作符和前綴操作符的處理方法。后綴操作符不常見,需要的話自己想辦法吧,在上一篇文章中的語法定義中并沒有出現后綴操作符。

 

    在這種方法中,我們把重點放在不包含修改優先級的括號的表達式中。遇到一個用于修改優先級的括號的時候,只要遞歸一下就好了。現在,我們通過詞法分析,已經得到了很多記號,然后就使用以下的方法來生成一顆正確的語法樹:

 

    1:我們需要定義兩個指針,第一個用于保存根節點,第二個用于保存當前節點。在分析的過程中,根節點會經常變化,當前節點也是。

 

    2:取出一個單元。一個單元指的是一個用括號包括起來的完整的表達式、一個函數調用、一個常量或變量和僅由前綴操作符與單元組成的整體。舉個例子,1是單元,a是單元,function(param1,param2+param3)是單元,(a*b+c*d)是單元,-(a+b)也是單元。但是-a+b就不是單元了。單元內部可能有表達式,我們可以遞歸下去。取出單元以后,就把根節點和當前節點指向這個單元。

 

    3:一個正確的表達式總是由單元和二元操作組成的,如果在以下的步驟中出錯的話,那么可以直接確定輸入的表達式的語法不正確。我們做一個死循環一直到遇到右括號、逗號等這些結束表達式的記號為止,對于每一個輸入執行第4步。

 

    4:取出一個二元操作符和一個單元。然后從當前節點往父節點找,一直到根節點或者父節點優先級比當前的二元操作符小的二元操作符為止。如果找到根節點,那么整個根節點將作為二元操作符的左操作數,單元作為右操作數,根節點更新,當前節點指向單元。如果不是的話,將找到的節點(這個節點的父節點的優先級比自己小)從父節點脫離,整個節點作為操作符的左操作數,單元作為右操作數,然后用這個二元操作符接上父節點。

 

    5:當34進行不下去的時候,我們就得到了一棵完整的表達式語法樹了。當然,如果中間出錯的話,我們應當輸出錯誤信息。這個時候要不要繼續往下走就自己看著辦吧,因為進行錯誤恢復的話,接下去的錯誤信息會很難看,就像VC++一樣。

 

    我給一個例子來說明如何處理這些事情。現在我們要分析1+2*3+4。這個算法將會產生一個正確的語法樹”1”,然后修改為正確的語法樹”1+2”,然后修改為正確的語法樹”1+2*3”,最后產生完整的正確的語法樹。

 

    第一步,產生一個單元的正確的語法樹:

    第二步,獲得一個二元操作符,并產生一個單元的語法樹”2”。因為當前節點往上就沒有了,所以執行4中的第一種情況:

    第三步,獲得操作符”*”和一個單元的語法樹”3”。因為2的父節點的優先級比”*”小,因此執行4的第二種情況:

    第四步,獲得操作符”+”和一個單元的語法樹”4”。這個時候3的父節點的優先級大于或等于”+”的優先級,因此一直往上找,一直到根節點。因為根節點的優先級仍然大于或等于”+”的優先級,因此再也上不了了,執行4的第一種情況:

    字符串結束了,中間也沒有出錯,代表輸入的表達式”1+2*3+4”是正確的,我們也得到了一棵正確的語法樹。

 

    通過之前的文章與上述兩種簡單的方法的學習,我想分析一門語言的語法也就沒什么困難的了。不過分析字符串是次要的,得到語法樹才是主要的。就算用了一種猥瑣的處理字符串的辦法得到了語法樹,那也沒關系,以后有時間再改就行了。現在我們要討論一下語法樹的數據結構問題。

 

    在這里我們需要大膽地使用虛函數。使用單一的一個class來表達整棵語法樹是不好的,因為我們的語法樹要表達unit、表達類型聲明、函數聲明、還有各種復雜的語句。類型是遞歸的,語句是遞歸的,表達式也是遞歸的。對于一組遞歸的結構,我們要定義一個幾類,并派生出各種子類來表達各種類型的結構。這樣做的好處是我們可以很方便地處理類型檢查、其它語義分析以及生成指令。多態在這里是相當好用的,比省掉一點虛函數的空間(若干個同類型的對象只共享一張虛函數表)和一點調用的時候犧牲的速度好多了。我想用復雜的if或函數指針來代替多態估計也沒有多態快。

 

    因為類型、表達式和語句的處理方式是類似的,因此我只為表達式建模。我們的表達式有四則運算、數組訪問以及函數調用。首先我們給出一個基類ExpBase

    class ExpBase

    {

    public:

       TypeBase* GetType(vector<ErrorMessage>& Errors);

    };

    我們拿到了一個表達式之后,轉換成表達式樹,就會得到一個ExpBase了,這個時候我們進行類型檢查,只需要調用GetType就行了。各種不同的檢查由子類實現。

 

    然后我們為運算符定義表達式節點:

    enum BinOpType

    {

        Plus,

        Minus,

        Multiply,

        Division,

        ……

    };

    enum SinOpType

    {

        Negative,

        Not,

        ……

    };

    class ExpBinOp : public ExpBase

    {

    public:

        ExpBase*  ParamA;

        ExpBase*  ParamB;

        BinOpType Operator;

    };

    class ExpSinOp : public ExpBase

    {

    public:

        ExpBase* Param;

        SinOpType Operator;

    };

    數組訪問可以加進二元操作符也可以不加,不過我個人還是傾向于不加的,因為后續的處理邏輯有很大的不同。

 

接下來是函數調用的表達式節點:

    class ExpInvoke : public ExpBase

    {

    public:

        ExpBase* Name;

        vector<ExpBase*> Params;

    };

 

    所有的符合表達式就構造完了,但是我們仍然需要一個代表單一記號的表達式,譬如變量名啊數字等等。我們直接把一個記號放進去就好了,因為記號里面有常量的類型信、也有變量名:

    class ExpToken : public ExpBase

    {

    public:

        Token* Content;

    };

 

    表達式的數據結構就構造完了,然后我們把剩下的類型信息與語句構造萬,給出單元結構以后就結束了。

 

    鑒于實習期間較忙,自己的時間不多,完整的代碼我就不給出來了。要是大家愿意的話可以去這里看Vczh Free Script 2.0 beta的語法樹結構。雖然少了類型族,但也還是能看得。

 

    下一篇文章講述語義分析以及符號表的事情。語法樹不僅要代表源代碼,還需要附帶額外的信息,譬如表達式的類型、重載的選擇等等。這些在語法分析的時候很難一起產生,所以我們借助多態來簡化這個任務。

posted on 2008-08-01 23:19 陳梓瀚(vczh) 閱讀(5213) 評論(4)  編輯 收藏 引用 所屬分類: 腳本技術

評論:
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法)[未登錄] 2008-08-02 00:16 | foxtail
sf 哈哈  回復  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-08-02 01:46 | 空明流轉
最近用flex+yacc+ctool來搞得,前兩個用于詞法和語法分析,ctool可以保存AST。  回復  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-09-30 17:01 |
我有一門新的語言,需要語法分析器,和正則表達式引擎,可實在費勁了。不知博主有興趣研究嗎?我的郵箱king_tu@163.com  回復  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-10-01 09:49 | 陳梓瀚(vczh)
工程上來說,正則表達式有boost::regex,語法分析器你可以選擇yacc幫你生成無法看懂的代碼,或者用boost幫你寫一些很難控制錯誤信息的代碼,或者其他。  回復  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美一区二区视频97| 久久青草福利网站| 国产免费成人av| 国产精品毛片高清在线完整版| 欧美三级视频在线观看| 国产精品免费一区二区三区在线观看| 国产精品亚洲аv天堂网| 国产日韩欧美黄色| 在线欧美不卡| 亚洲无亚洲人成网站77777| 亚洲欧美卡通另类91av| 久久久av水蜜桃| 久久精品亚洲一区二区三区浴池| 亚洲国产一区二区在线| 亚洲人成人一区二区在线观看| 日韩亚洲综合在线| 欧美在线视频观看免费网站| 欧美电影免费观看大全| 国产精品三级久久久久久电影| 狠狠色综合网站久久久久久久| avtt综合网| 久久久亚洲影院你懂的| 亚洲精品少妇| 久久婷婷久久一区二区三区| 国产精品福利在线观看网址| 亚洲国产cao| 香蕉亚洲视频| 亚洲日本一区二区| 久久久久国产一区二区| 国产精品久久久久久久浪潮网站| 亚洲国产精品尤物yw在线观看| 午夜国产精品视频免费体验区| 欧美国产日产韩国视频| 性欧美videos另类喷潮| 欧美日韩免费网站| 91久久久久久久久| 久久躁狠狠躁夜夜爽| 中文欧美在线视频| 欧美日韩国产bt| 亚洲精选视频免费看| 欧美mv日韩mv国产网站app| 午夜在线a亚洲v天堂网2018| 欧美视频二区36p| 日韩一级免费观看| 欧美国产日韩一区二区在线观看| 欧美自拍丝袜亚洲| 国产日韩欧美高清免费| 亚洲欧美日本日韩| 在线一区二区三区四区| 欧美日韩在线大尺度| 亚洲精品一二三| 欧美激情亚洲精品| 免费在线欧美黄色| 最新国产拍偷乱拍精品 | 欧美一区久久| 一本在线高清不卡dvd| 欧美日韩美女在线| 日韩亚洲精品视频| 亚洲激情综合| 欧美猛交免费看| 99精品免费网| 亚洲精品在线免费观看视频| 欧美激情免费在线| 亚洲欧洲日本专区| 亚洲国产欧美一区二区三区丁香婷 | 日韩一区二区精品| 亚洲三级电影全部在线观看高清| 老司机67194精品线观看| 久久久久久一区二区| 久久久国产视频91| 亚洲国产精品久久久久婷婷老年| 久久久久久亚洲综合影院红桃| 欧美尤物巨大精品爽| 激情自拍一区| 亚洲国产精品一区二区www在线| 欧美11—12娇小xxxx| 一区二区高清视频| 国产精品99久久久久久久女警| 国产精品一区二区在线观看| 久久精品中文字幕一区| 久久久亚洲影院你懂的| 日韩一级不卡| 午夜久久黄色| 亚洲人成小说网站色在线| 亚洲免费成人av电影| 国产日韩精品一区| 欧美高清视频在线播放| 欧美性视频网站| 久久午夜精品一区二区| 欧美成人精品h版在线观看| 亚洲欧美视频一区| 久久午夜视频| 亚洲尤物精选| 久久综合九色99| 亚洲一区视频在线观看视频| 久久精品99| 亚洲自拍都市欧美小说| 老司机精品视频网站| 午夜精品短视频| 免费成人高清视频| 午夜精品久久久久久久久久久| 久久久噜久噜久久综合| 亚洲欧美视频一区| 欧美激情精品久久久久久免费印度 | 免费观看成人网| 欧美影院视频| 欧美日韩第一区| 欧美国产成人在线| 国产农村妇女毛片精品久久莱园子 | 欧美不卡视频| 国产日韩专区| 在线视频中文亚洲| 亚洲精品社区| 久久综合九九| 久久人人97超碰人人澡爱香蕉 | 国产精品视频内| 亚洲免费观看| 亚洲精品一区在线观看香蕉| 久久av在线看| 欧美一区二视频在线免费观看| 欧美日本高清| 亚洲激情二区| 亚洲精品色图| 老司机精品导航| 久久成人资源| 夜夜精品视频| 一区二区在线视频播放| 日韩视频一区二区在线观看 | 在线亚洲一区二区| 久久综合久久美利坚合众国| 亚洲午夜久久久| 欧美激情2020午夜免费观看| 欧美成人午夜剧场免费观看| 精品动漫3d一区二区三区免费版| 欧美一区二区三区另类| 欧美一区二区免费观在线| 国产精品极品美女粉嫩高清在线| 99riav久久精品riav| 亚洲视频视频在线| 欧美日韩午夜在线| 亚洲性视频h| 久久国产精品久久久久久电车| 欧美午夜寂寞影院| 亚洲综合第一| 久久久久久久激情视频| 国产尤物精品| 麻豆精品视频在线观看| 亚洲福利视频网| 亚洲精品在线观看视频| 欧美日韩精品免费观看| 亚洲视频一区| 久久色中文字幕| 一区二区在线看| 欧美美女bbbb| 亚洲男人的天堂在线| 麻豆精品网站| 一区二区动漫| 国产午夜精品久久久久久免费视| 欧美专区福利在线| 欧美韩日一区二区| 亚洲永久字幕| 狠狠色丁香久久综合频道| 欧美成人在线影院| 亚洲一区二区三区精品视频| 久久视频一区二区| 一区二区高清在线观看| 国产亚洲欧美另类一区二区三区| 蜜桃av综合| 欧美亚洲尤物久久| 亚洲国产精品黑人久久久| 午夜激情亚洲| 久久久精品午夜少妇| 亚洲精品久久久久久久久久久久久 | 老巨人导航500精品| 99av国产精品欲麻豆| 国产欧美日韩视频一区二区| 久久免费视频网站| 欧美成人精精品一区二区频| 亚洲国产一区二区三区青草影视| 欧美日韩一区二区三区四区在线观看 | 美国十次成人| 亚洲视频axxx| 亚洲福利一区| 国产精品magnet| 免费不卡中文字幕视频| 亚洲欧美国产精品va在线观看| 欧美激情一区二区三区| 久久黄金**| 亚洲午夜在线观看| 亚洲区国产区| 国内揄拍国内精品少妇国语| 国产精品久久国产精品99gif| 免费日韩视频| 久久久av水蜜桃| 香蕉乱码成人久久天堂爱免费| 亚洲人成亚洲人成在线观看| 欧美大胆成人| 久久理论片午夜琪琪电影网| 亚洲欧美综合网| 亚洲一区二区三区乱码aⅴ蜜桃女|