• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-91  評(píng)論-137  文章-0  trackbacks-0
            《面向組合子的一些測(cè)試》 進(jìn)一步完善代碼,制作出詞法分析器.

            我們首先需要一個(gè)Fail基類,他有一個(gè)純虛函數(shù)Parser.
            1 class Fail
            2 {
            3 public:
            4     virtual NWString Parser(NWString& input)=0;
            5 };
            Parser的輸入為要分析的字符串,輸出為分析完成后剩余的字符串.

            然后我們需要一個(gè)Ch和一個(gè)Str分別用來(lái)分析單個(gè)字符和一個(gè)字符串.
             1 class Ch : public Fail
             2 {
             3 public:
             4     Ch(WCHAR _value) : value(_value){}
             5 
             6     NWString Parser(NWString& input);
             7 
             8     WCHAR Value();
             9 protected:
            10     WCHAR value; // 待匹配串
            11 };
            12 
            13 class Str : public Fail
            14 {
            15 public:
            16     Str(NWString _value) : value(_value){}
            17 
            18     NWString Parser(NWString& input);
            19 protected:
            20     NWString value; // 待匹配串
            21 };

            然后是Seq,Alt和Any,分別表示組合,選擇和循環(huán).
             1 class Seq : public Fail
             2 {
             3 public:
             4     Seq(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
             5 
             6     NWString Parser(NWString& input);
             7 protected:
             8     NAutoPtr<Fail> left;
             9     NAutoPtr<Fail> right;
            10 };
            11 
            12 class Alt : public Fail
            13 {
            14 public:
            15     Alt(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
            16 
            17     NWString Parser(NWString& input);
            18 protected:
            19     NAutoPtr<Fail> left;
            20     NAutoPtr<Fail> right;
            21 };
            22 
            23 class Any : public Fail
            24 {
            25 public:
            26     Any(const NAutoPtr<Fail>& _left,const int _count) : left(_left),count(_count){}
            27 
            28     NWString Parser(NWString& input);
            29 protected:
            30     NAutoPtr<Fail> left;
            31     int count;
            32 };

            最后我們需要一個(gè)Node類型來(lái)存放以上這幾類對(duì)象.
             1 class Node
             2 {
             3 public:
             4     Node(){}
             5     Node(const NAutoPtr<Fail>& _left) : left(_left){}
             6 
             7     friend NAutoPtr<Node> operator+(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             8     friend NAutoPtr<Node> operator|(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             9     friend NAutoPtr<Node> operator-(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
            10 
            11     static NAutoPtr<Node> OnceMore(NAutoPtr<Node> node);
            12     static NAutoPtr<Node> More(NAutoPtr<Node> node);
            13     static NAutoPtr<Node> NewCh(WCHAR input);
            14     static NAutoPtr<Node> NewStr(NWString input);
            15 
            16     NWString Parser(NWString& input);
            17 
            18     NAutoPtr<Fail>& Value();
            19 protected:
            20     NAutoPtr<Fail> left;
            21 };
            下面來(lái)分析一下Node里的函數(shù):
            +:對(duì)應(yīng)于Seq,用于將兩個(gè)Node連接起來(lái).
            |:對(duì)應(yīng)與Alt,用于選擇兩個(gè)Node.
            -:只有l(wèi)eft和right的Value()都是NAutoPtr<Ch>時(shí)才可使用,內(nèi)部有類型轉(zhuǎn)換,表示從哪個(gè)字符到哪個(gè)字符.
            OnceMore:重復(fù)1次及以上.
            More:重復(fù)0次以上.
            NewCh:生成一個(gè)NAutoPtr<Ch>的Node對(duì)象.
            NewStr:生成一個(gè)NAutoPtr<Str>的Node對(duì)象.

            下面我們需要4個(gè)宏.
            1 #define ONCEMORE(N)                    Node::OnceMore(N)
            2 #define MORE(N)                        Node::More(N)
            3 #define NEWCH(N)                    Node::NewCh(N)
            4 #define NEWSTR(N)                    Node::NewStr(N)
            這4個(gè)宏僅為了輸入方便

            然后我們來(lái)測(cè)試一下:
            1     NAutoPtr<Node> Symbol = ONCEMORE(NEWCH('_'| NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z'))
            2         + MORE(NEWCH('_'| (NEWCH('0'- NEWCH('9')) | (NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z')));
            3     NAutoPtr<Node> Number = ONCEMORE(NEWCH('0'- NEWCH('9'));
            4     NAutoPtr<Node> Real = Number + NEWCH('.'+ Number;
            相信對(duì)正則表達(dá)式有一定認(rèn)識(shí)的同學(xué)已經(jīng)知道這3條語(yǔ)句分別對(duì)應(yīng)于什么正則表達(dá)式.
            Symbol->[_a-zA-Z]+[_0-9a-zA-Z]*
            Number->[0-9]+
            Real->[0-9]+.[0-9]+

            定義一個(gè)待分析的字符串.
            1     NWString str = L"abcce_fg123.459agetr";

            對(duì)其分析.
            1     wprintf(L"%s\n",str);
            2     wprintf(L"%s\n",Symbol->Parser(str));
            3     wprintf(L"%s\n",Real->Parser(str));
            4     wprintf(L"%s\n",Symbol->Parser(str));

            分析結(jié)果.
            1 abcce_fg123.459agetr
            2 123.459agetr
            3 agetr
            4 

            因?yàn)闆](méi)有考慮分析效率問(wèn)題,所以使用NWString作為輸入和輸出,在實(shí)際使用中可用LPTSTR來(lái)代替NWString,同時(shí)修改響應(yīng)代碼.
            最后給出源代碼
            posted on 2011-01-26 22:11 lwch 閱讀(2443) 評(píng)論(9)  編輯 收藏 引用 所屬分類: NScript

            評(píng)論:
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-27 10:46 | 陳梓瀚(vczh)
            嗯,就快達(dá)到四則運(yùn)算分析器的目標(biāo)了。你知道你這么做的話在讓Node遞歸的時(shí)候可能還有些問(wèn)題你沒(méi)考慮到,譬如說(shuō)

            A = a | B
            B = b | A

            你如何在B還沒(méi)有被=的時(shí)候就能用它呢,恩恩。

            話說(shuō)回來(lái),你TM的基類竟然是Fail……  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-27 14:44 | lwch
            @陳梓瀚(vczh)
            這個(gè)問(wèn)題還真沒(méi)考慮過(guò)..惰性計(jì)算的確不是一件容易的事情..
            但這個(gè)作為詞法分析器已經(jīng)足夠  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-27 16:29 | 陳梓瀚(vczh)
            @lwch
            詞法分析器用DFA才是最快的,用這個(gè)慢死了。而且那玩意兒也不是惰性計(jì)算……  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-28 12:36 | ooseven
            速度慢還不是最大的問(wèn)題,最大的問(wèn)題是用這個(gè)算法你需要自己開(kāi)發(fā)算法進(jìn)行狀態(tài)數(shù)的優(yōu)化,難度很高的。如果不優(yōu)化的話,稍微復(fù)雜一點(diǎn)的正則文法,可能需要好幾萬(wàn)個(gè)Node,比如你用這個(gè)作為basic語(yǔ)言的后臺(tái)詞法分析引擎試試?
              回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-28 14:11 | 陳梓瀚(vczh)
            @ooseven
            壓縮狀態(tài)的算法已經(jīng)很成熟的啦,不用怕  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-28 14:27 | lwch
            @陳梓瀚(vczh)
            Node是在運(yùn)行時(shí)生成的,要壓縮的話還得遍歷一遍..  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-28 16:46 | 陳梓瀚(vczh)
            @lwch
            那你實(shí)現(xiàn)的好一點(diǎn)就好了。一個(gè)詞法分析器出來(lái)也就那么幾百個(gè)狀態(tài)吧,便利一次非常快。  回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-29 00:31 | ooseven
            @陳梓瀚(vczh)
            太樂(lè)觀了,一個(gè)沒(méi)有經(jīng)過(guò)壓縮的basic語(yǔ)言的詞法分析狀態(tài)估計(jì)有好幾萬(wàn)個(gè),單單生成就得好一會(huì)兒
              回復(fù)  更多評(píng)論
              
            # re: 使用面向組合子算法寫(xiě)詞法分析器 2011-01-29 04:01 | 陳梓瀚(vczh)
            @ooseven
            不可能,你有很多投機(jī)取巧用來(lái)壓縮狀態(tài)的算法沒(méi)做。我出來(lái)的一直都只有幾百個(gè)。不過(guò)其實(shí)我介紹這個(gè)算法的文章也在我的置頂里面,你可以去看看。我在做編譯器的時(shí)候這些狀態(tài)也是運(yùn)行時(shí)產(chǎn)生的。我那個(gè)nativex跟basic可以比吧,也有那么多復(fù)雜的token。基本上構(gòu)造狀態(tài)機(jī)的時(shí)候瞬間就搞定了,根本無(wú)法感受他的時(shí)間,更不存在你所說(shuō)的“好一會(huì)兒”。顯然還是實(shí)現(xiàn)的問(wèn)題。  回復(fù)  更多評(píng)論
              
            中文字幕成人精品久久不卡| 伊人久久五月天| 久久超乳爆乳中文字幕| 国产Av激情久久无码天堂| 久久亚洲高清观看| 性做久久久久久久久| 亚洲精品乱码久久久久久久久久久久 | 亚洲国产精品无码久久久不卡| 久久久无码一区二区三区| 久久国产精品波多野结衣AV| 久久久久久久女国产乱让韩| 国产综合久久久久久鬼色| 久久人妻少妇嫩草AV蜜桃| AV狠狠色丁香婷婷综合久久 | 精品无码久久久久国产| 精品久久久久久无码国产| 一本久久a久久精品亚洲| 精品99久久aaa一级毛片| 狠狠精品久久久无码中文字幕| 秋霞久久国产精品电影院| 亚洲AV日韩AV永久无码久久| 精品国产综合区久久久久久| 久久精品国产久精国产思思| 狠狠色丁香婷婷久久综合| 久久久人妻精品无码一区| 久久青青草原精品影院| 国产午夜精品久久久久免费视| 无码乱码观看精品久久| 久久婷婷人人澡人人| 国内精品伊人久久久久影院对白| 精品国产乱码久久久久久郑州公司| 久久中文字幕人妻丝袜| 午夜精品久久久久| 中文精品99久久国产| 午夜精品久久影院蜜桃| 亚洲一区精品伊人久久伊人| 久久综合五月丁香久久激情| 亚洲国产日韩欧美久久| 色婷婷狠狠久久综合五月| 欧美久久久久久| 伊人色综合久久天天人手人婷 |