• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-19  評論-21  文章-0  trackbacks-0
            一. 簡介

                該正則表達式暫時能識別 *,|,(,)等特殊符號,如(a|b)*abc。不過擴展到其他符號(如?)也相對比較容易,修改NFA中的構建規則即可。

            二. 引擎的構建

                該正則表達式引擎的構建以《Compilers Principles,Techniques & Tools》3.7節為依據,暫時只能識別*,|,(,)這幾個特殊的字符,其工作過程為:構建NFA -> 根據NFA構建DFA -> 用DFA匹配。

            1. 構建NFA
            該NFA的構建以2條基本規則和3條組合規則為基礎,采用歸納的思想構建而成。
            1)2條基本的規則是:
            a. 以一個空值ε構建一個NFA

            b. 以一個字符a構建一個NFA

            2) 3條組合規則是:
            a. r = s | t (其中s和t都是NFA)

            b. r = s t(其中s和t都是NFA)

            c. r = s *(其中s為NFA)

            3) 如果需要識別如”?”等特殊符號,則可再加一些組合規則。

            在具體的程序中,可以以下面的BNF為結構來實現。(具體見源程序regexp.cpp)

            -> r '|' s | r
            -> s t | s
            -> a '*' | a
            -> token | '(' r ')' | ε   

            2. 構建DFA
            主要是求ε閉包的過程,從一個集合的ε閉包轉移到一個集合的ε閉包。
            以a*c為例,其NFA圖如下所示(用dot畫的)

            為例:
            起始結點3的ε閉包集為 A = {3,1,4}
            A遇上字母a的轉移為MOV(A,a) = { 2 },其ε閉包集為B = { 2,1,4 }
            A遇上字母c的轉移為MOV(A,c) = { 6 },其ε閉包集為B = { 6 }
            同理可求出其他轉移集合,最后得到的DFA如下所示:

            3. 匹配
            每匹配成功一個字符則DFA移動到下個相應的結點。

            三. 改進

            1. 如龍書中所說,有時候模擬NFA而不是直接構建DFA可能達到更好的效果。
            2. 每次匹配不成功都需要回溯,這個地方也可以借鑒KMP算法(不過KMP對此好像有點不適用)
            3. 其他改進方法可以看看《柔性字符串匹配》和龍書《Compilers Principles,Techniques & Tools》3.7節。

            四. 代碼下載

            svn checkout http://regexp.googlecode.com/svn/trunk/ regexp-read-only

            regexp.rar
            posted on 2010-06-17 20:50 hex108 閱讀(722) 評論(2)  編輯 收藏 引用 所屬分類: Program

            評論:
            # re: 構建正則表達式引擎 2010-06-18 18:23 | 木頭奎
            發現一處代碼問題:
            NFA *construct_nfa_and(NFA *s,NFA *t)函數體里面,
            delete( t->get_head() ); //釋放t的頭結點
            這句話
            應該放到s->set_tail( t->get_tail() );的后面去

            VC6下測試發現的。  回復  更多評論
              
            # re: 構建正則表達式引擎 2010-06-18 21:01 | hex108
            @木頭奎
            謝謝! 剛改正了呵  回復  更多評論
              
            久久人人爽人人人人片av| 久久天天躁狠狠躁夜夜网站| 久久久WWW成人免费毛片| 久久亚洲高清综合| 日韩人妻无码一区二区三区久久| 99久久精品日本一区二区免费| 99久久国产综合精品网成人影院| 久久精品国产欧美日韩99热| 成人免费网站久久久| 久久精品国产乱子伦| 91精品国产91久久| 精品国际久久久久999波多野| 久久久久久国产精品免费免费| 亚洲AV无码久久寂寞少妇| 久久精品国产福利国产琪琪| 久久无码人妻一区二区三区午夜| 日本欧美国产精品第一页久久| 99久久无色码中文字幕| 国产偷久久久精品专区| 亚洲国产成人精品久久久国产成人一区二区三区综 | 久久av高潮av无码av喷吹| 麻豆成人久久精品二区三区免费 | 亚洲国产成人久久综合碰碰动漫3d| 伊人色综合久久天天网| 精品无码久久久久久久久久| 潮喷大喷水系列无码久久精品| 久久精品综合网| 国产69精品久久久久APP下载| 久久亚洲国产成人影院网站| 精品综合久久久久久88小说| 岛国搬运www久久| 久久精品国产亚洲7777| 久久激情亚洲精品无码?V| 很黄很污的网站久久mimi色 | 亚洲国产成人久久综合碰碰动漫3d| 国产精品禁18久久久夂久| 久久久久女人精品毛片| 99国产欧美精品久久久蜜芽 | 国产精品久久一区二区三区| 国产成人无码久久久精品一| 69久久夜色精品国产69|