青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0
    字符集的正規(guī)化指的是讓正則表達式的表達式樹的所有節(jié)點中記錄的字符集合的最小單元都是互不交叉的。舉個例子,[a-g][h-n]沒有交叉,但是[a-g][g-n]就交叉了。所以對[a-g][g-n]做字符集正規(guī)化的結(jié)果就是將表達式修改為([a-f]|g)(g|[h-n])。這樣表達式里面出現(xiàn)的字符集合的最小單元[a-f]、g和[h-n]就沒有交叉了。下面是正規(guī)化的代碼:

    正規(guī)化包含兩個步驟,第一步是檢查所有的字符集表達式然后做出一張正規(guī)化列表,譬如從表達式[a-g][g-n]抽取出正規(guī)化列表[a-f]、g和[h-n]。第二步則使用這張列表重寫表達式。[a-g]=[a-f]|g而[h-n]=h|[g-n],于是便改寫成了([a-f]|g)(g|[h-n])。在這里我們使用上一篇文章的visitor模式來完成。第一步和第二步的共同點是遍歷所有的節(jié)點,然后獲取所有的CharSetExpression。他們的區(qū)別僅僅在于如何對待CharSetExpression上。所以我們先寫一個算法基類:
 1         class CharSetAlgorithm : public RegexExpressionAlgorithm<void, NormalizedCharSet*>
 2         {
 3         public:
 4             void Apply(LoopExpression* expression, NormalizedCharSet* target)
 5             {
 6                 Invoke(expression->expression, target);
 7             }
 8 
 9             void Apply(SequenceExpression* expression, NormalizedCharSet* target)
10             {
11                 Invoke(expression->left, target);
12                 Invoke(expression->right, target);
13             }
14 
15             void Apply(AlternateExpression* expression, NormalizedCharSet* target)
16             {
17                 Invoke(expression->left, target);
18                 Invoke(expression->right, target);
19             }
20 
21             void Apply(BeginExpression* expression, NormalizedCharSet* target)
22             {
23             }
24 
25             void Apply(EndExpression* expression, NormalizedCharSet* target)
26             {
27             }
28 
29             void Apply(CaptureExpression* expression, NormalizedCharSet* target)
30             {
31                 Invoke(expression->expression, target);
32             }
33 
34             void Apply(MatchExpression* expression, NormalizedCharSet* target)
35             {
36             }
37 
38             void Apply(PositiveExpression* expression, NormalizedCharSet* target)
39             {
40                 Invoke(expression->expression, target);
41             }
42 
43             void Apply(NegativeExpression* expression, NormalizedCharSet* target)
44             {
45                 Invoke(expression->expression, target);
46             }
47 
48             void Apply(UsingExpression* expression, NormalizedCharSet* target)
49             {
50             }
51         };

    足夠細心的話會發(fā)現(xiàn)Apply(CharSetExpression*)沒有了。這是當(dāng)然的,因為下面兩個算法將補全之。首先是提取正規(guī)化列表。方法很簡單,找出每一個字符集,用它來切割正規(guī)化列表就好了。舉個例子,我們處理[a-g][g-h],首先獲得[a-g],然后通過跟[g-h]比較知道他們有交集,于是提取交集g,然后切割一下就行了:
 1         class BuildNormalizedCharSetAlgorithm : public CharSetAlgorithm
 2         {
 3         public:
 4             void AddRange(NormalizedCharSet* target, CharRange range)
 5             {
 6                 int index=0;
 7                 while(index<target->ranges.Count())
 8                 {
 9                     CharRange current=target->ranges[index];
10                     if(current<range || current>range)
11                     {
12                         index++;
13                     }
14                     else if(current.begin<range.begin)
15                     {
16                         // range   :    [    ?
17                         // current : [       ]
18                         target->ranges.RemoveAt(index);
19                         target->ranges.Add(CharRange(current.begin, range.begin-1));
20                         target->ranges.Add(CharRange(range.begin, current.end));
21                         index++;
22                     }
23                     else if(current.begin>range.begin)
24                     {
25                         // range  :  [       ]
26                         // current  :   [    ?
27                         target->ranges.Add(CharRange(range.begin, current.begin-1));
28                         range.begin=current.begin;
29                     }
30                     else if(current.end<range.end)
31                     {
32                         // range   : [       ]
33                         // current : [    ]
34                         range.begin=current.end+1;
35                         index++;
36                     }
37                     else if(current.end>range.end)
38                     {
39                         // range   : [    ]
40                         // current : [       ]
41                         target->ranges.RemoveAt(index);
42                         target->ranges.Add(range);
43                         target->ranges.Add(CharRange(range.end+1, current.end));
44                         return;
45                     }
46                     else
47                     {
48                         // range   : [       ]
49                         // current : [       ]
50                         return;
51                     }
52                 }
53                 target->ranges.Add(range);
54             }

    于是,我們拿到了這張列表之后,就可以重寫表達式了:
 1         class SetNormalizedCharSetAlgorithm : public CharSetAlgorithm
 2         {
 3         public:
 4             void Apply(CharSetExpression* expression, NormalizedCharSet* target)
 5             {
 6                 CharRange::List result;
 7                 for(int i=0;i<target->ranges.Count();i++)
 8                 {
 9                     CharRange targetRange=target->ranges[i];
10                     for(int j=0;j<expression->ranges.Count();j++)
11                     {
12                         CharRange range=expression->ranges[j];
13                         if(range.begin<=targetRange.begin && targetRange.end<=range.end)
14                         {
15                             result.Add(targetRange);
16                         }
17                     }
18                 }
19                 expression->ranges.Clear();
20                 CopyFrom(expression->ranges.Wrap(), result.Wrap());
21             }
22         };

    最后在Expression那里封裝一下就大功告成了:
1         void Expression::NormalizeCharSet()
2         {
3             NormalizedCharSet normalized;
4             BuildNormalizedCharSetAlgorithm().Invoke(this&normalized);
5             SetNormalizedCharSetAlgorithm().Invoke(this&normalized);
6         }

    至于什么是NormalizedCharSet,這只是一個擁有成員SortedList<CharRange>的類罷了。至此我們還看到了Visitor的另一個優(yōu)點:可以提取算法的公共部分。
posted on 2009-10-17 20:43 陳梓瀚(vczh) 閱讀(1900) 評論(1)  編輯 收藏 引用 所屬分類: VL++3.0開發(fā)紀(jì)事

評論:
# re: Vczh Library++3.0之正則表達式引擎(字符集正規(guī)化) 2009-10-19 00:26 | pp
樓主活在自己的世界里不亦樂呼啊  回復(fù)  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲欧美中文日韩在线| 欧美在线观看天堂一区二区三区| 欧美成人资源| 欧美国产一区二区| 欧美日韩亚洲天堂| 国产精品亚洲视频| 精品电影一区| 99在线视频精品| 性做久久久久久免费观看欧美| 欧美一区二区在线播放| 久久婷婷国产麻豆91天堂| 亚洲国产合集| 欧美美女bb生活片| 欧美激情综合色| 国产精品女人毛片| 国内精品久久久久久影视8| 亚洲福利视频专区| 亚洲欧美日韩一区| 久久亚洲精选| aa成人免费视频| 久久久久国产一区二区| 欧美日韩国产在线观看| 国产综合亚洲精品一区二| 亚洲美女毛片| 久久久久一区二区| 一区二区三区精品视频在线观看| 欧美在线视频免费观看| 欧美日韩二区三区| 狠狠色丁香久久婷婷综合_中| 亚洲精选视频免费看| 久久久久久久网| 91久久亚洲| 欧美一区成人| 国产精品v欧美精品v日韩| 亚洲国产精品电影| 久久久精品国产99久久精品芒果| 亚洲日韩欧美一区二区在线| 久久久久久尹人网香蕉| 国产精品自在在线| 亚洲一区二区欧美日韩| 亚洲欧洲在线一区| 久久裸体艺术| 国产一区二区三区奇米久涩| 亚洲欧美另类国产| 亚洲精品免费在线播放| 欧美+亚洲+精品+三区| 韩国亚洲精品| 久久久久久91香蕉国产| 午夜精品福利一区二区三区av | 一区二区三区毛片| 欧美高清在线精品一区| 亚洲高清中文字幕| 蜜臀va亚洲va欧美va天堂| 欧美影视一区| 国产一区二区三区久久精品| 久久久精品动漫| 久久国产精品一区二区三区四区| 国产日韩在线视频| 久久久久9999亚洲精品| 久久经典综合| 亚洲电影免费| 亚洲国产精品嫩草影院| 欧美日韩国产区一| 亚洲欧美日韩一区| 欧美亚洲视频一区二区| 黑人巨大精品欧美黑白配亚洲| 久久不射中文字幕| 久久久久久尹人网香蕉| 亚洲三级电影全部在线观看高清| 99精品久久久| 亚洲国产影院| 亚洲人午夜精品| 欧美色图五月天| 午夜视频一区二区| 久久国产直播| 亚洲精品乱码久久久久久蜜桃91| 91久久国产综合久久| 欧美三级电影大全| 久久久精品tv| 欧美精品乱码久久久久久按摩| 亚洲午夜精品福利| 欧美影视一区| 亚洲美女在线看| 亚洲综合国产精品| 亚洲国产精品激情在线观看| 91久久精品一区| 国产精品免费观看视频| 欧美3dxxxxhd| 你懂的成人av| 欧美日韩在线观看一区二区三区| 欧美自拍偷拍午夜视频| 久热re这里精品视频在线6| 一区二区成人精品| 欧美在线免费视屏| 亚洲一区www| 久久久久久国产精品mv| 亚洲淫片在线视频| 久久漫画官网| 欧美一级网站| 欧美巨乳在线| 模特精品在线| 国产欧美日韩视频一区二区三区 | 欧美国产成人精品| 国产精品进线69影院| 欧美www视频| 国产有码在线一区二区视频| 日韩视频国产视频| 亚洲国产精选| 久久久久国内| 久久久999精品免费| 国产精品久久久久久久久久久久久久| 欧美1区3d| 黄色日韩在线| 欧美亚洲综合另类| 午夜精品久久久久久久男人的天堂| 能在线观看的日韩av| 久久久久久久久久码影片| 国产精品美女主播| 一本到高清视频免费精品| 亚洲人成亚洲人成在线观看图片 | 亚洲午夜久久久久久尤物| 久久综合九色综合网站| 久久美女性网| 国产在线精品二区| 欧美资源在线观看| 久久精品国产亚洲5555| 国产免费成人在线视频| 亚洲激情国产精品| 欧美日韩国产欧| 久久久久久久尹人综合网亚洲| 亚洲欧美一区在线| 伊人成人在线视频| 国产偷国产偷亚洲高清97cao | 亚洲免费视频观看| 国产精品免费电影| 欧美极品在线播放| 欧美视频免费| 伊人激情综合| 久久久亚洲精品一区二区三区| 欧美日韩高清区| 亚洲人成在线观看| 日韩视频不卡中文| 欧美人与性动交a欧美精品| 亚洲精品久久久久久久久久久久久 | 国产精品久久久久久久久久妞妞| 亚洲美女啪啪| 午夜精品在线视频| 国产午夜精品麻豆| 久久精品国产一区二区电影| 欧美福利精品| 亚洲午夜精品久久久久久浪潮 | 玖玖在线精品| av不卡免费看| 国产精品网站一区| 久久精品视频在线观看| 欧美成人免费播放| 宅男在线国产精品| 国产综合亚洲精品一区二| 久久亚洲国产精品一区二区 | 亚洲第一毛片| 欧美日本在线看| 午夜精品视频在线观看一区二区| 久久综合激情| 亚洲视频免费观看| 韩国女主播一区| 欧美精品一区二区久久婷婷| 亚洲一区二区三区在线看| 久久久免费精品视频| 日韩一区二区免费看| 国产一区二区三区免费观看| 欧美寡妇偷汉性猛交| 午夜影院日韩| 亚洲国产欧美不卡在线观看| 欧美伊人久久久久久久久影院| 亚洲黄色片网站| 国产麻豆午夜三级精品| 欧美成人免费在线| 欧美中文在线视频| 亚洲天堂av电影| 永久域名在线精品| 一区二区三区视频免费在线观看| 午夜亚洲伦理| 亚洲伦理在线| 国产一区视频在线观看免费| 欧美日韩国产一中文字不卡| 久久视频精品在线| 欧美一区二区在线视频| 日韩视频免费观看高清在线视频 | 亚洲一级在线| 亚洲精品国产拍免费91在线| 国产一区二区三区奇米久涩 | 国产亚洲一区二区在线观看| 欧美日韩美女| 欧美a级一区二区| 久久av资源网站| 香港成人在线视频| 亚洲欧美日本伦理| 亚洲一区二区三区久久| 一区二区三区精密机械公司| 亚洲三级免费|