青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0
    有個同學近來一直在做一個魔獸世界戰況分析(名字好像叫DeusCraft),說是很火。只是用C#覺得不是很爽,想移植到C++上面來。但是那個東西在分析的時候用了好多正則表達式,于是只好找了些正則表達式引擎來測。

    測試的文件一共有27萬多行,首先通過一個檢查時間的正則表達式。如果成功,則在接下來的20幾條正則表達式中驗證字符串命中哪一條,然后開始做剩余的工作。原先在C#上花了12秒分析,后來換了boost的正則表達式花費40秒,然后從MSR上找了一個號稱比boost快4倍的正則表達式引擎,結果還是40秒(都是微軟的,咋差距這么大……)。于是同學用他自己做的正則表達式引擎花了23秒(此數據不太記得),我用我以前那個東西花費108秒(-_-|||)。

    于是我們這幾天就在優化正則表達式引擎,到了今天同學那個花費13秒,我那個12秒。Visual Studio 2008 Team System上有一個Performance Wizard,用于在程序執行的過程中統計各個函數所占用的時間,可以方便定位,看出效率瓶頸,非常好用。

    我之前的正則表達式為了保持很多語法上的一致性(譬如選擇操作符“|”需要遵守交換律等等),使用了一種花費很大的辦法來對字符串進行分析。這種分析方法找出所有符合正則表達式要求的所有匹配的路徑然后進行篩選。篩選的過程中浪費了很多new和delete的操作,而且做了很多計算,維護了一個非常復雜的數據結構。后來想到有些事情是可以讓人來操心的,于是在原來的接口上加了一個option,添加了一種叫做“貪婪式”的分析方法。現在就同時有兩種分析方法用了。第二種分析方法的優點是快,缺點是喪失了一些語法上的優美(不過這個對于大部分人來說應該是沒什么關系的了。要是正則表達式的執行過程不復雜的話,《精通正則表達式》也就賣不出去了,反正別人的正則表達式大多都是貪婪的)。貪婪式的分析方法不同時掃描所有路徑,而是使用回溯的方法。不過這種方法最大的優點在于數據結構可以大幅度簡化為三個堆棧(NFA狀態、已捕獲子串、捕獲狀態),從而大量減少包括申請和釋放等的指針操作。

    上文中的測試是在同學他自己進行的。我在我自己的電腦上使用了一條表達式(而不是20幾條)來跑相同的文件,非貪婪式用了23秒,貪婪式用了3.5秒。

    雖然這個正則表達式引擎的接口跟現在C#或Java流行的那些差不多,只是這東西屬于Syngram的一部分,所以不是很想單獨分隔成一個dll發布。至于代碼就要等Vczh Free Script 3.0或者Vczh Lazy Script 1.0發布的時候再一起開放了,因為使用Syngram做編譯器是很爽的。到時候再考慮如何將正則表達式和上下文無關文法兩個強大的字符串分析庫封裝成dll用吧。嘿嘿。
posted on 2008-05-07 05:21 陳梓瀚(vczh) 閱讀(15512) 評論(21)  編輯 收藏 引用 所屬分類: C++

評論:
# re: 正則表達式——一點小插曲 2008-05-07 19:19 | xiaolige
你自己寫的那個功能有boost的全嗎,能夠全面實現boost.regex功能并且性能上超越它這么多就很厲害了  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-07 20:13 | 空明流轉
現在MSR的不一定有boost好了,你用的是regex還是xpressive的那個,我都分不清有什么區別,囧  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-07 20:39 | Fox
正要看看正則表達式,不妨寫詳細點,參考一下:D  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-07 21:39 | eXile
boost::xpressive有兩種使用方式, 一種就是和boost::regex一樣的動態解析,一種是靜態解析,類似于boost::spirit .
如果你使用的正則式是硬編碼的字符串(大多數情況下都是如此), 那么使用 xpressive的靜態解析具有更高的效率, 因為它的解析模板是在編譯期生成的.  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-08 05:10 | 陳梓瀚(vczh)
boost::regex不能命名捕獲,只能匿名捕獲,我的可以,這是功能上的唯一區別。其他的特性我全有。畢竟是參考過他和.net兩邊的語法然后自己改了一下的。

至于spirit,那個不是正則表達式,是上下文無關文法。這個就是另外一個問題了。我那套syngram有一個東西是用來處理上下文無關文法的,這兩個我還沒比。不過以前的spirit是不能處理左遞歸的,不知道現在的行不行。

不過xpressive寫的正則表達式在boost的主頁上號稱快了15%,估計有所限制。把文本的正則表達式換成那種直接寫代碼的東西,本質上并沒有改變什么。因為狀態機還是狀態機,操作符重載是不可能靜態編譯的,只有直接用模板才行。這樣的話會變成類似
seq_p<
ch_p<'a'>,
opt_p<
ch_p<'b'>,
ch_p<'c'>
>
>
的,用于表達a(b|c)。這種形式才有可能達到編譯器編譯出分析字符串的代碼。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-09 06:20 | 路人甲
不知天高地厚,你和你同學竟然都超過了regex,真是太有才了
  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-09 06:24 | 路人甲
原先在C#上花了12秒分析,后來換了boost的正則表達式花費40秒,然后從MSR上找了一個號稱比boost快4倍的正則表達式引擎,結果還是40秒(都是微軟的,咋差距這么大……)。
=======================
C++比C#慢這么多,差距怎么這么大啊,為什么C++比C#慢這么多啊?哦,原來使用者是頭豬喲  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-09 07:27 | eXile
@陳梓瀚(vczh)
你所寫的模板形式和xpressive的表達式模板并沒有太大的差別, 因為表達式模板最終生成的也是類似于這樣的東西.
另外, 程序庫為了實現功能的全面性和通用性, 必然要損失一部分效率, 樓上的對此也不用大驚小怪, 還是要注意素質.....
  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-09 09:40 | 陳梓瀚(vczh)
@路人甲
C#的正則表達式也是C++寫的,謝謝合作。
至于速度問題,好像沒人規定我就不能比boost做得好吧。

不過路人甲想必是沒有寫過正則表達式引擎了。在測試的過程中,瓶頸不在分析,而在于分析完了之后產生的數據結構。正則表達式分析字符串的過程本身是很快的,分析完了制造那些數據出來給你用的時候,就會消耗大量的時間。明白?不過話說回來,我那個庫是沒有用到stl的。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-11 19:53 | 胡人
鼓勵原創,鼓勵創新,鼓勵提高,一個字,好!
期待能早些見到東西,而不是一些有點自吹自擂的數據!
  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-11 21:45 | 陳梓瀚(vczh)
東西不能著急。做是做出來了。改進前的代碼其實已經發布了,改進后的還沒有。只是以前沒做廣告到大家不知道罷了。現在還不拿出來的原因有三:

1:沒充分測試。因為平時還要上課做作業。
2:我用的庫是我自己開發的,沒有stl,跟大家的代碼要接上不是那么容易。所以就算看到了,也就只能看。想用的話還得再花一些功夫。因為這個正則表達式當初只是想給自己用的。
3:正則表達式隸屬于我自己的那套文法工具,按照計劃是在下一個編譯器發布的時候一起給出來。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-11 22:03 | 空明流轉
鄙視造車輪啊造車輪。。。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-24 07:04 | missdeer
我有一個項目里用MSR的greta全文匹配5種模式,一個3萬行的文件,占用CPU99%可能要1分鐘左右。最近發現,用lex和yacc來做,達到同樣的效果,可能不會超過3秒鐘。正則表達式要用好,還是很有文章可作的。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2008-05-24 09:10 | 陳梓瀚(vczh)
當然,你用lex生成代碼,是不能動態修改的。當然快了。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2009-03-20 02:20 | 林林
不知到能不能把你的測試數據與程序公布一下,不用提供正則庫的源碼
我也寫了一個,想比較一下?  回復  更多評論
  
# re: 正則表達式——一點小插曲 2009-03-20 02:54 | 陳梓瀚(vczh)
那個在舊電腦里面,而且是一個100多M的文本文件……你去比較C#那個吧,我的速度是它的96%(比率較穩定)  回復  更多評論
  
# re: 正則表達式——一點小插曲 2009-03-22 01:38 | 白開水
LSS的,你把一份C文件,用gcc -E 跑一次后,在粘貼個幾十次,基本就OK了  回復  更多評論
  
# re: 正則表達式——一點小插曲 2009-03-24 08:29 | wow
@路人甲
毫無水準  回復  更多評論
  
# re: 正則表達式——一點小插曲 2010-07-27 17:57 | 路人癸
要鼓勵~而不是諷刺~支持國產~打到小日本~  回復  更多評論
  
# re: 正則表達式——一點小插曲 2010-09-02 00:45 | yoco
@路人甲

boost::regex 的效能本來就是慢的,這是常識。

切莫妄自菲薄,您自己實現一個,效能也是有可能比 boost::regex 好的。  回復  更多評論
  
# re: 正則表達式——一點小插曲 2016-08-03 11:24 | Bread
明天開工。
來踩一下輪子哥的腳印。  回復  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲免费在线| 欧美一区在线直播| 欧美成va人片在线观看| 欧美一区二区三区喷汁尤物| 性欧美长视频| 久久国产99| 榴莲视频成人在线观看| 欧美黄色网络| 国产精品久久久久久久久搜平片 | 欧美激情小视频| 欧美日韩国产精品一卡| 国产精品扒开腿做爽爽爽视频 | 亚洲视频一区在线观看| 欧美高清一区二区| 亚洲精品日产精品乱码不卡| 亚洲人成网站精品片在线观看| 狼狼综合久久久久综合网| 久久免费精品日本久久中文字幕| 欧美激情亚洲视频| 亚洲午夜高清视频| 久久婷婷久久| 欧美日韩中文在线| 伊人成年综合电影网| 亚洲毛片一区二区| 久久成人综合网| 日韩视频中文字幕| 久久久国产精品一区二区三区| 欧美韩日一区二区三区| 国产亚洲欧美激情| 中文av一区二区| 免费成人黄色av| 亚洲欧美日韩天堂| 欧美激情小视频| 亚洲国产精品第一区二区| 性色一区二区三区| 亚洲欧洲日韩在线| 老司机凹凸av亚洲导航| 国产乱子伦一区二区三区国色天香| 亚洲高清资源| 久久精品中文字幕免费mv| 艳女tv在线观看国产一区| 蜜臀av性久久久久蜜臀aⅴ| 国产日韩欧美二区| 亚洲与欧洲av电影| 亚洲美女视频在线观看| 欧美成人高清| 亚洲福利视频网站| 久久伊人亚洲| 欧美一区二区啪啪| 国产乱人伦精品一区二区| 亚洲午夜久久久| 亚洲国产欧美一区| 你懂的视频欧美| 亚洲国产欧美不卡在线观看| 久久久精品一区| 香蕉久久精品日日躁夜夜躁| 欧美视频在线观看视频极品| 亚洲精品国精品久久99热| 免费久久99精品国产| 久久久久99精品国产片| 国产精品热久久久久夜色精品三区| 一区二区三区高清在线| 亚洲精品中文字| 欧美日韩一二三四五区| 亚洲视屏在线播放| 中日韩美女免费视频网址在线观看 | 欧美不卡一卡二卡免费版| 亚洲欧洲av一区二区| 国产精品日韩欧美一区| 亚洲一区美女视频在线观看免费| 亚洲精品美女久久7777777| 欧美精品一区二区三区很污很色的| 亚洲国产天堂久久综合网| 亚洲电影自拍| 欧美日韩国产在线一区| 亚洲视频网在线直播| 亚洲夜间福利| 国产区亚洲区欧美区| 久久另类ts人妖一区二区| 久久久人人人| 99精品国产在热久久婷婷| 9人人澡人人爽人人精品| 国产精品久久毛片a| 久久久www免费人成黑人精品 | 国产精品亚洲一区| 久久嫩草精品久久久久| 免费观看欧美在线视频的网站| 9色国产精品| 亚洲欧美另类国产| 狠狠色狠狠色综合人人| 亚洲国产精品成人一区二区| 国产精品jizz在线观看美国 | 亚洲欧洲日产国码二区| 国产精品裸体一区二区三区| 久热re这里精品视频在线6| 欧美电影在线播放| 欧美一区二区精品久久911| 另类图片国产| 欧美一级在线播放| 裸体歌舞表演一区二区 | 久久午夜精品一区二区| 欧美成年人视频网站| 翔田千里一区二区| 牛牛影视久久网| 欧美在线视频观看| 欧美国产日韩一区二区在线观看| 午夜电影亚洲| 欧美黄色一区二区| 久久久777| 国产精品超碰97尤物18| 亚洲第一精品夜夜躁人人躁| 国产精品中文字幕欧美| 欧美激情精品久久久| 国产视频一区二区在线观看| 99re国产精品| 亚洲精品一区二区三区在线观看| 亚洲在线第一页| 一本久久a久久免费精品不卡| 午夜在线精品偷拍| 亚洲视频免费| 欧美人成网站| 亚洲一区免费网站| 欧美a级大片| 国产乱码精品1区2区3区| 亚洲欧洲日本mm| 亚洲国产一区二区三区在线播| 亚洲一级特黄| 亚洲欧美春色| 国产精品xvideos88| 亚洲激情网站免费观看| 国产免费观看久久黄| 亚洲精品在线三区| 99精品黄色片免费大全| 欧美激情国产高清| 欧美国产精品va在线观看| 国产一区亚洲| 久久狠狠一本精品综合网| 欧美一区免费视频| 国产精品一区视频网站| 亚洲综合欧美日韩| 亚洲男人的天堂在线| 国产精品国产馆在线真实露脸 | 久久夜色精品国产噜噜av| 国产日韩av一区二区| 午夜伦欧美伦电影理论片| 欧美一级理论性理论a| 国产精品免费aⅴ片在线观看| 亚洲一区二区三区在线观看视频| 亚洲欧美一区二区原创| 国产精品一二| 欧美专区亚洲专区| 免费看黄裸体一级大秀欧美| 亚洲国产天堂久久综合| 欧美激情视频网站| 中文一区二区在线观看| 久久电影一区| 亚洲激情二区| 欧美日韩成人综合| 亚洲综合成人在线| 久久亚洲欧美国产精品乐播| 亚洲成色777777女色窝| 欧美黄色片免费观看| 亚洲一级一区| 欧美国产视频在线观看| 99国内精品久久| 国产亚洲欧美一级| 蘑菇福利视频一区播放| 中文一区二区| 欧美第十八页| 午夜精品久久久久久久| 亚洲第一免费播放区| 欧美三级网址| 久久久久久久久综合| 日韩午夜激情av| 久久一二三四| 亚洲一区三区视频在线观看 | 国产精品qvod| 另类欧美日韩国产在线| 亚洲桃花岛网站| 欧美成人精品一区二区| 亚洲综合欧美| 亚洲人体影院| 国产一区二区久久精品| 欧美日韩免费在线视频| 久久精视频免费在线久久完整在线看 | 国产欧美一区二区三区久久| 亚洲国产经典视频| 亚洲大胆在线| 国产精品久久一区主播| 蜜臀av性久久久久蜜臀aⅴ四虎| 99精品国产99久久久久久福利| 久久手机精品视频| 亚洲一区二区三区四区在线观看| 激情综合中文娱乐网| 国产精品久久久久久久久果冻传媒| 欧美va亚洲va香蕉在线| 午夜精品久久久久久久久久久久| 91久久在线| 欧美成年网站| 久久免费午夜影院|