溪流漫話
荒廢中，求警醒~

隨筆-90 評論-947 文章-0 trackbacks-0

初步性能測試

因為接下去要做優化工作，在此之前，先做下簡單的性能測試。

比較的對象是std::regex，暫時只比較兩項：

1、解析正則表達式的速度

2、使用解析好的正則表達式去匹配字符串的速度。

測試代碼如下：

SECTION_BEGIN(StdRegExParse100000);

PERFORMANCE_TEST_BEGIN(StdRegExParse100000);

for (int i = 0; i < 100000; ++i)

{

wregex r;

r.assign(L"http://([a-zA-Z0-9\\-]+.)+[a-zA-Z]+/");

}

PERFORMANCE_TEST_END(StdRegExParse100000);

SECTION_END();

SECTION_BEGIN(xlRegExpParse100000);

PERFORMANCE_TEST_BEGIN(xlRegExpParse100000);

for (int i = 0; i < 100000; ++i)

{

RegExp r;

r.Parse(L"http://([a-zA-Z0-9\\-]+.)+[a-zA-Z]+/");

}

PERFORMANCE_TEST_END(xlRegExpParse100000);

SECTION_END();

SECTION_BEGIN(StdRegExMatch100000);

{

wregex r;

r.assign(L"http://([a-zA-Z0-9\\-]+.)+[a-zA-Z]+/");

PERFORMANCE_TEST_BEGIN(StdRegExMatch100000);

for (int i = 0; i < 100000; ++i)

{

regex_match(L"http://w-1.w-2.w-3.streamlet.org/", r);

}

PERFORMANCE_TEST_END(StdRegExMatch100000);

}

SECTION_END();

SECTION_BEGIN(xlRegExpMatch100000);

{

RegExp r;

r.Parse(L"http://([a-zA-Z0-9\\-]+.)+[a-zA-Z]+/");

PERFORMANCE_TEST_BEGIN(xlRegExpMatch100000);

for (int i = 0; i < 100000; ++i)

{

r.Match(L"http://w-1.w-2.w-3.streamlet.org/");

}

PERFORMANCE_TEST_END(xlRegExpMatch100000);

}

SECTION_END();

前兩則是分別使用std::wregex和xl::RegExp解析"http://([a-zA-Z0-9\\-]+.)+[a-zA-Z]+/"十萬次，后兩則是拿來匹配http://w-1.w-2.w-3.streamlet.org/十萬次。

結果如下：

匹配速度差很多，解析速度差不多。

考慮到在解析“?”“+”“*”的時候，引入了很多ε邊，于是對那部分做點優化，去除不必要的ε邊和節點構造，然后再測試：

可以看到有所提高，但是解析速度還是跟std:wregex的差很多，匹配速度有明顯領先。目前只解析到ε邊、-NFA，如果再做狀態機轉化，雖然會提高匹配速度，可是解析速度會進一步下降。因此，一開始就要考慮使用一種更高效的狀態機存儲方法。

這兩天著涼生病了，好難受啊……

posted on 2012-06-13 23:00 溪流閱讀(539) 評論(0) 編輯收藏引用所屬分類: C++

只有注冊用戶登錄后才能發表評論。


相關文章: 建立一個簡單干凈的 gn+ninja 工具鏈微軟拼音長句模式恢復工具支持Win10 1803 發布個工具，一鍵恢復Win8/8.1中的微軟拼音長句模式（新體驗模式）將 Timer 對象化裸寫一個進程外 COM 組件讓 COM 脫離注冊表在 DLL 中加入第二個 COM 類讓COM組件可被跨語言調用裸寫一個進程內 COM 組件寫個含 Windows Media Player 的窗口

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

本博客中提供的任何源代碼、非開源軟件以及其他作品，如未加特別說明，均屬原創。如果其中有版權說明，則請遵守版權說明；如果沒有版權說明，任何人都可以將其用于任何合法場合，包括但不限于商業、非商業的。如果您有使用，特別是用于商業場合，您最好通知我一下，但這并不是必須的。本博客中的任何非原創作品，請遵守原作者的版權說明。

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

常用鏈接

留言簿(21)

隨筆分類(124)

隨筆檔案(90)

我的鏈接

GitHub
個人網站
溪流軟件工作室

友情鏈接

Armageddon
xsh_123321的專欄
更吹落星如雨
做一個優雅的程序員

積分與排名

積分 - 414673
排名 - 57

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(21)

隨筆分類(124)

隨筆檔案(90)

我的鏈接

友情鏈接

積分與排名

最新隨筆

最新評論

閱讀排行榜

評論排行榜