最近寫一個(gè)小的搜索引擎,涉及到Html內(nèi)容的提取,所以開(kāi)發(fā)了這個(gè)基于pcre的正則表達(dá)式測(cè)試工具,基本兼容Perl和PHP,除了沒(méi)有實(shí)現(xiàn)模式,如perl支持/your regex/i 模式,這個(gè)工具必須寫成2個(gè)表達(dá)式,一個(gè)是"your regex",另一個(gè)是"i",工具用VC8開(kāi)發(fā),依賴庫(kù)自己找。
下載地址:
http://m.shnenglu.com/Files/PeakGao/xregex.rar
被匹配的文本文件支持鼠標(biāo)拖曳
正則表達(dá)式文本框說(shuō)明:
本文本框支持n個(gè)正則表達(dá)式描述,你可以只啟用選擇的某一個(gè)正則表達(dá)式(依賴上方的復(fù)選框),也支持批處理每個(gè)正則表達(dá)式(只因我是為了測(cè)試清除HTML的垃圾內(nèi)容而開(kāi)發(fā)的,所以提供了這個(gè)功能);
幾個(gè)按鈕的功能解釋一下:
加載默認(rèn)表達(dá)式:就是將input_regex.txt文件內(nèi)容讀入到正則表達(dá)式文本框;
加載默認(rèn)內(nèi)容:就是將input.txt文件讀入內(nèi)容文本框;
執(zhí)行匹配:就是一項(xiàng)一項(xiàng)的進(jìn)行匹配,就像記事本的查找功能一樣;
替換選擇文本:不用介紹了吧;
單正則全部替換:表示使用正則表達(dá)式中的某個(gè)正則表達(dá)式(如果存在多行),和替換文本來(lái)對(duì)內(nèi)容文本框中的內(nèi)容進(jìn)行全部替換;
多正則全部替換:表示使用正則表達(dá)式中的所有表達(dá)式和替換文本中的所有文本串(與表達(dá)式對(duì)應(yīng),有10個(gè)表達(dá)式,就寫10個(gè)替換文本)對(duì)內(nèi)容文本框中的文本進(jìn)行依序替換。
如果有錯(cuò)誤發(fā)生不要找我,我只是臨時(shí)開(kāi)發(fā)了給自己測(cè)試用的,望見(jiàn)諒。
演示:
如果你正確下載了,程序能運(yùn)行起來(lái)的話,點(diǎn)“多正則全部替換”看看效果。
btw:
我用正在表達(dá)式清除Html無(wú)用信息發(fā)現(xiàn)速度慢的不行,自己寫了個(gè)Html的專用解析器,發(fā)現(xiàn)速度比他快上上百倍,真是無(wú)話可說(shuō)。。。