久久国产综合精品,一区二区欧美日韩视频,国产原创一区二区

正則表達(dá)式簡單資料

　　正則表達(dá)式是使用一套特殊符號(hào)模式做為表達(dá)格式的字符串，主要用處是描述和解析文本。許多程序員（甚至一些不錯(cuò)的高手）都無視（也不用）正則表達(dá)式，我認(rèn)為這是一個(gè)恥辱，因?yàn)樵诮鉀Q很多問題的時(shí)候，正則表達(dá)式常常讓我們有得心應(yīng)手的感覺。一旦你掌握了，就會(huì)發(fā)現(xiàn)它能解決無數(shù)真實(shí)世界的問題。

　　正則表達(dá)式的工作方式就象Windows或者*nix系統(tǒng)里面的文件名替代符 - 你可以使用特定的*或者?來指定一系列文件。但是使用正則表達(dá)式的特殊字符或者metacharacters（元字符）來表示這類事情會(huì)更準(zhǔn)確。

　　正則表達(dá)式把大多數(shù)字符當(dāng)作直接字符，就好像正則表達(dá)式 mike，將只會(huì)匹配按順序的字符序列m - i - k - e。與此同時(shí)正則表達(dá)式使用一個(gè)采用元字符的擴(kuò)展集合，可以表示非常復(fù)雜的文字匹配。

　　認(rèn)識(shí)元字符： ^[](){}.*?\|+$ 以及在某些時(shí)候出現(xiàn)的 -
我知道它們看上去很恐怖，但是一旦你了解它們就會(huì)知道它們是很可愛的符號(hào)。

　　行定位點(diǎn): ‘^’ 和 ‘$’
‘^’ (讀成：caret) 和 ‘$’ (讀成：dollar) 這兩個(gè)元字符分別代表一行文字的開始和結(jié)束。就象我前面舉的例子，正則表達(dá)式mike會(huì)匹配字符序列m - i - k – e，可是它會(huì)匹配一行中的所有位置 (比如，它會(huì)匹配 “I’m mike”或者 “carmike”)。 ‘^’字符被用來限定匹配行的開始，因此^mike 將只會(huì)尋找以mike開始的行。同樣，表達(dá)式mike$將只會(huì)尋找m - i - k - e在一行末尾的(當(dāng)然還是會(huì)匹配 ‘carmike’)。

　　如果我們聯(lián)合使用這兩個(gè)行定位點(diǎn)字符，我們可以搜索在多行文字中尋找包含的特殊字符串序列。比如：表達(dá)式 ^mike$ 將只會(huì)匹配占有單獨(dú)一行的單詞mike，一個(gè)字不多一個(gè)字不少。同樣，表達(dá)式 ^$ 對于發(fā)現(xiàn)空行（一行開始就是本行結(jié)束的那種）很有用。

　　字符分類: ‘[]’
　　一對方括號(hào)被稱為一個(gè)字符分類, 你可以用來匹配任何一個(gè)或多個(gè)字符。假設(shè)你想匹配單詞 ‘gray’，同時(shí)也想找一下被拼寫成 ‘grey’的單詞。使用一個(gè)字符分類將允許你匹配這兩者 -- 正則表達(dá)式 gr[ea]y 被解讀成 “匹配這樣的字符串 - 一個(gè)g, 跟著是r, 跟著或者是一個(gè)e或者是一個(gè)a, 跟著一個(gè)y”。

　　如果你用 [^ ... ] 代替 [ ... ], 這個(gè)分類將匹配后面列出來字符以外的任何字符。首字符 ^ 表示“否定"列表 - 不同于你列出所有希望包含的字符，你是去列出所有不想包含的字符。注意在這里使用的^ (caret) 字符，它在字符分類方式之外使用表示另外的意思 - 用來匹配文字行的開始（見文章前面部分）。

　　字符分類中的元字符: ‘-’
　　在一個(gè)字符分類中，字符分類中的元字符 ‘-’ (dash) 用來指出一個(gè)字符范圍。考慮字符分類 [01234567890abcdefABCDEF]，采用’-’的話我們可以這樣寫[0-9a-fA-F]，方便了不少吧。有一點(diǎn)大家要注意的，這個(gè)’-’符號(hào)只有用一個(gè)字符分類中才被認(rèn)為是元字符，在其他位置，它只是簡單的匹配普通的’-’字符，沒有任何其他意義。

　　但是且慢，我看到有人舉手質(zhì)疑。假如在一個(gè)字符分類里面，’-’字符做為第一個(gè)字符出現(xiàn)的時(shí)候，會(huì)把它認(rèn)為成什么呢？比如[-A-F]，問題很好，注意：這是一個(gè)例外，如果在字符分類中，’-’字符是第一個(gè)出現(xiàn)的字符，那我們把它當(dāng)作普通字符而不是元字符處理（因?yàn)閷?shí)際上它不可能表示一個(gè)字符范圍，范圍需要有開始和結(jié)束字符），這個(gè)時(shí)候它只會(huì)匹配一個(gè)普通的’-’字符。引申開來，我們再說一個(gè)例外：S’?’和’.’在大多數(shù)情況下都是正則表達(dá)式的元字符，但是有個(gè)例外是在字符分類中，當(dāng)它們在字符分類中的時(shí)候（比如在：[-0-9.?]，它們只是代表一個(gè)普通字符，唯一的特殊字符（元字符）是0和9中間的’-’）。

　　用一個(gè)句點(diǎn): ‘.’匹配任何字符
　　‘.’ 元字符（一般讀成a dot 或者point）是一種匹配任何字符的寫法。在你想在一個(gè)字符串的指定位置匹配一個(gè)任意字符的時(shí)候，它顯得非常可愛。再強(qiáng)調(diào)一遍，在字符分類中，’.’就不是一個(gè)元字符了。到現(xiàn)在為止，你開始看出一些門道來了吧？哪些是元字符哪些不是元字符在字符分類里面和外面是不一樣的。

　　選擇性元字符: ‘|’
　　‘|’ 元字符（讀成pipe）的意思是“or”。它允許你把多個(gè)表達(dá)式合成到一個(gè)表達(dá)式，然后匹配里面任何單個(gè)表達(dá)式的結(jié)果。這些子表達(dá)式被稱為備選項(xiàng)。

　　例如：Mike 和 Michael 是兩個(gè)獨(dú)立的正則表達(dá)式，但是Mike|Michael 這樣來寫的話，這個(gè)正則表達(dá)式匹配任意一個(gè)單詞。

　　圓括號(hào)在這里可以被用來限制備選的范圍。我們可以使用圓括號(hào)來達(dá)到和上面這個(gè)正則表達(dá)式同樣的目的，同時(shí)縮短它長度，正則表達(dá)式Mi(ke|chael) 同樣匹配Mike或者M(jìn)ichael。當(dāng)然，在實(shí)際程序中我還是會(huì)用第一種寫法，雖然長了一點(diǎn)，可是更容易理解，因此也更容易維護(hù)。

　　匹配可選項(xiàng): ‘?’
　　‘?’ 元字符（讀成：question mark）意味著可選。它放在正則表達(dá)式的某個(gè)位置的一個(gè)字符后面，這個(gè)字符允許在匹配結(jié)果中出現(xiàn)，也可以不出現(xiàn)。當(dāng)然，我們可以肯定的是：這個(gè)’?’字符只能跟在一個(gè)普通字符而不是元字符后面。

　　如果我想匹配英式或者美式拼法的單詞‘flavor’ ，我會(huì)用正則表達(dá)式flavou?r，它被解讀成：“匹配一個(gè)字符串：f，跟著一個(gè)l，跟著一個(gè)a，跟著一個(gè)v，跟著一個(gè)o，跟著一個(gè)可選的u，跟著一個(gè)r”。

　　數(shù)量符號(hào): ‘+’ and ‘*’
　　象’?’字符一樣，‘+’ （讀成plus）和‘*’（讀成star）元字符影響前導(dǎo)字符（就是在這個(gè)符號(hào)前面的字符）可以在匹配字符串中出現(xiàn)的數(shù)量（使用前面說的‘?’的話，相當(dāng)于前導(dǎo)字符可以出現(xiàn)0次或一次）。元字符‘+’ 匹配前面出現(xiàn)的項(xiàng)目一次或更多次，而‘*’ 則表示匹配任何次，包括0次。

　　如果我想通過在一場足球比賽中解說員說’goal’的聲音次數(shù)來統(tǒng)計(jì)比分的話，我應(yīng)該用正則表達(dá)式go+al，它可以匹配‘goal’，也可以匹配一些激情主播的‘gooooooooooooooooal’ （但肯定不會(huì)是 ‘gal’)。

　　前面的三個(gè)元字符：’?’、’+’、’*’一般又叫做計(jì)量符。因?yàn)樗鼈冇绊懬懊骓?xiàng)目的數(shù)量。

　　數(shù)量范圍: ‘{}’
　　‘{最小, 最大}’ 這個(gè)元字符序列允許你指定特定項(xiàng)目可以被匹配的最少和最大次數(shù)。例如go{1,5}al 可以用來限制我們上面的例子，只匹配1到5次o。同樣的{0,1} 其實(shí)就等同于一個(gè)’?’元字符。

　　轉(zhuǎn)義字符: ‘\’
　　‘\’ 元字符（讀成：backslash）被用來轉(zhuǎn)換指定的元字符的含義，以便于你可以把它們當(dāng)成普通字符來匹配。例如，你打算匹配字符’?’或者’\’，你就可以在它們前面加上一個(gè)’\’字符，這樣它們就被轉(zhuǎn)換成普通字符的含義，就好像這樣寫：‘\?’ or ‘\\’.

　　如果在一個(gè)非元字符前面使用’\’的話，那么根據(jù)你使用正則表達(dá)式的語言不同，會(huì)有不同的含義，必須參閱相應(yīng)的手冊。比較普遍采用的是perl兼容的正則表達(dá)式（PCREs），你可以在這里查看the perldoc page for perl regular expressions. PCREs用得非常普遍，在PHP、 Ruby和ECMAScript/Javascript還有很多語言中都可以使用。

　　用圓括號(hào)匹配: ‘()’
　　大部分正則表達(dá)式工具允許你用圓括號(hào)設(shè)定一個(gè)特定的表達(dá)式子集。比如，我們可以用一個(gè)正則表達(dá)式http://([^/]+)去匹配一個(gè)URL的域名部分。下面讓我們把這個(gè)正則表達(dá)式分解開，看看它是如何工作的。

　　這個(gè)表達(dá)式的起始部分非常直白：它必須匹配“h - t - t - p - : - / - /”這樣的字符序列。這個(gè)初始序列之后就是圓括號(hào)了，它被用來捕捉符合它們包圍的子表達(dá)式的字符。在現(xiàn)在的例子中，子表達(dá)式是‘[^/]+’，用上面學(xué)到的知識(shí)，我們知道它實(shí)際上是匹配除了‘/’字符以外的任何字符一次到多次。對于一個(gè)像是 http://immike.net/blog/Some-blog-post的URL，‘immike.net’ 將會(huì)被這個(gè)圓括號(hào)里面的表達(dá)式所匹配。

posted on 2007-12-05 20:24 李亞閱讀(467) 評論(1) 編輯收藏引用所屬分類: 正則表達(dá)式

# re: 正則表達(dá)式簡單資料[未登錄] 2007-12-25 15:43 yy

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

正則表達(dá)式簡單資料

評論

導(dǎo)航

統(tǒng)計(jì)

公告

常用鏈接

留言簿(3)

隨筆分類(32)

隨筆檔案(32)

相冊

最新隨筆

搜索

最新評論

閱讀排行榜

評論排行榜

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理