精品成人在线视频,99人久久精品视频最新地址,国产视频在线观看一区二区三区

別讀成痞子高

教程精選：正則表達(dá)式快速入門（三）

作者：開心石頭

　　在上文里，我們介紹了正則表達(dá)式的子模式，逆向引用和量詞，在這篇文章里，我們將重點(diǎn)介紹正則表達(dá)式中的斷言(Assertions)。

　　斷言(Assertions)

　　斷言(Assertions)是在目標(biāo)字符串的當(dāng)前匹配位置進(jìn)行的一種測試但這種測試并不占用目標(biāo)字符串，也即不會(huì)移動(dòng)模式在目標(biāo)字符串中的當(dāng)前匹配位置。

　　讀起來似乎有點(diǎn)拗口，我們還是舉幾個(gè)簡單的例子。

　　兩個(gè)最常見的斷言是元字符“^”和“$”，它們檢查匹配模式是否出現(xiàn)在行首或行尾。

　　我們來看這個(gè)模式/^\d\d\d$/，試著用它來匹配目標(biāo)字符串“123”。“\d\d\d”表示三個(gè)數(shù)字字符，匹配了目標(biāo)字符串的三個(gè)字符，而模式中的^和$分別表示這三個(gè)字符同時(shí)出現(xiàn)在行首和行尾，而它們本身并不與目標(biāo)字符串中的任何字符相對(duì)應(yīng)。

　　其它還有一些簡單的斷言\b, \B, \A, \Z, \z，它們都以反斜線開頭，前面我們已經(jīng)介紹過反斜線的這個(gè)用法。這幾個(gè)斷言的含義如下表。

斷言

含義

\b

字分界線

\B

非字分界線

\A

目標(biāo)的開頭（獨(dú)立于多行模式）

\Z

目標(biāo)的結(jié)尾或位于結(jié)尾的換行符前（獨(dú)立于多行模式）

\z

目標(biāo)的結(jié)尾（獨(dú)立于多行模式）

\G

目標(biāo)中的第一個(gè)匹配位置

　　注意這些斷言不能出現(xiàn)在字符類中，如果出現(xiàn)了也是其它的含義，例如\b在字符類中表示反斜線字符0x08。

　　前面介紹的這些斷言的測試都是一些基于當(dāng)前位置的測試，斷言還支持更多復(fù)雜的測試條件。更復(fù)雜的斷言以子模式方式來表示，它包括前向斷言(Lookahead assertions)和后向斷言(Lookbehind assertions)。

　　前向斷言(Lookahead assertions)

　　前向斷言從目標(biāo)字符串的當(dāng)前位置向前測試斷言條件是否成立。前向斷言又可分為前向肯定斷言和前向否定斷言，分別用(?=和{?!表示。例如模式/ \w+(?=;)/用來表示一串文本字符后面會(huì)有一個(gè)分號(hào)，但是這個(gè)分號(hào)并不包括在匹配結(jié)果中。一件有趣的事看起來差不多的模式/ (?=;)\w+/并不是表示一串前面不是分號(hào)的alpha字符串，事實(shí)上，不論這串a(chǎn)lpha字符的前面是否是一個(gè)分號(hào)它總是匹配的，要完成這個(gè)功能需要我們下面提到的后向斷言(Lookbehind assertions)。

　　后向斷言(Lookbehind assertions)

　　后向斷言分別用(?<=和(?<!表示肯定的后向斷言與否定后向斷言。例如，/ (?<!foo)bar/將尋找一個(gè)前面不是foo的bar字符串。一般而言，后向斷言使用的子模式需要有確定的長度值，否則會(huì)產(chǎn)生一個(gè)編譯錯(cuò)誤。

　　使用后向斷言與一次性子模式搭配使用可以有效的文本的結(jié)束部分進(jìn)行匹配，這里來看一下例子。

　　考慮一下如果用/abcd$/這樣一個(gè)簡單的模式來匹配一長段以abcd結(jié)尾的文本，因?yàn)槟Ｊ降钠ヅ溥^程是從左向右進(jìn)行的，正則表達(dá)式引擎將在文本中尋找每一個(gè)a字符并嘗試匹配剩余的模式，如果在這長段文本里僅好有不少的a字符，這樣做明顯是非常低效的，而如果把以上模式換成為樣/^.*abcd$/，這時(shí)前面的“^.*”部分將匹配整個(gè)文本，然后它發(fā)現(xiàn)下一個(gè)模式a無法匹配，這時(shí)會(huì)發(fā)生前面提到過的回溯過程，解析器會(huì)逐次縮短“^.*”匹配的字符長度從右向左逐次查找剩余的子模式，也要產(chǎn)生多次的嘗試過程?，F(xiàn)在，我們用一次性子模式與后向斷言重寫所用的模式，改為/^(?>.*)(?<=abcd)/，這時(shí)，一次性子模式一次匹配了整段文本，然后用后向斷言檢查前面四個(gè)字符是否為abcd，只需要一次檢測就可以立刻確定整個(gè)模式是否匹配。在遇到需要匹配一個(gè)很長的文本時(shí)，這種方法可以非常顯著的提高處理效率。

　　一個(gè)模式中可以包含多個(gè)相繼的斷言，斷言也可以嵌套。另外，斷言使用的子模式也是非捕獲的，不能被逆向引用。

　　斷言的一個(gè)重要應(yīng)用領(lǐng)域就是做為條件子模式的條件。那什么是條件子模式呢？

　　條件子模式(Conditional subpatterns)

　　正則表達(dá)式允許在模式中根據(jù)不同的條件使用不同的匹配子模式。也就是條件子模式(Conditional subpatterns)。它的格式如下:(?(condition)yes-pattern)或者 (?(condition)yes-pattern|no-pattern)。如果條件滿足，采用yes-pattern，否則，采用no-pattern(如果在模式中提供了話)。

　　條件子模式中的條件有兩種，一種是斷言結(jié)果，另一種是看是否捕獲一個(gè)前面提供的子模式。

　　如果在表示條件的圓括號(hào)里的內(nèi)容是一個(gè)數(shù)字，它表示當(dāng)此數(shù)字代表的子模式被成功匹配時(shí)條件為真。看看下面這個(gè)例子，/( $ )? [^()]+ (?(1) $ )/x，(注意“x”模式修正符表示忽略字符類外的空白字符和#符號(hào)之后的內(nèi)容)。

　　這個(gè)模式的第一部分“( $ )?”匹配了一個(gè)可選的左圖括號(hào)“(”，第二部分“[^()]+”匹配了一個(gè)以上的非圓括號(hào)字符，最后一部分“(?(1) $ )”是個(gè)條件子模式，表示如果捕獲到\1也即那個(gè)可選的左圓括號(hào)，第三部分應(yīng)該會(huì)出現(xiàn)一個(gè)右圓括號(hào)“)”。

　　如果在表示條件的圓括號(hào)內(nèi)是一個(gè)“R”字符，表示在這個(gè)模式或子模式被遞歸調(diào)用時(shí)條件為真，在遞歸調(diào)用的頂層，這個(gè)條件為假。關(guān)于正則表達(dá)式中的遞歸，我們會(huì)在后面的部分專題介紹。

　　如果條件不是一個(gè)數(shù)字或R字符，則它必需是一個(gè)斷言。斷言可以是肯定或否定的前身或后向斷言。讓我們看下面這個(gè)例子。

　　/(?(?=[^a-z]*[a-z])

　　\d{2}-[a-z]{3}-\d{2} | \d{2}-\d{2}-\d{2} )/x

　　為了讓這個(gè)正則表達(dá)式更容易閱讀，我們特意采用了x模式修正符，這樣我們可以在用模式中加入空格對(duì)符式進(jìn)行格式上的分隔并分行表示而不影響模式的解析。

　　第一行的條件子模式使用了一個(gè)肯定的前向斷言，表示一串可選的非小寫字母后面跟隨著一個(gè)小寫字母。換句話說，它查看目標(biāo)字符串是否至少包含一個(gè)小寫字母，如果是，它用“|”前的模式對(duì)目標(biāo)進(jìn)行匹配，看目標(biāo)是否為看目標(biāo)是否為兩個(gè)數(shù)字-三個(gè)小寫字母-兩個(gè)數(shù)字這種格式，否則，用“|”來匹配目標(biāo)，看目標(biāo)字符串是否為由“-”分隔的三段二位十進(jìn)制數(shù)字。

　　正則表達(dá)式中的注釋

　　為了讓正則表達(dá)式更容易閱讀，可以在其中加入注釋語句。通常注釋由左圓括號(hào)和井號(hào)——“(#“開始，當(dāng)遇到下一個(gè)右圓括號(hào)”)“結(jié)束。注釋是禁止嵌套的。

　　如果設(shè)定了“x”模式修正符，任何字符類之外(也即[]之外)的井號(hào)(#)和下一個(gè)新行標(biāo)記之間的部分也被作為注釋看待。

　　未完待續(xù)

posted on 2007-04-22 17:17 PeakGao 閱讀(344) 評(píng)論(0) 編輯收藏引用所屬分類: php

只有注冊用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 教程精選：正則表達(dá)式快速入門（三）教程精選：正則表達(dá)式快速入門（二）教程精選：正則表達(dá)式快速入門（一）學(xué)習(xí)筆記一：學(xué)用mootools的Ajax對(duì)象老外用php寫的一個(gè)MySQL類有關(guān)于 set_magic_quotes_runtime 在PHP的系統(tǒng)函數(shù)前加@是什么意思？用php實(shí)現(xiàn)url轉(zhuǎn)向

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

<

2007年4月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

31

1

2

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

導(dǎo)航

統(tǒng)計(jì)

隨筆 - 65
文章 - 0
評(píng)論 - 80
引用 - 0

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

教程精選：正則表達(dá)式快速入門（三）

導(dǎo)航

統(tǒng)計(jì)

常用鏈接

留言簿(9)

隨筆分類(67)

隨筆檔案(65)

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

斷言	含義
\b	字分界線
\B	非字分界線
\A	目標(biāo)的開頭（獨(dú)立于多行模式）
\Z	目標(biāo)的結(jié)尾或位于結(jié)尾的換行符前（獨(dú)立于多行模式）
\z	目標(biāo)的結(jié)尾（獨(dú)立于多行模式）
\G	目標(biāo)中的第一個(gè)匹配位置