• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            woaidongmao

            文章均收錄自他人博客,但不喜標(biāo)題前加-[轉(zhuǎn)貼],因其丑陋,見諒!~
            隨筆 - 1469, 文章 - 0, 評(píng)論 - 661, 引用 - 0
            數(shù)據(jù)加載中……

            利用正則表達(dá)式排除特定字符串

            1.例子,查找不以baidu開頭的字符串。
            baidu.com
            sina.com.cn

            正則:^(?!baidu).*$  匹配結(jié)果就是第2行,也就是第1行被排除了
            這里使用了零寬度斷言(?!exp),注意,我們有一個(gè)向前查找的語(yǔ)法(也叫順序環(huán)視)  (?=exp)
            (?=exp) 會(huì)查找exp之前的【位置】如果將等號(hào)換成感嘆號(hào),就變成了否定語(yǔ)義,也就是說查找的位置的后面不能是exp
            一般情況下?!要與特定的錨點(diǎn)相結(jié)合,例如^行開頭或者$行結(jié)尾,那么上面的例子的意思如下:
            ^(?!baidu).*$ 先匹配一個(gè)行開頭的位置,并且要求接下來的位置的后面不是baidu這個(gè)字符串。這樣由于第一行^之后的位置后面是baidu所以匹配失敗,被排除在外了。

            2.例子,查找不以com結(jié)尾的字符串。
            www.sina.com.cn
            www.educ.org
            www.hao.cc
            www.baidu.com
            www.123.com

            正則 ^.*?(?<!com)$  匹配前3行結(jié)果。
            如果查找以com結(jié)尾的字符串則使用正則 ^.*?(?<=com)$或者 ^.*?com$  
            對(duì)正則表達(dá)式的解釋:^.*?(?<!com)$
            首先匹配行開頭,然后是 .*? 這個(gè)是忽略優(yōu)先,也就是優(yōu)先忽略不匹配任何字符,(?<!com) 這個(gè)是一個(gè)逆序環(huán)視的否定形式,意思是匹配一個(gè)位置此位置的前面不能是字符串com,最后是一個(gè)行結(jié)束。對(duì)于www.123.com來說,首先匹配行首,接著匹配w后面的位置,發(fā)現(xiàn)前面不是com,所以成功但緊接著要匹配行尾,失敗,回溯讓.*? 匹配一個(gè)w符號(hào),接著(?<com)匹配第二個(gè)w后面的位置,發(fā)現(xiàn)前面也不是com匹配成功,緊接著要匹配$對(duì)應(yīng)的行尾失敗,一直到.*?匹配了www.baidu.com的時(shí)候,此時(shí)(?<!com)匹配m后面的位置,此時(shí)此位置的前面是com匹配直接失敗,接著.*?匹配行末尾,(?<!com)匹配$后面的位置,顯然這次也失敗了,所以整個(gè)全局匹配都失敗。  www.123.com被排除到匹配之外。這里的.*后面加不加問號(hào)結(jié)果都一樣。

            3.例子查找不含有if的行
            if (a>b)
            printf("hello");
            else if(a<b)
            printf("hello2");
            else
            printf("hello3");

            正則 ^([^f]|[^i]f)+$
            其實(shí)這個(gè)匹配也是一個(gè)排除型字符串的匹配,但是不同于上面兩種,因?yàn)檫@里的if可能既不在行開頭,也不在行結(jié)尾,而是在字符串中間這樣就給匹配帶來了麻煩,在正則表達(dá)式中沒有提供類似排除的功能。我們最容易想到的就是下面的正則:
            ^[^if]+$ 這種寫法看起來是那么回事,但是排除型字符組排除的是i和f兩個(gè)字符,而不是if這個(gè)字符串,所以這個(gè)正則表達(dá)式匹配的是那些既沒有i字符也不包含f字符的字符串。但是如果字符串中有一個(gè)i或多個(gè)i或者有一個(gè)或多個(gè)f,或者i和f字符都有只不過沒有連在一起。這些情況都是我們需要匹配的情況,而我們不能匹配的情況是那些包含if字符串的行,而不是包含i或f字符的行,所以這種寫法漏洞很大。

            ^.*(?!if).*$ 這種寫法使用了零寬度斷言,表面意思看起來好像是說 任意字符+非if+任意字符 組成了整個(gè)字符串,但是仔細(xì)研究匹配過程就知道這個(gè)是錯(cuò)的,(?if)匹配的是一個(gè)位置,所以對(duì)于字符串a(chǎn)ifb他也是可以匹配到的,而實(shí)際上這樣的字符正是我們不要的。按照這個(gè)正則表達(dá)式,對(duì)于aifb 首先匹配行首,其次.*是貪婪模式(匹配優(yōu)先),會(huì)一直匹配到字符串的末尾(此時(shí)傳動(dòng)裝置定位在$位置前面),此時(shí)(?!if)需要匹配一個(gè)位置,這個(gè)位置的后面不能是if,這個(gè)時(shí)候正好位置在b字符的后面,符合匹配條件,緊接著匹配行尾,到這里整個(gè)全局匹配成功。

            也就是說對(duì)于一個(gè)字符串例如我要排除abc這個(gè)字串,那么對(duì)于任意一個(gè)字符串   helloworld abc helloworld 在匹配的時(shí)候(?!abc)可以匹配h、e、l、l、o、w、o、r、l、d等這些字符后面的位置,都是成功的。所以匹配根本還沒有進(jìn)行到abc這個(gè)地方,(?!abc)就會(huì)匹配成功。這個(gè)時(shí)候根本起不到排除的作用,為什么上面的第1和第2個(gè)例子可以呢,因?yàn)樗麄兊奈恢糜行惺缀托形蚕薅?。例如我要匹配行首不是abc的話,那么此時(shí)^(?!abc) 這個(gè)時(shí)候(?!abc)實(shí)際上在匹配的時(shí)候其傳動(dòng)裝置的位置被行首進(jìn)行了限定,所以對(duì)于那些以abc開頭的字符串來說就會(huì)匹配失敗了。

            對(duì)于正則表達(dá)式^.*(?!abc).*$怎么能讓第一個(gè).*匹配到 helloworldabcxxx中的helloworld的問題。

            對(duì)于上面的題目,我們的答案是^([^f]|[^i]f)+$  其實(shí)就將所有的匹配分成了2種情況,一種情況是假設(shè)字符串中沒有f字符,    自然就不可能有if字符串了,這種情況下匹配的字符串中是不可能有if的。第二種情況就是有f字符,但是我們要求此時(shí)f的前面不能是i,所以在有f和沒有f兩種情況都考慮到的情況下,這個(gè)正則就應(yīng)該可以滿足所有的情況了。

            其實(shí)這個(gè)問題的解答是不完美的,對(duì)于排除的字符串if只有2個(gè)字符i和f字符,我們可以使用這種方式,但是如果我們要排除的是字符串helloworld,這種方法顯然就不實(shí)用了,那要考慮到多少種情況呢?

            在這種情況下我們使用  ^(?!.*helloworld).*$  正則表達(dá)式  我們將第一個(gè).*移到了零寬度斷言的里面。在匹配的時(shí)候首先匹配行首的位置,然后接下來是匹配行首后面的位置,要求此位置的后面不能是    .*helloworld 匹配的字符串,說白了要求此位置的后面不能是xxxxxxxxxxxxxxxxxxhelloworld 類似的字符串,這樣就排除了從行首開始后面含有helloworld的情況了。

            posted on 2013-04-18 11:15 肥仔 閱讀(3223) 評(píng)論(4)  編輯 收藏 引用 所屬分類: 正則表達(dá)式

            評(píng)論

            # re: 利用正則表達(dá)式排除特定字符串  回復(fù)  更多評(píng)論   

            不以com結(jié)尾:^.*?(?<!com)$ 正確應(yīng)該是^.*?(?!com)$
            2013-06-09 15:34 | argb

            # re: 利用正則表達(dá)式排除特定字符串  回復(fù)  更多評(píng)論   

            樓主貌似把順序環(huán)視和逆序環(huán)視搞混了
            2013-06-09 15:35 | argb

            # re: 利用正則表達(dá)式排除特定字符串  回復(fù)  更多評(píng)論   

            某些情況下look around不太好用 例如 “一對(duì)引號(hào)左邊不是xxx” 的情況。一個(gè)字符串中有多個(gè)這種 xxx "yyyy" 的情況下會(huì)得到錯(cuò)誤的處理。簡(jiǎn)單情況下或許還好。不過大部分語(yǔ)言不支持lookbehind.
            2013-06-09 15:43 | argb

            # re: 利用正則表達(dá)式排除特定字符串  回復(fù)  更多評(píng)論   

            這是很好的知道還是有一個(gè)網(wǎng)站,提供了很多的信息,以饗讀者。
            2014-02-04 16:00 | 雅虎
            久久亚洲美女精品国产精品| 狠狠色丁香久久婷婷综合蜜芽五月| 色狠狠久久综合网| 97久久国产综合精品女不卡| 精品少妇人妻av无码久久| 国内精品久久久久久麻豆| 伊人色综合久久天天网| 精品乱码久久久久久久| 四虎亚洲国产成人久久精品| 色综合久久久久综合体桃花网| 999久久久免费国产精品播放| 亚洲国产香蕉人人爽成AV片久久| 久久亚洲精品成人AV| 久久嫩草影院免费看夜色| 2021久久精品国产99国产精品| 日韩欧美亚洲综合久久影院Ds| 粉嫩小泬无遮挡久久久久久| 久久亚洲高清综合| 曰曰摸天天摸人人看久久久| 久久精品国产亚洲αv忘忧草| 国产精品熟女福利久久AV| 久久久精品国产sm调教网站 | 久久这里有精品| 中文字幕亚洲综合久久| 蜜臀久久99精品久久久久久小说 | 久久久久久亚洲精品成人| 久久丝袜精品中文字幕| 99久久精品国产免看国产一区| 99久久夜色精品国产网站| 伊人久久亚洲综合影院| 久久伊人中文无码| 亚洲成av人片不卡无码久久| 国产日韩久久免费影院| 精品久久久无码中文字幕天天| 久久精品国产99国产精品澳门| 午夜不卡久久精品无码免费| 久久久久se色偷偷亚洲精品av | 亚洲人成无码网站久久99热国产| 久久se精品一区精品二区国产| 久久久久四虎国产精品| 51久久夜色精品国产|