青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

sunrise

每天不斷學(xué)習(xí),才能不斷提升自己。

  C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
  64 隨筆 :: 0 文章 :: 92 評(píng)論 :: 0 Trackbacks
ps:中文處理經(jīng)驗(yàn)不足,學(xué)習(xí)了。
下面這個(gè)小工具包含了 判斷unicode是否是漢字,數(shù)字,英文,或者其他字符。 全角符號(hào)轉(zhuǎn)半角符號(hào)。 unicode字符串歸一化等工作。 還有一個(gè)能處理多音字的漢字轉(zhuǎn)拼音的程序,還在整理中。
轉(zhuǎn)自:
http://hi.baidu.com/fenghua1893/item/d1a71d5ac47ffdcfd3e10cd1
#!/usr/bin/env python
#
 -*- coding:GBK -*- 
 
"""漢字處理的工具:
判斷unicode是否是漢字,數(shù)字,英文,或者其他字符。
全角符號(hào)轉(zhuǎn)半角符號(hào)。
"""
 
def is_chinese(uchar):
        """判斷一個(gè)unicode是否是漢字"""
        if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
                return True
        else:
                return False
 
def is_number(uchar):
        """判斷一個(gè)unicode是否是數(shù)字"""
        if uchar >= u'\u0030' and uchar<=u'\u0039':
                return True
        else:
                return False
 
def is_alphabet(uchar):
        """判斷一個(gè)unicode是否是英文字母"""
        if (uchar >= u'\u0041' and uchar<=u'\u005a'or (uchar >= u'\u0061' and uchar<=u'\u007a'):
                return True
        else:
                return False
 
def is_other(uchar):
        """判斷是否非漢字,數(shù)字和英文字符"""
        if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):
                return True
        else:
                return False
 
def B2Q(uchar):
        """半角轉(zhuǎn)全角"""
        inside_code=ord(uchar)
        if inside_code<0x0020 or inside_code>0x7e:      #不是半角字符就返回原來的字符
                return uchar
        if inside_code==0x0020: #除了空格其他的全角半角的公式為:半角=全角-0xfee0
                inside_code=0x3000
        else:
                inside_code+=0xfee0
        return unichr(inside_code)
 
def Q2B(uchar):
        """全角轉(zhuǎn)半角"""
        inside_code=ord(uchar)
        if inside_code==0x3000:
                inside_code=0x0020
        else:
                inside_code-=0xfee0
        if inside_code<0x0020 or inside_code>0x7e:      #轉(zhuǎn)完之后不是半角字符返回原來的字符
                return uchar
        return unichr(inside_code)


 
def stringQ2B(ustring):
        """把字符串全角轉(zhuǎn)半角"""
        return "".join([Q2B(uchar) for uchar in ustring])
 
def uniform(ustring):
        """格式化字符串,完成全角轉(zhuǎn)半角,大寫轉(zhuǎn)小寫的工作"""
        return stringQ2B(ustring).lower()
 
def string2List(ustring):
        """將ustring按照中文,字母,數(shù)字分開"""
        retList=[]
        utmp=[]
        for uchar in ustring:
                if is_other(uchar):
                        if len(utmp)==0:
                                continue
                        else:
                                retList.append("".join(utmp))
                                utmp=[]
                else:
                        utmp.append(uchar)
        if len(utmp)!=0:
                retList.append("".join(utmp))
        return retList
 
if __name__=="__main__":
        #test Q2B and B2Q
        for i in range(0x0020,0x007F):
                print Q2B(B2Q(unichr(i))),B2Q(unichr(i))
 
        #test uniform
        ustring=u'中國 人名a高頻A'
        ustring=uniform(ustring)
        ret=string2List(ustring)





        print ret
posted on 2012-08-29 17:47 SunRise_at 閱讀(4180) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 可愛的python
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            狠狠色噜噜狠狠狠狠色吗综合| 狠狠色噜噜狠狠狠狠色吗综合| 亚洲精品国产精品国产自| 欧美日韩日日骚| 欧美一区网站| 亚洲毛片播放| 夜夜嗨av一区二区三区四区| 91久久精品www人人做人人爽| 国产精品美女一区二区| 欧美性色视频在线| 国产欧美三级| 在线精品国产欧美| 亚洲精品永久免费精品| 99视频日韩| 午夜精品久久| 久久夜色精品国产| 亚洲国产精品久久精品怡红院| 欧美高清一区二区| 激情欧美亚洲| 亚洲电影在线免费观看| 亚洲免费观看高清完整版在线观看| 国产区在线观看成人精品| 国产精品高清在线| 欧美午夜不卡视频| 欧美视频免费在线观看| 国产精品欧美精品| 国产精品免费网站在线观看| 国产精品日韩欧美一区二区三区 | 99国产精品视频免费观看一公开 | 欧美日韩卡一卡二| 欧美激情bt| 国产精品爽爽ⅴa在线观看| 一区久久精品| 午夜视频久久久久久| 亚洲国产精品一区二区第四页av | 亚洲精品欧洲| 久久精品91久久香蕉加勒比| 最近看过的日韩成人| 欧美一级网站| 欧美日本一区二区三区| 亚洲第一毛片| 久久久久成人网| 一区二区三区高清在线| 欧美成年视频| 亚洲电影av| 久久久亚洲成人| 亚洲欧美日韩国产一区| 欧美日韩专区在线| 亚洲精选国产| 欧美不卡一区| 欧美一区二区在线观看| 国产精品九色蝌蚪自拍| 亚洲精品一区二区网址| 欧美黑人国产人伦爽爽爽| 欧美在线91| 国产日韩欧美a| 欧美亚洲免费高清在线观看| 一区二区三区你懂的| 欧美精品在线观看播放| 91久久精品国产91久久性色tv| 狼狼综合久久久久综合网| 久久av资源网站| 国产一区二区激情| 久久婷婷人人澡人人喊人人爽| 欧美亚洲在线播放| 国产午夜亚洲精品不卡| 久久人人爽人人| 免费成人高清视频| 亚洲日本电影在线| 亚洲人久久久| 欧美性猛交xxxx乱大交蜜桃| 亚洲一区影音先锋| 欧美成ee人免费视频| 国产一区二区三区四区老人| 亚洲专区一区二区三区| 欧美精品v日韩精品v国产精品 | 精品成人一区二区| 久久久国产精品亚洲一区| 久久久久久久精| 亚洲毛片在线免费观看| 国产一区在线视频| 亚洲欧洲日产国码二区| 久久成人综合网| 黄色成人在线观看| 免费观看在线综合| 欧美激情第4页| 性欧美videos另类喷潮| 久久久久久噜噜噜久久久精品| 在线精品福利| 亚洲理伦在线| 国产欧美一区二区三区另类精品 | 最新日韩av| 99riav1国产精品视频| 国产一区二区丝袜高跟鞋图片| 欧美激情一区二区在线| 国产精品久久久久av| 老牛国产精品一区的观看方式| 欧美精品乱码久久久久久按摩| 先锋影音国产一区| 欧美11—12娇小xxxx| 午夜在线视频观看日韩17c| 久热精品视频在线| 亚洲欧美日韩精品久久奇米色影视| 午夜在线视频一区二区区别| 亚洲国产日韩一区| 亚洲欧美激情视频在线观看一区二区三区| 尤物精品国产第一福利三区| 日韩午夜电影在线观看| 极品少妇一区二区三区精品视频| 亚洲黄色在线| 国产欧美亚洲精品| 亚洲精品欧美激情| 亚洲高清网站| 久久精品久久99精品久久| 亚洲欧美日韩国产综合精品二区| 久久综合导航| 久久天天躁狠狠躁夜夜av| 国产精品扒开腿做爽爽爽视频| 欧美大片网址| 红桃视频成人| 午夜视频久久久久久| 亚洲亚洲精品在线观看| 欧美久久在线| 亚洲黄色小视频| 亚洲精品影院| 欧美激情综合亚洲一二区| 免费欧美高清视频| 精品99一区二区三区| 日韩一级不卡| 欧美成人免费va影院高清| 久久久青草婷婷精品综合日韩| 国产精品久久777777毛茸茸| 亚洲美女av在线播放| 亚洲理论在线观看| 欧美成人免费视频| 亚洲国产另类久久久精品极度| 亚洲电影在线看| 久久亚洲精品伦理| 麻豆乱码国产一区二区三区| 国内伊人久久久久久网站视频| 午夜精品久久久久久99热| 午夜精品久久久久久99热软件| 国产精品福利在线| 日韩一级免费| 欧美大片免费观看在线观看网站推荐| 欧美va日韩va| 亚洲精品视频在线播放| 欧美激情一区二区久久久| 亚洲日本在线观看| 亚洲砖区区免费| 国产亚洲精品aa午夜观看| 欧美中文字幕第一页| 欧美本精品男人aⅴ天堂| 日韩一级片网址| 国产欧美精品一区二区色综合| 欧美资源在线| 亚洲日韩欧美视频一区| 亚洲一区二区三区四区五区午夜| 国产精品99免费看| 久久福利一区| 亚洲国产欧美日韩精品| 亚洲自拍偷拍色片视频| 国产综合激情| 欧美激情影音先锋| 亚洲尤物在线| 欧美高清日韩| 性欧美videos另类喷潮| 尤物yw午夜国产精品视频| 欧美日本国产精品| 性欧美video另类hd性玩具| 欧美www视频在线观看| 亚洲天堂偷拍| 激情综合色综合久久| 欧美日韩国产丝袜另类| 欧美在线视频在线播放完整版免费观看 | 久久www成人_看片免费不卡| 欧美成人xxx| 午夜精品免费在线| 亚洲日韩欧美视频一区| 国产女主播一区二区| 欧美成人一品| 欧美一区二区三区的| 91久久精品一区二区三区| 久久精品国产99| 亚洲一区二区免费在线| 亚洲国产精品一区二区第四页av| 欧美午夜宅男影院| 欧美成人精品在线观看| 久久精品夜夜夜夜久久| 亚洲午夜激情网站| 亚洲三级网站| 欧美va亚洲va国产综合| 久久精品中文字幕一区| 亚洲一区二区三区乱码aⅴ| 亚洲精品美女在线观看播放| 一区二区在线免费观看| 国产欧美日韩另类视频免费观看| 欧美日韩性生活视频| 欧美成人一区二区| 久久精品人人做人人爽|