青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

sunrise

每天不斷學(xué)習(xí),才能不斷提升自己。

  C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
  64 隨筆 :: 0 文章 :: 92 評(píng)論 :: 0 Trackbacks
ps:中文處理經(jīng)驗(yàn)不足,學(xué)習(xí)了。
下面這個(gè)小工具包含了 判斷unicode是否是漢字,數(shù)字,英文,或者其他字符。 全角符號(hào)轉(zhuǎn)半角符號(hào)。 unicode字符串歸一化等工作。 還有一個(gè)能處理多音字的漢字轉(zhuǎn)拼音的程序,還在整理中。
轉(zhuǎn)自:
http://hi.baidu.com/fenghua1893/item/d1a71d5ac47ffdcfd3e10cd1
#!/usr/bin/env python
#
 -*- coding:GBK -*- 
 
"""漢字處理的工具:
判斷unicode是否是漢字,數(shù)字,英文,或者其他字符。
全角符號(hào)轉(zhuǎn)半角符號(hào)。
"""
 
def is_chinese(uchar):
        """判斷一個(gè)unicode是否是漢字"""
        if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
                return True
        else:
                return False
 
def is_number(uchar):
        """判斷一個(gè)unicode是否是數(shù)字"""
        if uchar >= u'\u0030' and uchar<=u'\u0039':
                return True
        else:
                return False
 
def is_alphabet(uchar):
        """判斷一個(gè)unicode是否是英文字母"""
        if (uchar >= u'\u0041' and uchar<=u'\u005a'or (uchar >= u'\u0061' and uchar<=u'\u007a'):
                return True
        else:
                return False
 
def is_other(uchar):
        """判斷是否非漢字,數(shù)字和英文字符"""
        if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):
                return True
        else:
                return False
 
def B2Q(uchar):
        """半角轉(zhuǎn)全角"""
        inside_code=ord(uchar)
        if inside_code<0x0020 or inside_code>0x7e:      #不是半角字符就返回原來的字符
                return uchar
        if inside_code==0x0020: #除了空格其他的全角半角的公式為:半角=全角-0xfee0
                inside_code=0x3000
        else:
                inside_code+=0xfee0
        return unichr(inside_code)
 
def Q2B(uchar):
        """全角轉(zhuǎn)半角"""
        inside_code=ord(uchar)
        if inside_code==0x3000:
                inside_code=0x0020
        else:
                inside_code-=0xfee0
        if inside_code<0x0020 or inside_code>0x7e:      #轉(zhuǎn)完之后不是半角字符返回原來的字符
                return uchar
        return unichr(inside_code)


 
def stringQ2B(ustring):
        """把字符串全角轉(zhuǎn)半角"""
        return "".join([Q2B(uchar) for uchar in ustring])
 
def uniform(ustring):
        """格式化字符串,完成全角轉(zhuǎn)半角,大寫轉(zhuǎn)小寫的工作"""
        return stringQ2B(ustring).lower()
 
def string2List(ustring):
        """將ustring按照中文,字母,數(shù)字分開"""
        retList=[]
        utmp=[]
        for uchar in ustring:
                if is_other(uchar):
                        if len(utmp)==0:
                                continue
                        else:
                                retList.append("".join(utmp))
                                utmp=[]
                else:
                        utmp.append(uchar)
        if len(utmp)!=0:
                retList.append("".join(utmp))
        return retList
 
if __name__=="__main__":
        #test Q2B and B2Q
        for i in range(0x0020,0x007F):
                print Q2B(B2Q(unichr(i))),B2Q(unichr(i))
 
        #test uniform
        ustring=u'中國 人名a高頻A'
        ustring=uniform(ustring)
        ret=string2List(ustring)





        print ret
posted on 2012-08-29 17:47 SunRise_at 閱讀(4180) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 可愛的python
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲一区免费| 欧美色区777第一页| 亚洲资源av| 久久精品国产精品亚洲综合| 亚洲午夜国产成人av电影男同| 亚洲高清资源| 精品999成人| 国产精品美女诱惑| 国产精品任我爽爆在线播放 | 亚洲一二三四久久| 亚洲永久视频| 久久久www成人免费毛片麻豆| 久久精品一区蜜桃臀影院| 久久先锋资源| 中日韩男男gay无套| 欧美一二区视频| 亚洲免费在线观看视频| 久久大逼视频| 国内外成人在线视频| 久久久精品一品道一区| 欧美高清视频www夜色资源网| 欧美三级乱码| 国产亚洲欧美一级| 日韩性生活视频| 久久精品成人一区二区三区| 国产日韩一区| 一区二区三区在线观看视频| 亚洲精品久久| 亚洲淫片在线视频| 欧美激情按摩在线| 亚洲一级黄色片| 欧美亚洲综合久久| 欧美女同视频| 一区二区三区在线观看欧美| 亚洲午夜精品一区二区三区他趣| 欧美在线影院在线视频| 亚洲精品日韩在线观看| 久久成人av少妇免费| 欧美高清视频一区| 亚洲欧美日韩综合aⅴ视频| 久久亚洲电影| 国产亚洲va综合人人澡精品| 亚洲一区自拍| 99综合精品| 欧美激情国产精品| 亚洲成色精品| 久久婷婷一区| 亚洲色图综合久久| 欧美日韩在线播放一区二区| 亚洲大片精品永久免费| 久久视频国产精品免费视频在线| 最新日韩中文字幕| 亚洲婷婷综合色高清在线| 欧美大片在线观看| 亚洲第一区中文99精品| 快射av在线播放一区| 先锋影音网一区二区| 欧美网站在线| 亚洲欧美日韩一区二区| 亚洲日本在线视频观看| 欧美成人嫩草网站| 欧美精品一区视频| 国精产品99永久一区一区| 久久大逼视频| 亚洲精品美女在线| 日韩视频中午一区| 99国产精品一区| 欧美gay视频激情| 国户精品久久久久久久久久久不卡 | 欧美一区二区三区男人的天堂| 亚洲一级黄色片| 亚洲最新合集| 欧美国产日韩一区二区| 国产在线精品自拍| 老司机久久99久久精品播放免费 | 在线观看91久久久久久| 欧美成人伊人久久综合网| 蜜桃视频一区| 亚洲神马久久| 先锋资源久久| 亚洲激情一区二区三区| 亚洲人体一区| 国产精品免费视频观看| 久久久久久久久一区二区| 乱中年女人伦av一区二区| 99精品热视频| 亚洲欧美精品一区| 亚洲高清自拍| 中文日韩在线视频| 国产综合色精品一区二区三区| 葵司免费一区二区三区四区五区| 免费高清在线一区| 亚洲免费视频中文字幕| 亚洲影院免费观看| 国产一区二区三区视频在线观看| 欧美成人午夜| 国产精品欧美日韩| 美国成人直播| 欧美日韩免费高清一区色橹橹| 性xx色xx综合久久久xx| 久久夜色精品亚洲噜噜国产mv| 亚洲七七久久综合桃花剧情介绍| 一区二区国产精品| 在线观看日韩专区| 亚洲黄色尤物视频| 国产精品制服诱惑| 亚洲欧洲一区| 韩国在线视频一区| 亚洲日本激情| 激情欧美日韩| 一区二区三区免费网站| 亚洲国产第一页| 午夜亚洲影视| 亚洲女人小视频在线观看| 久久综合色8888| 久久精品一区二区| 欧美日韩久久| 欧美黄污视频| 国产亚洲美州欧州综合国| 一区二区三区国产在线| 午夜日韩在线观看| 欧美成人按摩| 久久成人18免费网站| 亚洲欧美中文在线视频| 一本一本久久a久久精品综合麻豆| 亚洲国产毛片完整版| 亚洲欧美日韩精品久久亚洲区| 亚洲精品久久久久久久久| 亚洲国产欧美一区| 亚洲天堂成人在线视频| 午夜精品视频一区| 欧美国产综合视频| 亚洲免费大片| 亚洲欧美视频一区| 久久久久久久久久久一区| 最新国产成人在线观看| 日韩视频在线免费| 欧美阿v一级看视频| 米奇777在线欧美播放| 国产一区二区三区日韩欧美| 亚洲综合首页| 西瓜成人精品人成网站| 国产精品美女久久久久久2018| 99视频精品免费观看| 亚洲女女女同性video| 国产精品国产一区二区| 亚洲欧美日韩另类| 久久米奇亚洲| 亚洲国产精品123| 免费观看日韩| 夜夜嗨av色综合久久久综合网 | 影音欧美亚洲| 久久综合伊人77777尤物| 毛片基地黄久久久久久天堂| 亚洲国产精品第一区二区| 欧美阿v一级看视频| 亚洲美女色禁图| 午夜精品电影| 在线国产欧美| 欧美久久久久久久| 亚洲影院在线观看| 久久夜色撩人精品| 日韩网站在线看片你懂的| 欧美色综合天天久久综合精品| 亚洲一级片在线看| 男男成人高潮片免费网站| 99精品福利视频| 国产精品久久久久久久久免费樱桃| 亚洲午夜精品在线| 欧美大片va欧美在线播放| 99精品福利视频| 国产一区二区三区久久 | 狠狠色噜噜狠狠色综合久| 鲁大师成人一区二区三区| 日韩午夜精品| 鲁大师影院一区二区三区| aa级大片欧美三级| 欧美日韩国产一级| 先锋影音国产一区| 亚洲日韩欧美视频一区| 久久久97精品| 国产精品99久久久久久人| 国产精品综合av一区二区国产馆| 亚洲影视九九影院在线观看| 欧美性做爰毛片| 久久久夜夜夜| 亚洲欧美日本另类| 亚洲免费观看高清完整版在线观看熊 | 亚洲少妇一区| 在线播放亚洲| 国产精品九色蝌蚪自拍| 欧美国产欧美亚洲国产日韩mv天天看完整| 日韩一区二区久久| 欧美激情视频免费观看| 久久精品99久久香蕉国产色戒| 国产亚洲高清视频| 欧美日韩播放| 欧美激情一区| 久久久蜜桃精品| 先锋影音网一区二区|