青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

  最近在用VC++開發一個小工具,平時用慣了.NET,用起VC++最郁悶的就是字符串處理。當然最最讓人難于琢磨的就是字符集,編碼之間的轉換。通過這幾天的研究,終于明白了Unicode和UTF-8之間編碼的區別。Unicode是一個字符集,而UTF-8是Unicode的其中一種,Unicode是定長的都為雙字節,而UTF-8是可變的,對于漢字來說Unicode占有的字節比UTF-8占用的字節少1個字節。Unicode為雙字節,而UTF-8中漢字占三個字節。
                        網魂小兵 http://xdotnet.cnblogs.com
    UTF-8編碼字符理論上可以最多到6個字節長,然而16位BMP(Basic Multilingual Plane)字符最多只用到3字節長。下面看一下UTF-8編碼表:

        U-00000000 - U-0000007F: 0xxxxxxx
        U-00000080 - U-000007FF: 110xxxxx 10xxxxxx
        U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
        U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
        U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
        U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

    xxx 的位置由字符編碼數的二進制表示的位填入, 越靠右的 x 具有越少的特殊意義,只用最短的那個足夠表達一個字符編碼數的多字節串。 注意在多字節串中, 第一個字節的開頭"1"的數目就是整個串中字節的數目。而第一行中以0開頭,是為了兼容ASCII編碼,為一個字節,第二行就為雙字節字符串,第三行為3字節,如漢字就屬于這種,以此類推。(個人認為:其實我們可以簡單的把前面的1的個數看成字節數)
                         網魂小兵 http://xdotnet.cnblogs.com
    為了要將Unicode轉換為UTF-8,當然要知道他們的區別到底在什么地方。下面來看一下,在Unicode中的編碼是怎樣轉換成UTF-8的,在UTF-8中,如果一個字符的字節小于0x80(128)則為ASCII字符,占一個字節,可以不用轉換,因為UTF-8兼容ASCII編碼。假如在Unicode中漢字“你”的編碼為“u4F60”,把它轉換為二進制為100111101100000,然后按照UTF-8的方法進行轉換。可以將Unicode二進制從地位往高位取出二進制數字,每次取6位,如上述的二進制就可以分別取出為如下所示的格式,前面按格式填補,不足8位用0填補。

      
           unicode:  100111101100000                  4F60

           utf-8:    11100100,10111101,10100000       E4BDA0


    從上面就可以很直觀的看出Unicode到UTF-8之間的轉換,當然知道了UTF-8的格式后,就可以進行逆運算,就是按照格式把它在二進制中的相應位置上取出,然后在轉換就是所得到的Unicode字符了(這個運算可以通過“位移”來完成)。
                      網魂小兵 http://xdotnet.cnblogs.com
    如上述的“你”的轉換,由于其值大于0x800小于0x10000,因此可以判斷為三字節存儲,則最高位需要向右移“12”位再根據三字節格式的最高位為11100000(0xE0)求或(|)就可以得到最高位的值了。同理第二位則是右移“6”位,則還剩下最高位和第二位的二進制值,可以通過與111111(0x3F)求按位于(&)操作,再和11000000(0x80)求或(|)。第三位就不用移位了,只要直接取最后六位(與111111(ox3F)取&),在與11000000(0x80)求或(|)。OK了,轉換成功!在VC++中的代碼如下所示(Unicode到UTF-8的轉換)。

        1 const wchar_t pUnicode = L"你";
        2 char utf8[3+1];
        3 memset(utf8,0,4);
        4 utf8[0] = 0xE0|(pUnicode>>12);
        5 utf8[1] = 0x80|((pUnicode>>6)&0x3F);
        6 utf8[2] = 0x80|(pUnicode&0x3F);
        7 utf8[3] = "\0";
        8 //char[4]就是UTF-8的字符“你”了。

    當然在UTF-8到Unicode的轉換也是通過移位等來完成的,就是把UTF-8那些格式相應的位置的二進制數給揪出來。在上述例子中“你”為三個字節,因此要每個字節進行處理,有高位到低位進行處理。在UTF-8中“你”為11100100,10111101,10100000。從高位起即第一個字節11100100就是把其中的"0100"給取出來,這個很簡單只要和11111(0x1F)取與(&),由三字節可以得知最到位肯定位于12位之前,因為每次取六位。所以還要將得到的結果左移12位,最高位也就這樣完成了0100,000000,000000。而第二位則是要把“111101”給取出來,則只需將第二字節10111101和111111(0x3F)取與(&)。在將所得到的結果左移6位與最高字節所得的結果取或(|),第二位就這樣完成了,得到的結果為0100,111101,000000。以此類推最后一位直接與111111(0x3F)取與(&),再與前面所得的結果取或(|)即可得到結果0100,111101,100000。OK,轉換成功!在VC++中的代碼如下所示(UTF-8到Unicode的轉換)。

    1 //UTF-8格式的字符串
    2 const char* utf8 = "你";
    3 wchar_t unicode;
    4 unicode = (utf8[0] & 0x1F) << 12;
    5 unicode |= (utf8[1] & 0x3F) << 6;
    6 unicode |= (utf8[2] & 0x3F);
    7 //unicode is ok!
                            網魂小兵 http://xdotnet.cnblogs.com
    當然在編程過程中不可能只轉換一個字符,這里需要注意的是字符的長度一定要算清楚,不然會帶來...以上就是我這幾天研究的結果,至于Unicode的轉換為GB2312在MFC中Windows有自帶的API(WideCharToMultiByte)可以轉換。這樣也就能夠將UTF-8格式轉換為GB2312了,這里就不再贅述,如果大家有更好的方法希望指教。
Posted on 2011-11-20 13:52 鄭興鋒 閱讀(372) 評論(0)  編輯 收藏 引用
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美大胆a视频| 韩日精品视频| 欧美一级成年大片在线观看| 最新69国产成人精品视频免费| 午夜精品理论片| 香蕉国产精品偷在线观看不卡| 亚洲综合视频1区| 亚洲免费视频成人| 久久久水蜜桃| 欧美成人亚洲成人| 亚洲日本免费| 亚洲免费综合| 久久久久国产精品一区三寸| 久久久一本精品99久久精品66| 男男成人高潮片免费网站| 欧美黄色一区| 国产精品私人影院| 在线观看欧美成人| 亚洲精品国产精品国自产观看浪潮 | 亚洲黄色在线看| 一区二区欧美精品| 欧美一区1区三区3区公司| 老司机精品视频网站| 欧美三级视频| 在线观看日产精品| 亚洲午夜一区二区| 欧美gay视频激情| av成人免费在线观看| 久久琪琪电影院| 国产女优一区| 99re6这里只有精品| 久久理论片午夜琪琪电影网| 91久久在线| 久久久久久久综合狠狠综合| 国产精品国色综合久久| 亚洲国产激情| 久久精品国语| 亚洲影院在线| 欧美日韩精品久久| 亚洲黄色在线观看| 久久国产婷婷国产香蕉| 亚洲毛片在线免费观看| 久久这里只有| 国产曰批免费观看久久久| 中文欧美在线视频| 亚洲黄色视屏| 久久视频在线视频| 久久激情中文| 久久国产免费看| 一区二区av在线| 欧美成人福利视频| 在线日韩精品视频| 久久久久女教师免费一区| 亚洲午夜在线观看| 欧美日韩成人在线播放| 亚洲伦理久久| 亚洲国产日韩欧美在线99| 美女网站久久| 亚洲国产91| 欧美激情第五页| 久久综合狠狠综合久久激情| 国内免费精品永久在线视频| 久久综合国产精品| 久久精品日韩| 亚洲国产国产亚洲一二三| 欧美wwwwww| 欧美成年人网| 99综合在线| 9l国产精品久久久久麻豆| 欧美日韩免费观看中文| 亚洲视频一二| 亚洲视频在线播放| 国产精品美女诱惑| 久久久xxx| 久久一综合视频| 亚洲精品字幕| 日韩特黄影片| 国产欧美日韩一区二区三区在线| 久久激五月天综合精品| 久久久国产一区二区三区| 欧美a级在线| 亚洲一区激情| 欧美一区在线视频| 亚洲欧洲精品一区二区三区波多野1战4| 欧美成人一区二区三区在线观看 | 一区在线电影| 欧美成人精品一区二区| 欧美喷潮久久久xxxxx| 亚洲欧美在线免费观看| 久久久久久久国产| 一区二区激情视频| 欧美伊人影院| 99热在线精品观看| 欧美一区二区精品| 亚洲精品欧美极品| 亚洲资源av| 亚洲人www| 午夜国产精品影院在线观看| 欧美日韩视频一区二区| 久久久久久久久岛国免费| 欧美a级在线| 久久久久国产精品一区| 欧美国产视频一区二区| 欧美诱惑福利视频| 欧美精品aa| 久久久久亚洲综合| 国产目拍亚洲精品99久久精品 | 亚洲欧美一区二区视频| 在线观看亚洲精品视频| 中文国产一区| 亚洲国产天堂久久综合网| 一区二区三区欧美| 亚洲人成亚洲人成在线观看| 亚洲欧美日韩综合| 国产情侣一区| 亚洲午夜精品一区二区| 亚洲国产精品久久久久秋霞蜜臀| 亚洲天堂免费在线观看视频| 伊人激情综合| 亚洲欧美日韩一区二区三区在线观看 | 欧美成人一区二免费视频软件| 午夜精品999| 欧美日韩高清在线播放| 免费观看成人| 国产午夜久久| 亚洲免费影视第一页| 亚洲午夜精品网| 欧美精品久久99| 欧美aa国产视频| 国产综合视频| 欧美一区二区三区四区夜夜大片| 亚洲欧美综合一区| 欧美日韩午夜剧场| 亚洲黄色一区| 日韩一级大片| 欧美精品成人| 日韩午夜黄色| 一区二区高清| 欧美日韩另类在线| 日韩一级黄色av| 一区二区三区三区在线| 欧美日韩伦理在线免费| 亚洲精品一区二区三区不| 欧美三级韩国三级日本三斤| 日韩一区二区福利| 亚洲欧美日韩精品一区二区 | 亚洲一区二区三区视频| 香蕉久久精品日日躁夜夜躁| 国产精品亚洲产品| 欧美影院在线播放| 美女999久久久精品视频| 在线观看日韩| 欧美韩日一区| 亚洲视频国产视频| 久久精品91久久久久久再现| 在线观看欧美日本| 欧美欧美天天天天操| 在线亚洲一区| 女女同性女同一区二区三区91| 亚洲国产清纯| 欧美色图五月天| 欧美专区在线观看| 欧美黑人一区二区三区| 亚洲夜晚福利在线观看| 一区二区电影免费观看| 一区二区欧美日韩| 国产精品久久久久影院色老大 | 久久国产精品一区二区| 久久综合伊人77777| 91久久午夜| 欧美性理论片在线观看片免费| 亚洲一区在线观看免费观看电影高清| 久久色中文字幕| aaa亚洲精品一二三区| 国产欧美一区二区三区在线老狼 | 欧美大片在线观看| 亚洲天堂av在线免费| 欧美国产亚洲精品久久久8v| 一区二区三区 在线观看视频| 国产日韩欧美不卡| 欧美日韩一区二区精品| 欧美在线免费视屏| 亚洲免费精彩视频| 久久亚洲图片| 亚洲免费一级电影| 日韩性生活视频| 国语自产偷拍精品视频偷| 欧美视频一区二| 欧美r片在线| 久久不见久久见免费视频1| 一区二区欧美激情| 亚洲高清不卡av| 麻豆精品国产91久久久久久| 一区二区三区国产盗摄| 激情成人中文字幕| 国产亚洲欧美一区在线观看| 欧美日韩综合视频网址| 欧美精品不卡| 欧美顶级艳妇交换群宴| 久久精品主播|