青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

可冰

冰,是沉睡著的水......

  C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
  37 隨筆 :: 5 文章 :: 94 評論 :: 0 Trackbacks
UTF Formats Estimated average storage required per page (3000 characters)
UTF-8




3 KB
(1999)
5 KB
(2003)
On average, English takes slightly over one unit per code point. Most Latin-script languages take about 1.1 bytes. Greek, Russian, Arabic and Hebrew take about 1.7 bytes, and most others (including Japanese, Chinese, Korean and Hindi) take about 3 bytes. Characters in surrogate space take 4 bytes, but as a proportion of all world text they will always be very rare.
UTF-16


6 KB All of the most common characters in use for all modern writing systems are already represented with 2 bytes. Characters in surrogate space take 4 bytes, but as a proportion of all world text they will always be very rare.
UTF-32

12 KB All take 4 bytes

[來源: http://icu.sourceforge.net/docs/papers/forms_of_unicode/]


UTF-8(ISO 10646-1) 有以下特性:

  • UCS 字符 U+0000 到 U+007F (ASCII) 被編碼為字節 0x00 到 0x7F (ASCII 兼容). 這意味著只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 兩種編碼方式下是一樣的.
  • 所有 > U+007F 的 UCS 字符被編碼為一個或多個字節的串, 每個字節都有標記位集. 因此, ASCII 字節 (0x00-0x7F) 不可能作為任何其他字符的一部分.
  • 表示非 ASCII 字符的多字節串的第一個字節總是在 0xC0 到 0xFD 的范圍里, 并指出這個字符包含多少個字節. 多字節串的其余字節都在 0x80 到 0xBF 范圍里. 這使得重新同步非常容易, 并使編碼無國界, 且很少受丟失字節的影響.
  • 可以編入所有可能的 231個 UCS 代碼
  • UTF-8 編碼字符理論上可以最多到 6 個字節長, 然而 16 位 BMP 字符最多只用到 3 字節長.
  • Bigendian UCS-4 字節串的排列順序是預定的.
  • 字節 0xFE 和 0xFF 在 UTF-8 編碼中從未用到.

下列字節串用來表示一個字符. 用到哪個串取決于該字符在 Unicode 中的序號.

U-00000000 - U-0000007F: 0xxxxxxx
U-00000080 - U-000007FF: 110xxxxx 10xxxxxx
U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

xxx 的位置由字符編碼數的二進制表示的位填入. 越靠右的 x 具有越少的特殊意義. 只用最短的那個足夠表達一個字符編碼數的多字節串. 注意在多字節串中, 第一個字節的開頭"1"的數目就是整個串中字節的數目.

例如: Unicode 字符 U+00A9 = 1010 1001 (版權符號) 在 UTF-8 里的編碼為:

11000010 10101001 = 0xC2 0xA9

而字符 U+2260 = 0010 0010 0110 0000 (不等于) 編碼為:

11100010 10001001 10100000 = 0xE2 0x89 0xA0

這種編碼的官方名字拼寫為 UTF-8, 其中 UTF 代表 UCS Transformation Format. 請勿在任何文檔中用其他名字 (比如 utf8 或 UTF_8) 來表示 UTF-8, 當然除非你指的是一個變量名而不是這種編碼本身.

什么編程語言支持 Unicode?

在大約 1993 年之后開發的大多數現代編程語言都有一個特別的數據類型, 叫做 Unicode/ISO 10646-1 字符. 在 Ada95 中叫 Wide_Character, 在 Java 中叫 char.

ISO C 也詳細說明了處理多字節編碼和寬字符 (wide characters) 的機制, 1994 年 9 月 Amendment 1 to ISO C 發表時又加入了更多. 這些機制主要是為各類東亞編碼而設計的, 它們比處理 UCS 所需的要健壯得多. UTF-8 是 ISO C 標準調用多字節字符串的編碼的一個例子, wchar_t 類型可以用來存放 Unicode 字符.
[來源: http://www.linuxforum.net/books/UTF-8-Unicode.html]

posted on 2005-09-19 15:38 可冰 閱讀(388) 評論(0)  編輯 收藏 引用 所屬分類: UTF-8
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            一本久久综合亚洲鲁鲁五月天| 久久婷婷国产综合精品青草 | 欧美三级乱人伦电影| 欧美电影免费观看高清| 欧美久久久久免费| 欧美日韩一区二区三区四区在线观看 | 久久久欧美精品| 亚洲永久精品大片| 欧美在线不卡| 久久野战av| 亚洲一区在线免费观看| 国产亚洲一区二区三区在线观看 | 欧美三区不卡| 国产日产欧美精品| 亚洲精品自在在线观看| 久久精品国产亚洲a| 91久久久久久久久| 欧美在线一级视频| 国产精品爱久久久久久久| 韩国av一区二区三区在线观看| 日韩一区二区高清| 蜜桃久久精品乱码一区二区| 在线亚洲电影| 欧美日韩理论| 在线综合+亚洲+欧美中文字幕| 欧美成人精品三级在线观看| 午夜精品福利一区二区蜜股av| 欧美日韩一区不卡| 中文在线资源观看视频网站免费不卡| 欧美1区视频| 农村妇女精品| 一本一本久久a久久精品牛牛影视| 欧美国产综合一区二区| 亚洲精品黄网在线观看| 免费成人网www| 欧美1区2区| 久久精品国产亚洲一区二区三区| 国产精品一二三四区| 欧美一区二区视频网站| 久久福利资源站| 一本色道婷婷久久欧美| 欧美一区二区三区播放老司机| 亚洲美女黄网| 亚洲精品日韩在线| 欧美激情国产日韩精品一区18| 亚洲精品综合精品自拍| 一区二区三区四区五区视频| 国产日韩精品一区二区三区在线 | 久久久国产91| 午夜免费日韩视频| 亚洲日本免费| 久久欧美中文字幕| 中文日韩在线| 久久噜噜噜精品国产亚洲综合| 亚洲综合999| 欧美激情精品久久久久久黑人 | 亚洲国产精品久久久久久女王| 欧美国产激情| 黄色成人在线网址| 中文欧美日韩| 亚洲人成亚洲人成在线观看图片| 亚洲五月六月| 在线午夜精品| 欧美成人69av| 欧美www视频在线观看| 国产农村妇女毛片精品久久莱园子| 欧美高清你懂得| 亚洲国产女人aaa毛片在线| 一区二区三区免费网站| 久久国产精品一区二区三区四区| 日韩午夜电影| 美日韩在线观看| 老司机67194精品线观看| 国产亚洲精品久久久| 亚洲欧美电影院| 亚洲在线黄色| 国产欧美精品在线| 久久精品国产在热久久| 男人天堂欧美日韩| 亚洲激情在线| 国产精品扒开腿做爽爽爽软件| 亚洲人体1000| 日韩网站在线观看| 国产日韩精品一区二区浪潮av| 亚洲伊人伊色伊影伊综合网| 欧美在线观看你懂的| 亚洲国产精品va在线看黑人 | 欧美日韩一区在线播放| 亚洲欧美大片| 亚洲国产精品黑人久久久| 99视频有精品| 狠狠干综合网| 欧美女同视频| 久久国产精品一区二区三区四区 | 日韩视频不卡| 欧美激情精品久久久久久免费印度| 亚洲视频电影图片偷拍一区| 国产一区二区三区四区| 欧美日韩国产一区二区三区地区 | 欧美好吊妞视频| 亚洲精选国产| 国产精品乱码久久久久久| 欧美aⅴ99久久黑人专区| 亚洲永久视频| 亚洲在线视频| 亚洲午夜激情在线| 亚洲一区二区四区| 免费在线国产精品| 亚洲性视频网址| 亚洲午夜久久久久久久久电影院| 亚洲精品一区在线观看香蕉| 亚洲精品国产精品乱码不99按摩| 狠狠入ady亚洲精品| 在线观看av一区| 亚洲免费不卡| 亚洲欧美日韩高清| 久久精品国产亚洲高清剧情介绍| 久久精品中文字幕一区| 老司机精品导航| 亚洲黄色三级| 亚洲欧美日韩国产一区二区三区| 亚洲一区二区高清视频| 午夜精品短视频| 欧美成人精品在线观看| 国产乱码精品一区二区三区av| 国内自拍亚洲| 亚洲一区二区毛片| 欧美大片在线观看一区| 亚洲精品在线视频| 亚洲免费人成在线视频观看| 久久综合网络一区二区| 国产免费成人在线视频| 日韩视频一区二区三区在线播放免费观看| 亚洲网站在线看| 亚洲激情国产精品| 蜜桃精品一区二区三区| 精品1区2区| 乱人伦精品视频在线观看| 亚洲一区二区在线播放| 欧美日韩一本到| 亚洲社区在线观看| 亚洲欧洲综合另类| 久久精品国产久精国产思思 | 亚洲精品一区二区在线观看| 久久久www成人免费毛片麻豆| 一本色道久久综合亚洲精品高清 | 欧美精品在线网站| 亚洲国内精品| 亚洲精品乱码久久久久久| 男女激情久久| 亚洲人成在线观看| 欧美激情第4页| 欧美日韩成人综合| 亚洲视频综合| 亚洲欧美区自拍先锋| 国内精品久久久久久久果冻传媒| 久久久7777| 欧美bbbxxxxx| 午夜老司机精品| 久久久久久亚洲精品杨幂换脸| 亚洲大片免费看| 亚洲国产精品电影在线观看| 欧美午夜国产| 欧美二区视频| 欧美一区深夜视频| 蜜桃av一区二区三区| 性久久久久久久久久久久| 久久综合九色综合久99| 99re热这里只有精品免费视频| 一本大道久久精品懂色aⅴ| 国产日韩一区在线| 亚洲国产精品免费| 国产亚洲高清视频| 中国成人亚色综合网站| 最新日韩在线视频| 久久精品亚洲| 国产欧美精品在线| 亚洲国产精品va在看黑人| 亚洲日本中文字幕| 久久激情综合| 久久久久久婷| 黄色成人在线网址| 午夜日韩在线观看| 久久精视频免费在线久久完整在线看| 久久久精品动漫| 欧美另类变人与禽xxxxx| 亚洲激情电影在线| 亚洲网友自拍| 国产一区成人| 另类成人小视频在线| 亚洲激情视频在线观看| 欧美一区二区精品| 久久九九国产精品| 久久久久久久综合日本| 欧美精品亚洲精品| 亚洲一区美女视频在线观看免费| 亚洲欧洲精品一区二区精品久久久 | 国产精品美女久久久免费| 亚洲第一视频| 国产日本欧美一区二区|