• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 28, comments - 179, trackbacks - 0, articles - 1
              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

            字符集相關(guān)問(wèn)題

            Posted on 2007-05-30 16:54 chemz 閱讀(5803) 評(píng)論(14)  編輯 收藏 引用 所屬分類(lèi): C++
                                             字符集相關(guān)問(wèn)題
                字符集目前有兩個(gè)大的類(lèi)別:本地字符集和國(guó)際字符集,其中每一類(lèi)別的字符集又有多個(gè)
            不同的字符編碼實(shí)例。比如:本地字符集中基本上對(duì)于每一個(gè)不同的地區(qū)和國(guó)家就會(huì)形成一個(gè)
            屬于自己的字符集(ascii, latin-1, chs等),國(guó)際字符集中同樣包括多種不同的編碼方案
            (utf8, utf16等)。
                那么在C/C++程序中如何完成上述字符集之間的轉(zhuǎn)換工作呢?分成兩種情況:
                1. 通過(guò)const char *cstr使用開(kāi)發(fā)環(huán)境中的編輯器輸入字符串常量"中國(guó)",如下:
                        const char *cstr = "中國(guó)";
                   這樣一來(lái)cstr所指向的字符串內(nèi)存中保存的則是本地字符編碼下所形成的字符串,也
                   就是說(shuō),上面的cstr中存儲(chǔ)著chs字符編碼集中的字符;
                2. 通過(guò)const wchar_t *wstr使用開(kāi)發(fā)環(huán)境中的編輯器輸入字符串常量"中國(guó)",如下:
                        const wchar_t *wstr = L"中國(guó)";
                   這樣一來(lái)wstr所指向的字符串內(nèi)存中保存的則是國(guó)際字符編碼(在VC++下是ucs2,
                   在gcc下是ucs4)下所形成的字符串,也就是說(shuō),上面的wstr中存儲(chǔ)著utf16字符編
                   碼集中的字符;
                那么如何將cstr轉(zhuǎn)換成為wstr呢?可以通過(guò)C語(yǔ)言中的標(biāo)準(zhǔn)轉(zhuǎn)換函數(shù)mbstowcs來(lái)完成該工
            作,此時(shí)需要注意的是如果直接使用mbstowcs進(jìn)行轉(zhuǎn)換會(huì)得到一個(gè)錯(cuò)誤的結(jié)果,并不能成功
            的完成轉(zhuǎn)換成為國(guó)際寬字符的要求,這是為什么呢?在C/C++語(yǔ)言標(biāo)準(zhǔn)中定義了其運(yùn)行時(shí)的
            字符集環(huán)境為"C",也就是ASCII字符集的一個(gè)子集,那么mbstowcs在工作時(shí)會(huì)將cstr中所包
            含的字符串看作是ASCII編碼的字符,而不認(rèn)為是一個(gè)包含有chs編碼的字符串,所以他會(huì)將
            每一個(gè)中文拆成2個(gè)ASCII編碼進(jìn)行轉(zhuǎn)換,這樣得到的結(jié)果就是會(huì)形成4個(gè)wchar_t的字符組成
            的串,那么如何才能夠讓mbstowcs正常工作呢?在調(diào)用mbstowcs進(jìn)行轉(zhuǎn)換之間必須明確的告
            訴mbstowcs目前cstr串中包含的是chs編碼的字符串,通過(guò)setlocale( LC_ALL, "chs" )函數(shù)
            調(diào)用來(lái)完成,需要注意的是這個(gè)函數(shù)會(huì)改變整個(gè)應(yīng)用程序的字符集編碼方式,必須要通過(guò)重
            新調(diào)用setlocale( LC_ALL, "C" )函數(shù)來(lái)還原,這樣就可以保證mbstowcs在轉(zhuǎn)換時(shí)將cstr中
            的串看作是中文串,并且轉(zhuǎn)換成為2個(gè)wchar_t字符,而不是4個(gè)。


            Feedback

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-05-30 20:47 by 小明
            const wchar_t *wstr = "中國(guó)";

            這樣寫(xiě)不合法吧
            const wchar_t *wstr = L"中國(guó)";

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-05-31 09:14 by chemz
            非常感謝指出,書(shū)寫(xiě)時(shí)漏了L,謝謝!

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-05-31 11:00 by walkspeed
            看來(lái)有人也研究過(guò)的也。

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-04 14:32 by 看圖軟件
            研究下

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-26 21:17 by Jerry
            請(qǐng)教一下,在Solaris操作系統(tǒng)下中文字符串使用的是什么字符集。
            我在Solaris下用setlocale( LC_ALL, "chs" ),然后將字符串轉(zhuǎn)換成unicode
            得到錯(cuò)誤結(jié)果,后來(lái)發(fā)現(xiàn)在solaris里面就沒(méi)有"chs"這種編碼方式,請(qǐng)問(wèn)我怎樣才能正確轉(zhuǎn)換

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-27 08:51 by chemz
            我在搞solaris的時(shí)候也遇到過(guò)這個(gè)問(wèn)題,我所在的環(huán)境是solaris9和10對(duì)于8我不太清楚。是這樣的,在solaris的操作系統(tǒng)安裝光盤(pán)中有一張單獨(dú)的Languages語(yǔ)言支持光盤(pán),必須要選擇安裝對(duì)應(yīng)的字符集支持,如果要顯示中文還必須要切換操作系統(tǒng)的當(dāng)前語(yǔ)種到中文(任意一種中文都沒(méi)有問(wèn)題,最好采用GB18030,否則會(huì)出現(xiàn)有些生僻的字沒(méi)有編碼的問(wèn)題),這樣就可以轉(zhuǎn)換和顯示了。對(duì)于solaris8沒(méi)有試過(guò),因?yàn)楸容^老了。

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-27 09:27 by Jerry
            謝謝chemz
            但是我在solaris下locale -a 查了一下他里面支持的中文字符集有
            zh,zh_CN.EUC,zh.GBK,zh.UTF-8,我一個(gè)個(gè)試過(guò)了,但是都不正確轉(zhuǎn)換,是不是真的需要另外加中文字符集,不清楚在solaris下面是不是真的有“chs”的字符集

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-27 10:27 by chemz
            你用的什么編譯器,GNU還是Sun的?

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-27 11:53 by Jerry
            Sun 的CC編譯器,

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2007-06-27 12:05 by chemz
            不好意思我沒(méi)有用過(guò)Sun的CC,凡是在Unix環(huán)境下開(kāi)發(fā)我們都用統(tǒng)一的GNU gcc編譯器集合,這樣會(huì)比較好移植。

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2008-06-21 10:51 by 數(shù)字柔情
            我在LINUX企業(yè)版5上實(shí)驗(yàn)了上面代碼,編譯時(shí)這句const wchar_t *wstr = L"中國(guó)";報(bào)錯(cuò)converting to execution character set:無(wú)效或不完整的多字節(jié)字符或?qū)捵址?
            是怎么回事啊,LINUX下不能把中文轉(zhuǎn)成UNICODE嗎?那怎么用。

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2008-06-22 13:55 by chemz
            樓上的需要注意你可能在寫(xiě)const wchar_t *wstr = L"中國(guó)";這句話(huà)時(shí)引號(hào)是個(gè)中文的,所以才會(huì)有問(wèn)題。

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2008-09-28 08:49 by soli

            我怎么知道我的字符串中是什么編碼呢?

            比如:

            m_ctrlEdit.GetWindowText(m_strEdit);

            此時(shí)m_strEdit中是什么編碼的字符串呢?

            # re: 字符集相關(guān)問(wèn)題  回復(fù)  更多評(píng)論   

            2010-07-15 09:31 by hzpfly
            如果中英文混排的情況如何轉(zhuǎn)換成寬字符呢?
            const char* str = "I 服了 You";
            久久精品亚洲精品国产色婷| 国产人久久人人人人爽| 国产精品美女久久久久AV福利 | 曰曰摸天天摸人人看久久久| 91精品国产高清久久久久久国产嫩草 | 久久久久国产精品麻豆AR影院 | 欧美午夜A∨大片久久 | 久久久久女教师免费一区| 一97日本道伊人久久综合影院| 久久久久无码精品国产不卡| 伊人热人久久中文字幕| 色综合久久中文字幕无码| 国产 亚洲 欧美 另类 久久 | 国内精品免费久久影院| 久久亚洲中文字幕精品有坂深雪 | 久久综合综合久久综合| 亚洲中文字幕无码久久2020| 久久se精品一区二区影院| 久久精品免费全国观看国产| 久久99精品国产一区二区三区 | 久久久久久无码Av成人影院| 国产精品成人99久久久久| 久久精品午夜一区二区福利| 久久亚洲精品国产亚洲老地址| 狠狠人妻久久久久久综合蜜桃| 成人妇女免费播放久久久| 亚洲国产精品无码久久| 亚洲欧美一级久久精品| 国产午夜精品久久久久九九| 久久成人国产精品二三区| 青青草原精品99久久精品66| 精品多毛少妇人妻AV免费久久 | 欧美国产精品久久高清| 国产成人无码精品久久久久免费| 久久青草国产手机看片福利盒子| 久久久久久无码Av成人影院| 久久九九精品99国产精品| 嫩草伊人久久精品少妇AV| 亚洲一本综合久久| 久久亚洲精品中文字幕三区| 九九精品99久久久香蕉|