大龍的博客

導(dǎo)航

<

2010年5月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

29

30

31

1

2

3

4

5

留言簿(43)

收藏夾

ps (rss)

隨筆檔案

文章檔案

閱讀排行榜

評論排行榜

常用鏈接

統(tǒng)計

隨筆 - 864
文章 - 2
評論 - 378
引用 - 0

setlocale同mbstowcs函數(shù)的關(guān)系 --- 轉(zhuǎn)

程序中，如果要將ASCII碼字符串轉(zhuǎn)換為寬字符（Unicode），可以利用標(biāo)準(zhǔn)C的mbstowcs函數(shù)。

微軟在MSDN中有示例，如下：

然而，這段代碼在處理含有漢字的字符串時就會出現(xiàn)問題。比如將：

wchar_t *pwchello = L"Hi"; 替換為wchar_t *pwchello = L"你好";

查看運行結(jié)果就會發(fā)現(xiàn)，mbstowcs函數(shù)將漢字視作兩個ASCII字符，這樣一個漢字就變成了兩個wchar_t。原因是mbstowcs需要我們明確的告訴他要轉(zhuǎn)換的字符語言。這里需要使用setlocale函數(shù)。在網(wǎng)上發(fā)現(xiàn)不少人遇到這個問題，微軟的MSDN也是，為什么這里就不說明一下呢？

只要在調(diào)用前，使用setlocale(LC_ALL, "chs")設(shè)置，結(jié)果就正常了。

我測試在英文Vista操作系統(tǒng)內(nèi)，Visual Studio 2008下setlocale(LC_ALL, "chs")可以執(zhí)行成功。

但是在Borland C++Builder 6、CodeGear RAD Studio 2009下執(zhí)行都失敗，BCB提供的幫助文件內(nèi)也未找到，反復(fù)測試使用setlocale(LC_ALL, "Chinese (Simplified)_People's Republic of China")可以奏效（這么大一個長串，BCB對搞中文編碼的程序員也夠狠）。

更諷刺的是，在BCB內(nèi)使用setlocale(LC_ALL, "jpn")，或"cht"都可以成功。唯獨就不支持"chs"，對BCB的做法徹底無語了。我相信在大多數(shù)unix或linux上也還是支持"chs"的。如果有時間，我再搞一個MinGW試試看。

另外如果程序運行在非中文操作系統(tǒng)內(nèi)，使用setlocale修改運行時字符集環(huán)境，會影響當(dāng)前應(yīng)用程序的編碼方式，因此使用前需要保留一下老的編碼，使用后再恢復(fù)。

for 在linux上coding的兄弟們，locale別名表大概在 /usr/lib/X11/locale/locale.alias

posted on 2010-05-25 14:29 大龍閱讀(2790) 評論(1) 編輯收藏引用

# re: setlocale同mbstowcs函數(shù)的關(guān)系 --- 轉(zhuǎn) 2011-04-09 19:23 pointma

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品