一路向北
追逐夢(mèng)想，永不停步......

隨筆-4 評(píng)論-40 文章-117 trackbacks-0

MultiByteToWideChar的與WideCharToMultiByte的參數(shù)詳解

第一個(gè)就是寬字符到多字節(jié)字符轉(zhuǎn)換函數(shù)，函數(shù)原型如下：

int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cbMultiByte,
LPCSTR lpDefaultChar,
LPBOOL lpUsedDefaultChar
);

此函數(shù)把寬字符串轉(zhuǎn)換成指定的新的字符串，如ANSI，UTF8等，新字符串不必是多字節(jié)字符集。參數(shù)：

CodePage：指定要轉(zhuǎn)換成的字符集代碼頁(yè)，它可以是任何已經(jīng)安裝的或系統(tǒng)自帶的字符集，你也可以使用如下所示代碼頁(yè)之一。

CP_ACP 當(dāng)前系統(tǒng)ANSI代碼頁(yè)
CP_MACCP 當(dāng)前系統(tǒng)Macintosh代碼頁(yè)
CP_OEMCP 當(dāng)前系統(tǒng)OEM代碼頁(yè)，一種原始設(shè)備制造商硬件掃描碼
CP_SYMBOL Symbol代碼頁(yè)，用于Windows 2000及以后版本，我不明白是什么
CP_THREAD_ACP 當(dāng)前線程ANSI代碼頁(yè)，用于Windows 2000及以后版本，我不明白是什么
CP_UTF7 UTF-7，設(shè)置此值時(shí)lpDefaultChar和lpUsedDefaultChar都必須為NULL
CP_UTF8 UTF-8，設(shè)置此值時(shí)lpDefaultChar和lpUsedDefaultChar都必須為NULL

我想最常用的應(yīng)該是CP_ACP和CP_UTF8了，前者將寬字符轉(zhuǎn)換為ANSI，后者轉(zhuǎn)換為UTF8。

dwFlags：指定如何處理沒(méi)有轉(zhuǎn)換的字符，但不設(shè)此參數(shù)函數(shù)會(huì)運(yùn)行的更快一些，我都是把它設(shè)為0。可設(shè)的值如下表所示：
WC_NO_BEST_FIT_CHARS 把不能直接轉(zhuǎn)換成相應(yīng)多字節(jié)字符的Unicode字符轉(zhuǎn)換成lpDefaultChar指定的默認(rèn)字符。也就是說(shuō)，如果把Unicode轉(zhuǎn)換成多字節(jié)字符，然后再轉(zhuǎn)換回來(lái)，你并不一定得到相同的Unicode字符，因?yàn)檫@期間可能使用了默認(rèn)字符。此選項(xiàng)可以單獨(dú)使用，也可以和其他選項(xiàng)一起使用。
WC_COMPOSITECHECK 把合成字符轉(zhuǎn)換成預(yù)制的字符。它可以與后三個(gè)選項(xiàng)中的任何一個(gè)組合使用，如果沒(méi)有與他們中的任何一個(gè)組合，則與選項(xiàng)WC_SEPCHARS相同。
WC_ERR_INVALID_CHARS 此選項(xiàng)會(huì)致使函數(shù)遇到無(wú)效字符時(shí)失敗返回，并且GetLastError會(huì)返回錯(cuò)誤碼ERROR_NO_UNICODE_TRANSLATION。否則函數(shù)會(huì)自動(dòng)丟棄非法字符。此選項(xiàng)只能用于UTF8。

WC_DISCARDNS 轉(zhuǎn)換時(shí)丟棄不占空間的字符，與WC_COMPOSITECHECK一起使用
WC_SEPCHARS 轉(zhuǎn)換時(shí)產(chǎn)生單獨(dú)的字符，此是默認(rèn)轉(zhuǎn)換選項(xiàng)，與WC_COMPOSITECHECK一起使用
WC_DEFAULTCHAR 轉(zhuǎn)換時(shí)使用默認(rèn)字符代替例外的字符，(最常見(jiàn)的如’?’)，與WC_COMPOSITECHECK一起使用。

當(dāng)指定WC_COMPOSITECHECK時(shí)，函數(shù)會(huì)將合成字符轉(zhuǎn)換成預(yù)制字符。合成字符由一個(gè)基字符和一個(gè)不占空間的字符(如歐洲國(guó)家及漢語(yǔ)拼音的音標(biāo))組成，每一個(gè)都有不同的字符值。預(yù)制字符有一個(gè)用于表示基字符和不占空間字符的合成體的單一的字符值。
當(dāng)指定WC_COMPOSITECHECK選項(xiàng)時(shí)，也可以使用上表列出的最后3個(gè)選項(xiàng)來(lái)定制預(yù)制字符的轉(zhuǎn)換規(guī)則。這些選項(xiàng)決定了函數(shù)在遇到寬字符串的合成字符沒(méi)有對(duì)應(yīng)的預(yù)制字符時(shí)的行為，他們與WC_COMPOSITECHECK一起使用，如果都沒(méi)有指定，函數(shù)默認(rèn)WC_SEPCHARS。

對(duì)于下列代碼頁(yè)，dwFlags必須為0，否則函數(shù)返回錯(cuò)誤碼ERROR_INVALID_FLAGS。
50220 50221 50222 50225 50227 50229 52936 54936 57002到57011 65000(UTF7) 42(Symbol)
對(duì)于UTF8，dwFlags必須為0或WC_ERR_INVALID_CHARS，否則函數(shù)都將失敗返回并設(shè)置錯(cuò)誤碼ERROR_INVALID_FLAGS，你可以調(diào)用GetLastError獲得。

lpWideCharStr：待轉(zhuǎn)換的寬字符串。

cchWideChar：待轉(zhuǎn)換寬字符串的長(zhǎng)度，-1表示轉(zhuǎn)換到字符串結(jié)尾。

lpMultiByteStr：接收轉(zhuǎn)換后輸出新串的緩沖區(qū)。

cbMultiByte：輸出緩沖區(qū)大小，如果為0，lpMultiByteStr將被忽略，函數(shù)將返回所需緩沖區(qū)大小而不使用lpMultiByteStr。

lpDefaultChar：指向字符的指針，在指定編碼里找不到相應(yīng)字符時(shí)使用此字符作為默認(rèn)字符代替。如果為NULL則使用系統(tǒng)默認(rèn)字符。對(duì)于要求此參數(shù)為NULL的dwFlags而使用此參數(shù)，函數(shù)將失敗返回并設(shè)置錯(cuò)誤碼ERROR_INVALID_PARAMETER。

lpUsedDefaultChar：開(kāi)關(guān)變量的指針，用以表明是否使用過(guò)默認(rèn)字符。對(duì)于要求此參數(shù)為NULL的dwFlags而使用此參數(shù)，函數(shù)將失敗返回并設(shè)置錯(cuò)誤碼ERROR_INVALID_PARAMETER。lpDefaultChar和lpUsedDefaultChar都設(shè)為NULL，函數(shù)會(huì)更快一些。

返回值：如果函數(shù)成功，且cbMultiByte非0，返回寫(xiě)入lpMultiByteStr的字節(jié)數(shù)(包括字符串結(jié)尾的null)；cbMultiByte為0，則返回轉(zhuǎn)換所需

字節(jié)數(shù)。函數(shù)失敗，返回0。
注意：函數(shù)WideCharToMultiByte使用不當(dāng)，會(huì)給影響程序的安全。調(diào)用此函數(shù)會(huì)很容易導(dǎo)致內(nèi)存泄漏，因?yàn)閘pWideCharStr指向的輸入緩沖區(qū)大小是寬字符數(shù)，而lpMultiByteStr指向的輸出緩沖區(qū)大小是字節(jié)數(shù)。為了避免內(nèi)存泄漏，應(yīng)確保為輸出緩沖區(qū)指定合適的大小。我的方法是先使cbMultiByte為0調(diào)用WideCharToMultiByte一次以獲得所需緩沖區(qū)大小，為緩沖區(qū)分配空間，然后再次調(diào)用WideCharToMultiByte填充緩沖區(qū)，詳見(jiàn)下面的代碼。另外，從Unicode UTF16向非Unicode字符集轉(zhuǎn)換可能會(huì)導(dǎo)致數(shù)據(jù)丟失，因?yàn)樵撟址赡軣o(wú)法找到表示特定Unicode數(shù)據(jù)的字符。

wchar_t* pwszUnicode = "Holle, word! 你好，中國(guó)！ ";
int iSize;
char* pszMultiByte;

iSize = WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, NULL, 0, NULL, NULL);
pszMultiByte = (char*)malloc((iSize+1)/**sizeof(char)*/);
WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, pszMultiByte, iSize, NULL, NULL);

第二個(gè)是多字節(jié)字符到寬字符轉(zhuǎn)換函數(shù)，函數(shù)原型如下：
> int MultiByteToWideChar(
UINT CodePage,
DWORD dwFlags,
LPCSTR lpMultiByteStr,
int cbMultiByte,
LPWSTR lpWideCharStr,
int cchWideChar
);

此函數(shù)把多字節(jié)字符串轉(zhuǎn)換成寬字符串(Unicode)，待轉(zhuǎn)換的字符串并不一定是多字節(jié)的。

此函數(shù)的參數(shù)，返回值及注意事項(xiàng)參見(jiàn)上面函數(shù)WideCharToMultiByte的說(shuō)明，這里只對(duì)dwFlags做簡(jiǎn)單解釋。

dwFlags：指定是否轉(zhuǎn)換成預(yù)制字符或合成的寬字符，對(duì)控制字符是否使用像形文字，以及怎樣處理無(wú)效字符。

MB_PRECOMPOSED 總是使用預(yù)制字符，即有單個(gè)預(yù)制字符時(shí)，就不會(huì)使用分解的基字符和不占空間字符。此為函數(shù)的默認(rèn)選項(xiàng)，不能和MB_COMPOSITE合用
MB_COMPOSITE 總是使用分解字符，即總是使用基字符+不占空間字符的方式
MB_ERR_INVALID_CHARS 設(shè)置此選項(xiàng)，函數(shù)遇到非法字符就失敗并返回錯(cuò)誤碼ERROR_NO_UNICODE_TRANSLATION，否則丟棄非法字符
MB_USEGLYPHCHARS 使用像形字符代替控制字符

對(duì)于下列代碼頁(yè)，dwFlags必須為0，否則函數(shù)返回錯(cuò)誤碼ERROR_INVALID_FLAGS。
50220 50221 50222 50225 50227 50229 52936 54936 57002到57011 65000(UTF7) 42(Symbol)
對(duì)于UTF8，dwFlags必須為0或MB_ERR_INVALID_CHARS，否則函數(shù)都將失敗并返回錯(cuò)誤碼ERROR_INVALID_FLAGS。

以下函數(shù)我沒(méi)用過(guò)，只簡(jiǎn)要說(shuō)明之。

int GetTextCharset( HDC hdc );

此函數(shù)獲取當(dāng)前選進(jìn)的設(shè)備描述表的字符集，等同于GetTextCharsetInfo(hdc, NULL, 0)。

返回值：成功返回字符集標(biāo)識(shí)，失敗返回DEFAULT_CHARSET。

posted on 2009-05-25 21:16 李陽(yáng) 閱讀(430) 評(píng)論(0) 編輯收藏引用

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開(kāi)源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

<

2025年10月

>

日

一

二

三

四

五

六

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

常用鏈接

留言簿(7)

隨筆分類(lèi)

隨筆檔案

文章分類(lèi)

文章檔案

鏈接

CodeGuru
CodeProject
sqlite中文站
VIM -幫助
Vim中文使用手冊(cè)
面向 Linux 程序員和系統(tǒng)管理員的技術(shù)資源
云風(fēng)的 BLOG

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(7)

隨筆分類(lèi)

隨筆檔案

文章分類(lèi)

文章檔案

鏈接

友情鏈接

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜