国产精品久久夜,黄色亚洲在线,欧美日韩蜜桃

[轉]wchar_t與char轉換

Posted on 2008-01-08 11:07 寒蟬閱讀(36173) 評論(11) 編輯收藏引用所屬分類: C++讀書筆記

wchar_t與char轉換
原文地址：http://hi.baidu.com/gchrist/blog/item/29a138f533383e24bd310934.html

環境：Dev cpp 平臺i386 
    C++標準中，wchar_t是寬字符類型，每個wchar_t類型占2個字節，16位寬。漢字的表示就要用到wchar_t 。char，我們都知道，占一個字節，8位寬。
其實知道了這個以后，要在wchar_t 和 char兩種類型之間轉換就不難實現了。wchar_t 轉換為char 的代碼如下： 
有如下的wchar_t和char變量:
wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;
char *C2W(wchar_t w_cn , char c_cn[2])
{    //following code convert wchar to char 

      c_cn[0] = w_cn >> 8 ;

      c_cn[1] = w_cn ;

      c_cn[2] = '\0';
      return c_cn ;
}
  其中需要注意的是一個16位的wchar_t需要用兩個8位的char來存儲之。我們可以發現另外一個問題，wchar_t的高位字節應該存儲在char數組的低位字節。
(這里沒有仔細研究了，覺得怪怪的)。 這是完成了wchar_t到char的轉化，char到wchar_t的轉換類似。






C++中，你要想這樣：cout<<w_cn<<endl;打印wchar_t，那是不行的。why？我想是wchar_t類型沒有重載<<運算符吧。要顯示，我的方法是：
string cn(c_cn);


cout<<cn<<endl;
這樣就能正確的打印wchar_t字符了。是不是感覺好像做了好多事，但是完成的卻是很簡單的事情？呵呵，其實我也有同感，但是沒有辦法。更簡單的辦法，當然是直接用API(我一個是懶的去找了，二一個自己動手轉換有些東西看的更清楚咯)，但是這樣的轉換更靈活，

在實際中應該會用到的。 有了以上的基礎，下面給出wchar_t字符串到char字符串的轉換代碼：
char *W2C(const wchar_t *pw , char *pc)








{

//cout<<*pw<<endl;    //這樣是不能正確顯示的，你可以試試看顯示的是什么

      *pc++ = *pw >> 8 ;

      *pc = *pw ;

      return 0 ;

} 

char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)

{     char *ptemp = pcstr ;

      if(pwstr!=NULL && pcstr!=NULL)

      {  size_t wstr_len = wcslen(pwstr) ;

          len = (len > wstr_len ) ?    wstr_len : len ;

      while( len -- > 0)

      {
          W2C(pwstr , pcstr);

          pwstr++ ;

          pcstr +=2 ;      //和我們開始說的一樣+2，不是+1

      }

          *pcstr = '\0';

          return ptemp ;

      }

      return 0 ;

}    
對上面的代碼進行測試：
int main(int arg , char *argv[])
{
      wchar_t pwstr[] = {'我' , '是' , '中' , '國' , '人'};
      char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;

      memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );

      wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
      str.assign (pcstr);

      cout<<str<<endl;

      delete []pcstr ;
}

Feedback

# re: [轉]wchar_t與char轉換回復 更多評論

2008-01-08 16:40 by <a href=http://minidx.com>minidxer</a>

相同的編碼的這樣轉沒問題，不同的話就有問題的
比如gb的轉UTF16

# re: [轉]wchar_t與char轉換回復 更多評論

2008-01-20 19:41 by jsjkandy

對于編碼還剛剛處于學習階段，不知道您是否可以給我介紹幾篇文章，或者給講一些不同的編碼在不同的平臺上進行移植的一些問題。呵呵。

# re: [轉]wchar_t與char轉換回復 更多評論

2009-03-02 15:29 by biangji

你好，我在c++中傳遞char*類型到java的時候出現如下問題
#
# An unexpected error has been detected by Java Runtime Environment:
#
# EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x102156f9, pid=5280, tid=5672
#
# Java VM: Java HotSpot(TM) Client VM (11.0-b15 mixed mode, sharing windows-x86)
# Problematic frame:
# C [MSVCR71D.dll+0x156f9]
#
# An error report file with more information is saved as:
# D:\Program Files\eclipse\workspace\jnaTestProject1\hs_err_pid5280.log
#
# If you would like to submit a bug report, please visit:
# http://java.sun.com/webapps/bugreport/crash.jsp
# The crash happened outside the Java Virtual Machine in native code.
# See problematic frame for where to report the bug.
#
不知道是怎么回事，麻煩您解答，謝謝

# re: [轉]wchar_t與char轉換回復 更多評論

2009-03-02 15:30 by biangji

不好意思，我發錯了

# re: [轉]wchar_t與char轉換回復 更多評論

2009-03-05 21:19 by 寒蟬

@biangji
不好意思，呵呵，我java不會啊。

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

2010-10-18 15:51 by me

setlocale...
std::wcout << ..?

# re: [轉]wchar_t與char轉換回復 更多評論

2011-11-17 11:43 by todd

wchar_t w_cn = '中' 這樣寫至少也應該有個警告，應該用 wchar_t w_cn = L'中'

輸出wchar_t字符串可以用 wcout

char c_cn[2] .... c_cn[2] = ... 理論上是索引超出范圍

wchar_t 的長度與編譯器實現有關，可能是2個字節，也可能是4個字節

這個轉化方案有問題，理論上是錯誤的，至少是靠不住的。

char sz[] = "中"; 導致 sizeof(sz) 結果為4，除掉結尾的'\0' 字符，中字用了3個字符，（但這也可能是因為我的代碼文件用的 utf-8 保存的，不確定）

unicode可以說只是一個字符集，收 utf-8, utf-16, ucs4 等等編碼方式的支持。
gb18030定義模糊，其把字符集與編碼方式混為一談（也或者我讀得文檔表述有問題）

utf-8, utf-16, ucs4 之間轉換只需解碼再編碼就可以了。而與gb18030之間的轉化解碼后還要進行字符集轉換后在編碼。

比如給定漢字x, 其 unicode 對應 code point 是 xu，其 utf-8 編碼是 utf8(xu);
其gb18030的 code point 是 xk ，編碼是 gb18030(xk)，而 utf8(xu) 與 gb18030(xk) 可能想去甚遠

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

2012-06-22 12:28 by JK

char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
memset(pcstr , 0 , 2 * wcslen(pwstr)+1);
wstr2cstr(pwstr , pcstr , wcslen(pwstr));

三句代碼把 wcslen 調用了三次，為什么不先算出來，調三次不浪費嗎？況且，你這里直接用 sizeof 更好，連函數調用都省去了。

# re: [轉]wchar_t與char轉換回復 更多評論

2012-11-27 07:28 by Martian

可笑，完全錯誤，錯的沒邊了

# re: [轉]wchar_t與char轉換回復 更多評論

2012-11-29 17:05 by ikillmeba

確實，有很多的錯誤，編譯器的問題，還有平臺的問題，都有可能

# re: [轉]wchar_t與char轉換 回復 更多評論

2013-02-19 10:56 by ligand

此文錯得太離譜。

C++語言標準沒有規定wchar_t是多少比特寬度！！！

在類Unix/Linux系統中，wchar_t是32比特寬。

即使在Windows平臺上，一個wchar_t漢字字符轉為DBCS（雙字節表示，簡體中文即指gb2312/gbk/gb18030，三者可視為同一），也不能直接靠移位操作、字節復制之類，而必須去查表。因為wchar_t漢字字符保存的是Unicode的碼值的UTF-16小尾表示，與gb2312/gbk/gb18030完全不同。這就好比gb2312/gbk/gb18030與繁體的Big5轉換，也必須只能去查表。

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: VC調試入門【翻譯】Relationship Between a C++ Window Object and an HWND--CWND對象和HWND的區別和聯系 [轉]wchar_t與char轉換 visual assist X10破解版 C/C++中的轉義字符

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

追逐夢想

導航

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

我的.net博客

搜索

最新評論

閱讀排行榜

評論排行榜

[轉]wchar_t與char轉換

Feedback

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

追逐夢想

導航

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

我的.net博客

搜索

最新評論

閱讀排行榜

評論排行榜

[轉]wchar_t與char轉換

Feedback

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換 回復 更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換[未登錄] 回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論

# re: [轉]wchar_t與char轉換回復更多評論