• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            追逐夢想

            臨淵羨魚,不如退而結(jié)網(wǎng)
            posts - 8, comments - 18, trackbacks - 0, articles - 0

            [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換

            Posted on 2008-01-08 11:07 寒蟬 閱讀(36125) 評論(11)  編輯 收藏 引用 所屬分類: C++讀書筆記
            環(huán)境:Dev cpp 平臺i386 
                C++標(biāo)準(zhǔn)中,wchar_t是寬字符類型,每個(gè)wchar_t類型占2個(gè)字節(jié),16位寬。漢字的表示就要用到wchar_t 。char,我們都知道,占一個(gè)字節(jié),8位寬。
            其實(shí)知道了這個(gè)以后,要在wchar_t 和 char兩種類型之間轉(zhuǎn)換就不難實(shí)現(xiàn)了。wchar_t 轉(zhuǎn)換為char 的代碼如下: 
            有如下的wchar_t和char變量:
            wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;
            char *C2W(wchar_t w_cn , char c_cn[2])
            {    //following code convert wchar to char 
                  c_cn[0] = w_cn >> 8 ;
                  c_cn[1] = w_cn ;
                  c_cn[2] = '\0';
                  return c_cn ;
            }
              其中需要注意的是一個(gè)16位的wchar_t需要用兩個(gè)8位的char來存儲之。我們可以發(fā)現(xiàn)另外一個(gè)問題,wchar_t的高位字節(jié)應(yīng)該存儲在char數(shù)組的低位字節(jié)。
            (這里沒有仔細(xì)研究了,覺得怪怪的)。
             這是完成了wchar_t到char的轉(zhuǎn)化,char到wchar_t的轉(zhuǎn)換類似。






            C++中,你要想這樣:cout<<w_cn<<endl;打印wchar_t,那是不行的。why?我想是wchar_t類型沒有重載<<運(yùn)算符吧。要顯示,我的方法是:
            string cn(c_cn);

            cout<<cn<<endl;
            這樣就能正確的打印wchar_t字符了。是不是感覺好像做了好多事,但是完成的卻是很簡單的事情?呵呵,其實(shí)我也有同感,但是沒有辦法。更簡單的辦法,當(dāng)然是直接用API(我一個(gè)是懶的去找了,二一個(gè)自己動(dòng)手轉(zhuǎn)換有些東西看的更清楚咯),但是這樣的轉(zhuǎn)換更靈活,
            在實(shí)際中應(yīng)該會用到的。 有了以上的基礎(chǔ),下面給出wchar_t字符串到char字符串的轉(zhuǎn)換代碼:
            char *W2C(const wchar_t *pw , char *pc)







            {
            //cout<<*pw<<endl;    //這樣是不能正確顯示的,你可以試試看顯示的是什么
                  *pc++ = *pw >> 8 ;
                  *pc = *pw ;
                  return 0 ;

            char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)
            {     char *ptemp = pcstr ;
                  if(pwstr!=NULL && pcstr!=NULL)
                  {  size_t wstr_len = wcslen(pwstr) ;
                      len = (len > wstr_len ) ?    wstr_len : len ;
                  while( len -- > 0)
                  {
                      W2C(pwstr , pcstr);
                      pwstr++ ;
                      pcstr +=2 ;      //和我們開始說的一樣+2,不是+1
                  }
                      *pcstr = '\0';
                      return ptemp ;
                  }
                  return 0 ;
            }    
            對上面的代碼進(jìn)行測試:
            int main(int arg , char *argv[])
            {
                  wchar_t pwstr[] = {'我' , '是' , '中' , '國' , '人'};
                  char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
                  memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );
                  wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
                  str.assign (pcstr);
                  cout<<str<<endl;
                  delete []pcstr ;
            }

            Feedback

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2008-01-08 16:40 by <a href=http://minidx.com>minidxer</a>
            相同的編碼的這樣轉(zhuǎn)沒問題,不同的話就有問題的
            比如gb的轉(zhuǎn)UTF16

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2008-01-20 19:41 by jsjkandy
            對于編碼還剛剛處于學(xué)習(xí)階段,不知道您是否可以給我介紹幾篇文章,或者給講一些不同的 編碼在不同的平臺上進(jìn)行移植的一些問題。呵呵。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-02 15:29 by biangji
            你好,我在c++中傳遞char*類型到j(luò)ava的時(shí)候出現(xiàn)如下問題
            #
            # An unexpected error has been detected by Java Runtime Environment:
            #
            # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x102156f9, pid=5280, tid=5672
            #
            # Java VM: Java HotSpot(TM) Client VM (11.0-b15 mixed mode, sharing windows-x86)
            # Problematic frame:
            # C [MSVCR71D.dll+0x156f9]
            #
            # An error report file with more information is saved as:
            # D:\Program Files\eclipse\workspace\jnaTestProject1\hs_err_pid5280.log
            #
            # If you would like to submit a bug report, please visit:
            # http://java.sun.com/webapps/bugreport/crash.jsp
            # The crash happened outside the Java Virtual Machine in native code.
            # See problematic frame for where to report the bug.
            #
            不知道是怎么回事,麻煩您解答,謝謝

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-02 15:30 by biangji
            不好意思,我發(fā)錯(cuò)了

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2009-03-05 21:19 by 寒蟬
            @biangji
            不好意思,呵呵,我java不會啊。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換[未登錄]  回復(fù)  更多評論   

            2010-10-18 15:51 by me
            setlocale...
            std::wcout << ..?

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2011-11-17 11:43 by todd
            wchar_t w_cn = '中' 這樣寫至少也應(yīng)該有個(gè)警告, 應(yīng)該用 wchar_t w_cn = L'中'

            輸出wchar_t字符串可以用 wcout

            char c_cn[2] .... c_cn[2] = ... 理論上是索引超出范圍

            wchar_t 的長度與編譯器實(shí)現(xiàn)有關(guān), 可能是2個(gè)字節(jié), 也可能是4個(gè)字節(jié)

            這個(gè)轉(zhuǎn)化方案有問題,理論上是錯(cuò)誤的,至少是靠不住的。

            char sz[] = "中"; 導(dǎo)致 sizeof(sz) 結(jié)果為4, 除掉結(jié)尾的'\0' 字符, 中字用了3個(gè)字符, (但這也可能是因?yàn)槲业拇a文件用的 utf-8 保存的, 不確定)

            unicode可以說只是一個(gè)字符集, 收 utf-8, utf-16, ucs4 等等編碼方式的支持。
            gb18030定義模糊, 其把字符集與編碼方式混為一談(也或者我讀得文檔表述有問題)

            utf-8, utf-16, ucs4 之間轉(zhuǎn)換只需解碼再編碼就可以了。 而與gb18030之間的轉(zhuǎn)化解碼后還要進(jìn)行字符集轉(zhuǎn)換后在編碼。

            比如給定漢字x, 其 unicode 對應(yīng) code point 是 xu, 其 utf-8 編碼是 utf8(xu);
            其gb18030的 code point 是 xk , 編碼是 gb18030(xk), 而 utf8(xu) 與 gb18030(xk) 可能想去甚遠(yuǎn)

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換[未登錄]  回復(fù)  更多評論   

            2012-06-22 12:28 by JK
            char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
            memset(pcstr , 0 , 2 * wcslen(pwstr)+1);
            wstr2cstr(pwstr , pcstr , wcslen(pwstr));

            三句代碼把 wcslen 調(diào)用了三次,為什么不先算出來,調(diào)三次不浪費(fèi)嗎?況且,你這里直接用 sizeof 更好,連函數(shù)調(diào)用都省去了。

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2012-11-27 07:28 by Martian
            可笑,完全錯(cuò)誤,錯(cuò)的沒邊了

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2012-11-29 17:05 by ikillmeba
            確實(shí),有很多的錯(cuò)誤,編譯器的問題,還有平臺的問題,都有可能

            # re: [轉(zhuǎn)]wchar_t與char轉(zhuǎn)換  回復(fù)  更多評論   

            2013-02-19 10:56 by ligand
            此文錯(cuò)得太離譜。

            C++語言標(biāo)準(zhǔn)沒有規(guī)定wchar_t是多少比特寬度!!!

            在類Unix/Linux系統(tǒng)中,wchar_t是32比特寬。

            即使在Windows平臺上,一個(gè)wchar_t漢字字符轉(zhuǎn)為DBCS(雙字節(jié)表示,簡體中文即指gb2312/gbk/gb18030,三者可視為同一),也不能直接靠移位操作、字節(jié)復(fù)制之類,而必須去查表。因?yàn)閣char_t漢字字符保存的是Unicode的碼值的UTF-16小尾表示,與gb2312/gbk/gb18030完全不同。這就好比gb2312/gbk/gb18030與繁體的Big5轉(zhuǎn)換,也必須只能去查表。
            国产精品成人无码久久久久久 | 久久久精品2019免费观看| 久久精品国产亚洲av麻豆蜜芽 | 久久se精品一区二区| 久久精品一区二区| 伊人久久精品影院| 亚洲AV无码久久精品狠狠爱浪潮| 五月丁香综合激情六月久久| 久久国产精品久久精品国产| 久久综合色区| 久久这里只有精品首页| 久久婷婷色香五月综合激情| 99re久久精品国产首页2020| 久久免费视频一区| 久久精品国内一区二区三区| 中文字幕久久波多野结衣av| 精品久久久久久无码人妻热| 久久精品亚洲一区二区三区浴池| 欧美一级久久久久久久大片| 久久精品国产亚洲AV无码偷窥| 久久精品国产精品亚洲下载 | 国产91色综合久久免费| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区 | 久久99精品久久久久久久不卡| 久久婷婷五月综合97色直播| 国产国产成人精品久久| 亚洲AV无码1区2区久久| 久久久久久久综合狠狠综合| 国产精品99久久久久久董美香| 狠狠色丁香久久婷婷综合| 久久精品人妻一区二区三区| 久久这里只有精品首页| 久久精品无码一区二区三区| 青青草原精品99久久精品66| 狠狠精品久久久无码中文字幕| 色综合久久中文字幕综合网| 国产农村妇女毛片精品久久| 日本免费久久久久久久网站| 久久精品国内一区二区三区| 久久久中文字幕| 久久久不卡国产精品一区二区 |