• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            colorful

            zc qq:1337220912

             

            編寫跨平臺(tái)的軟件入門——有關(guān)字節(jié)對齊

            一,             為什么要跨平臺(tái)?

            你想過把你的 Windows 上編寫的程序在 Linux 編譯運(yùn)行嗎,以及在 Mac 或其他 OS 上運(yùn)行等等?反過來也一樣?這就需要涉及到跨平臺(tái)編程知識(shí)。這里需要注意的是,平時(shí)很多在一個(gè)平臺(tái)運(yùn)行的程序在跨平臺(tái)的時(shí)候變的不再正確。

            Java 并非真的是跨平臺(tái)的開發(fā)環(huán)境,它是運(yùn)行在它自己的平臺(tái)上。這里主要關(guān)注 C 和 C++ 的跨平臺(tái)開發(fā)。

            下面主要就幾個(gè)方面來討論跨平臺(tái)編程的注意事項(xiàng):

            1.  字節(jié)序

            2.  字節(jié)填充

            3.  其他

            二,             字節(jié)序

            大家都知道計(jì)算機(jī)使用兩種字節(jié)序,一種是 little-endian ,另一種是 big-endian 。這主要是由于當(dāng)前流行的 CPU 之間的差異造成的,基本上是 IBM-PowerPC 使用的大序,而其他 CPU 使用的小序。

            這里先來介紹一下 little-endian 和 big-endian 之間的具體差異。

            X86 指 令集合使用小序( little-endian )字節(jié)順序;這就意味著多個(gè)字節(jié)值的最重要字節(jié)在地址的最低位。小序很早就使用,因?yàn)橛布菀讓?shí)現(xiàn),但和今天的制造商技術(shù)有點(diǎn)不同;但在第一代 IBM PC 機(jī)的 Vaxen 和 8086 處理器使用是它如此流行的主要原因。

            看一個(gè)例子:

            short example[2] = {0x0001,0x0302};

             

            按照 16 進(jìn)制的形式來顯示上面數(shù)據(jù)在內(nèi)存中的存儲(chǔ)方式:

            01 00 02 03

            我們看到對于數(shù)組的第一個(gè)元素,高 8 位應(yīng)該是 0 ,而最終存儲(chǔ)的時(shí)候是在低 8 位的后面。

            而 另一方面 PowerPC 和 Sparc 芯片是 big-endian 的,也就是說,最重要的字節(jié)存儲(chǔ)在較低的地址。對于 CPU 需要額外的電路實(shí)現(xiàn)這個(gè)功能,但對于今天的處理器技術(shù)與緩存控制技術(shù)相比較顯的微不足道。使用 BIG-ENDIAN 的最大好處是在使用低級(jí)調(diào)式器時(shí)比較容易理解數(shù)據(jù)的存儲(chǔ),同樣對于文件十六進(jìn)制 DUMP 或網(wǎng)絡(luò) Sniffer 顯示也是一樣的。

            對于 BIG-ENDIAN ,上面的例子中內(nèi)存如下表示:

            00 01 03 02

            這里需要注意的是:由于 BIG-ENDIAN 格式的 RAW 數(shù)據(jù)比較容易調(diào)式,如果我們有機(jī)會(huì)設(shè)計(jì)一個(gè)新的文件格式,那么使用 BIG-ENDIAN 格式,而不是根據(jù) CPU 架構(gòu)來決定。

            下面看幾個(gè)關(guān)于字節(jié)序的問題:

            1.  Long 型指針和 char 指針之間的轉(zhuǎn)換

            看下面這段代碼

            unsigned long value = 0x03020100;

            unsigned long *ptr = &value;

            unsigned char charVal;

            charVal = *(unsigned char *)ptr;

            程序的含義比較簡單,主要是從一個(gè)指向 long 的指針強(qiáng)制轉(zhuǎn)換為一個(gè)指向 char 的指針,這里假設(shè)指針指向的是最不重要的字節(jié)地址。

            在一個(gè) little-endian 處理器上, charVal 是 0 ,而在一個(gè) big-endian 處理器上, charVal 的值是 3 。這樣的問題是最難以發(fā)現(xiàn)的問題之一。

            為了避免這個(gè)錯(cuò)誤,使用一個(gè)臨時(shí)變量可以解決這個(gè)問題,如下:

            unsigned long temp = *ptr;

            charVal = (unsigned char)temp;

            上面的第二行代碼就保證將在任何架構(gòu)上都將最不重要的字節(jié)傳遞給 charVal ;編譯器處理具體的細(xì)節(jié)。

            2.  讀寫文件和寫網(wǎng)絡(luò)數(shù)據(jù)

            在從文件讀數(shù)據(jù)或?qū)憯?shù)據(jù)到文件的時(shí)候以及網(wǎng)絡(luò),對于字節(jié)順序的處理一定要小心;一定記住不能將多個(gè)字節(jié)的數(shù)據(jù)寫到文件或網(wǎng)絡(luò)上;例如:

            long val = 1;

            int result = write(fileDes,&val,sizeof(val));

            這段代碼在 little-endian 和 big-endian 機(jī)器上執(zhí)行的結(jié)果是不一樣的,如果讀數(shù)據(jù)的時(shí)候使用如下代碼:

            long val ;

            int result = read(fileDes,&val,sizeof(long));

            如果這兩段代碼分別位于 little-endian 和 big-endian 機(jī)器上,那么最終得到的 val 不是 1 ,而是 0x01000000 。

            解決多字節(jié)的讀寫有很多辦法,這里提供兩種。

            方法 1 :

            寫的代碼

            long val = 1;

            char buf[4];

            buf[0] = 0xff&val;

            buf[1] = (0xff00&val)>>8;

            buf[2] = (0xff0000&val)>>16;

            buf[3] = (0xff000000&val)>>24;

            int result = write(fileDes,buf,4);

            讀的代碼

            long val;

            char buf[4];

            int result = read(fileDes,buf,4);

            val = buf[0]|(buf[1]<<8)|(buf[2]<<16)|(buf[3]<<24);

            3.  運(yùn)行時(shí)檢查字節(jié)順序

            bool gIsBigEndian;

            void InitializeEndianFlag()

            {

            Short one = 1;

            Char *cp = (char *)&one;

            If(*cp == 0)

                gIsBigEndian = true;

            else

                gIsBigEndian = false;

            return ;

            }

            4.  字節(jié)交換對性能的影響

            由于字節(jié)順序的問題導(dǎo)致在處理的時(shí)候需要進(jìn)行字節(jié)交換或類似 2 中方法 1 的處理,這里稱為交換。通常情況下,做字節(jié)順序的交換并不影響,因?yàn)榻粨Q兩個(gè)字節(jié)或四個(gè)字節(jié)值只需要很少的 CPU 指令,并且完全可以在寄存器中執(zhí)行。

            但如果有很多數(shù)據(jù)需要交換,例如:一個(gè) 1024*768 位圖的圖像,在這么大的循環(huán)中執(zhí)行是影響性能的。

            另外對于 3 的運(yùn)行時(shí)檢查字節(jié)序的代碼要查看具體的位置。如果僅僅調(diào)用一次或幾次,不會(huì)影響性能,如果對于上面的這個(gè)循環(huán)中調(diào)用,對性能的影響是顯著的,這個(gè)時(shí)候可以使用一個(gè)預(yù)編譯宏來分別處理。例如:

            #ifdef BIG_ENDIAN//big-endian

            #else//little-endian

            #endif//BIG_ENDIAN

             

            三,             字節(jié)填充

            另一個(gè)寫可移植代碼的注意點(diǎn)是結(jié)構(gòu)體的字節(jié)對齊和填充。通常,在單個(gè)平臺(tái)上,如果需要保存一個(gè)結(jié)構(gòu)體到文件,那么是作為一個(gè)整體寫到文件的,如下:

            struct myStruct{

            char theChar;

            long theLong;

            };

            struct myStruct foo;

            foo.the Char = 1;

            foo.theLong = 2;

            如果我們已經(jīng)將數(shù)據(jù)按照 big-endian 進(jìn)行了交換,然后直接將整個(gè)結(jié)構(gòu)體寫到文件中。那么什么樣的數(shù)據(jù)會(huì)被寫到磁盤上呢?

            int result = write(fileDes, &foo, sizeof(foo));

            實(shí)際上我們不知道具體寫了什么數(shù)據(jù),因?yàn)槲覀冞€不知道這個(gè)代碼在什么平臺(tái)上運(yùn)行;實(shí)際上上面的 code 中會(huì)將垃圾數(shù)據(jù)寫到文件里,垃圾數(shù)據(jù)多少由 foo 分配到的內(nèi)存決定的。

            一種可能我們認(rèn)為的情況是:

             01 00 00 00 02

            但我們可能得到的這樣的數(shù)據(jù):

            01 f 8 00 00 00 02

            甚至是:

            01 e6 a7 20 00 00 00 02

            這里到底發(fā)生了什么? sizeof(foo) 是編譯器和處理器依賴的。

            有 些處理器不能從某些位置讀或?qū)懚鄠€(gè)字節(jié);幾乎所有的都不能從奇數(shù)地址來讀數(shù)據(jù)。通常他們只讀那些是 sizeof ( value )倍數(shù)的地址;對于四個(gè)字節(jié)只能讀地址是 4 個(gè)字節(jié)的倍數(shù),對于 2 個(gè)字節(jié)的 short 只能讀兩個(gè)字節(jié)倍數(shù)的地址。如果不遵從這個(gè)字節(jié)對齊的規(guī)律,處理器會(huì)拋出一個(gè)異常并且終止程序,有些系統(tǒng)上會(huì)鎖定機(jī)器(如果發(fā)生在 kernel 中)。

            有 時(shí),讀沒有對齊的數(shù)據(jù)需要花費(fèi)額外的時(shí)間。例如: PowerPC 能夠讀任何偶數(shù)地址,但對于那些不能被 4 整除的地址需要耗費(fèi)額外的總線周期。為了讀一個(gè) long 數(shù)值( value )在 2 整除而不是 4 整除的地址,它將讀四個(gè)字節(jié)并包括需要讀的值的上面兩個(gè)字節(jié),拋棄 2 個(gè)字節(jié),然后讀另外四個(gè)包含 value 低 2 個(gè)字節(jié)的字節(jié),同樣拋棄另外兩個(gè)。這與讀 4 個(gè)字節(jié)對齊的地址相比需要多訪問一次緩存。

            為了達(dá)到字節(jié)對齊的目的,編譯器會(huì)插入未命名的填充字節(jié)到結(jié)構(gòu)體中。至于插入幾個(gè)字節(jié)是通過編譯器和 OS 或庫內(nèi)存分配器一起決定的。

            在 Windows VC 編譯器中,可以使用 #pragma 來指定字節(jié)對齊的方式。

            總而言之,在定義結(jié)構(gòu)的時(shí)候要按照字節(jié)邊界對齊來定義,一般按照 4 個(gè)字節(jié),如果不夠就需要增加填充字段。

            另外對于結(jié)構(gòu)體寫文件或輸出到網(wǎng)絡(luò)上,最好的辦法是按照成員來逐個(gè)寫入或發(fā)送,這可以避免將垃圾數(shù)據(jù)存放到文件中或傳輸?shù)骄W(wǎng)絡(luò)上。

             

            四,             其他

            下面是幾個(gè)筆者在實(shí)際編寫代碼中發(fā)生過的錯(cuò)誤,這里與大家一道分析一下。

            1.         示例 1 :

            for(int i = 0;i<1000;i++)

            {

               ….

            }

            ...

            for(int i = 0;i<1000;i++)

            {

            ...

            }

            上面這段代碼是很普通的 C++ 代碼,但這段代碼不一定可以在所有的編譯器中都能編譯通過。主要的原因在于變量 i 的聲明。

            C++ 標(biāo) 準(zhǔn)說:在 for 循環(huán)內(nèi)部聲明的變量在 for 結(jié)束的時(shí)候無效,因此可以連續(xù)使用再次在 for 循環(huán)中使用該記數(shù)器變量。但很不幸的是很多編譯器都提供編譯選項(xiàng)來讓你覺得變量是否在 for 循環(huán)以后仍然有效。 VC 中默認(rèn)編譯選項(xiàng) /Ze 用來指定 for 循環(huán)變量的局部性,但并非所有的編譯器都是將這個(gè)選項(xiàng)作為默認(rèn)編譯參數(shù);所以為了能讓你的代碼可以在任意平臺(tái)編譯通過,使用 C 風(fēng)格的會(huì)有保證一點(diǎn);如下:

            int i = 0;

            for(i = 0;i<1000;i++)

            {

               ….

            }

            ...

            for(i = 0;i<1000;i++)

            {

            ...

            }

             

            2.         示例 2 : int 型變量的使用

            Int 型變量是一個(gè)奇怪的東西,它在 16 位機(jī)器上是 2 個(gè)字節(jié),在 32 位機(jī)上是 4 個(gè)字節(jié);將來可能在 64 位機(jī)上是 8 個(gè)字節(jié)。所以如果你的代碼中有對 int 的使用,而你想代碼可以在很多平臺(tái)上運(yùn)行,那么一定要注意了。看一下下面的情況:

            for(int i = 0;i<65540;i++)

            {

               ….

            }

            這個(gè)代碼可能在不同的平臺(tái)上得到不同的結(jié)果。如果這個(gè)代碼是在 16 位機(jī)器上運(yùn)行,那么得到的結(jié)果與 32 位機(jī)器上可能不同。

            同樣在使用 int 型變量寫文件和輸出到網(wǎng)絡(luò)時(shí)都要小心這個(gè)問題。最好的辦法是,在這些情況下不要使用 int 型變量; int 型變量僅僅在程序內(nèi)部使用。

            3.         關(guān)于 Bit field 的問題

            在 C 語法中有 bit field 的語法,可以根據(jù)需要來定義一個(gè)符號(hào)具體占用的 bit 數(shù),例如:

            typedef struct tagTest
            {
               char a:4;
               char b:2;
               char c:2;
            }TagTest,*PTagTest;

            實(shí)際上 tagTest 的字節(jié)數(shù)是 1 個(gè)字節(jié),成員 a 占用 4 位, b 和各占用兩位。這樣的好處是可以針對每個(gè)成員賦值而設(shè)置指定的位的值,例如:

            tagTest myTest;
            myTest.a = 10;
            myTest.b = 2;
            myTest.c = 1;

            假如你在 Windows 上是使用 VC 來編譯連接上面的程序,不管如何處理,你不會(huì)發(fā)生任何問題。但現(xiàn)在我們假設(shè)將 myTest 放入緩沖區(qū)中,然后在 MAC 機(jī)器上取出來,那么會(huì)發(fā)生什么來?看代碼:

            Windows:

            char buf[10];

            buf[0] = myTest;

            buf[2]=...

            int result = send(fd,buf,10,..);

             

            MAC:

            char buf[10];

            int ret = 0;

            int result = recv(fd,buf,10,..);

            PTagTest pTest = (PTagTest)&buf[0];

             

            if(pTest->a == 10)

               ret = 1;

            else

                ret = 0;

            ...

            那么 ret 的值是什么呢?我們期望是 1 但,結(jié)果不是 1 。如果你通過調(diào)試器來觀察一下 pTest 各成員的值你發(fā)現(xiàn):

            pTest->a = 6; pTest->b =2 ; pTest->c =2;

            細(xì) 心的讀者可能發(fā)現(xiàn)這里的問題所在,原因在于不同的編譯器對 bit field 進(jìn)行了不同的處理。在 Windows 平臺(tái)上, c 被放在字節(jié)的最高兩位,而 a 被放在字節(jié)的最低 4 位,在 MAC 上正好相反。但一定要注意,這是編譯器行為,而不是數(shù)據(jù)在傳輸過程中發(fā)生了字節(jié)的位交換。在 Windows 發(fā)送到網(wǎng)絡(luò)的時(shí)候, buf[0] 的內(nèi)容二進(jìn)制表示為:

            01 10 1010

            在 MAC 上 recv 之后, buf[0] 的內(nèi)容仍然與上面的相同。

            為了避免這個(gè)問題,請不要在寫文件或網(wǎng)絡(luò)輸出的時(shí)候使用 BIT FILED 語法,如果一定要使用請注意編譯器對位處理的區(qū)別。

            n         五 小結(jié)

            其 實(shí)實(shí)際工作中,大家認(rèn)為自己的代碼都不需要在多個(gè)平臺(tái)上運(yùn)行,而認(rèn)為跨平臺(tái)編碼與自己無關(guān);其實(shí)不然,好的編碼習(xí)慣是慢慢養(yǎng)成的,如果大家都知道這些跨平 臺(tái)編碼的細(xì)節(jié),在開始寫代碼的時(shí)候就開始避免這樣的問題,一旦有一天我們的代碼需要跨平臺(tái)運(yùn)行或一點(diǎn)我們要寫跨平臺(tái)代碼時(shí),我們就不會(huì)無從下手,而是順其 自然,因?yàn)槲覀円呀?jīng)具備了這樣的習(xí)慣。

            當(dāng)然這里的介紹只是一個(gè)開始,跨平臺(tái)編碼涉及的問題還很多,由于筆者經(jīng)驗(yàn)的限制不能一一描述。


            本文引用通告地址:http://lionwq.spaces.eepw.com.cn/articles/trackback/item/19180

            posted on 2012-05-15 16:21 多彩人生 閱讀(512) 評(píng)論(0)  編輯 收藏 引用


            只有注冊用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            導(dǎo)航

            統(tǒng)計(jì)

            常用鏈接

            留言簿(3)

            隨筆分類

            隨筆檔案

            搜索

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            国内精品久久久久影院免费| 亚洲欧美一区二区三区久久| 1000部精品久久久久久久久| 国产∨亚洲V天堂无码久久久| 久久精品国产亚洲网站| 久久精品亚洲乱码伦伦中文| 人妻无码αv中文字幕久久| 国产亚洲色婷婷久久99精品91| 久久亚洲AV成人无码软件| 国产亚洲婷婷香蕉久久精品| 麻豆精品久久久久久久99蜜桃 | 91久久九九无码成人网站| 人妻中文久久久久| 青青青青久久精品国产| 久久精品免费全国观看国产| 99久久精品免费看国产| 精品久久8x国产免费观看| 国产精品久久久久久久久久影院| 精品一区二区久久| 69久久夜色精品国产69| yy6080久久| 久久久久久久久久久免费精品| 狠狠干狠狠久久| 久久亚洲春色中文字幕久久久| 久久亚洲欧洲国产综合| 国产精品久久久久一区二区三区| 久久精品国产亚洲av影院| 久久久女人与动物群交毛片| 亚洲人成伊人成综合网久久久| 亚洲国产精品成人久久蜜臀| 久久99精品国产麻豆蜜芽| 99久久婷婷国产综合精品草原| 久久中文娱乐网| 国产成人久久精品二区三区| 亚洲国产精品久久久久久| 99久久国产热无码精品免费久久久久| 久久狠狠高潮亚洲精品| 久久99久久99小草精品免视看| 精品久久一区二区| 久久99精品国产99久久6| 亚洲国产日韩欧美综合久久|