大小端問題
By unanao
<sunjianjiao@gmail.com>
一、什么是大小端問題
(From《Computer Systems,A Programer's Perspective》)在幾乎所有的機(jī)器上,多字節(jié)對(duì)象被存儲(chǔ)為連續(xù)的字節(jié)序列,對(duì)象的地址為所使用字節(jié)序列中最低字節(jié)地址。
小端:某些機(jī)器選擇在存儲(chǔ)器中按照從最低有效字節(jié)到最高有效字節(jié)的順序存儲(chǔ)對(duì)象,這種最低有效字節(jié)在最前面的表示方式被稱為小端法(little endian) 。這樣的存儲(chǔ)模式有點(diǎn)兒類似于把數(shù)據(jù)當(dāng)作字符串順序處理:地址由小向大增加,而數(shù)據(jù)從高位往低位放;
大端:某些機(jī)器則按照從最高有效字節(jié)到最低有效字節(jié)的順序儲(chǔ)存,這種最高有效字節(jié)在最前面的方式被稱為大端法(big endian) 。這種存儲(chǔ)模式將地址的高低和數(shù)據(jù)位權(quán)有效地結(jié)合起來,高地址部分權(quán)值高,低地址部分權(quán)值低,和我們的邏輯方法一致。
舉個(gè)例子來說名大小端: 比如一個(gè)int x, 地址為0x100, 它的值為0x1234567. 則它所占據(jù)的0x100, 0x101, 0x102, 0x103地址組織如下圖:

二、為什么會(huì)有大小端模式之分呢?
這是因?yàn)樵谟?jì)算機(jī)系統(tǒng)中,我們是以字節(jié)為單位的,每個(gè)地址單元都對(duì)應(yīng)著一個(gè)字節(jié),一個(gè)字節(jié)為 8bit。但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對(duì)于位數(shù)大于 8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個(gè)字節(jié),那么必然存在著一個(gè)如果將多個(gè)字節(jié)安排的問題。因此就導(dǎo)致了大端存儲(chǔ)模式和小端存儲(chǔ)模式。例如一個(gè)16bit的short型x,在內(nèi)存中的地址為0x0010,x的值為0x1122,那么0x11為高字節(jié),0x22為低字節(jié)。對(duì)于 大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,剛好相反。我們常用的X86結(jié)構(gòu)是小端模 式,而KEIL C51則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來選擇是大端模式還是小端模式。
三、如何區(qū)分大小端問題:
方法1:
#include <stdio.h>
int main(void)
{
int i = 1;
unsigned char *pointer;
pointer = (unsigned char *)&i;
if(*pointer)
{
printf("litttle_endian");
}
else
{
printf("big endian\n");
}
return 0;
}
C中的數(shù)據(jù)類型都是從內(nèi)存的低地址向高地址擴(kuò)展,取址運(yùn)算"&"都是取低地址。小端方式中(i占至少兩個(gè)字節(jié)的長(zhǎng)度)則i所分配的內(nèi)存最小地址那個(gè)字節(jié)中就存著1,其他字節(jié)是0。大端的話則1在i的最高地址字節(jié)處存放,char是一個(gè)字節(jié),所以強(qiáng)制將char型量p指向i,則p指向的一定是i的最低地址,那么就可以判斷p中的值是不是1來確定是不是小端。
方法2:
#include <stdio.h>
int main(void)
{
union {
short a;
char ch;
} u;
u.a = 1;
if (u.ch == 1)
{
printf("Littel endian\n");
}
else
{
printf("Big endian\n");
}
}
利用聯(lián)合體的特點(diǎn),數(shù)據(jù)成員共享內(nèi)存空間,union中元素的起始地址都是相同的——位于聯(lián)合的開始。 用char來截取感興趣的字節(jié)。
四、需要考慮大小端(字節(jié)順序)的情況
1、所寫的程序需要向不同的硬件平臺(tái)遷移,說不定哪一個(gè)平臺(tái)是大端還是小端,為了保證可移植性,一定提前考慮好。
2. 在不同類型的機(jī)器之間通過網(wǎng)絡(luò)傳送二進(jìn)制數(shù)據(jù)時(shí)。 一個(gè)常見的問題是當(dāng)小端法機(jī)器產(chǎn)生的數(shù)據(jù)被發(fā)送到大端法機(jī)器或者反之時(shí),接受程序會(huì)發(fā)現(xiàn),字(word)里的字節(jié)(byte)成了反序的。為了避免這類問 題,網(wǎng)絡(luò)應(yīng)用程序的代碼編寫必須遵守已建立的關(guān)于字節(jié)順序的規(guī)則,以確保發(fā)送方機(jī)器將它的內(nèi)部表示轉(zhuǎn)換成網(wǎng)絡(luò)標(biāo)準(zhǔn),而接受方機(jī)器則將網(wǎng)絡(luò)標(biāo)準(zhǔn)轉(zhuǎn)換為它的內(nèi)部標(biāo)準(zhǔn)。
3. 當(dāng)閱讀表示整數(shù)的字節(jié)序列時(shí)。這通常發(fā)生在檢查機(jī)器級(jí)程序時(shí),e.g.:反匯編得到的一條指令:
80483bd: 01 05 64 94 04 08 add %eax, 0x8049464
3. 當(dāng)編寫強(qiáng)轉(zhuǎn)的類型系統(tǒng)的程序時(shí)。如寫入的數(shù)據(jù)為u32型,但是讀取的時(shí)候卻是char型的。如:0x1234, 大端讀取為12時(shí),小端獨(dú)到的是34。
六、提高程序的可移植性
使用宏編譯
#ifdef LITTLE_ENDIAN
//小端的代碼
#else
//大端的代碼
#endif
七、大、小端之間的轉(zhuǎn)換
1、小端轉(zhuǎn)換為大端
#include <stdio.h>
void show_byte(char *addr, int len)
{
int i;
for (i = 0; i < len; i++)
{
printf("%.2x \t", addr[i]);
}
printf("\n");
}
int endian_convert(int t)
{
int result;
int i;
result = 0;
for (i = 0; i < sizeof(t); i++)
{
result <<= 8;
result |= (t & 0xFF);
t >>= 8;
}
return result;
}
int main(void)
{
int i;
int ret;
i = 0x1234567;
show_byte((char *)&i, sizeof(int));
ret = endian_convert(i);
show_byte((char *)&ret, sizeof(int));
return 0;
}
posted on 2012-12-26 16:06
胡滿超 閱讀(909)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
算法 、
轉(zhuǎn)載