轉(zhuǎn)自http://hi.baidu.com/serial_story/blog/item/7e110587c3ed8e29c75cc3c7.html
【大端(Big Endian)與小端(Little Endian)簡介】
Byte Endian是指字節(jié)在內(nèi)存中的組織,所以也稱它為Byte Ordering,或Byte Order。
對于數(shù)據(jù)中跨越多個字節(jié)的對象, 我們必須為它建立這樣的約定:
(1) 它的地址是多少?
(2) 它的字節(jié)在內(nèi)存中是如何組織的?
針對第一個問題,有這樣的解釋:
對于跨越多個字節(jié)的對象,一般它所占的字節(jié)都是連續(xù)的,它的地址等于它所占字節(jié)最低地址。(鏈表可能是個例外, 但鏈表的地址可看作鏈表頭的地址)。
比如: int x, 它的地址為0x100。 那么它占據(jù)了內(nèi)存中的Ox100, 0x101, 0x102, 0x103這四個字節(jié)(32位系統(tǒng),所以int占用4個字節(jié))。
上面只是內(nèi)存字節(jié)組織的一種情況: 多字節(jié)對象在內(nèi)存中的組織有一般有兩種約定。 考慮一個W位的整數(shù)。
它的各位表達(dá)如下:[Xw-1, Xw-2, ... , X1, X0],它的
MSB (Most Significant Byte, 最高有效字節(jié))為 [Xw-1, Xw-2, ... Xw-8];
LSB (Least Significant Byte, 最低有效字節(jié))為 [X7,X6,..., X0]。
其余的字節(jié)位于MSB, LSB之間。
LSB和MSB誰位于內(nèi)存的最低地址, 即誰代表該對象的地址?
這就引出了大端(Big Endian)與小端(Little Endian)的問題。
如果LSB在MSB前面, 既LSB是低地址, 則該機(jī)器是小端; 反之則是大端。
DEC (Digital Equipment Corporation,現(xiàn)在是Compaq公司的一部分)和Intel的機(jī)器(X86平臺)一般采用小端。
IBM, Motorola(Power PC), Sun的機(jī)器一般采用大端。
當(dāng)然,這不代表所有情況。有的CPU即能工作于小端, 又能工作于大端, 比如ARM, Alpha,摩托羅拉的PowerPC。 具體情形參考處理器手冊。
具體這類CPU是大端還是小端,應(yīng)該和具體設(shè)置有關(guān)。
(如,Power PC支持little-endian字節(jié)序,但在默認(rèn)配置時是big-endian字節(jié)序)
一般來說,大部分用戶的操作系統(tǒng)(如windows, FreeBsd,Linux)是Little Endian的。少部分,如MAC OS ,是Big Endian 的。
所以說,Little Endian還是Big Endian與操作系統(tǒng)和芯片類型都有關(guān)系。
Linux系統(tǒng)中,你可以在/usr/include/中(包括子目錄)查找字符串BYTE_ORDER(或
_BYTE_ORDER, __BYTE_ORDER),確定其值。BYTE_ORDER中文稱為字節(jié)序。這個值一般在endian.h或machine/endian.h文件中可以找到,有時在feature.h中,不同的操作系統(tǒng)可能有所不同。
對于一個數(shù)0x1122
使用Little Endian方式時,低字節(jié)存儲0x22,高字節(jié)存儲0x11
而使用Big Endian方式時, 低字節(jié)存儲0x11, 高字節(jié)存儲0x22
經(jīng)一網(wǎng)友指正,才知道,上面的描述,是不準(zhǔn)確的.
想了下,覺得如下描述可能更合適:
使用Little Endian方式存儲數(shù)據(jù)時,數(shù)據(jù)的LSB相對最沒意義的數(shù)據(jù)位,存放在低地址位置,這里的LSB也就是22了.也即,
低地址存儲0x22, 高地址存儲0x11
而使用Big Endian方式存儲數(shù)據(jù)時,數(shù)據(jù)的MSB最有意義的數(shù)據(jù)位,存放在低地址位置,這里的MSB也就是11了.也即
低地址存儲0x11, 高地址存儲0x22
助記:
1)所謂MSB (Most Significant Byte),名字很復(fù)雜,不知是否有人沒搞懂,反正我開始看到這個詞時候,就很糊涂,有點(diǎn)不完全理解.其實簡單說MSB就是,一個數(shù)字中,最重要的那位,
舉例來說,12004,中文讀作,一萬兩千零四,那最高位的1,就表示了一萬,此處就稱作MSB,最有意義的位.
2)一般常見的數(shù)據(jù)存儲,用文字寫出來的時候,其內(nèi)容書寫格式,多數(shù)是從低地址到高地址.
舉例,一個16進(jìn)制數(shù)是 0x11 22 33, 而存放的位置是
地址0x3000 中存放11
地址0x3001 中存放22
地址0x3002 中存放33
連起來就寫成地址0x3000-0x3002中存放了數(shù)據(jù)0x112233.
而這種存放和表示方式,正好符合大端.
解釋的有點(diǎn)亂,希望有人能看懂.
如果還有哪里有誤,還請各位繼續(xù)指正.謝謝.
【用函數(shù)判斷系統(tǒng)是Big Endian還是Little Endian】
bool IsBig_Endian()
//如果字節(jié)序為big-endian,返回true;
//反之為 little-endian,返回false
{
unsigned short test = 0x1122;
if(*( (unsigned char*) &test ) == 0x11)
return TRUE;
else
return FALSE;
}//IsBig_Endian()