在C語言中,結(jié)構(gòu)是一種復(fù)合數(shù)據(jù)類型,其構(gòu)成元素既可以是基本數(shù)據(jù)類型(如int、long、float等)的變
量,也可以是一些復(fù)合數(shù)據(jù)類型(如數(shù)組、結(jié)構(gòu)、聯(lián)合等)的數(shù)據(jù)單元。在結(jié)構(gòu)中,編譯器為結(jié)構(gòu)的每個(gè)成員按其自然對界(alignment)條件分配空間。
各個(gè)成員按照它們被聲明的順序在內(nèi)存中順序存儲(chǔ),第一個(gè)成員的地址和整個(gè)結(jié)構(gòu)的地址相同。
例如,下面的結(jié)構(gòu)各成員空間分配情況:
struct test
{
char x1;
short x2;
float x3;
char x4;
};
結(jié)構(gòu)的第一個(gè)成員x1,其偏移地址為0,占據(jù)了第1個(gè)字節(jié)。第二個(gè)成員x2為short類型,其起始地址必須2字節(jié)
對界,因此,編譯器在x2和x1之間填充了一個(gè)空字節(jié)。結(jié)構(gòu)的第三個(gè)成員x3和第四個(gè)成員x4恰好落在其自然對界地址上,在它們前面不需要額外的填充字
節(jié)。在test結(jié)構(gòu)中,成員x3要求4字節(jié)對界,是該結(jié)構(gòu)所有成員中要求的最大對界單元,因而test結(jié)構(gòu)的自然對界條件為4字節(jié),編譯器在成員x4后面
填充了3個(gè)空字節(jié)。整個(gè)結(jié)構(gòu)所占據(jù)空間為12字節(jié)。
更改C編譯器的缺省字節(jié)對齊方式
在缺省情況下,C編譯器為每一個(gè)變量或是數(shù)據(jù)單元按其自然對界條件分配空間。一般地,可以通過下面的方法來改變?nèi)笔〉膶鐥l件:
· 使用偽指令#pragma pack (n),C編譯器將按照n個(gè)字節(jié)對齊。
· 使用偽指令#pragma pack (),取消自定義字節(jié)對齊方式。
另外,還有如下的一種方式:
· __attribute((aligned
(n))),讓所作用的結(jié)構(gòu)成員對齊在n字節(jié)自然邊界上。如果結(jié)構(gòu)中有成員的長度大于n,則按照最大成員的長度來對齊。
· __attribute__
((packed)),取消結(jié)構(gòu)在編譯過程中的優(yōu)化對齊,按照實(shí)際占用字節(jié)數(shù)進(jìn)行對齊。
以上的n = 1, 2, 4, 8, 16...
第一種方式較為常見。
( via http://blog.csdn.net/wenddy112/articles/300583.aspx )
下面有一道在 CSDN論壇 上討論火熱的題:
Intel和微軟和本公司同時(shí)出現(xiàn)的面試題
#pragma pack(8)
struct s1{
short a;
long b;
};
struct s2{
char c;
s1 d;
long long e;
};
#pragma pack()
問
1.sizeof(s2) = ?
2.s2的c后面空了幾個(gè)字節(jié)接著是d?
感謝 redleaves(ID最吊的網(wǎng)友) 的解答,結(jié)果如下:
sizeof(S2)結(jié)果為24.
成員對齊有一個(gè)重要的條件,即每個(gè)成員分別對齊.即每個(gè)成員按自己的方式對齊.
也就是說上面雖然指定了按8字節(jié)對齊,但并不是所有的成員都是以8字節(jié)對齊.其對齊的規(guī)則是,每個(gè)成員按其類型的對齊參數(shù)(通常是這個(gè)類型的大小)和指定對齊參數(shù)(這里是8字節(jié))中較小的一個(gè)對齊.并且結(jié)構(gòu)的長度必須為所用過的所有對齊參數(shù)的整數(shù)倍,不夠就補(bǔ)空字節(jié).
S1中,成員a是1字節(jié)默認(rèn)按1字節(jié)對齊,指定對齊參數(shù)為8,這兩個(gè)值中取1,a按1字節(jié)對齊;成員b是4個(gè)字節(jié),默認(rèn)是按4字節(jié)對齊,這時(shí)就按4字節(jié)對齊,所以sizeof(S1)應(yīng)該為8;
S2中,c和S1中的a一樣,按1字節(jié)對齊,而d
是個(gè)結(jié)構(gòu),它是8個(gè)字節(jié),它按什么對齊呢?對于結(jié)構(gòu)來說,它的默認(rèn)對齊方式就是它的所有成員使用的對齊參數(shù)中最大的一個(gè),S1的就是4.所以,成員d就是
按4字節(jié)對齊.成員e是8個(gè)字節(jié),它是默認(rèn)按8字節(jié)對齊,和指定的一樣,所以它對到8字節(jié)的邊界上,這時(shí),已經(jīng)使用了12個(gè)字節(jié)了,所以又添加了4個(gè)字節(jié)
的空,從第16個(gè)字節(jié)開始放置成員e.這時(shí),長度為24,已經(jīng)可以被8(成員e按8字節(jié)對齊)整除.這樣,一共使用了24個(gè)字節(jié).
a b
S1的內(nèi)存布局:11**,1111,
c
S1.a
S1.b
d
S2的內(nèi)存布局:1***,11**,1111,****11111111
這里有三點(diǎn)很重要:
1.每個(gè)成員分別按自己的方式對齊,并能最小化長度
2.復(fù)雜類型(如結(jié)構(gòu))的默認(rèn)對齊方式是它最長的成員的對齊方式,這樣在成員是復(fù)雜類型時(shí),可以最小化長度
3.對齊后的長度必須是成員中最大的對齊參數(shù)的整數(shù)倍,這樣在處理數(shù)組時(shí)可以保證每一項(xiàng)都邊界對齊
補(bǔ)充一下,對于數(shù)組,比如:
char
a[3];這種,它的對齊方式和分別寫3個(gè)char是一樣的.也就是說它還是按1個(gè)字節(jié)對齊.
如果寫: typedef char Array3[3];
Array3這種類型的對齊方式還是按1個(gè)字節(jié)對齊,而不是按它的長度.
不論類型是什么,對齊的邊界一定是1,2,4,8,16,32,64....中的一個(gè).