從編譯器角度分析C語(yǔ)言中數(shù)組名和指針的區(qū)別
數(shù)組名和指針是兩個(gè)往往很容易讓人們混淆的概念,
很多人以為數(shù)組名就是一個(gè)指針,
也有很多人知道數(shù)組名不同于指針但是僅知道數(shù)組名的值不能像指針一樣改變
例如你可以寫出下面這樣的代碼:
int *p;
p++;
卻不能寫這樣的代碼:
int a[];
a++;
那么數(shù)組名跟指針之間到底有什么區(qū)別呢?
第一,在聲明上,只有作為函數(shù)參數(shù)的數(shù)組名編譯器總是轉(zhuǎn)化成指針,
其他情況下,數(shù)組名就是數(shù)組名,指針就是指針,二者不能混淆,
你不能在一個(gè)文件中定義一個(gè)數(shù)組,而在另一個(gè)文件中把它聲明成一個(gè)指針。
char a[]; //定義一個(gè)數(shù)組a
extern char* a; //在另一個(gè)文件中將a聲明成一個(gè)指針
在編譯器中,符號(hào)表用來(lái)存放C語(yǔ)言中有關(guān)標(biāo)識(shí)符的屬性信息,這些信息集中反應(yīng)了標(biāo)識(shí)符的特征屬性。
等到詞法分析到代碼聲稱的各個(gè)階段的時(shí)候,編譯器需要根據(jù)源代碼提出的要求,從表中獲取不同標(biāo)識(shí)符的不同屬性。
值得注意的是,數(shù)組標(biāo)識(shí)符的屬性和指針是完全不同的。
因此,在一個(gè)文件中定義一個(gè)數(shù)組的時(shí)候,編譯器會(huì)把它記錄在符號(hào)表中,而在編譯器分析另一個(gè)文件中的聲明時(shí),通過(guò)符號(hào)的語(yǔ)義檢查發(fā)現(xiàn)不一致。
也許這樣的聲明可以編譯通過(guò)(在gcc下通過(guò)了),但是把一個(gè)數(shù)組名當(dāng)成一個(gè)指針來(lái)使用,別指望它能運(yùn)行起來(lái)。
第二,指針是一個(gè)變量,而數(shù)組名不是。
數(shù)組名是數(shù)組的首地址,它本身就是一個(gè)地址,對(duì)應(yīng)到匯編語(yǔ)言級(jí)別就是一個(gè)常量,一個(gè)固定的數(shù)(地址)。
因此數(shù)組名不能進(jìn)行++,--等運(yùn)算。
在大多數(shù)編譯器中,對(duì)數(shù)組的引用a[i]總是被編譯器改寫成*(a+i)的格式。
也就是說(shuō),編譯器每遇到a[i],都會(huì)把它當(dāng)作*(a+i)來(lái)處理。
我們都知道,*addr表示內(nèi)存中(addr)的位置存儲(chǔ)的值,
比如*0x8048000就表示地址為0x8048000的內(nèi)存中所存儲(chǔ)的值。
所以a[i]就表示a的值加上i所得到的數(shù)作為一個(gè)內(nèi)存地址里面所存儲(chǔ)的值。
那么a的值是什么呢 ???
編譯器在做詞法分析和語(yǔ)法分析的時(shí)候,遇到一個(gè)數(shù)組的定義,就會(huì)把數(shù)組的有關(guān)信息匯集在一個(gè)叫做“內(nèi)情向量”或“信息向量”的表格中,其中的信息包括數(shù)組的類型,維數(shù),各維的上、下邊界,以及數(shù)組的首地址,然后將這個(gè)“內(nèi)情向量”相關(guān)信息存儲(chǔ)在符號(hào)表中。
數(shù)組定義后位置就是固定的,因此其首地址可以在編譯階段得到。
當(dāng)編譯器到達(dá)代碼生成的各階段時(shí),每次遇到數(shù)組名這個(gè)標(biāo)識(shí)符,編譯器都會(huì)從符號(hào)表中取出這個(gè)數(shù)組的首地址,然后用這個(gè)地址來(lái)替代數(shù)組名,例如,假設(shè)數(shù)組a起始地址是0x8048000,則a[1]就會(huì)被編譯器轉(zhuǎn)化成*(0x8048000+1),
因此在生成的匯編代碼中,數(shù)組名已經(jīng)完全被轉(zhuǎn)化成一個(gè)常量,一個(gè)固定的數(shù)(地址)。
但是
對(duì)于指針p,它是一個(gè)變量,其值存儲(chǔ)在地址&p中,這個(gè)值在編譯時(shí)是不能得到的。
因?yàn)槭亲兞浚灾羔樋梢宰鳛楸磉_(dá)式中的左值操作,
如++或--,而被認(rèn)為是常量的數(shù)組名卻不可以,正如你可以騎走一輛自行車,但是不能騎走一棵樹(shù)。
另外,C語(yǔ)言把 數(shù)組下標(biāo) 改寫成 指針偏移量 的 根本原因 是
指針偏移量是底層硬件所使用的基本模型。
第三,對(duì)數(shù)組的引用,如a[i],或*(a+1),需要訪存一次;而對(duì)指針的引用,如*(p+1),需要訪存兩次。
a被認(rèn)為是常數(shù),所以取*(a+1)的值只需將a所表示的常數(shù)加1,然后從得到的地址里訪存取一次即可。
對(duì)于指針,需要先從&p這個(gè)地址里把p的值取出來(lái),然后加1,再?gòu)牡玫降牡刂防镌L存取一次,一共需要兩次訪存。
第四,假設(shè)a是一個(gè)數(shù)組名,而p是一個(gè)指針,當(dāng)你使用 a 和 &a 時(shí),得到值是一樣的,都是數(shù)組的起始地址。
而使用 p 和 &p 時(shí),得到的值是不一樣的, p 表示指針 p 所指向的地址,而 &p 表示 p 這個(gè)變量的地址。
再假設(shè) p = a;
則 p 就表示數(shù)組a的起始地址,而&p是存儲(chǔ)數(shù)組a的起始地址的那個(gè)地址。
這是因?yàn)榫幾g器把a(bǔ)當(dāng)成數(shù)組首地址,而&a當(dāng)作數(shù)組第一個(gè)元素的地址,因此得到的值是一樣的。
另外,sizeof(a)得到的是a所表示的數(shù)組的大小,而sizeof(p)得到的是指針的大小。
轉(zhuǎn)自:
http://blog.chinaunix.net/uid-27004869-id-3301282.html