peakflys注:本文轉(zhuǎn)載自http://blog.sina.com.cn/s/blog_49ec372801008fzt.html ,其中很多對gcc的講解很實(shí)用。
現(xiàn)代編譯器常見的編譯過程:
源文件-->預(yù)處理-->編譯/優(yōu)化-->匯編-->鏈接-->可執(zhí)行文件
對于gcc而言:
第一步 預(yù)處理
命令: gcc -o test.i -E test.c
或者 cpp -o test.i test.c (這里cpp不是指c plus plus,而是the C Preprocessor)
結(jié)果: 生成預(yù)處理后的文件test.i(可以打開后與預(yù)處理前進(jìn)行比對,當(dāng)然長度會嚇你一跳)
注解: 此步讀取c源程序,對偽指令和特殊符號進(jìn)行處理。包括宏(
peakflys注:通過加入-E -P 可以輕松的看到程序中宏替換后的代碼,便于編寫復(fù)雜宏時(shí)對照),條件編譯,包含的頭文件,以及一些特殊符號。基本上是一個(gè)replace的過程。
第二步 編譯及優(yōu)化
命令: gcc -o test.s -S test.i
或者 /路徑/cc1 -o test.s test.i
結(jié)果: 生成匯編文件test.s(可打開后查看源文件生成的匯編碼)
注解: 此步通過詞法和語法分析,確認(rèn)所有指令符合語法規(guī)則(否則報(bào)編譯錯(cuò)),之后翻譯成對應(yīng)的中間碼,在linux中被稱為RTL(Register Transfer Language),通常是平臺無關(guān)的,這個(gè)過程也被稱為編譯前端。編譯后端對RTL樹進(jìn)行裁減,優(yōu)化,得到在目標(biāo)機(jī)上可執(zhí)行的匯編代碼。使用不同的優(yōu)化 編譯選項(xiàng),可以看到在不同優(yōu)化級別下的代碼。了解編譯器對你寫的代碼到底做了什么。
第三步 匯編
命令: gcc -o test.o -c test.s
或者 as -o test.o test.s
結(jié)果: 生成目標(biāo)機(jī)器指令文件test.o(可用objdump查看)
注解: 此步把匯編語言代碼翻譯成目標(biāo)機(jī)器指令, 用file test.o 可以看到test.o是一個(gè)relocatable的ELF文件,通常包含.text .rodata代碼段和數(shù)據(jù)段。可用readelf -r test.o查看需要relocation的部分。gcc采用as作為其匯編器,所以匯編碼是AT&T格式的,而不是Intel格式,所以在用 gcc編譯嵌入式匯編時(shí),也要采用AT&T格式。
第四步 鏈接
命令: gcc -o test test.o
或者 ld -o test test.o
結(jié)果: 生成可執(zhí)行文件test (可用objdump查看)
注解: 此步將在一個(gè)文件中引用的符號同在另外一個(gè)文件中該符號的定義鏈接起來,使得所有的這些目標(biāo)文件鏈接成為一個(gè)能被操作系統(tǒng)加載到內(nèi)存的執(zhí)行體。(如果有不 到的符號定義,或者重復(fù)定義等,會報(bào)鏈接錯(cuò))。用file test 可以看到test是一個(gè)executable的ELF文件。
當(dāng)然鏈接的時(shí)候還會用到靜態(tài)鏈接庫,和動態(tài)連接庫。靜態(tài)庫和動態(tài)庫都是.o目標(biāo)文件的集合,但是使用相差很遠(yuǎn)。
靜態(tài)庫:
命令: ar -v -q test.a test.o
結(jié)果: 生成靜態(tài)鏈接庫test.a
注解: 靜態(tài)庫是在鏈接過程中將相關(guān)代碼提取出來加入可執(zhí)行文件的庫(即在鏈接的時(shí)候?qū)⒑瘮?shù)的代碼將從其所在地靜態(tài)鏈接庫中被拷貝到最終的可執(zhí)行程序中),ar只是將一些別的文件集合到一個(gè)文件中。可以打包,當(dāng)然也可以解包。(
peakflys注:通常自己編寫的常用底層都以靜態(tài)庫的形式提供,這樣一則減少上層邏輯的編譯時(shí)間,二則只需要在每個(gè)使用處包含文件名即可,不用關(guān)注庫文件的具體路徑)
動態(tài)庫:
命令: gcc -shared test.so test.o
或者/PATH/collect2 -shared test.so test.o (省略若干參數(shù))
結(jié)果: 生成動態(tài)連接庫test.so
注解: 動態(tài)庫在鏈接時(shí)只創(chuàng)建一些符號表,而在運(yùn)行的時(shí)候才將有關(guān)庫的代碼裝入內(nèi)存,映射到運(yùn)行時(shí)相應(yīng)進(jìn)程的虛地址空間(
peakflys注:通過這種特點(diǎn),我們可以設(shè)想,如果以后服務(wù)器的功能邏輯都以這種方式提供,那么對于C++這種編譯型語言也可以像解釋型的腳本語言一樣達(dá)到不停服的功能更新)。如果出錯(cuò),如找不到對應(yīng)的.so文件,會 在執(zhí)行的時(shí)候報(bào)動態(tài)連接錯(cuò)(可用LD_LIBRARY_PATH指定路徑)。用file test.so可以看到test.so是shared object的ELF文件。而靜態(tài)庫test.a只是一個(gè)集合包。
peakflys注:linux下,通常靜態(tài)庫以.a方式存在,動態(tài)庫以.so方式存在;windows下靜態(tài)庫以.lib存在,動態(tài)庫以.dll方式存在。
所以當(dāng)gcc編譯源文件時(shí)經(jīng)歷了test.c -> test.i -> RTL -> test.s -> test.o -> test的過程。當(dāng)然以上各步可以一步或若干步一起完成,如gcc -o test test.c直接得到可執(zhí)行文件。當(dāng)然也可以加上-v來查看在這個(gè)過程中,gcc總共做了多少事。