一路向北
追逐夢想，永不停步......

隨筆-4 評論-40 文章-117 trackbacks-0

項目越來越大，每次需要重新編譯整個項目都是一件很浪費時間的事情。Research了一下，找到以下可以幫助提高速度的方法，總結一下。

　　tmpfs

　　有人說在Windows下用了RAMDisk把一個項目編譯時間從4.5小時減少到了5分鐘，也許這個數字是有點夸張了，不過粗想想，把文件放到內存上做編譯應該是比在磁盤上快多了吧，尤其如果編譯器需要生成很多臨時文件的話。

　　這個做法的實現成本最低，在Linux中，直接mount一個tmpfs就可以了。而且對所編譯的工程沒有任何要求，也不用改動編譯環境。

　　mount -t tmpfs tmpfs ~/build -o size=1G

　　用2.6.32.2的Linux Kernel來測試一下編譯速度：

　　用物理磁盤：40分16秒

　　用tmpfs：39分56秒

　　呃……沒什么變化?？磥砭幾g慢很大程度上瓶頸并不在IO上面。但對于一個實際項目來說，編譯過程中可能還會有打包等IO密集的操作，所以只要可能，用tmpfs是有益無害的。當然對于大項目來說，你需要有足夠的內存才能負擔得起這個tmpfs的開銷。

　　make -j

　　既然IO不是瓶頸，那CPU就應該是一個影響編譯速度的重要因素了。

　　用make -j帶一個參數，可以把項目在進行并行編譯，比如在一臺雙核的機器上，完全可以用make -j4，讓make最多允許4個編譯命令同時執行，這樣可以更有效的利用CPU資源。

　　還是用Kernel來測試：

　　用make： 40分16秒

　　用make -j4：23分16秒

　　用make -j8：22分59秒

　　由此看來，在多核CPU上，適當的進行并行編譯還是可以明顯提高編譯速度的。但并行的任務不宜太多，一般是以CPU的核心數目的兩倍為宜。

　　不過這個方案不是完全沒有cost的，如果項目的Makefile不規范，沒有正確的設置好依賴關系，并行編譯的結果就是編譯不能正常進行。如果依賴關系設置過于保守，則可能本身編譯的可并行度就下降了，也不能取得最佳的效果。

　　ccache

　　ccache用于把編譯的中間結果進行緩存，以便在再次編譯的時候可以節省時間。這對于玩Kernel來說實在是再好不過了，因為經常需要修改一些Kernel的代碼，然后再重新編譯，而這兩次編譯大部分東西可能都沒有發生變化。對于平時開發項目來說，也是一樣。為什么不是直接用make所支持的增量編譯呢？還是因為現實中，因為Makefile的不規范，很可能這種“聰明”的方案根本不能正常工作，只有每次make clean再make才行。

　　安裝完ccache后，可以在/usr/local/bin下建立gcc，g++，c++，cc的symbolic link，鏈到/usr/bin/ccache上。總之確認系統在調用gcc等命令時會調用到ccache就可以了（通常情況下/usr/local /bin會在PATH中排在/usr/bin前面）。

　　繼續測試：

　　用ccache的第一次編譯(make -j4)：23分38秒

　　用ccache的第二次編譯(make -j4)：8分48秒

　　用ccache的第三次編譯(修改若干配置，make -j4)：23分48秒

　　看來修改配置（我改了CPU類型...）對ccache的影響是很大的，因為基本頭文件發生變化后，就導致所有緩存數據都無效了，必須重頭來做。但如果只是修改一些.c文件的代碼，ccache的效果還是相當明顯的。而且使用ccache對項目沒有特別的依賴，布署成本很低，這在日常工作中很實用。

　　可以用ccache -s來查看cache的使用和命中情況：

　　cache directory /home/lifanxi/.ccachecache hit 7165cache miss 14283called for link 71not a C/C++file 120no input file 3045files in cache 28566cache size 81.7 Mbytesmax cache size 976.6 Mbytes

　　可以看到，顯然只有第二編次譯時cache命中了，cache miss是第一次和第三次編譯帶來的。兩次cache占用了81.7M的磁盤，還是完全可以接受的。

　　distcc

　　一臺機器的能力有限，可以聯合多臺電腦一起來編譯。這在公司的日常開發中也是可行的，因為可能每個開發人員都有自己的開發編譯環境，它們的編譯器版本一般是一致的，公司的網絡也通常具有較好的性能。這時就是distcc大顯身手的時候了。

　　使用distcc，并不像想象中那樣要求每臺電腦都具有完全一致的環境，它只要求源代碼可以用make -j并行編譯，并且參與分布式編譯的電腦系統中具有相同的編譯器。因為它的原理只是把預處理好的源文件分發到多臺計算機上，預處理、編譯后的目標文件的鏈接和其它除編譯以外的工作仍然是在發起編譯的主控電腦上完成，所以只要求發起編譯的那臺機器具備一套完整的編譯環境就可以了。

　　distcc安裝后，可以啟動一下它的服務：

　　/usr/bin/distccd --daemon --allow 10.64.0.0/16

　　默認的3632端口允許來自同一個網絡的distcc連接。

　　然后設置一下DISTCC_HOSTS環境變量，設置可以參與編譯的機器列表。通常localhost也參與編譯，但如果可以參與編譯的機器很多，則可以把localhost從這個列表中去掉，這樣本機就完全只是進行預處理、分發和鏈接了，編譯都在別的機器上完成。因為機器很多時，localhost的處理負擔很重，所以它就不再“兼職”編譯了。

　　export DISTCC_HOSTS="localhost 10.64.25.1 10.64.25.2 10.64.25.3"

　　然后與ccache類似把g++，gcc等常用的命令鏈接到/usr/bin/distcc上就可以了。

　　在make的時候，也必須用-j參數，一般是參數可以用所有參用編譯的計算機CPU內核總數的兩倍做為并行的任務數。

　　同樣測試一下：

　　一臺雙核計算機，make -j4：23分16秒

　　兩臺雙核計算機，make -j4：16分40秒

　　兩臺雙核計算機，make -j8：15分49秒

　　跟最開始用一臺雙核時的23分鐘相比，還是快了不少的。如果有更多的計算機加入，也可以得到更好的效果。

　　在編譯過程中可以用distccmon-text來查看編譯任務的分配情況。distcc也可以與ccache同時使用，通過設置一個環境變量就可以做到，非常方便。

　　總結一下：

　　tmpfs：解決IO瓶頸，充分利用本機內存資源

　　make -j：充分利用本機計算資源

　　distcc：利用多臺計算機資源

　　ccache：減少重復編譯相同代碼的時間

　　這些工具的好處都在于布署的成本相對較低，綜合利用這些工具，就可以輕輕松松的節省相當可觀的時間。上面介紹的都是這些工具最基本的用法，更多的用法可以參考它們各自的man page。

posted on 2012-02-09 13:45 李陽閱讀(598) 評論(0) 編輯收藏引用所屬分類: Linux

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: Linux 信號 (轉) 【轉】IO - 同步，異步，阻塞，非阻塞（亡羊補牢篇）深入了解epoll (轉) 加速Linux程序編譯 Linux下Gcc生成和使用靜態庫和動態庫詳解（轉） Linux環境進程間通信共享內存（下） Linux環境進程間通信共享內存（上） shmat linux下獲取時間的若干函數 vim目錄樹插件NERD tree的安裝方法

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

<

2025年9月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

常用鏈接

留言簿(7)

隨筆分類

隨筆檔案

文章分類

文章檔案

鏈接

CodeGuru
CodeProject
sqlite中文站
VIM -幫助
Vim中文使用手冊
面向 Linux 程序員和系統管理員的技術資源
云風的 BLOG

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(7)

隨筆分類

隨筆檔案

文章分類

文章檔案

鏈接

友情鏈接

搜索

最新評論

閱讀排行榜

評論排行榜