在线看一区二区,欧美一区2区三区4区公司二百,亚洲午夜一区二区三区

循環的效率

今天偶爾看道了計算機體系結構中有關編譯器優化對提高Cache性能的影響一節，其中說道如果有數組，假設int a[5000][100]，我們寫下如下代碼，則第一種效率高于第二種。原因是第二個循環以100*4字節的跨距訪問存儲器，勢必造成Cache失效次數增加，增大了訪存時間，而第一種循環順序地訪問一個Cache塊中地元素，減少了失效次數，提高了Cache性能。

?14-4(a)

?2for?(row=0;?row<5000;?row++)

?3{

?4??for?(?col=0;?col<100;?col++?)

?5??{

?6?????sum?=?sum?+?a[row][col];

?7??}

?8}

?94-4(b)

10for?(col=0;?col<100;?col++?)

11{

12??for?(row=0;?row<5000;?row++)

13??{

14????sum?=?sum?+?a[row][col];

15??}

16}

但我又想起了林銳博士的高質量C++編程手冊，其中寫到：在多重循環中，如果有可能，應當將最長的循環放在最內層，最短的循環放在最外層，以減少CPU 跨切循環層的次數。按照他的說法，上面二種寫法，后一種比較好，這不就跟體系結構書上說的矛盾了嗎？我不知道誰對誰錯，也不知道減少CPU 跨切循環層的次數是怎么具體影響效率，大家不知有何看法。

posted on 2006-12-17 23:14 大熊貓閱讀(1417) 評論(4) 編輯收藏引用

Feedback

# re: 循環的效率 2006-12-18 11:14 LOGOS

寫成 for (i=0; i<row*col; ++i)如何？回復更多評論

# re: 循環的效率 2006-12-18 12:38 shephard

CPU一個才多少錢，人腦一個要多少錢
兩種寫法的CPU周期才差多少，在一個團隊里溝通兩種寫法的區別又要花多少人月
說實話，覺得這樣在意效率真的沒什么意思
畢竟近五年內，可能的巨大效率提升還是會發生在多線程上回復更多評論

# re: 循環的效率 2006-12-18 12:49 WeiFeng

原來早就有人對這點產生懷疑了，去看看吧
http://www.linuxsir.org/bbs/printthread.php?t=248134 回復更多評論

# re: 循環的效率 2006-12-18 18:24 liuliu

這個例子其實不好，因為這里的效率差別主要在于對內存中數組元素的訪問是否連續了。如果把內層循環內容改為空或者改為sum=1之類，對于for本身的耗費應該可以看到差別。
如果沒有其他影響因素，把循環次數多的for寫在內層肯定是有好書的。
首先，對于內層，每個for“本身”都執行了100*5000次，而對于外層，卻是不同，分別為100和5000，這里可能有些差別。
另外，我想也是更主要的一點，(a)的內層循環連續執行100次后要被打斷一次執行外部循環，如果內層有內容，連續執行肯定可以更有效的利用register和cache，而每次打斷可能會需要一些外部的交換操作。相比之下，(b)就是連續執行5000次后被打斷一次，一共被打斷100次，這里的開銷差別如果在苛刻的條件下，肯定需要考慮的。
不過，一般情況下，應該差別不大，特別是相對于內存甚至IO操作，比如上面這個例子的col和row。如果這兩者影響同時存在，考慮了for的問題而忘記了內存操作，那就是本末倒置了，畢竟一個是register或cache級別的，一個是memory級別的，差大了。
個人理解，不一定對:) 回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！



網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

VC++ C++ C# Algorithm

常用鏈接

留言簿(4)

隨筆檔案(21)

文章檔案(3)

相冊

資料網站

搜索

最新評論

評論排行榜

Feedback