• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            VC++ C++ C# Algorithm

            C++博客 首頁 新隨筆 聯系 聚合 管理
              21 Posts :: 3 Stories :: 31 Comments :: 0 Trackbacks
            今天偶爾看道了計算機體系結構中有關編譯器優化對提高Cache性能的影響一節,其中說道如果有數組,假設int a[5000][100],我們寫下如下代碼,則第一種效率高于第二種。原因是第二個循環以100*4字節的跨距訪問存儲器,勢必造成Cache失效次數增加,增大了訪存時間,而第一種循環順序地訪問一個Cache塊中地元素,減少了失效次數,提高了Cache性能。
            ?14-4(a)
            ?2
            for?(row=0;?row<5000;?row++)
            ?
            3{
            ?
            4??for?(?col=0;?col<100;?col++?)
            ?
            5??{
            ?
            6?????sum?=?sum?+?a[row][col];
            ?
            7??}

            ?
            8}

            ?
            94-4(b)
            10
            for?(col=0;?col<100;?col++?)
            11{
            12??for?(row=0;?row<5000;?row++)
            13??{
            14????sum?=?sum?+?a[row][col];
            15??}

            16}

            但我又想起了林銳博士的高質量C++編程手冊,其中寫到:在多重循環中,如果有可能,應當將最長的循環放在最內層,最短的循環放在最外層,以減少CPU 跨切循環層的次數。按照他的說法,上面二種寫法,后一種比較好,這不就跟體系結構書上說的矛盾了嗎?我不知道誰對誰錯,也不知道減少CPU 跨切循環層的次數是怎么具體影響效率,大家不知有何看法。
            posted on 2006-12-17 23:14 大熊貓 閱讀(1393) 評論(4)  編輯 收藏 引用

            Feedback

            # re: 循環的效率 2006-12-18 11:14 LOGOS
            寫成 for (i=0; i<row*col; ++i)如何?  回復  更多評論
              

            # re: 循環的效率 2006-12-18 12:38 shephard
            CPU一個才多少錢,人腦一個要多少錢
            兩種寫法的CPU周期才差多少,在一個團隊里溝通兩種寫法的區別又要花多少人月
            說實話,覺得這樣在意效率真的沒什么意思
            畢竟近五年內,可能的巨大效率提升還是會發生在多線程上  回復  更多評論
              

            # re: 循環的效率 2006-12-18 12:49 WeiFeng
            原來早就有人對這點產生懷疑了,去看看吧
            http://www.linuxsir.org/bbs/printthread.php?t=248134  回復  更多評論
              

            # re: 循環的效率 2006-12-18 18:24 liuliu
            這個例子其實不好,因為這里的效率差別主要在于對內存中數組元素的訪問是否連續了。如果把內層循環內容改為空或者改為sum=1之類,對于for本身的耗費應該可以看到差別。
            如果沒有其他影響因素,把循環次數多的for寫在內層肯定是有好書的。
            首先,對于內層,每個for“本身”都執行了100*5000次,而對于外層,卻是不同,分別為100和5000,這里可能有些差別。
            另外,我想也是更主要的一點,(a)的內層循環連續執行100次后要被打斷一次執行外部循環,如果內層有內容,連續執行肯定可以更有效的利用register和cache,而每次打斷可能會需要一些外部的交換操作。相比之下,(b)就是連續執行5000次后被打斷一次,一共被打斷100次,這里的開銷差別如果在苛刻的條件下,肯定需要考慮的。
            不過,一般情況下,應該差別不大,特別是相對于內存甚至IO操作,比如上面這個例子的col和row。如果這兩者影響同時存在,考慮了for的問題而忘記了內存操作,那就是本末倒置了,畢竟一個是register或cache級別的,一個是memory級別的,差大了。
            個人理解,不一定對:)  回復  更多評論
              

            精产国品久久一二三产区区别 | 青青草国产97免久久费观看| 一级做a爰片久久毛片人呢| 久久国产精品99久久久久久老狼 | 久久亚洲AV无码精品色午夜麻豆| 香蕉久久久久久狠狠色| 久久久噜噜噜久久熟女AA片| 97久久精品无码一区二区天美| 久久精品国产亚洲Aⅴ蜜臀色欲| 久久精品中文字幕大胸| 国产精品久久波多野结衣| 老司机午夜网站国内精品久久久久久久久| 亚洲国产精品成人久久蜜臀| 青草国产精品久久久久久| 久久久久九九精品影院| 国内精品久久久久| 狠狠色婷婷久久综合频道日韩| 大美女久久久久久j久久| 人妻无码精品久久亚瑟影视| 亚洲国产二区三区久久| 国产亚洲精久久久久久无码| 伊人色综合久久天天人守人婷| 久久精品国产亚洲欧美| 无码人妻少妇久久中文字幕蜜桃| 久久亚洲国产精品五月天婷| Xx性欧美肥妇精品久久久久久| 国产精品久久久久国产A级| 亚洲综合精品香蕉久久网| 伊色综合久久之综合久久| 久久久久无码国产精品不卡| 伊人久久精品线影院| 热久久国产精品| 精品欧美一区二区三区久久久| 99久久精品国产一区二区三区 | 久久香综合精品久久伊人| 精产国品久久一二三产区区别 | 日韩欧美亚洲综合久久影院Ds | 精品久久久久久久久久中文字幕| 久久精品国产亚洲AV香蕉| 无码日韩人妻精品久久蜜桃| 亚洲中文字幕无码久久综合网|