• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            關(guān)于for循環(huán)的執(zhí)行效率問題

            先提出這樣一個問題,是我昨天去一家公司面試時遇到的問題,
            模塊一:
            1  forint i= 0;i<N; i++)
            2  {
            3      A;
            4      B;
            5      C;
            6  }
            7 
            模塊二:
             1  forint i= 0;i<N; i++)
             2  {
             3      A;
             4  }
             5  forint i= 0;i<N; i++)
             6  {
             7      B;
             8  }
             9 
            10  forint i= 0;i<N; i++)
            11  {
            12      C;
            13  }
            舉出3個例子說明模塊一比模塊二執(zhí)行效率高,同樣舉出3個例子證明模塊二比模塊一執(zhí)行效率高。
            頭一次遇到這種問題,很棘手,我當(dāng)時的思路是從cpu執(zhí)行效率、內(nèi)存使用效率這兩個方面來考慮,列舉了一些可能的情況,應(yīng)付了過去。
            回來仔細(xì)想了一下,查了一些相關(guān)的帖子好像都有提過,但都不是很全面,先把問題拋在這個地方等搞清楚了在寫。

            我以前遇到的問題大概都是這種類型的:
             1 for(int i = 0;i<100;i++)
             2 {
             3    for(int j = 0;j<10000;j++)
             4    {
             5       //balabala
             6    }
             7 }
             8 和
             9 for(int i = 0;i<10000;i++)
            10 {
            11    for(int j = 0;j<100;j++)
            12    {
            13       //balabala
            14    }
            15 }
            這兩個程序那個執(zhí)行效率高,如果是以前我會毫不猶豫的說是第一個效率高,這是由于cpu切換的次數(shù)比較多導(dǎo)致性能下降,知道這句話不理解什么原理。我比較贊同下面的說法,
            1. 最長循環(huán)放到內(nèi)部可以提高I cache的效率,降低因為循環(huán)跳轉(zhuǎn)造成cache的miss以及流水線flush造成的延時
            2. 多次相同循環(huán)后也能提高跳轉(zhuǎn)預(yù)測的成功率,提高流水線效率
            3. 編譯器會自動展開循環(huán)提高效率, 這個不一定是必然有效的
            但不是絕對正確的,比如: 1 int x[1000][100];
             2 for(i=0;i<1000;i++)
             3   for(j=0;j<100;j++)
             4 {
             5   //access x[i][j]
             6 }
             7 
             8 int x[1000][100];
             9 for(j=0;j<100;j++)
            10   for(i=0;i=1000;i++)
            11 {
            12   //access x[i][j]
            13 }
            14 
            這時候第一個的效率就比第二個的高,原因嘛和硬件也有一些關(guān)系,CPU對于內(nèi)存的訪問都是通過數(shù)據(jù)緩存(cache)來進(jìn)行的。
            比如一個通用CPU,一級緩存(L1-Cache)的大小為16K,而其組織結(jié)構(gòu)為每32個字節(jié)一組(cache line size=32byte),
            也就是每次從二級緩存或內(nèi)存取數(shù)據(jù)到一級緩存,都是一次性取32個字節(jié)。
            對于上面的第一段代碼,每次取數(shù)據(jù)到一級緩存,都有連續(xù)8次內(nèi)存訪問可以共享一條緩存。
            而對于第二段代碼,每次取數(shù)據(jù)到一級緩存后,訪問一次后,基本上就沒有機(jī)會被再次使用了;
            上面這兩段代碼的區(qū)別在于第一段代碼,每次內(nèi)存訪問后,地址值需要加常數(shù)4,而第二段代碼,每次訪問后,地址值加400。
            如果沒有對于緩存訪問的區(qū)別,那么這時我們的確可以將長的循環(huán)放在里層,短的放在外層。但是而其主要原因不是一般人所想象的指令數(shù)目的區(qū)別的問題,
            而主要由于分支預(yù)測錯誤會引起的流水線中斷從而導(dǎo)致性能的降低。
                 最后一個問題,有人說while比for循環(huán)效率高,不知道這個假設(shè)是否正確,先立在這搞清楚再補(bǔ)充。









            posted on 2011-12-07 19:57 sheng 閱讀(3245) 評論(0)  編輯 收藏 引用


            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            導(dǎo)航

            <2025年8月>
            272829303112
            3456789
            10111213141516
            17181920212223
            24252627282930
            31123456

            統(tǒng)計

            常用鏈接

            留言簿(1)

            隨筆檔案

            收藏夾

            同行

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            91精品国产91久久久久久| 合区精品久久久中文字幕一区| 久久人人爽人人爽人人AV东京热 | 久久精品亚洲日本波多野结衣 | 亚洲精品乱码久久久久久| 久久免费高清视频| 日产久久强奸免费的看| 亚洲国产精品婷婷久久| 久久精品人妻中文系列| 久久99精品久久久久久不卡| 日日噜噜夜夜狠狠久久丁香五月 | 久久夜色精品国产噜噜麻豆 | 久久99精品久久久久久秒播| 亚洲AV无码久久精品狠狠爱浪潮| 国产精品狼人久久久久影院 | 亚洲伊人久久大香线蕉综合图片| 青青草原综合久久大伊人精品| 97久久国产综合精品女不卡| 久久人人爽人人爽人人片AV东京热| 精品人妻久久久久久888| 精品伊人久久久| 伊人情人综合成人久久网小说| 久久久国产精品网站| 国产精品对白刺激久久久| 久久99久国产麻精品66| 精品国产99久久久久久麻豆| 伊人色综合九久久天天蜜桃| 无码任你躁久久久久久久| 久久国产影院| 一日本道伊人久久综合影| 久久精品亚洲男人的天堂| 精品熟女少妇aⅴ免费久久| 精品国产婷婷久久久| 久久综合一区二区无码| 亚洲精品tv久久久久| 久久人人添人人爽添人人片牛牛| 亚洲国产成人久久笫一页| 波多野结衣久久| 欧洲成人午夜精品无码区久久| 久久精品无码专区免费东京热| 国产精品一久久香蕉国产线看观看|