• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            我要啦免费统计
            filecache  32m
            內存映射文件 處理md5,io cpu都降下來了
            254file 6.54g
            多線程
            線程數 cpu_count()
            cpu變為38%  io減為 讀取16,348 寫入 2,000
            [2013-04-19 12:09:02] check is ok!
            [2013-04-19 12:10:06] check is ok!
            64s
            單線程
            [2013-04-19 11:57:00] is ok
            [2013-04-19 11:57:41] is ok
            41s
            -----------------------------------------------------------------------------------
            多線程 增加運行線程數
            cpu_count()*2;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:23:49] check is ok!
            [2013-04-19 13:24:14] check is ok!
            25s
            cpu 占用53%最多峰值
            cpu_count()*4;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:27:57] check is ok!
            [2013-04-19 13:28:19] check is ok!
            22s
            cpu90%峰值
            cpu_count()*8;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:30:44] check is ok!
            [2013-04-19 13:30:51] check is ok!
            7s
            cpu100%峰值
            cpu_count()*16
            [2013-04-19 13:33:23] check is ok!
            [2013-04-19 13:33:31] check is ok!
            8s
            cpu100%峰值


            單線程:

            2081 FILE
            11.9G
            [2013-04-24 15:32:28] is ok
            [2013-04-24 15:41:31] is ok
            9分鐘
            磁盤到了讀取的極限 20-30m/s
            cpu 未充滿 20%左右
            io為瓶頸


            總結:采用內存映射文件,一次性加載文件到內存塊計算md5 降io和io cpu損耗
            采用線程和cpu親緣性,充分利用釋放出來的cpu計算能力。
            實驗記過254哥文件6.5g  4核機器 開啟32哥線程分布到各個cpu 可以得到7秒的計算結果,比上面單線程未優化提升6倍速度,比上面多線程未優化提升9倍

            一個解決方案:
            一個文件: 分段md5,    特征為 md51|md52|md53……
            一個連續讀取文件的線程,
            每個md5作為一個任務計算。
            讀取持續性讀取,到一個連續性內存,分段任務給線程池分段計算,算完全體統計一下,
            如果過程中出現里面局部有一個是失敗的,那么整個數據都不用驗證了,其他任務也不用繼續了,直接認為失敗,這個概率很高。減少計算一大堆,切分粒度中一點別切太多片。每個任務結束的時候都釋放內存回收使用。
            io在獨立線程, 計算md5在線程池,這樣徹底分離,重復內存持續復用。

            posted on 2013-04-19 13:44 閱讀(2596) 評論(5)  編輯 收藏 引用 所屬分類: life

            評論:
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:17 | YzL
            這個跟MD5有啥關系??我還以為是單文件能多線程計算,這才跟MD5有點意義  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:32 | 蔡東赟
            @YzL
            我這里有上w個文件,解決當前問題為主要要務。

            單文件多線程md5 沒有那個功力啊。  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-03 12:08 | x x
            磁盤的讀取極限絕對不止20M-30M.  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:42 | 蔡東赟
            @x x

            system占用 40m/s了
            我程序也三四十m了。


              回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:43 | 蔡東赟
            @x x

            還有方案不?

            上面是虛擬內存用完了,卡在虛擬內存了。
            難道直接用系統的物理內存
              回復  更多評論
              
            久久久无码精品亚洲日韩蜜臀浪潮 | 欧美日韩中文字幕久久久不卡 | 一本大道久久香蕉成人网| 亚洲人成无码www久久久| 亚洲精品乱码久久久久久蜜桃图片 | 97久久超碰国产精品旧版| 91精品观看91久久久久久| 久久天天躁狠狠躁夜夜2020| 日韩av无码久久精品免费| 久久国产精品波多野结衣AV| 久久婷婷五月综合色奶水99啪| 日韩精品久久久久久久电影蜜臀| 国产午夜精品理论片久久 | 麻豆av久久av盛宴av| 久久国产精品久久久| 狠狠色丁香婷婷久久综合五月| 久久精品一本到99热免费| 久久国产影院| 91精品国产高清久久久久久国产嫩草 | 一本久久a久久精品综合夜夜| 久久毛片一区二区| 久久精品国产色蜜蜜麻豆| 狠色狠色狠狠色综合久久| 亚洲熟妇无码另类久久久| 少妇久久久久久被弄到高潮| 久久这里只有精品久久| 久久久噜噜噜www成人网| 人妻无码αv中文字幕久久琪琪布| 久久九九亚洲精品| 久久99热只有频精品8| 亚洲国产另类久久久精品| 久久午夜夜伦鲁鲁片免费无码影视 | 久久久一本精品99久久精品66| 午夜精品久久久久| 亚洲精品tv久久久久久久久久| 久久久久综合网久久| 2020最新久久久视精品爱| 97精品国产97久久久久久免费| 久久综合综合久久狠狠狠97色88 | 亚洲综合精品香蕉久久网| 少妇熟女久久综合网色欲|