• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            我要啦免费统计
            filecache  32m
            內存映射文件 處理md5,io cpu都降下來了
            254file 6.54g
            多線程
            線程數 cpu_count()
            cpu變為38%  io減為 讀取16,348 寫入 2,000
            [2013-04-19 12:09:02] check is ok!
            [2013-04-19 12:10:06] check is ok!
            64s
            單線程
            [2013-04-19 11:57:00] is ok
            [2013-04-19 11:57:41] is ok
            41s
            -----------------------------------------------------------------------------------
            多線程 增加運行線程數
            cpu_count()*2;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:23:49] check is ok!
            [2013-04-19 13:24:14] check is ok!
            25s
            cpu 占用53%最多峰值
            cpu_count()*4;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:27:57] check is ok!
            [2013-04-19 13:28:19] check is ok!
            22s
            cpu90%峰值
            cpu_count()*8;
            線程分布給cpu親緣性  設置一下
            [2013-04-19 13:30:44] check is ok!
            [2013-04-19 13:30:51] check is ok!
            7s
            cpu100%峰值
            cpu_count()*16
            [2013-04-19 13:33:23] check is ok!
            [2013-04-19 13:33:31] check is ok!
            8s
            cpu100%峰值


            單線程:

            2081 FILE
            11.9G
            [2013-04-24 15:32:28] is ok
            [2013-04-24 15:41:31] is ok
            9分鐘
            磁盤到了讀取的極限 20-30m/s
            cpu 未充滿 20%左右
            io為瓶頸


            總結:采用內存映射文件,一次性加載文件到內存塊計算md5 降io和io cpu損耗
            采用線程和cpu親緣性,充分利用釋放出來的cpu計算能力。
            實驗記過254哥文件6.5g  4核機器 開啟32哥線程分布到各個cpu 可以得到7秒的計算結果,比上面單線程未優化提升6倍速度,比上面多線程未優化提升9倍

            一個解決方案:
            一個文件: 分段md5,    特征為 md51|md52|md53……
            一個連續讀取文件的線程,
            每個md5作為一個任務計算。
            讀取持續性讀取,到一個連續性內存,分段任務給線程池分段計算,算完全體統計一下,
            如果過程中出現里面局部有一個是失敗的,那么整個數據都不用驗證了,其他任務也不用繼續了,直接認為失敗,這個概率很高。減少計算一大堆,切分粒度中一點別切太多片。每個任務結束的時候都釋放內存回收使用。
            io在獨立線程, 計算md5在線程池,這樣徹底分離,重復內存持續復用。

            posted on 2013-04-19 13:44 閱讀(2616) 評論(5)  編輯 收藏 引用 所屬分類: life

            評論:
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:17 | YzL
            這個跟MD5有啥關系??我還以為是單文件能多線程計算,這才跟MD5有點意義  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-04-19 17:32 | 蔡東赟
            @YzL
            我這里有上w個文件,解決當前問題為主要要務。

            單文件多線程md5 沒有那個功力啊。  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-03 12:08 | x x
            磁盤的讀取極限絕對不止20M-30M.  回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:42 | 蔡東赟
            @x x

            system占用 40m/s了
            我程序也三四十m了。


              回復  更多評論
              
            # re: 多線程 md5 較驗 和 單線程校驗 校驗比較多的文件數 性能評價(初步成果)(2) 2013-05-05 21:43 | 蔡東赟
            @x x

            還有方案不?

            上面是虛擬內存用完了,卡在虛擬內存了。
            難道直接用系統的物理內存
              回復  更多評論
              
            久久人人爽人人爽人人av东京热| 久久精品男人影院| 国产成人久久精品一区二区三区 | 亚洲国产高清精品线久久| 欧美久久天天综合香蕉伊| 亚洲国产欧洲综合997久久| 99久久国产热无码精品免费久久久久| 亚洲综合久久夜AV | 久久中文字幕一区二区| 久久婷婷成人综合色综合| 久久久久噜噜噜亚洲熟女综合| 久久亚洲中文字幕精品有坂深雪| 久久久国产精华液| 99国内精品久久久久久久 | 欧美久久综合九色综合| 国产成人久久精品一区二区三区 | 久久精品国产69国产精品亚洲| 亚洲国产成人久久笫一页| 韩国三级中文字幕hd久久精品 | 国产成人久久777777| 丁香狠狠色婷婷久久综合| 蜜臀av性久久久久蜜臀aⅴ麻豆| 久久久久人妻一区精品| 久久99精品久久久久久噜噜| 久久99国产精品久久久| 99精品久久精品一区二区| 亚洲中文字幕无码久久综合网 | 久久久国产精品网站| 久久久久人妻精品一区二区三区| 亚洲国产视频久久| 波多野结衣久久一区二区| 久久久久99这里有精品10| 无码任你躁久久久久久久| 久久99精品久久久久久9蜜桃| 93精91精品国产综合久久香蕉| 久久国产乱子伦精品免费强| 日韩一区二区久久久久久| 久久九九全国免费| 色婷婷久久久SWAG精品| 久久久亚洲AV波多野结衣| 久久久女人与动物群交毛片|