• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            woaidongmao

            文章均收錄自他人博客,但不喜標(biāo)題前加-[轉(zhuǎn)貼],因其丑陋,見諒!~
            隨筆 - 1469, 文章 - 0, 評論 - 661, 引用 - 0
            數(shù)據(jù)加載中……

            Intel TBB:Pipeline,軟件流水線的威力

            參觀過工廠裝配線的人一定對流水線這個名字不陌生,半成品在皮帶機上流過一系列的流水線節(jié)點,每個節(jié)點以自己的方式進一步裝配,然后傳給下一節(jié)點。現(xiàn)代的高性能CPU均采用了這種流水線設(shè)計,將計算任務(wù)分為取指,譯碼,執(zhí)行,訪存,反饋等幾個階段。采用流水線設(shè)計的最大優(yōu)點就是增加了系統(tǒng)吞吐量,例如,當(dāng)?shù)谝粭l指令處于執(zhí)行階段的時候,譯碼單元可以在翻譯第二條指令,而取指單元則可以去加載第三條指令。甚至,在某些節(jié)點還可以并行執(zhí)行,例如,現(xiàn)代的MIMD多指令多數(shù)據(jù)的計算機,可以在同一時間執(zhí)行多條指令,或者同時更新多個數(shù)據(jù)。

             

            Intel認識到頻率已成為CPU性能瓶頸之后,多核處理器應(yīng)運而生。如今高性能程序設(shè)計的根本已經(jīng)轉(zhuǎn)變?yōu)槿绾胃浞值睦?/span>CPU資源,更快更多地處理數(shù)據(jù),而Intel所開發(fā)的開源 TBB庫巧妙的利用了流水線這種思想,實現(xiàn)了一個自適應(yīng)的高性能軟件流水線TBB::pipeline。本文將會以text_filter為例,簡單介紹pipeline的實現(xiàn)原理和一些關(guān)鍵技術(shù)點,以求達到拋磚引玉的效果。

             

            介紹TBB::pipeline之前不得不先說一下TBB庫的引擎-task scheduler,它又被稱為TBB庫的心臟[Intel TBB nutshell book],是所有算法的基礎(chǔ)組件,用于驅(qū)動整個TBB庫的運作。例如,TBB庫所提供的parallel_for算法,里面就有task scheduler的蹤影,pipeline也不例外。

             

            先看看parallel_for的實現(xiàn):

             

            template<typename Range, typename Body>

             

            void parallel_for( const Range& range, const Body& body, const simple_partitioner& partitioner=simple_partitioner() ) {

             

                internal::start_for<Range,Body,simple_partitioner>::run(range,body,partitioner);

             

            }

             

            再往下看:

             

                template<typename Range, typename Body, typename Partitioner>

             

                class start_for: public task {

             

                    Range my_range;

             

                    const Body my_body;

             

                    typename Partitioner::partition_type my_partition;

             

                    /*override*/ task* execute();

             

             

             

                    //! Constructor for root task.

             

                    start_for( const Range& range, const Body& body, Partitioner& partitioner ) :

             

            ...

             

                    }

             

            可以看到,class start_for是從task繼承的,而這個class task,就是task scheduler中進行任務(wù)調(diào)度的基本元素---task,這也是TBB庫的靈魂所在。相對于原生線程庫(Raw Thread),例如POSIX thread(pthread)TBB庫可以看作是一種對多線程更高層面的封裝,它不再使用thread,而是以task作為基本的任務(wù)抽象,從而能夠更好的整合計算資源并最優(yōu)化的調(diào)度任務(wù)。TBB庫的種種優(yōu)點,如自動調(diào)整工作負荷,系統(tǒng)擴展性等,全是拜task scheduler所賜。TBB提供的每種算法都有其獨特的應(yīng)用背景,如果算法不能滿足用戶的需求,那么完全可以以task為基類派生出新類,擴展出新的任務(wù)執(zhí)行和調(diào)度算法。這種思想貫穿了TBB的整個設(shè)計,而TBB::pipeline,也是這種思想的典型體現(xiàn)。

             

            TBB::pipeline的優(yōu)點:

             

            保證數(shù)據(jù)執(zhí)行的順序

            線程負載自動調(diào)節(jié)

            更高的Cache命中率

            系統(tǒng)擴展性

             

            假如目前有這樣一項任務(wù),對一個文件的內(nèi)容進行分析,將每一個字符串的首字符改為大寫,然后寫入一個新文件里。

             

            一個傳統(tǒng)的串行執(zhí)行的解決方案是:

             

            分別創(chuàng)建讀入和寫出文件

             

            while (!EOF)

            {

            從文件讀入一個字符串

            首字符轉(zhuǎn)化為大寫字符

            寫入一個字符串到文件

            }

            關(guān)閉讀入和寫出文件的描述符

             

            這么簡單的過程,還有可能通過TBB::Pipeline來提供性能嗎?我們來看看Pipeline的解決方案:

             

            1.分別創(chuàng)建讀入和寫出文件描述符

             

            2.建立三個task,分別是從文件讀入一個字符串首字符轉(zhuǎn)化為大寫字符,“ 寫入一個字符串到文件,其中需要指定從文件讀入一個字符串寫入一個字符串到文件這兩個task為串行執(zhí)行。(為什么要串行執(zhí)行,請自行思考或者去看Intel TBBnutshell book)

             

            3.啟動Pipeline,Pipeline通過內(nèi)建的task scheduler來調(diào)度這些task的運行。

             

             

            用一個29MB的文件作為測試用例,在我的雙核機器上串行執(zhí)行的速度是 0.527582秒,而Pipeline的速度是0.446161,對于更復(fù)雜的邏輯,Pipeline的性能還會顯著提升。性能提升的奧秘,就在于Pipeline能夠自動根據(jù)系統(tǒng)情況,以并行方式執(zhí)行首字符轉(zhuǎn)化為大寫字符這個task

             

            具體的Pipeline的示例代碼和使用,可以去參考Intel TBBnutshell book,這里想繼續(xù)深究一下:

             

            1.  為什么Pipeline可以保證數(shù)據(jù)執(zhí)行的順序?既然TBB歸根到底是通過多線程執(zhí)行任務(wù),為什么不會在讀入先后兩個字符串后,后讀入的字符串先被下一個task處理?Pipeline里是不是有一個類似于FIFO 先進先出隊列之類的東西?

             

            2.  為什么Pipeline能夠自動地并行執(zhí)行首字符轉(zhuǎn)化為大寫字符這個task?如果這個task被并行執(zhí)行了,那么又怎么保證第一點?

             

            3.  Pipeline是怎么保證那些task被串行執(zhí)行的。

             

            4.  所謂自動根據(jù)系統(tǒng)情況,進行任務(wù)調(diào)度是怎么一回事?

             

            這些既是問題,也是Pipeline中的關(guān)鍵技術(shù)點,有心的可以去研讀一下Pipeline的代碼先睹為快。

             

            Intel TBBnutshell book -- <Intel Threading Building Blocks Outfitting C++ for Multi-Core Processor Parallelism>

             

            posted on 2009-05-02 01:53 肥仔 閱讀(3530) 評論(0)  編輯 收藏 引用 所屬分類: 庫 & 代碼段

            久久免费看黄a级毛片| 久久精品成人欧美大片| 亚洲AV无码久久精品色欲| 国产精品亚洲综合专区片高清久久久| 国产精品视频久久久| 久久精品人人做人人爽电影蜜月 | 99国产精品久久久久久久成人热| 噜噜噜色噜噜噜久久| 无码人妻少妇久久中文字幕| 热99re久久国超精品首页| 久久九九青青国产精品| 青青青青久久精品国产h| 国产精品伦理久久久久久| 理论片午午伦夜理片久久| 亚洲日韩欧美一区久久久久我 | 久久午夜无码鲁丝片秋霞| 国色天香久久久久久久小说| 久久人人爽人人澡人人高潮AV | 亚洲午夜福利精品久久| 久久久青草青青国产亚洲免观| 日本加勒比久久精品| 伊人久久大香线蕉亚洲| 91久久精一区二区三区大全| 国产成人精品白浆久久69| 久久综合精品国产一区二区三区| 中文字幕精品无码久久久久久3D日动漫 | 九九久久精品国产| 亚洲国产精品无码久久久不卡| 久久ZYZ资源站无码中文动漫| 久久99精品国产麻豆蜜芽| 亚洲狠狠婷婷综合久久蜜芽| 国内精品久久久久影院优| 久久久久国产视频电影| 久久久久99精品成人片直播| 青青国产成人久久91网| 久久婷婷成人综合色综合| 久久人妻少妇嫩草AV无码蜜桃 | 欧美精品九九99久久在观看| 伊人久久综合成人网| 成人精品一区二区久久 | 欧美久久综合九色综合|