• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            李帥的博客

            軟件開發(fā)愛好者

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              14 隨筆 :: 3 文章 :: 4 評(píng)論 :: 0 Trackbacks

            在Pentium以上的CPU中,提供了一條機(jī)器指令RDTSC(Read Time Stamp Counter)來讀取這個(gè)時(shí)間戳的數(shù)字,并將其保存在EDX:EAX寄存器對(duì)中。由于EDX:EAX寄存器對(duì)恰好是Win32平臺(tái)下C++語言保存函數(shù)返回值的寄存器,所以我們可以把這條指令看成是一個(gè)普通的函數(shù)調(diào)用。vc2003像這樣:
            inline unsigned __int64 GetTimeStampCount()
            {
            __asm RDTSC
            }
            對(duì)于vc6或者其他編譯器可能不行,因?yàn)镽DTSC不被C++的內(nèi)嵌匯編器直接支持,所以我們要用_emit偽指令直接嵌入該指令的機(jī)器碼形式0X0F、0X31,如下:
            inline unsigned __int64 GetTimeStampCount()
            {
            __asm _emit 0x0F
            __asm _emit 0x31
            }

             

             

            對(duì)關(guān)注性能的程序開發(fā)人員而言,一個(gè)好的計(jì)時(shí)部件既是益友,也是良師。計(jì)時(shí)器既可以作為程序組件幫助程序員精確的控制程序進(jìn)程,又是一件有力的調(diào)試武器,在有經(jīng)驗(yàn)的程序員手里可以盡快的確定程序的性能瓶頸,或者對(duì)不同的算法作出有說服力的性能比較。  
               
                在Windows平臺(tái)下,常用的計(jì)時(shí)器有兩種,一種是timeGetTime多媒體計(jì)時(shí)器,它可以提供毫秒級(jí)的計(jì)時(shí)。但這個(gè)精度對(duì)很多應(yīng)用場(chǎng)合而言還是太粗糙了。另一種是QueryPerformanceCount計(jì)數(shù)器,隨系統(tǒng)的不同可以提供微秒級(jí)的計(jì)數(shù)。對(duì)于實(shí)時(shí)圖形處理、多媒體數(shù)據(jù)流處理、或者實(shí)時(shí)系統(tǒng)構(gòu)造的程序員,善用QueryPerformanceCount/QueryPerformanceFrequency是一項(xiàng)基本功。  
               
                本文要介紹的,是另一種直接利用Pentium   CPU內(nèi)部時(shí)間戳進(jìn)行計(jì)時(shí)的高精度計(jì)時(shí)手段。以下討論主要得益于《Windows圖形編程》一書,第   15頁-17頁,有興趣的讀者可以直接參考該書。關(guān)于RDTSC指令的詳細(xì)討論,可以參考Intel產(chǎn)品手冊(cè)。本文僅僅作拋磚之用。  
                在   Intel   Pentium以上級(jí)別的CPU中,有一個(gè)稱為“時(shí)間戳(Time   Stamp)”的部件,它以64位無符號(hào)整型數(shù)的格式,記錄了自CPU上電以來所經(jīng)過的時(shí)鐘周期數(shù)。由于目前的CPU主頻都非常高,因此這個(gè)部件可以達(dá)到納秒級(jí)的計(jì)時(shí)精度。這個(gè)精確性是上述兩種方法所無法比擬的。  
               
                在Pentium以上的CPU中,提供了一條機(jī)器指令RDTSC(Read   Time   Stamp   Counter)來讀取這個(gè)時(shí)間戳的數(shù)字,并將其保存在EDX:EAX寄存器對(duì)中。由于EDX:EAX寄存器對(duì)恰好是Win32平臺(tái)下C++語言保存函數(shù)返回值的寄存器,所以我們可以把這條指令看成是一個(gè)普通的函數(shù)調(diào)用。像這樣:  
               
              inline   unsigned   __int64   GetCycleCount()  
              {  
                __asm   RDTSC  
              }  
               
              但是不行,因?yàn)镽DTSC不被C++的內(nèi)嵌匯編器直接支持,所以我們要用_emit偽指令直接嵌入該指令的機(jī)器碼形式0X0F、0X31,如下:  
               
              inline   unsigned   __int64   GetCycleCount()  
              {  
                __asm   _emit   0x0F  
                __asm   _emit   0x31  
              }  
               
              以后在需要計(jì)數(shù)器的場(chǎng)合,可以像使用普通的Win32   API一樣,調(diào)用兩次GetCycleCount函數(shù),比較兩個(gè)返回值的差,像這樣:  
               
              unsigned   long   t;  
              t   =   (unsigned   long)GetCycleCount();  
              //Do   Something   time-intensive   ...  
              t   -=   (unsigned   long)GetCycleCount();  
               
                《Windows圖形編程》第15頁編寫了一個(gè)類,把這個(gè)計(jì)數(shù)器封裝起來。有興趣的讀者可以去參考那個(gè)類的代碼。作者為了更精確的定時(shí),做了一點(diǎn)小小的改進(jìn),把執(zhí)行RDTSC指令的時(shí)間,通過連續(xù)兩次調(diào)用GetCycleCount函數(shù)計(jì)算出來并保存了起來,以后每次計(jì)時(shí)結(jié)束后,都從實(shí)際得到的計(jì)數(shù)中減掉這一小段時(shí)間,以得到更準(zhǔn)確的計(jì)時(shí)數(shù)字。但我個(gè)人覺得這一點(diǎn)點(diǎn)改進(jìn)意義不大。在我的機(jī)器上實(shí)測(cè),這條指令大概花掉了幾十到100多個(gè)周期,在   Celeron   800MHz的機(jī)器上,這不過是十分之一微秒的時(shí)間。對(duì)大多數(shù)應(yīng)用來說,這點(diǎn)時(shí)間完全可以忽略不計(jì);而對(duì)那些確實(shí)要精確到納秒數(shù)量級(jí)的應(yīng)用來說,這個(gè)補(bǔ)償也過于粗糙了。  
               
              這個(gè)方法的優(yōu)點(diǎn)是:  
               
              1.高精度。可以直接達(dá)到納秒級(jí)的計(jì)時(shí)精度(在1GHz的CPU上每個(gè)時(shí)鐘周期就是一納秒),這是其他計(jì)時(shí)方法所難以企及的。  
               
              2.   成本低。timeGetTime   函數(shù)需要鏈接多媒體庫winmm.lib,QueryPerformance*   函數(shù)根據(jù)MSDN的說明,需要硬件的支持(雖然我還沒有見過不支持的機(jī)器)和KERNEL庫的支持,所以二者都只能在Windows平臺(tái)下使用(關(guān)于DOS平臺(tái)下的高精度計(jì)時(shí)問題,可以參考《圖形程序開發(fā)人員指南》,里面有關(guān)于控制定時(shí)器8253的詳細(xì)說明)。但RDTSC指令是一條CPU指令,凡是i386平臺(tái)下Pentium以上的機(jī)器均支持,甚至沒有平臺(tái)的限制(我相信i386版本UNIX和Linux下這個(gè)方法同樣適用,但沒有條件試驗(yàn)),而且函數(shù)調(diào)用的開銷是最小的。  
               
              3.   具有和CPU主頻直接對(duì)應(yīng)的速率關(guān)系。一個(gè)計(jì)數(shù)相當(dāng)于1/(CPU主頻Hz數(shù))秒,這樣只要知道了CPU的主頻,可以直接計(jì)算出時(shí)間。這和   QueryPerformanceCount不同,后者需要通過QueryPerformanceFrequency獲取當(dāng)前計(jì)數(shù)器每秒的計(jì)數(shù)次數(shù)才能換算成時(shí)間。  
               
              這個(gè)方法的缺點(diǎn)是:  
               
              1.現(xiàn)有的C/C++編譯器多數(shù)不直接支持使用RDTSC指令,需要用直接嵌入機(jī)器碼的方式編程,比較麻煩。  
               
              2.數(shù)據(jù)抖動(dòng)比較厲害。其實(shí)對(duì)任何計(jì)量手段而言,精度和穩(wěn)定性永遠(yuǎn)是一對(duì)矛盾。如果用低精度的timeGetTime來計(jì)時(shí),基本上每次計(jì)時(shí)的結(jié)果都是相同的;而RDTSC指令每次結(jié)果都不一樣,經(jīng)常有幾百甚至上千的差距。這是這種方法高精度本身固有的矛盾。  
               
              關(guān)于這個(gè)方法計(jì)時(shí)的最大長(zhǎng)度,我們可以簡(jiǎn)單的用下列公式計(jì)算:  
               
              自CPU上電以來的秒數(shù)   =   RDTSC讀出的周期數(shù)   /   CPU主頻速率(Hz)  
               
              64位無符號(hào)整數(shù)所能表達(dá)的最大數(shù)字是1.8×10^19,在我的Celeron   800上可以計(jì)時(shí)大約700年(書中說可以在200MHz的Pentium上計(jì)時(shí)117年,這個(gè)數(shù)字不知道是怎么得出來的,與我的計(jì)算有出入)。無論如何,我們大可不必關(guān)心溢出的問題。  
               
              下面是幾個(gè)小例子,簡(jiǎn)要比較了三種計(jì)時(shí)方法的用法與精度  
               
              //Timer1.cpp   使用了RDTSC指令的Timer類//KTimer類的定義可以參見《Windows圖形編程》P15  
              //編譯行:CL   Timer1.cpp   /link   USER32.lib  
              #include   &ltstdio.h>  
              #include   "KTimer.h"  
              main()  
              {  
                unsigned   t;  
                KTimer   timer;  
                timer.Start();  
                Sleep(1000);  
                t   =   timer.Stop();  
                printf("Lasting   Time:   %d\n",t);  
              }  
               
              //Timer2.cpp   使用了timeGetTime函數(shù)  
              //需包含&ltmmsys.h>,但由于Windows頭文件錯(cuò)綜復(fù)雜的關(guān)系  
              //簡(jiǎn)單包含&ltwindows.h>比較偷懶:)  
              //編譯行:CL   timer2.cpp   /link   winmm.lib    
              #include   &ltwindows.h>  
              #include   &ltstdio.h>  
               
              main()  
              {  
                DWORD   t1,   t2;  
                t1   =   timeGetTime();  
                Sleep(1000);  
                t2   =   timeGetTime();  
                printf("Begin   Time:   %u\n",   t1);  
                printf("End   Time:   %u\n",   t2);  
                printf("Lasting   Time:   %u\n",(t2-t1));  
              }  
               
              //Timer3.cpp   使用了QueryPerformanceCounter函數(shù)  
              //編譯行:CL   timer3.cpp   /link   KERNEl32.lib  
              #include   &ltwindows.h>  
              #include   &ltstdio.h>  
               
              main()  
              {  
                LARGE_INTEGER   t1,   t2,   tc;  
                QueryPerformanceFrequency(&tc);  
                printf("Frequency:   %u\n",   tc.QuadPart);  
                QueryPerformanceCounter(&t1);  
                Sleep(1000);  
                QueryPerformanceCounter(&t2);  
                printf("Begin   Time:   %u\n",   t1.QuadPart);  
                printf("End   Time:   %u\n",   t2.QuadPart);  
                printf("Lasting   Time:   %u\n",(   t2.QuadPart-   t1.QuadPart));  
              }  
               
              ////////////////////////////////////////////////  
              //以上三個(gè)示例程序都是測(cè)試1秒鐘休眠所耗費(fèi)的時(shí)間  
              file://測(cè)/試環(huán)境:Celeron   800MHz   /   256M   SDRAM      
              //                     Windows   2000   Professional   SP2  
              //                     Microsoft   Visual   C++   6.0   SP5  
              ////////////////////////////////////////////////  
               
              以下是Timer1的運(yùn)行結(jié)果,使用的是高精度的RDTSC指令  
              Lasting   Time:   804586872  
               
              以下是Timer2的運(yùn)行結(jié)果,使用的是最粗糙的timeGetTime   API  
              Begin   Time:   20254254  
              End   Time:   20255255  
              Lasting   Time:   1001  
               
              以下是Timer3的運(yùn)行結(jié)果,使用的是QueryPerformanceCount   API  
              Frequency:   3579545  
              Begin   Time:   3804729124  
              End   Time:   3808298836  
              Lasting   Time:   3569712  


            歡迎收藏本文 一起讀網(wǎng) 【獲取CPU時(shí)間戳代碼 使用CPU時(shí)間戳進(jìn)行高精度計(jì)時(shí) http://www.1qidu.com/?action-viewnews-itemid-16841
            一起讀網(wǎng)參考地址:http://www.1qidu.com/?action-viewnews-itemid-16841

            posted on 2010-06-09 14:05 李帥 閱讀(4044) 評(píng)論(4)  編輯 收藏 引用

            評(píng)論

            # re: 獲取CPU時(shí)間戳代碼 使用CPU時(shí)間戳進(jìn)行高精度計(jì)時(shí) 2013-05-09 22:30 skyshore
            請(qǐng)問CPU主頻不定時(shí)(例如主板支持的各種省電技術(shù)或intel i5的睿頻技術(shù))怎么計(jì)算?  回復(fù)  更多評(píng)論
              

            # re: 獲取CPU時(shí)間戳代碼 使用CPU時(shí)間戳進(jìn)行高精度計(jì)時(shí) 2015-06-12 09:38 pffang
            @skyshore
            別用CPU頻率,用QueryPerformanceCounter
              回復(fù)  更多評(píng)論
              


            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            国产精品18久久久久久vr | 狠狠精品干练久久久无码中文字幕| 久久久久久久99精品免费观看| 99精品久久久久久久婷婷| 97久久国产综合精品女不卡| 久久国产亚洲精品| 久久亚洲精品无码观看不卡| 无码精品久久久久久人妻中字| 久久婷婷五月综合色99啪ak| 久久中文字幕视频、最近更新| 久久亚洲精品无码观看不卡| 97香蕉久久夜色精品国产| 久久99精品久久久久久hb无码| 久久久久亚洲AV成人网人人网站| 婷婷国产天堂久久综合五月| 国产精品久久久久无码av| 日本欧美国产精品第一页久久| 大蕉久久伊人中文字幕| 狠狠色丁香婷综合久久| 久久妇女高潮几次MBA| 少妇久久久久久被弄到高潮| 国产精品久久久久久久久鸭| 亚洲成色www久久网站夜月| 观看 国产综合久久久久鬼色 欧美 亚洲 一区二区| 香蕉久久夜色精品国产2020| 韩国三级中文字幕hd久久精品| 久久99精品国产99久久6男男| 久久天天躁狠狠躁夜夜2020一| 国产国产成人精品久久| 久久精品人妻中文系列| 国产精品亚洲综合专区片高清久久久 | 美女久久久久久| 久久中文娱乐网| 久久青青草原国产精品免费| 九九99精品久久久久久| 潮喷大喷水系列无码久久精品| 久久天天躁狠狠躁夜夜网站| 色婷婷久久综合中文久久蜜桃av| 精品国产乱码久久久久软件| 性欧美大战久久久久久久| 久久精品一区二区三区中文字幕|