• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            歲月流轉,往昔空明

            C++博客 首頁 新隨筆 聯系 聚合 管理
              118 Posts :: 3 Stories :: 413 Comments :: 0 Trackbacks

            To: 很土:我確實沒有搜到任何相關的信息,所以還請你指點。謝謝。

            我昨天在寫函數然后測試優化選項的時候,非常奇怪的發現,如果打開了

            運行時檢測 選項中的 堆棧幀檢測 ,代碼性能就會瘋狂的攀升一個數量級

            然而從理論上來說,由于堆棧幀檢測添加了Check ESP的CRT函數調用(實際的匯編也是如此),性能應該略有下降才是,但是我不知道為什么它的性能居然能極大幅度的提高。

            #include "stdafx.h"
            #include 
            <math.h>
            #include 
            <float.h>
            #include 
            <emmintrin.h> 
            #include 
            <windows.h>
            #include 
            <d3dxmath.h>

            using namespace std;

             
            struct __declspec(align(16)) Matrix {
            float m[4][4];
            }
            ;

            class Profiler
            {
            public:
            LARGE_INTEGER s;
            LARGE_INTEGER e;

            __int64 Begin() 
            {
            QueryPerformanceCounter(
            &s);

            return s.QuadPart;
            }


            __int64 End() 
            {
            QueryPerformanceCounter(
            &e);

            return e.QuadPart - s.QuadPart;
            }

            }
            ;

            int Multiply(float o[][4], const float a[][4], const float b[][4], int i)
            {
            o[
            0][0= a[0][0* b[0][0+ a[0][1* b[1][0+ a[0][2* b[2][0+ a[0][3* b[3][0];
            o[
            0][1= a[0][0* b[0][1+ a[0][1* b[1][1+ a[0][2* b[2][1+ a[0][3* b[3][1];
            o[
            0][2= a[0][0* b[0][2+ a[0][1* b[1][2+ a[0][2* b[2][2+ a[0][3* b[3][2];
            o[
            0][3= a[0][0* b[0][3+ a[0][1* b[1][3+ a[0][2* b[2][3+ a[0][3* b[3][3];

            o[
            1][0= a[1][0* b[0][0+ a[1][1* b[1][0+ a[1][2* b[2][0+ a[1][3* b[3][0];
            o[
            1][1= a[1][0* b[0][1+ a[1][1* b[1][1+ a[1][2* b[2][1+ a[1][3* b[3][1];
            o[
            1][2= a[1][0* b[0][2+ a[1][1* b[1][2+ a[1][2* b[2][2+ a[1][3* b[3][2];
            o[
            1][3= a[1][0* b[0][3+ a[1][1* b[1][3+ a[1][2* b[2][3+ a[1][3* b[3][3];

            o[
            2][0= a[2][0* b[0][0+ a[2][1* b[1][0+ a[2][2* b[2][0+ a[2][3* b[3][0];
            o[
            2][1= a[2][0* b[0][1+ a[2][1* b[1][1+ a[2][2* b[2][1+ a[2][3* b[3][1];
            o[
            2][2= a[2][0* b[0][2+ a[2][1* b[1][2+ a[2][2* b[2][2+ a[2][3* b[3][2];
            o[
            2][3= a[2][0* b[0][3+ a[2][1* b[1][3+ a[2][2* b[2][3+ a[2][3* b[3][3];

            o[
            3][0= a[3][0* b[0][0+ a[3][1* b[1][0+ a[3][2* b[2][0+ a[3][3* b[3][0];
            o[
            3][1= a[3][0* b[0][1+ a[3][1* b[1][1+ a[3][2* b[2][1+ a[3][3* b[3][1];
            o[
            3][2= a[3][0* b[0][2+ a[3][1* b[1][2+ a[3][2* b[2][2+ a[3][3* b[3][2];
            o[
            3][3= a[3][0* b[0][3+ a[3][1* b[1][3+ a[3][2* b[2][3+ a[3][3* b[3][3];

            return i / 1000;
            }


            int _tmain(int argc, _TCHAR* argv[])
            {
            __declspec(align(
            16)) D3DXVECTOR3 v(2.0f,2.0f,2.0f);
            HANDLE hp 
            = GetCurrentProcess();
            HANDLE ht 
            = GetCurrentThread();

            SetPriorityClass(hp, REALTIME_PRIORITY_CLASS);
            SetThreadPriority(ht, THREAD_PRIORITY_TIME_CRITICAL);

            Profiler p;
            Matrix m, m1, m2;
            memset(m.m, 
            016);
            memset(m1.m, 
            016);

            m.m[
            0][0= 1.0f;
            m.m[
            0][1= 2.0f;
            m.m[
            0][2= 3.0f;
            m.m[
            0][3= 4.0f;

            m.m[
            1][0= 5.0f;
            m.m[
            1][1= 6.0f;
            m.m[
            1][2= 7.0f;
            m.m[
            1][3= 8.0f;

            int y = 0;
            int t = 0;

            p.Begin();
            for(int i = 0; i < 100000++i)
            {
            = Multiply(m2.m, m.m, m1.m, i);
            += t;
            }

            __int64 x 
            = p.End();

            cout 
            << x << " MatrixMultiply C"<< y << endl;

            SetPriorityClass(hp, NORMAL_PRIORITY_CLASS);
            SetThreadPriority(ht, THREAD_PRIORITY_NORMAL);

            system(
            "pause");

            return 0;
            }




            以上為代碼。。。希望能有知道的帥哥做出解答。。。謝謝了!

            posted on 2005-11-28 20:52 空明流轉 閱讀(821) 評論(4)  編輯 收藏 引用

            評論

            # re: VC71的一個超奇怪問題 2005-11-29 08:49 很土
            這種問題完全可以google就知道,和另外一個"怎么鏈接動態庫"一樣的,提問之前都沒有google過...,至少在你們的文字中,我沒有看到google過的痕跡.
              回復  更多評論
              

            # re: VC71的一個超奇怪問題 2005-11-29 09:46 空明流轉
            Google 了,但是沒有找到。望樓上的高人指點。  回復  更多評論
              

            # re: VC71的一個超奇怪問題 2005-12-08 08:55 神殺中龍
            空明流轉 找到你了,我是神殺中龍  回復  更多評論
              

            # re: VC71的一個超奇怪問題 2008-08-19 14:46 沈臻豪(foxtail)
            這個問題高深了 要找專門搞優化的人來看看  回復  更多評論
              

            午夜久久久久久禁播电影| 少妇人妻综合久久中文字幕| 99久久婷婷国产综合亚洲| 久久久久久久精品妇女99| 久久无码AV中文出轨人妻| 亚洲av日韩精品久久久久久a| 亚洲精品高清国产一线久久| 久久99亚洲网美利坚合众国| 热久久国产精品| 久久综合视频网站| 亚洲国产精品无码久久一区二区 | 日本精品久久久久中文字幕| 99国内精品久久久久久久| 久久91精品综合国产首页| 午夜精品久久久久久久无码| 精品久久亚洲中文无码| 国产国产成人久久精品| 久久天天婷婷五月俺也去| 国产精品一久久香蕉国产线看观看 | 国产成人久久久精品二区三区| 欧美亚洲另类久久综合婷婷| 亚洲精品乱码久久久久久自慰| 免费观看久久精彩视频| 久久精品中文字幕大胸| 国产一区二区三区久久| 久久久亚洲裙底偷窥综合| 久久综合九色综合久99| 久久久国产打桩机| 久久精品成人| 久久99精品国产| 婷婷五月深深久久精品| 色综合久久久久综合99| 97精品国产91久久久久久| 欧美亚洲国产精品久久| 久久国产高清一区二区三区| 亚洲AV日韩精品久久久久| 亚洲欧美日韩精品久久亚洲区 | 精品欧美一区二区三区久久久| 亚洲精品高清国产一线久久| 性欧美大战久久久久久久| 久久精品国产亚洲沈樵|