• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            程序讓生活更美好

            半畝方塘 天光云影

              C++博客 ::  :: 新隨筆 :: 聯(lián)系 ::  :: 管理 ::
              55 隨筆 :: 4 文章 :: 202 評論 :: 0 Trackbacks
            談到優(yōu)化,很多人都會直接想到匯編。難道優(yōu)化只能在匯編層次嗎?當(dāng)然不是,C++層次一樣可以作代碼優(yōu)化,其中有些常常是意想不到的。在C++層次進(jìn)行優(yōu)化,比在匯編層次優(yōu)化具有更好的移植性,應(yīng)該是優(yōu)化中的首選做法。 
            1.確定浮點(diǎn)型變量和表達(dá)式是 float 型 
                為了讓編譯器產(chǎn)生更好的代碼(比如說產(chǎn)生3DNow! 或SSE指令的代碼),必須確定浮點(diǎn)型變量和表達(dá)式是 float 型的。要特別注意的是,以 ";F"; 或 ";f"; 為后綴(比如:3.14f)的浮點(diǎn)常量才是 float 型,否則默認(rèn)是 double 型。為了避免 float 型參數(shù)自動轉(zhuǎn)化為 double,請在函數(shù)聲明時使用 float。 
            2.使用32位的數(shù)據(jù)類型 
              編譯器有很多種,但它們都包含的典型的32位類型是:int,signed,signed int,unsigned,unsigned int,long,signed long,long int,signed long int,unsigned long,unsigned long int。盡量使用32位的數(shù)據(jù)類型,因為它們比16位的數(shù)據(jù)甚至8位的數(shù)據(jù)更有效率。 
            3.明智使用有符號整型變量 
              在很多情況下,你需要考慮整型變量是有符號還是無符號類型的。比如,保存一個人的體重數(shù)據(jù)時不可能出現(xiàn)負(fù)數(shù),所以不需要使用有符號類型。但是,如果是要保存溫度數(shù)據(jù),就必須使用到有符號的變量。 
              在許多地方,考慮是否使用有符號的變量是必要的。在一些情況下,有符號的運(yùn)算比較快;但在一些情況下卻相反。 
              比如:整型到浮點(diǎn)轉(zhuǎn)化時,使用大于16位的有符號整型比較快。因為x86構(gòu)架中提供了從有符號整型轉(zhuǎn)化到浮點(diǎn)型的指令,但沒有提供從無符號整型轉(zhuǎn)化到浮點(diǎn)的指令??纯淳幾g器產(chǎn)生的匯編代碼: 
              不好的代碼: 
            編譯前      編譯后 
            double x;    mov [foo + 4], 0 
            unsigned int i;   mov eax, i 
            x = i;     mov [foo], eax 
                 flid qword ptr [foo] 
                 fstp qword ptr [x] 
              上面的代碼比較慢。不僅因為指令數(shù)目比較多,而且由于指令不能配對造成的FLID指令被延遲執(zhí)行。最好用以下代碼代替: 
                推薦的代碼: 
            編譯前     編譯后 
            double x;    fild dword ptr 
            int i;     fstp qword ptr [x] 
            x = i; 
              在整數(shù)運(yùn)算中計算商和余數(shù)時,使用無符號類型比較快。以下這段典型的代碼是編譯器產(chǎn)生的32位整型數(shù)除以4的代碼: 
              不好的代碼  
            編譯前      編譯后 
            int i;     mov eax, i 
            i = i / 4;     cdq 
                 and edx, 3 
                 add eax, edx 
                 sar eax, 2 
                 mov i, eax 
                推薦的代碼
            編譯前      編譯后 
            unsigned int i;    shr i, 2 
            i = i / 4; 
             總結(jié):
             無符號類型用于:除法和余數(shù),循環(huán)計數(shù),數(shù)組下標(biāo)
              有符號類型用于:整型到浮點(diǎn)的轉(zhuǎn)化
            4.while VS. for 
              在編程中,我們常常需要用到無限循環(huán),常用的兩種方法是while (1) 和 for (;;)。這兩種方法效果完全一樣,但那一種更好呢?然我們看看它們編譯后的代碼: 
            編譯前      編譯后 
            while (1);     mov eax,1 
                 test eax,eax 
                 je foo+23h 
                 jmp foo+18h 
            編譯前      編譯后  
            for (;;);     jmp foo+23h 
              一目了然,for (;;)指令少,不占用寄存器,而且沒有判斷跳轉(zhuǎn),比while (1)好。 
            5.使用數(shù)組型代替指針型 
              使用指針會使編譯器很難優(yōu)化它。因為缺乏有效的指針代碼優(yōu)化的方法,編譯器總是假設(shè)指針可以訪問內(nèi)存的任意地方,包括分配給其他變量的儲存空間。所以為了編譯器產(chǎn)生優(yōu)化得更好的代碼,要避免在不必要的地方使用指針。一個典型的例子是訪問存放在數(shù)組中的數(shù)據(jù)。C++ 允許使用操作符 [] 或指針來訪問數(shù)組,使用數(shù)組型代碼會讓優(yōu)化器減少產(chǎn)生不安全代碼的可能性。比如,x[0] 和x[2] 不可能是同一個內(nèi)存地址,但 *p 和 *q 可能。強(qiáng)烈建議使用數(shù)組型,因為這樣可能會有意料之外的性能提升。 
                不好的代碼
            typedef struct
            {
              float x,y,z,w;
            } VERTEX;
            typedef struct

            {
              float m[4][4];
            } MATRIX;
            void XForm(float* res, const float* v, const float* m, int nNumVerts)
            {
              float dp;
              int i;
               const VERTEX* vv = (VERTEX *)v;
               for (i = 0; i <; nNumVerts; i++)
              {
                dp = vv->;x * *m ++;
                dp += vv->;y * *m ++;
                dp += vv->;z * *m ++;
                dp += vv->;w * *m ++;
                *res ++ = dp;      // 寫入轉(zhuǎn)換了的 x
                dp = vv->;x * *m ++;
                dp += vv->;y * *m ++;
                dp += vv->;z * *m ++;
                dp += vv->;w * *m ++;
                *res ++ = dp;     // 寫入轉(zhuǎn)換了的 y
                dp = vv->;x * *m ++;
                dp += vv->;y * *m ++;
                dp += vv->;z * *m ++;
                dp += vv->;w * *m ++;
                *res ++ = dp;    // 寫入轉(zhuǎn)換了的 z
                dp = vv->;x * *m ++;
                dp += vv->;y * *m ++;
                dp += vv->;z * *m ++;
                dp += vv->;w * *m ++;
                *res ++ = dp;    // 寫入轉(zhuǎn)換了的 w
                vv ++;        // 下一個矢量
                m -= 16;
              }
            }
                推薦的代碼 
            typedef struct
            {
              float x,y,z,w;
            } VERTEX;
            typedef struct
            {
              float m[4][4];
            } MATRIX;
            void XForm (float* res, const float* v, const float* m, int nNumVerts)
            {
              int i;
              const VERTEX* vv = (VERTEX*)v;
              const MATRIX* mm = (MATRIX*)m;
              VERTEX* rr = (VERTEX*)res;
              for (i = 0; i <; nNumVerts; i++)
              {
                rr->;x = vv->;x * mm->;m[0][0] + vv->;y * mm->;m[0][1]
                    + vv->;z * mm->;m[0][2] + vv->;w * mm->;m[0][3];
                rr->;y = vv->;x * mm->;m[1][0] + vv->;y * mm->;m[1][1]
                    + vv->;z * mm->;m[1][2] + vv->;w * mm->;m[1][3];
                rr->;z = vv->;x * mm->;m[2][0] + vv->;y * mm->;m[2][1]
                    + vv->;z * mm->;m[2][2] + vv->;w * mm->;m[2][3];
                rr->;w = vv->;x * mm->;m[3][0] + vv->;y * mm->;m[3][1]
                    + vv->;z * mm->;m[3][2] + vv->;w * mm->;m[3][3];
              }

              注意: 源代碼的轉(zhuǎn)化是與編譯器的代碼發(fā)生器相結(jié)合的。從源代碼層次很難控制產(chǎn)生的機(jī)器碼。依靠編譯器和特殊的源代碼,有可能指針型代碼編譯成的機(jī)器碼比同等條件下的數(shù)組型代碼運(yùn)行速度更快。明智的做法是在源代碼轉(zhuǎn)化后檢查性能是否真正提高了,再選擇使用指針型還是數(shù)組型。 
            6.充分分解小的循環(huán) 
              要充分利用CPU的指令緩存,就要充分分解小的循環(huán)。特別是當(dāng)循環(huán)體本身很小的時候,分解循環(huán)可以提高性能。BTW:很多編譯器并不能自動分解循環(huán)。 
            不好的代碼 推薦的代碼 
            // 3D轉(zhuǎn)化:把矢量 V 和 4x4 矩陣 M 相乘
            for (i = 0; i <; 4; i ++)
            {
              r = 0;
              for (j = 0; j <; 4; j ++)
              {
                r += M[j]*V[j];
              }
            }
            r[0] = M[0][0]*V[0] + M[1][0]*V[1] + M[2][0]*V[2] + M[3][0]*V[3];
            r[1] = M[0][1]*V[0] + M[1][1]*V[1] + M[2][1]*V[2] + M[3][1]*V[3];
            r[2] = M[0][2]*V[0] + M[1][2]*V[1] + M[2][2]*V[2] + M[3][2]*V[3];
            r[3] = M[0][3]*V[0] + M[1][3]*V[1] + M[2][3]*V[2] + M[3][3]*v[3]; 
            7.避免沒有必要的讀寫依賴 
              當(dāng)數(shù)據(jù)保存到內(nèi)存時存在讀寫依賴,即數(shù)據(jù)必須在正確寫入后才能再次讀取。雖然AMD Athlon等CPU有加速讀寫依賴延遲的硬件,允許在要保存的數(shù)據(jù)被寫入內(nèi)存前讀取出來,但是,如果避免了讀寫依賴并把數(shù)據(jù)保存在內(nèi)部寄存器中,速度會更快。在一段很長的又互相依賴的代碼鏈中,避免讀寫依賴顯得尤其重要。如果讀寫依賴發(fā)生在操作數(shù)組時,許多編譯器不能自動優(yōu)化代碼以避免讀寫依賴。所以推薦程序員手動去消除讀寫依賴,舉例來說,引進(jìn)一個可以保存在寄存器中的臨時變量。這樣可以有很大的性能提升。下面一段代碼是一個例子: 
                不好的代碼
            float x[VECLEN], y[VECLEN], z[VECLEN];
            ...... 
            for (unsigned int k = 1; k <; VECLEN; k ++)
            {
              x[k] = x[k-1] + y[k];
            }
            for (k = 1; k <; VECLEN; k++)
            {
              x[k] = z[k] * (y[k] - x[k-1]);
            }
               推薦的代碼 
            float x[VECLEN], y[VECLEN], z[VECLEN];
            ...... 
            float t(x[0]);
            for (unsigned int k = 1; k <; VECLEN; k ++)
            {
              t = t + y[k];
              x[k] = t;
            }
            t = x[0];
            for (k = 1; k <; VECLEN; k ++)
            {
              t = z[k] * (y[k] - t);
              x[k] = t;

            8.Switch 的用法 
              Switch 可能轉(zhuǎn)化成多種不同算法的代碼。其中最常見的是跳轉(zhuǎn)表和比較鏈/樹。推薦對case的值依照發(fā)生的可能性進(jìn)行排序,把最有可能的放在第一個,當(dāng)switch用比較鏈的方式轉(zhuǎn)化時,這樣可以提高性能。此外,在case中推薦使用小的連續(xù)的整數(shù),因為在這種情況下,所有的編譯器都可以把switch 轉(zhuǎn)化成跳轉(zhuǎn)表。 
                不好的代碼
            int days_in_month, short_months, normal_months, long_months;
            ...... 
            switch (days_in_month)
            {
              case 28:
              case 29:
                short_months ++;
                break;
              case 30:
                normal_months ++;
                break;
              case 31:
                long_months ++;
                break;
              default:
                cout <;<; ";month has fewer than 28 or more than 31 days"; <;<; endl;
                break;
            }
                推薦的代碼 
            int days_in_month, short_months, normal_months, long_months;
            ...... 
            switch (days_in_month)
            {
              case 31:
                long_months ++;
                break;
              case 30:
                normal_months ++;
                break;
              case 28:
              case 29:
                short_months ++; 
                break;
              default:
                cout <;<; ";month has fewer than 28 or more than 31 days"; <;<; endl;
                break;

            9.所有函數(shù)都應(yīng)該有原型定義 
              一般來說,所有函數(shù)都應(yīng)該有原型定義。原型定義可以傳達(dá)給編譯器更多的可能用于優(yōu)化的信息。 
              盡可能使用常量(const)。C++ 標(biāo)準(zhǔn)規(guī)定,如果一個const聲明的對象的地址不被獲取,允許編譯器不對它分配儲存空間。這樣可以使代碼更有效率,而且可以生成更好的代碼。 
            10.提升循環(huán)的性能
              要提升循環(huán)的性能,減少多余的常量計算非常有用(比如,不隨循環(huán)變化的計算)。 
              不好的代碼(在for()中包含不變的if()) 推薦的代碼 
            for( i ... )
            {
              if( CONSTANT0 )
              {
                DoWork0( i ); // 假設(shè)這里不改變CONSTANT0的值
              }
              else
              {
                DoWork1( i ); // 假設(shè)這里不改變CONSTANT0的值
              }
            }
            if( CONSTANT0 )
            {
              for( i ... )
              {
                DoWork0( i );
              }
            }
            else
            {
              for( i ... )
              {
                DoWork1( i );
              }

              如果已經(jīng)知道if()的值,這樣可以避免重復(fù)計算。雖然不好的代碼中的分支可以簡單地預(yù)測,但是由于推薦的代碼在進(jìn)入循環(huán)前分支已經(jīng)確定,就可以減少對分支預(yù)測的依賴。   把本地函數(shù)聲明為靜態(tài)的(static) 
              如果一個函數(shù)在實(shí)現(xiàn)它的文件外未被使用的話,把它聲明為靜態(tài)的(static)以強(qiáng)制使用內(nèi)部連接。否則,默認(rèn)的情況下會把函數(shù)定義為外部連接。這樣可能會影響某些編譯器的優(yōu)化——比如,自動內(nèi)聯(lián)。 
            11.考慮動態(tài)內(nèi)存分配 
              動態(tài)內(nèi)存分配(C++中的";new";)可能總是為長的基本類型(四字對齊)返回一個已經(jīng)對齊的指針。但是如果不能保證對齊,使用以下代碼來實(shí)現(xiàn)四字對齊。這段代碼假設(shè)指針可以映射到 long 型。 
              例子 
              double* p = (double*)new BYTE[sizeof(double) * number_of_doubles+7L];
                double* np = (double*)((long(p) + 7L) &; –8L); 
              現(xiàn)在,你可以使用 np 代替 p 來訪問數(shù)據(jù)。注意:釋放儲存空間時仍然應(yīng)該用delete p。 
            12.使用顯式的并行代碼 
              盡可能把長的有依賴的代碼鏈分解成幾個可以在流水線執(zhí)行單元中并行執(zhí)行的沒有依賴的代碼鏈。因為浮點(diǎn)操作有很長的潛伏期,所以不管它被映射成 x87 或 3DNow! 指令,這都很重要。很多高級語言,包括C++,并不對產(chǎn)生的浮點(diǎn)表達(dá)式重新排序,因為那是一個相當(dāng)復(fù)雜的過程。需要注意的是,重排序的代碼和原來的代碼在代數(shù)上一致并不等價于計算結(jié)果一致,因為浮點(diǎn)操作缺乏精確度。在一些情況下,這些優(yōu)化可能導(dǎo)致意料之外的結(jié)果。幸運(yùn)的是,在大部分情況下,最后結(jié)果可能只有最不重要的位(即最低位)是錯誤的。 
              不好的代碼
            double a[100], sum;
            int i;
            sum = 0.0f;
            for (i=0; i<;100; i++)
              sum += a; 
                推薦的代碼 
            double a[100], sum1, sum2, sum3, sum4, sum;
            int i;
            sum1 = sum2 = sum3 = sum4 = 0.0;
            for (i = 0; i <; 100; i += 4)
            {
              sum1 += a;
              sum2 += a[i+1];
              sum3 += a[i+2];
              sum4 += a[i+3];
            }
            sum = (sum4+sum3)+(sum1+sum2); 
              要注意的是:使用4 路分解是因為這樣使用了4階段流水線浮點(diǎn)加法,浮點(diǎn)加法的每一個階段占用一個時鐘周期,保證了最大的資源利用率。 
            13.提出公共子表達(dá)式 
              在某些情況下,C++編譯器不能從浮點(diǎn)表達(dá)式中提出公共的子表達(dá)式,因為這意味著相當(dāng)于對表達(dá)式重新排序。需要特別指出的是,編譯器在提取公共子表達(dá)式前不能按照代數(shù)的等價關(guān)系重新安排表達(dá)式。這時,程序員要手動地提出公共的子表達(dá)式(在VC.net里有一項“全局優(yōu)化”選項可以完成此工作,但效果就不得而知了)。 
            推薦的代碼 
            float a, b, c, d, e, f;
            ...
            e = b * c / d;
            f = b / d * a;
            float a, b, c, d, e, f;
            ...
            const float t(b / d);
            e = c * t;
            f = a * t; 
            推薦的代碼 
            float a, b, c, e, f;
            ...
            e = a / c;
            f = b / c;
            float a, b, c, e, f;
            ...
            const float t(1.0f / c);
            e = a * t;
            f = b * t; 
            14.結(jié)構(gòu)體成員的布局 
              很多編譯器有“使結(jié)構(gòu)體字,雙字或四字對齊”的選項。但是,還是需要改善結(jié)構(gòu)體成員的對齊,有些編譯器可能分配給結(jié)構(gòu)體成員空間的順序與他們聲明的不同。但是,有些編譯器并不提供這些功能,或者效果不好。所以,要在付出最少代價的情況下實(shí)現(xiàn)最好的結(jié)構(gòu)體和結(jié)構(gòu)體成員對齊,建議采取這些方法: 
              A按類型長度排序 
              把結(jié)構(gòu)體的成員按照它們的類型長度排序,聲明成員時把長的類型放在短的前面。 
              把結(jié)構(gòu)體填充成最長類型長度的整倍數(shù) 
              把結(jié)構(gòu)體填充成最長類型長度的整倍數(shù)。照這樣,如果結(jié)構(gòu)體的第一個成員對齊了,所有整個結(jié)構(gòu)體自然也就對齊了。下面的例子演示了如何對結(jié)構(gòu)體成員進(jìn)行重新排序: 
              不好的代碼,普通順序 推薦的代碼,新的順序并手動填充了幾個字節(jié)
            struct
            {
              char a[5];
              long k;
              double x;
            } baz;
            struct
            {
              double x;
              long k;
              char a[5];
            char pad[7];
            } baz;

              這個規(guī)則同樣適用于類的成員的布局。 
              B按數(shù)據(jù)類型的長度排序本地變量 
              當(dāng)編譯器分配給本地變量空間時,它們的順序和它們在源代碼中聲明的順序一樣,和上一條規(guī)則一樣,應(yīng)該把長的變量放在短的變量前面。如果第一個變量對齊了,其它變量就會連續(xù)的存放,而且不用填充字節(jié)自然就會對齊。有些編譯器在分配變量時不會自動改變變量順序,有些編譯器不能產(chǎn)生4字節(jié)對齊的棧,所以4字節(jié)可能不對齊。下面這個例子演示了本地變量聲明的重新排序: 
              不好的代碼,普通順序 推薦的代碼,改進(jìn)的順序 
            short ga, gu, gi;
            long foo, bar;
            double x, y, z[3];
            char a, b;
            float baz;
            double z[3];
            double x, y;
            long foo, bar;
            float baz;
            short ga, gu, gi; 
            14.避免不必要的整數(shù)除法 
              整數(shù)除法是整數(shù)運(yùn)算中最慢的,所以應(yīng)該盡可能避免。一種可能減少整數(shù)除法的地方是連除,這里除法可以由乘法代替。這個替換的副作用是有可能在算乘積時會溢出,所以只能在一定范圍的除法中使用。 
              不好的代碼 推薦的代碼 
            int i, j, k, m;
            m = i / j / k;
            int i, j, k, m;
            m = i / (j * k); 
            15.把頻繁使用的指針型參數(shù)拷貝到本地變量 
              避免在函數(shù)中頻繁使用指針型參數(shù)指向的值。因為編譯器不知道指針之間是否存在沖突,所以指針型參數(shù)往往不能被編譯器優(yōu)化。這樣是數(shù)據(jù)不能被存放在寄存器中,而且明顯地占用了內(nèi)存帶寬。注意,很多編譯器有“假設(shè)不沖突”優(yōu)化開關(guān)(在VC里必須手動添加編譯器命令行/Oa或/Ow),這允許編譯器假設(shè)兩個不同的指針總是有不同的內(nèi)容,這樣就不用把指針型參數(shù)保存到本地變量。否則,請在函數(shù)一開始把指針指向的數(shù)據(jù)保存到本地變量。如果需要的話,在函數(shù)結(jié)束前拷貝回去。   
                不好的代碼 
            // 假設(shè) q != r
            void isqrt(unsigned long a, unsigned long* q, unsigned long* r)
            {
              *q = a;
              if (a >; 0)
              {
                while (*q >; (*r = a / *q))
                {
                  *q = (*q + *r) >;>; 1;
                }
              }
              *r = a - *q * *q;
            }
                推薦的代碼
            // 假設(shè) q != r
            void isqrt(unsigned long a, unsigned long* q, unsigned long* r)
            {
              unsigned long qq, rr;
              qq = a;
              if (a >; 0)
              {
                while (qq >; (rr = a / qq))
                {
                  qq = (qq + rr) >;>; 1;
                }
              }
              rr = a - qq * qq;
              *q = qq;
              *r = rr;

            16.賦值與初始化
            先看看以下代碼: 
            class CInt
            {
              int m_i; 
            public:
              CInt(int a = 0):m_i(a) { cout <;<; ";CInt"; <;<; endl; }
              ~CInt() { cout <;<; ";~CInt"; <;<; endl; } 
              CInt operator + (const CInt&; a) { return CInt(m_i + a.GetInt()); } 
              void SetInt(const int i)  { m_i = i; }
              int GetInt() const      { return m_i; }
            };
                不好的代碼 
            void main()
            {
              CInt a, b, c;
              a.SetInt(1);
              b.SetInt(2);
              c = a + b;
            }
                推薦的代碼
            void main()
            {
              CInt a(1), b(2);
              CInt c(a + b);

              這兩段代碼所作的事都一樣,但那一個更好呢?看看輸出結(jié)果就會發(fā)現(xiàn),不好的代碼輸出了四個";CInt";和四個";~CInt";,而推薦的代碼只輸出三個。也就是說,第二個例子比第一個例子少生成一次臨時對象。Why? 請注意,第一個中的c用的是先聲明再賦值的方法,第二個用的是初始化的方法,它們有本質(zhì)的區(qū)別。第一個例子的";c = a + b";先生成一個臨時對象用來保存a + b的值,再把該臨時對象用位拷貝的方法給c賦值,然后臨時對象被銷毀。這個臨時對象就是那個多出來的對象。第二個例子直接用拷貝構(gòu)造函數(shù)的方法對c初始化,不產(chǎn)生臨時對象。所以,盡量在需要使用一個對象時才聲明,并用初始化的方法賦初值。 
            17.盡量使用成員初始化列表 
              在初始化類的成員時,盡量使用成員初始化列表而不是傳統(tǒng)的賦值方式。 
              不好的代碼 
            class CMyClass
            {
              string strName; 
            public:
              CMyClass(const string&; str);
            }; 
            CMyClass::CMyClass(const string&; str)
            {
              strName = str;
            }
                推薦的代碼
            class CMyClass
            {
              string strName;
              int i;
            public:
              CMyClass(const string&; str);
            }; 
            CMyClass::CMyClass(const string&;str)
               :strName(str)
            {


              不好的例子用的是賦值的方式。這樣,strName會先被建立(調(diào)用了string的默認(rèn)構(gòu)造函數(shù)),再由參數(shù)str賦值。而推薦的例子用的是成員初始化列表,strName直接構(gòu)造為str,少調(diào)用一次默認(rèn)構(gòu)造函數(shù),還少了一些安全隱患。zhuan

            posted on 2010-05-24 14:04 北風(fēng)之神007 閱讀(1771) 評論(0)  編輯 收藏 引用 所屬分類: c/c++
            无码任你躁久久久久久久| 97久久综合精品久久久综合| 色综合久久综合网观看| 日韩乱码人妻无码中文字幕久久| 伊人久久大香线蕉av不变影院| 久久久久久久精品妇女99| 日产精品久久久久久久性色| 国产欧美一区二区久久| 精品久久人人妻人人做精品| 伊人久久大香线蕉成人| 久久国产高潮流白浆免费观看| 青草影院天堂男人久久| 中文字幕无码久久精品青草| 色婷婷综合久久久久中文| segui久久国产精品| 久久久久久国产精品无码下载| 国产精品久久精品| 久久精品国产亚洲AV不卡| 丰满少妇人妻久久久久久4| 亚洲欧美精品一区久久中文字幕| 久久久噜噜噜久久熟女AA片| 精品人妻伦一二三区久久| 熟妇人妻久久中文字幕| 性高朝久久久久久久久久| 精品久久久久久亚洲| 亚洲午夜久久久| 99久久精品费精品国产| 久久久久久午夜成人影院| 亚洲精品无码专区久久同性男| 曰曰摸天天摸人人看久久久| 久久夜色精品国产噜噜亚洲AV| 精品视频久久久久| 精品无码久久久久久国产| 久久精品国产影库免费看| 久久精品国产亚洲av影院| 奇米影视7777久久精品人人爽| 久久国产精品免费一区| 久久国产精品偷99| 国产精品青草久久久久福利99 | 亚洲精品tv久久久久久久久| 人妻无码精品久久亚瑟影视|