摘要: 在向大家介紹CxImage類庫之前,先向大家推薦一個優秀的站點:
http://www.codeproject.com
。這個站點有很多值得收藏的文章和源碼。本文就是根據此站點相關信息寫成。
關于這個類,可以看CodeProject上的文章:http://www.codeproject.com/bi...
閱讀全文
posted @
2006-09-10 21:07 Jerry Cat 閱讀(1288) |
評論 (0) |
編輯 收藏
[c++語言]goto語句中標記(labels)的使用
goto語句可以將程序控制轉移到由“標記”所指定的地方,這是地球人都知道的。
關于標記的用法不太知道或沒注意的地方:
1。標記不能單獨出現,必須后跟一條語句;如果需要一個單獨的標記(想不出有這種需要),則在標記后放一條空語句。
2。標記在它所在的函數內有效,不能重新定義。不同函數中可以使用同名標記。
reference:
ms-help://MS.VSCC.2003/MS.MSDNQTR.2003FEB.2052/vclang/html/_pluslang_Using_Labels_with_the_goto_Statement.htm
posted @
2006-09-10 21:01 Jerry Cat 閱讀(1625) |
評論 (0) |
編輯 收藏
猶太諺語:父親幫助兒子時,兩人都笑了;兒子幫助父親時,兩人都哭了。
猶太諺語:一個傻子丟了一顆石頭到池塘里,十個聰明人也檢不回來!
猶太諺語:財富就在一碼之內。
猶太諺語:人生有三種東西會傷人:苦惱、爭吵和空的錢包。
猶太諺語:投資自己陌生的行業的人,都將與黃金失之交臂。
posted @
2006-09-10 20:41 Jerry Cat 閱讀(451) |
評論 (0) |
編輯 收藏
C++面試題
1.是不是一個父類寫了一個virtual 函數,如果子類覆蓋它的函數不加virtual ,也能實現多態?
virtual修飾符會被隱形繼承的。
private 也被集成,只事派生類沒有訪問權限而已
virtual可加可不加
子類的空間里有父類的所有變量(static除外)
同一個函數只存在一個實體(inline除外)
子類覆蓋它的函數不加virtual ,也能實現多態。
在子類的空間里,有父類的私有變量。私有變量不能直接訪問。
--------------------------------------------------------------------------
2.輸入一個字符串,將其逆序后輸出。(使用C++,不建議用偽碼)
#include <iostream>
using namespace std;
void main()
{
? char a[50];memset(a,0,sizeof(a));
? int i=0,j;
? char t;
? cin.getline(a,50,'\n');
? for(i=0,j=strlen(a)-1;i<strlen(a)/2;i++,j--)
? {
?? t=a[i];
????? a[i]=a[j];
?? a[j]=t;
? }
? cout<<a<<endl;?
}
//第二種
string str;
cin>>str;
str.replace;
cout<<str;
--------------------------------------------------------------------------
3.請簡單描述Windows內存管理的方法。
內存管理是操作系統中的重要部分,兩三句話恐怕誰也說不清楚吧~~
我先說個大概,希望能夠拋磚引玉吧
當程序運行時需要從內存中讀出這段程序的代碼。代碼的位置必須在物理內存中才能被運行,由于現在的操作系統中有非常多的程序運行著,內存中不能夠完全放下,所以引出了虛擬內存的概念。把哪些不常用的程序片斷就放入虛擬內存,當需要用到它的時候在load入主存(物理內存)中。這個就是內存管理所要做的事。內存管理還有另外一件事需要做:計算程序片段在主存中的物理位置,以便CPU調度。
內存管理有塊式管理,頁式管理,段式和段頁式管理。現在常用段頁式管理
塊式管理:把主存分為一大塊、一大塊的,當所需的程序片斷不在主存時就分配一塊主存空間,把程 序片斷load入主存,就算所需的程序片度只有幾個字節也只能把這一塊分配給它。這樣會造成很大的浪費,平均浪費了50%的內存空間,但時易于管理。
頁式管理:把主存分為一頁一頁的,每一頁的空間要比一塊一塊的空間小很多,顯然這種方法的空間利用率要比塊式管理高很多。
段式管理:把主存分為一段一段的,每一段的空間又要比一頁一頁的空間小很多,這種方法在空間利用率上又比頁式管理高很多,但是也有另外一個缺點。一個程序片斷可能會被分為幾十段,這樣很多時間就會被浪費在計算每一段的物理地址上(計算機最耗時間的大家都知道是I/O吧)。
段頁式管理:結合了段式管理和頁式管理的優點。把主存分為若干頁,每一頁又分為若干段。好處就很明顯,不用我多說了吧。
各種內存管理都有它自己的方法來計算出程序片斷在主存中的物理地址,其實都很相似。
這只是一個大概而已,不足以說明內存管理的皮毛。無論哪一本操作系統書上都有詳細的講解
--------------------------------------------------------------------------
4.
#include "stdafx.h"
#define SQR(X) X*X
int main(int argc, char* argv[])
{
?int a = 10;
?int k = 2;
?int m = 1;
?a /= SQR(k+m)/SQR(k+m);
?printf("%d\n",a);
?return 0;
}
這道題目的結果是什么啊?
define 只是定義而已,在編擇時只是簡單代換X*X而已,并不經過算術法則的
a /= (k+m)*(k+m)/(k+m)*(k+m);
=>a /= (k+m)*1*(k+m);
=>a = a/9;
=>a = 1;
--------------------------------------------------------------------------
5.
const 符號常量;
(1)const char *p
(2)char const *p
(3)char * const p
說明上面三種描述的區別;
如果const位于星號的左側,則const就是用來修飾指針所指向的變量,即指針指向為常量;
如果const位于星號的右側,const就是修飾指針本身,即指針本身是常量。
(1)const char *p
一個指向char類型的const對象指針,p不是常量,我們可以修改p的值,使其指向不同的char,但是不能改變它指向非char對象,如:
const char *p;
char c1='a';
char c2='b';
p=&c1;//ok
p=&c2;//ok
*p=c1;//error
(2)char const *p
(3)char * const p
這兩個好象是一樣的,此時*p可以修改,而p不能修改。
(4)const char * const p
這種是地址及指向對象都不能修改。
--------------------------------------------------------------------------
6.下面是C語言中兩種if語句判斷方式。請問哪種寫法更好?為什么?
?int n;
?if (n == 10) // 第一種判斷方式
?if (10 == n) // 第二種判斷方式
如果少了個=號,編譯時就會報錯,減少了出錯的可能行,可以檢測出是否少了=
--------------------------------------------------------------------------
7.下面的代碼有什么問題?
void DoSomeThing(...)
{
?char* p;
?...
?p = malloc(1024);? // 分配1K的空間
?if (NULL == p)
? return;
?...
?p = realloc(p, 2048); // 空間不夠,重新分配到2K
?if (NULL == p)
? return;
?...
}
A:
p = malloc(1024);???? 應該寫成: p = (char *) malloc(1024);
??????? 沒有釋放p的空間,造成內存泄漏。
--------------------------------------------------------------------------
8.下面的代碼有什么問題?并請給出正確的寫法。
void DoSomeThing(char* p)
{
?char str[16];
?int n;
?assert(NULL != p);
?sscanf(p, "%s%d", str, n);
?if (0 == strcmp(str, "something"))
?{
? ...
?}
}
A:
sscanf(p, "%s%d", str, n);?? 這句該寫成: sscanf(p, "%s%d", str, &n);
--------------------------------------------------------------------------
9.下面代碼有什么錯誤?
Void test1()
{
?char string[10];
?char *str1="0123456789";
?strcpy(string, str1);
}
數組越界
--------------------------------------------------------------------------
10.下面代碼有什么問題?
Void test2()
{
? char string[10], str1[10];
? for(i=0; i<10;i++)
? {
???? str1[i] ='a';
? }
? strcpy(string, str1);
}
數組越界
--------------------------------------------------------------------------
11.下面代碼有什么問題?
Void test3(char* str1)
{
? char string[10];
? if(strlen(str1)<=10)
? {
??? strcpy(string, str1);
? }
}
==數組越界
==strcpy拷貝的結束標志是查找字符串中的\0 因此如果字符串中沒有遇到\0的話 會一直復制,直到遇到\0,上面的123都因此產生越界的情況
?
建議使用 strncpy 和 memcpy
--------------------------------------------------------------------------
12.下面代碼有什么問題?
#define MAX_SRM 256
DSN get_SRM_no()
{
? static int SRM_no; //是不是這里沒賦初值?
? int I;
? for(I=0;I<MAX_SRM;I++,SRM_no++)
? {
??? SRM_no %= MAX_SRM;
??? if(MY_SRM.state==IDLE)
??? {
????? break;
??? }
? }
? if(I>=MAX_SRM)
??? return (NULL_SRM);
? else
??? return SRM_no;
}
系統會初始化static int變量為0,但該值會一直保存,所謂的不可重入...
--------------------------------------------------------------------------
13.寫出運行結果:
{// test1
??? char str[] = "world"; cout << sizeof(str) << ": ";
??? char *p??? = str;???? cout << sizeof(p) << ": ";
??? char i???? = 10;????? cout << sizeof(i) << ": ";
??? void *pp?? = malloc(10);? cout << sizeof(p) << endl;
}
6:4:1:4
--------------------------------------------------------------------------
14.寫出運行結果:
{// test2
??? union V {
?struct X {
? unsigned char s1:2;
? unsigned char s2:3;
? unsigned char s3:3;
?} x;
?unsigned char c;
??? } v;
??? v.c = 100;
??? printf("%d", v.x.s3);
}
3
--------------------------------------------------------------------------
15.用C++寫個程序,如何判斷一個操作系統是16位還是32位的?不能用sizeof()函數
A1:
16位的系統下,
int i = 65536;
cout << i; // 輸出0;
int i = 65535;
cout << i; // 輸出-1;
32位的系統下,
int i = 65536;
cout << i; // 輸出65536;
int i = 65535;
cout << i; // 輸出65535;
A2:
int a = ~0;
if( a>65536 )
{
??? cout<<"32 bit"<<endl;
}
else
{
??? cout<<"16 bit"<<endl;
}
--------------------------------------------------------------------------
16.C和C++有什么不同?
從機制上:c是面向過程的(但c也可以編寫面向對象的程序);c++是面向對象的,提供了類。但是,
c++編寫面向對象的程序比c容易
從適用的方向:c適合要求代碼體積小的,效率高的場合,如嵌入式;c++適合更上層的,復雜的;? llinux核心大部分是c寫的,因為它是系統軟件,效率要求極高。
從名稱上也可以看出,c++比c多了+,說明c++是c的超集;那為什么不叫c+而叫c++呢,是因為c++比
c來說擴充的東西太多了,所以就在c后面放上兩個+;于是就成了c++
C語言是結構化編程語言,C++是面向對象編程語言。
C++側重于對象而不是過程,側重于類的設計而不是邏輯的設計。
--------------------------------------------------------------------------
17.在不用第三方參數的情況下,交換兩個參數的值
#include <stdio.h>
void main()
{
??????? int i=60;
??????? int j=50;
??????? i=i+j;
??????? j=i-j;
??????? i=i-j;
??????? printf("i=%d\n",i);
??????? printf("j=%d\n",j);
}
方法二:
i^=j;
j^=i;
i^=j;
方法三:
// 用加減實現,而且不會溢出
a = a+b-(b=a)
--------------------------------------------------------------------------
18.有關位域的面試題(為什么輸出的是一個奇怪的字符)
a.t = 'b';效果相當于 a.t= 'b' & 0xf;
'b' --> 01100010
'b' & 0xf -->>00000010
所以輸出Ascii碼為2的特殊字符
char t:4;就是4bit的字符變量,同樣
unsigned short i:8;就是8bit的無符號短整形變量
--------------------------------------------------------------------------
19.int i=10, j=10, k=3; k*=i+j; k最后的值是?
60
--------------------------------------------------------------------------
20.進程間通信的方式有?
進程間通信的方式有 共享內存, 管道 ,Socket ,消息隊列 , DDE等
--------------------------------------------------------------------------
21.
struct A
{
char t:4;
char k:4;
unsigned short i:8;
unsigned long m;
}
sizeof(A)=?(不考慮邊界對齊)
7
struct CELL???????????? // Declare CELL bit field
{
?? unsigned character? : 8;? // 00000000 ????????
?? unsigned foreground : 3;? // 00000??? 00000000
?? unsigned intensity? : 1;? // 0000?000 00000000
?? unsigned background : 3;? // 0???0000 00000000
?? unsigned blink????? : 1;? // ?0000000 00000000
} screen[25][80];?????? // Array of bit fields
二、位結構
??? 位結構是一種特殊的結構, 在需按位訪問一個字節或字的多個位時, 位結構
比按位運算符更加方便。
??? 位結構定義的一般形式為:
???? struct位結構名{
????????? 數據類型 變量名: 整型常數;
????????? 數據類型 變量名: 整型常數;
???? } 位結構變量;
??? 其中: 數據類型必須是int(unsigned或signed)。 整型常數必須是非負的整
數, 范圍是0~15, 表示二進制位的個數, 即表示有多少位。
??? 變量名是選擇項, 可以不命名, 這樣規定是為了排列需要。
??? 例如: 下面定義了一個位結構。
???? struct{
????????? unsigned incon: 8;? /*incon占用低字節的0~7共8位*/
????????? unsigned txcolor: 4;/*txcolor占用高字節的0~3位共4位*/
????????? unsigned bgcolor: 3;/*bgcolor占用高字節的4~6位共3位*/
????????? unsigned blink: 1;? /*blink占用高字節的第7位*/
???? }ch;
??? 位結構成員的訪問與結構成員的訪問相同。
??? 例如: 訪問上例位結構中的bgcolor成員可寫成:
????? ch.bgcolor
?
??? 注意:
??? 1. 位結構中的成員可以定義為unsigned, 也可定義為signed,? 但當成員長
度為1時, 會被認為是unsigned類型。因為單個位不可能具有符號。
??? 2. 位結構中的成員不能使用數組和指針, 但位結構變量可以是數組和指針,
如果是指針, 其成員訪問方式同結構指針。
??? 3. 位結構總長度(位數), 是各個位成員定義的位數之和,? 可以超過兩個字
節。
??? 4. 位結構成員可以與其它結構成員一起使用。
??? 例如:
???? struct info{
????????? char name[8];
????????? int age;
????????? struct addr address;
????????? float pay;
????????? unsigned state: 1;
????????? unsigned pay: 1;
????????? }workers;
??? 上例的結構定義了關于一個工人的信息。其中有兩個位結構成員, 每個位結
構成員只有一位, 因此只占一個字節但保存了兩個信息, 該字節中第一位表示工
人的狀態, 第二位表示工資是否已發放。由此可見使用位結構可以節省存貯空間。
--------------------------------------------------------------------------
22.下面的函數實現在一個固定的數上加上一個數,有什么錯誤,改正
int add_n(int n)
{
? static int i=100;
? i+=n;
? return i;
}
答:
因為static使得i的值會保留上次的值。
去掉static就可了
--------------------------------------------------------------------------
23.下面的代碼有什么問題?
class A
{
public:
? A() { p=this; }
? ~A() { if(p!=NULL) { delete p; p=NULL; } }
? A* p;
};
答:
會引起無限遞歸
--------------------------------------------------------------------------
24.
union a {
?int a_int1;
?double a_double;
?int a_int2;
};
typedef struct
{
?a a1;
?char y;
} b;
class c
{
?double c_double;
?b b1;
?a a2;
};
輸出cout<<sizeof(c)<<endl;的結果?
答:
VC6環境下得出的結果是32
另:
我(sun)在VC6.0+win2k下做過試驗:
short - 2
int-4
float-4
double-8
指針-4
sizeof(union),以結構里面size最大的為union的size
解析C語言中的sizeof
一、sizeof的概念
sizeof是C語言的一種單目操作符,如C語言的其他操作符++、--等。它并不是函數。sizeof操作符以字節形式給出了其操作數的存儲大小。操作數可以是一個表達式或括在括號內的類型名。操作數的存儲大小由操作數的類型決定。
二、sizeof的使用方法
1、用于數據類型
sizeof使用形式:sizeof(type)
數據類型必須用括號括住。如sizeof(int)。
2、用于變量
sizeof使用形式:sizeof(var_name)或sizeof var_name
變量名可以不用括號括住。如sizeof (var_name),sizeof var_name等都是正確形式。帶括號的用法更普遍,大多數程序員采用這種形式。
注意:sizeof操作符不能用于函數類型,不完全類型或位字段。不完全類型指具有未知存儲大小的數據類型,如未知存儲大小的數組類型、未知內容的結構或聯合類型、void類型等。
如sizeof(max)若此時變量max定義為int max(),sizeof(char_v) 若此時char_v定義為char char_v [MAX]且MAX未知,sizeof(void)都不是正確形式。
三、sizeof的結果
sizeof操作符的結果類型是size_t,它在頭文件
中typedef為unsigned int類型。該類型保證能容納實現所建立的最大對象的字節大小。
1、若操作數具有類型char、unsigned char或signed char,其結果等于1。
ANSI C正式規定字符類型為1字節。
2、int、unsigned int 、short int、unsigned short 、long int 、unsigned long 、 float、double、long double類型的sizeof 在ANSI C中沒有具體規定,大小依賴于實現,一般可能分別為2、2、2、2、 4、4、4、8、10。
3、當操作數是指針時,sizeof依賴于編譯器。例如Microsoft C/C++7.0中,near類指針字節數為2,far、huge類指針字節數為4。一般Unix的指針字節數為4。
4、當操作數具有數組類型時,其結果是數組的總字節數。
5、聯合類型操作數的sizeof是其最大字節成員的字節數。結構類型操作數的sizeof是這種類型對象的總字節數,包括任何墊補在內。
讓我們看如下結構:
struct {char b; double x;} a;
在某些機器上sizeof(a)=12,而一般sizeof(char)+ sizeof(double)=9。
這是因為編譯器在考慮對齊問題時,在結構中插入空位以控制各成員對象的地址對齊。如double類型的結構成員x要放在被4整除的地址。
6、如果操作數是函數中的數組形參或函數類型的形參,sizeof給出其指針的大小。
四、sizeof與其他操作符的關系
sizeof的優先級為2級,比/、%等3級運算符優先級高。它可以與其他操作符一起組成表達式。如i*sizeof(int);其中i為int類型變量。
五、sizeof的主要用途
1、sizeof操作符的一個主要用途是與存儲分配和I/O系統那樣的例程進行通信。例如:
void *malloc(size_t size),
size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)。
2、sizeof的另一個的主要用途是計算數組中元素的個數。例如:
void * memset(void * s,int c,sizeof(s))。
六、建議
由于操作數的字節數在實現時可能出現變化,建議在涉及到操作數字節大小時用sizeof來代替常量計算。
=============================================================
本文主要包括二個部分,第一部分重點介紹在VC中,怎么樣采用sizeof來求結構的大小,以及容易出現的問題,并給出解決問題的方法,第二部分總結出VC中sizeof的主要用法。
1、 sizeof應用在結構上的情況
請看下面的結構:
struct MyStruct
{
double dda1;
char dda;
int type
};
對結構MyStruct采用sizeof會出現什么結果呢?sizeof(MyStruct)為多少呢?也許你會這樣求:
sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當在VC中測試上面結構的大小時,你會發現sizeof(MyStruct)為16。你知道為什么在VC中會得出這樣一個結果嗎?
其實,這是VC對變量存儲的一個特殊處理。為了提高CPU的存儲速度,VC對一些變量的起始地址做了"對齊"處理。在默認情況下,VC規定各成員變量存放的起始地址相對于結構的起始地址的偏移量必須為該變量的類型所占用的字節數的倍數。下面列出常用類型的對齊方式(vc6.0,32位系統)。
類型
對齊方式(變量存放的起始地址相對于結構的起始地址的偏移量)
Char
偏移量必須為sizeof(char)即1的倍數
int
偏移量必須為sizeof(int)即4的倍數
float
偏移量必須為sizeof(float)即4的倍數
double
偏移量必須為sizeof(double)即8的倍數
Short
偏移量必須為sizeof(short)即2的倍數
各成員變量在存放的時候根據在結構中出現的順序依次申請空間,同時按照上面的對齊方式調整位置,空缺的字節VC會自動填充。同時VC為了確保結構的大小為結構的字節邊界數(即該結構中占用最大空間的類型所占用的字節數)的倍數,所以在為最后一個成員變量申請空間后,還會根據需要自動填充空缺的字節。
下面用前面的例子來說明VC到底怎么樣來存放結構的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為上面的結構分配空間的時候,VC根據成員變量出現的順序和對齊方式,先為第一個成員dda1分配空間,其起始地址跟結構的起始地址相同(剛好偏移量0剛好為sizeof(double)的倍數),該成員變量占用sizeof(double)=8個字節;接下來為第二個成員dda分配空間,這時下一個可以分配的地址對于結構的起始地址的偏移量為8,是sizeof(char)的倍數,所以把dda存放在偏移量為8的地方滿足對齊方式,該成員變量占用 sizeof(char)=1個字節;接下來為第三個成員type分配空間,這時下一個可以分配的地址對于結構的起始地址的偏移量為9,不是sizeof (int)=4的倍數,為了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(這三個字節沒有放什么東西),這時下一個可以分配的地址對于結構的起始地址的偏移量為12,剛好是sizeof(int)=4的倍數,所以把type存放在偏移量為12的地方,該成員變量占用sizeof(int)=4個字節;這時整個結構的成員變量已經都分配了空間,總的占用的空間大小為:8+1+3+4=16,剛好為結構的字節邊界數(即結構中占用最大空間的類型所占用的字節數sizeof(double)=8)的倍數,所以沒有空缺的字節需要填充。所以整個結構的大小為:sizeof(MyStruct)=8+1+ 3+4=16,其中有3個字節是VC自動填充的,沒有放任何有意義的東西。
下面再舉個例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:
struct MyStruct
{
char dda;
double dda1;??
int type
};
這個結構占用的空間為多大呢?在VC6.0環境下,可以得到sizeof(MyStruc)為24。結合上面提到的分配空間的一些原則,分析下VC怎么樣為上面的結構分配空間的。(簡單說明)
struct MyStruct
{
? char dda;//偏移量為0,滿足對齊方式,dda占用1個字節;
double dda1;//下一個可用的地址的偏移量為1,不是sizeof(double)=8
???????????? //的倍數,需要補足7個字節才能使偏移量變為8(滿足對齊
???????????? //方式),因此VC自動填充7個字節,dda1存放在偏移量為8
???????????? //的地址上,它占用8個字節。
int type;//下一個可用的地址的偏移量為16,是sizeof(int)=4的倍
?????????? //數,滿足int的對齊方式,所以不需要VC自動填充,type存
?????????? //放在偏移量為16的地址上,它占用4個字節。
};//所有成員變量都分配了空間,空間總的大小為1+7+8+4=20,不是結構
?? //的節邊界數(即結構中占用最大空間的類型所占用的字節數sizeof
?? //(double)=8)的倍數,所以需要填充4個字節,以滿足結構的大小為
?? //sizeof(double)=8的倍數。
所以該結構總的大小為:sizeof(MyStruc)為1+7+8+4+4=24。其中總的有7+4=11個字節是VC自動填充的,沒有放任何有意義的東西。
VC對結構的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認的對齊方式,自己可以設定變量的對齊方式。
VC 中提供了#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節數,那么偏移量必須滿足默認的對齊方式,第二、如果n小于該變量的類型所占用的字節數,那么偏移量為n的倍數,不用滿足默認的對齊方式。結構的總大小也有個約束條件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節數,那么結構的總大小必須為占用空間最大的變量占用的空間數的倍數;?
否則必須為n的倍數。下面舉例說明其用法。
#pragma pack(push) //保存對齊狀態
#pragma pack(4)//設定為4字節對齊
struct test
{
? char m1;
? double m4;
? int? m3;
};
#pragma pack(pop)//恢復對齊狀態
以上結構的大小為16,下面分析其存儲情況,首先為m1分配空間,其偏移量為0,滿足我們自己設定的對齊方式(4字節對齊),m1占用1個字節。接著開始為 m4分配空間,這時其偏移量為1,需要補足3個字節,這樣使偏移量滿足為n=4的倍數(因為sizeof(double)大于n),m4占用8個字節。接著為m3分配空間,這時其偏移量為12,滿足為4的倍數,m3占用4個字節。這時已經為所有成員變量分配了空間,共分配了16個字節,滿足為n的倍數。如果把上面的#pragma pack(4)改為#pragma pack(16),那么我們可以得到結構的大小為24。(請讀者自己分析)
2、 sizeof用法總結
在VC中,sizeof有著許多的用法,而且很容易引起一些錯誤。下面根據sizeof后面的參數對sizeof的用法做個總結。
A.? 參數為數據類型或者為一般變量。例如sizeof(int),sizeof(long)等等。這種情況要注意的是不同系統系統或者不同編譯器得到的結果可能是不同的。例如int類型在16位系統中占2個字節,在32位系統中占4個字節。
B.? 參數為數組或指針。下面舉例說明.
int a[50];? //sizeof(a)=4*50=200; 求數組所占的空間大小
int *a=new int[50];// sizeof(a)=4; a為一個指針,sizeof(a)是求指針
?????????????????? //的大小,在32位系統中,當然是占4個字節。
C.? 參數為結構或類。Sizeof應用在類和結構的處理情況是相同的。但有兩點需要注意,第一、結構或者類中的靜態成員不對結構或者類的大小產生影響,因為靜態變量的存儲位置與結構或者類的實例地址無關。
第二、沒有成員變量的結構或類的大小為1,因為必須保證結構或類的每一
個實例在內存中都有唯一的地址。
下面舉例說明,
Class Test{int a;static double c};//sizeof(Test)=4.
Test *s;//sizeof(s)=4,s為一個指針。
Class test1{ };//sizeof(test1)=1;
D.? 參數為其他。下面舉例說明。
?? int func(char s[5]);
?? {
???? cout<<sizeof(s);//這里將輸出4,本來s為一個數組,但由于做為函
???????????????????? //數的參數在傳遞的時候系統處理為一個指針,所
???????????????????? //以sizeof(s)實際上為求指針的大小。
???? return 1;
}
sizeof(func("1234"))=4//因為func的返回類型為int,所以相當于
???????????????????? //求sizeof(int).
以上為sizeof的基本用法,在實際的使用中要注意分析VC的分配變量的分配策略,這樣的話可以避免一些錯誤。
--------------------------------------------------------------------------
25.i最后等于多少?
int i = 1;
int j = i++;
if((i>j++) && (i++ == j)) i+=j;
答:
i = 5
--------------------------------------------------------------------------
26.
unsigned short array[]={1,2,3,4,5,6,7};
int i = 3;
*(array + i) = ?
答:
4
--------------------------------------------------------------------------
27.
class A
{
? virtual void func1();
? void func2();
}
Class B: class A
{
? void func1(){cout << "fun1 in class B" << endl;}
? virtual void func2(){cout << "fun2 in class B" << endl;}
}
A, A中的func1和B中的func2都是虛函數.
B, A中的func1和B中的func2都不是虛函數.
C, A中的func2是虛函數.,B中的func1不是虛函數.
D, A中的func2不是虛函數,B中的func1是虛函數.
答:
A
--------------------------------------------------------------------------
28.
數據庫:抽出部門,平均工資,要求按部門的字符串順序排序,不能含有"human resource"部門,
employee結構如下:employee_id, employee_name, depart_id,depart_name,wage
答:
select depart_name, avg(wage)
from employee
where depart_name <> 'human resource'
group by depart_name
order by depart_name
--------------------------------------------------------------------------
29.
給定如下SQL數據庫:Test(num INT(4)) 請用一條SQL語句返回num的最小值,但不許使用統計功能,如MIN,MAX等
答:
select top 1 num
from Test
order by num desc
--------------------------------------------------------------------------
30.
輸出下面程序結果。
#include <iostream.h>
class A
{
public:
?virtual void print(void)
?{
??? cout<<"A::print()"<<endl;
?}
};
class B:public A
{
public:
?virtual void print(void)
?{
?? cout<<"B::print()"<<endl;
?};
};
class C:public B
{
public:
?virtual void print(void)
?{
? cout<<"C::print()"<<endl;
?}
};
void print(A a)
{
?? a.print();
}
void main(void)
{
?? A a, *pa,*pb,*pc;
?? B b;
?? C c;
??
?? pa=&a;
?? pb=&b;
?? pc=&c;
??
?? a.print();
?? b.print();
?? c.print();
??
?? pa->print();
?? pb->print();
?? pc->print();
??
?? print(a);
?? print(b);
?? print(c);
}
A:
A::print()
B::print()
C::print()
A::print()
B::print()
C::print()
A::print()
A::print()
A::print()
--------------------------------------------------------------------------
31.
試編寫函數判斷計算機的字節存儲順序是開序(little endian)還是降序(bigendian)
答:
bool IsBigendian()
{
?unsigned short usData = 0x1122;
?unsigned char? *pucData = (unsigned char*)&usData;
?return (*pucData == 0x22);
}
--------------------------------------------------------------------------
32.簡述Critical Section和Mutex的不同點
答:
對幾種同步對象的總結
1.Critical Section
A.速度快
B.不能用于不同進程
C.不能進行資源統計(每次只可以有一個線程對共享資源進行存取)
2.Mutex
A.速度慢
B.可用于不同進程
C.不能進行資源統計
3.Semaphore
A.速度慢
B.可用于不同進程
C.可進行資源統計(可以讓一個或超過一個線程對共享資源進行存取)
4.Event
A.速度慢
B.可用于不同進程
C.可進行資源統計
--------------------------------------------------------------------------
33.一個數據庫中有兩個表:
一張表為Customer,含字段ID,Name;
一張表為Order,含字段ID,CustomerID(連向Customer中ID的外鍵),Revenue;
寫出求每個Customer的Revenue總和的SQL語句。
建表
create table customer
(
ID int primary key,Name char(10)
)
go
create table [order]
(
ID int primary key,CustomerID? int foreign key references customer(id) , Revenue float
)
go
--查詢
select Customer.ID, sum( isnull([Order].Revenue,0) )
from customer full join [order]
on( [order].customerid=customer.id )
group by customer.id
--------------------------------------------------------------------------
34.請指出下列程序中的錯誤并且修改
void GetMemory(char *p){
? p=(char *)malloc(100);
}
void Test(void){
? char *str=NULL;
? GetMemory=(str);
? strcpy(str,"hello world");
? printf(str);
}
A:錯誤--參數的值改變后,不會傳回
GetMemory并不能傳遞動態內存,Test函數中的 str一直都是 NULL。
strcpy(str, "hello world");將使程序崩潰。
修改如下:
char *GetMemory(){
? char *p=(char *)malloc(100);
? return p;
}
void Test(void){
? char *str=NULL;
? str=GetMemory(){
? strcpy(str,"hello world");
? printf(str);
}
方法二:void GetMemory2(char **p)變為二級指針.
void GetMemory2(char **p, int num)
{
?*p = (char *)malloc(sizeof(char) * num);
}
--------------------------------------------------------------------------
35.程序改錯
class mml
{
? private:
??? static unsigned int x;
? public:
??? mml(){ x++; }
??? mml(static unsigned int &) {x++;}
??? ~mml{x--;}
? pulic:
??? virtual mon() {} = 0;
??? static unsigned int mmc(){return x;}
??? ......?????????????????????
?
};
class nnl:public mml
{
? private:
??? static unsigned int y;
? public:
??? nnl(){ x++; }
??? nnl(static unsigned int &) {x++;}
??? ~nnl{x--;}
? public:
??? virtual mon() {};
???? static unsigned int nnc(){return y;}
??? ......??????????????????
};
代碼片斷:
mml* pp = new nnl;
..........
delete pp;
A:
基類的析構函數應該為虛函數
virtual ~mml{x--;}
--------------------------------------------------------------------------
36.101個硬幣100真、1假,真假區別在于重量。請用無砝碼天平稱兩次給出真幣重還是假幣重的結論。
答:
101個先取出2堆,
33,33
第一次稱,如果不相等,說明有一堆重或輕
那么把重的那堆拿下來,再放另外35個中的33
如果相等,說明假的重,如果不相等,新放上去的還是重的話,說明假的輕(不可能新放上去的輕)
第一次稱,如果相等的話,這66個肯定都是真的,從這66個中取出35個來,與剩下的沒稱過的35個比
下面就不用說了
方法二:
第3題也可以拿A(50),B(50)比一下,一樣的話拿剩下的一個和真的比一下。
如果不一樣,就拿其中的一堆。比如A(50)再分成兩堆25比一下,一樣的話就在
B(50)中,不一樣就在A(50)中,結合第一次的結果就知道了。
--------------------------------------------------------------------------
37.static變量和static 函數各有什么特點?
答:
static變量:在程序運行期內一直有效,如果定義在函數外,則在編譯單元內可見,如果在函數內,在在定義的block內可見;
static函數:在編譯單元內可見;
--------------------------------------------------------------------------
38.用C 寫一個輸入的整數,倒著輸出整數的函數,要求用遞歸方法 ;
答:
void fun( int a )
{
?printf( "%d", a%10 );
?a /= 10;
?if( a <=0 )return;
?fun( a );
}
--------------------------------------------------------------------------
39.寫出程序結果:
void Func(char str[100])
{
? printf("%d\n", sizeof(str));
}
答:
4
分析:
指針長度
--------------------------------------------------------------------------
40.int id[sizeof(unsigned long)];
??? 這個對嗎?為什么??
答:
對
這個 sizeof是編譯時運算符,編譯時就確定了
可以看成和機器有關的常量。
本文主要包括二個部分,第一部分重點介紹在VC中,怎么樣采用sizeof來求結構的大小,以及容易出現的問題,并給出解決問題的方法,第二部分總結出VC中sizeof的主要用法。
1、 sizeof應用在結構上的情況
請看下面的結構:
struct MyStruct
{
double dda1;
char dda;
int type
};
對結構MyStruct采用sizeof會出現什么結果呢?sizeof(MyStruct)為多少呢?也許你會這樣求:
sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當在VC中測試上面結構的大小時,你會發現sizeof(MyStruct)為16。你知道為什么在VC中會得出這樣一個結果嗎?
其實,這是VC對變量存儲的一個特殊處理。為了提高CPU的存儲速度,VC對一些變量的起始地址做了"對齊"處理。在默認情況下,VC規定各成員變量存放的起始地址相對于結構的起始地址的偏移量必須為該變量的類型所占用的字節數的倍數。下面列出常用類型的對齊方式(vc6.0,32位系統)。
類型
對齊方式(變量存放的起始地址相對于結構的起始地址的偏移量)
Char
偏移量必須為sizeof(char)即1的倍數
int
偏移量必須為sizeof(int)即4的倍數
float
偏移量必須為sizeof(float)即4的倍數
double
偏移量必須為sizeof(double)即8的倍數
Short
偏移量必須為sizeof(short)即2的倍數
各成員變量在存放的時候根據在結構中出現的順序依次申請空間,同時按照上面的對齊方式調整位置,空缺的字節VC會自動填充。同時VC為了確保結構的大小為結構的字節邊界數(即該結構中占用最大空間的類型所占用的字節數)的倍?
posted @
2006-09-10 20:36 Jerry Cat 閱讀(170) |
評論 (0) |
編輯 收藏
/********************************************\
|????歡迎轉載, 但請保留作者姓名和原文鏈接, 祝您進步并共勉!???? |
\********************************************/
讀VC++內幕之體悟 - 11
作者: Jerry Cat
時間: 2006/09/10
鏈接:http://m.shnenglu.com/jerysun0818/archive/2006/09/10/12225.html
通過在函數OnInitDialog中加入AfxOleLockControl(someActivexControl.GetClsid());可以把ActiveX控件鎖定在內存中,這樣,除非程序退出或者調用了AfxOleUnlockControl,ActiveX控件將總在內存中。
posted @
2006-09-10 20:20 Jerry Cat 閱讀(705) |
評論 (3) |
編輯 收藏
/********************************************\
|????歡迎轉載, 但請保留作者姓名和原文鏈接, 祝您進步并共勉!???? |
\********************************************/
動態鏈接庫小結
作者: Jerry Cat
時間: 2006/09/02
鏈接: http://m.shnenglu.com/jerysun0818/archive/2006/09/02/11974.html
一.庫模塊:
?(略)
?
二.實現(可以使用Visual C++提供的向導來創建動態鏈接庫和靜態鏈接庫)
1>:Win32 Static Library
2>:Win32 Dynamic-Link-Library
3>:MFC AppWizard(dll)
Regular Dll With MFC statically linked
Regular Dll using shared MFC Dll
MFC Extension Dll (using shared MFC DLL)
?
三.Win32 DLL可以直接使用API,但是不可以直接使用MFC
MFC AppWizard可以直接使用MFC
四.
Regular Dll using shared MFC Dll
和
MFC Extension Dll
兩者比較
(表1 )
Regular Dll using shared MFC Dll
|
MFC Extension Dll (using shared MFC DLL)
|
1.??????
能導出
C
風格函數,全局變量
2.??????
能導出資源
|
1.??????
能導出
C
風格函數,全局變量
2.??????
能導出資源
3.??????
能導出
C++
類,成員函數,重載函數
|
允許靜態或者動態鏈接
MFC
類庫
|
只能動態鏈接
MFC
類庫
|
它允許客戶程序靜態或者動態鏈接
|
只允許客戶程序動態鏈接
|
?
|
?
|
?
五.調用
1>
隱式鏈接
隱式鏈接時,使用
DLL
的程序需要獲取以下信息:
?1.
包含了導出函數(類)聲明的頭文件
?2.
導入庫
(lib_
?3.
實際的
DLL
?
使用導出函數的源文件需要
#include
(
1
)的頭文件,調用導出函數與其它函數完全一樣
?
建立可執行程序時,需要導入
LIB
文件,可通過以下方式實現
1.??????
Project->Setting->Link
在
Object/Library Modules
編輯框中指定
LIB
名字
2.??????
#pragma comment(lib,”LIB
名字
”)
例如:我們想使用
opengl
函數,我們可以
1.#include<gl/gl.h>
?#include<gl/glu.h>
2.#pragma comment(lib, “glu32.lib”)
?#pragma comment(lib, “opengl32.lib”)
2>
顯式鏈接
使用
DLL
的程序在運行時通過函數調用來顯式加載或卸載
DLL
,并通過函數調用來調用
DLL
的導出函數。
?1.
使用
LoadLibrary
來加載
DLL
,得到模塊句柄
?2.
調用
GetProcessAddress
來獲取應用程序要調用的導出函數指針
?3.
使用結束后,用
FreeLibrary
來卸載
DLL
?
例如:我們想使用
xxx.dll
中的
GetVersion
函數,我們可以
typedef UINT (CALLBACK* LPFNDLLFUN)(DWORD,UINT);
HINSTANCE hDll = LoadLibrary(“xxx.dll”);
if(hDll != NULL)
{
??? LPFNDLLFUN lpfnDllFun1 = (LPFNDLLFUN)GetProcess(hDll, “GetVersion”);
??? if(lpfnDllFun1)
??? {
??????? // 你的函數調用
??? }
?? FreeLibrary(hDll);
}
posted @
2006-09-02 21:37 Jerry Cat 閱讀(1099) |
評論 (0) |
編輯 收藏
[轉] C++語錄 - 基本教義派
1。如果C函數的參數為空,其原形必須含關鍵字void,而c++可有可無!
2。函數之所以可以能遞歸,是因為每個函數被調用時,都會把參數和其他的局部對象復制到一塊專用的內存區域,而且同一個函數的每一個執行進程都有一個單獨的復制
3。exter "c"
{??????????????????????????????// 這是個連接說明
?#include "mychdr.h"? // 告訴c++ 庫 這是個用C編譯的函數
}
4。C++采用名字重組技術,給編譯器內部的函數標識符重命名,重組的函數名包含了指定函數的返回植類型和參數類型的符號!
5。自動儲存的類型修飾符指定一個局部變量是自動的,即每次執行到定義該變量的語句塊時,都將為該變量在內存中產生一個新的副本,并對其進行初始化。
6。靜態儲存類型初始化值只在語句塊第一次執行時其作用,在隨后的運行過程中,變量將保持語句塊上一次執行的值!
7。static 儲存類型修飾符使得函數和變量的標識符對于連接到同一個程序的其他源代碼文件而言是不可見的。
8。寄存器變量的地址是無法取得的,因為大多數計算機的硬件寄存器都不占內存地址。
9。C++程序中,默認情況下,函數的所有參數都是以傳值方式,即把實參的一個副本復制到被調用函數的形參中。
10。在編譯器內部,用一個字符數組來表示字符串常量,對字符串的使用實際上就是在引用它的內部地址,所以把字符串給字符型指針實際上就是把常量的地址賦給指針!
11。當函數的形參是指向非const 型變量的指針時,不能用const型變量的地址做形參!
12。任何地址都可以賦值給void 型指針,C++允許任何類型的指針自動轉換成?void型!
13。typedef 的作用是給一個已存在的類型起個別名!
14。指針是儲存地址的變量,地址是相對較小的數據單元(在32機系統中占四個字節)它儲存另一個數據的地址!
15。# undef 預處理指令使得以定義的宏在以后的代碼中無效!
16。不帶參數或所有參數都有默認值的構造函數叫做默認構造函數,實例化對象數組必須有默認的構造函數;如果類中之少有一個構造函數,編輯器將不在提供默認的構造函數!
17。靜態成員只能在類中申明,必須在類外定義,并且靜態成員只能存在唯一一個實例,即使沒有任何類的實例,靜態成員也是已經存在的,類的所有實例都可以使用他,他屬于整個類!
18。靜態成員函數與一般成員函數的區別:靜態成員函數沒有this指針,因此他無法訪問非靜態成員!一般的成員函數隱含this指針
19。初始化和賦值的區別是:初始化是創建一個新的對象,然后用已有的的對象去初始化,賦值是兩個都存在的對象!
20。常量數據成員和引用數據成員必須使用構造函數的參數初始化表來初始化,而不能賦值!
21。對象被申明為常量,那么該對象就不可以調用類中任何非常量型的成員函數。
22。mutable 修飾符申明的數據成員,這樣一個常量型的成員函數就可以修改它的值!
23。class member以他們在class?內的申明次序來初始化和他們在member initialization list 中出現的次序無關!
24。string &operation =(const string & rhs);// 意思是將一個常 string? 指定給另一個string?
25。string &operator =(const char *rhs);//意思是將一個常 char * 指定給一個string?
26。避免傳回內部數據的handls;
27。public繼承是一種( isa),所以任何事情只要對base class? 而言是真,就一定對其 derived class? 為真。
28。純虛函數的兩個接口,他們必須被任何“繼承了他們”的子類重新申明,他們在抽象類中通常沒有定義!
29。純虛函數的申明主要是為了讓derived class 繼承函數的接口;
?????????虛函數的申明主要是為了讓derived class 繼承函數的接口及其缺省行為
??????? 成員函數(非虛)的申明主要是為了讓derived class 繼承函數的實現,表示在 derived? class 中希望不要有不同的行為,即不要重新定義繼承而來的非虛成員函數!
30。絕對不要重新定義繼承而來的參數值,因為虛擬函數系動態綁定,而缺省參數卻是靜態綁定的!
31。對象的靜態型別是程序申明它時所采用的型別。對象的動態型別是指對象目前所代表的型別,表現出一個對象的行為模式!
40:getlin(s,bufsize)表示讀取bufsize-1個字符給s如果遇到換行符就停下來,添加一個空字節,丟棄換行符!
41。編輯器將空白字符默認為分隔符。
42。不允許重載系統中預定義的操作,因此重載操作中至少有個操作數是用戶自定義類型!
43。全局const申明默認情況下是內部連接,而在c 中他們是外部連接,如果希望一個const 對象具有外部連接特性,就必須使用關鍵字“extern”
44.除了寄存器變量以外,程序中的所有對象都存在內存中的。
45。在c++中給void型指針賦值時,不用強制類型轉換是一種錯誤!
posted @
2006-09-02 19:57 Jerry Cat 閱讀(412) |
評論 (0) |
編輯 收藏
[轉]用SIMD指令優化程序之拋磚引玉
小談
CPU
緩存體系
現在的
CPU
依舊采用馮諾伊曼體系,喜歡像傻子一樣從頭執行到尾,中途沒有任何的跳轉停頓等待。可是現實情況是,大部分程序里面還是少不了
IF ELSE
之類的判斷,循環就更加得多了。如何優化循環大家可以自己琢磨,其實不難,可以參考一下《高質量
C\C++
編程指南》
現在
CPU
上都有
Level 1
指令緩存(又叫做
L1 Trace
)與
Level 1
數據緩存(
L1 Data Cache
)。
PMMX
,
P2
,
P3
為二者都準備了
16kb
,我的
P4 Northwood
(以下簡稱
P4NW
)有
8kbL1
數據緩存和
12kb
指令緩存。
CPU
讀取
L1 Data Cache
中的數據只需要
1
個時鐘周期,速度非常快,應該是僅次于寄存器了。數據緩存是由
256
或者
512
行
32bytes
組成的,也就是
32bytes
對齊的,而
P4NW
是
64bytes
字節對齊的,并行
4
路,總共
128
行。當你處理的數據沒有載入緩存的時候,
CPU
將從內存讀取緩存行大小的數據,所以緩存行總是對齊到能被
32
整除的物理地址。
CPU
對
L1
數據緩存中的數據進行操作是最快速的。所以推薦內存地址最起碼是
32byte
對齊的。目前編譯器在這個地方的優化已經非常好了,一般都是
4byte
對齊,當然也都是
32
對齊的。在后面你將會看到,
SSE2
要求數據是
16
字節對齊的。
?
緩存類似一個
C++ set
容器,但是不能賦值到一個任意的內存地址。每行本身都有
1
個
7bit
大小的關聯值(
set value
)要和目標內存地址的
5
到
11
位對應(
0-4
位已經忽略了),也可以理解為,關聯值是內存段地址的一部分。
PPro
中,有
128
個關聯值對應到
2
行,所以最多可以為任意的內存單元準備
2
個緩存行。
PMMX P2 P3 P4NW
有
4
個。由于內存是分段的,所以說
CPU
只能為,
5-11
位地址相同的內存準備
2
或者
4
個不同的緩存行。如何為兩個內存地址賦予相同的關聯值呢?把
2
個地址的低
5bit
去掉,這樣就能被
32
整除了。如果這
2
個截斷了的地址都是
4096
(
1000H
)的倍數,那么這兩個地址就有了相同的關聯值。
?
讓我們用匯編加深一下印象,假設
ESI
中是
32
對齊的地址。
?
??????????????????????????????????????? AGAIN:? MOV? EAX,? [ESI]
MOV? EBX,? [ESI+13*4096+4]
MOV ?ECX,? [ESI+20*4096+28]
DEC? ?EDX
JNZ ??AGAIN
Oh Year
,這里
3
個地址都有相同的關聯值,而且地址跨度都超過了數據緩存的大小,可這個循環在
PPro
上效率會相當低。當你想讀取
ECX
的值的時候,將沒有空閑的緩存行了
——
因為共享一個關聯值,而且
2
行已經被使用了。此時
CPU
將騰出最近使用的
2
個緩存行,一個已經被
EAX
使用。然后
CPU
把這個緩存行用
[ESI+20*4096]
到
[ESI+20*4096+31]
的內存數據填充,然后從緩存中讀取
ECX
。聽起來好象相當的煩瑣。更加糟糕的是,當又需要讀取
EAX
的時候,還需要重復上述的過程,需要對內存緩存來回操作,效率相當的低,甚至不如不用緩存。可是,如果我們把第三行改成:
MOV? ECX,? [ESI+20*4096+32]
哦,不好,看起來,我們的地址超過了
32
,不能被整除了。可是這樣有了不同的關聯值,也就意味著有了
1
個新行,不再共享可憐的
2
個行。這樣一來,對三個寄存器的操作就不需要反復的用
2
個緩存行進行調度了,各有一個了。嘿嘿,這次只需要
3
個時鐘周期了,而上一個要
60
個周期。這是在
PPro
上的,在后來的
CPU
中都是
4
路的,也就不存在上面的問題了。搞笑的是,
Intel
的文檔卻錯誤的說
P2
的緩存是
2
路的。雖然說很少人在用那么古老的
CPU
,可是其中的道理大家應該明白。
可是判斷要訪問的部分數據是否有相同的關聯值,也就是關于緩存是否能夠命中的問題,是相當困難的,匯編還好,用高等級語言編譯過的程序鬼知道是否對緩存做過優化呢。所以么,推薦,在程序的核心部分,對性能要求最高的部分,先對齊數據,然后確保使用的單個數據塊不要超過緩存大小,
2
個數據塊,單個不要超過緩存大小的一半(仔細想想為什么,因為關聯值的問題,可以緩存分為兩部分處理兩塊)。可是大部分情況下,我們都是使用遠比數據緩存大的多的結構,以及編譯器自己返回的指針,然后為了優化你可能希望把所有頻繁使用的變量放到一個連續的數據塊中以充分利用緩存。我們可以這樣做,把靜態變量數值拷貝到棧中的局部變量中,等子函數或者循環結束后再拷貝回來。這樣一來就相當于把靜態變量放入了連續的地址空間中去。
當讀取的數據不在
L1 Cache
內時,
CPU
將要從
L2 Cache
讀取
L1
緩存行大小的數據到
L1
里去,大概需要
200ns
的時間(也就是
100Mhz
系統的
20
個時鐘周期),但是直到你能夠使用這些數據前,又需要有
50-100ns
的延遲。最糟糕的是,如果數據也不在
L2 Cache
中,那么就只能從最慢速的內存里讀取了,內存的龜速哪能和全速的緩存相比。
好了,關于緩存的知識可以就此打住了,下面開始講如何優化緩存。無非就是
3
種方法,硬件預取(
Prefetch
)、軟件預取、使用緩存指令。關于預取的注意事項主要有這些:
<!--[if !supportLists]--> 1、? <!--[endif]--> 合理安排內存的數據,使用塊結構,提高緩存命中率。
<!--[if !supportLists]--> 2、? <!--[endif]--> 使用編譯器提供的預取指令。比如ICC中的_mm_prefetch _mm_stream,甚至_mm_load等比較“傳統”的指令。
<!--[if !supportLists]--> 3、? <!--[endif]--> 盡可能少的使用全局的變量或者指針。
<!--[if !supportLists]--> 4、? <!--[endif]--> 程序盡可能少的進行判斷跳轉循環。
<!--[if !supportLists]--> 5、? <!--[endif]--> 使用const標記,不要在代碼中混合register聲明。
不過要提醒一句,真正提高程序效率的方法不是那種,從頭到尾由于外科手術般的解剖,一個一個地方的優化,請抓住程序最核心的部分進行優化,記住
80-20
規則。
?
使用
SIMD
先復習一下對齊指令,
__declspec(aliagn(#))
,
#
替換為字節數。比如想聲明一個
16
字結對齊的浮點數組,
__declspec(aliagn(16)) float Array[128]
。需要注意的是,最好充分了解你
CPU
的類型,支持哪些指令集。
SIMD
主要使用在需要同時操作大量數據的工作領域,比如
3D
圖形處理(游戲),物理建模(
CAD
),加密,以及科學計算領域。據我所知,目前
GPGPU
也是使用
SIMD
的代表之一。
MMX
主要特性:
57
條指令,
64bit
的
FP
寄存器
MM0-MM7
,對齊到
8
個
80bit
的
FP
寄存器
ST0-ST7
。需要數據
8
字節對齊,也就是使用
Packed
數字。
PS
:這里冒出了一個問題,為什么
Intel
要把
MMX
的寄存器和
FPU
的寄存器混合起來使用呢?因為這里牽涉到一個
FPU
狀態切換問題,后面會提到,當你在一段代碼中又要用到
MMX
指令又要用到傳統的
FPU
指令,那么需要保存
FPU
狀態,或者退出
MMX
。可是這種操作對于
FPU
來說非常昂貴,而且對于多任務操作系統來說,近乎于不可能完成的任務
——
同時有許多程序,有些需要
MMX
,有些不需要,而正確地進行調度會變得非常困難。所以
Intel
將保存狀態的工作完全交給了
CPU
自己,軟件人員無須作太多這方面的工作,這樣一來,就向前向后兼容了多任務操作系統,比如
Windows
和
Linux
。后來隨著操作系統和
CPU
的不斷升級,操作系統開發人員發布了一個補丁包,就可以讓操作系統使用新的寄存器。這時人們都發現
Intel
的這種做法是相當短視的,這可以當作一個重大的失誤。后來
Intel
通過引入了新的浮點指令集,這時才加入
XMM
寄存器。可造成這段故事的原因卻根本不是技術問題,保證兼容性也是一個方面,總之真的說不清楚。你只要記得無法同時使用
MMX
與
FPU
就可以了,
CPU
要進行模式切換。
SSE1
主要特性:
128bit
的
FP
寄存器
XMM0-XMM7
。增加了數據預取指令。額外的
64bit
整數支持。支持同時處理
4
個單精度浮點數,也就是
C\C++
里的
float
。
適用范圍:多媒體信號處理
SSE2
主要特性:
128bit
的
FP
寄存器支持處理同時處理
2
個雙精度
double
浮點數,以及
16byte 8word 4dword 2quadword
整數。
適用范圍:
3D
處理
語音識別
視頻編碼解碼
SSE3
主要特性:增加支持非對稱
asymmetric
和水平
horizontal
計算的
SIMD
指令。為
SIMD
提供了一條特殊的寄存器
load
指令。線程同步指令。
適用范圍:科學計算
多線程程序
手頭工具
1
、選擇一個合適的編譯器,推薦用
Intel C++ Compiler
(以下簡稱
ICC
),以及
Visual Studio .NET 2003
及以上
IDE
附帶的
C++
編譯器。同時,
Microsoft C++ Compiler
也支持
AMD
的
3DNow
。
GCC C++ Compiler
沒有測試。
2
、
Intel
以及
AMD
的匯編指令集手冊。這個是必需的,強烈建議每個C++ Coder人手準備一份。
?
所有的都用
C++
混合變成的方式實現
使用范例:
向量乘法在
3D
處理中非常非常多,多半用于計算單位矢量的夾角。
我們先定義一個頂點結構。
__declspec(align(
16
))?
struct
?Vertex{
????
float
?x,y,z,w;
};
??? 16字節對齊的結構,其實本身也是16字節的東西。如果沒有對齊,運行時會報錯。
w是其次坐標系的參數,處理向量的時候不需要用到。我的函數是這樣的:
float
?Dot(Vertex
*
?v1,Vertex
*
?v2)
{
????Vertex?tmp;
????__asm{
????????MOV?EAX,[v1];
????????MOVAPS?XMM0,[EAX];
????????MOV?EAX,[v2];
????????MOVAPS?XMM1,[EAX];
????????MULPS?XMM0,XMM1;
????????MOVAPS?tmp,XMM0;
????};
????
return
?tmp.x?
+
?tmp.y?
+
?tmp.z;
};
??? VC中反匯編之:
?1?float?Dot(Vertex*?v1,Vertex*
?v2)
?2?
{
?3?
0041C690??push????????ebx??
?4?
0041C691??mov?????????ebx,esp?
?5?0041C693??sub?????????esp,8
?
?6?
0041C696??and?????????esp,0FFFFFFF0h?
?7?0041C699??add?????????esp,4
?
?8?
0041C69C??push????????ebp??
?9?0041C69D??mov?????????ebp,dword?ptr?[ebx+4
]?
10?0041C6A0??mov?????????dword?ptr?[esp+4
],ebp?
11?
0041C6A4??mov?????????ebp,esp?
12?
0041C6A6??sub?????????esp,0E8h?
13?
0041C6AC??push????????esi??
14?
0041C6AD??push????????edi??
15?0041C6AE??lea?????????edi,[ebp-
0E8h]?
16?
0041C6B4??mov?????????ecx,3Ah?
17?
0041C6B9??mov?????????eax,0CCCCCCCCh?
18?
0041C6BE??rep?stos????dword?ptr?[edi]?
19?
????Vertex?tmp;
20?
????__asm{
21?
????????MOV?EAX,[v1];
22?
0041C6C0??mov?????????eax,dword?ptr?[v1]?
23?
????????MOVAPS?XMM0,[EAX];
24?
0041C6C3??movaps??????xmm0,xmmword?ptr?[eax]?
25?
????????MOV?EAX,[v2];
26?
0041C6C6??mov?????????eax,dword?ptr?[v2]?
27?
????????MOVAPS?XMM1,[EAX];
28?
0041C6C9??movaps??????xmm1,xmmword?ptr?[eax]?
29?
????????MULPS?XMM0,XMM1;
30?
0041C6CC??mulps???????xmm0,xmm1?
31?
????????MOVAPS?tmp,XMM0;
32?
0041C6CF??movaps??????xmmword?ptr?[tmp],xmm0?
33?
????};
34?????return?tmp.x?+?tmp.y?+
?tmp.z;
35?
0041C6D3??fld?????????dword?ptr?[tmp]?
36?0041C6D6??fadd????????dword?ptr?[ebp-
1Ch]?
37?0041C6D9??fadd????????dword?ptr?[ebp-
18h]?
38?};
??? 前面都是保護現場入Stack的代碼,沒有必要管。我之所以這樣,在Stack中聲明了一個零時變量返回之,是為了減少代碼的行數。有興趣地可以參考本文后面引用資料中的Intel范例,代碼多的多,功能卻一樣。這樣就可以利用SIMD計算點乘了。圖示:
??? 這種頂點格式稱為AoS(Array of structure),這種結構的好處是,能夠和現有的程序結構,比如D3D中的FVF頂點格式,和GL中的頂點格式。但是,由于許多情況下,并沒有使用第四各浮點數,這就讓SIMD指令浪費了25%的性能。于是有了SoA格式,讓我們重新來過。
??? 我借用了一下上面一個結構的指令,還是沒有用_mm_128格式,讓大家看得清楚一些:
__declspec(align(
16
))?
struct
?Vertex_soa{
?????
float
?x[
4
],y[
4
],z[
4
],w[
4
];
};
??? 依舊16字節對齊。計算函數如下:
?1?void?Dot(Vertex_soa*?v1,Vertex*?v2,float*
?result)
?2?
{
?3?
????Vertex?tmp1,tmp2;
?4?
????__asm{
?5?
????????MOV?ECX,v1;
?6?
????????MOV?EDX,v2;
?7?
?8?
????????MOVAPS?XMM7,[ECX];
?9?????????MOVAPS?XMM6,[ECX+16
];
10?????????MOVAPS?XMM5,[ECX+32
];
11?????????MOVAPS?XMM4,[ECX+48
];
12?
????????MOVAPS?XMM0,XMM7;
13?
????????UNPCKLPS?XMM7,XMM6;
14?
????????MOVLPS?[EDX],XMM7;
15?????????MOVHPS?[EDX+16
],XMM7;
16?
????????UNPCKHPS?XMM0,XMM6;
17?????????MOVLPS?[EDX+32
],XMM0;
18?????????MOVHPS?[EDX+48
],XMM0;
19?
20?
????????MOVAPS?XMM0,XMM5;
21?
????????UNPCKLPS?XMM5,XMM4;
22?
????????UNPCKHPS?XMM0,XMM4;
23?????????MOVLPS?[EDX+8
],XMM5;
24?????????MOVHPS?[EDX+24
],XMM5;
25?????????MOVLPS?[EDX+40
],XMM0;
26?????????MOVHPS?[EDX+56
],XMM0;
27?
28?
????????MOVAPS?XMM3,[EDX];
29?????????MOVAPS?XMM2,[EDX+16
];
30?????????MOVAPS?XMM1,[EDX+32
];
31?????????MOVAPS?XMM0,[EDX+48
];
32?
33?
????????MULPS?XMM3,XMM2;
34?
????????MULPS?XMM1,XMM0;
35?
????????MOVAPS?tmp2,XMM1;
36?
????????MOVAPS?tmp1,XMM3;
37?
????};
38?????result[0]?=?tmp1.x?+?tmp1.y?+
?tmp1.z;
39?????result[1]?=?tmp2.x?+?tmp2.y?+
?tmp2.z;
40?};
??? Oh Year,就是這樣了,同時計算了1對乘法。我在代碼中借用了一下前面的頂點結構,這樣方便一些。至于SOA格式,請看前面的聲明。很多代碼都是轉換Stack中的內存格式,轉換成AOS格式,這樣才能使用SIMD指令計算。
??? 通過上面的演示,想必大家已經對SIMD有了個直觀地認識,其實在自己的代碼中加入這些是非常方便與容易的。雖然說現在的CPU性能已經提高了許多,性能也強了許多,可是在諸多對性能要求高的地方,還是非常烤煙程序員的水平的。
posted @
2006-08-24 21:00 Jerry Cat 閱讀(620) |
評論 (0) |
編輯 收藏
摘要: 用文檔序列化來保存打開文件[理論聯系實際]
文檔與序列化
...
閱讀全文
posted @
2006-08-17 00:38 Jerry Cat 閱讀(882) |
評論 (1) |
編輯 收藏
/********************************************\
|????歡迎轉載, 但請保留作者姓名和原文鏈接, 祝您進步并共勉!???? |
\********************************************/
讀VC++內幕之體悟 - 10
作者: Jerry Cat
時間: 2006/08/05
鏈接:
http://m.shnenglu.com/jerysun0818/archive/2006/08/05/10866.html
10.擴展DLL支持C++接口,并要求客戶程序被動態連接到相同版本的MFC庫,該庫RELEASE版本對應文件為mfc42.dll。正規DLL可以導出C風格的函數,卻不能導出C++類。
posted @
2006-08-05 17:56 Jerry Cat 閱讀(587) |
評論 (0) |
編輯 收藏