转自Qhttp://tech.e800.com.cn/articles/2010/56/1273126029787_1.html
“new”是C++的一个关键字Q同时也是操作符。关于new的话题非常多Q因为它实比较复杂Q也非常秘Q下面我把我了解到的与new有关的内容做一个ȝ?/p>
new的过E?/p>
当我们用关键字new在堆上动态创Z个对象时Q它实际上做了三件事Q获得一块内存空间、调用构造函数、返回正的指针。当?dng)如果我们创徏的是单类型的变量Q那么第二步?x)被省略。假如我们定义了如下一个类AQ?/p>
class A
{
int i;
public:
A(int _i) :i(_i*_i) {}
void Say() { printf("i=%dn", i); }
};
//调用newQ?/p>
A* pa = new A(3);
那么上述动态创Z个对象的q程大致相当于以下三句话Q只是大致上Q:(x)
A* pa = (A*)malloc(sizeof(A));
pa->A::A(3);
return pa;
虽然从效果上看,q三句话也得C一个有效的指向堆上的A对象的指针paQ但区别在于Q当mallocp|Ӟ它不?x)调用分配内存失败处理程序new_handlerQ而用new的话?x)的。因此我们还是要可能的使用newQ除非有一些特D的需求?/p>
new的三UŞ?/p>
到目前ؓ(f)止,本文所提到的new都是指的“new operator”或称?#8220;new expression”Q但事实上在C++中一提到newQ至可能代表以下三U含义:(x)new operator、operator new、placement new?/p>
new operator是我们qx所使用的newQ其行ؓ(f)是前面所说的三个步骤Q我们不能更改它。但具体到某一步骤中的行ؓ(f)Q如果它不满x们的具体要求 Ӟ我们是有可能更改它的。三个步骤中最后一步只是简单的做一个指针的cd转换Q没什么可说的Qƈ且在~译出的代码中也q不需要这U{换,只是Zؓ(f)的认? |了。但前两步就有些内容了?/p>
new operator的第一步分配内存实际上是通过调用operator new来完成的Q这里的new实际上是像加减乘除一L(fng)操作W,因此也是可以重蝲的。operator new默认情况下首先调用分配内存的代码Q尝试得CD堆上的I间Q如果成功就q回Q如果失败,则{而去调用一个new_handerQ然后l重复前? q程。如果我们对q个q程不满意,可以重载operator newQ来讄我们希望的行为。例如:(x)
class A
{
public:
void* operator new(size_t size)
{
printf("operator new calledn");
return ::operator new(size);
}
};
A* a = new A();
q里通过::operator new调用了原有的全局的newQ实C在分配内存之前输Z句话。全局的operator new也是可以重蝲的,但这样一来就不能再递归的用new来分配内存,而只能用malloc了:(x)
void* operator new(size_t size)
{
printf("global newn");
return malloc(size);
}
相应的,delete也有delete operator和operator delete之分Q后者也是可以重载的。ƈ且,如果重蝲了operator newQ就应该也相应的重蝲operator deleteQ这是良好的~程?fn)惯?/p>
new的第三种形?-placement new是用来实现定位构造的Q因此可以实现new operator三步操作中的W二步,也就是在取得了一块可以容Ux定类型对象的内存后,在这块内存上构造一个对象,q有点类g前面代码中的 “p->A::A(3);”q句话,但这q不是一个标准的写法Q正的写法是用placement newQ?/p>
#include
void main()
{
char s[sizeof(A)];
A* p = (A*)s;
new(p) A(3); //p->A::A(3);
p->Say();
}
对头文g或的引用是必ȝQ这h 可以使用placement new。这?#8220;new(p) A(3)”q种奇怪的写法便是placement new了,它实C在指定内存地址上用指定cd的构造函数来构造一个对象的功能Q后面A(3)是Ҏ(gu)造函数的昑ּ调用。这里不隑֏玎ͼq块指定的地址? 可以是栈Q又可以是堆QplacementҎ(gu)不加区分。但是,除非特别必要Q不要直接用placement new Q这毕竟不是用来构造对象的正式写法Q只不过是new operator的一个步骤而已。用new operator地编译器?x)自动生成对placement new的调用的代码Q因此也?x)相应的生成使用delete时调用析构函数的代码。如果是像上面那样在栈上使用了placement newQ则必须手工调用析构函数Q这也是昑ּ调用析构函数的唯一情况Q?/p>
p->~A();
当我们觉得默认的new operator对内存的理不能满我们的需要,而希望自己手工的理内存Ӟplacement new有用了。STL中的allocator׃用了q种方式Q借助placement new来实现更灉|有效的内存管理?/p>
处理内存分配异常
正如前面所_(d)operator new的默认行为是h分配内存Q如果成功则q回此内存地址Q如果失败则调用一个new_handlerQ然后再重复此过E。于是,惌从operator new的执行过E中q回Q则必然需要满下列条件之一Q?/p>
* 分配内存成功
* new_handler中抛出bad_alloc异常
* new_handler中调用exit()或类似的函数QɽE序l束
于是Q我们可以假N认情况下operator new的行为是q样的:(x)
void* operator new(size_t size)
{
void* p = null
while(!(p = malloc(size)))
{
if(null == new_handler)
throw bad_alloc();
try
{
new_handler();
}
catch(bad_alloc e)
{
throw e;
}
catch(…)
{}
}
return p;
}
在默认情况下Qnew_handler的行为是抛出一个bad_alloc异常Q因? 上述循环只会(x)执行一ơ。但如果我们不希望用默认行为,可以自定义一个new_handlerQƈ使用std::set_new_handler函数使其 生效。在自定义的new_handler中,我们可以抛出异常Q可以结束程序,也可以运行一些代码得有可能有内存被I闲出来Q从而下一ơ分配时也许?x)? 功,也可以通过set_new_handler来安装另一个可能更有效的new_handler。例如:(x)
void MyNewHandler()
{
printf(“New handler called!n”);
throw std::bad_alloc();
}
std::set_new_handler(MyNewHandler);
q里new_handlerE序在抛出异怹前会(x)输出一句话。应该注意,? new_handler的代码里应该注意避免再嵌套有对new的调用,因ؓ(f)如果q里调用new再失败的话,可能?x)再D对new_handler的调用, 从而导致无限递归调用?-q是我猜的,q没有尝试过?/p>
在编E时我们应该注意到对new的调用是有可能有异常被抛出的Q因此在new的代码周围应该注意保持其事务性,即不能因用newp|抛出异常来导致不正确的程序逻辑或数据结构的出现。例如:(x)
class SomeClass
{
static int count;
SomeClass() {}
public:
static SomeClass* GetNewInstance()
{
count++;
return new SomeClass();
}
};
静态变量count用于记录此类型生成的实例的个敎ͼ在上qC码中Q如果因new分配内存p|而抛出异常,那么其实例个数ƈ没有增加Q但count变量的值却已经多了一个,从而数据结构被破坏。正的写法是:(x)
static SomeClass* GetNewInstance()
{
SomeClass* p = new SomeClass();
count++;
return p;
}
q样一来,如果newp|则直接抛出异常,count的g?x)增加。类似的Q在处理U程同步Ӟ也要注意cM的问题:(x)
void SomeFunc()
{
lock(someMutex); //加一个锁
delete p;
p = new SomeClass();
unlock(someMutex);
}
此时Q如果newp|Qunlock不?x)被执行Q于是不仅造成了一个指向不正确地址的指针p的存在,q将DsomeMutex永远不会(x)被解锁。这U情冉|要注意避免的。(参考:(x)C++言Q争取异常安全的代码Q? <http://dev.yesky.com/490/2087990.shtml>
STL的内存分配与traits技?/p>
在《STL原码剖析》一书中详细分析了SGI STL的内存分配器的行为。与直接使用new operator不同的是QSGI STLq不依赖C++默认的内存分配方式,而是使用一套自行实现的Ҏ(gu)。首先SGI STL可用内存整块的分配Q之成为当前进E可用的内存Q当E序中确实需要分配内存时Q先从这些已h好的大内存块中尝试取得内存,如果p|的话再尝? 整块的分配大内存。这U做法有效的避免了大量内存碎片的出现Q提高了内存理效率?/p>
Z实现q种方式QSTL使用了placement newQ通过在自q理的内存I间上用placement new来构造对象,以达到原有new operator所h的功能?/p>
template
inline void construct(T1* p, const T2& value)
{
new(p) T1(value);
}
此函数接收一个已构造的对象Q通过拯构造的方式在给定的内存地址p上构造一个新?象,代码中后半截T1(value)便是placement new语法中调用构造函数的写法Q如果传入的对象value正是所要求的类型T1Q那么这里就相当于调用拷贝构造函数。类似的Q因使用?placement newQ编译器不会(x)自动产生调用析构函数的代码,需要手工的实现Q?/p>
template
inline void destory(T* pointer)
{
pointer->~T();
}
与此同时QSTL中还有一个接收两个P代器的destory版本Q可某容器上指定范 围内的对象全部销毁。典型的实现方式是通过一个@环来Ҏ(gu)范围内的对象逐一调用析构函数。如果所传入的对象是非简单类型,q样做是必要的,但如果传入的 是简单类型,或者根本没有必要调用析构函数的自定义类型(例如只包含数个int成员的结构体Q,那么再逐一调用析构函数是没有必要的Q也费了时间。ؓ(f) 此,STL使用了一U称?#8220;type traits”的技巧,在编译器判断出所传入的类型是否需要调用析构函敎ͼ(x)
template
inline void destory(ForwardIterator first, ForwardIterator last)
{
__destory(first, last, value_type(first));
}
其中value_type()用于取出q代器所指向的对象的cd信息Q于是:(x)
template
inline void __destory(ForwardIterator first, ForwardIterator last, T*)
{
typedef typename __type_traits::has_trivial_destructor trivial_destructor;
__destory_aux(first, last, trivial_destructor());
}
//如果需要调用析构函敎ͼ(x)
template
inline void __destory_aux(ForwardIterator first, ForwardIterator last, __false_type)
{
for(; first < last; ++first)
destory(&*first); //因first是P代器Q?first取出其真正内容,然后再用&取地址
}
//如果不需要,׃么也不做Q?/p>
tempalte
inline void __destory_aux(ForwardIterator first, ForwardIterator last, __true_type)
{}
因上q函数全都是inline的,所以多层的函数调用q不?x)对性能造成影响Q最l编? 的结果根据具体的cd只是一个for循环或者什么都没有。这里的关键在于__type_traitsq个模板cMQ它Ҏ(gu)不同的Tc? 型定义出不同的has_trivial_destructor的结果,如果T是简单类型,定义ؓ(f)__true_typecdQ否则就定义? __false_typecd。其中__true_type、__false_type只不q是两个没有M内容的类Q对E序的执行结果没有什么意义,? 在编译器看来它对模板如何特化具有非帔R要的指导意义了,正如上面代码所C的那样。__type_traits也是特化了的一pd?板类Q?/p>
struct __true_type {};
struct __false_type {};
template
struct __type_traits
{
public:
typedef __false _type has_trivial_destructor;
……
};
template<> //模板特化
struct __type_traits //int的特化版?/p>
{
public:
typedef __true_type has_trivial_destructor;
……
};
…… //其他单类型的特化版本
如果要把一个自定义的类型MyClass也定义ؓ(f)不调用析构函敎ͼ只需要相应的定义__type_traits的一个特化版本即可:(x)
template<>
struct __type_traits
{
public:
typedef __true_type has_trivial_destructor;
……
};
模板是比较高U的C++~程技巧,模板特化、模板偏特化更是技巧性很强的? 西,STL中的type_traits充分借助模板特化的功能,实现了在E序~译期通过~译器来军_为每一处调用用哪个特化版本,于是在不增加~程复杂 性的前提下大大提高了E序的运行效率。更详细的内容可参考《STL源码剖析》第二、三章中的相兛_宏V?/p>
带有“[]”的new和delete
我们l常?x)通过new来动态创Z个数l,例如Q?/p>
char* s = new char[100];
……
delete s;
严格的说Q上qC码是不正的Q因为我们在分配内存时用的是new[]Q而ƈ不是单的newQ但释放内存时却用的是delete。正的写法是用delete[]Q?/p>
delete[] s;
但是Q上q错误的代码g也能~译执行Qƈ不会(x)带来什么错误。事实上Qnew与new[]、delete与delete[]是有区别的,特别是当用来操作复杂cd时。假如针对一个我们自定义的类MyClass使用new[]Q?/p>
MyClass* p = new MyClass[10];
上述代码的结果是在堆上分配了10个连l的MyClass实例Qƈ且已l对它们依次? 用了构造函敎ͼ于是我们得到?0个可用的对象Q这一点与Java、C#有区别的QJava、C#中这L(fng)l果只是得到?0个null。换句话_(d)使用 q种写法时MyClass必须拥有不带参数的构造函敎ͼ否则?x)发现编译期错误Q因为编译器无法调用有参数的构造函数?/p>
当这h造成功后Q我们可以再其释放Q释放时使用delete[]Q?/p>
delete[] p;
当我们对动态分配的数组调用delete[]Ӟ其行为根据所甌的变量类型会(x)有所? 同。如果p指向单类型,如int、char{,其结果只不过是这块内存被回收Q此时用delete[]与delete没有区别Q但如果p指向的是复杂 cdQdelete[]?x)针对动态分配得到的每个对象调用析构函数Q然后再释放内存。因此,如果我们对上q分配得到的p指针直接使用delete来回Ӟ 虽然~译期不报什么错误(因ؓ(f)~译器根本看不出来这个指针p是如何分配的Q,但在q行ӞDEBUG情况下)(j)?x)给Z个Debug assertion failed提示?/p>
到这里,我们很容易提Z个问?-delete[]是如何知道要为多个对象调用析构函数的?要回{这个问题,我们可以首先看一看new[]的重载?/p>
class MyClass
{
int a;
public:
MyClass() { printf("ctorn"); }
~MyClass() { printf("dtorn"); }
};
void* operator new[](size_t size)
{
void* p = operator new(size);
printf("calling new[] with size=%d address=%pn", size, p);
return p;
}
// d?/p>
MyClass* mc = new MyClass[3];
printf("address of mc=%pn", mc);
delete[] mc;
q行此段代码Q得到的l果为:(x)QVC2005Q?/p>
calling new[] with size=16 address=003A5A58
ctor
ctor
ctor
address of mc=003A5A5C
dtor
dtor
dtor
虽然Ҏ(gu)造函数和析构函数的调用结果都在预料之中,但所甌的内存空间大以?qing)地址? 数值却出现了问题。我们的cMyClass的大显然是4个字节,q且甌的数l中?个元素,那么应该一q?2个字节才对,但事实上pȝ却ؓ(f)我们? 请了16字节Qƈ且在operator new[]q后我们得到的内存地址是实际申请得到的内存地址值加4的结果。也是_(d)当ؓ(f)复杂cd动态分配数l时Q系l自动在最l得到的内存地址前空Z 4个字节,我们有理q信这4个字节的内容与动态分配数l的长度有关。通过单步跟踪Q很Ҏ(gu)发现q?个字节对应的intgؓ(f)0x00000003Q也是 说记录的是我们分配的对象的个数。改变一下分配的个数然后再次观察的结果证实了我的x。于是,我们也有理由认ؓ(f)new[] operator的行为相当于下面的伪代码Q?/p>
template
T* New[](int count)
{
int size = sizeof(T) * count + 4;
void* p = T::operator new[](size);
*(int*)p = count;
T* pt = (T*)((int)p + 4);
for(int i = 0; i < count; i++)
new(&pt[i]) T();
return pt;
}
上述C意性的代码省略了异常处理的部分Q只是展C当我们对一个复杂类型用new[] 来动态分配数l时其真正的行ؓ(f)是什么,从中可以看到它分配了比预期多4个字节的内存q用它来保存对象的个敎ͼ然后对于后面每一块空间?placement new来调用无参构造函敎ͼq也p释了Z么这U情况下cdL无参构造函敎ͼ最后再首地址q回。类似的Q我们很Ҏ(gu)写出相应的delete[]的实 C码:(x)
template
void Delete[](T* pt)
{
int count = ((int*)pt)[-1];
for(int i = 0; i < count; i++)
pt[i].~T();
void* p = (void*)((int)pt - 4);
T::operator delete[](p);
}
由此可见Q在默认情况下operator new[]与operator new的行为是相同的,operator delete[]与operator delete也是Q不同的是new operator与new[] operator、delete operator与delete[] operator。当?dng)我们可以?gu)不同的需要来选择重蝲带有和不带有“[]”的operator new和deleteQ以满不同的具体需求?/p>
把前面类MyClass的代码稍做修?-注释掉析构函敎ͼ然后再来看看E序的输出:(x)
calling new[] with size=12 address=003A5A58
ctor
ctor
ctor
address of mc=003A5A58
q一ơ,new[]老老实实的甌?2个字节的内存Qƈ且申L(fng)l果与new[] operatorq回的结果也是相同的Q看来,是否在前面添?个字节,只取决于q个cL没有析构函数Q当?dng)q么说ƈ不确切,正确的说法是q个cL否需 要调用构造函敎ͼ因ؓ(f)如下两种情况下虽然这个类没声明析构函敎ͼ但还是多甌?个字节:(x)一是这个类中拥有需要调用析构函数的成员Q二是这个类l承自需? 调用析构函数的类。于是,我们可以递归的定?#8220;需要调用析构函数的c?#8221;Z下三U情况之一Q?/p>
1 昑ּ的声明了析构函数?/p>
2 拥有需要调用析构函数的cȝ成员?/p>
3 l承自需要调用析构函数的cȝ
cM的,动态申L(fng)单类型的数组Ӟ也不?x)多甌?个字节。于是在q两U情况下Q释攑ֆ存时使用delete或delete[]都可以,但ؓ(f)L良好的习(fn)惯,我们q是应该注意只要是动态分配的数组Q释放时׃用delete[]?/p>
释放内存时如何知道长?/p>
但这同时又带来了新问题,既然甌无需调用析构函数的类或简单类型的数组时ƈ没有记录 个数信息Q那么operator deleteQ或更直接的说free()是如何来回收q块内存的呢Q这p研究malloc()q回的内存的l构了。与new[]cM的是Q实际上? malloc()甌内存时也多申请了C字节的内容,只不q这与所甌的变量的cd没有M关系Q我们从调用malloc时所传入的参C可以理解q一 ?-它只接收了要甌的内存的长度Qƈ不关p这块内存用来保存什么类型。下面运行这样一D代码做个实验:(x)
char *p = 0;
for(int i = 0; i < 40; i += 4)
{
char* s = new char[i];
printf("alloc %2d bytes, address=%p distance=%dn", i, s, s - p);
p = s;
}
我们直接来看VC2005下Release版本的运行结果,DEBUG版因包含了较多的调试信息Q这里就不分析了Q?/p>
alloc 0 bytes, address=003A36F0 distance=3815152
alloc 4 bytes, address=003A3700 distance=16
alloc 8 bytes, address=003A3710 distance=16
alloc 12 bytes, address=003A3720 distance=16
alloc 16 bytes, address=003A3738 distance=24
alloc 20 bytes, address=003A84C0 distance=19848
alloc 24 bytes, address=003A84E0 distance=32
alloc 28 bytes, address=003A8500 distance=32
alloc 32 bytes, address=003A8528 distance=40
alloc 36 bytes, address=003A8550 distance=40
每一ơ分配的字节数都比上一ơ多4QdistanceD录着与上一ơ分配的差|W? 一个差值没有实际意义,中间有一个较大的差|可能是这块内存已l被分配了,于是也忽略它。结果中最的差gؓ(f)16字节Q直到我们申?6字节Ӟq个? 值变成了24Q后面也有类似的规律Q那么我们可以认为申h得的内存l构是如下这L(fng)Q?/p>
从图中不隄出,当我们要分配一D内存时Q所得的内存地址和上一ơ的֜址臛_要相?个字节(在DEBUG版中q要更多Q,那么我们可以猜想Q这8个字节中应该记录着与这D|分配的内存有关的信息。观察这8个节内的内容Q得到结果如下:(x)
图中双为每ơ分配所得的地址之前8个字节的内容?6q制表示Q从图中U线所表示? 以看刎ͼq?个字节中的第一个字节乘?卛_到相临两ơ分配时的距,l过试验一ơ性分配更大的长度可知Q第二个字节也是q个意义Qƈ且代表高8位,也就 说前面空的这8个字节中的前两个字节记录了一ơ分配内存的长度信息Q后面的六个字节可能与空闲内存链表的信息有关Q在译内存时用来提供必要的信息。这? 解答了前面提出的问题Q原来C/C++在分配内存时已经记录了够充分的信息用于回收内存Q只不过我们q_不关心它|了?/p>