1769国产精品,日韩一级不卡,久久超碰97中文字幕

Sun, 15 Feb 2009 02:50:00 GMT

�?在自己最�q�的�~�程中注意到一个趋势，正是�q�个��势才引出本月的专栏主题。最�q�，我在��Z�� Microsoft® .NET Framework 的应用程序中完成了大量的 Win32® Interop。我�q�不是要说我的应用程序充满了自定义的 interop 代码�Q�但有时我会�?.NET Framework �c�d��中碰��C��些次要但又繁�i�、不充分的内容，通过调用�?Windows® API�Q�可以快速减��这��L��ȝ��?/p>

因此我认为，.NET Framework 1.0 �?1.1 版类库中存在��M�� Windows 所没有的功能限刉��不��为怪。毕竟，32 位的 Windows�Q�不��何�U�版本）是一个成熟的操作�pȝ��Q��ؓ�q�大客户服务了十多年。相比之下，.NET Framework 却是一个新事物�?/p>

随着��来��多的开发�h员将生��应用�E�序转到托管代码�Q�开发�h员更频繁地研�I�底层操作系�l�以图找��Z��些关键功能显得很自然 �?臛_��目前是如此�?/p>

值得庆幸的是�Q�公��p��a��q�行�?(CLR) �?interop 功能�Q�称为��^台调�? (P/Invoke)�Q�非常完善。在本专栏中�Q�我��重点介�l�如何实际��?P/Invoke 来调�?Windows API 函数。当�?CLR �? COM Interop 功能�Ӟ��P/Invoke 当作名词使用�Q�当指该功能的��用时�Q�则��其当作动词使用。我�q�不打算直接介绍 COM Interop�Q�因为它�?P/Invoke ��h��更好的可讉K��性，却更加复杂，�q�有点自相矛盾，�q��得将 COM Interop 作�ؓ专栏主题来讨��Z��太简明扼要�?/p>

走进 P/Invoke

首先从考察一个简单的 P/Invoke �C�Z��开始。让我们看一看如何调�?Win32 MessageBeep 函数�Q�它的非托管声明如以下代码所�C�：

BOOL MessageBeep(

  UINT uType   // beep type

);

��Z��调用 MessageBeep�Q�您需要在 C# 中将以下代码��d��C��个类或结构定义中�Q?

[DllImport("User32.dll")]

static extern Boolean MessageBeep(UInt32 beepType);

令�h惊讶的是�Q�只需要这�D�代码就可以使托��代码调用非托管�?MessageBeep API。它不是一个方法调用，而是一个外部方法定义。（另外�Q�它接近于一个来�?C �?C# 允许的直接端口，因此以它��v�Ҏ��介绍一些概忉|��有帮助的。）来自托管代码的可能调用如下所�C�：

MessageBeep(0);

��h��意，现在 MessageBeep �Ҏ��被声明�ؓ static。这�?P/Invoke �Ҏ��所要求的，因�ؓ在该 Windows API 中没有一致的实例概念。接下来�Q�还要注意该�Ҏ��被标��Cؓ extern。这是提�C�编译器该方法是通过一个从 DLL 导出的函数实现的�Q�因此不需要提供方法体�?/p>

说到�~�少�Ҏ��体，您是否注意到 MessageBeep 声明�q�没有包含一个方法体�Q�与大多数算法由中间语言 (IL) 指��o�l�成的托��方法不同，P/Invoke �Ҏ��只是元数据，实时 (JIT) �~�译器在�q�行旉��过它将托管代码与非托管�?DLL 函数�q�接��h��。执行这�U�到非托��世界的�q�接所需的一个重要信息就是导出非托管�Ҏ��?DLL 的名�U�。这一信息是由 MessageBeep �Ҏ��声明之前�?DllImport 自定义属性提供的。在本例中，可以看到�Q�MessageBeep 非托��?API 是由 Windows 中的 User32.dll 导出的�?/p>

到现在�ؓ止，关于调用 MessageBeep ��剩两个话题没有介绍�Q�请回顾一下，调用的代码与以下所�C�Z��码片�D�非常相��|��

[DllImport("User32.dll")]

static extern Boolean MessageBeep(UInt32 beepType);

最后这两个话题是与数据��送处�?(data marshaling) 和从托管代码到非托管函数的实际方法调用有关的话题。调用非托管 MessageBeep 函数可以由找��C��用域内的extern MessageBeep 声明的�Q何托��代码执行。该调用�c�M��于�Q何其他对静态方法的调用。它与其他�Q何托��方法调用的共同之处在于带来了数据封送处理的需要�?

C# 的规则之一是它的调用语法只能访�?CLR 数据�c�d��Q�例�?System.UInt32 �?System.Boolean。C# 昄��不识�?Windows API 中��用的��Z�� C 的数据类型（例如 UINT �?BOOL�Q�，�q�些�c�d��只是 C 语言�c�d��的类型定义而已。所以当 Windows API 函数 MessageBeep 按以下方式编写时

BOOL MessageBeep( UINT uType )

外部�Ҏ��必��M��?CLR �c�d��来定义，如您在前面的代码片段中所看到的。需要��用与基础 API 函数�c�d��不同但与之兼容的 CLR �c�d��?P/Invoke 较难使用的一个方面。因此，在本专栏的后面我��用完整的章节来介绍数据��送处理�?

样式

�?C# 中对 Windows API �q�行 P/Invoke 调用是很��单的。但如果�c�d��拒绝使您的应用程序发出嘟壎ͼ�应该��x��设法调用 Windows 使它�q�行�q�项工作�Q�是吗？

是的。但是与选择的方法有养I��而且关系甚大�Q�通常�Q�如果类库提供某�U�途径来实现您的意图，则最好��?API 而不要直接调用非托管代码�Q�因�? CLR �c�d��?Win32 之间在样式上有很大的不同。我可以��关于这个问题的��归结��Z��句话。当您进�?P/Invoke �Ӟ��不要使应用程序逻辑直接属于��M��外部�Ҏ��或其中的构�g。如果您遵��@�q�个��规则，从长�q�看�l�常会省去许多的�ȝ��?/p>

�?1 中的代码昄��了我所讨论�?MessageBeep 外部�Ҏ��的最��附加代码。图 1 中�ƈ没有��M��显著的变化，而只是对无包装的外部�Ҏ��q�行一些普通的改进�Q�这可以使工作更加轻松一些。从�剙��开始，您会注意��C��个名�?Sound 的完整类型，它专用于 MessageBeep。如果我需要��?Windows API 函数 PlaySound 来添加对播放波�Ş的支持，则可以重�?Sound �c�d��。然而，我不会因公开单个公共静态方法的�c�d��而生气。毕竟这只是应用�E�序代码而已。还应该注意刎ͼ�Sound 是密��的�Q��ƈ定义了一个空的私有构造函数。这些只是一些细节，目的是��用户不会错误��C�� Sound �z��c�L��者创建它的实例�?/p>

�?1 中的代码的下一个特征是�Q�P/Invoke 出现位置的实际外部方法是 Sound 的私有方法。这个方法只是由公共 MessageBeep �Ҏ��间接公开�Q�后者接�?BeepTypes �c�d��的参数。这个间接的额外层是一个很关键的细节，它提供了以下好处。首先，应该在类库中引入一个未来的 beep 托管�Ҏ��Q�可以重复地通过公共 MessageBeep �Ҏ��来��用托��?API�Q�而不必更改应用程序中的其余代码�?/p>

该包装方法的�W�二个好处是�Q�当您进�?P/Invoke 调用�Ӟ��您放弃了免受讉K��冲突和其他低�U�破坏的权利�Q�这通常是由 CLR 提供的。缓冲方法可以保护您的应用程序的其余部分免受讉K��冲突及类似问题的影响�Q�即使它不做��M��事而只是传递参敎ͼ�。该�~�冲�Ҏ��由 P/Invoke 调用引入的�Q何潜在的错误本地化�?/p>

��私有外部方法隐藏在公共包装后面的第三同时也是最后的一个好处是�Q�提供了向该�Ҏ��d��一些最��的 CLR 样式的机会。例如，在图 1 中，我将 Windows API 函数�q�回�?Boolean ��p�|转换成更�?CLR 的异常。我�q�定义了一个名�?BeepTypes 的枚丄��型，它的成员对应于同�?Windows API 一起��用的定义倹{��由�?C# 不支持定义，因此可以使用托管枚�D�c�d��来避免��数向整个应用�E�序代码扩散�?/p>

包装�Ҏ��的最后一个好处对于简单的 Windows API 函数�Q�如 MessageBeep�Q�诚然是微不��道的。但是当您开始调用更复杂的非托管函数�Ӟ��您会发现�Q�手动将 Windows API 样式转换成对 CLR 更加友好的方法所带来的好处会��来��多。越是打��在整个应用�E�序中重�?interop 功能�Q�越是应该认真地考虑包装的设计。同时我认�ؓ�Q�在非面向对象的静态包装方法中使用�?CLR 友好的参��C��q��不可以�?/p>

DLL Import 属�?/p>

现在是更深入地进行探讨的时候了。在�Ҏ��代码进�?P/Invoke 调用�Ӟ��DllImportAttribute �c�d��扮演着重要的角艌Ӏ�DllImportAttribute 的主要作用是�l?CLR 指示哪个 DLL 导出您想要调用的函数。相�?DLL 的名�U�被作�ؓ一个构造函数参��C��递给 DllImportAttribute�?/p>

如果您无法肯定哪�?DLL 定义了您要��用的 Windows API 函数�Q�Platform SDK 文档��ؓ您提供最好的帮助资源。在 Windows API 函数主题文字临近�l�尾的位�|�，SDK 文档指定�?C 应用�E�序要��用该函数必须链接�?.lib 文�g。在几乎所有的情况下，�?.lib 文�g��h��与定义该函数的系�l?DLL 文�g相同的名�U�。例如，如果该函数需�?C 应用�E�序链接�? Kernel32.lib�Q�则该函数就定义�?Kernel32.dll 中。您可以�?MessageBeep 中找到有�?MessageBeep �?Platform SDK 文档主题。在该主题结��֤��Q�您会注意到它指出库文�g�?User32.lib�Q�这表明 MessageBeep 是从 User32.dll 中导出的�?/p>

可选的 DllImportAttribute 属�?/p>

除了指出宿主 DLL 外，DllImportAttribute �q�包含了一些可选属性，其中四个特别有趣�Q�EntryPoint、CharSet、SetLastError �?CallingConvention�?/p>

EntryPoint 在不希望外部托管�Ҏ��h��?DLL 导出相同的名�U�的情况下，可以讄��该属性来指示导出�?DLL 函数的入口点名称。当您定义两个调用相同非托管函数的外部方法时�Q�这特别有用。另外，�?Windows 中还可以通过它们的序号值绑定到导出�? DLL 函数。如果您需要这样做�Q�则诸如“#1”�?#8220;#129”�?EntryPoint 值指�C?DLL 中非托管函数的序号��D��不是函数名�?/p>

CharSet 对于字符集，�q��所有版本的 Windows 都是同样创徏的。Windows 9x �p�d��产品�~�少重要�?Unicode 支持�Q��?Windows NT �?Windows CE �p�d��则一开始就使用 Unicode。在�q�些操作�pȝ��上运行的 CLR ��Unicode 用于 String �?Char 数据的内部表�C�。但也不必担�?�?当调�?Windows 9x API 函数�Ӟ��CLR 会自动进行必要的转换�Q�将其从 Unicode转换�?ANSI�?/p>

如果 DLL 函数不以��M��方式处理文本�Q�则可以忽略 DllImportAttribute �?CharSet 属性。然而，�?Char �?String 数据是等式的一部分�Ӟ��应该��?CharSet 属性设�|��ؓ CharSet.Auto。这样可以�� CLR �Ҏ��宿主 OS 使用适当的字�W�集。如果没有显式地讄�� CharSet 属性，则其默认��gؓ CharSet.Ansi。这个默认值是有缺点的�Q�因为对于在 Windows 2000、Windows XP �?Windows NT® 上进行的 interop 调用�Q�它会消极地影响文本参数��送处理的性能�?/p>

应该昑ּ�地选择 CharSet.Ansi �?CharSet.Unicode �?CharSet ��D��不是��?CharSet.Auto 的唯一情况是：您显式地指定了一个导出函敎ͼ�而该函数特定于这两种 Win32 OS 中的某一�U�。ReadDirectoryChangesW API 函数��是�q�样的一个例子，它只存在于基�?Windows NT 的操作系�l�中�Q��ƈ且只支持 Unicode�Q�在�q�种情况下，您应该显式地使用 CharSet.Unicode�?/p>

有时�Q�Windows API 是否有字�W�集关系�q�不明显。一�U�决不会有错的确认方法是�?Platform SDK 中检查该函数�?C 语言头文件。（如果您无法肯定要看哪个头文�g�Q�则可以查看 Platform SDK 文档中列出的每个 API 函数的头文�g。）如果您发现该 API 函数��实定义��Z��个映��到�?A �?W �l�尾的函数名的宏�Q�则字符集与您尝试调用的函数有关�p�R��Windows API 函数的一个例子是�? WinUser.h 中声明的 GetMessage API�Q�您也许会惊讶地发现它有 A �?W 两种版本�?/p>

SetLastError 错误处理非常重要�Q�但在编�E�时�l�常被遗忘。当您进�?P/Invoke 调用�Ӟ��也会面��其他的挑�?�?处理托管代码�?Windows API 错误处理和异�怹�间的区别。我可以�l�您一点徏议�?/p>

如果您正在��?P/Invoke 调用 Windows API 函数�Q�而对于该函数�Q�您使用 GetLastError 来查找扩展的错误信息�Q�则应该在外部方法的 DllImportAttribute 中将 SetLastError 属性设�|��ؓ true。这适用于大多数外部�Ҏ��?/p>

�q�会��D�� CLR 在每�ơ调用外部方法之后缓存由 API 函数讄��的错误。然后，在包装方法中�Q�可以通过调用�c�d��? System.Runtime.InteropServices.Marshal �c�d��中定义的 Marshal.GetLastWin32Error �Ҏ��来获取缓存的错误倹{��我的徏议是��查这些期望来�?API 函数的错误��|��q��ؓ�q�些值引发一个可感知的异常。对于其他所有失败情况（包括�Ҏ��没意料到的��p�|情况�Q�，则引发在 System.ComponentModel 命名�I�间中定义的 Win32Exception�Q��ƈ��? Marshal.GetLastWin32Error �q�回的��g��递给它。如果您回头看一下图 1 中的代码�Q�您会看到我�?extern MessageBeep �Ҏ��的公共包装中��采用了�q�种�Ҏ��?/p>

CallingConvention 我将在此介绍的最后也可能是最不重要的一�?DllImportAttribute 属性是 CallingConvention。通过此属性，可以�l?CLR 指示应该��哪�U�函数调用约定用于堆栈中的参数。CallingConvention.Winapi 的默认值是最好的选择�Q�它在大多数情况下都可行。然而，如果该调用不起作用，则可以检�?Platform SDK 中的声明头文�Ӟ��看看您调用的 API 函数是否是一个不�W�合调用�U�定标准的异�?API�?/p>

通常�Q�本机函敎ͼ�例如 Windows API 函数�?C- �q�行�?DLL 函数�Q�的调用�U�定描述了如何将参数推入�U�程堆栈或从�U�程堆栈中清除。大多数 Windows API 函数都是首先��函数的最后一个参数推入堆栈，然后��p��调用的函数负责清理该堆栈。相反，许多 C-�q�行�?DLL 函数都被定义为按照方法参数在�Ҏ��{�֐�中出现的��序��其推入堆栈�Q�将堆栈清理工作交给调用者�?/p>

�q�运的是�Q�要�?P/Invoke 调用工作只需要让外围讑֤�理解调用�U�定卛_��。通常�Q�从默认�? CallingConvention.Winapi 开始是最好的选择。然后，�?C �q�行�?DLL 函数和少数函��C��Q�可能需要将�U�定更改�? CallingConvention.Cdecl�?/p>

数据��送处�?/p>

数据��送处理是 P/Invoke ��h��挑战性的斚w��。当在托��和非托��代码之间传递数据时�Q�CLR 遵��@许多规则�Q�很��有开发�h员会�l�常遇到它们直至可将�q�些规则��C��。除非您是一名类库开发�h员，否则在通常情况下没有必要掌握其�l�节。�ؓ了最有效地在 CLR 上��?P/Invoke�Q�即使只偶尔需�?interop 的应用程序开发�h员仍然应该理解数据封送处理的一些基��知识�?/p>

在本月专栏的剩余部分中，我将讨论��单数字和字符串数据的数据��送处理。我��从最基本的数字数据封送处理开始，然后介绍��单的指针��送处理和字符串封送处理�?/p>

��送数字和逻辑标量

Windows OS 大部分是�?C �~�写的。因此，Windows API 所用到的数据类型要么是 C �c�d��Q�要么是通过�c�d��定义或宏定义重新标记�?C �c�d��。让我们看看没有指针的数据封送处理。简单�v见，首先重点讨论的是数字和布��倹{�?/p>

当通过值向 Windows API 函数传递参数时�Q�需要知道以下问题的�{�案�Q?

•	数据从根本上讲是整型的还是��Q点型的？
•	如果数据是整型的�Q�则它是有符��L��q�是无符��L��Q?
•	如果数据是整型的�Q�则它的位数是多��？
•	如果数据是��Q点型的，则它是单�_�ֺ�的还是双�_�ֺ�的？

有时�{�案很明显，但有时却不明显。Windows API 以各�U�方式重新定义了基本�?C 数据�c�d��。图 2 列出�?C �?Win32 的一些公共数据类型及其规范，以及一个具有匹配规范的公共语言�q�行库类型�?

通常�Q�只要您选择一个其规范与该参数�?Win32 �c�d��相匹配的 CLR �c�d��Q�您的代码就能够正常工作。不�q�也有一些特例。例如，�? Windows API 中定义的 BOOL �c�d��是一个有�W�号�?32 位整型。然而，BOOL 用于指示 Boolean �?true �? false。虽然您不用��?BOOL 参数作�ؓ System.Int32 值封送，但是如果使用 System.Boolean �c�d��Q�就会获得更合适的映射。字�W�类型的映射�c�M��?BOOL�Q�因为有一个特定的 CLR �c�d�� (System.Char) 指出字符的含义�?/p>

在了解这些信息之后，逐步介绍�C�Z��可能是有帮助的。依焉��?beep 主题作�ؓ例子�Q�让我们来试一�?Kernel32.dll 低�� Beep�Q�它会通过计算机的扬声器发生嘟声。这个方法的 Platform SDK 文档可以�?Beep 中找到。本�?API 按以下方式进行记录：

BOOL Beep(

  DWORD dwFreq,      // Frequency

  DWORD dwDuration   // Duration in milliseconds

);

在参数封送处理方面，您的工作是了解什�?CLR 数据�c�d��?Beep API 函数所使用�?DWORD �?BOOL 数据�c�d��相兼宏V��回��一下图 2 中的图表�Q�您��看�?DWORD 是一�?32 位的无符��h��数��|��如同 CLR �c�d�� System.UInt32。这意味着您可以��?UInt32 ��g��为送往 Beep 的两个参数。BOOL �q�回值是一个非常有��的情况�Q�因��图表告诉我们�Q�在 Win32 中，BOOL 是一�?32 位的有符��h��数。因此，您可以��? System.Int32 ��g��为来�?Beep 的返回倹{��然而，CLR 也定义了 System.Boolean �c�d��作�ؓ Boolean 值的语义�Q�所以应该��用它来替代。CLR 默认��?System.Boolean 值封送�ؓ 32 位的有符��h��数。此处所昄��的外部方法定义是用于 Beep 的结�?P/Invoke �Ҏ��Q?

[DllImport("Kernel32.dll", SetLastError=true)]

static extern Boolean Beep(

   UInt32 frequency, UInt32 duration);

指针参数

许多 Windows API 函数��指针作为它们的一个或多个参数。指针增加了��送数据的复杂性，因�ؓ它们增加了一个间接层。如果没有指针，您可以通过值在�U�程堆栈中传递数据。有了指针，则可以通过引用传递数据，�Ҏ��是将该数据的内存地址推入�U�程堆栈中。然后，函数通过内存地址间接讉K��数据。��用托��代码表�C�此附加间接层的方式有多 �U��?/p>

�?C# 中，如果��方法参数定义�ؓ ref �?out�Q�则数据通过引用而不是通过��g��递。即使您没有使用 Interop 也是�q�样�Q�但只是从一个托��方法调用到另一个托��方法。例如，如果通过 ref 传�?System.Int32 参数�Q�则在线�E�堆栈中传递的是该数据的地址�Q�而不是整数值本�w�。下面是一个定义�ؓ通过引用接收整数值的�Ҏ��的示例：

void FlipInt32(ref Int32 num){

   num = -num;

}

�q�里�Q�FlipInt32 �Ҏ��获取一�?Int32 值的地址、访问数据、对它求反，然后��求反过的��D��l�原始变量。在以下代码中，FlipInt32 �Ҏ��会将调用�E�序的变�?x 的��g�� 10 更改�?-10�Q?

Int32 x = 10;

FlipInt32(ref x);

在托��代码中可以重用�q�种能力�Q�将指针传递给非托��代码。例如，FileEncryptionStatus API 函数�?32 位无�W�号位掩码的形式�q�回文�g加密状态。该 API 按以下所�C�方式进行记录：

BOOL FileEncryptionStatus(

  LPCTSTR lpFileName,  // file name

  LPDWORD lpStatus     // encryption status

);

��h��意，该函数�ƈ不��用它的返回��D��回状态，而是�q�回一�?Boolean ��|��指示调用是否成功。在成功的情况下�Q�实际的状态值是通过�W�二个参数返回的。它的工作方式是调用�E�序向该函数传递指向一�?DWORD 变量的指针，而该 API 函数用状态值填充指向的内存位置。以下代码片�D�|��C�Z��一个调用非托管 FileEncryptionStatus 函数的可能外部方法定义：

[DllImport("Advapi32.dll", CharSet=CharSet.Auto)]

static extern Boolean FileEncryptionStatus(String filename, 

   out UInt32 status);

该定义��?out 关键字来�?UInt32 状态值指�C?by-ref 参数。这里我也可以选择 ref 关键字，实际上在�q�行时会产生相同的机器码。out 关键字只是一�?by-ref 参数的规范，它向 C# �~�译器指�C�所传递的数据只在被调用的函数外部传递。相反，如果使用 ref 关键字，则编译器会假定数据可以在被调用的函数的内部和外部传递�?/p>

托管代码�?out �?ref 参数的另一个很好的斚w��是，地址作�ؓ by-ref 参数传递的变量可以是线�E�堆栈中的一个本地变量、一个类或结构的元素�Q�也可以是具有合适数据类型的数组中的一个元素引用。调用程序的�q�种灉|��性��? by-ref 参数成�ؓ��送缓冲区指针以及单数值指针的一个很好的��L��。只有在我发�?ref �?out 参数不符合我的需要的情况下，我才会考虑��指针封送�ؓ更复杂的 CLR �c�d��Q�例如类或数�l�对象）�?/p>

如果您不熟悉 C 语法或者调�?Windows API 函数�Q�有时很隄��道一个方法参数是否需要指针。一个常见的指示�W�是看参数类型是否是以字�?P �?LP 开头的�Q�例�?LPDWORD �? PINT。在�q�两个例子中�Q�LP �?P 指示参数是一个指针，而它们指向的数据�c�d��分别�?DWORD �? INT。然而，在有些情况下�Q�可以直接��?C 语言语法中的星号 (*) ��?API 函数定义为指针。以下代码片�D�展�C�Z��q�方面的�C�Z��Q?

void TakesAPointer(DWORD* pNum);

可以看到�Q�上�q�函数的唯一一个参数是指向 DWORD 变量的指针�?

当通过 P/Invoke ��送指针时�Q�ref �?out 只用于托��代码中的值类型。当一个参数的 CLR �c�d��使用 struct 关键字定义时�Q�可以认��参数是一个值类型。Out �?ref 用于��送指向这些数据类型的指针�Q�因为通常值类型变量是对象或数据，而在托管代码中�ƈ没有对值类型的引用。相反，当封送引用类型对象时�Q��ƈ不需�? ref �?out 关键字，因�ؓ变量已经是对象的引用了�?/p>

如果您对引用�c�d��和值类型之间的差别不是很熟悉，��h��?2000 �q?12 �?发行�?MSDN® Magazine�Q�在 .NET 专栏的主题中可以扑ֈ�更多信息。大多数 CLR �c�d��都是引用�c�d��Q�然而，除了 System.String �? System.Object�Q�所有的基元�c�d��Q�例�?System.Int32 �?System.Boolean�Q�都是值类型�?/p>

��送不透明 (Opaque) 指针�Q�一�U�特�D�情�?/p>

有时�?Windows API 中，�Ҏ��传递或�q�回的指针是不透明的，�q�意味着该指针��g��技术角度讲是一个指针，但代码却不直接��用它。相反，代码��该指针�q�回�l?Windows 以便随后�q�行重用�?/p>

一个非常常见的例子��是句柄的概��c��在 Windows 中，内部数据�l�构�Q�从文�g到屏�q�上的按钮）在应用程序代码中都表�C�Zؓ句柄。句柄其实就是不透明的指针或有着指针宽度的数��|��应用�E�序用它来表�C�内部的 OS 构造�?/p>

��数情况下，API 函数也将不透明指针定义�?PVOID �?LPVOID �c�d��。在 Windows API 的定义中�Q�这些类型意思就是说该指针没有类型�?/p>

当一个不透明指针�q�回�l�您的应用程序（或者您的应用程序期望得��C��个不透明指针�Q�时�Q�您应该��参数或�q�回值封送�ؓ CLR 中的一�U�特�D�类�?�? System.IntPtr。当您��?IntPtr �c�d��Ӟ��通常不��?out �?ref 参数�Q�因�?IntPtr 意�ؓ直接持有指针。不�q�，如果您将一个指针封送�ؓ一个指针，则对 IntPtr 使用 by-ref 参数是合适的�?/p>

�?CLR �c�d��pȝ��中，System.IntPtr �c�d��有一个特�D�的属性。不像系�l�中的其他基�c�d��Q�IntPtr �q�没有固定的大小。相反，它在�q�行时的大小是依底层操作�pȝ��的正常指针大��而定的。这意味着�?32 位的 Windows 中，IntPtr 变量的宽度是 32 位的�Q�而在 64 位的 Windows 中，实时�~�译器编译的代码会将 IntPtr 值看�?64 位的倹{��当在托��代码和非托��代码之间封送不透明指针�Ӟ��q�种自动调节大小的特点十分有用�?/p>

误��住，��M��q�回或接受句柄的 API 函数其实操作的就是不透明指针。您的代码应该将 Windows 中的句柄��送成 System.IntPtr 倹{�?/p>

您可以在托管代码中将 IntPtr 值强制�{换�ؓ 32 位或 64 位的整数��|��或将后者强制�{换�ؓ前者。然而，当��?Windows API 函数�Ӟ��因�ؓ指针应是不透明的，所以除了存储和传递给外部�Ҏ��外，不能��它们另做它用。这�U?#8220;只限存储和传�?#8221;规则的两个特例是当您需要向外部�Ҏ��传�? null 指针值和需要比�?IntPtr ��g�� null 值的情况。�ؓ了做到这一点，您不能将零强制�{换�ؓ System.IntPtr�Q�而应该在 IntPtr �c�d��上��?Int32.Zero 静态公共字�D�，以便获得用于比较或赋值的 null 倹{�?/p>

��送文�?/p>

在编�E�时�l�常要对文本数据�q�行处理。文本�ؓ interop 刉��了一些麻烦，�q�有两个原因。首先，底层操作�pȝ��可能使用 Unicode 来表�C�字�W�串�Q�也可能使用 ANSI。在极少数情况下�Q�例�?MultiByteToWideChar API 函数的两个参数在字符集上是不一致的�?/p>

�W�二个原因是�Q�当需要进�?P/Invoke �Ӟ��要处理文本还需要特别了解到 C �?CLR 处理文本的方式是不同的。在 C 中，字符串实际上只是一个字�W�值数�l�，通常�?null 作�ؓ�l�束�W�。大多数 Windows API 函数是按照以下条件处理字�W�串的：对于 ANSI�Q�将其作为字�W�值数�l�；对于 Unicode�Q�将其作为宽字符值数�l��?/p>

�q�运的是�Q�CLR 被设计得相当灉|��Q�当��送文本时问题得以��L��解决�Q�而不用在�?Windows API 函数期望从您的应用程序得到的是什么。这里是一些需要记住的主要考虑事项�Q?

•	是您的应用程序向 API 函数传递文本数据，�q�是 API 函数向您的应用程序返回字�W�串数据�Q�或者二者兼有？
•	您的外部�Ҏ��应该使用什么托��类型？
•	API 函数期望得到的是什么格式的非托��字�W�串�Q?/p>

我们首先解答最后一个问题。大多数 Windows API 函数都带�?LPTSTR �?LPCTSTR 倹{��（从函数角度看�Q�它们分别是可修改和不可修改的缓冲区�Q�包含以 null �l�束的字�W�数�l��?#8220;C”代表常数�Q�意味着使用该参��C��息不会传递到函数外部。LPTSTR 中的“T”表明该参数可以是 Unicode �? ANSI�Q�取决于您选择的字�W�集和底层操作系�l�的字符集。因为在 Windows API 中大多数字符串参数都是这两种�c�d��之一�Q�所以只要在 DllImportAttribute 中选择 CharSet.Auto�Q�CLR ��按默认的方式工作�?

然而，有些 API 函数或自定义�?DLL 函数采用不同的方式表�C�字�W�串。如果您要用��C��个这��L��函数�Q�就可以采用 MarshalAsAttribute 修饰外部�Ҏ��的字�W�串参数�Q��ƈ指明一�U�不同于默认 LPTSTR 的字�W�串格式。有�? MarshalAsAttribute 的更多信息，请参阅位�?MarshalAsAttribute Class �?Platform SDK 文档主题�?/p>

现在让我们看一下字�W�串信息在您的代码和非托��函��C��间传递的方向。有两种方式可以知道处理字符串时信息的传递方向。第一个也是最可靠的一个方法就是首先理解参数的用途。例如，您正调用一个参敎ͼ�它的名称�c�M�� CreateMutex �q�带有一个字�W�串�Q�则可以惛_��该字�W�串信息是从应用�E�序�? API 函数传递的。同�Ӟ��如果您调�?GetUserName�Q�则该函数的名称表明字符串信息是从该函数向您的应用程序传递的�?/p>

除了�q�种比较合理的方法外�Q�第二种查找信息传递方向的方式��是查找 API 参数�c�d��中的字母“C”。例如，GetUserName API 函数的第一个参数被定义�?LPTSTR �c�d��Q�它代表一个指�?Unicode �?ANSI 字符串缓冲区的长指针。但�?CreateMutex 的名�U�参数被�c�d��化�ؓ LTCTSTR。请注意�Q�这里的�c�d��定义是一��L��Q�但增加一个字�?#8220;C”来表明缓冲区为常敎ͼ�API 函数不能写入�?/p>

一旦明��了文本参数是只用作输入�q�是用作输入/输出�Q�就可以��定使用哪种 CLR �c�d��作�ؓ参数�c�d��。这里有一些规则。如果字�W�串参数只用作输入，则��?System.String �c�d��。在托管代码中，字符串是不变的，适合用于不会被本�?API 函数更改的缓冲区�?/p>

如果字符串参数可以用作输入和/或输出，则��?System.StringBuilder �c�d��。StringBuilder �c�d��是一个很有用的类库类型，它可以帮助您有效地构建字�W�串�Q�也正好可以��缓冲区传递给本机函数�Q�由本机函数为您填充字符串数据。一旦函数调用返回，您只需要调�?StringBuilder 对象�?ToString ��可以得��C��?String 对象�?/p>

GetShortPathName API 函数能很好地用于昄��什么时候��?String、什么时候��?StringBuilder�Q�因为它只带有三个参敎ͼ�一个输入字�W�串、一个输出字�W�串和一个指明输出缓冲区的字�W�长度的参数�?/p>

�?3 所�C�Zؓ加注释的非托��?GetShortPathName 函数文档�Q�它同时指出了输入和输出字符串参数。它引出了托��的外部�Ҏ��定义�Q�也如图 3 所�C�。请注意�W�一个参数被��送�ؓ System.String�Q�因为它是一个只用作输入的参数。第二个参数代表一个输出缓冲区�Q�它使用�?System.StringBuilder�?/p>

��结

本月专栏所介绍�?P/Invoke 功能��_��调用 Windows 中的许多 API 函数。然而，如果您大量用�? interop�Q�则会最�l�发现自己封送了很复杂的数据�l�构�Q�甚臛_��能需要在托管代码中通过指针直接讉K��内存。实际上�Q�本��Z��码中�?interop 可以是一个将�l�节和低�U�比特藏在里面的真正的潘多拉盒子。CLR、C# 和托��?C++ 提供了许多有用的功能�Q�也�总�后我会在本专栏介�l�高�U�的 P/Invoke 话题�?/p>

同时�Q�只要您觉得 .NET Framework �c�d��无法播放您的声音或者�ؓ您执行其他一些功能，您可以知道如何向原始而优�U��?Windows API ��L��一些帮助�?/p>

Figure 1 MessageBeep, Interop Done Well

namespace Wintellect.Interop.Sound{

   using System;

   using System.Runtime.InteropServices;

   using System.ComponentModel;



   sealed class Sound{

      public static void MessageBeep(BeepTypes type){

         if(!MessageBeep((UInt32) type)){

            Int32 err = Marshal.GetLastWin32Error();

            throw new Win32Exception(err);

         }

      }



      [DllImport("User32.dll", SetLastError=true)]

      static extern Boolean MessageBeep(UInt32 beepType);



      private Sound(){}

   }



   enum BeepTypes{ 

      Simple = -1,

      Ok                = 0x00000000,

      IconHand          = 0x00000010,

      IconQuestion      = 0x00000020,

      IconExclamation   = 0x00000030,

      IconAsterisk      = 0x00000040

   }

}

Figure 2 Non-Pointer Data Types


    
        
            Win32 Types Specification CLR Type
        
    
    
        
            char, INT8, SBYTE, CHARâ�?nbsp;
            8-bit signed integer
            System.SByte
        
        
            short, short int, INT16, SHORT
            16-bit signed integer
            System.Int16
        
        
            int, long, long int, INT32, LONG32, BOOLâ�?nbsp;, INT 
            32-bit signed integer
            System.Int32
        
        
            __int64, INT64, LONGLONG
            64-bit signed integer
            System.Int64
        
        
            unsigned char, UINT8, UCHARâ�?nbsp;, BYTE
            8-bit unsigned integer
            System.Byte
        
        
            unsigned short, UINT16, USHORT, WORD, ATOM, WCHARâ�?nbsp;, __wchar_t
            16-bit unsigned integer
            System.UInt16
        
        
            unsigned, unsigned int, UINT32, ULONG32, DWORD32, ULONG, DWORD, UINT
            32-bit unsigned integer
            System.UInt32
        
        
            unsigned __int64, UINT64, DWORDLONG, ULONGLONG
            64-bit unsigned integer
            System.UInt64
        
        
            float, FLOAT
            Single-precision floating point
            System.Single
        
        
            double, long double, DOUBLE
            Double-precision floating point
            System.Double
        
        
            â�?nbsp;In Win32 this type is an integer with a specially assigned meaning; in contrast, the CLR provides a specific type devoted to this meaning.

Win32 Types	Specification	CLR Type
char, INT8, SBYTE, CHARâ�?nbsp;	8-bit signed integer	System.SByte
short, short int, INT16, SHORT	16-bit signed integer	System.Int16
int, long, long int, INT32, LONG32, BOOLâ�?nbsp;, INT	32-bit signed integer	System.Int32
__int64, INT64, LONGLONG	64-bit signed integer	System.Int64
unsigned char, UINT8, UCHARâ�?nbsp;, BYTE	8-bit unsigned integer	System.Byte
unsigned short, UINT16, USHORT, WORD, ATOM, WCHARâ�?nbsp;, __wchar_t	16-bit unsigned integer	System.UInt16
unsigned, unsigned int, UINT32, ULONG32, DWORD32, ULONG, DWORD, UINT	32-bit unsigned integer	System.UInt32
unsigned __int64, UINT64, DWORDLONG, ULONGLONG	64-bit unsigned integer	System.UInt64
float, FLOAT	Single-precision floating point	System.Single
double, long double, DOUBLE	Double-precision floating point	System.Double
â�?nbsp;In Win32 this type is an integer with a specially assigned meaning; in contrast, the CLR provides a specific type devoted to this meaning.

Figure 3 GetShortPathName Declarations

// ** Documentation for Win32 GetShortPathName() API Function

// DWORD GetShortPathName(

//   LPCTSTR lpszLongPath,      // file for which to get short path 

//   LPTSTR lpszShortPath,      // short path name (output)

//   DWORD cchBuffer            // size of output buffer

// );



[DllImport("Kernel32", CharSet = CharSet.Auto)]

static extern Int32 GetShortPathName(

   String path,                // input string

   StringBuilder shortPath,    // output string

   Int32 shortPathLength);     // StringBuilder.Capacity

王勇�?/a> 2009-02-15 10:50 发表评论

Sun, 15 Feb 2009 02:43:00 GMT

使用C/C++语言开发��Y件的�E�序员经常碰到这��L��问题�Q�有时候是�E�序�~�译没有问题�Q�但是链接的时候��L��报告函数不存在（�l�典�?span lang="EN-US">LNK 2001错误�Q�，有时候是�E�序�~�译和链接都没有错误�Q�但是只要调用库中的函数��׃��出现堆栈异常。这些现象通常是出现在C�?span lang="EN-US">C++的代码�؜合��用的情况下或 �?span lang="EN-US">C++�E�序中��用第三方的库的情况下�Q�不是用C++语言开发的�Q�，其实�q�都是函数调用约定（Calling Convention�Q�和函数名修饎ͼ�Decorated Name�Q�规则惹的祸。函数调用方式决定了函数参数入栈的顺序，是由调用者函数还是被调用函数负责清除栈中的参数等问题�Q�而函数名修饰规则军_��了编译器�? 用何�U�名字修饰方式来区分不同的函敎ͼ�如果函数之间的调用约定不匚w��或者名字修��C��匚w��׃��产生以上的问题。本文分别对C�?span lang="EN-US">C++�q�两�U�编�E�语�a�的函数调用约定和函数名修饰规则进行详�l�的解释�Q�比较了它们的异同之处，�q��D例说明了以上问题出现的原因�?

函数调用�U�定�Q?span lang="EN-US">Calling Convention�Q?/span>

函数调用�U�定不仅军_��了发生函数调用时函数参数的入栈顺序，�q�决定了是由调用者函数还是被调用函数负责清除栈中的参敎ͼ��q�原堆栈。函数调用约定有很多�? 式，除了常见�?span lang="EN-US">__cdecl�Q?span lang="EN-US">__fastcall�?span lang="EN-US">__stdcall之外�Q?span lang="EN-US">C++的编译器�q�支�?span lang="EN-US">thiscall方式�Q�不��?span lang="EN-US">C/C++�~�译器还支持 naked call方式。这么多函数调用�U�定常常令许多程序员很迷惑，到底它们是怎么回事�Q�都是在什么情况下使用呢？下面��分别介�l�这几种函数调用�U�定�?span lang="EN-US">

1.__cdecl

�~�译器的命��o行参数是/Gd�?span lang="EN-US">__cdecl方式�?span lang="EN-US">C/C++�~�译器默认的函数调用�U�定�Q�所有非C++成员函数和那些没有用__stdcall�?span lang="EN-US"> __fastcall声明的函数都默认�?span lang="EN-US">__cdecl方式�Q�它使用C函数调用方式�Q�函数参数按照从叛_��左的��序入栈�Q�函数调用者负责清除栈中的参数�Q�由于每�ơ函数调用都要由�~�译器��生清除（�q�原�Q�堆栈的代码�Q�所以��?span lang="EN-US">__cdecl方式�~�译的程序比使用__stdcall方式�~�译的程序要大很多，但是 __cdecl调用方式是由函数调用者负责清除栈中的函数参数�Q�所以这�U�方式支持可变参敎ͼ�比如printf�?span lang="EN-US">windows�?span lang="EN-US">API wsprintf��是__cdecl调用方式。对�?span lang="EN-US">C函数�Q?span lang="EN-US">__cdecl方式的名字修饰约定是在函数名�U�前��d��一个下划线�Q�对�?span lang="EN-US">C++函数�Q�除非特别�� ?span lang="EN-US">extern "C"�Q?span lang="EN-US">C++函数使用不同的名字修饰方式�?span lang="EN-US">

2.__fastcall

�~�译器的命��o行参数是/Gr�?span lang="EN-US">__fastcall函数调用�U�定在可能的情况下��用寄存器传递参敎ͼ�通常是前两个 DWORD�c�d��的参数或较小的参��C��?span lang="EN-US">ECX�?span lang="EN-US">EDX寄存器传递，其余参数按照从右向左的顺序入栈，被调用函数在�q�回之前负责清除栈中的参数。编译器使用两个@修饰函数名字�Q�后跟十�q�制数表�C�的函数参数列表大小�Q�例如：@function_name@number。需要注意的�?span lang="EN-US">__fastcall函数�?用约定在不同的编译器上可能有不同的实玎ͼ�比如16位的�~�译器和32位的�~�译器，另外�Q�在使用内嵌汇编代码�Ӟ��q�要注意不能和编译器使用的寄存器有冲�H��?span lang="EN-US">

3.__stdcall

�~�译器的命��o行参数是/Gz�Q?span lang="EN-US">__stdcall�?span lang="EN-US">Pascal�E�序的缺省调用方式，大多�?span lang="EN-US">Windows�?span lang="EN-US">API也是__stdcall调用�U�定�?span lang="EN-US"> __stdcall函数调用�U�定��函数参��C��叛_��左入栈，除非使用指针或引用类型的参数�Q�所有参数采用传值方式传递，��p��调用函数负责清除栈中的参数。对 �?span lang="EN-US">C函数�Q?span lang="EN-US">__stdcall的名�U�C��饰方式是在函数名字前��d��下划�U�，在函数名字后��d��@和函数参数的大小�Q�例如：_functionname@number

4.thiscall

thiscall只用�?span lang="EN-US">C++成员函数的调用，函数参数按照从右向左的顺序入栈，�c�d��例的this指针通过ECX寄存器传递。需要注意的�?span lang="EN-US">thiscall不是C++的关键字�Q�不能��?span lang="EN-US">thiscall声明函数�Q�它只能��q��译器使用�?span lang="EN-US">

5.naked call

采用前面几种函数调用�U�定的函敎ͼ��~�译器会在必要的时候自动在函数开始添加保�?span lang="EN-US">ESI�Q?span lang="EN-US">EDI�Q?span lang="EN-US">EBX�Q?span lang="EN-US">EBP寄存器的代码�Q�在退出函数时恢复�q�些寄存�?的内容，使用naked call方式声明的函��C��会添加这��L��代码�Q�这也就是�ؓ什么称其�ؓnaked的原因吧�?span lang="EN-US">naked call不是�c�d��修饰�W�，故必��d��_declspec共同使用�?span lang="EN-US">

VC的编译环境默认是使用__cdecl调用�U�定�Q�也可以在编译环境的Project Setting...菜单�Q��?span lang="EN-US">C/C++ �Q��?span lang="EN-US">Code Generation��w��择讄��函数调用�U�定。也可以直接在函数声明前��d��关键�?span lang="EN-US">__stdcall�?span lang="EN-US">__cdecl�?span lang="EN-US">__fastcall�{�单独确定函数的调用方式。在Windows�pȝ��上开发��Y件常用到WINAPI宏，它可以根据编译设�|�翻译成适当的函数调用约定，�?span lang="EN-US">WIN32中，它被定义�?span lang="EN-US"> __stdcall�?span lang="EN-US">

函数名字修饰�Q?span lang="EN-US">Decorated Name�Q�方�?/span>

函数的名字修饎ͼ�Decorated Name�Q�就是编译器在编译期间创建的一个字�W�串�Q�用来指明函数的定义或原型�?span lang="EN-US">LINK�E�序或其他工��h��旉��要指定函数的名字修饰来定位函数的正确位置�? 多数情况下程序员�q�不需要知道函数的名字修饰�Q?span lang="EN-US">LINK�E�序或其他工具会自动区分他们。当�Ӟ��在某些情况下需要指定函数的名字修饰�Q�例如在C++�E�序中， ��Z��?span lang="EN-US">LINK�E�序或其他工兯��够匹配到正确的函数名字，��必��Mؓ重蝲函数和一些特�D�的函数�Q�如构造函数和析构函数�Q�指定名字装饰。另一�U�需要指定函数的名字修饰的情冉|��在汇�~�程序中调用C�?span lang="EN-US">C++的函数。如果函数名字，调用�U�定�Q�返回值类型或函数参数有�Q何改变，原来的名字修饰就不再有效�Q�必��L��定新�? 名字修饰�?span lang="EN-US">C�?span lang="EN-US">C++�E�序的函数在内部使用不同的名字修饰方式，下面��分别介�l�这两种方式�?span lang="EN-US">

1. C�~�译器的函数名修饰规�?span lang="EN-US">

对于__stdcall调用�U�定�Q�编译器和链接器会在输出函数名前加上一个下划线前缀�Q�函数名后面加上一�?span lang="EN-US">“@”�W�号和其参数的字节数�Q�例�?span lang="EN-US">_functionname@number�?span lang="EN-US">__cdecl调用�U�定仅在输出函数名前加上一个下划线前缀�Q�例�?span lang="EN-US">_functionname�?span lang="EN-US">__fastcall调用�U�定在输出函数名前加上一�?span lang="EN-US">“@”�W�号�Q�后面也是一�?span lang="EN-US">“@”�W�号和其参数的字节数�Q�例�?span lang="EN-US">@functionname@number�?span lang="EN-US">

2. C++�~�译器的函数名修饰规�?span lang="EN-US">

    C++的函数名修饰规则有些复杂�Q�但是信息更充分�Q�通过分析修饰名不仅能够知道函数的调用方式�Q�返回值类型，参数个数甚至参数�c�d��。不��?span lang="EN-US"> __cdecl�Q?span lang="EN-US">__fastcall�q�是__stdcall调用方式�Q�函��C��饰都是以一�?span lang="EN-US">“?”开始，后面紧跟函数的名字，再后面是参数表的开始标识和按照参数�c�d��代号拼出的参数表。对�?span lang="EN-US">__stdcall方式�Q�参数表的开始标识是“@@YG”�Q�对�?span lang="EN-US">__cdecl方式则是“@@YA”�Q�对�?span lang="EN-US">__fastcall方式则是“@@YI”。参数表的拼写代号如下所�C�：
X--void
D--char
E--unsigned char
F--short
H--int
I--unsigned int
J--long
K--unsigned long�Q?span lang="EN-US">DWORD�Q?span lang="EN-US">
M--float
N--double
_N--bool
U--struct
....
�?针的方式有些特别�Q�用PA表示指针�Q�用PB表示const�c�d��的指针。后面的代号表明指针�c�d��Q�如果相同类型的指针�q�箋出现�Q�以“0”代替�Q�一�?span lang="EN-US">“0”�?表一�ơ重复�?span lang="EN-US">U表示�l�构�c�d��Q�通常后跟�l�构体的�c�d��名，�?span lang="EN-US">“@@”表示�l�构�c�d��名的�l�束。函数的�q�回��g��作特�D�处理，它的描述方式和函数参��C��P��紧跟着参数表的开始标志，也就是说�Q�函数参数表的第一��实际上是表�C�函数的�q�回值类型。参数表后以“@Z”标识整个名字的结束，如果该函数无参数�Q�则�?span lang="EN-US">“Z”标识�l�束。下面�D两个例子�Q�假如有以下函数声明�Q?span lang="EN-US">

int Function1(char *var1,unsigned long);

其函��C��饰名�?span lang="EN-US">“?Function1@@YGHPADK@Z”�Q�而对于函数声明：

void Function2();

其函��C��饰名则�ؓ“?Function2@@YGXXZ” �?

对于C++的类成员函数�Q�其调用方式�?span lang="EN-US">thiscall�Q�，函数的名字修��C��非成员的C++函数�E�有不同�Q�首先就是在函数名字和参数表之间插入�?span lang="EN-US">“@”字符引导的类名；其次是参数表的开始标识不同，公有�Q?span lang="EN-US">public�Q�成员函数的标识�?span lang="EN-US">“@@QAE”,保护�Q?span lang="EN-US">protected�Q�成员函数的标识�?span lang="EN-US">“@@IAE”,�U�有�Q?span lang="EN-US">private�Q�成员函数的标识�?span lang="EN-US">“@@AAE”�Q�如果函数声明��用了const关键字，则相应的标识应分别�ؓ“@@QBE”�Q?span lang="EN-US">“@@IBE”�?span lang="EN-US">“@@ABE”。如果参数类型是�c�d��例的引用�Q�则使用“AAV1”�Q�对�?span lang="EN-US">const�c�d��的引用，则��?span lang="EN-US">“ABV1”。下面就以类CTest��Z��说明C++成员函数的名字修饰规则：

class CTest
{
......
private:
    void Function(int);
protected:
    void CopyInfo(const CTest &src);
public:
    long DrawText(HDC hdc, long pos, const TCHAR* text, RGBQUAD color, BYTE bUnder, bool bSet);
    long InsightClass(DWORD dwClass) const;
......
};

对于成员函数Function�Q�其函数修饰名�ؓ“?Function@CTest@@AAEXH@Z”�Q�字�W�串“@@AAE”表示�q�是一个私有函数。成员函�?span lang="EN-US">CopyInfo只有一个参敎ͼ�是对�c?span lang="EN-US">CTest�?span lang="EN-US">const引用参数�Q�其函数修饰名�ؓ“?CopyInfo@CTest@@IAEXABV1@@Z”�?span lang="EN-US"> DrawText是一个比较复杂的函数声明�Q�不仅有字符串参敎ͼ��q�有�l�构体参数和HDC句柄参数�Q�需要指出的�?span lang="EN-US">HDC实际上是一�?span lang="EN-US">HDC__�l�构�c�d��的指针，�q�个参数的表�C�就�?span lang="EN-US">“PAUHDC__@@”�Q�其完整的函��C��饰名�?span lang="EN-US">“?DrawText@CTest@@QAEJPAUHDC__@@JPBDUtagRG BQUAD@@E_N@Z”�?span lang="EN-US">InsightClass是一个共有的const函数�Q�它的成员函数标识是“@@QBE”�Q�完整的修饰名就�?span lang="EN-US">“?InsightClass@CTest@@QBEJK@Z”�?span lang="EN-US">

无论�?span lang="EN-US">C函数名修饰方式还�?span lang="EN-US">C++函数名修饰方式均不改变输出函数名中的字符大小写，�q�和PASCAL调用�U�定不同�Q?span lang="EN-US">PASCAL�U�定输出的函数名无�Q何修��C��全部大写�?span lang="EN-US">

3.查看函数的名字修�?span lang="EN-US">

有两�U�方式可以检查你的程序中的函数的名字修饰�Q��用编译输出列表或使用Dumpbin工具。��?span lang="EN-US">/FAc�Q?span lang="EN-US">/FAs�?span lang="EN-US">/FAcs命��o行参数可以让�~�译�?输出函数或变量名字列表。��?span lang="EN-US">dumpbin.exe /SYMBOLS命��o也可以获�?span lang="EN-US">obj文�g�?span lang="EN-US">lib文�g中的函数或变量名字列表。此外，�q�可以��?span lang="EN-US"> undname.exe ��修饰名转换为未修饰形式�?span lang="EN-US">

函数调用�U�定和名字修饰规则不匚w��引�v的常见问�?/span>

函数调用时如果出现堆栈异常，十有八九是由于函数调用约定不匚w��引�v的。比如动态链接库a有以下导出函敎ͼ�

long MakeFun(long lFun);

动态库生成的时候采用的函数调用�U�定�?span lang="EN-US">__stdcall�Q�所以编译生成的a.dll中函�?span lang="EN-US">MakeFun的调用约定是_stdcall�Q�也��是函数调用时参��C��叛_��左入栈，函数�q�回时自��p��原堆栈。现在某个程序模�?span lang="EN-US">b要引�?span lang="EN-US">a中的MakeFun�Q?span lang="EN-US">b�?span lang="EN-US">a一样��?span lang="EN-US"> C++方式�~�译�Q�只�?span lang="EN-US">b模块的函数调用方式是__cdecl�Q�由�?span lang="EN-US">b包含�?span lang="EN-US">a提供的头文�g�?span lang="EN-US">MakeFun函数声明�Q�所�?span lang="EN-US">MakeFun�?span lang="EN-US">b模块中被其它调用MakeFun的函数认为是__cdecl调用方式�Q?span lang="EN-US">b模块中的�q�些函数在调用完MakeFun当然要帮着恢复堆栈啦，可是MakeFun已经在结�?时自己恢复了堆栈�Q?span lang="EN-US">b模块中的函数�q�样多此一丑ְ�引�v了栈指针错误�Q�从而引发堆栈异常。宏观上的现象就是函数调用没有问题（因�ؓ参数传递顺序是一�?的）�Q?span lang="EN-US">MakeFun也完成了自己的功能，只是函数�q�回后引发错误。解决的�Ҏ��也很��单，只要保证两个模块的在�~�译时设�|�相同的函数调用�U�定��p��了�?

在了解了函数调用�U�定和函数的名修饰规则之后，再来看在C++�E�序中��?span lang="EN-US">C语言�~�译的库时经常出现的LNK 2001错误��很��单了。还以上面例子的两个模块��Z��Q�这一�ơ两个模块在�~�译的时候都采用__stdcall调用�U�定�Q�但�?span lang="EN-US">a.dll使用C语言的语法编译的�Q?span lang="EN-US">C语言方式�Q�，所�?span lang="EN-US">a.dll的蝲入库a.lib�?span lang="EN-US">MakeFun函数的名字修饰就�?span lang="EN-US">“_MakeFun@4”�?span lang="EN-US">b包含�?span lang="EN-US">a提供的头文�g�?span lang="EN-US">MakeFun函数声明�Q�但是由�?span lang="EN-US">b采用的是C++语言�~�译�Q�所�?span lang="EN-US">MakeFun�?span lang="EN-US">b模块中被按照C++的名字修饰规则命名�ؓ“?MakeFun@@YGJJ@Z”�Q�编译过�E�相安无事，链接�E�序�?span lang="EN-US">c++的链接器��到a.lib中去�?span lang="EN-US">“?MakeFun@@YGJJ@Z”�Q�但�?span lang="EN-US">a.lib中只�?span lang="EN-US">“_MakeFun@4”�Q�没�?span lang="EN-US">“?MakeFun@@YGJJ@Z”�Q�于是链接器��报告：

error LNK2001: unresolved external symbol ?MakeFun@@YGJJ@Z

解决的方法和��单，��是要让b模块知道�q�个函数�?span lang="EN-US">C语言�~�译的，extern "C"可以做到�q�一炏V��一个采�?span lang="EN-US">C语言�~�译的库应该考虑��C��用这个库的程序可能是C++�E�序�Q��?span lang="EN-US">C++�~�译器）�Q�所以在设计头文件时应该注意�q�一炏V��通常应该�q�样声明头文�Ӟ��

#ifdef _cplusplus
extern "C" {
#endif

long MakeFun(long lFun);

#ifdef _cplusplus
}
#endif

�q�样C++的编译器��q��?span lang="EN-US">MakeFun的修饰名�?span lang="EN-US">“_MakeFun@4”�Q�就不会有链接错误了�?span lang="EN-US">

许多��Z��明白�Q��ؓ什么我使用的编译器都是VC的编译器�q�会产生“error LNK2001”错误�Q�其实，VC的编译器会根据源文�g的扩展名选择�~�译方式�Q�如果文件的扩展名是“.C”�Q�编译器会采�?span lang="EN-US">C的语法编译，如果扩展名是 “.cpp”�Q�编译器会��?span lang="EN-US">C++的语法编译程序，所以，最好的�Ҏ��是使用extern "C"�?span lang="EN-US">

王勇�?/a> 2009-02-15 10:43 发表评论

Sun, 15 Feb 2009 02:38:00 GMT

1. ASCII�?/strong>

我们知道�Q�在计算机内部，所有的信息最�l�都表示��Z��个二�q�制的字�W�串。每一个二�q�制位（bit�Q�有0�?两种状态，因此八个二进制位��可以组合出 256�U�状态，�q�被�U�Cؓ一个字节（byte�Q�。也��是��_��一个字节一共可以用来表�C?56�U�不同的状态，每一个状态对应一个符��P��是256个符��P��? 0000000�?1111111�?/p>
上个世纪60�q�代�Q�美国制定了一套字�W�编码，对英语字�W�与二进制位之间的关�p�，做了�l�一规定。这被称为ASCII码，一直沿用至今�?/p>
ASCII码一��p��定了128个字�W�的�~�码�Q�比如空�?#8220;SPACE”�?2�Q�二�q�制00100000�Q�，大写的字母A�?5�Q�二�q�制01000001�Q�。这128个符��P��包括32个不能打印出来的控制�W�号�Q�，只占用了一个字节的后面7位，最前面�?位统一规定�?�?/p>
2、非ASCII�~�码

��p��?28个符��L��码就够了�Q�但是用来表�C�其他语�a��Q?28个符��h��不够的。比如，在法语中�Q�字母上�Ҏ��注音�W�号�Q�它��无法用ASCII码表�C��? 于是�Q�一些欧�z�国家就军_��Q�利用字节中闲置的最高位�~�入新的�W�号。比如，法语中的é的编码�ؓ130�Q�二�q�制10000010�Q�。这样一来，�q�些�Ƨ洲国家�? 用的�~�码体系�Q�可以表�C�最�?56个符受��?/p>
但是�Q�这里又出现了新的问题。不同的国家有不同的字母�Q�因此，哪怕它们都使用256个符��L��~�码方式�Q�代表的字母却不一栗��比如，130在法语编�? 中代表了é�Q�在希伯来语�~�码中却代表了字母Gimel (ג)�Q�在俄语�~�码中又会代表另一个符受��但是不��怎样�Q�所有这些编码方式中�Q?�?27表示的符��h��一��L��Q�不一��L��只是128�?55的这一�D�c�?/p>
至于亚洲国家的文字，使用的符号就更多了，汉字��多�?0万左叟뀂一个字节只能表�C?56�U�符��P��肯定是不够的�Q�就必须使用多个字节表达一个符受��? 比如�Q�简体中文常见的�~�码方式是GB2312�Q��用两个字节表�C�Z��个汉字，所以理��Z��最多可以表�C?56x256=65536个符受��?/p>
中文�~�码的问题需要专文讨论，�q�篇�W�记不涉及。这里只指出�Q�虽焉��是用多个字节表示一个符��P��但是GB�cȝ��汉字�~�码与后文的Unicode和UTF-8是毫无关�pȝ��?/p>
3.Unicode

正如上一节所��_��世界上存在着多种�~�码方式�Q�同一个二�q�制数字可以被解释成不同的符受��因此，要想打开一个文本文�Ӟ��必��ȝ��道它的编码方式，否则用错误的�~�码方式解读�Q�就会出��Cؕ码。�ؓ什么电子邮件常常出��Cؕ码？��是因�ؓ发信人和收信��Z��用的�~�码方式不一栗��?/p>
可以惌��Q�如果有一�U�编码，��世界上所有的�W�号都纳入其中。每一个符号都�l�予一个独一无二的编码，那么��q��问题��׃��消失。这��是Unicode�Q�就像它的名字都表示的，�q�是一�U�所有符��L��~�码�?/p>
Unicode当然是一个很大的集合�Q�现在的规模可以容纳100多万个符受��每个符��L��~�码都不一��P��比如�Q�U+0639表示阿拉伯字母Ain�Q�U+0041表示��p��的大写字母A�Q�U+4E25表示汉字“�?#8221;。具体的�W�号对应表，可以查询unicode.org�Q�或者专门的汉字对应�?/a>�?

4. Unicode的问�?/strong>

需要注意的是，Unicode只是一个符号集�Q�它只规定了�W�号的二�q�制代码�Q�却没有规定�q�个二进制代码应该如何存储�?/p>
比如�Q�汉�?#8220;�?#8221;的unicode是十六进制数4E25�Q��{换成二进制数��?5位（100111000100101�Q�，也就是说�q�个�W�号的表�C��需�?个字节。表�C�其他更大的�W�号�Q�可能需�?个字节或�?个字节，甚至更多�?/p>
�q�里��有两个严重的问题，�W�一个问题是�Q�如何才能区别unicode和ascii�Q�计��机怎么知道三个字节表示一个符��P��而不是分别表�C�Z��个符�? 呢？�W�二个问题是�Q�我们已�l�知道，英文字母只用一个字节表�C�就够了�Q�如果unicode�l�一规定�Q�每个符��L��三个或四个字节表�C�，那么每个英文字母前都�? 然有二到三个字节�?�Q�这对于存储来说是极大的��费�Q�文本文件的大小会因此大��Z��三倍，�q�是无法接受的�?/p>
它们造成的结果是�Q?�Q�出��C��unicode的多�U�存储方式，也就是说有许多种不同的二�q�制格式�Q�可以用来表�C�unicode�?�Q�unicode在很长一�D�|��间内无法推广�Q�直��C��联网的出现�?/p>
5.UTF-8

互联�|�的普及�Q�强烈要求出��C��U�统一的编码方式。UTF-8��是在互联网上��用最�q�的一�U�unicode的实现方式。其他实现方式还包括UTF-16和UTF-32�Q�不�q�在互联�|�上基本不用�?strong>重复一遍，�q�里的关�p�L��Q�UTF-8是Unicode的实现方式之一�?/strong>

UTF-8最大的一个特点，��是它是一�U�变长的�~�码方式。它可以使用1~4个字节表�C�Z��个符��P��Ҏ��不同的符可��变化字节长度�?/p>
UTF-8的编码规则很��单，只有二条�Q?/p>
1�Q�对于单字节的符��P��字节的第一位设�?�Q�后�?位�ؓ�q�个�W�号的unicode码。因此对于英语字母，UTF-8�~�码和ASCII码是相同的�?/p>
2�Q�对于n字节的符��P��n>1�Q�，�W�一个字节的前n位都设�ؓ1�Q�第n+1位设�?�Q�后面字节的前两位一律设�?0。剩下的没有提及的二�q�制位，全部��个符��L��unicode码�?/p>
下表�ȝ��了编码规则，字母x表示可用�~�码的位�?/p>

Unicode�W�号范围 | UTF-8�~�码方式
(十六�q�制) | �Q�二�q�制�Q?br> --------------------+---------------------------------------------
0000 0000-0000 007F | 0xxxxxxx
0000 0080-0000 07FF | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

下面�Q�还是以汉字“�?#8221;��Z��Q�演�C�如何实现UTF-8�~�码�?/p>
已知“�?#8221;的unicode�?E25�Q?00111000100101�Q�，�Ҏ��上表�Q�可以发�?E25处在�W�三行的范围内（0000 0800-0000 FFFF�Q�，因此“�?#8221;的UTF-8�~�码需要三个字节，��x��式是“1110xxxx 10xxxxxx 10xxxxxx”。然后，�?#8220;�?#8221;的最后一个二�q�制位开始，依次从后向前填入格式中的x�Q�多出的位补0。这样就得到了，“�?#8221;的UTF-8�~�码�? “11100100 10111000 10100101”�Q��{换成十六�q�制��是E4B8A5�?/p>
6. Unicode与UTF-8之间的�{�?/strong>

通过上一节的例子�Q�可以看�?#8220;�?#8221;的Unicode码是4E25�Q�UTF-8�~�码是E4B8A5�Q�两者是不一��L��。它们之间的转换可以通过�E�序实现�?/p>
在Windows�q�_��下，有一个最��单的转化�Ҏ��Q�就是��用内�|�的��C��本小�E�序Notepad.exe。打开文�g后，点击“文�g”菜单中的“另存�?#8221;命��o�Q�会跛_��一个对话框�Q�在最底部有一�?#8220;�~�码”的下拉条�?/p>

里面有四个选项�Q�ANSI�Q�Unicode�Q�Unicode big endian �?UTF-8�?/p>
1�Q�ANSI是默认的�~�码方式。对于英文文件是ASCII�~�码�Q�对于简体中文文件是GB2312�~�码�Q�只针对Windows��体中文版�Q�如果是�J�体中文版会采用Big5码）�?/p>
2�Q�Unicode�~�码指的是UCS-2�~�码方式�Q�即直接用两个字节存入字�W�的Unicode码。这个选项用的little endian格式�?/p>
3�Q�Unicode big endian�~�码与上一个选项相对应。我在下一节会解释little endian和big endian的涵义�?/p>
4�Q�UTF-8�~�码�Q�也��是上一节谈到的�~�码�Ҏ��?/p>
选择�?#8221;�~�码方式“后，点击”保存“按钮�Q�文件的�~�码方式��q��刻�{换好了�?/p>
7. Little endian和Big endian

上一节已�l�提刎ͼ�Unicode码可以采用UCS-2格式直接存储。以汉字”�?#8220;��Z��Q�Unicode码是4E25�Q�需要用两个字节存储�Q�一个字�? �?E�Q�另一个字节是25。存储的时候，4E在前�Q?5在后�Q�就是Big endian方式�Q?5在前�Q?E在后�Q�就是Little endian方式�?/p>
�q�两个古怪的名称来自英国作家斯威夫特的《格列佛游记》。在该书中，��h国里爆发了内战，战争起因是�h们争论，吃鸡蛋时�I�竟是从大头(Big- Endian)敲开�q�是从小�?Little-Endian)敲开。�ؓ了这件事情，前后爆发了六�ơ战争，一个皇帝送了命，另一个皇帝丢了王位�?/p>
因此�Q�第一个字节在前，��是”大头方式“�Q�Big endian�Q�，�W�二个字节在前就�?#8221;��头方式“�Q�Little endian�Q��?/p>
那么很自然的�Q�就会出��C��个问题：计算机怎么知道某一个文件到底采用哪一�U�方式编码？

Unicode规范中定义，每一个文件的最前面分别加入一个表�C�编码顺序的字符�Q�这个字�W�的名字叫做”零宽度非换行�I�格“�Q�ZERO WIDTH NO-BREAK SPACE�Q�，用FEFF表示。这正好是两个字节，而且FF比FE�?�?/p>
如果一个文本文件的头两个字节是FE FF�Q�就表示该文仉��用大头方式；如果头两个字节是FF FE�Q�就表示该文仉��用小头方式�?/p>
8. 实例

下面�Q��D一个实例�?/p>
打开”��C��?#8220;�E�序Notepad.exe�Q�新��Z��个文本文�Ӟ��内容��是一�?#8221;�?#8220;字，依次采用ANSI�Q�Unicode�Q�Unicode big endian �?UTF-8�~�码方式保存�?/p>
然后�Q�用文本�~�辑软�gUltraEdit�?/a>�?#8221;十六�q�制功能“�Q�观察该文�g的内部编码方式�?/p>
1�Q�ANSI�Q�文件的�~�码��是两个字节“D1 CF”�Q�这正是“�?#8221;的GB2312�~�码�Q�这也暗�C�GB2312是采用大头方式存储的�?/p>
2�Q�Unicode�Q�编码是四个字节“FF FE 25 4E”�Q�其�?#8220;FF FE”表明是小头方式存储，真正的编码是4E25�?/p>
3�Q�Unicode big endian�Q�编码是四个字节“FE FF 4E 25”�Q�其�?#8220;FE FF”表明是大头方式存储�?/p>
4�Q�UTF-8�Q�编码是六个字节“EF BB BF E4 B8 A5”�Q�前三个字节“EF BB BF”表示�q�是UTF-8�~�码�Q�后三个“E4B8A5”��是“�?#8221;的具体编码，它的存储��序与编码顺序是一致的�?/p>
9. 延��阅读

* The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets�Q�关于字�W�集的最基本知识�Q?/p>
* 谈谈Unicode�~�码

* RFC3629�Q�UTF-8, a transformation format of ISO 10646�Q�如果实现UTF-8的规定）

王勇�?/a> 2009-02-15 10:38 发表评论

Sun, 15 Feb 2009 02:37:00 GMT
如果你用C++来编写COM�Q�那么你��必不可��的使用�q�三个类型。��用这三种wrapper class毫无疑问会简化我们的�~�程�Q��得��用SAFEARRAY, VARIANT和BSTR��单。但是，使用�q�三个类型依焉��要小心，因�ؓ使用不当的话�Q�就会造成内存泄漏�Q�或效率降低�?br>
1. 如果拯��两个BSTR
假如我们一个BSTR�Q�这个时候我希望复制一份BSTR�Q��ƈ丢弃之前的BSTR。通常我们会这么写�Q?br>
CComBSTR StringToBSTR(const string & sVal)
{
     CComBSTR bstrValue = sVal.data();
     return bstrValue;
}

int main()
{
     CComBSTR vValue = StringToBSTR("value");

     return 0;
}

当然�Q�上面这个程序没有�Q何问题，不会有�Q何内存泄漏的可能。但是，你有没有上面代码里都发生了什么了�Q?br>�{�案很简单，在函数StringToBSTR里面�Q�讲bstrValue�q�回的时候，会调用CComBSTR::Copy()�Q�在Copy()里面��会调用
::SysAllocStringByteLen()
�q�个函数。而后在给vValue赋值的时候，�?会调用一��?br>::SysAllocString()
显而易见，开销很大�?br>
那么�Q�我们将怎么改进�q�段代码了？

BSTR StringToBSTR(const string & sVal)
{
     CComBSTR bstrValue = sVal.data();
     return bstrValue.Detach();
}

int main()
{
     CComBSTR vValue.Attach(StringToBSTR("value"));

     return 0;
}
�q�样�Q�通过CComBSTR::Detach()�Q�我们将BSTR�q�回回来�Q�通过CComBSTR::Attach()�Q�我们将BSTR指针存储��h��。这��P��减��了两次开销�Q�大大提高了效率�Q�也不会造成内存效率�?br>
2. 如何使用CComSafeArray
�? 用CComSafeArray的一个最大的好处�Q�就是它会自动释攑օ�素是VARIANT和BSTR。也��是��_��如果你的�c�d��是VARIANT�Q�它会自动调 �?:VariantClear()。如果你的类型是BSTR�Q�他会自动调�?:SysStringFree()�Ҏ��。但是��用它的时候，同样要小心�?br>2.1 成对使用::SafeArrayAccessData()�?:SafeArrayUnaccessData()
我们有时候会�q�样使用CComSafeArray的元素：

void DoSomething()
{
     CComSafeArray<double> pSafeArray(3);
     double * pVal = NULL;
     ::SafeArrayAccessData(pSafeArray.m_psa, (void**)&pVal);

     //handle the elements through the pVal;
}
因�ؓ::SafeArrayAccessData �Ҏ��会在SFAEARRAY上给lock�?. 如果上面�E�序昄��调用CComSafeArray::Destroy()函数�Q�你��查它�q�回来的HRESULT的时候，应该是下面的��|��
        hr   0x8002000d 内存已锁定�?   HRESULT
如果你不仔细��查，那么��造成CComSafeArray没有释放�?br>2.2 从CComSafeArray转�ؓ成CComVariant
有时候我们��用CComVariant包装SAFEARRY。你会这样写代码�Q?br>
void DoSomething()
{
     CComSafeArray<double> pSafeArray(3);

     //fill the safearray

     CComVariant v = pSafeArray.Detach();
}
你可能会��d��CComVariant会存储pSafeArray的指针。可惜，你错了�?br>CComVariant会调�?:SafeArrayCopy 来完成赋值操作。而你的pSafeArray已经调用了Detach()操作�Q�那么它里面的SAFEARRAY��变成了孤儿�Q�没有�h去释攑֮�了�?br>那么你应该怎么写了�Q?br>你可以这么写�Q?br>
void DoSomething()
{
     CComSafeArray<double> pSafeArray(3);

     //fill the safearray

     CComVariant v = pSafeArray.m_psa;
}
�q�样�Q�CComVariant会调�?:SafeArrayCopy 来完成复制操作，而CComSafeArray也会保证在析构的时候释��N��面的SAFEARRAY�?br>
使用上面三个wrapper�c�，��实可以很方便我们编�E�，也能避免很多memory leak。但是，使用他们同样要小心，不然�Q�同样会造成性能损失�Q�或者，更糟�p�的�Q�内存泄漏�?img src ="http://m.shnenglu.com/netboy/aggbug/73846.html" width = "1" height = "1" />

王勇�?/a> 2009-02-15 10:37 发表评论

Sun, 15 Feb 2009 02:30:00 GMT
C 风格�Q�C-style�Q�强制�{型如下：
(T) exdivssion // cast exdivssion to be of type T
函数风格�Q�Function-style�Q�强制�{型��用这��L��语法�Q?
T(exdivssion) // cast exdivssion to be of type T

�q�两�U��Ş式之间没有本质上的不同，它纯�_�就是一个把括号攑֜�哪的问题。我把这两种形式�U�Cؓ旧风��|��old-style�Q�的强制转型�?br>

使用标准C++的类型�{换符�Q�static_cast、dynamic_cast、reinterdivt_cast、和const_cast�?br>1. static_cast
用法�Q�static_cast < type-id > ( exdivssion )
该运��符把exdivssion转换为type-id�c�d��Q�但没有�q�行时类型检查来保证转换的安全性。它主要有如下几�U�用法：
①用于类层次�l�构中基�c�d��子类之间指针或引用的转换�?br>　　�q�行上行转换�Q�把子类的指针或引用转换成基�c�表�C�）是安全的�Q?br>　　�q�行下行转换�Q�把基类指针或引用�{换成子类表示�Q�时�Q�由于没有动态类型检查，所以是不安全的�?br>②用于基本数据类型之间的转换�Q�如把int转换成char�Q�把int转换成enum。这�U��{换的安全性也要开发�h员来保证�?br>③把�I�指针�{换成目标�c�d��的空指针�?br>④把��M��c�d��的表辑ּ�转换成void�c�d��?br>注意�Q�static_cast不能转换掉exdivssion的const、volitale、或者__unaligned属性�?br>
2. dynamic_cast
用法�Q�dynamic_cast < type-id > ( exdivssion )
该运��符把exdivssion转换成type-id�c�d��的对象。Type-id必须是类的指针、类的引用或者void *�Q?br>如果type-id是类指针�c�d��Q�那么exdivssion也必��L��一个指针，如果type-id是一个引用，那么exdivssion也必��L��一个引用�?br>dynamic_cast主要用于�c�d��ơ间的上行�{换和下行转换�Q�还可以用于�c�M��间的交叉转换�?br>在类层次间进行上行�{换时�Q�dynamic_cast和static_cast的效果是一��L��Q?br>在进行下行�{换时�Q�dynamic_cast��h��c�d��查的功能�Q�比static_cast更安全�?br>class B{
public:
int m_iNum;
virtual void foo();
};
class D:public B{
public:
char *m_szName[100];
};
void func(B *pb){
D *pd1 = static_cast(pb);
D *pd2 = dynamic_cast(pb);
}
在上面的代码�D�中�Q�如果pb指向一个D�c�d��的对象，pd1和pd2是一��L��Q��ƈ且对�q�两个指针执行D�c�d��的�Q何操作都是安全的�Q?br>但是�Q�如果pb指向的是一个B�c�d��的对象，那么pd1��是一个指向该对象的指针，对它�q�行D�c�d��的操作将是不安全的（如访问m_szName�Q�，
而pd2��是一个空指针�?br>另外要注意：B要有虚函敎ͼ�否则会编译出错；static_cast则没有这个限制�?br>�q�是�׃��q�行时类型检查需要运行时�c�d��信息�Q�而这个信息存储在�cȝ��虚函数表�Q?br>关于虚函数表的概念，详细可见�Q�中�Q�只有定义了虚函数的�c�L��有虚函数表，
没有定义虚函数的�c�L��没有虚函数表的�?br>另外�Q�dynamic_cast�q�支持交叉�{换（cross cast�Q�。如下代码所�C��?br>class A{
public:
int m_iNum;
virtual void f(){}
};
class B:public A{
};
class D:public A{
};
void foo(){
B *pb = new B;
pb->m_iNum = 100;
D *pd1 = static_cast(pb); //compile error
D *pd2 = dynamic_cast(pb); //pd2 is NULL
delete pb;
}
在函数foo中，使用static_cast�q�行转换是不被允许的�Q�将在编译时出错�Q�而��?dynamic_cast的�{换则是允许的�Q�结果是�I�指针�?br>
3. reindivter_cast
用法�Q�reindivter_cast (exdivssion)
type-id必须是一个指针、引用、算术类型、函数指针或者成员指针�?br>它可以把一个指针�{换成一个整敎ͼ�也可以把一个整数�{换成一个指针（先把一个指针�{换成一个整敎ͼ�
在把该整数�{换成原类型的指针�Q�还可以得到原先的指针��|��?br>该运��符的用法比较多�?br>4. const_cast
用法�Q�const_cast (exdivssion)
该运��符用来修改�c�d��的const或volatile属性。除了const 或volatile修饰之外�Q?type_id和exdivssion的类型是一��L��?br>帔R��指针被�{化成非常量指针，�q�且仍然指向原来的对象；
帔R��引用被�{换成非常量引用，�q�且仍然指向原来的对象；帔R��对象被�{换成非常量对象�?br>Voiatile和const�c�试。�D如下一例：
class B{
public:
int m_iNum;
}
void foo(){
const B b1;
b1.m_iNum = 100; //comile error
B b2 = const_cast(b1);
b2. m_iNum = 200; //fine
}
上面的代码编译时会报错，因�ؓb1是一个常量对象，不能对它�q�行改变�Q?br>使用const_cast把它转换成一个常量对象，��可以对它的数据成员��L��改变。注意：b1和b2是两个不同的对象�?br>
== ===========================================
== dynamic_cast .vs. static_cast
== ===========================================

class B { ... };
class D : public B { ... };

void f(B* pb)
{
D* pd1 = dynamic_cast(pb);
D* pd2 = static_cast(pb);
}

If pb really points to an object of type D, then pd1 and pd2 will get the same value. They will also get the same value if pb == 0.

If pb points to an object of type B and not to the complete D class, then dynamic_cast will know enough to return zero. However, static_cast relies on the programmer’s assertion that pb points to an object of type D and simply returns a pointer to that supposed D object.

即dynamic_cast可用于��承体�p�M��的向下�{型，卛_��基类指针转换为派生类指针�Q�比static_cast更严格更安全。dynamic_cast在执行效率上比static_cast要差一些，但static_cast在更宽上范围内可以完成映��，�q�种不加限制的映��伴随着不安全性。static_cast覆盖的变换类型除�c�d��ơ的静态导航以外，�q�包括无映射变换、窄化变�?�q�种变换会导致对象切�?丢失信息)、用VOID*的强制变换、隐式类型变换等...

== ===========================================
== static_cast .vs. reinterdivt_cast
== ================================================

reinterdivt_cast是�ؓ了映��到一个完全不同类型的意思，�q�个关键词在我们需要把�c�d��映射回原有类型时用到它。我们映��到的类型仅仅是��Z��故弄玄虚和其他目的，�q�是所有映��中最危险的�?�q�句话是C++�~�程思想中的原话)
static_cast �?reinterdivt_cast 操作�W�修改了操作数类型。它们不是互逆的�Q?static_cast 在编译时使用�c�d��信息执行转换�Q�在转换执行必要的检��?诸如指针��界计算, �c�d��?. 其操作数相对是安全的。另一斚w��Q�reinterdivt_cast 仅仅是重新解释了�l�出的对象的比特模型而没有进行二�q�制转换�Q?例子如下�Q?br>

int n=9; double d=static_cast < double > (n);

上面的例子中, 我们��一个变量从 int 转换�?double�?�q�些�c�d��的二�q�制表达式是不同的�?要将整数 9 转换�?双精度整�?9�Q�static_cast 需要正��地为双�_�ֺ�整数 d 补��比特位。其�l�果�?9.0。而reinterdivt_cast 的行为却不同:

int n=9;
double d=reinterdivt_cast (n);

�q�次, �l�果有所不同. 在进行计��以�? d 包含无用�? �q�是因�ؓ reinterdivt_cast 仅仅是复�?n 的比特位�?d, 没有�q�行必要的分�?

因此, 你需要�}慎��?reinterdivt_cast.

王勇�?/a> 2009-02-15 10:30 发表评论

关于sizeof()的简单解析（转）

Sun, 15 Feb 2009 02:29:00 GMT
在所有说明之前，�l�大家出一道题目：

int a=256;

printf("%d\n", sizeof(++a));

printf("%d\n", a);

那么到底打印的是多少呢？

应该�?�?56�Q�我想第一个答案大家应该已�l�没有问题了�Q�但是�ؓ什么在++a以后�Q�a的数��D��是没有发生变化呢�Q�因为sizeof�Q�）是一个运��符�Q�在其中的所有的�q�算都是无效的，所�?+a�Ҏ��没有运行�?br>
上面的一个例子提醒我们，虽然sizeof看这��单，但是其中�q�是有很多的问题值得讨论的，呵呵�?br>
一、sizeof的概��c��
　　sizeof是C语言的一�U�单目操作符�Q�如C语言的其他操作符++�?-�{�。它�q�不是函数。sizeof操作�W�以字节形式�l�出了其操作数的存储大小。操作数可以是一个表辑ּ�或括在括号内的类型名。操作数的存储大��由操作数的�c�d��军_��。　

二、sizeof的��用方法　
　　1、用于数据类型　

　　sizeof使用形式�Q�sizeof�Q�type�Q�　

　　数据�c�d��必须用括��h��住。如sizeof�Q�int�Q�。　

　　2、用于变量　

　　sizeof使用形式�Q�sizeof�Q�var_name�Q�或sizeof　var_name　

　　变量名可以不用括��h��住。如sizeof　(var_name)�Q�sizeof　var_name�{�都是正��Ş式。带括号的用法更普遍�Q�大多数�E�序员采用这�U��Ş式。　

　　注意�Q�sizeof操作�W�不能用于函数类型，不完全类型或位字�D�c��不完全�c�d��指具有未知存储大��的数据�c�d��Q�如未知存储大小的数�l�类型、未知内容的�l�构或联合类型、void�c�d��{�。　

　　如sizeof(max)若此时变量max定义为int　max(),sizeof(char_v)　若此时char_v定义为char　char_v　[MAX]且MAX未知�Q�sizeof(void)都不是正��Ş式。　

三、sizeof的结果　
　　sizeof操作�W�的�l�果�c�d��是size_t�Q�它在头文�g

中typedef为unsigned　int�c�d��。该�c�d��保证能容�U�_��现所建立的最大对象的字节大小。　

　　1、若操作数具有类型char、unsigned　char或signed　char�Q�其�l�果�{�于1。　

　　ANSI　C正式规定字符�c�d��?字节。　

2、int、unsigned　int　、short　int、unsigned　short　、long　int　、unsigned　long　�?nbsp; float、double、long　double�c�d��的sizeof　在ANSI　C中没有具体规定，大小依赖于实玎ͼ�一般可能分别�ؓ2�?�?�?2�?4�?�?�?�?0。　

　　3、当操作数是指针�Ӟ��sizeof依赖于编译器。例如Microsoft　C/C++7.0中，near�c�L��针字节数�?�Q�far、huge�c�L��针字节数�?。一般Unix的指针字节数�?。　

　　4、当操作数具有数�l�类型时�Q�其�l�果是数�l�的��d��节数。　

　　5、联合类型操作数的sizeof是其最大字节成员的字节数。结构类型操作数的sizeof是这�U�类型对象的��d��节数�Q�包括�Q何垫补在内。　

　　让我们看如下�l�构�Q�　

　　struct　{char　b;　double　x;}　a;　

　　在某些机器上sizeof�Q�a�Q?12�Q�而一般sizeof�Q�char�Q?　sizeof�Q�double�Q?9。　

　　�q�是因�ؓ�~�译器在考虑寚w��问题�Ӟ��在结构中插入�I�Z��以控制各成员对象的地址寚w��。如double�c�d��的结构成员x要放在被4整除的地址。　

　　6、如果操作数是函��C��的数�l��Ş参或函数�c�d��的�Ş参，sizeof�l�出其指针的大小。　

四、sizeof与其他操作符的关�p�R��
　　sizeof的优先��?�U�，�?�?�{?�U�运��符优先�U�高。它可以与其他操作符一��L��成表辑ּ�。如i*sizeof�Q�int�Q�；其中i为int�c�d��变量。　

五、sizeof的主要用途　
　　1、sizeof操作�W�的一个主要用途是与存储分配和I/O�pȝ��那样的例�E�进行通信。例如：　

　　void　*malloc�Q�size_t　size�Q?　

　　size_t　fread(void　*　ptr,size_t　size,size_t　nmemb,FILE　*　stream)。　

　　2、sizeof的另一个的主要用途是计算数组中元素的个数。例如：　

　　void　*　memset�Q�void　*　s,int　c,sizeof(s)�Q�。　

六、徏议　
　　�׃��操作数的字节数在实现时可能出现变化，��在涉及到操作数字节大��时用sizeof来代替常量计��?br>

=============================================================
本文主要包括二个部分�Q�第一部分重点介绍在VC中，怎么样采用sizeof来求�l�构的大��，以及�Ҏ��出现的问题，�q�给��决问题的�Ҏ��Q�第二部分�ȝ��出VC中sizeof的主要用法�?

1�?sizeof应用在结构上的情�?

��L��下面的结构：

struct MyStruct

{

double dda1;

char dda;

int type

};

对结构MyStruct采用sizeof会出��C��么结果呢�Q�sizeof(MyStruct)为多��呢�Q�也�怽�会这��h��Q?

sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13

但是当在VC中测试上面结构的大小�Ӟ��你会发现sizeof(MyStruct)�?6。你知道��Z��么在VC中会得出�q�样一个结果吗�Q?

其实�Q�这是VC对变量存储的一个特�D�处理。�ؓ了提高CPU的存储速度�Q�VC对一些变量的起始地址做了"寚w��"处理。在默认情况下，VC规定各成员变量存攄��起始地址相对于结构的起始地址的偏�U�量必须��变量的类型所占用的字节数的倍数。下面列出常用类型的寚w��方式(vc6.0,32位系�l?�?

�c�d��
寚w��方式�Q�变量存攄��起始地址相对于结构的起始地址的偏�U�量�Q?

Char
偏移量必��Mؓsizeof(char)�?的倍数

int
偏移量必��Mؓsizeof(int)�?的倍数

float
偏移量必��Mؓsizeof(float)�?的倍数

double
偏移量必��Mؓsizeof(double)�?的倍数

Short
偏移量必��Mؓsizeof(short)�?的倍数

各成员变量在存放的时候根据在�l�构中出现的��序依次甌��I�间�Q�同时按照上面的寚w��方式调整位置�Q�空�~�的字节VC会自动填充。同时VC��Z��保�l�构的大��ؓ�l�构的字节边界数�Q�即该结构中占用最大空间的�c�d��所占用的字节数�Q�的倍数�Q�所以在为最后一个成员变量申��L��间后�Q�还会根据需要自动填充空�~�的字节�?

下面用前面的例子来说明VC到底怎么��h��存放�l�构的�?

struct MyStruct

{

double dda1;

char dda;

int type

}�Q?

��Z��面的�l�构分配�I�间的时候，VC�Ҏ��成员变量出现的顺序和寚w��方式�Q�先为第一个成员dda1分配�I�间�Q�其起始地址跟结构的起始地址相同�Q�刚好偏�U�量0刚好为sizeof(double)的倍数�Q�，该成员变量占用sizeof(double)=8个字节；接下来�ؓ�W�二个成员dda分配�I�间�Q�这时下一个可以分配的地址对于�l�构的�v始地址的偏�U�量�?�Q�是sizeof(char)的倍数�Q�所以把dda存放在偏�U�量�?的地�Ҏ��_��齐方式，该成员变量占�?nbsp; sizeof(char)=1个字节；接下来�ؓ�W�三个成员type分配�I�间�Q�这时下一个可以分配的地址对于�l�构的�v始地址的偏�U�量�?�Q�不�?sizeof (int)=4的倍数�Q��ؓ了满��_��齐方式对偏移量的�U�束问题�Q�VC自动填充3个字节（�q�三个字节没有放什么东西）�Q�这时下一个可以分配的地址对于�l�构的�v始地址的偏�U�量�?2�Q�刚好是sizeof(int)=4的倍数�Q�所以把type存放在偏�U�量�?2的地方，该成员变量占用sizeof (int)=4个字节；�q�时整个�l�构的成员变量已�l�都分配了空��_��ȝ��占用的空间大��ؓ�Q?+1+3+4=16�Q�刚好�ؓ�l�构的字节边界数�Q�即�l�构中占用最大空间的�c�d��所占用的字节数sizeof(double)=8�Q�的倍数�Q�所以没有空�~�的字节需要填充。所以整个结构的大小为：sizeof (MyStruct)=8+1+ 3+4=16�Q�其中有3个字节是VC自动填充的，没有放�Q何有意义的东�ѝ�?

下面再�D个例子，交换一下上面的MyStruct的成员变量的位置�Q��它变成下面的情况�Q?

struct MyStruct

{

char dda;

double dda1;

int type

}�Q?

�q�个�l�构占用的空间�ؓ多大呢？在VC6.0环境下，可以得到sizeof(MyStruc)�?4。结合上面提到的分配�I�间的一些原则，分析下VC怎么样�ؓ上面的结构分配空间的。（��单说明）

struct MyStruct

{

char dda;//偏移量�ؓ0�Q�满��_��齐方式，dda占用1个字节；

double dda1;//下一个可用的地址的偏�U�量�?�Q�不是sizeof(double)=8

             //的倍数�Q�需要补��?个字节才能��偏移量变�?�Q�满��_��?

             //方式�Q�，因此VC自动填充7个字节，dda1存放在偏�U�量�?

             //的地址上，它占�?个字节�?

int type�Q?/下一个可用的地址的偏�U�量�?6�Q�是sizeof(int)=4的�?

           //敎ͼ�满��int的对齐方式，所以不需要VC自动填充�Q�type�?

           //攑֜�偏移量�ؓ16的地址上，它占�?个字节�?

}�Q?/所有成员变量都分配了空��_��I�间�ȝ��大小�?+7+8+4=20�Q�不是结�?

   //的节边界敎ͼ�即结构中占用最大空间的�c�d��所占用的字节数sizeof

   //(double)=8�Q�的倍数�Q�所以需要填�?个字节，以满��结构的大小�?

   //sizeof(double)=8的倍数�?

所以该�l�构�ȝ��大小为：sizeof(MyStruc)�?+7+8+4+4=24。其中�ȝ��?+4=11个字节是VC自动填充的，没有放�Q何有意义的东�ѝ�?

VC对结构的存储的特�D�处理确实提高CPU存储变量的速度�Q�但是有时候也带来了一些麻烦，我们也屏蔽掉变量默认的对齐方式，自己可以讑֮�变量的对齐方式�?

#pragma pack(n)
VC 中提供了#pragma pack(n)来设定变量以n字节寚w��方式。n字节寚w��是说变量存攄��起始地址的偏�U�量有两�U�情况：�W�一、如果n大于�{�于该变量所占用的字节数�Q�那么偏�U�量必须满��默认的对齐方式，�W�二、如果n��于该变量的�c�d��所占用的字节数�Q�那么偏�U�量为n的倍数�Q�不用满��默认的寚w��方式。结构的��d��也有个�U�束条�g�Q�分下面两种情况�Q�如果n大于所有成员变量类型所占用的字节数�Q�那么结构的��d��必��Mؓ占用�I�间最大的变量占用的空间数的倍数�Q?nbsp;

否则必须为n的倍数。下面�D例说明其用法�?

#pragma pack(push) //保存寚w��状�?

#pragma pack(4)//讑֮��?字节寚w��

struct test

{

char m1;

double m4;

int m3;

};

#pragma pack(pop)//恢复寚w��状�?

以上�l�构的大��ؓ16�Q�下面分析其存储情况�Q�首先�ؓm1分配�I�间�Q�其偏移量�ؓ0�Q�满��x��们自��p��定的寚w��方式�Q?字节寚w��Q�，m1占用1个字节。接着开始�ؓ m4分配�I�间�Q�这时其偏移量�ؓ1�Q�需要补��?个字节，�q�样使偏�U�量满��为n=4的倍数�Q�因为sizeof(double)大于n�Q?m4占用8个字节。接着为m3分配�I�间�Q�这时其偏移量�ؓ12�Q�满��ؓ4的倍数�Q�m3占用4个字节。这时已�l��ؓ所有成员变量分配了�I�间�Q�共分配�?6个字节，满��为n的倍数。如果把上面�?pragma pack(4)改�ؓ#pragma pack(16)�Q�那么我们可以得到结构的大小�?4。（误��者自己分析）

2�?sizeof用法�ȝ��

在VC中，sizeof有着许多的用法，而且很容易引起一些错误。下面根据sizeof后面的参数对sizeof的用法做个�ȝ��?

A�Q?nbsp; 参数为数据类型或者�ؓ一般变量。例如sizeof(int),sizeof(long)�{�等。这�U�情况要注意的是不同�pȝ��pȝ��或者不同编译器得到的结果可能是不同的。例如int�c�d��?6位系�l�中�?个字节，�?2位系�l�中�?个字节�?

B�Q?nbsp; 参数为数�l�或指针。下面�D例说�?

int a[50]; //sizeof(a)=4*50=200; 求数�l�所占的�I�间大小

int *a=new int[50];// sizeof(a)=4; a��Z��个指针，sizeof(a)是求指针

                   //的大��?�?2位系�l�中�Q�当然是�?个字节�?

C�Q?nbsp; 参数为结构或�c�R��Sizeof应用在类和结构的处理情况是相同的。但有两炚w��要注意，�W�一、结构或者类中的静态成员不对结构或者类的大��生媄响，因�ؓ静态变量的存储位置与结构或者类的实例地址无关�?

�W�二、没有成员变量的�l�构或类的大��ؓ1�Q�因为必��M��证结构或�cȝ��每一

个实例在内存中都有唯一的地址�?

下面举例说明�Q?

Class Test{int a;static double c};//sizeof(Test)=4.

Test *s;//sizeof(s)=4,s��Z��个指针�?

Class test1{ };//sizeof(test1)=1;

D�Q?nbsp; 参数为其他。下面�D例说明�?

   int func(char s[5]);

   {

     cout<
                     //数的参数在传递的时候系�l�处理�ؓ一个指针，所

                     //以sizeof(s)实际上�ؓ求指针的大小�?

     return 1;

}

sizeof(func("1234"))=4//因�ؓfunc的返回类型�ؓint�Q�所以相当于

                     //求sizeof(int).

以上为sizeof的基本用法，在实际的使用中要注意分析VC的分配变量的分配�{�略�Q�这��L��话可以避免一些错误�?img src ="http://m.shnenglu.com/netboy/aggbug/73842.html" width = "1" height = "1" />

王勇�?/a> 2009-02-15 10:29 发表评论