來(lái)源自自1999年7月MSJ雜志的《Win32 Q&A》欄目
你也許會(huì)說(shuō)我一直用CreateThread來(lái)創(chuàng)建線程,一直都工作得好好的,為什么要用_beginthreadex來(lái)代替CreateThread,下面讓我來(lái)告訴你為什么。
回答一個(gè)問(wèn)題可以有兩種方式,一種是簡(jiǎn)單的,一種是復(fù)雜的。
如果你不愿意看下面的長(zhǎng)篇大論,那我可以告訴你簡(jiǎn)單的答案:_beginthreadex在內(nèi)部調(diào)用了CreateThread,在調(diào)用之前_beginthreadex做了很多的工作,從而使得它比CreateThread更安全。
為什么我們需要兩個(gè)幾乎相同的庫(kù)來(lái)分別對(duì)待單線程和多線程程序?說(shuō)起來(lái)也很簡(jiǎn)單,兩個(gè)字——效率。讓我們從頭說(shuō)起,標(biāo)準(zhǔn)CRT庫(kù)出現(xiàn)于1970年左右,那時(shí),線程的概念尚未出現(xiàn)在任何一個(gè)操作系統(tǒng)上。但是,線程畢竟是出現(xiàn)了,那好,讓我們來(lái)看看下面這個(gè)例子,在這個(gè)例子中我們使用了CRT的全局變量 errno:
BOOL fFailure = (system("NOTEPAD.EXE README.TXT") == -1);
if (fFailure) {
switch (errno) {
case E2BIG: // Argument list or environment too big
break;
case ENOENT: // Command interpreter cannot be found
break;
case ENOEXEC: // Command interpreter has bad format
break;
case ENOMEM: // Insufficient memory to run command
break;
}
}
設(shè)想這樣的情況,當(dāng)上面的代碼執(zhí)行到system函數(shù)之后,if聲明之前的時(shí)候,操作系統(tǒng)打斷了它,而轉(zhuǎn)去執(zhí)行進(jìn)程中的另一個(gè)線程,而這個(gè)線程正好使用了會(huì)設(shè)置errno的某個(gè)CRT函數(shù)......于是,問(wèn)題就出現(xiàn)了。
為了解決這個(gè)問(wèn)題,每個(gè)線程需要自己的errno全局變量,而且還需要一些機(jī)制來(lái)使得它們使用它們自己的errno變量,而不是其他線程的。當(dāng)然, errno只是“多線程不服癥”的其中一個(gè)受害者,其他受害者還有:_doserrno, strtok, _wcstok, strerror, _strerror, tmpnam, tmpfile, asctime, _wasctime, gmtime, _ecvt, _fcvt。
于是,為了讓C和C++程序能夠正常工作,必須創(chuàng)建一個(gè)數(shù)據(jù)結(jié)構(gòu),并把它與每一個(gè)線程關(guān)連起來(lái),只有這樣才能調(diào)用CRT庫(kù)時(shí)不至于誤入“他線程家園”。
那么系統(tǒng)怎么知道在創(chuàng)建一個(gè)新線程時(shí)分配這個(gè)數(shù)據(jù)塊呢?回答是系統(tǒng)不知道,這一切責(zé)任都在你,只有你才能確保所有的事情正常完成。
是不是有點(diǎn)重任在肩的感覺(jué)?呵呵,不要緊,其你要做的和標(biāo)題所說(shuō)的一樣,只需要調(diào)用_beginthreadex函數(shù)即可:
unsigned long _beginthreadex(void *security,
unsigned stack_size,
unsigned (*start_address)(void *), void *arglist,
unsigned initflag, unsigned *thrdaddr);
_beginthreadex的參數(shù)列表與CreateThread一模一樣,只是參數(shù)名與類(lèi)型有少許差異罷了。這是因?yàn)镸icrosoft覺(jué)得CRT函數(shù)不應(yīng)該對(duì)Windows的數(shù)據(jù)類(lèi)型有任何依賴。兩者返回的東西也是一樣的,所以即使你使用了CreateThread函數(shù),要替換成_beginthreadex也是一件很容易的事情。
因?yàn)閮烧叩臄?shù)據(jù)類(lèi)型不完全一致,所以我們需要作一些轉(zhuǎn)換來(lái)避免編譯器的抱怨,為了簡(jiǎn)化這項(xiàng)工作,你可以使用我所寫(xiě)的這個(gè)宏:
typedef unsigned (__stdcall * PTHREAD_START) (void *);
#define chBEGINTHREADEX(psa, cbStack, pfnStartAddr, \ pvParam, fdwCreate, pdwThreadID) \
((HANDLE) _beginthreadex( \
(void *) (psa), \
(unsigned) (cbStack), \
(PTHREAD_START) (pfnStartAddr),\
(void *) (pvParam),\
(unsigned) (fdwCreate), \
(unsigned *) (pdwThreadID)))
注意_beginthreadex函數(shù)只存在于CRT庫(kù)的多線程版本中,如果你鏈接到了一個(gè)單線程運(yùn)行時(shí)庫(kù),鏈接器會(huì)毫不客氣地報(bào)告 “unresolved external symbol”錯(cuò)誤。另外,還需要注意的是VS在創(chuàng)建新項(xiàng)目時(shí)默認(rèn)選擇的是單線程庫(kù),所以需要記得修改設(shè)置。
說(shuō)了這么多,只是說(shuō)了一些概念,至于_beginthreadex為什么要比CreateThread更好,還是需要事實(shí)來(lái)說(shuō)話的,當(dāng)然,程序員所說(shuō)的事實(shí),就是代碼了,代碼之前,了無(wú)秘密,所以下面讓我們來(lái)看看CRT庫(kù)的代碼是怎樣的。首先,自然是主角人物_beginthreadex(你可以在THREADEX.C中找到它),因?yàn)闆](méi)必要在這里重復(fù)寫(xiě)出源代碼,所以我只給出偽代碼版本的_beginthreadex:
unsigned long __cdecl _beginthreadex (
void *psa,
unsigned cbStack,
unsigned (__stdcall * pfnStartAddr) (void *),
void * pvParam,
unsigned fdwCreate,
unsigned *pdwThreadID)
{
_ptiddata ptd; // Pointer to thread's data block
unsigned long thdl; // Thread's handle
// Allocate data block for the new thread
if ((ptd = calloccrt(1, sizeof(struct tiddata))) == NULL)
goto errorreturn;
// Initialize the data block
initptd(ptd);
// Save the desired thread function and the parameter
// we want it to get in the data block
ptd->_initaddr = (void *) pfnStartAddr;
ptd->_initarg = pvParam;
// Create the new thread
thdl = (unsigned long) CreateThread(psa, cbStack,_threadstartex, (PVOID) ptd, fdwCreate, pdwThreadID);
if (thdl == NULL) {
// Thread couldn't be created, cleanup and return failure
goto error_return;
}
// Create created OK, return the handle
return(thdl);
error_return:
// Error: data block or thread couldn't be created
_free_crt(ptd);
return((unsigned long)0L);
}
_beginthreadex的代碼中有幾個(gè)地方需要重點(diǎn)注意:
(1)首先每個(gè)線程會(huì)從CRT的堆上獲得真正屬于它自己的tiddata內(nèi)存塊。 tiddata數(shù)據(jù)結(jié)構(gòu)你可以在MTDLL.H中找到。傳遞給_beginthreadex的線程函數(shù)的地址被保存在tiddata內(nèi)存塊中。要傳遞給該線程函數(shù)的參數(shù)也被保存在這里。_beginthreadex接下來(lái)調(diào)用CreateThread,注意,這時(shí)CreateThread在新線程中執(zhí)行的并不是pfnStartAddr函數(shù),而是一個(gè)名為_(kāi)threadstartex的函數(shù)。同時(shí),傳遞給線程函數(shù)的參數(shù)也不是pvParam,而是 tiddata結(jié)構(gòu)的地址。最后,如果一切順利將返回線程句柄,如果任何一個(gè)操作失敗,將返回NULL。
現(xiàn)在,tiddata結(jié)構(gòu)已經(jīng)被分配并初始化完成,下面來(lái)看看該結(jié)構(gòu)是如何關(guān)聯(lián)到線程的。這次的對(duì)象是_threadstartex,同樣也在THREADEX.C中,同樣也給出偽代碼:
static unsigned long WINAPI _threadstartex (void* ptd) {
// Note: ptd is the address of this thread's tiddata block
// Associate the tiddata block with this thread
TlsSetValue(__tlsindex, ptd);
// Save this thread ID in the tiddata block
((_ptiddata) ptd)->_tid = GetCurrentThreadId();
// Initialize floating-point support (code not shown)
// Wrap desired thread function in SEH frame to
// handle runtime errors and signal support
__try {
// Call desired thread function passing it the desired parameter
// Pass threads exit code value to _endthreadex
_endthreadex(
( (unsigned (WINAPI *)(void *))(((_ptiddata)ptd)->_initaddr) )
( ((_ptiddata)ptd)->_initarg ) ) ;
}
__except(_XcptFilter(GetExceptionCode(), GetExceptionInformation()){
// The C-Runtime's exception handler deals with runtime errors
// and signal support, we should never get it here.
_exit(GetExceptionCode());
}
// We never get here, the thread dies in this function
return(0L);
}
_threadstartex同樣也有一些東西需要我們注意。新線程開(kāi)始時(shí)會(huì)執(zhí)行BaseThreadStart(位于Kernel32.DLL 中),然后跳到_threadstartex。_threadstartex的唯一參數(shù)就是新線程的tiddata內(nèi)存塊地址。TlsSetValue完成了將tiddata結(jié)構(gòu)與線程關(guān)聯(lián)起來(lái)的目的(這里的tiddata結(jié)構(gòu)被稱(chēng)為線程本地存儲(chǔ),TLS,顧名思義,就是屬于每個(gè)線程自己的數(shù)據(jù))。
在事實(shí)上的線程函數(shù)周?chē)胖昧艘粋€(gè)結(jié)構(gòu)化異常處理體(A structured exception handling frame)。這個(gè)處理體主要負(fù)責(zé)處理與運(yùn)行時(shí)庫(kù)有關(guān)的很多東西,比如運(yùn)行時(shí)錯(cuò)誤(像拋出但卻沒(méi)有被捕獲的C++異常這類(lèi)東西)和CRT的signal函數(shù)。這很重要,如果你使用CreateThread創(chuàng)建了線程,然后又調(diào)用了CRT的signal函數(shù),那么signal函數(shù)將無(wú)法正常工作。
注意,這時(shí)還不能返回到BaseThreadStart,如果這樣做,線程會(huì)死掉,退出碼會(huì)正常設(shè)置,但tiddata內(nèi)存塊不會(huì)被銷(xiāo)毀,這就會(huì)造成內(nèi)存泄漏。為了防止泄漏,需要調(diào)用_endthreadex,并且將退出碼傳遞給它。
_endthreadex同樣也在THREADEX.C中,同樣也給出偽代碼:
void __cdecl _endthreadex (unsigned retcode) {
_ptiddata ptd; // Pointer to thread's data block
// Cleanup floating-point support (code not shown)
// Get the address of this thread's tiddata block
ptd = _getptd();
// Free the tiddata block
_freeptd(ptd);
// Terminate the thread
ExitThread(retcode);
}
注意CRT的_getptd函數(shù)在內(nèi)部調(diào)用了系統(tǒng)的TlsGetValue函數(shù)來(lái)獲取對(duì)應(yīng)線程的tiddata內(nèi)存塊地址,然后釋放該內(nèi)存塊,最后調(diào)用ExitThread來(lái)真正銷(xiāo)毀線程,當(dāng)然是用上面所提到的退出碼來(lái)調(diào)用。
我強(qiáng)烈建議你絕不要調(diào)用ExitThread來(lái)中止你的線程。最好也是最簡(jiǎn)單的辦法就是讓線程自己返回即可,讓它自生自滅。ExitThread不僅徒增復(fù)雜,而且還會(huì)造成tiddata內(nèi)存塊泄漏。
Microsoft Visual C++項(xiàng)目組發(fā)現(xiàn)人們總是喜歡調(diào)用ExitThread,他們希望能盡可能的做到讓程序不泄漏內(nèi)存。所以如果你真的想要明確地退出線程,你也最好使用_endthreadex,雖然這也不太好。
OK,目前為止你應(yīng)該對(duì)誰(shuí)更好些的問(wèn)題有了深入的了解,但是為什么調(diào)用CreateThread的程序仍然可以經(jīng)年累月的正常運(yùn)行呢?當(dāng)線程調(diào)用一個(gè)需要 tiddata結(jié)構(gòu)的CRT函數(shù)時(shí)(大多數(shù)CRT函數(shù)是線程安全的,并不需要該結(jié)構(gòu)),首先CRT函數(shù)試圖獲取線程的數(shù)據(jù)塊的地址(通過(guò)調(diào)用 TlsGetValue),然后,如果返回NULL,說(shuō)明調(diào)用線程沒(méi)有相關(guān)聯(lián)的tiddata塊,那么CRT函數(shù)馬上為調(diào)用線程分配并初始化一個(gè) tiddata塊,并將該內(nèi)存塊關(guān)聯(lián)到線程(通過(guò)TlsSetValue),這樣,該CRT函數(shù)以及其他CRT函數(shù)都可以使用該線程的tiddata塊了(此即所謂“前人栽樹(shù)后人乘涼”了,^_^)。
當(dāng)然,如果說(shuō)你的線程運(yùn)行的時(shí)候一直沒(méi)有問(wèn)題是幾乎不可能的。事實(shí)上,的確有一些問(wèn)題需要說(shuō)說(shuō)。如果線程使用了CRT的signal函數(shù),整個(gè)進(jìn)程都會(huì)被中止,因?yàn)榻Y(jié)構(gòu)化異常處理體尚未準(zhǔn)備好。同樣,如果不調(diào)用_endthreadex來(lái)中止線程就會(huì)造成內(nèi)存泄漏,如果使用_beginthreadex,當(dāng)然會(huì)容易想到_endthreadex,但如果你習(xí)慣了使用CreateThread,是否還會(huì)想起_endthreadex,我表示極大的懷疑,而且CreateThread/_endthreadex的組合怎么看怎么讓人別扭。
不要忘記開(kāi)始的問(wèn)題,接下來(lái)讓我們?cè)賮?lái)看看效率問(wèn)題。CRT庫(kù)的多線程版本在某些函數(shù)里面放置了同步原語(yǔ),比如malloc,為了保證堆不會(huì)被同時(shí)調(diào)用的 malloc函數(shù)破壞,這不可避免地會(huì)對(duì)效率造成影響,C/C++的哲學(xué)我們不應(yīng)忘記,“決不為自己沒(méi)有用到的付出代價(jià)”,自然,我們無(wú)權(quán)要求單線程程序?yàn)槎嗑€程程序付出它們不該付出的代價(jià),所以,開(kāi)頭的問(wèn)題也有了答案。
上面所說(shuō)的都是靜態(tài)鏈接的CRT庫(kù),而CRT庫(kù)的動(dòng)態(tài)鏈接版本則被編寫(xiě)得更加通用,以便能夠被任何運(yùn)行的程序和DLL共享。正是基于這個(gè)原因,這個(gè)版本的庫(kù)只存在多線程版本。因?yàn)镃RT庫(kù)是以DLL形式提供的,程序和DLL不需要包含CRT庫(kù)的任何代碼,自然尺寸也就更小。同時(shí),如果Microsoft修正了CRT庫(kù)DLL中的Bug,程序也就自然受益了。
終于該結(jié)束了,還是來(lái)幾句總結(jié)吧:首先,如果你調(diào)用_beginthreadex,你會(huì)獲得線程的句柄,句柄當(dāng)然需要關(guān)閉,但_endthreadex并沒(méi)有這么做。通常是調(diào)用_beginthreadex的線程(很可能是主線程)來(lái)調(diào)用CloseHandle關(guān)閉不再需要的新線程的句柄。其次,如果你使用CRT函數(shù),你只需要使用_beginthreadex即可。如果不使用,那么你可以只使用CreateThread。同樣,如果只有一個(gè)線程(主線程)使用 CRT,你也可以使用CreateThread;如果新創(chuàng)建的線程不使用CRT,那么你也不需要_beginthreadex和多線程CRT。