評(píng)論請(qǐng)移步:http://zbm.xuanwo.tk/2011/05/lua-deadloop.html
論壇
上有人問,所以把以前做的東西拿出來秀一下。
Lua是一門小巧精致的語(yǔ)言,特別適用于嵌入其它的程序?yàn)樗鼈兲峁┠_本支持。不過腳本通常是用戶編寫的,很有可能出現(xiàn)死循環(huán),雖說這是用戶的問題,但卻會(huì)造成我們的宿主程序死掉。所以檢測(cè)用戶腳本中的死循環(huán)并中止這段腳本的運(yùn)行就顯得非常重要了。
可是,一個(gè)現(xiàn)實(shí)的問題是死循環(huán)并不好檢測(cè),一些隱藏較深的死循環(huán)連人都很難找出來,更不用說讓機(jī)器去找了。所以實(shí)際采用的方案多是檢測(cè)腳本的執(zhí)行時(shí)間,如果超過一定的限度,就認(rèn)為里面有死循環(huán),我下面的例子也是用的這種方法。
以下是幾個(gè)相關(guān)的全局變量(我是喜歡把C++當(dāng)C用的程序員,C++的忠實(shí)粉絲請(qǐng)忍耐一下:))的定義。
1?lua_State*?g_lua?=?NULL;????????????//?lua腳本引擎
2?volatile?unsigned?g_begin?=?0;????????//?腳本開始執(zhí)行的時(shí)間
3?volatile?long?g_counter?=?0;????????//?腳本執(zhí)行計(jì)數(shù),?用于判斷執(zhí)行超時(shí)
4?volatile?long?g_check?=?0;???????????//?進(jìn)行超時(shí)檢查時(shí)的執(zhí)行計(jì)數(shù)
run_user_script用來執(zhí)行用戶腳本,它首先通過GetTickCount把當(dāng)前的時(shí)間記錄到g_begin中去。然后將g_counter加一,在執(zhí)行完用戶腳本后再將其加一,這樣就可以保證執(zhí)行用戶腳本時(shí)它是個(gè)奇數(shù),而不執(zhí)行時(shí)是偶數(shù),檢測(cè)腳本超時(shí)的代碼可以籍此來判斷當(dāng)前是否在執(zhí)行用戶腳本。還要注意調(diào)用用戶腳本要使用lua_pcall而不是lua_call,因?yàn)槲覀冎兄鼓_本的執(zhí)行會(huì)產(chǎn)生一個(gè)Lua中的“錯(cuò)誤”,在C/C++中它是一個(gè)異常,只有用lua_pcall才能保證這個(gè)錯(cuò)誤被Lua腳本引擎正確處理。
1?int?run_user_script(?int?nargs,?int?nresults,?int?errfunc?)
2?{
3?????g_begin?=?GetTickCount();
4?????_InterlockedIncrement(?&g_counter?);
5?????int?err?=?lua_pcall(?g_lua,?nargs,?nresults,?errfunc?);
6?????_InterlockedIncrement(?&g_counter?);
7?????return?err;
8?}
下面的check_script_timeout用來檢測(cè)腳本超時(shí),需要在另外一個(gè)線程中周期性的調(diào)用,原因我想就不用解釋了吧。它首先檢查是否在執(zhí)行用戶腳本,或者是否已經(jīng)讓當(dāng)前執(zhí)行的用戶腳本中止過。然后看這段腳本執(zhí)行了多長(zhǎng)時(shí)間,超過限度就把當(dāng)前腳本計(jì)數(shù)記錄到g_check中去,并通過lua_sethook設(shè)置一個(gè)鉤子函數(shù)timeout_break,這個(gè)鉤子函數(shù)會(huì)在用戶腳本執(zhí)行時(shí)被調(diào)用。
?1?void?check_script_timeout()
?2?{
?3?????long?counter?=?g_counter;
?4??
?5?????//?沒有執(zhí)行用戶腳本,?不檢查超時(shí)
?6?????if(?(counter?&?0x00000001)?==?0?)
?7?????????return;
?8??
?9?????//?已經(jīng)讓當(dāng)前執(zhí)行的用戶腳本中止了
10?????if(?g_check?==?counter?)
11?????????return;
12??
13?????//?如果執(zhí)行時(shí)間超過了設(shè)置的超時(shí)時(shí)間(這里是1秒),?終止它
14?????if(?GetTickCount()?-?g_begin?>?1000?)
15?????{
16?????????g_check?=?counter;
17?????????int?mask?=?LUA_MASKCALL?|?LUA_MASKRET?|?LUA_MASKLINE?|?LUA_MASKCOUNT;
18?????????lua_sethook(?g_lua,?timeout_break,?mask,?1);
19?????}
20?}
最后就是那個(gè)鉤子函數(shù)了,它首先把鉤子去掉,因?yàn)檫@個(gè)鉤子只要執(zhí)行一次就行了。由于設(shè)置鉤子和執(zhí)行鉤子是在不同的線程中,并且鉤子從設(shè)置到執(zhí)行需要一定的時(shí)間,所以它要通過對(duì)比g_check和g_counter來判斷是否還在運(yùn)行判斷超時(shí)所執(zhí)行的那段腳本,不是就什么也不做,是就通過luaL_error產(chǎn)生一個(gè)錯(cuò)誤,并中止腳本的執(zhí)行,而這個(gè)錯(cuò)誤最終會(huì)被run_user_script中的lua_pcall捕獲。
1?void?timeout_break(?lua_State*?L,?lua_Debug*?ar?)
2?{
3?????lua_sethook(?L,?NULL,?0,?0?);
4?????//?鉤子從設(shè)置到執(zhí)行,?需要一段時(shí)間,?所以要檢測(cè)是否仍在執(zhí)行那個(gè)超時(shí)的腳本
5?????if(?g_check?==?g_counter?)
6?????????luaL_error(?L,?"script?timeout."?);
7?}
上面的檢測(cè)使用了兩個(gè)線程,其實(shí)在一個(gè)線程中也可以做到,并且更簡(jiǎn)單。但那樣會(huì)導(dǎo)致鉤子函數(shù)頻繁執(zhí)行,影響效率,如果對(duì)性能沒什么要求的話,也可以采用。