評論請移步:http://zbm.xuanwo.tk/2011/05/lua-deadloop.html
論壇
上有人問,所以把以前做的東西拿出來秀一下。
Lua是一門小巧精致的語言,特別適用于嵌入其它的程序為它們提供腳本支持。不過腳本通常是用戶編寫的,很有可能出現(xiàn)死循環(huán),雖說這是用戶的問題,但卻會造成我們的宿主程序死掉。所以檢測用戶腳本中的死循環(huán)并中止這段腳本的運行就顯得非常重要了。
可是,一個現(xiàn)實的問題是死循環(huán)并不好檢測,一些隱藏較深的死循環(huán)連人都很難找出來,更不用說讓機器去找了。所以實際采用的方案多是檢測腳本的執(zhí)行時間,如果超過一定的限度,就認為里面有死循環(huán),我下面的例子也是用的這種方法。
以下是幾個相關(guān)的全局變量(我是喜歡把C++當C用的程序員,C++的忠實粉絲請忍耐一下:))的定義。
1?lua_State*?g_lua?=?NULL;????????????//?lua腳本引擎
2?volatile?unsigned?g_begin?=?0;????????//?腳本開始執(zhí)行的時間
3?volatile?long?g_counter?=?0;????????//?腳本執(zhí)行計數(shù),?用于判斷執(zhí)行超時
4?volatile?long?g_check?=?0;???????????//?進行超時檢查時的執(zhí)行計數(shù)
run_user_script用來執(zhí)行用戶腳本,它首先通過GetTickCount把當前的時間記錄到g_begin中去。然后將g_counter加一,在執(zhí)行完用戶腳本后再將其加一,這樣就可以保證執(zhí)行用戶腳本時它是個奇數(shù),而不執(zhí)行時是偶數(shù),檢測腳本超時的代碼可以籍此來判斷當前是否在執(zhí)行用戶腳本。還要注意調(diào)用用戶腳本要使用lua_pcall而不是lua_call,因為我們中止腳本的執(zhí)行會產(chǎn)生一個Lua中的“錯誤”,在C/C++中它是一個異常,只有用lua_pcall才能保證這個錯誤被Lua腳本引擎正確處理。
1?int?run_user_script(?int?nargs,?int?nresults,?int?errfunc?)
2?{
3?????g_begin?=?GetTickCount();
4?????_InterlockedIncrement(?&g_counter?);
5?????int?err?=?lua_pcall(?g_lua,?nargs,?nresults,?errfunc?);
6?????_InterlockedIncrement(?&g_counter?);
7?????return?err;
8?}
下面的check_script_timeout用來檢測腳本超時,需要在另外一個線程中周期性的調(diào)用,原因我想就不用解釋了吧。它首先檢查是否在執(zhí)行用戶腳本,或者是否已經(jīng)讓當前執(zhí)行的用戶腳本中止過。然后看這段腳本執(zhí)行了多長時間,超過限度就把當前腳本計數(shù)記錄到g_check中去,并通過lua_sethook設置一個鉤子函數(shù)timeout_break,這個鉤子函數(shù)會在用戶腳本執(zhí)行時被調(diào)用。
?1?void?check_script_timeout()
?2?{
?3?????long?counter?=?g_counter;
?4??
?5?????//?沒有執(zhí)行用戶腳本,?不檢查超時
?6?????if(?(counter?&?0x00000001)?==?0?)
?7?????????return;
?8??
?9?????//?已經(jīng)讓當前執(zhí)行的用戶腳本中止了
10?????if(?g_check?==?counter?)
11?????????return;
12??
13?????//?如果執(zhí)行時間超過了設置的超時時間(這里是1秒),?終止它
14?????if(?GetTickCount()?-?g_begin?>?1000?)
15?????{
16?????????g_check?=?counter;
17?????????int?mask?=?LUA_MASKCALL?|?LUA_MASKRET?|?LUA_MASKLINE?|?LUA_MASKCOUNT;
18?????????lua_sethook(?g_lua,?timeout_break,?mask,?1);
19?????}
20?}
最后就是那個鉤子函數(shù)了,它首先把鉤子去掉,因為這個鉤子只要執(zhí)行一次就行了。由于設置鉤子和執(zhí)行鉤子是在不同的線程中,并且鉤子從設置到執(zhí)行需要一定的時間,所以它要通過對比g_check和g_counter來判斷是否還在運行判斷超時所執(zhí)行的那段腳本,不是就什么也不做,是就通過luaL_error產(chǎn)生一個錯誤,并中止腳本的執(zhí)行,而這個錯誤最終會被run_user_script中的lua_pcall捕獲。
1?void?timeout_break(?lua_State*?L,?lua_Debug*?ar?)
2?{
3?????lua_sethook(?L,?NULL,?0,?0?);
4?????//?鉤子從設置到執(zhí)行,?需要一段時間,?所以要檢測是否仍在執(zhí)行那個超時的腳本
5?????if(?g_check?==?g_counter?)
6?????????luaL_error(?L,?"script?timeout."?);
7?}
上面的檢測使用了兩個線程,其實在一個線程中也可以做到,并且更簡單。但那樣會導致鉤子函數(shù)頻繁執(zhí)行,影響效率,如果對性能沒什么要求的話,也可以采用。