0.轉(zhuǎn)載請(qǐng)保留原創(chuàng):http://m.shnenglu.com/jinglexy
MSN and Email: jinglexy at yahoo dot com dot cn
前不久寫的一個(gè)調(diào)試器,公司很多模塊使用linux環(huán)境,由于使用平臺(tái)的緣故,bug非常多,于是編寫了一個(gè)簡(jiǎn)單的調(diào)試器:大致功能是捕獲程序異常,打印調(diào)用棧(也包括調(diào)用函數(shù)名),對(duì)運(yùn)行的進(jìn)程進(jìn)行代碼或函數(shù)調(diào)試,內(nèi)核簡(jiǎn)單調(diào)試等。代碼量并不大,有效代碼行不超過(guò)3000行,花了10工作日完成,可能是時(shí)間緊迫吧,后期調(diào)試用了3周,汗哪!
1.使用ptrace系統(tǒng)調(diào)用關(guān)聯(lián)一個(gè)進(jìn)程后,需要waitpid(pid,
NULL, WUNTRACED);一下,這個(gè)調(diào)試了很長(zhǎng)時(shí)間才發(fā)現(xiàn)的,我猜測(cè)可能是因?yàn)?/span>ptrace后,不像信號(hào)立即 進(jìn)入目標(biāo)進(jìn)程的處理。需要調(diào)度到目標(biāo)進(jìn)程后,進(jìn)入do_waitpid()處理函數(shù)以設(shè)置正確的調(diào)試狀態(tài)。如果不這樣做,會(huì)導(dǎo)致釋放管理進(jìn)程失敗。比較流行的調(diào)試工具gdb就是使用ptrace實(shí)現(xiàn)的,在gcc編譯過(guò)程中也會(huì)插入專門的調(diào)試信息。原理比較簡(jiǎn)單,實(shí)現(xiàn)起來(lái)細(xì)節(jié)需要注意的也很多。
2.在跟蹤程序異常時(shí)的調(diào)用棧中發(fā)現(xiàn)的:montavista編譯環(huán)境的一個(gè)bug?(不能捕獲動(dòng)態(tài)庫(kù)中的異常,主要是因?yàn)閯?dòng)態(tài)庫(kù)加載時(shí)地址都不固定,使用了一種叫做got的技術(shù),可以閱讀coly大俠翻譯的《連接器與加載器》一書,非常棒)
當(dāng)程序收到異常信號(hào)后,內(nèi)核進(jìn)入do_signal()處理,在arch/arm/kernel/signal.c文件,
do_signal() -- > handle_signal() --> setup_rt_frame()
setup_rt_frame會(huì)拷貝上下文環(huán)境的數(shù)據(jù)結(jié)構(gòu)到用戶空間,
就是它的參數(shù) siginfo_t *info,這個(gè)數(shù)據(jù)結(jié)構(gòu)內(nèi)部包含了上下文的數(shù)據(jù)結(jié)構(gòu)struct ucontext ,
定義在:include/asm-arm/ucontext.h,內(nèi)容如下:
struct ucontext {
unsigned long uc_flags;
struct ucontext *uc_link;
stack_t uc_stack;
struct sigcontext uc_mcontext;
sigset_t uc_sigmask; /* mask last for extensibility */
};
在arm_v5t_le-gcc中,上下文結(jié)構(gòu)定義如下:
/opt/montavista/pro/devkit/arm/v5t_le/target/usr/include/sys/ucontext.h文件
typedef struct ucontext
{
unsigned long int uc_flags;
struct ucontext *uc_link;
__sigset_t uc_sigmask;
stack_t uc_stack;
mcontext_t uc_mcontext;
long int uc_filler[5];
} ucontext_t;
在上面數(shù)據(jù)結(jié)構(gòu)中, __sigset_t
uc_sigmask;被定義在上下文環(huán)境之前,
而在內(nèi)核中 fp指針在 uc_mcontext的arm_fp域中(先將uc_mcontext強(qiáng)制轉(zhuǎn)換成struct sigcontext結(jié)構(gòu)
在asm-arm/sigcontext.h定義),
也就是第14個(gè) int 成員, 由于上面的stack_t 占內(nèi)存為3個(gè) int型,所以在nipdebug調(diào)試庫(kù)中修補(bǔ)為
*bp = ct->uc_sigmask.__val[17];
結(jié)論:montavista編譯環(huán)境的ucontext.h文件定義上下文環(huán)境的數(shù)據(jù)結(jié)構(gòu)位置不正確,
而該數(shù)據(jù)結(jié)構(gòu)在/opt/arm/arm-linux/sys-include/sys/ucontext.h(即arm9)中定義是正確的,
/opt/ppc/include/sys/ucontext.h(ppc交叉編譯)中也是正確的。