看了《深入理解linux內(nèi)核》的中斷與異常,簡(jiǎn)單總結(jié)了下,如果有錯(cuò)誤,望指正!
一 什么是中斷和異常
異常又叫同步中斷,是當(dāng)指令執(zhí)行時(shí)由cpu控制單元產(chǎn)生的,之所以稱之為異常,是因?yàn)橹挥性谝粭l指令結(jié)束之后才發(fā)出中斷(程序執(zhí)行異常或者系統(tǒng)調(diào)用)。
中斷又叫異步中斷,是由其他硬件設(shè)備依照cpu時(shí)鐘信號(hào)隨機(jī)產(chǎn)生的。
二 高級(jí)可編程中斷控制器

APIC
每個(gè)CPU都有一個(gè)本地的APIC,通過(guò)IIC bus鏈接到一個(gè)I/O APIC,這個(gè)I/O APIC負(fù)責(zé)處理外部IRQS,分發(fā)IRQS給本地APIC。
三 中斷與異常處理程序嵌套執(zhí)行
中斷處理程序允許被另一個(gè)中斷處理程序”中斷“,從而引起內(nèi)核控制路徑嵌套執(zhí)行。但是中斷處理程序是不允許發(fā)生阻塞,即任務(wù)切換的。
中斷可以搶占異常處理程序,但異常處理程序不會(huì)搶占中斷。因?yàn)橹袛嗵幚沓绦虮囟ㄌ幱趦?nèi)核態(tài),如果發(fā)生異常,那只能是BUG了,也就是說(shuō)內(nèi)核控制路徑中異常處理程序不會(huì)超過(guò)一個(gè)。
四 Linux中斷描述符
Intel把中斷描述符分三類:任務(wù)門、中斷門、陷阱門,而Linux則分成五類:
- 中斷門:Intel的中斷門,DPL = 0,描述中斷處理程序,通過(guò)set_intr_gate宏設(shè)置
- 系統(tǒng)門:Intel的陷阱門,DPL = 3,用于系統(tǒng)調(diào)用,通過(guò)set_system_gate宏設(shè)置
- 系統(tǒng)中斷門:Intel的中斷門,DPL = 3,用于向量3的異常處理,通過(guò)set_system_intr_gate宏設(shè)置
- 陷阱門:Intel陷阱門,DPL = 0,大部分的異常處理,通過(guò)set_trap_gate宏設(shè)置
- 任務(wù)門:Intel任務(wù)門,DPL = 0,對(duì)”Double fault“異常處理,通過(guò)set_task_gate宏設(shè)置
五 異常處理
當(dāng)cpu產(chǎn)生異常時(shí),會(huì)自動(dòng)根據(jù)產(chǎn)生的異常編號(hào)在IDT中找對(duì)應(yīng)的異常處理程序,異常處理程序保存大多數(shù)寄存器的值,調(diào)用異常處理的高級(jí)C函數(shù)處理該異常,然后通過(guò)調(diào)用ret_from_exception從異常處理程序退出。
六 中斷處理
I/O中斷處理程序執(zhí)行的四個(gè)基本過(guò)程:
- 在內(nèi)核態(tài)堆棧中保存IRQ的值和寄存器的內(nèi)容
- 給正在為IRQ線服務(wù)的PIC發(fā)送一個(gè)應(yīng)答,這將允許該P(yáng)IC進(jìn)一步發(fā)中斷
- 執(zhí)行共享該IRQ的所有設(shè)備的中斷服務(wù)例程(ISR)
七 IRQ數(shù)據(jù)結(jié)構(gòu)

IRQ數(shù)據(jù)結(jié)構(gòu)
hw_irq_controller是對(duì)PIC進(jìn)程控制的一些函數(shù),包括應(yīng)答PIC什么的。action指向的是一個(gè)irqaction鏈,每個(gè)irqaction描述一個(gè)設(shè)備的服務(wù)例程。irq_desc_t中的state字段保證了同一時(shí)刻只有一個(gè)設(shè)備會(huì)擁有該IRQ,正在處理該IRQ的CPU會(huì)禁用這條IRQ(本地),其它c(diǎn)pu還是可以接受該IRQ的請(qǐng)求,不過(guò)由于此時(shí)state的狀態(tài)為IRQ_INPROGRESS,所以新的IRQ請(qǐng)求會(huì)在其它的CPU上應(yīng)答,但不會(huì)處理,也就是該新的IRQ處理會(huì)被延遲到處理同一個(gè)IRQ的前面一個(gè)CPU上執(zhí)行。能這樣做是因?yàn)镮RQ的數(shù)據(jù)結(jié)構(gòu)是所有CPU所共享的。
八 多種類型的內(nèi)核棧
如果編譯內(nèi)核設(shè)置內(nèi)核棧為8k,那么進(jìn)程的內(nèi)核棧被用于所有類型的內(nèi)核控制路徑。如果內(nèi)核棧為4k,則內(nèi)核使用3種類型的內(nèi)核棧:異常棧,用于處理異常,每個(gè)進(jìn)程一個(gè);硬中斷棧,用于處理中斷,每個(gè)cpu一個(gè);軟中斷棧,用于出來(lái)延遲函數(shù),每個(gè)cpu一個(gè)。
九 軟中斷
1 為什么要引進(jìn)軟中斷機(jī)制,用前面的中斷機(jī)制不就可以了嗎(老版本的linux就沒(méi)有軟中斷機(jī)制)?
從前面的中斷處理中可以看出,一個(gè)中斷處理程序的幾個(gè)中斷服務(wù)例程(每個(gè)設(shè)備一個(gè))是串行執(zhí)行的,如果某個(gè)處理例程執(zhí)行的時(shí)間比較長(zhǎng),而后面的例程又很緊急,那么會(huì)導(dǎo)致這個(gè)緊急的例程匯編延遲比較久的時(shí)間。所以如果能把一些服務(wù)例程中不是很緊急但又花費(fèi)比較長(zhǎng)的操作延遲到執(zhí)行完該IRQ上所有中斷服務(wù)例程之后執(zhí)行,那么一些緊急的,花費(fèi)時(shí)間短(一般緊急的操作所需的時(shí)間都是比較短的)的例程就可以得到快速的響應(yīng)。還有就是對(duì)于某個(gè)設(shè)備的中斷服務(wù)例程,如果它的服務(wù)例程服務(wù)時(shí)間過(guò)長(zhǎng),cpu在執(zhí)行該服務(wù)例程時(shí)是會(huì)中斷本地cpu對(duì)該設(shè)備的中斷或者整個(gè)本地中斷,這樣會(huì)導(dǎo)致很多中斷會(huì)得不到快速的響應(yīng)。
2 軟中斷使用的關(guān)鍵數(shù)據(jù)結(jié)構(gòu)
softirq_vec數(shù)組,每個(gè)數(shù)組元素類型為softirq_action,該數(shù)組總共有32個(gè)元素,目前只用了前面六個(gè)。softirq_action數(shù)據(jù)結(jié)構(gòu)包含兩個(gè)字段:指向軟中斷處理函數(shù)的action指針和指向軟中斷函數(shù)需要的通用數(shù)據(jù)結(jié)構(gòu)的data指針,這是cpu共享的。
每個(gè)進(jìn)程描述的thread_info字段中的preempt_count字段,該字段被編碼來(lái)表示三個(gè)不同的計(jì)數(shù)器和一個(gè)標(biāo)志。0-7位表示是否允許搶占內(nèi)核,8-15表示是否正在處理軟中斷,16-27表示硬件中斷控制路徑嵌套數(shù),28為是PREEMPT_ACTIVE標(biāo)志。每個(gè)進(jìn)程有一個(gè)。
另一個(gè)是每個(gè)cpu都有的32位掩碼,存放在irq_cpustat_t數(shù)據(jù)結(jié)構(gòu)中的__softirq_pending字段,32位,每一位表示softirq_vec數(shù)組中的對(duì)應(yīng)的軟中斷函數(shù)是否已激活。irq_cpustat_t存放在irq_stat數(shù)組中,每個(gè)cpu對(duì)于數(shù)組中的一個(gè)irq_cpustat_t。每個(gè)cpu一個(gè)。
3 軟中斷可延遲函數(shù)的四個(gè)操作
- 初始化,定義一個(gè)新的可延遲函數(shù),并加入到softirq_vec數(shù)組中,所有cpu共享該softirq_vec。
- 激活,標(biāo)記一個(gè)可延遲函數(shù)為”掛起“,通過(guò)前面描述的__softirq_pending字段。
- 屏蔽,有選擇地屏蔽一個(gè)可延遲函數(shù),即使它被激活。它是通過(guò)前面的preempt_count字段或者關(guān)閉本地中斷(延遲函數(shù)一般是通過(guò)中斷處理程序激活的,如果沒(méi)有中斷處理程序執(zhí)行,自然也就不會(huì)有延遲函數(shù)的激活)來(lái)實(shí)現(xiàn)的。
- 執(zhí)行,執(zhí)行一個(gè)掛起的可延遲函數(shù)和同類型的其它掛起的可延遲函數(shù)。通過(guò)do_softirq實(shí)現(xiàn)。
激活和執(zhí)行可延遲函數(shù)必須要在同一個(gè)cpu上,從前面激活和執(zhí)行可以看出這一點(diǎn)。因?yàn)開(kāi)_softirq_pending是每個(gè)cpu一個(gè),所有在特定cpu激活的延遲函數(shù),只有在該cpu上的__softirq_pending標(biāo)記激活,而其它c(diǎn)pu是不知道該函數(shù)被激活的,也就不會(huì)去執(zhí)行該函數(shù)了。
4 linux現(xiàn)有的六種軟中斷
處理高級(jí)優(yōu)先級(jí)的tasklet軟中斷HI_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為0;和時(shí)鐘中斷關(guān)聯(lián)的tasklet軟中斷TIMER_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為1;把數(shù)據(jù)包傳送到網(wǎng)卡軟中斷NET_TX_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為2;從網(wǎng)卡接收數(shù)據(jù)包的軟中斷NET_RX_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為3;SCSI命令的后天中斷處理的軟中斷SCSI_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為4;處理常規(guī)tasklet軟中斷TASKLET_SOFTIRQ,在softirq_vec數(shù)組的下標(biāo)為5;它們的優(yōu)先級(jí)是從高到低的。
5 檢查是否有軟中斷掛起(也叫激活)的時(shí)機(jī)
- 內(nèi)核調(diào)用local_bh_enable激活本地軟中斷
- smp_apic_timer_interrupt處理完本地定時(shí)中斷
- cpu處理CALL_FUNCTION_VECTOR中斷處理
- 當(dāng)一個(gè)特殊的ksoftirq/n內(nèi)核線程被喚醒。
ksoftirq/n內(nèi)核線程是專門用來(lái)處理激活的軟中斷的,每個(gè)cpu有一個(gè)。
十 tasklet
tasklet是在軟中斷的基礎(chǔ)上實(shí)現(xiàn)的。正如前面說(shuō)的linux現(xiàn)有的六種軟中斷,其中HI_SOFTIRQ和TASKLET_SOFTIRQ軟中斷就是tasklet。
對(duì)于每種tasklet(HI_SOFTIRQ和TASKLET_SOFTIRQ),每個(gè)cpu都有一個(gè)tasklet_head類型來(lái)描述這種tasklet。tasklet_head類型指向了一個(gè)由tasklet類型組成的鏈表,而每個(gè)tasklet類型描述了該tasklet要執(zhí)行的函數(shù)和函數(shù)需要的數(shù)據(jù)以及tasklet的狀態(tài)(狀態(tài)表示同類型的tasklet是否在運(yùn)行等)。
當(dāng)do_softirq處理軟中斷時(shí),如果相應(yīng)的HI_SOFTIRQ和TASKLET_SOFTIRQ軟中斷被激活,就會(huì)調(diào)用對(duì)應(yīng)的軟中斷函數(shù)tasklet_hi_action和tasklet_action。而這兩個(gè)函數(shù)處理的數(shù)據(jù)正是HI_SOFTIRQ和TASKLET_SOFTIRQ類型tasklet所對(duì)應(yīng)的tasklet_head類型指向的tasklett鏈表。
為了能夠?qū)懽约旱膖asklet函數(shù)并加入到對(duì)應(yīng)tasklet類型的tasklet_head指向的鏈表中,需要調(diào)用tasklet_init來(lái)初始化新的tasklet和調(diào)用tasklet_schedule或tasklet_hi_schedule來(lái)把我們自定義的tasklet加入到對(duì)應(yīng)的tasklet_head指向的鏈表中并激活該tasklet類型所對(duì)應(yīng)的軟中斷。
所以說(shuō)tasklet是在軟中斷的基礎(chǔ)上實(shí)現(xiàn)的,但不同的是軟中斷時(shí)靜態(tài)分配的(linux分配了6個(gè)軟中斷),而tasklet是可以動(dòng)態(tài)加入和刪除tasklet的。
十一 工作隊(duì)列
每個(gè)工作隊(duì)列,在每個(gè)cpu上都有一個(gè)cpu_workqueue_struct結(jié)構(gòu)來(lái)描述,即對(duì)于同一個(gè)工作隊(duì)列,每個(gè)cpu都有該隊(duì)列的一個(gè)拷貝。cpu_workqueue_struct中的worklist成員指向了由work_struct結(jié)構(gòu)組成的鏈表,這個(gè)鏈表描述的是該工作隊(duì)列被掛起的函數(shù),等待工作者線程去執(zhí)行。
通過(guò)調(diào)用create_workqueue創(chuàng)建工作隊(duì)列。如果是smp,則每個(gè)cpu都會(huì)創(chuàng)建一個(gè)工作隊(duì)列和為該工作隊(duì)列工作的工作者線程。該工作者線程一直阻塞,直到有函數(shù)被加入到工作隊(duì)列中去,工作者線程執(zhí)行了函數(shù)之后就把函數(shù)從工作隊(duì)列中刪除。
可以通過(guò)queue_work函數(shù)把一個(gè)函數(shù)加入到工作隊(duì)列中去。
由于僅僅為了一個(gè)函數(shù)就創(chuàng)建一個(gè)工作隊(duì)列開(kāi)銷太大,所以內(nèi)核預(yù)定義了一個(gè)叫events的工作隊(duì)列,為該隊(duì)列工作的工作者線程叫events/n,每個(gè)cpu一個(gè)。還有就是專門為塊設(shè)備使用的kblocked工作隊(duì)列。
十二 軟中斷與工作隊(duì)列的區(qū)別
從上面可以看出,軟中斷和工作隊(duì)列十分的相似,都是對(duì)服務(wù)例程中某些耗時(shí)的操延后處理。主要區(qū)別在于,軟中斷的可延遲函數(shù)是在中斷上下文中執(zhí)行的,而工作者隊(duì)列的函數(shù)則是在進(jìn)程上下文中執(zhí)行的,也就是說(shuō)軟中斷的延遲函數(shù)執(zhí)行期間不允許內(nèi)核被搶占,而工作隊(duì)列則是可以的。
本文轉(zhuǎn)自:http://www.cnblogs.com/chengxuyuancc/p/3380922.html
posted on 2013-10-22 08:32
王海光 閱讀(582)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
Linux