listen函數(shù)是網(wǎng)絡(luò)編程一個(gè)基本的函數(shù),而且它的backlog參數(shù)卻是和TCP協(xié)議息息相關(guān)的。我們來(lái)看一下一個(gè)backlog參數(shù)到底有多少秘密。
一、 為了理解backlog參數(shù),我們必須首先認(rèn)識(shí)listen函數(shù)。
#include<sys/socket.h>
int listen(int sockfd, int backlog);
listen函數(shù)僅由TCP服務(wù)器調(diào)用,它做兩件事情:
1、當(dāng)socket函數(shù)創(chuàng)建一個(gè)套接口時(shí),它被假設(shè)為一個(gè)主動(dòng)套裝口,也就是說(shuō),它是一個(gè)將調(diào)用connet發(fā)起連接的客戶套接口。listen函數(shù)把一個(gè)未連接的套接口轉(zhuǎn)換成一個(gè)被動(dòng)套接口,指示內(nèi)核應(yīng)接受指向該套接口的連接請(qǐng)求。根據(jù)TCP狀態(tài)轉(zhuǎn)換圖,調(diào)用listen導(dǎo)致套接口從CLOSED狀態(tài)轉(zhuǎn)換到LISTEN狀態(tài)。
2、本函數(shù)的第二個(gè)參數(shù)規(guī)定了內(nèi)核應(yīng)該為相應(yīng)套接口排隊(duì)的最大連接個(gè)數(shù)。
為了更好的理解backlog參數(shù),我們必須認(rèn)識(shí)到內(nèi)核為任何一個(gè)給定的監(jiān)聽套接口維護(hù)兩個(gè)隊(duì)列:
1、未完成連接隊(duì)列(incomplete connection queue),每個(gè)這樣的SYN分節(jié)對(duì)應(yīng)其中一項(xiàng):已由某個(gè)客戶發(fā)出并到達(dá)服務(wù)器,而服務(wù)器正在等待完成相應(yīng)的TCP三路握手過程。這些套接口處于SYN_RCVD狀態(tài)。
2、已完成連接隊(duì)列(completed connection queue),每個(gè)已完成TCP三路握手過程的客戶對(duì)應(yīng)其中一項(xiàng)。這些套接口處于ESTABLISHED狀態(tài)。
當(dāng)來(lái)自客戶的SYN到達(dá)時(shí),TCP在未完成連接隊(duì)列中創(chuàng)建一個(gè)新項(xiàng),然后響應(yīng)以三路握手的第二個(gè)分節(jié):服務(wù)器的SYN響應(yīng),其中稍帶對(duì)客戶SYN的ACK(即SYN+ACK)。這一項(xiàng)一直保留在未完成連接隊(duì)列中,直到三路握手的第三個(gè)分節(jié)(客戶對(duì)服務(wù)器SYN的ACK)到達(dá)或者該項(xiàng)超時(shí)為止(曾經(jīng)源自Berkeley的實(shí)現(xiàn)為這些未完成連接的項(xiàng)設(shè)置的超時(shí)值為75秒)。如果三路握手正常完成,該項(xiàng)就從未完成連接隊(duì)列移到已完成連接隊(duì)列的隊(duì)尾。當(dāng)進(jìn)程調(diào)用accept時(shí),已完成連接隊(duì)列中的隊(duì)頭項(xiàng)將返回給進(jìn)程,或者如果該隊(duì)列為空,那么進(jìn)程將被投入睡眠,直到TCP在該隊(duì)列中放入一項(xiàng)才喚醒它。
二、查看man手冊(cè)。看看man listen怎么說(shuō)
![clip_image002[1] clip_image002[1]](http://m.shnenglu.com/images/cppblog_com/lynch/Windows-Live-Writer/listenbacklog_DEE6/clip_image002%5B1%5D_thumb.jpg)
可以看到man手冊(cè)是這樣描述backlog參數(shù)的:“backlog參數(shù)確定了connection隊(duì)列可以增長(zhǎng)的最大長(zhǎng)度”,如果connection隊(duì)列已滿(達(dá)到backlog確定的長(zhǎng)度),那么新的connection請(qǐng)求到來(lái)時(shí),客戶端會(huì)得到一個(gè)ECONNREFUSED error,或者,如果底層協(xié)議支持重發(fā),那么這個(gè)請(qǐng)求會(huì)被服務(wù)器忽略而使客戶端重新發(fā)送connection請(qǐng)求。
![clip_image004[1] clip_image004[1]](http://m.shnenglu.com/images/cppblog_com/lynch/Windows-Live-Writer/listenbacklog_DEE6/clip_image004%5B1%5D_thumb.jpg)
現(xiàn)在backlog用來(lái)確定已完成隊(duì)列(完成三次握手等待accept)的長(zhǎng)度,而不再是已完成隊(duì)列和未完成連接隊(duì)列之和(linux 2.2之前)。
未完成隊(duì)列(incomplete connection queue)的長(zhǎng)度現(xiàn)在由/proc/sys/net/ipv4/tcp_max_syn_backlog設(shè)置,在現(xiàn)在大多數(shù)最新linux內(nèi)核都是默認(rèn)512,這個(gè)設(shè)置有效的前提是系統(tǒng)的syncookies功能被禁用,如果系統(tǒng)的syncookies功能被啟用,那么這個(gè)設(shè)置是無(wú)效的。Syncookies是在內(nèi)核編譯的時(shí)候設(shè)置的,查看syncookies是否啟動(dòng):
cat /proc/sys/net/ipv4/tcp_syncookies
如果是“1”說(shuō)明已啟用,為“0”說(shuō)明未啟用。
那么為syncookies是做什么的呢,為什么它會(huì)和未完成隊(duì)列有關(guān)系。簡(jiǎn)單的說(shuō)它是為防范SYN Flood攻擊的設(shè)計(jì)。具體請(qǐng)參考“syncookies介紹”(http://baike.baidu.com/view/9033755.htm)。
繼續(xù)看backlog,如果我們給listen的backlog參數(shù)設(shè)值超過了/proc/sys/net/core/somaxconn,那么backlog參數(shù)的值為自動(dòng)被改寫為/proc/sys/net/core/somaxconn的值,它的默認(rèn)大小為128.
更多資料可以查看
1、 man tcp
2、 man listen
3、 《unix網(wǎng)絡(luò)編程卷一》
4、 百度百科syncookies介紹:http://baike.baidu.com/view/9033755.htm