牽著老婆滿街逛

嚴以律己,寬以待人. 三思而后行.
GMail/GTalk: yanglinbo#google.com;
MSN/Email: tx7do#yahoo.com.cn;
QQ: 3 0 3 3 9 6 9 2 0 .

導(dǎo)航

<

2012年9月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

統(tǒng)計

隨筆 - 1513
文章 - 45
評論 - 907
引用 - 0

公告

言論：
1.每日自省；
2.享受人生；
3.盡力而為；
4.堅持不懈；
5.切莫急躁；
6.慎言敏行；
7.動心忍性；
8.上善若水。

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

搜索

積分與排名

積分 - 2528272
排名 - 2

閱讀排行榜

糊涂窗口綜合癥和Nagle算法

轉(zhuǎn)載自:http://www.cnblogs.com/zhaoyl/archive/2012/09/20/2695799.html

　　前記：TCP/IP詳解系列，畢竟不是一本教材，很多地方講的不細致。比如SWS未說明是什么就開始介紹其避免方法，還和nagle扯在了一起，直覺告訴我二者一定有貓膩，邊搜索一下，果然很有收獲。今天貼在這里，分享給大家。

第一部分：SWS

何謂糊涂窗口綜合癥

　　當(dāng)發(fā)送端應(yīng)用進程產(chǎn)生數(shù)據(jù)很慢、或接收端應(yīng)用進程處理接收緩沖區(qū)數(shù)據(jù)很慢，或二者兼而有之；就會使應(yīng)用進程間傳送的報文段很小，特別是有效載荷很小。極端情況下，有效載荷可能只有1個字節(jié)；而傳輸開銷有40字節(jié)(20字節(jié)的IP頭+20字節(jié)的TCP頭) 這種現(xiàn)象就叫糊涂窗口綜合癥。

發(fā)送端引起的SWS

　　如果發(fā)送端為產(chǎn)生數(shù)據(jù)很慢的應(yīng)用程序服務(wù)(典型的有telnet應(yīng)用)，例如，一次產(chǎn)生一個字節(jié)。這個應(yīng)用程序一次將一個字節(jié)的數(shù)據(jù)寫入發(fā)送端的TCP的緩存。如果發(fā)送端的TCP沒有特定的指令，它就產(chǎn)生只包括一個字節(jié)數(shù)據(jù)的報文段。結(jié)果有很多41字節(jié)的IP數(shù)據(jù)報就在互連網(wǎng)中傳來傳去。解決的方法是防止發(fā)送端的TCP逐個字節(jié)地發(fā)送數(shù)據(jù)。必須強迫發(fā)送端的TCP收集數(shù)據(jù)，然后用一個更大的數(shù)據(jù)塊來發(fā)送。發(fā)送端的TCP要等待多長時間呢？如果它等待過長，它就會使整個的過程產(chǎn)生較長的時延。如果它的等待時間不夠長，它就可能發(fā)送較小的報文段，于是，Nagle找到了一個很好的解決方法，發(fā)明了Nagle算法。而他選擇的等待時間是一個RTT,即下個ACK來到時。

接收端引起的SWS

　　接收端的TCP可能產(chǎn)生糊涂窗口綜合癥，如果它為消耗數(shù)據(jù)很慢的應(yīng)用程序服務(wù)，例如，一次消耗一個字節(jié)。假定發(fā)送應(yīng)用程序產(chǎn)生了1000字節(jié)的數(shù)據(jù)塊，但接收應(yīng)用程序每次只吸收1字節(jié)的數(shù)據(jù)。再假定接收端的TCP的輸入緩存為4000字節(jié)。發(fā)送端先發(fā)送第一個4000字節(jié)的數(shù)據(jù)。接收端將它存儲在其緩存中。現(xiàn)在緩存滿了。它通知窗口大小為零，這表示發(fā)送端必須停止發(fā)送數(shù)據(jù)。接收應(yīng)用程序從接收端的TCP的輸入緩存中讀取第一個字節(jié)的數(shù)據(jù)。在入緩存中現(xiàn)在有了1字節(jié)的空間。接收端的TCP宣布其窗口大小為1字節(jié)，這表示正渴望等待發(fā)送數(shù)據(jù)的發(fā)送端的TCP會把這個宣布當(dāng)作一個好消息，并發(fā)送只包括一個字節(jié)數(shù)據(jù)的報文段。這樣的過程一直繼續(xù)下去。一個字節(jié)的數(shù)據(jù)被消耗掉，然后發(fā)送只包含一個字節(jié)數(shù)據(jù)的報文段。

　　對于這種糊涂窗口綜合癥，即應(yīng)用程序消耗數(shù)據(jù)比到達的慢，有兩種建議的解決方法：
　　1） Clark解決方法 Clark解決方法是只要有數(shù)據(jù)到達就發(fā)送確認，但宣布的窗口大小為零，直到或者緩存空間已能放入具有最大長度的報文段，或者緩存空間的一半已經(jīng)空了。
　　2 ）延遲確認第二個解決方法是延遲一段時間后再發(fā)送確認。這表示當(dāng)一個報文段到達時并不立即發(fā)送確認。接收端在確認收到的報文段之前一直等待，直到入緩存有足夠的空間為止。延遲的確認防止了發(fā)送端的TCP滑動其窗口。當(dāng)發(fā)送端的TCP發(fā)送完其數(shù)據(jù)后，它就停下來了。這樣就防止了這種癥狀。遲延的確認還有另一個優(yōu)點：它減少了通信量。接收端不需要確認每一個報文段。但它也有一個缺點，就是遲延的確認有可能迫使發(fā)送端重傳其未被確認的報文段。可以用協(xié)議來平衡這個優(yōu)點和缺點，例如現(xiàn)在定義了確認的延遲不能超過500毫秒。

第二部分：Nagle算法

   TCP/IP協(xié)議中，無論發(fā)送多少數(shù)據(jù)，總是要在數(shù)據(jù)前面加上協(xié)議頭，同時，對方接收到數(shù)據(jù)，也需要發(fā)送ACK表示確認。為了盡可能的利用網(wǎng)絡(luò)帶寬，TCP總是希望盡可能的發(fā)送足夠大的數(shù)據(jù)。（一個連接會設(shè)置MSS參數(shù)，因此，TCP/IP希望每次都能夠以MSS尺寸的數(shù)據(jù)塊來發(fā)送數(shù)據(jù)）。Nagle算法就是為了盡可能發(fā)送大塊數(shù)據(jù)，避免網(wǎng)絡(luò)中充斥著許多小數(shù)據(jù)塊。
   Nagle算法的基本定義是任意時刻，最多只能有一個未被確認的小段。所謂“小段”，指的是小于MSS尺寸的數(shù)據(jù)塊，所謂“未被確認”，是指一個數(shù)據(jù)塊發(fā)送出去后，沒有收到對方發(fā)送的ACK確認該數(shù)據(jù)已收到。
       Nagle算法的規(guī)則（可參考tcp_output.c文件里tcp_nagle_check函數(shù)注釋）：

（1）如果包長度達到MSS，則允許發(fā)送；

（2）如果該包含有FIN，則允許發(fā)送；

（3）設(shè)置了TCP_NODELAY選項，則允許發(fā)送；

（4）未設(shè)置TCP_CORK選項時，若所有發(fā)出去的小數(shù)據(jù)包（包長度小于MSS）均被確認，則允許發(fā)送；

（5）上述條件都未滿足，但發(fā)生了超時（一般為200ms），則立即發(fā)送。

Nagle算法只允許一個未被ACK的包存在于網(wǎng)絡(luò)，它并不管包的大小，因此它事實上就是一個擴展的停-等協(xié)議，只不過它是基于包停-等的，而不是基于字節(jié)停-等的。Nagle算法完全由TCP協(xié)議的ACK機制決定，這會帶來一些問題，比如如果對端ACK回復(fù)很快的話，Nagle事實上不會拼接太多的數(shù)據(jù)包，雖然避免了網(wǎng)絡(luò)擁塞，網(wǎng)絡(luò)總體的利用率依然很低。另外，他是一個自適應(yīng)的方法，讀者可以自己按上述規(guī)則試驗一下。

Nagle算法是silly window syndrome(SWS)預(yù)防算法的一個半集。SWS算法預(yù)防發(fā)送少量的數(shù)據(jù)，Nagle算法是其在發(fā)送方的實現(xiàn)，而接收方要做的時不要通告緩沖空間的很小增長，不通知小窗口，除非緩沖區(qū)空間有顯著的增長。這里顯著的增長定義為完全大小的段（MSS）或增長到大于最大窗口的一半。

注意：BSD的實現(xiàn)是允許在空閑鏈接上發(fā)送大的寫操作剩下的最后的小段，也就是說，當(dāng)超過1個MSS數(shù)據(jù)發(fā)送時，內(nèi)核先依次發(fā)送完n個MSS的數(shù)據(jù)包，然后再發(fā)送尾部的小數(shù)據(jù)包，其間不再延時等待。（假設(shè)網(wǎng)絡(luò)不阻塞且接收窗口足夠大）

TCP_NODELAY 選項

默認情況下，發(fā)送數(shù)據(jù)采用Negale 算法。這樣雖然提高了網(wǎng)絡(luò)吞吐量，但是實時性卻降低了，在一些交互性很強的應(yīng)用程序來說是不允許的，使用TCP_NODELAY選項可以禁止Negale 算法。

此時，應(yīng)用程序向內(nèi)核遞交的每個數(shù)據(jù)包都會立即發(fā)送出去。需要注意的是，雖然禁止了Negale 算法，但網(wǎng)絡(luò)的傳輸仍然受到TCP確認延遲機制的影響。

TCP_CORK 選項

所謂的CORK就是塞子的意思，形象地理解就是用CORK將連接塞住，使得數(shù)據(jù)先不發(fā)出去，等到拔去塞子后再發(fā)出去。設(shè)置該選項后，內(nèi)核會盡力把小數(shù)據(jù)包拼接成一個大的數(shù)據(jù)包（一個MTU）再發(fā)送出去，當(dāng)然若一定時間后（一般為200ms，該值尚待確認），內(nèi)核仍然沒有組合成一個MTU時也必須發(fā)送現(xiàn)有的數(shù)據(jù)（不可能讓數(shù)據(jù)一直等待吧）。
然而，TCP_CORK的實現(xiàn)可能并不像你想象的那么完美，CORK并不會將連接完全塞住。內(nèi)核其實并不知道應(yīng)用層到底什么時候會發(fā)送第二批數(shù)據(jù)用于和第一批數(shù)據(jù)拼接以達到MTU的大小，因此內(nèi)核會給出一個時間限制，在該時間內(nèi)沒有拼接成一個大包（努力接近MTU）的話，內(nèi)核就會無條件發(fā)送。也就是說若應(yīng)用層程序發(fā)送小包數(shù)據(jù)的間隔不夠短時，TCP_CORK就沒有一點作用，反而失去了數(shù)據(jù)的實時性（每個小包數(shù)據(jù)都會延時一定時間再發(fā)送）。

Nagle算法與CORK算法區(qū)別

　　Nagle算法和CORK算法非常類似，但是它們的著眼點不一樣，Nagle算法主要避免網(wǎng)絡(luò)因為太多的小包（協(xié)議頭的比例非常之大）而擁塞，而CORK算法則是為了提高網(wǎng)絡(luò)的利用率，使得總體上協(xié)議頭占用的比例盡可能的小。如此看來這二者在避免發(fā)送小包上是一致的，在用戶控制的層面上，Nagle算法完全不受用戶socket的控制，你只能簡單的設(shè)置TCP_NODELAY而禁用它，CORK算法同樣也是通過設(shè)置或者清除TCP_CORK使能或者禁用之，然而Nagle算法關(guān)心的是網(wǎng)絡(luò)擁塞問題，只要所有的ACK回來則發(fā)包，而CORK算法卻可以關(guān)心內(nèi)容，在前后數(shù)據(jù)包發(fā)送間隔很短的前提下（很重要，否則內(nèi)核會幫你將分散的包發(fā)出），即使你是分散發(fā)送多個小數(shù)據(jù)包，你也可以通過使能CORK算法將這些內(nèi)容拼接在一個包內(nèi)，如果此時用Nagle算法的話，則可能做不到這一點。

參考：http://www.cnblogs.com/ggjucheng/archive/2012/02/03/2337046.html

posted on 2012-09-25 03:08 楊粼波閱讀(831) 評論(0) 編輯收藏引用所屬分類: 文章收藏、網(wǎng)絡(luò)編程

只有注冊用戶登錄后才能發(fā)表評論。


相關(guān)文章: cocos2dx 內(nèi)存管理 select 效率問題微軟代碼簽名證書使用指南 Opus 音頻編碼正式標(biāo)準(zhǔn)化音頻比特率 speex 的一個例子, 使用了SPEEX抖動緩存. 深入剖析 iLBC 編碼器原理 speex開源項目的學(xué)習(xí) directsound抓取麥克風(fēng)PCM數(shù)據(jù)封裝類丟包補償技術(shù)調(diào)查

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

牽著老婆滿街逛

導(dǎo)航

統(tǒng)計

公告

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

工具官網(wǎng)

技術(shù)網(wǎng)站

開源網(wǎng)站

其他窩點

收藏網(wǎng)站

銀行官網(wǎng)

友情鏈接

資源共享

搜索

積分與排名

最新評論

閱讀排行榜

糊涂窗口綜合癥和Nagle算法