muduo (http://code.google.com/p/muduo) 是一個(gè)基于 Reactor 模式的 C++ 網(wǎng)絡(luò)庫(kù),我在編寫(xiě)它的時(shí)候并沒(méi)有以高并發(fā)高吞吐為主要目標(biāo),但出乎我的意料,ping pong 測(cè)試表明,muduo 吞吐量比 boost.asio 高 15% 以上。
測(cè)試對(duì)象
測(cè)試環(huán)境
硬件:DELL 490 工作站,雙路 Intel quad core Xeon E5320 CPU,16G 內(nèi)存
操作系統(tǒng):Ubuntu Linux Server 10.04.1 LTS x86_64
編譯器:g++ 4.4.3
測(cè)試方法
依據(jù) asio 性能測(cè)試 http://think-async.com/Asio/LinuxPerformanceImprovements 的辦法,用 ping pong 協(xié)議來(lái)測(cè)試吞吐量。
簡(jiǎn)單地說(shuō),ping pong 協(xié)議是客戶端和服務(wù)器都實(shí)現(xiàn) echo 協(xié)議。當(dāng) TCP 連接建立時(shí),客戶端向服務(wù)器發(fā)送一些數(shù)據(jù),服務(wù)器會(huì) echo 回這些數(shù)據(jù),然后客戶端再 echo 回服務(wù)器。這些數(shù)據(jù)就會(huì)像乒乓球一樣在客戶端和服務(wù)器之間來(lái)回傳送,直到有一方斷開(kāi)連接為止。這是用來(lái)測(cè)試吞吐量的常用辦法。
asio 的測(cè)試代碼取自 http://asio.cvs.sourceforge.net/viewvc/asio/asio/src/tests/performance/ ,未作更改。
muduo 的測(cè)試代碼在 0.1.1 軟件包內(nèi),路徑為 examples/pingpong/,代碼如 http://gist.github.com/564985 所示。
muduo 和 asio 的優(yōu)化編譯參數(shù)均為 -O2 -finline-limit=1000
$ BUILD_TYPE=release ./build.sh # 編譯 muduo 的優(yōu)化版本
我主要做了兩項(xiàng)測(cè)試:
- 單線程測(cè)試,測(cè)試并發(fā)連接數(shù)為 1/10/100/1000/10000 時(shí)的吞吐量。
- 多線程測(cè)試,并發(fā)連接數(shù)為 100 或 1000,服務(wù)器和客戶端的線程數(shù)同時(shí)設(shè)為 1/2/3/4。(由于我家里只有一臺(tái) 8 核機(jī)器,而且服務(wù)器和客戶端運(yùn)行在同一臺(tái)機(jī)器上,線程數(shù)大于 4 沒(méi)有意義。)
所有測(cè)試中,ping pong 消息的大小均為 16k bytes。測(cè)試用的 shell 腳本可從 http://gist.github.com/564985 下載。
測(cè)試結(jié)果
單線程測(cè)試的結(jié)果,數(shù)字越大越好:
多線程測(cè)試的結(jié)果,數(shù)字越大越好:
測(cè)試結(jié)果表明 muduo 吞吐量平均比 asio 高 15% 以上。
討論
muduo 出乎意料地比 asio 性能優(yōu)越,我想主要得益于其簡(jiǎn)單的設(shè)計(jì)和簡(jiǎn)潔的代碼。
asio 在多線程測(cè)試中表現(xiàn)不佳,我猜測(cè)其主要原因是測(cè)試代碼只使用了一個(gè) io_service,如果改用“io_service per CPU”的話,性能應(yīng)該有所提高。我對(duì) asio 的了解程度僅限于能讀懂其代碼,希望能有 asio 高手編寫(xiě)“io_service per CPU”的 ping pong 測(cè)試,以便與 muduo 做一個(gè)公平的比較。
ping pong 測(cè)試很容易實(shí)現(xiàn),歡迎其他網(wǎng)絡(luò)庫(kù)(ACE、POCO、libevent 等)也能加入到對(duì)比中來(lái),期待這些庫(kù)的高手出馬。