序言
雖然nginx+lua開發(fā)一些小的web服務(wù)簡單快捷,但是由于種種原因,配套的工具比較缺乏,監(jiān)控工具和性能檢測工具等等。而且lua作為一種跑在虛擬機的腳本語言,雖然做的短小精悍,但是。。。功能和可調(diào)優(yōu)的空間還是欠缺了點。
前段時間使用春哥的systemtap腳本對我的lua服務(wù)做了下性能測試,這里記錄一下折騰的歷程
準(zhǔn)備
systemtap是一個性能檢測和調(diào)試跟蹤的工具,最開始是為了調(diào)試內(nèi)核被做出來的,后來添加了用戶態(tài)跟蹤的功能。
折騰記錄
春哥的腳本要求systemtap2.2以上,公司測試服務(wù)器自帶的systemtap腳本的版本那是1.6,遠(yuǎn)遠(yuǎn)不夠,所以必須手動編譯一個。下載systamtap的源碼,然后./configuare + make就可以直接編了。最開始碰到的問題是公司el5系統(tǒng)的服務(wù)器的elfutil版本太低,得自己編譯一個高版本的elfutil然后指定路徑。。。。我怕麻煩,就把一個空的測試機器重裝成el6,elfutil的版本立馬就夠了(我真是太機智了)。
順利編譯出systamtap之后(中途遇到了systemtap版本不夠新導(dǎo)致的符號找不到的bug),就是tengine的安裝,時間都折騰在這上面了。。。我們項目用的是tengine-ads這個版本,直接用tengine缺少模塊,就請了tengine組的同學(xué)幫忙把模塊給打了進去。由于要跟蹤lua內(nèi)部,所以自帶的luajit必須-g編譯。那邊的同學(xué)比較忙,我就只能自己要了服務(wù)器權(quán)限跑上去自己編,編了幾次之后那個測試服務(wù)器竟然磁盤滿了。。。總之就是折騰了一晚上和一早上,終于把帶debuginfo的tengine給裝上了。
效果
啟動tengine服務(wù),把壓測程序開好,運行
./ngx-sample-lua-bt -p 29237 --luajit20 -t 200 -a '--vp 02 -R /home/wenqian.peiwq/systemtap-2.6/runtime -DSTP_NO_OVERLOAD --all-modules -DMAXSKIPPED=1024 ' > tmp.bt
采樣結(jié)束后,利用brendangregg的FlameGraph tools可以繪制棧調(diào)用的火焰圖,如下:

通過這個圖,先是立馬發(fā)現(xiàn)了一個低級錯誤。。。(上面貼的圖上已經(jīng)沒了),我有很多打印debug的語句,用了這類用法
_log.log("debug", "xxx", util.print_r(some_data))
忘記了lua的求值策略,雖然debug下的這個語句在生產(chǎn)環(huán)境中不執(zhí)行,但是由于求值策略,util.print_r(some_data)
仍然會先求值,導(dǎo)致了很大的性能損失,接近1/4。
同時也發(fā)現(xiàn)了UUID的生成所占用的時間也過分的長了一些,然后重寫了這個方法,使用了resty.string庫中的random模塊(直接調(diào)用了ngx_*的C函數(shù)),然后利用systemtap對比了前后的時間,提升了360%多,可見還是很有效果的。
注:
這個項目是基于我上次手?jǐn)]的小框架dodolu,根據(jù)這次的測試結(jié)果,框架的封裝對我的項目造成的性能損失在1%以下。
posted on 2015-01-09 12:03
右席 閱讀(2356)
評論(0) 編輯 收藏 引用