序言
雖然nginx+lua開發一些小的web服務簡單快捷,但是由于種種原因,配套的工具比較缺乏,監控工具和性能檢測工具等等。而且lua作為一種跑在虛擬機的腳本語言,雖然做的短小精悍,但是。。。功能和可調優的空間還是欠缺了點。
前段時間使用春哥的systemtap腳本對我的lua服務做了下性能測試,這里記錄一下折騰的歷程
準備
systemtap是一個性能檢測和調試跟蹤的工具,最開始是為了調試內核被做出來的,后來添加了用戶態跟蹤的功能。
折騰記錄
春哥的腳本要求systemtap2.2以上,公司測試服務器自帶的systemtap腳本的版本那是1.6,遠遠不夠,所以必須手動編譯一個。下載systamtap的源碼,然后./configuare + make就可以直接編了。最開始碰到的問題是公司el5系統的服務器的elfutil版本太低,得自己編譯一個高版本的elfutil然后指定路徑。。。。我怕麻煩,就把一個空的測試機器重裝成el6,elfutil的版本立馬就夠了(我真是太機智了)。
順利編譯出systamtap之后(中途遇到了systemtap版本不夠新導致的符號找不到的bug),就是tengine的安裝,時間都折騰在這上面了。。。我們項目用的是tengine-ads這個版本,直接用tengine缺少模塊,就請了tengine組的同學幫忙把模塊給打了進去。由于要跟蹤lua內部,所以自帶的luajit必須-g編譯。那邊的同學比較忙,我就只能自己要了服務器權限跑上去自己編,編了幾次之后那個測試服務器竟然磁盤滿了。。。總之就是折騰了一晚上和一早上,終于把帶debuginfo的tengine給裝上了。
效果
啟動tengine服務,把壓測程序開好,運行
./ngx-sample-lua-bt -p 29237 --luajit20 -t 200 -a '--vp 02 -R /home/wenqian.peiwq/systemtap-2.6/runtime -DSTP_NO_OVERLOAD --all-modules -DMAXSKIPPED=1024 ' > tmp.bt
采樣結束后,利用brendangregg的FlameGraph tools可以繪制棧調用的火焰圖,如下:

通過這個圖,先是立馬發現了一個低級錯誤。。。(上面貼的圖上已經沒了),我有很多打印debug的語句,用了這類用法
_log.log("debug", "xxx", util.print_r(some_data))
忘記了lua的求值策略,雖然debug下的這個語句在生產環境中不執行,但是由于求值策略,util.print_r(some_data)
仍然會先求值,導致了很大的性能損失,接近1/4。
同時也發現了UUID的生成所占用的時間也過分的長了一些,然后重寫了這個方法,使用了resty.string庫中的random模塊(直接調用了ngx_*的C函數),然后利用systemtap對比了前后的時間,提升了360%多,可見還是很有效果的。
注:
這個項目是基于我上次手擼的小框架dodolu,根據這次的測試結果,框架的封裝對我的項目造成的性能損失在1%以下。
posted on 2015-01-09 12:03
右席 閱讀(2347)
評論(0) 編輯 收藏 引用