服務(wù)器程序常見(jiàn)bug總結(jié)
最近整理了過(guò)去一年發(fā)生過(guò)的bug,包含跟其他項(xiàng)目組程序朋友交流的例子, 都是大家發(fā)生過(guò)的真實(shí)營(yíng)運(yùn)事故。游戲服務(wù)器程序,很多bug的原因都是共通的。抽象出了以下10點(diǎn)啟示, 作為checklist, 寫(xiě)下來(lái)以后寫(xiě)程序review時(shí)自檢:
1. 安全邊界問(wèn)題
啟示:用snprint, strncpy等限制長(zhǎng)度. 永遠(yuǎn)都要考慮超過(guò)邊界的情況
case2: int型大負(fù)數(shù)相加,負(fù)溢出變成大正數(shù)
啟示:test case要全覆蓋輸入?yún)?shù)范圍, 處理各種可能的情況
check A變量
call func_B()
....
A變量被func_B改變了, 但繼續(xù)信任A變量check的結(jié)果。
啟示:白盒復(fù)查代碼時(shí),注意檢查調(diào)用后的變化。
啟示:要檢查一致性,有些邏輯不允許多次被執(zhí)行(比如發(fā)獎(jiǎng)勵(lì)),需要有狀態(tài)變量確保只執(zhí)行1次(避免出刷bug)
推廣到異步環(huán)境(多線(xiàn)程,多進(jìn)程,各種回調(diào)),事務(wù)的中斷也有一個(gè)重入性問(wèn)題,解決方法也只有一個(gè):用一個(gè)唯一可辨認(rèn)的狀態(tài)變量,保證某些邏輯不會(huì)被多次執(zhí)行(比如購(gòu)物應(yīng)用中,用唯一訂單號(hào)來(lái)識(shí)別,狀態(tài)改變是一次性的,當(dāng)邏輯運(yùn)行多次,也不會(huì)重復(fù)加物品,或者重復(fù)扣錢(qián)了)
啟示:while或遞歸的終止條件,邏輯全覆蓋檢查,避免死循環(huán)。較深層次的互相調(diào)用,要注意是否出現(xiàn)了遞歸,是否有可能死循環(huán)。
這個(gè)問(wèn)題本質(zhì)是數(shù)據(jù)一致性問(wèn)題,編程中遇到的很多bug也歸結(jié)到這個(gè)問(wèn)題,比如野指針,就是因?yàn)閿?shù)據(jù)結(jié)構(gòu)相互引用的操作不一致造成的。
處理這個(gè)問(wèn)題,個(gè)人經(jīng)驗(yàn)是,他們的attach,detach操作盡可能在同一個(gè)模塊,不要分散在多個(gè)地方隨意修改,所有修改都集中在同一級(jí)接口做。
同理適用于new, delete, malloc, free這些分配,釋放,都集中在同一層的接口/模塊文件中做,debug起來(lái)也容易;非常反感在一個(gè)地方new, 然后不知道哪個(gè)模塊去delete, 很容易泄漏或者野指針, 無(wú)論如何,想辦法傳遞這些指針,一直傳到分配他所在的模塊文件中釋放,而且new和delete的接口代碼要靠近,方便查找問(wèn)題。
在listen fd的讀事件回調(diào)中, 通常會(huì)accept所有新的連接請(qǐng)求,如果用while(true)而不設(shè)一個(gè)上限,就有可能被攻擊(想象一下客戶(hù)端也用一個(gè)死循環(huán)來(lái)做connect)。
一方面要限制單次接受的socket次數(shù), 另外各個(gè)狀態(tài)要有超時(shí)機(jī)制,踢掉不尋常的連接,以防被攻擊占盡資源。
(同時(shí)要考慮用戶(hù)體驗(yàn),不要讓玩家死等,可以做一個(gè)提示跳轉(zhuǎn),或者等候的動(dòng)畫(huà))
參考資料:
附上最近看的一篇文章
<Writing-reliable-online-game-services> 作者曾是魔獸爭(zhēng)霸和星際爭(zhēng)霸,battle.net的開(kāi)發(fā)者,
里面講的point也是游戲里經(jīng)常遇到的可靠性問(wèn)題。
posted on 2012-11-30 14:14 Daly 閱讀(2358) 評(píng)論(5) 編輯 收藏 引用 所屬分類(lèi): 游戲開(kāi)發(fā)