Posted on 2009-08-09 14:44
Prayer 閱讀(2342)
評論(0) 編輯 收藏 引用 所屬分類:
系統(tǒng)、備份等
雙機(jī)熱備原理
雙機(jī)熱備是當(dāng)一臺服務(wù)器在工作時(稱為主機(jī))。另一臺服務(wù)器作備用狀態(tài)(稱為備機(jī))。當(dāng)主機(jī)因?yàn)槟撤N原因出現(xiàn)故障,如死機(jī),主機(jī)斷電,病毒發(fā)作,硬盤損壞等,不能繼續(xù)提供服務(wù)時,從機(jī)能夠在規(guī)定的時間內(nèi)接替主機(jī)的服務(wù),繼續(xù)提供服務(wù),從而達(dá)到不停機(jī)的服務(wù)。
雙機(jī)熱備軟件
DataWare是一組高可靠性的軟件系統(tǒng),可使聯(lián)入網(wǎng)絡(luò)中的兩臺服務(wù)器達(dá)到一種近乎無差錯的容錯級。如圖:
注:
1、上面是兩臺Web服務(wù)器,裝有相同的網(wǎng)絡(luò)操作系統(tǒng),NT或UNIX通過SCSI總線連接到一個外存子系統(tǒng)。
2、服務(wù)器通過網(wǎng)卡連接并經(jīng)由SCSI通道和一個網(wǎng)絡(luò)上的監(jiān)視器偵測主服務(wù)器故障。當(dāng)發(fā)生故障時,備援主機(jī)接替故障主機(jī)管理磁盤陣列、網(wǎng)絡(luò)通訊、數(shù)據(jù)庫等,DataWare起到主副機(jī)之間容錯切換開關(guān)的作用。
3、在備援機(jī)工作期間,用戶只需進(jìn)行幾個簡單的操作即可重新恢復(fù)系統(tǒng)。
Web服務(wù)器的host A 如果出現(xiàn)電源供應(yīng)不足、斷電、主機(jī)硬件故障、網(wǎng)絡(luò)出錯、應(yīng)用軟件沖突等,DataWare即會及時警報(bào),通知管理員。
1、服務(wù)進(jìn)程:
1)、雙服務(wù)器采用TCP/IP網(wǎng)絡(luò)協(xié)議跟用戶連接。
2)、雙機(jī)后臺對于用戶—服務(wù)器網(wǎng)絡(luò)用戶透明。
服務(wù)及優(yōu)點(diǎn):
1)、網(wǎng)絡(luò)服務(wù):
雙機(jī)后臺對于用戶一端,由監(jiān)控軟件DataWare 提供一個邏輯的IP地址,如:192.1.1.1,任一用戶上網(wǎng)只需用到這一地址;當(dāng)后臺有一臺服務(wù)器出現(xiàn)故障時,另外一臺服務(wù)器會自動將其網(wǎng)卡的IP地址替換為192.1.1.1;這樣,用戶一端的網(wǎng)絡(luò)不會因?yàn)橐慌_服務(wù)器出現(xiàn)故障而斷掉。
2)、數(shù)據(jù)庫服務(wù):
當(dāng)有一臺服務(wù)器出現(xiàn)故障時,另外一臺服務(wù)器會自動接管數(shù)據(jù)庫engine ;同時啟動數(shù)據(jù)庫和應(yīng)用程序,使用戶數(shù)據(jù)庫可以繼續(xù)操作,對用戶而言不受影響。
2、監(jiān)控原理:
DataWare 會有SCSI偵測心跳及網(wǎng)絡(luò)偵測心跳兩條通訊線路,結(jié)果置于Power 5000s 磁盤柜上的一個5MB 的小區(qū),用于監(jiān)控(如命名為Ware),此小區(qū)一般在機(jī)柜邏輯盤的起始段。
3、監(jiān)控對象資源有:
1)、Informix數(shù)據(jù)庫運(yùn)行狀態(tài)
2)、銀行應(yīng)用交易業(yè)務(wù)
3)、Sco Open Server Unix系統(tǒng)運(yùn)行狀態(tài)
4)、生產(chǎn)機(jī)硬件資源
5)、系統(tǒng)網(wǎng)絡(luò)設(shè)備
6)、對等主機(jī)系統(tǒng)運(yùn)行狀態(tài)
7)、SQL數(shù)據(jù)庫運(yùn)行狀態(tài)
8)、IIS的運(yùn)行狀態(tài)
1)、雙機(jī)熱備份 2)、雙機(jī)互備援
DataWare 支持的操作系統(tǒng)
Unix Based System:
Sco OpenServer5.0 SCO/MPX Unixware7.x
HP/ ux (Multi-pro ) HP/ux (Uni-Pro )等
Windows NT:
WinNT 3.51, 4.0 (英文版) WinNT 4.0 (中文版)
1、切換模塊:支持主從熱備份 hot Standby 和對等處理模式,同時也支持雙機(jī)雙控模式和爭主機(jī)工作自由切換模式。
2、切換時間靈活設(shè)置:在盡可能短的時間內(nèi)完成安全切換,并對其切換過程提供動態(tài)監(jiān)測、顯示,同時為用戶提出排除故障的操作提示。
1)、自動偵測, 2)、自動切換, 3)、自動修復(fù), 4)、負(fù)載平衡, 5)、自動提醒, 6)、易操作
1、服務(wù)器停電時,能實(shí)現(xiàn)自動切換。
2、服務(wù)器的硬盤、CPU、RAM發(fā)生故障,影響系統(tǒng)運(yùn)行時,實(shí)現(xiàn)自動切換。
3、網(wǎng)絡(luò)連接發(fā)生故障時(如服務(wù)器網(wǎng)卡、網(wǎng)線故障),實(shí)現(xiàn)自動切換。
4、服務(wù)器的SCSI線路,控制器設(shè)備發(fā)生故障時,實(shí)現(xiàn)自動切換。
5、操作系統(tǒng)、數(shù)據(jù)庫或應(yīng)用程序發(fā)生故障時,實(shí)現(xiàn)自動切換。
6、提供手動切換功能和可選功能附件,使系統(tǒng)管理員可以在主機(jī)負(fù)載過大時或其他適當(dāng)?shù)臅r候,實(shí)現(xiàn)手動切換。
7、雙機(jī)軟件本身發(fā)生故障時,應(yīng)能給出提示信息,使系統(tǒng)管理員可以及時將其恢復(fù)。
8、安全完成多次切換。
9、監(jiān)測備份機(jī)的基本設(shè)備和系統(tǒng)狀態(tài),保證備份機(jī)的可靠性。
10、自動保存完整的系統(tǒng)日志,并可管理。
報(bào)警系統(tǒng):
1)、發(fā)生任何故障時,均在監(jiān)控窗口中給出錯信息及響應(yīng)的處理建議。
2)、發(fā)生重大故障或切換時,發(fā)出明顯的信號(如警報(bào)聲等)提醒系統(tǒng)管理員注意。
3)、結(jié)合可選的功能附件,能按要求顯示系統(tǒng)資源的利用情況。
雙機(jī)熱備常用硬件
1、雙服務(wù)器
2、至少32M內(nèi)存
3、SCSI接口
4、以太網(wǎng)通道
5、可支持雙服務(wù)器的陣列子系統(tǒng)
6、終端服務(wù)器