同自動化瀏覽器(http://blog.joycode.com/jiangsheng/archive/2005/10/20/65489.aspx)相比,自動化瀏覽器控件(WebBrowser Control) 在應用程序中更加常用。從Outlook的預覽窗格到Maxthon這樣的基于IE引擎的瀏覽器,從無界面的HTML分析器到Norton Antivirusd的主界面,瀏覽器控件在眾多領(lǐng)域被用作各種各樣的用途。這也使得有必要根據(jù)具體的用戶需求自定義瀏覽器控件的行為。
在應用程序中加入瀏覽器控件
集成瀏覽器控件的最簡單的方法是找一個支持ActiveX的集成開發(fā)環(huán)境,在工具箱中加入Microsoft Web Browser這個控件,往表單上拖一個這個控件就可以完成工作。你甚至可以用集成開發(fā)環(huán)境添加ActiveX的事件處理函數(shù)。如果要直接導入ActiveX的話,建議使用mehrcpp的vbMHWB控件(http://www.codeproject.com/atl/vbmhwb.asp)。這個控件在瀏覽器控件的基礎(chǔ)上進行了擴展,暴露了很多底層接口。
通常導入ActiveX就可以滿足大部分需求 ,但是有些類庫中也集成了瀏覽器控件,并且提供了更多的功能,例如MFC的CHTMLView和CDHtmlDialog,ATL的HTML Control,以及.Net 2.0中的Windows.Forms.WebBrowser。如果使用Visual C++來進行非托管編程,那么建議使用MFC或者ATL的封裝類,或者使用vbMHWB控件。托管編程中當然首選Windows.Forms.WebBrowser。除非這些類的BUG影響到了應用程序的開發(fā),否則建議使用這些功能更加強大的封裝類。
在使用瀏覽器控件及其封裝類的時候要注意一些已知問題
常見任務(wù)
在集成瀏覽器控件之后,可以完成基本的網(wǎng)頁瀏覽,但是對于不同的任務(wù),也需要進一步的處理,例如設(shè)置控件的屬性、為控件添加事件處理、操作HTML文檔等等。
修改瀏覽器控件的屬性
這在集成開發(fā)環(huán)境中可以很容易地設(shè)置,也可以自己實現(xiàn)容器來設(shè)置,但是CHTMLView這樣的封裝類沒有這個選項(http://support.microsoft.com/kb/197921)。
- 鏈接目標解析。對于用瀏覽器控件來做瀏覽器的場合來說,需要將瀏覽器的RegisterAsBrowser屬性設(shè)置為true。這使得Internet Explorer在解析HTML鏈接的target屬性指定的目標窗口時可以找到這個窗口。
- 禁用拖放。對于使用瀏覽器控件來做預覽窗格的場合來說,需要將瀏覽器的RegisterAsDropTarget屬性設(shè)置為false。這使得窗口不接受拖進來的文件和鏈接。
- 禁用消息框。對于用瀏覽器控件來做HTML分析器的場合來說,有時需要屏蔽腳本產(chǎn)生的消息框以避免阻塞程序運行。這可以通過設(shè)置瀏覽器的Silent屬性來實現(xiàn),或者實現(xiàn)IDocHostShowUI::ShowMessage。
捕獲瀏覽器控件的事件
集成開發(fā)環(huán)境中可以也很容易地添加瀏覽器的事件處理函數(shù)。比較常用的事件包括
- NewWindow2或者NewWindow3事件。默認情況下,瀏覽器控件中創(chuàng)建的新窗口會是一個Internet Explorer的窗口。這通常不是預期的行為,對于瀏覽器程序來說更是這樣。需要處理瀏覽器的NewWindow2或者NewWindow3(在Windows XP SP2或者Windows 2003 SP1之后可用)事件來讓新的瀏覽器窗口在應用程序提供的窗口中運行。
- WindowClosing事件。瀏覽器控件需要處理WindowClosing事件來在瀏覽器控件被腳本關(guān)閉時關(guān)閉瀏覽器控件的宿主窗口(http://support.microsoft.com/kb/253219)。
- BeforeNavigate2事件??梢栽谧约旱木W(wǎng)頁中加入自定義的協(xié)議,之后在BeforeNavigate2事件中掃描URL來進行網(wǎng)頁和應用程序之間的交互(http://www.microsoft.com/msj/0100/c/c0100.aspx)。當然,自定義的網(wǎng)絡(luò)協(xié)議也可以用Asynchronous Pluggable Protocol來處理(參見http://support.microsoft.com/kb/303740),vbMHWB控件就實現(xiàn)了這個功能。但是更加常用的是在彈出廣告過濾器程序中用BeforeNavigate2來判斷在NewWindow2事件中創(chuàng)建的窗口是否需要關(guān)閉。
操作MSHTML文檔
通常HTML分析和瀏覽器自動化程序都需要分析網(wǎng)頁的結(jié)構(gòu),找到需要操作的元素。這需要對網(wǎng)頁的結(jié)構(gòu)進行分析,找到目標元素的標識方法。 一些常用的操作包括:
在頁面包含框架的時候,可能需要跨框架訪問HTML文檔??梢酝ㄟ^查詢框架元素所支持的IWebBrowser2接口或者IHTMLWindow2接口來訪問框架中的文檔(http://support.microsoft.com/kb/196340),但是也有可能因為安全設(shè)置而無法訪問(http://support.microsoft.com/kb/167796)。
在瀏覽器控件中顯示其它類型的文檔時,可以用IWebBrowser2的document屬性來訪問ActiveX文檔,例如在顯示Microsoft Word時,IWebBrowser2的document屬性就是Word的文檔對象,在顯示文件夾的時候,IWebBrowser2的document屬性就是文件夾對象等等。
擴展瀏覽器的宿主
瀏覽器控件在創(chuàng)建時會查詢ActiveX容器的IOleClientSite的實現(xiàn)的如下接口:IDocHostUIHandler, IDocHostUIHandler2 and IDocHostShowUI。
雖然在無法自定義ActiveX容器的情況下可以用ICustomDoc::SetUIHandler來掛接IDocHostUIHandler到瀏覽器控件,但是這樣也會造成內(nèi)存泄漏(http://support.microsoft.com/kb/893629)。一些類庫,例如MFC、ATL和.Net類庫都實現(xiàn)了IDocHostUIHandler接口。
除了專門用于瀏覽器用途的程序之外,通常都需要自定義瀏覽器控件的上下文菜單。這需要實現(xiàn)IDocHostUIHandler::ShowContextMenu。通常的實現(xiàn)包括完全禁用上下文菜單、完全替換上下文菜單、以及修改部分上下文菜單。經(jīng)常被從上下文菜單中移除的菜單項包含查看源代碼、刷新和屬性。一種替代的方案是在容器中過濾右鍵消息(http://support.microsoft.com/kb/231578)。
與瀏覽器相比,一些Internet Explorer的宿主功能在瀏覽器控件中并不是默認啟用。在某些場合,默認啟用的宿主功能可能并非預期。這時需要實現(xiàn)IDocHostUIHandler::GetHostInfo。可以通過實現(xiàn)IDocHostUIHandler::GetHostInfo來自定義的功能包括:
- 自動完成功能。對于用瀏覽器控件來做瀏覽器的場合來說,這個功能是有必要啟用的。啟用的方法是設(shè)置DOCHOSTUIFLAG_ENABLE_FORMS_AUTOCOMPLETE位
- 如果瀏覽器中的鏈接網(wǎng)址包含非ASCII的字符,那么需要實現(xiàn)IDocHostUIHandler::GetHostInfo,并且在返回的DOCHOSTUIINFO結(jié)構(gòu)中設(shè)置dwFlags成員的DOCHOSTUIFLAG_URL_ENCODING_ENABLE_UTF8位。這使得網(wǎng)址會在發(fā)送之前用UTF-8編碼。
- 3D邊框、滾動條,禁用文字選擇功能和禁用頁面上的腳本。
- 對于使用瀏覽器控件來做HTML編輯器的場合來說,有時需要修改默認的頁面樣式。這都需要實現(xiàn)IDocHostUIHandler::GetHostInfo(http://support.microsoft.com/kb/328803)。注意在有些版本的IE中IDocHostUIHandler::GetHostInfo只在MSHTML被初始化的時候被調(diào)用,所以如果你需要在MSHTML被初始化之后使你的修改生效,你需要瀏覽到一個Word之類的非HTML Active document文檔,之后再瀏覽回來。
在使用瀏覽器控件來做數(shù)據(jù)錄入界面的場合,需要更改瀏覽器控件默認的Tab鍵處理使得用戶可以使用Tab鍵切換到容器中的其他控件。這需要實現(xiàn)IDocHostUIHandler::TranslateAccelerator來自定義瀏覽器控件的快捷鍵處理。對于MFC這樣用消息鉤子來做消息預處理的可自定義容器來說,也可以用PreTranslateMessage來過濾F5鍵盤消息,而不是實現(xiàn)IDocHostUIHandler::TranslateAccelerator。
在腳本中調(diào)用應用程序?qū)g覽器控件的擴展,這需要實現(xiàn)IDocHostUIHandler::GetExternal。使用.Net的WebBrowser控件的話設(shè)置ObjectForScripting屬性就可以了。
對于用瀏覽器控件來做HTML分析器的場合來說,有時需要屏蔽腳本產(chǎn)生的消息框。這需要實現(xiàn)IDocHostShowUI::ShowMessage,或者設(shè)置瀏覽器的Silent屬性。
另外,瀏覽器也會查詢IOleClientSite來獲得其它的服務(wù)信息,例如
其他控制
對于用瀏覽器控件來做HTML分析器的場合來說,有時需要禁用瀏覽器的腳本、ActiveX或者圖片下載。這可以通過在容器中實現(xiàn)IDispatch,處理DISPID_AMBIENT_DLCONTROL來做到(http://msdn.microsoft.com/library/default.asp?url=/workshop/browser/overview/Overview.asp)。
看來離線瀏覽的控制并不能用這種方法來控制(http://support.microsoft.com/kb/247336)。不過你可以自己編寫一個HTTP層傳遞 BINDF_OFFLINEOPERATION標志 (http://groups-beta.google.com/group/microsoft.public.inetsdk.programming.mshtml_hosting/msg/76bf4910a289d4b3)
在瀏覽器控件中java小程序可能不能正常運行,如果使用Sun JVM1.4之后的版本,可以用SetEnvironmentVariable 來設(shè)置JAVA_PLUGIN_WEBCONTROL_ENABLE為1來啟用Sun JVM。
默認情況下在頁面載入時會有點擊聲。屏蔽點擊聲的一個方法是在程序運行時修改注冊表鍵(http://support.microsoft.com/kb/201901),另一個方法是將瀏覽器控件隱藏,在調(diào)用Navigate2之后再顯示,但是這也需要鎖定控件的更新區(qū)域(LockWindowUpdate)以避免閃爍。在IE7中,也可以調(diào)用 CoInternetSetFeatureEnabled函數(shù),傳遞FEATURE_DISABLE_NAVIGATION_SOUNDS來禁用瀏覽時的聲音。
在需要使用代理服務(wù)器時,有可能需要在應用程序中使用非默認的代理服務(wù)器設(shè)置。這可以通過調(diào)用UrlMkSetSessionOption來實現(xiàn)。
Overriding IInternetSecurityManager in a CComControl class
CAxWindow implements IObjectWithSite interface (get it with QueryHost
method). Call SetSite passing your implementation of IServiceProvider.
At this point, AxWin will forward all QueryService calls from hosted
WebBrowser to your implementation.