亚洲激情婷婷,欧美国产在线观看,妖精视频成人观看www

網(wǎng)頁抓取的程序

本打算做一個網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務(wù)器了,然后發(fā)送一個"GET url \n"的請求才能下載網(wǎng)頁. 之后就是分析網(wǎng)頁,比如辨認(rèn)超鏈接和搜索關(guān)鍵詞.

就是GET 這個東西搞不懂, 有的網(wǎng)頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?

source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
(寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)

Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2) 編輯收藏引用所屬分類: program

Feedback

# re: 網(wǎng)頁抓取的程序回復(fù) 更多評論

2007-08-11 14:51 by XTSHMF

兩個都試試阿，哪個行就哪個貝，嘿嘿

# re: 網(wǎng)頁抓取的程序 回復(fù) 更多評論

2007-08-11 15:14 by ken

怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com

刷新評論列表

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

2007年8月

日

一

二

三

四

五

六

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

2007年8月 (2)

ken

網(wǎng)頁抓取的程序

Feedback

# re: 網(wǎng)頁抓取的程序回復(fù) 更多評論

# re: 網(wǎng)頁抓取的程序 回復(fù) 更多評論

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

ken

網(wǎng)頁抓取的程序

Feedback

# re: 網(wǎng)頁抓取的程序 回復(fù) 更多評論

# re: 網(wǎng)頁抓取的程序 回復(fù) 更多評論

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

# re: 網(wǎng)頁抓取的程序回復(fù) 更多評論

# re: 網(wǎng)頁抓取的程序回復(fù) 更多評論