• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1860) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            国产精品久久网| 无码国产69精品久久久久网站| 久久99精品久久久久久久不卡| 久久91精品国产91久久户| 久久国产高清字幕中文| 四虎国产精品成人免费久久| 97久久婷婷五月综合色d啪蜜芽| 久久er99热精品一区二区| 久久久久久国产精品无码下载| 亚洲va久久久噜噜噜久久男同 | 久久伊人五月天论坛| 久久亚洲AV成人无码国产| 久久精品亚洲男人的天堂| 奇米综合四色77777久久| 久久久WWW免费人成精品| 国产亚洲欧美精品久久久| 久久精品国产色蜜蜜麻豆| 免费观看成人久久网免费观看| 无码伊人66久久大杳蕉网站谷歌| 狠狠色综合久久久久尤物| 久久人爽人人爽人人片AV | 久久国产一区二区| 亚洲精品第一综合99久久| 久久精品综合一区二区三区| 久久精品国产秦先生| 久久久久久午夜成人影院| 伊人久久精品无码二区麻豆| 香蕉99久久国产综合精品宅男自 | 韩国免费A级毛片久久| 国产午夜精品久久久久九九电影 | 久久综合久久久| 久久精品国产AV一区二区三区| 国产一区二区精品久久凹凸| 久久国产精品久久| 狠狠色丁香婷综合久久| MM131亚洲国产美女久久| 久久99精品国产麻豆| 亚洲va久久久噜噜噜久久男同| 国内精品综合久久久40p| 香蕉久久夜色精品升级完成| 人妻少妇久久中文字幕一区二区|