• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1860) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            久久精品人人做人人妻人人玩| 国产精品成人精品久久久| 97热久久免费频精品99| www.久久精品| 精品久久久久中文字| 久久久久波多野结衣高潮| 成人综合伊人五月婷久久| 久久精品女人天堂AV麻| 久久精品www人人爽人人| 欧美日韩中文字幕久久久不卡| 国产精品99久久久精品无码| 国产精品99久久不卡| 亚洲精品白浆高清久久久久久| 99久久精品免费观看国产| 色88久久久久高潮综合影院| 香蕉99久久国产综合精品宅男自 | 久久久噜噜噜久久| 亚洲日本va中文字幕久久| 99久久婷婷国产一区二区| 人妻无码αv中文字幕久久琪琪布| 精品欧美一区二区三区久久久| 久久久久免费看成人影片| 久久久久久久综合日本| 精品午夜久久福利大片| 久久精品中文无码资源站| 久久99精品久久久大学生| 久久综合九色综合久99| 久久久久久免费一区二区三区 | 亚洲综合婷婷久久| 99久久99久久精品免费看蜜桃| 色老头网站久久网| 欧美国产成人久久精品| 国产99久久久国产精品小说| 思思久久好好热精品国产| 99精品国产免费久久久久久下载| 热RE99久久精品国产66热| 欧美久久久久久精选9999| 欧美粉嫩小泬久久久久久久 | 久久久精品国产免大香伊| 久久久久久亚洲精品影院| 国产亚洲美女精品久久久2020|