• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務(wù)器了,然后發(fā)送一個"GET url \n"的請求才能下載網(wǎng)頁. 之后就是分析網(wǎng)頁,比如辨認(rèn)超鏈接和搜索關(guān)鍵詞.

            就是GET 這個東西搞不懂, 有的網(wǎng)頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            精品国产乱码久久久久久浪潮| 中文字幕人妻色偷偷久久| 99久久伊人精品综合观看| 国内精品免费久久影院| 久久精品国产亚洲AV不卡| 精品熟女少妇AV免费久久| 99国产欧美久久久精品蜜芽| 久久九九免费高清视频| 婷婷伊人久久大香线蕉AV| 国产精品永久久久久久久久久 | 久久亚洲中文字幕精品一区| 无码人妻久久一区二区三区免费丨| 好久久免费视频高清| 久久精品无码午夜福利理论片| 久久香蕉国产线看观看99| 久久夜色精品国产网站| 久久无码专区国产精品发布| 国产精品gz久久久| 久久精品国产免费一区| 久久久久亚洲精品天堂| 久久久久久久波多野结衣高潮| 精品久久久久久无码免费| 久久久久久a亚洲欧洲aⅴ| 国产精品一区二区久久不卡| 亚洲AV无一区二区三区久久| 久久乐国产综合亚洲精品| 亚洲国产成人久久综合一区77| 国产ww久久久久久久久久| 久久亚洲综合色一区二区三区| 久久精品无码专区免费青青| 久久人人爽人人爽人人AV | 亚洲级αV无码毛片久久精品 | 亚洲成色www久久网站夜月| 久久久亚洲欧洲日产国码是AV| 九九精品久久久久久噜噜| 久久亚洲sm情趣捆绑调教| 四虎亚洲国产成人久久精品| 久久se精品一区二区影院| 久久99热这里只有精品国产 | 四虎国产精品成人免费久久| 欧美与黑人午夜性猛交久久久|