• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網絡爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務器了,然后發送一個"GET url \n"的請求才能下載網頁. 之后就是分析網頁,比如辨認超鏈接和搜索關鍵詞.

            就是GET 這個東西搞不懂, 有的網頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學習網絡編程的同學參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1866) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網頁抓取的程序  回復  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            四虎影视久久久免费| 久久w5ww成w人免费| 久久久久久曰本AV免费免费| 无码人妻久久一区二区三区蜜桃| 国产精品一区二区久久精品涩爱| 精品多毛少妇人妻AV免费久久| 精品久久人妻av中文字幕| 亚洲欧美久久久久9999| 久久99国产综合精品| 亚洲色欲久久久久综合网| 久久精品九九亚洲精品天堂| 日韩欧美亚洲综合久久| 91久久精品国产成人久久| 午夜人妻久久久久久久久| 欧美日韩中文字幕久久久不卡| 久久精品国产网红主播| 久久香综合精品久久伊人| 99热都是精品久久久久久| 久久久久AV综合网成人| 久久91精品国产91| 久久精品一区二区影院| 久久被窝电影亚洲爽爽爽| 色综合久久久久无码专区| 欧美一区二区久久精品| 国产A级毛片久久久精品毛片| 91久久婷婷国产综合精品青草| 亚洲精品乱码久久久久久中文字幕| 人妻丰满?V无码久久不卡| 久久精品一区二区影院| 欧美亚洲另类久久综合| 久久中文娱乐网| 国产精品伦理久久久久久| 九九99精品久久久久久| 久久er国产精品免费观看2| 99久久超碰中文字幕伊人| 久久国产精品99精品国产| 99久久婷婷免费国产综合精品| 国产成人精品久久一区二区三区| 久久婷婷成人综合色综合| 欧美熟妇另类久久久久久不卡| 欧美噜噜久久久XXX|