• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過url連接到http服務(wù)器了,然后發(fā)送一個"GET url \n"的請求才能下載網(wǎng)頁. 之后就是分析網(wǎng)頁,比如辨認超鏈接和搜索關(guān)鍵詞.

            就是GET 這個東西搞不懂, 有的網(wǎng)頁需要給完整的url, 有的只需要相對路徑才正確. 怎么才能自動知道需要哪個啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1860) 評論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 14:51 by XTSHMF
            兩個都試試阿,哪個行就哪個貝,嘿嘿

            # re: 網(wǎng)頁抓取的程序  回復(fù)  更多評論   

            2007-08-11 15:14 by ken
            怎么判斷哪個行,哪個不行? 有的兩個都不行,比如google.com
            日本强好片久久久久久AAA | 国产免费久久精品丫丫| 国产99久久精品一区二区| 国产精品午夜久久| 亚洲成av人片不卡无码久久| 久久精品天天中文字幕人妻 | 久久久久波多野结衣高潮| 欧美一区二区三区久久综| 久久99精品久久久久久久不卡| 午夜精品久久久内射近拍高清| 成人久久免费网站| 中文字幕无码久久久| 久久国产成人午夜aⅴ影院 | 青春久久| 免费国产99久久久香蕉| 亚洲精品白浆高清久久久久久| 久久久精品无码专区不卡| 日本免费久久久久久久网站| 久久99热这里只频精品6| 久久91精品国产91| 国产女人aaa级久久久级| 成人久久久观看免费毛片| 久久久无码精品亚洲日韩京东传媒 | 久久久国产精品网站| 亚洲中文久久精品无码ww16| 亚洲欧美日韩精品久久亚洲区| 51久久夜色精品国产| 91精品国产91久久久久久| 久久综合综合久久综合| 精品国产日韩久久亚洲| 天堂无码久久综合东京热| 久久久99精品成人片中文字幕| 91精品国产综合久久四虎久久无码一级| 新狼窝色AV性久久久久久| 久久丫忘忧草产品| 99蜜桃臀久久久欧美精品网站 | 午夜精品久久久久久中宇| 久久亚洲sm情趣捆绑调教| 18禁黄久久久AAA片| 久久久久久国产精品无码下载| 亚洲国产香蕉人人爽成AV片久久|