• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            本打算做一個(gè)網(wǎng)絡(luò)爬蟲(crawler)的,但水平有限只做了基本的一些功能. 思路: 肯定是要能先通過(guò)url連接到http服務(wù)器了,然后發(fā)送一個(gè)"GET url \n"的請(qǐng)求才能下載網(wǎng)頁(yè). 之后就是分析網(wǎng)頁(yè),比如辨認(rèn)超鏈接和搜索關(guān)鍵詞.

            就是GET 這個(gè)東西搞不懂, 有的網(wǎng)頁(yè)需要給完整的url, 有的只需要相對(duì)路徑才正確. 怎么才能自動(dòng)知道需要哪個(gè)啊?


            source: http://m.shnenglu.com/Files/tompson/getwebpage.rar
            (寫的很爛, 供學(xué)習(xí)網(wǎng)絡(luò)編程的同學(xué)參考)
            Posted on 2007-08-11 14:45 ken 閱讀(1854) 評(píng)論(2)  編輯 收藏 引用 所屬分類: program

            Feedback

            # re: 網(wǎng)頁(yè)抓取的程序  回復(fù)  更多評(píng)論   

            2007-08-11 14:51 by XTSHMF
            兩個(gè)都試試阿,哪個(gè)行就哪個(gè)貝,嘿嘿

            # re: 網(wǎng)頁(yè)抓取的程序  回復(fù)  更多評(píng)論   

            2007-08-11 15:14 by ken
            怎么判斷哪個(gè)行,哪個(gè)不行? 有的兩個(gè)都不行,比如google.com

            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            精品久久久久久国产免费了| 欧美激情一区二区久久久| 久久久免费精品re6| 精品久久人人爽天天玩人人妻| 伊人久久无码精品中文字幕| 亚洲午夜久久久久妓女影院| 久久国产乱子伦精品免费强| 亚洲国产日韩综合久久精品| 国内精品伊人久久久久AV影院| 人妻无码αv中文字幕久久| 久久精品国产精品亚洲精品 | 麻豆av久久av盛宴av| 久久综合给合久久国产免费| 久久成人国产精品一区二区| 少妇精品久久久一区二区三区| 久久精品国产一区二区三区| 亚洲精品乱码久久久久久自慰| 精品久久久久久无码免费| 久久综合国产乱子伦精品免费| 色综合久久88色综合天天 | 好久久免费视频高清| 久久精品国产欧美日韩99热| 亚洲国产成人久久综合一| 亚洲va中文字幕无码久久 | 久久精品国产亚洲AV麻豆网站| 久久综合色区| 国产精品欧美久久久久无广告| 久久久久久毛片免费播放| 久久成人国产精品免费软件| 久久久精品久久久久久| 99久久国产主播综合精品| 99精品久久久久中文字幕| 久久久久久精品无码人妻| 久久久艹| 四虎影视久久久免费| 久久无码精品一区二区三区| 久久精品亚洲乱码伦伦中文| 久久国产影院| 亚洲精品高清一二区久久| 综合久久一区二区三区 | 久久精品国产99国产精品亚洲 |