• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 79  文章 - 58  trackbacks - 0
            <2008年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            常用鏈接

            留言簿(9)

            隨筆分類

            隨筆檔案

            文章檔案

            相冊

            搜索

            •  

            積分與排名

            • 積分 - 295931
            • 排名 - 87

            最新評論

            閱讀排行榜

            評論排行榜

            網絡上關于增量搜集網頁的資料比較少,可能還不成熟的原因。
            偶有所感啊。。。。

            獲取url之后,存放在visittable中,并保存本次的指紋信息。

            需要根據它的重要程度,初步估算一個搜集間隔。
            當到達下次搜集時間,則搜集它,這個時候,根據上下兩次的

            指紋,判斷是否有網頁是否有變化,以調整搜集間隔。
            舉例:第一次間隔10天,10天后搜集發現有變化,則調整間隔為5天。 

            5天后搜集發現無變化,則調整間隔為7.5天,以得到一個差不多的值。

            網站的重要程度也是一個方面,比如專門搜索mp3的搜索引擎,可以把
            根本沒有mp3的網站列入無效網站,把mp3較多的網站列為專業網站,
            縮小搜索間隔。

            visittable表結構:

            URLCode URL nextTime interval preInterval finger

            posted on 2008-05-22 22:23 merlinfang 閱讀(387) 評論(0)  編輯 收藏 引用 所屬分類: 搜索引擎
            国产产无码乱码精品久久鸭| 精品久久久久久99人妻| 亚洲伊人久久成综合人影院 | 色播久久人人爽人人爽人人片aV| 久久www免费人成精品香蕉| 国产精品99久久久精品无码| 久久精品a亚洲国产v高清不卡| 精品国产福利久久久| 伊人伊成久久人综合网777| 久久久久女人精品毛片| 思思久久好好热精品国产| 好久久免费视频高清| 欧美日韩精品久久久免费观看| 久久线看观看精品香蕉国产| 人妻少妇久久中文字幕| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区 | 日本精品久久久久中文字幕| 欧美日韩精品久久免费| 国产激情久久久久影院| 久久精品?ⅴ无码中文字幕| 国产一级做a爰片久久毛片| 日日躁夜夜躁狠狠久久AV| 欧美粉嫩小泬久久久久久久| 久久99国产精品尤物| 亚洲AV无一区二区三区久久| 国内精品伊人久久久久妇| 国产精品久久久久一区二区三区| 国产精品免费看久久久| 久久99精品久久久久久久不卡 | 国产色综合久久无码有码| 亚洲精品高清一二区久久| 久久99精品国产麻豆婷婷| 国产精品美女久久久免费| 一级做a爱片久久毛片| 嫩草影院久久99| 精品久久久久久亚洲精品| AV狠狠色丁香婷婷综合久久| 三上悠亚久久精品| 国产精品久久久久无码av| 久久91亚洲人成电影网站| 国产精品伦理久久久久久|