• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            學著站在巨人的肩膀上

            金融數學,InformationSearch,Compiler,OS,

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              12 隨筆 :: 0 文章 :: 8 評論 :: 0 Trackbacks

            通過前面的三篇文章相信你已經對神秘的搜索引擎有了一個感性的認識,和普通的php類似的腳本語言服務器類似,通過獲取前臺關鍵字,通過字典分詞,和事先建立建立好的倒排索引進行相關性分析,得出查詢結構格式化輸出結果。而這里的技術難點在于

            1、字典的選取(事實上根據不同時代不同地方人們的語言習慣是不一樣的所以說字典的最小元的取值是不同的)

            2、倒排索引的建立(這里就要涉及到爬蟲的抓取和索引的建立后面將重點介紹這2點,搜索引擎的效率和服務質量實效性瓶頸在這里)

            3、相關性分析(對抓回來的文檔分詞建索引和用戶關鍵字分詞算法上要對應)

            后面文章會重點介紹爬蟲的抓取和索引的建立。

            posted on 2009-12-10 22:54 學者站在巨人的肩膀上 閱讀(1002) 評論(0)  編輯 收藏 引用 所屬分類: 中文文本信息處理
            99久久国产综合精品麻豆| 久久九九久精品国产免费直播| 久久亚洲精品国产精品| 久久国产热精品波多野结衣AV| 久久亚洲国产午夜精品理论片| 亚洲国产精品综合久久网络| 久久精品毛片免费观看| 欧美激情精品久久久久久久九九九 | 久久激情亚洲精品无码?V| 伊人久久国产免费观看视频| 精品无码久久久久久尤物| 国産精品久久久久久久| 久久精品人人做人人妻人人玩| 久久国产成人亚洲精品影院| 97久久超碰成人精品网站| 区久久AAA片69亚洲| 精品无码久久久久久久久久| www久久久天天com| 无码伊人66久久大杳蕉网站谷歌| 久久婷婷色综合一区二区| 91久久成人免费| 久久亚洲精品国产精品| 久久人与动人物a级毛片| 国产综合免费精品久久久| 999久久久国产精品| 99久久这里只有精品| 久久99精品久久久久子伦| 亚洲第一极品精品无码久久| 久久久久亚洲国产| 久久综合亚洲色HEZYO社区| 综合久久给合久久狠狠狠97色| 精品人妻伦九区久久AAA片69| 99久久精品国产综合一区| 久久国产高清字幕中文| 青青草原综合久久| 精品久久人人妻人人做精品| A级毛片无码久久精品免费| 国产精品一区二区久久精品无码| 66精品综合久久久久久久| 国产精品成人久久久久三级午夜电影| 久久久久久久尹人综合网亚洲 |