• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

            最短摘要的生成

            這個問題在《編程之美》中提到過。前幾天百度三面的時候也問到了這個問題,當時沒有答上來。從新翻閱了一下《編程之美》。
            直觀的解決方案是:
            從文檔第一個詞開始遍歷,尋找后面的詞是否與關鍵詞數組匹配
            然后從文檔第二個、第三個 ... 一直到最后一個詞遍歷

            這個過程要記錄最短文摘的信息。
            這個時間復雜度是 O(N ^ 2 * M)
            N 是文檔的長度
            M 是關鍵詞數組的大小

            改進的方法是:
            對于求的的一個文摘,記錄第一次出現關鍵詞的位置,然后直接移動到該關鍵詞,然后右邊的邊界再向后移動。
            這個時間復雜度是 O(N)
            這種方法也就是說維持了一個摘要滑動窗口,一遍掃描文檔即可得到相應的最短摘要。
            摘要中的關鍵詞可以用一個隊列來存儲,因為摘要滑動窗口的左邊界和右邊界都是要從左到右移動的。所以隊列正好適用。另外還應該維持一個對應文摘滑動窗口中的關鍵詞出現的次數表。在做左右邊界移動時需要考量這個次數表所提供的信息。

            posted on 2011-07-03 20:34 unixfy 閱讀(1087) 評論(0)  編輯 收藏 引用
            久久久久久久97| 久久受www免费人成_看片中文 | 中文字幕久久波多野结衣av| 精品久久久久久国产三级| 国产国产成人精品久久| 久久久久人妻一区精品色| 久久狠狠爱亚洲综合影院 | 99久久精品免费国产大片| 777米奇久久最新地址| 久久国产高潮流白浆免费观看| 波多野结衣AV无码久久一区| 一本一道久久综合狠狠老| 久久伊人精品一区二区三区| 日本精品久久久久影院日本| 日本精品久久久久久久久免费| 婷婷国产天堂久久综合五月| 一级女性全黄久久生活片免费| 日本WV一本一道久久香蕉| 亚洲精品乱码久久久久久按摩| 欧美大香线蕉线伊人久久| 国产成人久久精品一区二区三区| 狠狠色噜噜狠狠狠狠狠色综合久久 | 91亚洲国产成人久久精品网址 | 午夜精品久久久久久影视777| 麻豆国内精品久久久久久| 久久久久亚洲av成人网人人软件| 亚洲国产精品嫩草影院久久| 亚洲香蕉网久久综合影视| 久久电影网2021| 国产精品99久久久久久宅男小说| 亚洲∧v久久久无码精品| 中文字幕亚洲综合久久2| 国产精品久久久久久五月尺| 国产美女久久精品香蕉69| 久久天天躁狠狠躁夜夜2020| 久久久久99精品成人片试看| 精品国产综合区久久久久久| 欧美一区二区三区久久综合| 久久性精品| 青青草国产成人久久91网| 久久国产欧美日韩精品|