• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            那誰的技術博客

            感興趣領域:高性能服務器編程,存儲,算法,Linux內核
            隨筆 - 210, 文章 - 0, 評論 - 1183, 引用 - 0
            數據加載中……

            前綴匹配問題與trie樹

            前綴匹配問題就是類似于你在某個輸入框中輸入某個字符串, 根據你的輸入猜測你要輸入的字符串, 比如說, 今天在我的firefox搜索欄里面搜索了"lighttpd"這個關鍵字, 當我再次輸入"ligh"的時候, 輸入框有一個下拉列表提示我"lighttpd".或者, 類似輸入法中的智能聯想, 輸入前面幾個字符聯想以其為前綴的其它詞組.這些都是前綴匹配技術的典型應用場合.

            為了簡單起見, 我們下面的講述假設你所查找的字符串都是由小寫英文字母組成的.

            前綴匹配問題最自然的想法就是采用樹, 我最開始的考慮是采用一個二叉樹, 根據字典順序排列來進行搜索.但是這個想法有一些問題, 比如"lighttpd"這個字符串, 在我匹配了最前面的"li"之后去搜索字符"g"的時候, 中間可能要跳躍過由字典順序排在'g'之前的字符, 比如'a','b'等等.也就是說, 根據前綴"li"去查找"lig"的時候, 我們不能馬上定位到"lig"的位置, 或者說, 這樣的定位不是O(1)的, 需要O(log2(n))次, 其中n為你所查找的字符距離字符'a'的距離.

            為了解決這個問題, trie樹采用了另一種解決辦法, trie樹中每個節點擁有一個數組, 這個數組的數量是所有可能出現的字符的數量, 基于前面的假設這里提到的字符串全部由小寫字母組成, 那么就是26個元素,而數組的下標是按照字典排序距離字母'a'的距離:
            const int num_chars = 2;
            struct Trie_node
            {
                char* data;
                Trie_node* branch[num_chars];
                Trie_node();
            };
            假設要搜索前綴'l'開始的字符串, 那么以'a'為前綴的所有字符串的根節點就是root->branch['l' - 'a'], 其中root是樹的根節點.
            搜索所有以'lg'為前綴的字符串可以類似展開, 其它的搜索前綴也可以同樣展開.

            于是, 前綴匹配問題在trie樹中就可以如下展開:比如要搜索以"li"為前綴的索引, 首先根據前面的算法找到索引為"li"的節點, 則以"li"為前綴的字符串都在以這個節點為根的子節點中.實際情況中, 這樣的子節點可能是很多的, 需要根據情況進行過濾.

            這里不再多闡述trie樹的數據結構, 這里有一份實現源碼和算法說明.

            可以看到, trie樹對于實現查找可變字符串的索引有很高的效率, 如果要查找n個字符組成的字符串, 只需要n次操作.
            同時, trie樹也節省了空間, 比如索引字符串"lig"和"ligh"共享了前面的三個字符.

            其它相關文章:
            http://blog.csdn.net/lwl_ls/archive/2008/05/03/2373069.aspx





            posted on 2008-08-19 23:41 那誰 閱讀(3837) 評論(1)  編輯 收藏 引用 所屬分類: 算法與數據結構

            評論

            # re: 前綴匹配問題與trie樹  回復  更多評論   

            谷歌的前綴匹配好爛,很不方便。
            2008-08-24 16:02 | dell
            久久久久久综合网天天| 亚洲国产精品久久久久婷婷老年| 久久综合五月丁香久久激情| 久久亚洲中文字幕精品一区| 久久精品www人人爽人人| 久久精品亚洲乱码伦伦中文| 亚洲狠狠婷婷综合久久久久| 久久久WWW成人免费毛片| 久久久精品国产免大香伊| 久久本道久久综合伊人| 蜜臀av性久久久久蜜臀aⅴ| 日本精品久久久久久久久免费| 久久婷婷激情综合色综合俺也去| 久久久久这里只有精品| 久久精品国产精品国产精品污| 精品一二三区久久aaa片| 亚洲精品NV久久久久久久久久| 久久综合狠狠综合久久激情 | 久久国产乱子伦免费精品| 亚洲精品WWW久久久久久| 久久久久国产亚洲AV麻豆| 99久久婷婷国产综合精品草原| 久久久一本精品99久久精品88| 伊人久久亚洲综合影院| 亚洲欧洲中文日韩久久AV乱码| 久久精品国产欧美日韩| 久久国产成人午夜AV影院| 国产香蕉97碰碰久久人人| 欧美综合天天夜夜久久| 久久最近最新中文字幕大全 | 久久这里只有精品18| 久久精品国产日本波多野结衣| 思思久久好好热精品国产| 日本亚洲色大成网站WWW久久| 久久精品无码专区免费| 婷婷久久综合| 伊人久久大香线蕉av不变影院| 人人妻久久人人澡人人爽人人精品| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 91精品国产高清91久久久久久| 久久久久久午夜成人影院 |