• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 6, 文章 - 0, 評論 - 24, 引用 - 0
            數(shù)據(jù)加載中……

            Trie—單詞查找樹

             

            Trie—單詞查找樹

            l  簡介

            Trie又稱單詞查找樹、前綴樹,是一種哈希樹的變種。應用于字符串的統(tǒng)計與排序,經(jīng)常被搜索引擎系統(tǒng)用于文本詞頻統(tǒng)計。

            含有單詞“tea”“tree”“A”“ZSU”的一棵Trie

            l  性質

            n  根節(jié)點不包含字符,除根節(jié)點外的每一個節(jié)點都只包含一個字符。

            n  從根節(jié)點到某一節(jié)點,路徑上經(jīng)過的字符連接起來,為該節(jié)點對應的字符串。

            n  每個節(jié)點的所有子節(jié)點包含的字符都不相同。

            l  優(yōu)點

            n  查詢快。對于長度為m的鍵值,最壞情況下只需花費O(m)的時間;而BST最壞情況下需要O(m log n)的時間。

            n  當存儲大量字符串時,Trie耗費的空間較少。因為鍵值并非顯式存儲的,而是與其他鍵值共享子串。

            n  Trie適用于“最長前綴匹配”。

            l  操作

            n  初始化或清空

            遍歷Trie,刪除所有節(jié)點,只保留根節(jié)點。

            n  插入字符串

            1.     設置當前節(jié)點根節(jié)點,設置當前字符為插入字符串中的首個字符;

            2.     當前節(jié)點的子節(jié)點上搜索當前字符,若存在,則將當前節(jié)點設為值為當前字符的子節(jié)點;否則新建一個值為當前字符的子節(jié)點,并將當前結點設置為新創(chuàng)建的節(jié)點。.

            3.     當前字符設置為串中的下個字符,若當前字符0,則結束;否則轉2.

            n  查找字符串

            搜索過程與插入操作類似,當字符找不到匹配時返回假;若全部字符都存在匹配,判斷最終停留的節(jié)點是否為樹葉,若是,則返回真,否則返回假。

            n  刪除字符串

            首先查找該字符串,邊查詢邊將經(jīng)過的節(jié)點壓棧,若找不到,則返回假;否則依次判斷棧頂節(jié)點是否為樹葉,若是則刪除該節(jié)點,否則返回真。

            l 實現(xiàn)
            對于字符表大小為S的字符串集,需建立一個S叉樹來代表這些字符串的集合。

            l  代碼

            trie.h


            l  參考資料

            英文維基 http://en.wikipedia.org/wiki/Trie

            中文維基 http://zh.wikipedia.org/w/index.php?title=Trie&variant=zh-cn

            posted on 2009-03-27 23:51 yuyang7 閱讀(5296) 評論(5)  編輯 收藏 引用 所屬分類: 數(shù)據(jù)結構

            評論

            # re: Trie—單詞查找樹  回復  更多評論   

            好,不錯,呵呵
            2009-03-28 15:55 | 中國福利彩票

            # re: Trie—單詞查找樹  回復  更多評論   

            如果想在磁盤上存儲Trie可以嘛?也許用數(shù)組實現(xiàn)?
            比如說詞典的應用。用只讀的Trie存儲詞典索引,每個節(jié)點保存數(shù)據(jù)文件的文件偏移量。要求可以直接從磁盤上用file mapping使用詞典索引。
            2009-03-28 22:27 | lxu

            # re: Trie—單詞查找樹  回復  更多評論   

            @lxu
            嗯,構造雙數(shù)組trie (Double-Array Trie)。
            2009-03-28 23:26 | yuyang7

            # re: Trie—單詞查找樹  回復  更多評論   

            謝謝,學到東西了。
            不過覺得博主的代碼可以優(yōu)化下,重復代碼的地方太多。

            比如說insert的C風格部分,我覺得可以改成,

            void insert(const char* str)
            {
            int size = strlen(str);
            insert<char*>(str, str + size);
            }
            ====================================
            這樣子可以減少重復代碼的部分,而且也方便以后修改嘛。

            另外,貌似memset(child, 0, sizeof(child))應該改成memset(child, 0, size * sizeof(child))
            2009-03-31 00:04 | 黃宇

            # re: Trie—單詞查找樹[未登錄]  回復  更多評論   

            同意樓上的第一點意見,實際上我是先實現(xiàn)了針對C風格字符串的函數(shù),后來覺得有需要對一段區(qū)間內的字符進行查找,才添加了針對迭代器的函數(shù),造成了代碼冗余.
            第二點意見我并不認同,可能樓上理解偏差了.可能樓上是想說 memset(child, 0, size * sizeof(tree_node<size>*)  的吧.
            2009-03-31 11:32 | yuyang7
            久久婷婷五月综合成人D啪 | 成人综合伊人五月婷久久| 国产精品99久久久久久猫咪| 午夜精品久久久久久中宇| 久久影院午夜理论片无码 | 精品综合久久久久久97| 久久久99精品成人片中文字幕| 狠狠色丁香婷婷久久综合不卡 | 日韩人妻无码精品久久免费一| 久久青青草视频| 精品国产日韩久久亚洲| 热久久最新网站获取| 久久人与动人物a级毛片| 久久精品无码一区二区WWW| 久久亚洲国产精品成人AV秋霞| 欧美日韩精品久久久免费观看| 伊人久久大香线蕉亚洲| 色偷偷久久一区二区三区| 99久久99久久精品免费看蜜桃| 久久er国产精品免费观看2| 国产精品午夜久久| 无码人妻久久一区二区三区蜜桃| 欧美久久综合九色综合| 77777亚洲午夜久久多喷| 国产V综合V亚洲欧美久久| 99久久伊人精品综合观看| 免费一级做a爰片久久毛片潮| 久久久久久久女国产乱让韩| 亚洲精品无码专区久久久| 国内精品伊人久久久久| 久久国产成人精品国产成人亚洲| 久久综合色之久久综合| 久久亚洲精精品中文字幕| 91精品国产91久久| 18禁黄久久久AAA片| 国产精品青草久久久久婷婷 | 一本一本久久A久久综合精品| 77777亚洲午夜久久多喷| 久久人妻少妇嫩草AV无码蜜桃| 久久妇女高潮几次MBA| 蜜桃麻豆www久久|