• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            WisKeyのLullaby

            huangwei.pro 『我失去了一只臂膀』「就睜開(kāi)了一只眼睛」

              C++博客 :: 首頁(yè) :: 聯(lián)系 :: 聚合  :: 管理
              12 Posts :: 0 Stories :: 23 Comments :: 0 Trackbacks

            公告

            “我該走哪條路?”
            “這取決于你要去哪里。”
            “我只想能到某個(gè)地方。”
            “只要你走的夠遠(yuǎn),你始終能到達(dá)那個(gè)地方。”

            Home: huangwei.pro
            E-Mail: sir.huangwei [at] gmail.com
            09.6 畢業(yè)于杭州電子科技大學(xué)
            進(jìn)入網(wǎng)易杭州研究院工作至今

            常用鏈接

            留言簿(1)

            我參與的團(tuán)隊(duì)

            搜索

            •  

            積分與排名

            • 積分 - 51538
            • 排名 - 445

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            http://blog.huang-wei.com/2010/07/20/%e5%8f%8c%e6%95%b0%e7%bb%84%e5%ad%97%e5%85%b8%e6%a0%91%e7%9a%84%e5%86%85%e5%ad%98%e5%8d%a0%e7%94%a8%e6%b5%8b%e8%af%95/

            上一篇文章介紹了雙數(shù)組字典樹(shù) DATrie,現(xiàn)在讓我們來(lái)簡(jiǎn)單的測(cè)試下內(nèi)存占用情況。

            測(cè)試用例,我選了The Holy Bible,數(shù)據(jù)文件大小為4.2MB。只記錄英文單詞,全部轉(zhuǎn)為小寫(xiě)。

            words : 822,529
            u-words : 12,591
            nodes : 34,266
            trie-mem : 1,247,308
            datrie-mem : 483,376

            Trie的實(shí)現(xiàn)我已經(jīng)做了一些優(yōu)化,初始每個(gè)節(jié)點(diǎn)的指針數(shù)組 size 為0,當(dāng)有節(jié)點(diǎn)插入時(shí),再開(kāi) max(size, char) 大小的數(shù)組。trie-mem 顯示的是已經(jīng)除去節(jié)點(diǎn)自身的大小,即該數(shù)值體現(xiàn)的是申請(qǐng)的指針數(shù)組總大小。

            trie-mem / ptr-size / nodes = 9.1,說(shuō)明平均每個(gè)節(jié)點(diǎn)(內(nèi)節(jié)點(diǎn)+葉節(jié)點(diǎn))分配了9.1個(gè)指針。相對(duì)完全Trie樹(shù)而言,已經(jīng)節(jié)省了很多空間了。但這樣算浪費(fèi)的量明顯是不夠精確的,nodes 應(yīng)該換成內(nèi)節(jié)點(diǎn)數(shù)(這里就用 u-words 代替葉節(jié)點(diǎn),雖然兩者是不等同的),因?yàn)槿~節(jié)點(diǎn)未分配指針數(shù)組,并應(yīng)該減去真正有用的轉(zhuǎn)移邊。這個(gè)浪費(fèi)的值應(yīng)該是 (trie-mem / ptr-size – nodes) / (nodes – u-words) = 12.8。

            DATrie的浪費(fèi)值應(yīng)該是 (datrie-mem / (2 * int-size) – nodes) / (nodes – u-words) – 1 = 1.2,可見(jiàn) DATrie 的空間復(fù)雜度還是相當(dāng)不錯(cuò)的。當(dāng)然DATrie的實(shí)現(xiàn)我還沒(méi)有進(jìn)行深入的優(yōu)化,基本就是上一篇文章里的代碼做的測(cè)試。如果按那文章里提到的優(yōu)化方法繼續(xù)優(yōu)化,空間的浪費(fèi)值會(huì)更低。

            但DATrie存在一個(gè)比較大的問(wèn)題,就是它的空間是預(yù)先申請(qǐng)好的,因?yàn)楦緹o(wú)從得出它實(shí)際的大小,如果空間不夠大了再重新分配的話(huà),那勢(shì)必又得消耗時(shí)間,而且還是無(wú)法解決空間是否足夠的問(wèn)題。另外,附加的信息域最好保存為指針的形式,否則重排時(shí)復(fù)制的復(fù)雜度就可能會(huì)很高。

            總結(jié),DATrie還是比較適合在工程中應(yīng)用,尤其對(duì)于數(shù)據(jù)集比較固定的。

            posted on 2010-07-23 08:52 威士忌 閱讀(1037) 評(píng)論(0)  編輯 收藏 引用

            只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            精品久久人人妻人人做精品| 精品乱码久久久久久久| 久久精品中文字幕第23页| 国产精品久久亚洲不卡动漫| 久久国产精品77777| 欧美粉嫩小泬久久久久久久 | 日本亚洲色大成网站WWW久久| 久久人妻少妇嫩草AV蜜桃| 欧洲人妻丰满av无码久久不卡 | 亚洲精品99久久久久中文字幕| 中文字幕无码久久精品青草| 国内精品久久久久| 国内精品综合久久久40p| 伊人久久大香线蕉精品| 久久久久久久久无码精品亚洲日韩 | 久久国产精品偷99| 欧美熟妇另类久久久久久不卡| 观看 国产综合久久久久鬼色 欧美 亚洲 一区二区 | 亚洲精品乱码久久久久久蜜桃| 久久久久久久综合狠狠综合| 久久久久久国产精品无码超碰| 久久久精品久久久久久 | 精品久久亚洲中文无码| 国产A级毛片久久久精品毛片| 亚洲女久久久噜噜噜熟女| 伊人久久大香线焦综合四虎| 久久精品无码午夜福利理论片| 久久国产欧美日韩精品免费| 久久99精品久久久久久野外| 99久久综合狠狠综合久久止| 久久人人爽人人爽人人AV东京热| 无码任你躁久久久久久| 久久国产三级无码一区二区| 国产巨作麻豆欧美亚洲综合久久 | 韩国三级大全久久网站| 国产麻豆精品久久一二三| 一本色道久久88精品综合 | 国产一级做a爰片久久毛片| 久久99精品国产自在现线小黄鸭| 亚洲国产另类久久久精品黑人 | 亚洲午夜久久久影院伊人|