• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Codejie's C++ Space

            Using C++

            LAC : I hate encoded data.


                昨晚敲好了LAC的Native Dictionary數(shù)據(jù)表, 今天準(zhǔn)備放些數(shù)據(jù)進(jìn)去,又是那么一沖動(dòng)--為什么不直接將Lingoes的數(shù)據(jù)導(dǎo)入進(jìn)去呢?反正早晚要做的.

                于是興沖沖地checkout出Lingoes-Extractor.這個(gè)項(xiàng)目是七八月份中無意間發(fā)現(xiàn)的,很強(qiáng)力,一定程度上破解了Lingoes的LD2格式,有興趣的快去download吧.
             
                在最早做LingosHook時(shí)也不是沒想過破解LD2,只是由于想著LingosHook只是個(gè)單詞本,不是個(gè)詞典,加上通過Hook方式也能獲得數(shù)據(jù),也就沒有去嘗試.現(xiàn)在要增加Native Dictionary,這些數(shù)據(jù)是必需的了,本來想著將前面準(zhǔn)備的(CET4,6)拿來用用就好了,但又覺得是不是有點(diǎn)不專業(yè)啊.于是轉(zhuǎn)而到處找詞典數(shù)據(jù),結(jié)果,結(jié)果就發(fā)現(xiàn)了這個(gè)Lingoes-Extractor項(xiàng)目.驚喜啊,當(dāng)時(shí)就決定直接用Lingoes是數(shù)據(jù)了...

                現(xiàn)在悲劇了...這就是為什么前面說Lingoes-Extractor是'一定程度上'破解了LD2呢?因?yàn)?雖然破解出的數(shù)據(jù)很全部,但很多必要的數(shù)據(jù)無法獲得.比如如下破解后的數(shù)據(jù):
            abut = abuts|abutted|abuttinga·but || ?'b?tv.  鄰接; 緊靠; 毗連

                數(shù)據(jù)顯示了abut單詞的多種表達(dá)式,以及音標(biāo),詞性和解釋,很全面,但問題是--這些數(shù)據(jù)該怎么分隔呢?
                研究了Lingoes-Extractor的源碼,發(fā)現(xiàn)其似乎也沒法分隔這些數(shù)據(jù),只能簡(jiǎn)單地分成'單詞'和'解釋'兩部分.
                
                現(xiàn)在,現(xiàn)在難道要我自己再來破解LD2嗎? 太悲劇了...現(xiàn)在真的么時(shí)間玩破解啊...記得上次破解WOW的WDB文件(有圖有真相...),差點(diǎn)死掉,我恨編碼數(shù)據(jù)!!!


            <---- 燒香的分割線 ---->

                高人啊,你在哪里啊... 唉,明天再好好看看人家的code先...

            posted on 2012-10-16 00:22 codejie 閱讀(1307) 評(píng)論(2)  編輯 收藏 引用 所屬分類: 隨筆而已

            評(píng)論

            # re: LAC : I hate encoded data. 2013-10-26 15:53 librehat

            小的最近在做Linux KDE桌面下的一個(gè)詞典小工具,到目前為止都用的網(wǎng)絡(luò)查詞(走有道、QQ、金山的API)。。。API查詞結(jié)果太「骨感」了,而且只有中英文。

            總算也要杠上LD2這個(gè)文件了,畢竟太多的詞典都是LD2格式的。

            想問問大俠,解開LD2文件有C++的實(shí)現(xiàn)嗎?我對(duì)Java一竅不通……另,如果用javascript實(shí)現(xiàn)的話會(huì)不會(huì)效率很慢(考慮到一個(gè)LD2文件也有個(gè)幾兆)  回復(fù)  更多評(píng)論   

            # re: LAC : I hate encoded data. 2013-10-26 18:08 codejie

            @librehat
            因?yàn)長AC是android應(yīng)用, 所以我也是用JAVA實(shí)現(xiàn)的. 但我覺得Extractor寫的不錯(cuò), 很好看懂的, Port到C++來實(shí)現(xiàn)肯定沒問題的.javascript不熟悉, 效率問題要看你打算怎么利用LD2文件了. 像LAC是先將LD2的索引部分解開, LD2文件僅當(dāng)數(shù)據(jù)使用, 如果你打算直接使用LD2, 那每次都解開索引部分, 怕效率就是大問題了.  回復(fù)  更多評(píng)論   

            公告

            Using C++

            導(dǎo)航

            統(tǒng)計(jì)

            留言簿(73)

            隨筆分類(513)

            積分與排名

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            亚洲中文字幕无码久久综合网| 国产精品嫩草影院久久| 精品久久久无码人妻中文字幕| 国产欧美久久久精品影院| 国产激情久久久久久熟女老人| 无码日韩人妻精品久久蜜桃 | 久久久久一级精品亚洲国产成人综合AV区 | 国产精品久久新婚兰兰| 老色鬼久久亚洲AV综合| 国产免费福利体检区久久| 久久久久久国产精品无码下载 | 亚洲AV日韩精品久久久久| 国产成人久久精品一区二区三区| 夜夜亚洲天天久久| 中文无码久久精品| 免费一级欧美大片久久网| 国产精品久久久久国产A级| 色婷婷噜噜久久国产精品12p| 99久久无色码中文字幕| 亚洲人成无码网站久久99热国产| 久久99热国产这有精品| 囯产精品久久久久久久久蜜桃| 久久久久亚洲AV无码去区首| 久久免费精品视频| 国产精品久久久久jk制服| 囯产极品美女高潮无套久久久 | 久久久久久综合一区中文字幕| 久久精品国产清自在天天线| 久久精品国产91久久综合麻豆自制 | 久久久久久青草大香综合精品| 久久99精品久久久久久久久久| 精品国产乱码久久久久久人妻| 久久久WWW免费人成精品| 久久精品国产免费一区| 久久水蜜桃亚洲av无码精品麻豆| 久久婷婷国产剧情内射白浆| 中文字幕久久亚洲一区| 亚洲欧美久久久久9999| 麻豆精品久久久久久久99蜜桃| 色偷偷91久久综合噜噜噜噜| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区 |