• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 7,  comments - 64,  trackbacks - 0
            大學(xué)畢業(yè)了!!上來感嘆一下!并拿出自己的畢業(yè)設(shè)計(jì)分享一下。
            這個(gè)小東西是用了一個(gè)星期完成的。BUG肯定不少,大家湊合著看一下吧。感覺有趣的就拿去玩玩。
            說說基本思路。
            1.對文件進(jìn)行分詞處理
            2.通過統(tǒng)計(jì)訓(xùn)練文檔當(dāng)中的詞頻方差,構(gòu)造評判矩陣
            3.之后在構(gòu)造待分類文檔的評判向量
            4.用評判向量和構(gòu)造矩陣相乘,選出最接近的分類。
            具體地方法大家可以參考一下這篇論文:《基于模糊理論的網(wǎng)頁過濾算法的實(shí)現(xiàn)》
            上圖:

                                                主界面

                                             結(jié)果文件

             訓(xùn)練文檔的目錄結(jié)構(gòu)

            程序文件:
             http://www.namipan.com/d/db9717e2153a1bc504dc597fee9ac32e92b428fcc4fe3900

            其實(shí)正確率還可以進(jìn)一步提高的。以后有興趣的時(shí)候再來重寫一下這個(gè)程序吧。



            總結(jié):
            我盡力優(yōu)化了這個(gè)程序的速度。但還是不理想。
            ICTCLAS分詞系統(tǒng)的效率低是其中一個(gè)重要原因。
            我使用了stlsoft中的aoto_buffer來優(yōu)化內(nèi)存的分配。
            使所有的string在內(nèi)存當(dāng)中只存在一份拷貝。
            map和vector容器永遠(yuǎn)只存放string*

            無法解決的問題:
            我想在一個(gè)double數(shù)組中存放1/N,2/N,3/N......N/N,以便后來使用。
            我覺得這些常量應(yīng)當(dāng)能在編譯時(shí)期確定。但是不知道如何通過定義宏來表示這些數(shù)值。
            搞的我最后不得不啟動(dòng)一個(gè)線程來專門計(jì)算這些值。

            有興趣的郵件聯(lián)系啊~!
            posted on 2009-06-12 21:38 HIT@ME 閱讀(1409) 評論(2)  編輯 收藏 引用

            FeedBack:
            # re: 非法信息識別系統(tǒng)
            2009-06-12 23:27 | unnamed
            還以為是源代碼,結(jié)果是執(zhí)行程序。  回復(fù)  更多評論
              
            # re: 非法信息識別系統(tǒng)
            2009-06-13 07:18 | YZY
            double數(shù)組既然是靜態(tài)的為什么還要用一個(gè)線程來計(jì)算這些值啊?
            直接計(jì)算或者從文本文件中讀取不就可以了?  回復(fù)  更多評論
              
            <2009年6月>
            31123456
            78910111213
            14151617181920
            21222324252627
            2829301234
            567891011

            常用鏈接

            留言簿(5)

            隨筆檔案

            test

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

            国产亚洲成人久久| 国产成人AV综合久久| 色偷偷88欧美精品久久久| 久久久国产精品| 久久精品国产99国产精品亚洲| 久久国产AVJUST麻豆| 亚洲欧美日韩中文久久| 91秦先生久久久久久久| 色狠狠久久综合网| 久久噜噜电影你懂的| 亚洲伊人久久综合中文成人网| 无码伊人66久久大杳蕉网站谷歌| 99麻豆久久久国产精品免费 | 91精品国产9l久久久久| 久久久久久av无码免费看大片| 久久久久久久波多野结衣高潮| 亚洲国产成人久久综合碰碰动漫3d| 亚洲中文字幕伊人久久无码| 欧美一区二区精品久久| 伊人久久大香线蕉AV色婷婷色 | 久久亚洲av无码精品浪潮| 久久久久久九九99精品| 日韩中文久久| 精品水蜜桃久久久久久久| 久久精品国产亚洲AV无码娇色 | 久久亚洲AV无码西西人体| www久久久天天com| 亚洲日韩中文无码久久| 亚洲人成无码网站久久99热国产 | 欧美国产成人久久精品| 国产综合免费精品久久久| 国产精品久久久久aaaa| 伊人久久大香线蕉亚洲五月天| 一本色道久久综合| 久久久久人妻一区精品果冻| 色偷偷888欧美精品久久久| 久久精品黄AA片一区二区三区| 无码人妻久久一区二区三区免费丨| 色青青草原桃花久久综合| 亚洲国产精品无码久久九九| 久久成人精品|