• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            關于系統架構的思考

            Posted on 2005-12-12 18:31 inwind 閱讀(135) 評論(0)  編輯 收藏 引用
            我們要做的是,發現網絡熱點,跟蹤輿情,并且給與預測。同時,要求能夠對指定的文檔集進行處理,過濾。
               基本過程和xj的差不多,幾個有待商榷問題:
            1 夏博士所說,軟件架構,接口一定要實現定義良好,并且不能被修改,保證以后的更新,維護方便。
            2 數據的結構:參考網站分類的一到三級,先將數據分類,再進行聚類,發現新事件,主題(聚類的過程也是分層的,通過調整閾值)
               對于新發現的事件,使用分類算法來跟蹤
            為什么不能直接聚類完成發現和跟蹤的任務?考慮,如果直接聚類,不容易保證事件的穩定性,同時,計算復雜度較高,不宜控制聚類的數目。難以實現實時跟蹤。——及時發現,實時跟蹤。

            3 對于分類的初步打算:
                  網站抓新聞
                  提取相干tag樹,去除噪音
                  分詞
                  對于一些高亮數據進行標記
                  特征提取(CHI)
                  向量化(tf/idf)
                  kNN
                  RTCut
                  
                  
            国产精品免费久久| 综合久久久久久中文字幕亚洲国产国产综合一区首| 欧美精品一区二区久久| 久久国产香蕉视频| 久久精品国产99国产精品亚洲| 日日躁夜夜躁狠狠久久AV| 91精品国产91热久久久久福利| 久久伊人色| 狠狠色丁香久久婷婷综合五月| 日韩一区二区三区视频久久| 亚洲精品乱码久久久久久按摩| 精品久久久久久国产| 久久精品免费全国观看国产| 久久国产精品99久久久久久老狼| 一级做a爰片久久毛片免费陪 | 久久伊人精品青青草原高清| 午夜福利91久久福利| 精品午夜久久福利大片| 久久久久久久精品妇女99| 九九久久精品国产| 99久久精品免费国产大片| 精品国产乱码久久久久久呢| 久久青青草原亚洲av无码| 狠色狠色狠狠色综合久久| 亚洲国产另类久久久精品小说| 热久久国产欧美一区二区精品| 国产精品久久久久久福利69堂| 欧美噜噜久久久XXX| 中文无码久久精品| 亚洲精品午夜国产VA久久成人| 2020久久精品亚洲热综合一本| 国产精品美女久久久网AV| 办公室久久精品| 国产—久久香蕉国产线看观看| 97久久精品无码一区二区天美| 久久久久久久久久久久中文字幕| 一本色道久久99一综合| 久久婷婷五月综合97色一本一本 | 无码人妻久久一区二区三区免费丨 | 久久久黄片| 免费一级欧美大片久久网 |