• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            唉,越看越瑣碎

            Posted on 2005-12-07 12:02 inwind 閱讀(287) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 隨想
            網(wǎng)頁(yè)的自動(dòng)分類,需要考慮的東西很多啊。

            分類體系的選擇,利用DDC還是中圖?還是借鑒yahoo或者google的分類體系?分類層次有多深?

            訓(xùn)練文集的選取?哪里來(lái)呢,那么多打好標(biāo)記,并且其分類要與我們的分類相同或者,相似吧

            剛開(kāi)始網(wǎng)頁(yè)的內(nèi)容處理,表示,是否考慮超鏈接,是否考慮html,如何剔出亂其八糟的廣告?

            網(wǎng)頁(yè)向量化,又有那么多種權(quán)值計(jì)算方法,經(jīng)典的就五個(gè)了,還有改進(jìn)的,估計(jì)也有那么五六個(gè)比較好的吧?

            向量的降維,還好那位帥哥整理過(guò)5經(jīng)典的算法,再加上后來(lái)北大那幫人做的實(shí)驗(yàn),經(jīng)典的幾個(gè)里面的性能大多清楚了。可是,是不是還有改進(jìn)的呢?特征提取算法和后面的分類算法組合后的性能參數(shù)呢?

            ok,然后是分類算法,姑且考慮KNN,還要考慮KNN的參數(shù),K=?,文檔之間的距離的計(jì)算,文檔-類得分的的加權(quán)?如何加權(quán)?——還有其他的算法呢?

            分類完了,還有截取算法,某個(gè)文檔可以屬于哪些類?某個(gè)類可以包含哪些文檔?這個(gè)怎么確定?RCut,PCut還是SCut,還有其他的改進(jìn)算法嗎?

            最有,貪心算法在這里面能起作用嗎?即每一步,都利用別人的實(shí)驗(yàn),選擇最好的算法,可是綜合起來(lái),就一定是全局最好的算法嗎?
            久久久久人妻一区二区三区| 老男人久久青草av高清| 亚洲AV日韩精品久久久久久久| 精品国产乱码久久久久久呢| 久久亚洲精品无码AV红樱桃| 国内精品伊人久久久久网站| 色8激情欧美成人久久综合电| 亚洲va国产va天堂va久久| 久久99精品综合国产首页| 日本精品久久久久久久久免费| 少妇高潮惨叫久久久久久| 久久精品国产精品亚洲| 浪潮AV色综合久久天堂| 伊人热热久久原色播放www| 久久久老熟女一区二区三区| 天堂无码久久综合东京热| 久久精品国产亚洲AV电影| 久久久久久久女国产乱让韩| 国产真实乱对白精彩久久| 久久免费的精品国产V∧| 久久亚洲国产精品成人AV秋霞| 99久久成人18免费网站| 国产精品久久久久9999高清| 97香蕉久久夜色精品国产| 人妻无码久久精品| 韩国三级中文字幕hd久久精品 | 26uuu久久五月天| 久久国产亚洲精品无码| 午夜天堂精品久久久久| 亚洲欧洲久久久精品| 亚洲国产成人久久综合碰| 久久久久国产视频电影| 久久精品国产亚洲Aⅴ香蕉| 亚洲精品国产成人99久久| 欧美日韩中文字幕久久伊人| 精品久久香蕉国产线看观看亚洲| 久久国产亚洲高清观看| 久久久久久久尹人综合网亚洲| 99久久精品费精品国产一区二区| 韩国免费A级毛片久久| 久久青青草原综合伊人|