Posted on 2005-12-16 17:26
inwind 閱讀(74)
評論(0) 編輯 收藏 引用
今天又開了一下午的會議,boss提出了一個很新穎的想法
因為當前的分類和聚類的實驗,都是基于封閉或者半封閉的數據集,并且數據集是比較規整的,在向量空間上是不均勻的,即有利于劃分的。
雖然,特征提取就是為了選擇可以劃分的向量,但是考慮到網絡上的海量數據,測驗的結果和封閉測試的可能懸殊很大。
基于這樣的考慮,考慮使用多個分類或者聚類策略(這里使用策略一詞,包括不同的特征選擇策略的側重,例如地點,時間等,也包括分類/聚類算法的選擇,M-ray策略的選擇等等),最后把每個分類/聚類算法的結果,以向量的形式給出,聯成一個新的大向量,然后依次作分類/聚類。
這種思想是很新鮮的,但是,同樣,當前的分類,聚類算法,比較復雜的也有將各種特征,進行分別提取和不同權值,產生了不錯的效果。兩種策略的比較,還需要實驗來確定哦