{NLP}最大概率分詞問題及其解法
最大概率分詞問題及其解法,hit的劉挺等,1998
這篇文章前面給出的一些模型對我這個新手來說不錯。后面對問題的解決一般。第一個問題是找分割點,這個很簡單,在找到每個點的最遠距離后,O(n)掃一遍就可以了。
第二個問題是每個字段內的最優概率計算。這個如果按原有的概率算比較難,n-gram的n不確定,不過他這里用的是unigram
這樣就簡單多了。。取log以后最短路,dp啥的愛咋搞咋搞。
posted on 2009-06-06 12:00 Nick9Gu 閱讀(1652) 評論(5) 編輯 收藏 引用 所屬分類: {IR-NLP-Data Mining} 、{論文看看看}

