Nick9Gu
posted on 2009-06-06 12:00 Nick9Gu 閱讀(1629) 評論(5) 編輯 收藏 引用 所屬分類: {IR-NLP-Data Mining} 、{論文看看看}
看看SIGHAN的論文吧! 回復 更多評論
是哪幾篇文章,能給出處嗎? 回復 更多評論
你的描述中都沒有涉及到特征的選取,更沒有涉及模型。而這兩個方面對于現在的概率分詞是關鍵中的關鍵。至于第二個問題,如果滿足一階馬爾可夫性質,都可以使用Viterbi解碼,解碼的復雜度是O(nk^2),這里n是句子的長度,對于簡單的分詞為2(當然可以更大)。SIGHAN的論文可以在網上找到。 回復 更多評論
http://aclweb.org/anthology-new/sighan.html 回復 更多評論
@argmax對,最近都在看,只是還沒更新上去,呵呵~那篇論文相對早的了,沒太復雜。 回復 更多評論