青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆 - 89  文章 - 118  trackbacks - 0
<2012年9月>
2627282930311
2345678
9101112131415
16171819202122
23242526272829
30123456

留言簿(16)

隨筆分類(56)

隨筆檔案(89)

文章分類

推薦博客

搜索

  •  

最新隨筆

最新評論

閱讀排行榜

轉(zhuǎn)自:http://blog.csdn.net/pennyliang/archive/2010/07/07/5717498.aspx

中文分詞方法有很多,其中基于詞典的分詞方法有:
  •     基于模式匹配的方法:(速度快)

                     正向最大匹配、逆向最大匹配法、雙向匹配法

  •      基于規(guī)則的方法:(索引壓縮的效果最好)
                     最少分詞法
     基于統(tǒng)計的分詞方法有:
  •      統(tǒng)計語言模型分詞(2-gram,3-gram)
  •      串頻統(tǒng)計的漢語自動分詞

      除了這些基本的方法,為了獲得最佳的效果,也可以引入動態(tài)規(guī)劃的方法獲得最優(yōu)解。

     設句子P = W0W1W2?Wn , 其中Wi (0≤i≤n) 為句子P中的第i 個漢字。Si(0≤i≤n+1)為句子的第i個間隙(切分位置)

     那么一個句子P理論上有多少種分詞法呢?

     分詞分法總數(shù)的通項:Fn)表示一個有n個單詞的句子包含的全部不同的分詞方法。

     F(n)=1+ F(n-1)+F(n-2)+F(n-3)+F(n-4)+..F(1)

    F(1)=1

    F(2)=2

    F(3)=4

    F(4)=8

     …

    F(n)=2F(n-1)

    則F(n)=2n-1

    如果將詞頻看做是距離,則求解最佳切分方法等價于在2n-1的解空間中尋找1種最佳的切分方法使得路徑最短。為此我們舉個例子:

    早起先刷牙

 

    

 

圖中紅圈為切分點,切分點之間的連線表示確定的一種分詞

圖中給出了三種分法,分別是[][][][][][早起][][刷牙][][起先][刷牙]

假定我們有這樣一個字頻和詞頻表,分別如下

 

              400

早起            100

              500

起先            150

              500

              300

刷牙            100

              500

則以上三種切分法的代價分別為

[][][][][]400+500+500+300+500 = 2200

[早起][][刷牙]100+500+100 = 700

[][起先][刷牙]400+150+100 =750 (此處應為650)

因此選用第2種切分法。

動態(tài)規(guī)劃的偽代碼大致為:

Segment(S,low,high,cost,last)

{

        Mincost = MAX;

        If(high-low<=1)

        {

        mincost = Costof(costL(low,high-low)); //其中L(start,length)的含義表示從start開始從P中取length長度的文本,Costof為該段文本的字頻,或者詞頻,如果不存在則為無窮大;如果cost數(shù)組中已經(jīng)計算過,則不重復計算,直接取值返回。

        cost[low][high] = mincost;

        Return mincost

       }

        fori = low+1 to high

       {

           a = Segment(S,low,i,cost,last);//為了簡單這里做了精簡,事實上如果a返回的是無窮大,則后面不用繼續(xù)計算,直接跳出,因為這種情況下無論如何也不可能是最優(yōu)解,可以直接剪枝。

           b = Segment(S,i,high,cost,last);

           if(a+b<Mincost)

           {

               Mincost = a + b;

               Cost[low][high]=Mincost;

               Last[low][high] = i;//Last記錄最佳切分點

           }

        }

        ExtractSegmentPos(Last,low,high);//該函數(shù)是將切分點一一展開。

}

 

 

 

 ExtractSegmentPos(Last,low,high)

{

     SegPos=MAX;

     if(high-low>1)

     {

          If(Last[low][high]>0)

          {

              SegPos =  Last[low][high]

              output(SegPos);
          }

          else

          { 

               return;

          }

     }

     ExtractSegmentPos(Last,low, SegPos);

     ExtractSegmentPos(Last, SegPos,high);

}


參考文獻

[1] 孫 曉, 黃德根  基于動態(tài)規(guī)劃的最小代價路徑漢語自動分詞   [J]小型微型計算機系統(tǒng)  第27 卷第3 期 2006 年3 月

其他推薦閱讀

http://www.leadbbs.com/MINI/default.asp?230-2682632-0-0-0-0-0-a-.htm

posted on 2010-07-30 09:06 胡滿超 閱讀(777) 評論(0)  編輯 收藏 引用

只有注冊用戶登錄后才能發(fā)表評論。
網(wǎng)站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久电影一区| 一级成人国产| 亚洲午夜免费福利视频| 亚洲精品国产系列| 宅男精品视频| 欧美在线在线| 亚洲免费视频网站| 欧美一区二区国产| 久久蜜桃香蕉精品一区二区三区| 久久亚洲国产精品一区二区| 亚洲国产精品高清久久久| 欧美+日本+国产+在线a∨观看| 欧美va天堂va视频va在线| 亚洲国产精品va在看黑人| 亚洲毛片一区二区| 午夜在线不卡| 欧美精品www在线观看| 欧美三级网页| 在线免费观看日韩欧美| 亚洲网在线观看| 久久久综合免费视频| 日韩午夜精品视频| 久久久亚洲国产美女国产盗摄| 欧美日韩亚洲国产一区| 精品99一区二区三区| 亚洲免费在线观看| 欧美xart系列高清| 亚洲欧美日本日韩| 欧美日韩国产成人在线91| 精品成人在线观看| 国产精品综合| 国产精品爽爽ⅴa在线观看| 国产欧美日韩精品一区| 亚洲欧洲综合另类在线| 欧美一区二区成人6969| 最近中文字幕mv在线一区二区三区四区 | 亚洲视频碰碰| 久久亚洲精品欧美| 国产精品网站一区| 国产精品99久久久久久www| 久久久久久久一区二区| 亚洲香蕉网站| 欧美性感一类影片在线播放| 亚洲日本国产| 欧美aaa级| 久久久噜久噜久久综合| 狠狠色2019综合网| 久久激情综合网| 亚洲一区免费看| 国产精品v欧美精品v日韩精品| 欧美一区二区性| 一本色道久久88亚洲综合88| 国产亚洲美州欧州综合国| 日韩亚洲国产精品| 亚洲欧洲日产国产综合网| 久久亚洲色图| 一区二区三区福利| 欧美国产在线电影| 国产午夜精品美女视频明星a级 | 亚洲青涩在线| 欧美国产日韩精品免费观看| 噜噜噜久久亚洲精品国产品小说| 尤物yw午夜国产精品视频明星| 久久久亚洲欧洲日产国码αv| 国产精品私人影院| 狠狠狠色丁香婷婷综合激情| 欧美黄免费看| 亚洲精品久久久久久久久久久久| 久久精品视频一| 欧美在线黄色| 一区二区三区在线免费视频| 久久亚洲私人国产精品va媚药 | 久久精品国产亚洲精品| 亚洲免费在线观看视频| 国产精品永久入口久久久| 亚洲欧美一区二区精品久久久| 中文av一区特黄| 国产日本欧洲亚洲| 免费在线欧美视频| 欧美国产日产韩国视频| 亚洲一区欧美二区| 欧美一区二区精品在线| 在线观看不卡av| 欧美暴力喷水在线| 欧美jjzz| 久久国产精品高清| 开心色5月久久精品| 亚洲乱码国产乱码精品精| 一级成人国产| 国产精品一二三四区| 国产精品美女久久久久久免费| 最新日韩在线视频| 亚洲黄色在线观看| 国产精品伦一区| 六月婷婷一区| 国产精品美女午夜av| 老牛影视一区二区三区| 欧美全黄视频| 玖玖综合伊人| 国产精品第三页| 欧美不卡视频一区| 国产精品伦理| 亚洲三级视频在线观看| 黄色成人91| 亚洲一区二区动漫| av成人激情| 久久综合久久久久88| 亚洲欧美在线高清| 欧美激情一区在线| 久久久久久久网| 国产精品久久久久高潮| 欧美激情久久久久| 国产婷婷色一区二区三区| 狠狠色狠色综合曰曰| 亚洲一区尤物| 欧美成人午夜激情在线| 久久午夜羞羞影院免费观看| 欧美特黄一级大片| 亚洲电影免费观看高清完整版在线观看| 欧美性大战久久久久| 亚洲人午夜精品免费| 亚洲高清在线观看一区| 欧美一区二区三区视频在线观看| 亚洲一区www| 欧美激情视频免费观看| 欧美黄色免费| 黄色资源网久久资源365| 欧美亚洲视频在线观看| 午夜视黄欧洲亚洲| 国产精品欧美日韩一区| av成人免费在线观看| 亚洲一区激情| 国产精品成人一区二区网站软件| 亚洲精品久久久久久一区二区 | 亚洲影院色在线观看免费| 欧美激情视频在线免费观看 欧美视频免费一| 久久本道综合色狠狠五月| 国产精品一区二区男女羞羞无遮挡| 99re视频这里只有精品| 一区二区三区四区国产精品| 欧美黄色一区| 一区二区免费在线观看| 亚洲欧美成人一区二区在线电影| 国产精品高潮视频| 亚洲一区二区三区四区视频| 欧美在线观看一区二区| 国产亚洲欧美日韩一区二区| 欧美综合77777色婷婷| 麻豆av福利av久久av| 在线成人av| 欧美黄免费看| 亚洲一区在线观看视频| 久久久久一区| 亚洲美女少妇无套啪啪呻吟| 国产精品高清在线观看| 午夜伦理片一区| 裸体一区二区三区| 99视频在线观看一区三区| 欧美丝袜第一区| 性欧美精品高清| 亚洲丶国产丶欧美一区二区三区 | 亚洲少妇在线| 国产精品专区一| 久久看片网站| 99热在线精品观看| 久久人体大胆视频| 一个人看的www久久| 国产一区二区激情| 欧美.www| 香蕉久久a毛片| 亚洲精品五月天| 久久精品亚洲| 一本色道久久综合精品竹菊| 国产精品视频导航| 裸体一区二区| 一区二区三区视频在线看| 久久久久久久综合| 亚洲裸体俱乐部裸体舞表演av| 国产精品一级在线| 欧美成人伊人久久综合网| 欧美一二三区在线观看| 久久青草久久| 欧美精品一区二区三| 午夜日韩福利| 亚洲日本va午夜在线影院| 久久激情网站| 亚洲影视中文字幕| 亚洲欧洲在线一区| 狠狠综合久久| 国产视频亚洲精品| 欧美性一二三区| 欧美激情第二页| 理论片一区二区在线| 欧美中文字幕在线观看| 亚洲视频一区在线观看| 亚洲黄网站在线观看| 女人色偷偷aa久久天堂| 久久精品亚洲精品国产欧美kt∨| 亚洲一区欧美| 亚洲免费影视|