• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學(xué)習(xí),才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks

               今天六一,C小加不在身邊,混球啊。任務(wù)需要在看曼寧的《統(tǒng)計自然語言處理基礎(chǔ)》。然后用到互信息,每次我覺得好高深的名字,做下去的時候就發(fā)現(xiàn)沒有那么難。

            搭配

            搭配由有限的復(fù)合構(gòu)詞法所描述。

            識別搭配對的方法有三種:1.使用頻率信息的搭配識別。2.基于含義和主詞搭配詞之間的距離識別。3.基于假設(shè)測試和互信息的識別。

            1.頻率

            將語料過濾后得到的動詞,名詞,之間進(jìn)行兩兩配對,統(tǒng)計每個詞語在一個句子,或在一個段落中出現(xiàn)的次數(shù),即為頻率。

            2.均值和方差 

               由于兩個詞之間的距離是可以變化的,計算兩個詞之間的偏移量的均值和方差。

            均值就是簡單的平均偏移量。

            方差衡量的是單獨的偏移量偏離均值的距離:


             
            是同現(xiàn)i的偏移量,表示的是樣本偏移量的均值。 

                 我們可以通過使用這個信息來發(fā)現(xiàn)搭配。具體的方法是通過尋找?guī)в械推畹脑~對。一個低的偏差值意味著這兩個詞通常大致相同距離出現(xiàn)。零偏差意味著這兩個詞總是以相同的距離出現(xiàn)。

               方差是關(guān)于一個相對于其他詞分布峰值情況的度量。

            關(guān)于互信息

            互信息的計算公式是這樣的:

            MI(a,b) = log( p(ab) / (p(a)*p(b)) )

            其中log的底數(shù)是2p(x)表示x出現(xiàn)的概率。

            好吧,好水,好簡單。。著手寫代碼了。

            posted on 2012-06-01 13:06 SunRise_at 閱讀(2105) 評論(2)  編輯 收藏 引用 所屬分類: 自然語言處理

            評論

            # re: 統(tǒng)計自然語言處理--互信息 2012-06-03 22:35 alafeizai
            統(tǒng)計自然語言處理 pdf么?  回復(fù)  更多評論
              

            # re: 統(tǒng)計自然語言處理--互信息 2012-06-04 10:00 SunRise_at
            我看的是紙質(zhì)的。。@alafeizai
              回復(fù)  更多評論
              

            99久久精品免费观看国产| 久久97久久97精品免视看秋霞| 久久99精品久久久久久噜噜| 亚洲国产精品人久久| 欧美日韩中文字幕久久久不卡| 97精品依人久久久大香线蕉97| 亚洲级αV无码毛片久久精品| 99久久精品国产麻豆| 一本色综合久久| 久久久久久狠狠丁香| 久久亚洲国产成人影院| 久久99国产精品久久久| 国产精品久久久香蕉| 91精品国产色综久久| 久久ww精品w免费人成| 亚洲精品国产综合久久一线| 精品国产一区二区三区久久久狼| 武侠古典久久婷婷狼人伊人| 国产精品18久久久久久vr | 91精品国产9l久久久久| 亚洲人成网站999久久久综合| 99久久99久久精品国产片| 亚洲欧美伊人久久综合一区二区 | 久久国产热精品波多野结衣AV| 亚洲国产精品无码久久九九 | 久久九九青青国产精品| 亚洲中文字幕无码久久精品1| 无码任你躁久久久久久| 国产真实乱对白精彩久久| 97久久国产亚洲精品超碰热| 精品人妻伦九区久久AAA片69| 热RE99久久精品国产66热| 亚洲欧美日韩精品久久| 91久久精品电影| 99久久国产热无码精品免费久久久久| 国产精品美女久久久久| 人妻少妇久久中文字幕| 久久久无码一区二区三区| 久久99久久99精品免视看动漫| 少妇内射兰兰久久| 99re久久精品国产首页2020|