• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks

               今天六一,C小加不在身邊,混球啊。任務需要在看曼寧的《統計自然語言處理基礎》。然后用到互信息,每次我覺得好高深的名字,做下去的時候就發現沒有那么難。

            搭配

            搭配由有限的復合構詞法所描述。

            識別搭配對的方法有三種:1.使用頻率信息的搭配識別。2.基于含義和主詞搭配詞之間的距離識別。3.基于假設測試和互信息的識別。

            1.頻率

            將語料過濾后得到的動詞,名詞,之間進行兩兩配對,統計每個詞語在一個句子,或在一個段落中出現的次數,即為頻率。

            2.均值和方差 

               由于兩個詞之間的距離是可以變化的,計算兩個詞之間的偏移量的均值和方差。

            均值就是簡單的平均偏移量。

            方差衡量的是單獨的偏移量偏離均值的距離:


             
            是同現i的偏移量,表示的是樣本偏移量的均值。 

                 我們可以通過使用這個信息來發現搭配。具體的方法是通過尋找帶有低偏差的詞對。一個低的偏差值意味著這兩個詞通常大致相同距離出現。零偏差意味著這兩個詞總是以相同的距離出現。

               方差是關于一個相對于其他詞分布峰值情況的度量。

            關于互信息

            互信息的計算公式是這樣的:

            MI(a,b) = log( p(ab) / (p(a)*p(b)) )

            其中log的底數是2p(x)表示x出現的概率。

            好吧,好水,好簡單。。著手寫代碼了。

            posted on 2012-06-01 13:06 SunRise_at 閱讀(2105) 評論(2)  編輯 收藏 引用 所屬分類: 自然語言處理

            評論

            # re: 統計自然語言處理--互信息 2012-06-03 22:35 alafeizai
            統計自然語言處理 pdf么?  回復  更多評論
              

            # re: 統計自然語言處理--互信息 2012-06-04 10:00 SunRise_at
            我看的是紙質的。。@alafeizai
              回復  更多評論
              

            国产精品成人久久久| 国内精品久久久久久野外| 日本久久久久久中文字幕| 91精品国产91久久| 99久久综合国产精品免费| 伊人久久大香线蕉av不卡| 久久香蕉国产线看观看乱码 | 99久久免费只有精品国产| 久久精品?ⅴ无码中文字幕| 久久综合九色欧美综合狠狠| 久久精品亚洲中文字幕无码麻豆 | 日韩人妻无码一区二区三区久久99| 亚洲精品无码专区久久久| 亚洲国产成人久久综合一区77| 久久国产精品无码一区二区三区 | 伊人久久大香线蕉综合网站| 伊人久久精品无码二区麻豆| 国产成人无码精品久久久久免费| 欧美亚洲色综久久精品国产| 日日狠狠久久偷偷色综合96蜜桃| 99久久精品免费看国产| 久久久久亚洲Av无码专| 一本一道久久a久久精品综合 | 久久超乳爆乳中文字幕| 久久中文字幕人妻丝袜| 久久久久免费视频| 久久成人精品视频| 久久er99热精品一区二区| 久久精品国产99久久久古代| 久久亚洲AV成人无码| 国产福利电影一区二区三区久久久久成人精品综合 | 久久久久久久97| 中文字幕精品久久| 亚洲国产成人乱码精品女人久久久不卡 | 久久久午夜精品福利内容| 亚洲Av无码国产情品久久| 久久国产乱子伦精品免费午夜| 久久国产精品久久国产精品| 久久成人国产精品| 91久久精品视频| 久久久不卡国产精品一区二区|