• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks

               今天六一,C小加不在身邊,混球啊。任務需要在看曼寧的《統計自然語言處理基礎》。然后用到互信息,每次我覺得好高深的名字,做下去的時候就發現沒有那么難。

            搭配

            搭配由有限的復合構詞法所描述。

            識別搭配對的方法有三種:1.使用頻率信息的搭配識別。2.基于含義和主詞搭配詞之間的距離識別。3.基于假設測試和互信息的識別。

            1.頻率

            將語料過濾后得到的動詞,名詞,之間進行兩兩配對,統計每個詞語在一個句子,或在一個段落中出現的次數,即為頻率。

            2.均值和方差 

               由于兩個詞之間的距離是可以變化的,計算兩個詞之間的偏移量的均值和方差。

            均值就是簡單的平均偏移量。

            方差衡量的是單獨的偏移量偏離均值的距離:


             
            是同現i的偏移量,表示的是樣本偏移量的均值。 

                 我們可以通過使用這個信息來發現搭配。具體的方法是通過尋找帶有低偏差的詞對。一個低的偏差值意味著這兩個詞通常大致相同距離出現。零偏差意味著這兩個詞總是以相同的距離出現。

               方差是關于一個相對于其他詞分布峰值情況的度量。

            關于互信息

            互信息的計算公式是這樣的:

            MI(a,b) = log( p(ab) / (p(a)*p(b)) )

            其中log的底數是2p(x)表示x出現的概率。

            好吧,好水,好簡單。。著手寫代碼了。

            posted on 2012-06-01 13:06 SunRise_at 閱讀(2105) 評論(2)  編輯 收藏 引用 所屬分類: 自然語言處理

            評論

            # re: 統計自然語言處理--互信息 2012-06-03 22:35 alafeizai
            統計自然語言處理 pdf么?  回復  更多評論
              

            # re: 統計自然語言處理--互信息 2012-06-04 10:00 SunRise_at
            我看的是紙質的。。@alafeizai
              回復  更多評論
              

            国产精品久久成人影院| 久久人人爽人人爽人人片AV麻烦| 成人午夜精品无码区久久| 婷婷久久综合九色综合绿巨人| 无码国内精品久久人妻麻豆按摩| 国产成人综合久久精品红| 囯产极品美女高潮无套久久久| 国内精品久久久久久99蜜桃| 久久99精品久久久久久水蜜桃| 热久久最新网站获取| 国产精品美女久久久久久2018| 国产精品免费久久久久电影网| 中文字幕精品久久久久人妻| 精品永久久福利一区二区| 久久精品国产亚洲精品| 一本色道久久88—综合亚洲精品| 国产精品久久久天天影视| 综合久久一区二区三区 | 中文字幕精品久久| 成人妇女免费播放久久久| 久久综合给合综合久久| 2021精品国产综合久久| 亚洲日本久久久午夜精品| 狠狠色丁香久久综合五月| 久久婷婷色综合一区二区| 久久国内免费视频| 无夜精品久久久久久| 久久精品免费一区二区三区| 国产三级精品久久| 亚洲综合伊人久久综合| 久久久久噜噜噜亚洲熟女综合| 97久久超碰国产精品2021| 亚洲国产另类久久久精品黑人| 久久精品无码一区二区日韩AV | 久久99毛片免费观看不卡 | 人妻无码久久一区二区三区免费| 久久精品无码一区二区app| 91精品久久久久久无码| 国产精品青草久久久久婷婷| 久久久久亚洲精品无码蜜桃| 久久天天躁狠狠躁夜夜2020一|