• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks

               今天六一,C小加不在身邊,混球啊。任務需要在看曼寧的《統計自然語言處理基礎》。然后用到互信息,每次我覺得好高深的名字,做下去的時候就發現沒有那么難。

            搭配

            搭配由有限的復合構詞法所描述。

            識別搭配對的方法有三種:1.使用頻率信息的搭配識別。2.基于含義和主詞搭配詞之間的距離識別。3.基于假設測試和互信息的識別。

            1.頻率

            將語料過濾后得到的動詞,名詞,之間進行兩兩配對,統計每個詞語在一個句子,或在一個段落中出現的次數,即為頻率。

            2.均值和方差 

               由于兩個詞之間的距離是可以變化的,計算兩個詞之間的偏移量的均值和方差。

            均值就是簡單的平均偏移量。

            方差衡量的是單獨的偏移量偏離均值的距離:


             
            是同現i的偏移量,表示的是樣本偏移量的均值。 

                 我們可以通過使用這個信息來發現搭配。具體的方法是通過尋找帶有低偏差的詞對。一個低的偏差值意味著這兩個詞通常大致相同距離出現。零偏差意味著這兩個詞總是以相同的距離出現。

               方差是關于一個相對于其他詞分布峰值情況的度量。

            關于互信息

            互信息的計算公式是這樣的:

            MI(a,b) = log( p(ab) / (p(a)*p(b)) )

            其中log的底數是2p(x)表示x出現的概率。

            好吧,好水,好簡單。。著手寫代碼了。

            posted on 2012-06-01 13:06 SunRise_at 閱讀(2120) 評論(2)  編輯 收藏 引用 所屬分類: 自然語言處理

            評論

            # re: 統計自然語言處理--互信息 2012-06-03 22:35 alafeizai
            統計自然語言處理 pdf么?  回復  更多評論
              

            # re: 統計自然語言處理--互信息 2012-06-04 10:00 SunRise_at
            我看的是紙質的。。@alafeizai
              回復  更多評論
              

            99久久99久久精品国产片| 91精品国产91久久综合| 婷婷久久五月天| 久久久国产乱子伦精品作者| 国产精品天天影视久久综合网| 99久久精品九九亚洲精品| 一本一本久久a久久精品综合麻豆| 久久国产精品无码一区二区三区| 国产精品99久久久久久www| 亚洲精品乱码久久久久久久久久久久 | 97久久超碰成人精品网站| 欧美精品福利视频一区二区三区久久久精品 | 热re99久久6国产精品免费| 日本WV一本一道久久香蕉| 久久高潮一级毛片免费| 韩国三级中文字幕hd久久精品 | 国产成人精品三上悠亚久久| 中文字幕精品久久| 99久久国产综合精品五月天喷水| 亚洲中文字幕无码久久综合网| 久久综合精品国产一区二区三区| 狠狠狠色丁香婷婷综合久久五月| 亚洲国产精品久久久久婷婷软件 | 色青青草原桃花久久综合| 99久久精品国产毛片| 国产99久久久久久免费看| 国产成人精品久久一区二区三区| 亚洲AV乱码久久精品蜜桃| 亚洲国产精品久久久天堂 | 伊人久久久AV老熟妇色| 久久人与动人物a级毛片| 久久久av波多野一区二区| 久久久久久国产精品无码超碰| 亚洲中文字幕无码久久2020| 一本色道久久HEZYO无码| 久久精品国产久精国产一老狼| 久久精品国产精品亚洲精品| 亚洲va中文字幕无码久久| 69久久精品无码一区二区| 久久国产乱子伦精品免费强| 精品久久久久中文字|