• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            信息提取的基本概念

            Posted on 2005-12-07 16:24 inwind 閱讀(537) 評論(0)  編輯 收藏 引用 所屬分類: 數據挖掘
            信息提取(Information Extraction)的定義是指從一段文本中抽取指定的一類信息(例如事件、事實)、并將其(形成結構化的數據)填入一個數據庫中供用戶查詢使用的過程。

            與其他信息處理技術的關系
               信息檢索(Information Retrieval) :只是找出滿足一定檢索條件(query)的整篇文檔或段落,而人們仍然必須閱讀所找到的每一個文檔或段落才能獲得所需要的信息。 
               自動文摘、文本理解 :自動文摘和文本理解則沒有預先規定目標的特性,需要對多種多樣的內容進行分析和處理。 

            信息提取的方針:識別實體,確定關系

            信息提取由簡到繁:
            單個實體:找出所有人名;找出所有email;找出所有大學......
            二元關系實體:XXX的電話(地址,email),位于某地的所有公司.....
            多元關系實體:把所有報道恐怖活動的報道都找出來(IR),并按照事件的地點/時間/參與者/…分類、排序;

            信息提取的基礎設施
               詞典、詞切分和詞性標注
            制作一個規模適當、分級合理并可靈活配置的詞典是建造中文信息提取系統的第一步;
               適用于中文信息提取的短語句法及語義分析
             包括句法成分的識別與標引,關鍵詞提取,檢索特征集的提取、索引等。
               適用于信息提取的句群分析與篇章表示
            這些技術包括表達句間成分的傳遞,指代、引用信息表的建立和使用,"this指針"(當前語義焦點focus)的維護,以及概念關系的推理等。
            99久久国产综合精品成人影院| 亚洲狠狠久久综合一区77777| 久久艹国产| 精品一二三区久久aaa片| 色综合久久综合中文综合网| 国产精品久久久久久搜索| 国产精品热久久无码av| 2021国内久久精品| 狠狠色噜噜狠狠狠狠狠色综合久久| 欧美日韩中文字幕久久伊人| 2021国内精品久久久久久影院| 久久久老熟女一区二区三区| 成人a毛片久久免费播放| 中文字幕无码久久久| av无码久久久久不卡免费网站 | 精品久久久无码人妻中文字幕豆芽| 久久超乳爆乳中文字幕| 亚洲AV伊人久久青青草原| 久久精品国产亚洲AV无码娇色| 亚洲另类欧美综合久久图片区| 久久精品国产亚洲av水果派| 香蕉久久夜色精品国产2020| 国产巨作麻豆欧美亚洲综合久久| 久久婷婷色综合一区二区| 久久精品一区二区影院| 色综合久久88色综合天天| 无码人妻久久一区二区三区免费丨 | 久久婷婷五月综合国产尤物app| 日韩亚洲欧美久久久www综合网| 无码国内精品久久综合88| 久久久精品国产Sm最大网站| 99国产精品久久久久久久成人热| 中文精品久久久久人妻不卡| 香蕉久久影院| 久久久亚洲精品蜜桃臀| 久久久久国色AV免费看图片| 久久久久久久综合综合狠狠| 青草久久久国产线免观| 国产免费久久精品99re丫y| 亚洲欧美成人久久综合中文网 | 久久夜色精品国产亚洲av|