• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            文本分類與輿情分析

            Posted on 2005-12-08 21:11 inwind 閱讀(1339) 評論(2)  編輯 收藏 引用

               項目的終極目標是輿情分析,為主管部門及時掌握網(wǎng)絡輿論情況,以及了解輿論發(fā)展的時間和空間上的發(fā)生發(fā)展情況。所作的工作必須以此為判斷的唯一標準。
               
               分類,首先要有個分類體系,現(xiàn)在掌握的情況是,分類是根據(jù)學科體制,在分類樹的某個節(jié)點上,按照唯一的標準進行分類。
               
               但是,人類知識本身就是渾然一體的,存在大量的交叉,甚至不同領域研究同一對象,甚至使用相同或者相似方法。(這時感覺,徐小棟老師的說法還是對的,呵呵,知識是渾然一體的,分類是人工雕琢,但是為了掌握的方便,只好如此了)。
               更何況,網(wǎng)絡信息的多樣性,隨意性,以及貼近生活,使得網(wǎng)絡信息,尤其是新聞,難以按照學科體制分類,或者很不適合用學科體制分類。
               例如,管理部門想要了解民眾對神六的看法,討論和關注程度,以及關注的方面。但是按照分類體系,神六對經(jīng)濟的影響屬于經(jīng)濟類,對外交的影響屬于政治類,對民俗的影響又屬于文化類。這樣,對于管理部門,可能是不想要得結(jié)果。
               
               又考慮到了主題的概念,一篇文章舉的例子,地震是主題,但是,唐山地震又是另外的概念,事件;載人航天是主題,但是神六上天又是事件。沒有人給出確切的定義。
               可否這樣定義呢:主題,是關于一個較為抽象概念的所有文章。
               事件,是關于一個確切的事件。
               
               但是,問題是,較為抽象的概念,分類的定義就是,對概念進行劃分,概念是關于本質(zhì)屬性的反應。本質(zhì)屬性呢,就是決定一個事物或者一類事物不是其他的決定性屬性。主題和分類還是有些混亂啊。

               現(xiàn)在想了兩種方案,
            一是分大類,僅一級,分個十幾二十類,然后在下面進行聚類和事件發(fā)現(xiàn)跟蹤。
            二是分得比較細,仿照北大或者google的三級分類,然后進行聚類和事件發(fā)現(xiàn)跟蹤,然后給出事件發(fā)現(xiàn)跟蹤的結(jié)果。

            哪一個比較好呢,似乎第一類,簡單分類后,對于聚類和事件發(fā)現(xiàn)跟蹤的影響小。
            但是,新聞的特征向量如何選取呢,理論上分類和聚類的要求是相同的,但是肯定會有細微的差別,更何況聚類還需要考慮新聞的時間分布。

            另外一個問題了,事件發(fā)現(xiàn)需要利用新聞事件的時間特性,但是,在比較長一段時間內(nèi),關于一系列事件的主題,如何挖掘呢,比如,礦難。——給每個新聞事件確定一個特征向量,然后對事件的特征向量進行聚類?

            嗯,繼續(xù)研究繼續(xù)研究

            Feedback

            # re: 文本分類與輿情分析  回復  更多評論   

            2007-01-23 21:24 by youyou
            最近準備研究文本分類,能否給與賜教?不知道有沒有文本分類的代碼,可否給我一份,謝謝!myyouyou1979@126.com

            # re: 文本分類與輿情分析  回復  更多評論   

            2008-04-20 16:44 by 發(fā)達省份
            zhaiyongzy@126.com
            我也想要文本分類相關算法
            欧美一区二区精品久久| 久久精品日日躁夜夜躁欧美| 狠狠色婷婷综合天天久久丁香| 久久最新精品国产| 亚洲国产成人久久一区久久| 99精品久久精品一区二区| 久久久精品免费国产四虎| 无码人妻少妇久久中文字幕| 久久久婷婷五月亚洲97号色 | 色狠狠久久综合网| 久久精品国产亚洲AV麻豆网站| 国产伊人久久| 国产精品久久一区二区三区| 久久久久亚洲AV无码专区网站| 久久精品国产亚洲av水果派| 久久伊人色| 久久99精品久久久久久9蜜桃| 思思久久99热只有频精品66| 国内精品免费久久影院| 精品亚洲综合久久中文字幕| 久久精品免费一区二区| 欧美性大战久久久久久| 久久综合九色综合久99| 伊人久久综合无码成人网| 日韩中文久久| 精品久久久久一区二区三区| 狠狠色噜噜狠狠狠狠狠色综合久久| 亚洲精品乱码久久久久66| 日产精品久久久久久久| 久久这里只有精品视频99| 国产午夜福利精品久久| 国产成人久久777777| 岛国搬运www久久| 国产一区二区精品久久岳 | 国产成人精品久久| 欧美国产成人久久精品| 久久精品国产亚洲αv忘忧草| 亚洲欧洲精品成人久久奇米网| 久久久精品无码专区不卡| 午夜精品久久久久久影视777| 日韩va亚洲va欧美va久久|