• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 12, comments - 4, trackbacks - 0, articles - 36

            文本分類與輿情分析

            Posted on 2005-12-08 21:11 inwind 閱讀(1339) 評論(2)  編輯 收藏 引用

               項目的終極目標(biāo)是輿情分析,為主管部門及時掌握網(wǎng)絡(luò)輿論情況,以及了解輿論發(fā)展的時間和空間上的發(fā)生發(fā)展情況。所作的工作必須以此為判斷的唯一標(biāo)準(zhǔn)。
               
               分類,首先要有個分類體系,現(xiàn)在掌握的情況是,分類是根據(jù)學(xué)科體制,在分類樹的某個節(jié)點上,按照唯一的標(biāo)準(zhǔn)進(jìn)行分類。
               
               但是,人類知識本身就是渾然一體的,存在大量的交叉,甚至不同領(lǐng)域研究同一對象,甚至使用相同或者相似方法。(這時感覺,徐小棟老師的說法還是對的,呵呵,知識是渾然一體的,分類是人工雕琢,但是為了掌握的方便,只好如此了)。
               更何況,網(wǎng)絡(luò)信息的多樣性,隨意性,以及貼近生活,使得網(wǎng)絡(luò)信息,尤其是新聞,難以按照學(xué)科體制分類,或者很不適合用學(xué)科體制分類。
               例如,管理部門想要了解民眾對神六的看法,討論和關(guān)注程度,以及關(guān)注的方面。但是按照分類體系,神六對經(jīng)濟的影響屬于經(jīng)濟類,對外交的影響屬于政治類,對民俗的影響又屬于文化類。這樣,對于管理部門,可能是不想要得結(jié)果。
               
               又考慮到了主題的概念,一篇文章舉的例子,地震是主題,但是,唐山地震又是另外的概念,事件;載人航天是主題,但是神六上天又是事件。沒有人給出確切的定義。
               可否這樣定義呢:主題,是關(guān)于一個較為抽象概念的所有文章。
               事件,是關(guān)于一個確切的事件。
               
               但是,問題是,較為抽象的概念,分類的定義就是,對概念進(jìn)行劃分,概念是關(guān)于本質(zhì)屬性的反應(yīng)。本質(zhì)屬性呢,就是決定一個事物或者一類事物不是其他的決定性屬性。主題和分類還是有些混亂啊。

               現(xiàn)在想了兩種方案,
            一是分大類,僅一級,分個十幾二十類,然后在下面進(jìn)行聚類和事件發(fā)現(xiàn)跟蹤。
            二是分得比較細(xì),仿照北大或者google的三級分類,然后進(jìn)行聚類和事件發(fā)現(xiàn)跟蹤,然后給出事件發(fā)現(xiàn)跟蹤的結(jié)果。

            哪一個比較好呢,似乎第一類,簡單分類后,對于聚類和事件發(fā)現(xiàn)跟蹤的影響小。
            但是,新聞的特征向量如何選取呢,理論上分類和聚類的要求是相同的,但是肯定會有細(xì)微的差別,更何況聚類還需要考慮新聞的時間分布。

            另外一個問題了,事件發(fā)現(xiàn)需要利用新聞事件的時間特性,但是,在比較長一段時間內(nèi),關(guān)于一系列事件的主題,如何挖掘呢,比如,礦難。——給每個新聞事件確定一個特征向量,然后對事件的特征向量進(jìn)行聚類?

            嗯,繼續(xù)研究繼續(xù)研究

            Feedback

            # re: 文本分類與輿情分析  回復(fù)  更多評論   

            2007-01-23 21:24 by youyou
            最近準(zhǔn)備研究文本分類,能否給與賜教?不知道有沒有文本分類的代碼,可否給我一份,謝謝!myyouyou1979@126.com

            # re: 文本分類與輿情分析  回復(fù)  更多評論   

            2008-04-20 16:44 by 發(fā)達(dá)省份
            zhaiyongzy@126.com
            我也想要文本分類相關(guān)算法

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久久久久精品免费看SSS| 久久久久亚洲AV片无码下载蜜桃 | 思思久久99热免费精品6| 国产精品九九久久精品女同亚洲欧美日韩综合区 | 午夜久久久久久禁播电影| 天天躁日日躁狠狠久久| 精品久久久久久无码专区| 99久久国产亚洲高清观看2024| 亚洲国产高清精品线久久 | 久久精品中文字幕久久| 日韩久久无码免费毛片软件| 伊人久久久AV老熟妇色| 久久狠狠一本精品综合网| 久久久久人妻精品一区| 性做久久久久久久久老女人| 国产精品无码久久综合| 亚洲精品tv久久久久| 国产精品久久久久影院色| 亚洲国产精品无码久久一线| 一本伊大人香蕉久久网手机| 亚洲国产精品无码久久一区二区 | 色婷婷久久综合中文久久一本| 久久亚洲中文字幕精品有坂深雪| 久久夜色精品国产亚洲av| 国产精品亚洲综合专区片高清久久久| 日韩人妻无码一区二区三区久久99| 亚洲国产精品久久| 欧美熟妇另类久久久久久不卡 | 久久香蕉国产线看观看精品yw| 久久久久国产一区二区三区| 97r久久精品国产99国产精| 无码精品久久久久久人妻中字 | 久久电影网一区| 成人国内精品久久久久影院| 国产69精品久久久久久人妻精品| 久久久久女教师免费一区| 国产精品九九久久免费视频| 久久免费精品视频| 国产精品久久久久久| 久久精品一区二区| 久久久久久久综合日本亚洲|