青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 1,  comments - 6,  trackbacks - 0
http://dahua.spaces.live.com/blog/cns!28AF4251DF30CA42!2339.entry

圖˙譜˙馬爾可夫過程˙聚類結構


題目中所說到的四個詞語,都是Machine Learning以及相關領域中熱門的研究課題。表面看屬于不同的topic,實際上則是看待同一個問題的不同角度。不少文章論述了它們之間的一些聯系,讓大家看到了這個世界的奇妙。

從圖說起

這里面,最簡單的一個概念就是“圖”(Graph),它用于表示事物之間的相互聯系。每個圖有一批節點(Node),每個節點表示一個對 象,通過一些邊(Edge)把這些點連在一起,表示它們之間的關系。就這么一個簡單的概念,它對學術發展的意義可以說是無可估量的。幾乎所有領域研究的東 西,都是存在相互聯系的,通過圖,這些聯系都具有了一個統一,靈活,而又強大的數學抽象。因此,很多領域的學者都對圖有著深入探討,而且某個領域關于圖的 研究成果,可以被其它領域借鑒。

矩陣表示:讓代數進入圖的世界

在數學上,一種被普遍使用的表達就是鄰接矩陣(Adjacency Matrix)。一個有N個節點的圖,可以用一個N x N的矩陣G表示,G(i, j)用一個值表示第i個節點和第j個節點的聯系,通常來說這個值越大它們關系越密切,這個值為0表示它們不存在直接聯系。這個表達,很直接,但是非常重 要,因為它把數學上兩個非常根本的概念聯系在一起:“圖”(Graph)和“矩陣”(Matrix)。矩陣是代數學中最重要的概念,給了圖一個矩陣表達, 就建立了用代數方法研究圖的途徑。數學家們幾十年前開始就看到了這一點,并且開創了數學上一個重要的分支——代數圖論(Algebraic Graph Theory)。

代數圖論通過圖的矩陣表達來研究圖。熟悉線性代數的朋友知道,代數中一個很重要的概念叫做“譜”(Spectrum)。一個矩陣的很多 特性和它的譜結構——就是它的特征值和特征向量是密切相關的。因此,當我們獲得一個圖的矩陣表達之后,就可以通過研究這個矩陣的譜結構來研究圖的特性。通 常,我們會分析一個圖的鄰接矩陣(Adjacency Matrix)或者拉普拉斯矩陣(Laplace Matrix)的譜——這里多說一句,這兩種矩陣的譜結構剛好是對稱的。

譜:“分而治之”的代數

譜,這個詞匯似乎在不少地方出現過,比如我們可能更多聽說的頻譜,光譜,等等。究竟什么叫“譜”呢?它的概念其實并不神秘,簡單地說,譜這 個概念來自“分而治之”的策略。一個復雜的東西不好直接研究,就把它分解成簡單的分量。如果我們把一個東西看成是一些分量疊加而成,那么這些分量以及它們 各自所占的比例,就叫這個東西的譜。所謂頻譜,就是把一個信號分解成多個頻率單一的分量。

矩陣的譜,就是它的特征值和特征向量,普通的線性代數課本會告訴你定義:如果A v = c v,那么c 就是A的特征值,v就叫特征向量。這僅僅是數學家發明的一種數學游戲么?——也許有些人剛學這個的時候,并一定能深入理解這么個公式代表什么。其實,這里 的譜,還是代表了一種分量結構,它為使用“分而治之”策略來研究矩陣的作用打開了一個重要途徑。這里我們可以把矩陣理解為一個操作(operator), 它的作用就是把一個向量變成另外一個向量:y = A x。對于某些向量,矩陣對它的作用很簡單,A v = cv,相當于就把這個向量v 拉長了c倍。我們把這種和矩陣A能如此密切配合的向量v1, v2, ... 叫做特征向量,這個倍數c1, c2, ...叫特征值。那么來了一個新的向量x 的時候,我們就可以把x 分解為這些向量的組合,x = a1 v1 + a2 v2 + ...,那么A對x的作用就可以分解了:A x = A (a1 v1 + a2 v2 + ...) = a1 c1 v1 + a2 c2 v2 ... 所以,矩陣的譜就是用于分解一個矩陣的作用的。

這里再稍微延伸一點。一個向量可以看成一個關于整數的函數,就是輸入i,它返回v( i )。它可以延伸為一個連續函數(一個長度無限不可數的向量,呵呵),相應的矩陣 A 變成一個二元連續函數(面積無限大的矩陣)。這時候矩陣乘法中的求和變成了積分。同樣的,A的作用可以理解為把一個連續函數映射為另外一個連續函數,這時 候A不叫矩陣,通常被稱為算子。對于算子,上面的譜分析方法同樣適用(從有限到無限,在數學上還需要處理一下,不多說了)——這個就是泛函分析中的一個重 要部分——譜論(Spectral Theory)。

馬爾可夫過程——從時間的角度理解圖

回到“圖”這個題目,那么圖的譜是干什么的呢?按照上面的理解,似乎是拿來分解一個圖的。這里譜的作用還是分治,但是,不是直觀的理解為把 圖的大卸八塊,而是把要把在圖上運行的過程分解成簡單的過程的疊加。如果一個圖上每個節點都有一個值,那么在圖上運行的過程就是對這些值進行更新的過程。 一個簡單,大家經常使用的過程,就是馬爾可夫過程(Markov Process)。

學過隨機過程的朋友都了解馬爾可夫過程。概念很簡單——“將來只由現在決定,和過去無關”。考慮一個圖,圖上每個點有一個值,會被不斷 更新。每個點通過一些邊連接到其它一些點上,對于每個點,這些邊的值都是正的,和為1。在圖上每次更新一個點的值,就是對和它相連接的點的值加權平均。如 果圖是聯通并且非周期(數學上叫各態歷經性, ergodicity),那么這個過程最后會收斂到一個唯一穩定的狀態(平衡狀態)。

圖上的馬爾可夫更新過程,對于很多學科有著非常重要的意義。這種數學抽象,可以用在什么地方呢?(1) Google對搜索結果的評估(PageRank)原理上依賴于這個核心過程,(2) 統計中一種廣泛運用的采樣過程MCMC,其核心就是上述的轉移過程,(3) 物理上廣泛存在的擴散過程(比如熱擴散,流體擴散)和上面的過程有很重要的類比,(4) 網絡中的信息的某些歸納與交換過程和上述過程相同 (比如Random Gossiping),還有很多。非常多的實際過程通過某種程度的簡化和近似,都可以歸結為上述過程。因此,對上面這個核心過程的研究,對于很多現象的理 解有重要的意義。各個領域的科學家從本領域的角度出發研究這個過程,得出了很多實質上一致的結論,并且很多都落在了圖的譜結構的這個關鍵點上。

圖和譜在此聯姻

根據上面的定義,我們看到鄰接矩陣A其實就是這個馬爾可夫過程的轉移概率矩陣。我們把各個節點的值放在一起可以得到一個向量v,那么我們就 可以獲得對這個過程的代數表示, v(t+1) = A v(t)。穩定的時候,v = A v。我們可以看到穩定狀態就是A的一個特征向量,特征值就是1。這里譜的概念進來了。我們把A的特征向量都列出來v1, v2, ...,它們有 A vi = ci vi。vi其實就是一種很特殊,但是很簡單的狀態,對它每進行一輪更新,所有節點的值就變成原來的ci倍。如果0 < ci < 1,那么,相當于所有節點的值呈現指數衰減,直到大家都趨近于0。

一般情況下,我們開始于一個任意一個狀態u,它的更新過程就沒那么簡單了。我們用譜的方法來分析,把u分解成 u = v1 + c2 v2 + c3 v3 + ... (在數學上可以嚴格證明,對于上述的轉移概率矩陣,最大的特征值就是1,這里對應于平衡狀態v1,其它的特征狀態v2, v3, ..., 對應于特征值1 > c2 > c3 > ... > -1)。那么,我們可以看到,當更新進行了t 步之后,狀態變成 u(t) = v1 + c2^t v2 + c3^t v3 + ...,我們看到,除了代表平衡狀態的分量保持不變外,其它分量隨著t 增長而指數衰減,最后,其它整個趨近于平衡狀態。

從上面的分析看到,這個過程的收斂速度,其實是和衰減得最慢的那個非平衡分量是密切相關的,它的衰減速度取決于第二大特征值c2,c2 的大小越接近于1,收斂越慢,越接近于0,收斂越快。這里,我們看到了譜的意義。第一,它幫助把一個圖上運行的馬爾可夫過程分解為多個簡單的字過程的疊 加,這里面包含一個平衡過程和多個指數衰減的非平衡過程。第二,它指出平衡狀態是對應于最大特征值1的分量,而收斂速度主要取決于第二大特征值。

我們這里知道了第二大特征值c2對于描述這個過程是個至關重要的量,究竟是越大越好,還是越小越好呢?這要看具體解決的問題。如果你要 設計一個采樣過程或者更新過程,那么就要追求一個小的c2,它一方面提高過程的效率,另外一方面,使得圖的結構改變的時候,能及時收斂,從而保證過程的穩 定。而對于網絡而言,小的c2有利于信息的迅速擴散和傳播。

聚類結構——從空間的角度理解圖

c2的大小往往取決于圖上的聚類結構。如果圖上的點分成幾組,各自聚成一團,缺乏組與組之間的聯系,那么這種結構是很不利于擴散的。在某些 情況下,甚至需要O(exp(N))的時間才能收斂。這也符合我們的直觀想象,好比兩個大水缸,它們中間的只有一根很細的水管相連,那么就需要好長時間才 能達到平衡。有興趣的朋友可以就這個水缸問題推導一下,這個水缸系統的第二大特征值和水管流量與水缸的容積的比例直接相關,隨比例增大而下降。

對于這個現象進行推廣,數學上有一個重要的模型叫導率模型(Conductance)。具體的公式不說了,大體思想是,節點集之間的導 通量和節點集大小的平均比例和第二大特征值之間存在一個單調的上下界關系。導率描述的是圖上的節點連接的空間結合,這個模型把第二特征值c2和圖的空間聚 集結構聯系在一起了。

圖上的聚類結構越明顯, c2越大;反過來說,c2越大,聚類的結構越明顯,(c2 = 1)時,整個圖就斷裂成非連通的兩塊或者多塊了。從這個意義上說,c2越大,越容易對這個圖上的點進行聚類。機器學習中一個重要課題叫做聚類,近十年來, 基于代數圖論發展出來的一種新的聚類方法,就是利用了第二大特征值對應的譜結構,這種聚類方法叫做譜聚類(Spectral Clustering)。它在Computer Vision里面對應于一種著名的圖像分割方法,叫做Normalized Cut。很多工作在使用這種方法。其實這種方法的成功,取決于c2的大小,也就是說取決于我們如何構造出一個利于聚類的圖,另外c2的值本身也可以作為衡 量聚類質量,或者可聚類性的標志。遺憾的是,在paper里面,使用此方法者眾,深入探討此方法的內在特點者少。

歸納起來

圖是表達事物關系和傳遞擴散過程的重要數學抽象

圖的矩陣表達提供了使用代數方法研究圖的途徑

譜,作為一種重要的代數方法,其意義在于對復雜對象和過程進行分解

圖上的馬爾可夫更新過程是很多實際過程的一個重要抽象

圖的譜結構的重要意義在于通過它對馬爾可夫更新過程進行分解分析

圖的第一特征值對應于馬爾可夫過程的平衡狀態,第二特征值刻畫了這個過程的收斂速度(采樣的效率,擴散和傳播速度,網絡的穩定程度)。

圖的第二特征分量與節點的聚類結構密切相關。可以通過譜結構來分析圖的聚類結構。

馬爾可夫過程代表了一種時間結構,聚類結構代表了一種空間結構,“譜”把它們聯系在一起了,在數學刻畫了這種時與空的深刻關系


posted on 2008-09-06 23:47 bneliao 閱讀(447) 評論(0)  編輯 收藏 引用 所屬分類: math
<2025年11月>
2627282930311
2345678
9101112131415
16171819202122
23242526272829
30123456

常用鏈接

留言簿

隨筆檔案

文章分類

文章檔案

BLOG連接

D3D

GAME

搜索

  •  

積分與排名

  • 積分 - 11557
  • 排名 - 1114

最新評論

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美福利视频在线| 久久精品免费电影| 国产一区二区三区观看| 欧美成人日本| 久久久久久九九九九| 亚洲天堂av图片| 中文日韩电影网站| 亚洲少妇中出一区| 午夜精品一区二区三区在线播放| 久久久久久亚洲精品杨幂换脸| 日韩一二三在线视频播| 狠狠色狠色综合曰曰| 黄色一区三区| 黑人一区二区三区四区五区| 国产欧美日韩| 在线观看视频亚洲| 亚洲国产精品电影在线观看| 国产一区二区福利| 欧美日韩视频第一区| 欧美搞黄网站| 亚洲精品一区二区三区福利| 最新成人av网站| 午夜视频在线观看一区| 免费成人网www| 欧美人与性动交α欧美精品济南到| 国产精品激情偷乱一区二区∴| 国产日韩精品在线播放| 亚洲另类黄色| 欧美在线观看网站| 99在线热播精品免费| 另类图片综合电影| 国产在线乱码一区二区三区| aaa亚洲精品一二三区| 欧美成人精品h版在线观看| 99综合电影在线视频| 欧美成人午夜| 亚洲精品国产精品国自产在线| 欧美尤物巨大精品爽| 国产精品99久久99久久久二8| 久久久美女艺术照精彩视频福利播放| 欧美日韩一区二区免费在线观看| 极品少妇一区二区三区| 久久高清国产| 欧美在线观看www| 很黄很黄激情成人| 欧美国产日产韩国视频| 久久躁日日躁aaaaxxxx| 亚洲精品国产精品乱码不99按摩 | 亚洲欧美成人网| 日韩一级欧洲| 久久夜色精品| 欧美另类极品videosbest最新版本| 亚洲国产精品一区二区www| 亚洲国产一区二区视频| 免费人成网站在线观看欧美高清| 99精品视频免费观看| 亚洲欧美999| 99国产精品| 久久一区二区三区国产精品| 一区二区三区免费网站| 久久一区二区三区国产精品| 亚洲图片欧美午夜| 欧美激情精品久久久| 欧美制服丝袜第一页| 欧美日韩亚洲一区三区 | 欧美视频在线观看免费网址| 国产精品h在线观看| 国内视频一区| 一本久久综合亚洲鲁鲁| 亚洲影院高清在线| 亚洲高清视频一区二区| 99精品欧美一区| 久久久久9999亚洲精品| 激情成人综合| 欧美激情视频免费观看| 亚洲一区二区视频在线| 欧美中文字幕在线播放| 亚洲一区二区三区涩| 在线观看欧美黄色| 欧美亚洲日本一区| 亚洲天堂av在线免费| 欧美国产日韩一区二区| 美女国产一区| 国产日韩欧美精品| 老司机午夜精品视频| 亚洲国产精品成人精品| 亚洲精品一区二| 国产在线乱码一区二区三区| 欧美激情女人20p| 国产女精品视频网站免费| 一区二区三区四区国产精品| 一本一本a久久| 国产精品视频免费观看| 久久久久久香蕉网| 久久综合色播五月| 国产日本欧洲亚洲| 香蕉久久夜色精品| 久久免费偷拍视频| 亚洲国产日韩在线一区模特| 欧美国产日韩亚洲一区| 欧美激情中文不卡| 欧美在线观看视频在线| 中文日韩电影网站| 国产午夜久久久久| 久久久国产精彩视频美女艺术照福利 | 国产欧美综合在线| 欧美在线看片a免费观看| 亚洲国产精品欧美一二99| 久久夜色精品国产欧美乱极品 | 久热精品视频| 亚洲激情亚洲| 欧美片在线观看| 欧美伊人精品成人久久综合97| 久久综合网色—综合色88| 欧美影院在线| 亚洲一区二区不卡免费| 亚洲欧洲一二三| 欧美凹凸一区二区三区视频| 欧美阿v一级看视频| 欧美在线观看一二区| 国产亚洲精品高潮| 欧美亚洲第一区| 麻豆成人精品| 久久国产精品亚洲va麻豆| 性欧美1819sex性高清| 欧美亚洲三区| 久久亚洲私人国产精品va媚药| 99精品国产在热久久下载| 久久免费视频网站| 翔田千里一区二区| 中文高清一区| 亚洲影院免费观看| 欧美综合激情网| 久久精品最新地址| 亚洲国产精品ⅴa在线观看| 亚洲免费播放| 国产午夜精品视频免费不卡69堂| 久久亚洲视频| 亚洲美女在线一区| 亚洲一级二级| 久久久国产91| 欧美视频你懂的| 亚洲精品人人| 久久久久久夜| 一区二区三区 在线观看视| 夜夜嗨av一区二区三区| 一区二区三区欧美成人| 美日韩精品视频| 红杏aⅴ成人免费视频| 午夜精品在线| 日韩亚洲国产欧美| 欧美日韩精品一区二区三区四区| 欧美精品在线观看91| 国产美女一区| 一区二区三区视频在线| 欧美午夜女人视频在线| 在线亚洲一区二区| 国产有码在线一区二区视频| 亚洲伦理久久| 久久www成人_看片免费不卡| 玖玖在线精品| 亚洲制服av| 国产精品国产三级国产普通话蜜臀 | 国产专区精品视频| 在线欧美电影| 久久久久久久久久久一区 | 欧美专区亚洲专区| 欧美成人亚洲成人日韩成人| 羞羞色国产精品| 国产精品久久久久国产精品日日 | 亚洲高清二区| 欧美顶级艳妇交换群宴| 99视频日韩| 欧美激情精品久久久久久大尺度| 国产精品一级二级三级| 亚洲精品小视频| 亚洲美女啪啪| 国产三级欧美三级| 久久婷婷麻豆| 欧美日韩不卡合集视频| 午夜欧美理论片| 国产精品亚洲综合色区韩国| 欧美亚洲三区| 欧美成人亚洲| 一本色道久久综合精品竹菊| 一区二区三区国产精华| 国产亚洲欧美中文| 精品成人在线观看| 亚洲综合色丁香婷婷六月图片| 欧美性大战xxxxx久久久| 亚洲一线二线三线久久久| 亚洲欧美精品在线| 99国产精品久久久久久久成人热| 亚洲视频专区在线| 亚洲欧洲精品一区二区三区不卡| 一本一道久久综合狠狠老精东影业 | 欧美成年人网| 亚洲成人在线网| 久久蜜臀精品av| 久久久久青草大香线综合精品|