總體設(shè)計(jì)方案:
?????? 本文將采取基于特征的方法對圖像進(jìn)行聚類與檢索。基于特征對圖像進(jìn)行聚類與檢索的基本方法是在建立圖像庫時(shí) , 對輸入的圖像先進(jìn)行圖像分析 , 提取圖像或目標(biāo)的特征向量并根據(jù)特征向量及匹配算法等將圖像進(jìn)行聚類。在進(jìn)行圖像檢索時(shí) , 對每一幅給定的查詢圖 , 進(jìn)行圖像分析并提取該圖的特征向量。通過將該圖特征向量與特征庫中的特征向量進(jìn)行匹配并根據(jù)匹配結(jié)果到圖像庫中搜索就可提取出所需要的檢索圖像來。
?????? 由上述工作原理可以知道基于特征的圖像聚類與檢索有四個(gè)關(guān)鍵 , 一是要從圖像中抽取分類和檢索的特征 , 二是確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量 , 三是要利用聚類算法對圖像庫中的圖像進(jìn)行聚類,四是要利用匹配算法在圖像庫中檢索相應(yīng)的圖像。
1 .從圖像中抽取分類和檢索的特征
?????? 我們知道,一幅圖像是以矩陣的形式存儲在計(jì)算機(jī)中的,具體地講,矩陣上某一點(diǎn)的值代表了圖像在該點(diǎn)的顏色信息,正是許多這樣的點(diǎn)的組合、排列呈現(xiàn)在我們的眼中才使得繽紛五彩的世界得以在計(jì)算機(jī)的屏幕上顯示出來。然而對于圖像聚類和圖像檢索來說,將全部這些點(diǎn)作為數(shù)據(jù)進(jìn)行分析處理是沒有必要也是不切實(shí)際的。例如在汽車車型識別中,圖像中的道路和行人以及其他建筑物都屬于無用信息,對于識別車型來說沒有任何意義,應(yīng)該將其去除,否則在識別時(shí)會產(chǎn)生不利影響。
?????? 所謂特征是從模式中得到的對分類有用的度量或?qū)傩裕瑧?yīng)該能夠反映不同類別之間的本質(zhì)差別。正如我們每個(gè)人具有高、矮、胖、瘦各不相同的特征一樣,不同的圖像之間也存在著互相得以區(qū)分的特征。在圖像聚類與檢索中,這些特征一般表示為一組數(shù)字,這些數(shù)字構(gòu)成一個(gè)矢量,稱為特征矢量。抓住關(guān)鍵特征,忽略其它信息是一種通用的、有效的方法。顏色和紋理是圖像的兩個(gè)最重要的特征,本文將對顏色和紋理的聚類與檢索進(jìn)行探討。
l???????? 顏色
?????? 在圖像的自動分析檢索中,顏色是一種能夠簡化目標(biāo)提取和分類的一種重要描述符,最早在基于內(nèi)容的圖像檢索中得到應(yīng)用。顏色特征定義比較明確,抽取也相對容易,所以在圖像處理中得到廣泛的重視和應(yīng)用,并已提出了很多成熟的算法。對顏色特征的表達(dá)方式有很多種,如直方圖法,累積直方圖法,局部累加直方圖法,顏色布局法,中心矩法等。由于顏色的信息量比較大,所以各種方法的共同的一點(diǎn)就是要用較有效和緊湊的辦法來表達(dá)顏色信息。
l???????? 紋理
?????? 紋理是另一個(gè)用于描述圖像的常用的概念。紋理通常被看作圖像的某種局部特性,或是對局部區(qū)域中圖像間關(guān)系的一種度量。另外,紋理信息也可以用來對圖像中的空間信息進(jìn)行一定程度的定量描述。基于紋理的圖像檢索也有很多成果。
2. 確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量
?????? 獲取了圖像的特征為我們接下來的工作奠定了良好的基礎(chǔ),我們的目標(biāo)是圖像的聚類和檢索,從根本上說就是將特征相近的圖像找出來。這里的“特征相近”只是一個(gè)直觀上的概念,何謂“相近”,不同的情況下有著不同的解釋。因此,我們很有必要定義一個(gè)具體的數(shù)學(xué)描述符定量的體現(xiàn)兩幅圖片間“相近”的程度,這就是相似性度量。顯然,我們的目標(biāo)就是找到相似度最小的圖像。
3.利用聚類算法對圖像庫中的圖像進(jìn)行聚類
?????? 人類的分類識別能力不是與生俱來的,而是后天經(jīng)過不斷的實(shí)踐和學(xué)習(xí)而逐漸具有的功能,例如對語言的學(xué)習(xí),對文字的學(xué)習(xí)。
?????? 在圖像檢索的過程中我們同樣面臨著分類的任務(wù),具體地講就是圖像的聚類。所謂圖像聚類就是將未知類別的一組圖像分成若干類的過程,也稱無監(jiān)督學(xué)習(xí)或無教師學(xué)習(xí)。聚類分析的思路比較直觀,根據(jù)各個(gè)待分類圖像特征的相似程度來進(jìn)行分類,將在特征空間中聚集在一起的樣本點(diǎn)劃分為一類。選擇合適的聚類算法對圖像庫中的圖像進(jìn)行聚類,是我們的核心任務(wù)之一。
4.利用匹配算法在圖像庫中檢索相應(yīng)的圖像
?????? 匹配可理解為結(jié)合不同的、已經(jīng)存在的表達(dá)而建立他們的解釋之間的聯(lián)系的技術(shù)與過程。從廣義上講,匹配是要研究如何把知識模型與從圖像獲得的描述信息對應(yīng)起來,從而達(dá)到識別目標(biāo),理解圖像,認(rèn)知世界的過程。而具體到基于內(nèi)容的圖像信息檢索,就是要將從查詢要求通過分析而得到的描述與需要檢索的圖像數(shù)據(jù)庫中個(gè)體的描述進(jìn)行比較,以便提取出視覺效果或語義內(nèi)容最為接近/相似的個(gè)體。
?????? 通俗地講,我們就是要根據(jù)用戶需要檢索的圖像的特征,到圖像庫中與現(xiàn)存的圖像特征進(jìn)行比較,根據(jù)一定的算法,找出相似度最小的一個(gè)或一組圖像,完成一個(gè)匹配過程,將用戶最希望得到的圖像信息檢索出來。
小結(jié):
?????? 通過從圖像中抽取分類和檢索的特征 , 確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量 , 利用聚類算法對圖像庫中的圖像進(jìn)行聚類,利用匹配算法在圖像庫中檢索相應(yīng)的圖像這四個(gè)步驟,我們基本提出了一個(gè)可行的圖像聚類與檢索的方案,接下來探討一些具體的關(guān)鍵技術(shù)與實(shí)驗(yàn)。
目的和意義
?????? 隨著科學(xué)技術(shù)的進(jìn)步發(fā)展和推廣應(yīng)用,特別是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,信息高速公路的建設(shè),以及多媒體的推廣應(yīng)用,現(xiàn)代信息處理的對象和方法都有了很大的變化。大量的各種類型的信息在全球得到了采集、傳輸、流通和應(yīng)用,人們正快速的進(jìn)入一個(gè)信息化的社會。
?????? 多媒體是一種極其重要的信息資源,現(xiàn)代技術(shù)已能運(yùn)用各種手段大量地采集和產(chǎn)生各種類型的多媒體信息數(shù)據(jù),而多媒體信息中占有舉足輕重作用的一種就是圖像信息。近年來隨著需求的增加、工藝技術(shù)的進(jìn)步,以各種方式獲取的圖像信息的數(shù)量得到了飛速的增長,進(jìn)入新世紀(jì)后,有人估計(jì)世界每年產(chǎn)生的新圖像已達(dá) 800 億幅,信息膨脹已給人類帶來過多的信息量以致超出了人的接受能力,有鑒于此,如何快速、準(zhǔn)確、高效的從浩如煙海的圖像信息源(比如網(wǎng)絡(luò))中獲取有用的信息就變得極為重要,近年來國際上廣泛開展了基于內(nèi)容的圖像檢索研究,而其中圖像聚類與檢索技術(shù)已取得相當(dāng)進(jìn)展,在各個(gè)領(lǐng)域已得到了廣泛的應(yīng)用。
?????? 所謂圖像聚類就是在給出的圖像集合中,根據(jù)圖像的內(nèi)容,在無先驗(yàn)知識的條件下,將圖像分成有意義的簇。對于圖像聚類,最引人注目的特征屬性是顏色、紋理和形狀等。目前有很多有效的聚類技術(shù),如層次聚類算法、基于分割的算法、混合——溶解算法、模式——搜尋算法、最近相鄰聚類、模糊聚類和進(jìn)化聚類方法。
?????? 所謂圖像檢索是從圖像數(shù)據(jù)庫中快速的提取出一個(gè)與查詢相關(guān)的圖像或圖像序列。隨著越來越多的圖像數(shù)據(jù)庫的建立和越來越多的圖像信息在數(shù)字檔案中的應(yīng)用,對圖像信息檢索的需求越來越大。
?????? 只有掌握了對圖像信息進(jìn)行自動查詢和選擇的技術(shù),才能使人類只接受或快速地獲取需要的信息而不至于淹沒于圖像信息的汪洋大海中。有鑒于此,本文將對圖像聚類與檢索的方法進(jìn)行研究,本文的實(shí)驗(yàn)圖庫為一特定情況下的圖像庫,具體地說是一組灰度圖像,該組圖像是一系列連續(xù)拍攝的列車行進(jìn)照片,因此不同的圖像之間既有相似性,又有因運(yùn)動和拍攝時(shí)間的不同而形成的差異性,對于實(shí)驗(yàn)結(jié)果的分析較為有利。另外,如果時(shí)間、條件允許,也可以實(shí)現(xiàn)對任意圖像進(jìn)行聚類、檢索(包括彩色圖像)。