總體設(shè)計方案:
?????? 本文將采取基于特征的方法對圖像進行聚類與檢索。基于特征對圖像進行聚類與檢索的基本方法是在建立圖像庫時 , 對輸入的圖像先進行圖像分析 , 提取圖像或目標的特征向量并根據(jù)特征向量及匹配算法等將圖像進行聚類。在進行圖像檢索時 , 對每一幅給定的查詢圖 , 進行圖像分析并提取該圖的特征向量。通過將該圖特征向量與特征庫中的特征向量進行匹配并根據(jù)匹配結(jié)果到圖像庫中搜索就可提取出所需要的檢索圖像來。
?????? 由上述工作原理可以知道基于特征的圖像聚類與檢索有四個關(guān)鍵 , 一是要從圖像中抽取分類和檢索的特征 , 二是確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量 , 三是要利用聚類算法對圖像庫中的圖像進行聚類,四是要利用匹配算法在圖像庫中檢索相應(yīng)的圖像。
1 .從圖像中抽取分類和檢索的特征
?????? 我們知道,一幅圖像是以矩陣的形式存儲在計算機中的,具體地講,矩陣上某一點的值代表了圖像在該點的顏色信息,正是許多這樣的點的組合、排列呈現(xiàn)在我們的眼中才使得繽紛五彩的世界得以在計算機的屏幕上顯示出來。然而對于圖像聚類和圖像檢索來說,將全部這些點作為數(shù)據(jù)進行分析處理是沒有必要也是不切實際的。例如在汽車車型識別中,圖像中的道路和行人以及其他建筑物都屬于無用信息,對于識別車型來說沒有任何意義,應(yīng)該將其去除,否則在識別時會產(chǎn)生不利影響。
?????? 所謂特征是從模式中得到的對分類有用的度量或?qū)傩裕瑧?yīng)該能夠反映不同類別之間的本質(zhì)差別。正如我們每個人具有高、矮、胖、瘦各不相同的特征一樣,不同的圖像之間也存在著互相得以區(qū)分的特征。在圖像聚類與檢索中,這些特征一般表示為一組數(shù)字,這些數(shù)字構(gòu)成一個矢量,稱為特征矢量。抓住關(guān)鍵特征,忽略其它信息是一種通用的、有效的方法。顏色和紋理是圖像的兩個最重要的特征,本文將對顏色和紋理的聚類與檢索進行探討。
l???????? 顏色
?????? 在圖像的自動分析檢索中,顏色是一種能夠簡化目標提取和分類的一種重要描述符,最早在基于內(nèi)容的圖像檢索中得到應(yīng)用。顏色特征定義比較明確,抽取也相對容易,所以在圖像處理中得到廣泛的重視和應(yīng)用,并已提出了很多成熟的算法。對顏色特征的表達方式有很多種,如直方圖法,累積直方圖法,局部累加直方圖法,顏色布局法,中心矩法等。由于顏色的信息量比較大,所以各種方法的共同的一點就是要用較有效和緊湊的辦法來表達顏色信息。
l???????? 紋理
?????? 紋理是另一個用于描述圖像的常用的概念。紋理通常被看作圖像的某種局部特性,或是對局部區(qū)域中圖像間關(guān)系的一種度量。另外,紋理信息也可以用來對圖像中的空間信息進行一定程度的定量描述。基于紋理的圖像檢索也有很多成果。
2. 確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量
?????? 獲取了圖像的特征為我們接下來的工作奠定了良好的基礎(chǔ),我們的目標是圖像的聚類和檢索,從根本上說就是將特征相近的圖像找出來。這里的“特征相近”只是一個直觀上的概念,何謂“相近”,不同的情況下有著不同的解釋。因此,我們很有必要定義一個具體的數(shù)學描述符定量的體現(xiàn)兩幅圖片間“相近”的程度,這就是相似性度量。顯然,我們的目標就是找到相似度最小的圖像。
3.利用聚類算法對圖像庫中的圖像進行聚類
?????? 人類的分類識別能力不是與生俱來的,而是后天經(jīng)過不斷的實踐和學習而逐漸具有的功能,例如對語言的學習,對文字的學習。
?????? 在圖像檢索的過程中我們同樣面臨著分類的任務(wù),具體地講就是圖像的聚類。所謂圖像聚類就是將未知類別的一組圖像分成若干類的過程,也稱無監(jiān)督學習或無教師學習。聚類分析的思路比較直觀,根據(jù)各個待分類圖像特征的相似程度來進行分類,將在特征空間中聚集在一起的樣本點劃分為一類。選擇合適的聚類算法對圖像庫中的圖像進行聚類,是我們的核心任務(wù)之一。
4.利用匹配算法在圖像庫中檢索相應(yīng)的圖像
?????? 匹配可理解為結(jié)合不同的、已經(jīng)存在的表達而建立他們的解釋之間的聯(lián)系的技術(shù)與過程。從廣義上講,匹配是要研究如何把知識模型與從圖像獲得的描述信息對應(yīng)起來,從而達到識別目標,理解圖像,認知世界的過程。而具體到基于內(nèi)容的圖像信息檢索,就是要將從查詢要求通過分析而得到的描述與需要檢索的圖像數(shù)據(jù)庫中個體的描述進行比較,以便提取出視覺效果或語義內(nèi)容最為接近/相似的個體。
?????? 通俗地講,我們就是要根據(jù)用戶需要檢索的圖像的特征,到圖像庫中與現(xiàn)存的圖像特征進行比較,根據(jù)一定的算法,找出相似度最小的一個或一組圖像,完成一個匹配過程,將用戶最希望得到的圖像信息檢索出來。
小結(jié):
?????? 通過從圖像中抽取分類和檢索的特征 , 確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量 , 利用聚類算法對圖像庫中的圖像進行聚類,利用匹配算法在圖像庫中檢索相應(yīng)的圖像這四個步驟,我們基本提出了一個可行的圖像聚類與檢索的方案,接下來探討一些具體的關(guān)鍵技術(shù)與實驗。

