Caltech101是屬于image categorization數(shù)據(jù)庫,見Linear Spatial Pyramid Matching using Sparse Coding for Image Classification(CVPR09-ScSPM)摘要寫了: In a number of image categorization experiments, 其標(biāo)題是Image Classification。Mingming Gong講image/object Classification/categorization 四個是一樣的概念.
我自己到谷歌上搜索:object categorization COIL,發(fā)現(xiàn)A novel color-context descriptor and its applications (ICME 2009)摘要最后一句: Experiments validate the discriminant power of the proposed descriptor in object categorization on COIL- 100 database and pedestrian identification in surveillance videos.故Deng Cai主頁的COIL是屬于object categorization的
中文名稱:圖像檢索
英文名稱:image retrieval
定義:在圖像集合中查找具有指定特征或包含指定內(nèi)容的圖像的技術(shù)。Yong Luo said比如線性化特征抽取方法,應(yīng)該是用訓(xùn)練集學(xué)習(xí)一個投影矩陣,然后應(yīng)用到測試集上來相互query,訓(xùn)練集丟掉,相當(dāng)于離線學(xué)習(xí)了一個投影矩陣
Reference
http://baike.baidu.com/view/63486.htm
Learning a Maximum Margin Subspace for Image Retrieval
Dong Xu's Phd thesis Section 7
Cooperative Sparse Representation Semi-supervised Image Annotation
---------------------------------------------------------------------------------------------------------------------------------------------------
圖像分類是測試樣本的預(yù)測label和實際的label比較得準(zhǔn)確率。圖像標(biāo)注本質(zhì)也是分類,是測試樣本預(yù)測出來的tag和實際的tag做比較得準(zhǔn)確率,看voc 07的訓(xùn)練tag,是5011*804的矩陣,也就是總共804個tag,如果該樣本有這個tag,則該位置的tag是1否則是0.一個圖像可以有多個tag,image annotation本質(zhì)也是multi-label的問題。是不是所有樣本的tag確實只有804個,其實有更多,將一些頻率比較低的去掉了。Yong Luo講在測試時有這樣的情況,測試樣本沒有tag,這時沒法算準(zhǔn)確率,就將這個測試樣本去掉。
---------------------------------------------------------------------------------------------------------------------------------------------------------
image annotation就是image classification. 見Cooperative Sparse Representation Semi-supervised Image Annotation. VI節(jié)A節(jié)第三段:with the annotations from a set of total 20 keywords.This is discussing with Weifeng Liu and Yong Luo. Sparse Unsupervised Dimensionality Reduction for Multiple View Data該文IV節(jié)E節(jié) 2)就用的Image Classification and Annotation.該文用三個數(shù)據(jù)集,MIML僅有類別沒有tag,后兩個僅有tag沒有類別,論文說了分別81和100個tag,故MIML是測試樣本的預(yù)測label和實際的label比較得準(zhǔn)確率,后兩個庫是是測試樣本的預(yù)測tag和實際的tag比較得準(zhǔn)確率。Yong Luo講沒有人在voc上做image annotation,因為其tag沒有太多的語義信息,比如pascal07_dictionary的804個tag中還有2003,voc的tag只能作為特征。
Yong Luo:另外還有三個做annotation的數(shù)據(jù)庫Corel 5K,IAPR TC-12,ESP GAME. Annotation是給圖像加標(biāo)注,阿秋TIP fig 3. Tian Xia MSE實驗第三節(jié)是Video annotation, Tian Xia寫了,和image retrival做法一樣。這三個數(shù)據(jù)庫Yong Luo 建議不要按照ML-KNN的五個指標(biāo)來進(jìn)行比較。Image annotation就按照annotation的指標(biāo),TagProp Discriminative Metric Learning (ICCV 2009)Table 3的P、R和N+。這三個指標(biāo)的定義該文講了,該文參考文獻(xiàn)17 A. Makadia, V. Pavlovic, and S. Kumar. A new baseline for image annotation. In ECCV, 2008也講了。
整個領(lǐng)域基本都是分類或者回歸問題,少部分是回歸,比如是年齡回歸(age regression)。mingming gong said that介于兩者之間的還有一個是ordinal regression = ranking(值是離散的,還有大小)