本發(fā)明涉及一種融合顏色特征與詞匯樹的車輛圖像檢索方法,屬于圖像處理與分析在智能交通系統(tǒng)上的應(yīng)用。
背景技術(shù):
車輛圖像檢索是智能交通系統(tǒng)的重要組成部分,是公安系統(tǒng)破獲車輛被盜等相關(guān)案件的重要手段。所以面對(duì)城市交通中的海量卡口高清圖像,車輛圖像檢索的準(zhǔn)確性和高效性對(duì)及時(shí)破案極為關(guān)鍵?;谠~袋模型的圖像檢索機(jī)制是近幾年來圖像檢索領(lǐng)域的主流方法,該方法將大量訓(xùn)練圖像特征(通常是SIFT特征)通過k-means聚類映射為視覺單詞的集合,構(gòu)成視覺單詞詞典。然后將測(cè)試圖像的特征逐個(gè)匹配量化到視覺單詞詞典中,得到了圖像的視覺單詞直方圖。由于將大量特征量化到視覺單詞這個(gè)過程時(shí)間耗損過大,為此,Nistér等人提出了利用分層k-means聚類的方法生成視覺單詞詞匯樹,有效解決了搜索非層次化單詞帶來的量化過程太慢的問題,生成的視覺單詞由TF-IDF模型(詞頻-逆文檔頻率)加權(quán)。由于視覺詞匯樹模型采用的SIFT特征只采用了灰度信息,而忽略了圖像的全局顏色特征,因此,本發(fā)明將車輛圖像的顏色信息作為圖像全局權(quán)值融入到視覺單詞匹配模型中去,從而提高車輛圖像的檢索精度,同時(shí)本發(fā)明引入感知哈希算法原理,能有效節(jié)約大規(guī)模車輛圖像檢索時(shí)間。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種融合顏色特征與詞匯樹的車輛圖像檢索方法,本發(fā)明檢索時(shí)間縮短,并在一定程度上提高檢索精度,能夠滿足現(xiàn)實(shí)使用中對(duì)準(zhǔn)確性和實(shí)時(shí)性的要求。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種融合顏色特征與詞匯樹的車輛圖像檢索方法,其特征在于,包括以下部分:
S01、詞匯樹的創(chuàng)建:對(duì)訓(xùn)練圖像庫(kù)中的每幅圖像先提取車身部分,對(duì)于剔除掉背景部分的車輛圖像提取SIFT特征,這樣就得到了一個(gè)特征集合F={f(i)}。然后對(duì)特征集合F進(jìn)行分層k-means聚類。初始時(shí),在詞匯樹的第一層上對(duì)特征集合F進(jìn)行第一次k-means聚類,計(jì)算出每個(gè)聚類的中心向量Ci。類似的,對(duì)新產(chǎn)生的每個(gè)聚類再用k-means聚類聚成k個(gè)簇集,不斷地重復(fù)上述操作直到樹的深度達(dá)到預(yù)先設(shè)定的L值,每個(gè)簇集定義為一個(gè)視覺單詞,得到視覺單詞詞匯樹;
S02、用權(quán)值向量來表示圖像:提取測(cè)試圖像庫(kù)中圖像的車身部分,對(duì)于剔除掉背景部分的車輛圖像提取SIFT特征,分別將每個(gè)SIFT特征分配給詞匯樹中最為接近的視覺單詞,然后依據(jù)每幅圖像中視覺單詞出現(xiàn)的次數(shù)以及視覺單詞與圖像的相關(guān)程度來計(jì)算圖像的視覺單詞權(quán)值;
S03、顏色特征權(quán)重的計(jì)算:提取圖像車身部分HSV顏色空間模型,采用均勻分段的方法對(duì)特征進(jìn)行量化,再將特征向量統(tǒng)一到一個(gè)特征度中,計(jì)算查詢圖像與待檢索圖像之間的特征度歐式距離排序并標(biāo)號(hào),根據(jù)顏色標(biāo)號(hào)建立顏色特征權(quán)重;
S04、感知哈希進(jìn)制數(shù)的選擇:為提高大規(guī)模圖像的檢索效率,本發(fā)明采用感知哈希算法原理,將視覺單詞分別量化給不同的哈希碼,在綜合考慮本發(fā)明的量化時(shí)間與檢索正確率之后,本發(fā)明的進(jìn)制數(shù)選取為4;
S05、圖像相似度計(jì)算:通過漢明距離計(jì)算圖像哈希序列的感知距離,再將顏色特征權(quán)重作為漢明距離的加權(quán)系數(shù)得到最終查詢圖像與待檢索圖像的相似度sim(q,d)=CqdHqd,將最為相似圖像輸出。
作為本發(fā)明的進(jìn)一步說明,所述步驟S02具體為:
(1)對(duì)測(cè)試庫(kù)中每一幅圖像首先提取車身部分,對(duì)車身部分提取SIFT特征,這樣就得到了一個(gè)特征集合F={f(i)}以及相應(yīng)的圖像ID集合imgID={id(i)};
(2)根據(jù)距離最近原則將SIFT特征分配給詞匯樹中最鄰近的視覺單詞,這樣每幅圖像的SIFT特征就轉(zhuǎn)化成了視覺單詞;
(3)wi,j則表示圖像dj中視覺單詞Fi的權(quán)值,即視覺單詞Fi與圖像dj的相關(guān)程度。權(quán)值是按照TF-IDF的原理定義的,mi,j表示視覺單詞Fi在圖像dj中出現(xiàn)的次數(shù),它可以用來衡量視覺單詞用來描述圖像的好壞程度。N表示圖像庫(kù)中圖像的總數(shù),ni表示包含視覺單詞Fi的圖像數(shù)目。逆文獻(xiàn)頻率定義為idfi=lg(N/ni),它表示的含義是視覺單詞對(duì)于區(qū)分相似圖像和不相似圖像的作用大小。所以,wi,j可以表示為
(4)圖像dj可以用視覺單詞的權(quán)值向量來表示為dj=[w1,j,w2,j,L,wt,j],測(cè)試圖像庫(kù)中的所有圖像可以用矩陣表示為
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S03具體為:
(1)對(duì)圖像直接提取HSV空間顏色特征向量,為了降低計(jì)算復(fù)雜程度,采用均勻分段的方法對(duì)顏色特征進(jìn)行量化,為了降低計(jì)算復(fù)雜程度,采用均勻分段的方法對(duì)顏色特征進(jìn)行量化,在根據(jù)公式L=HQSQV+SQV+V將特征向量統(tǒng)一到一個(gè)特征度中,其中QS、QV分別表示飽和度和亮度分量的量化級(jí)數(shù);
(2)計(jì)算查詢圖像與待檢索圖像之間的特征度歐式距離,根據(jù)歐式距離由小到大進(jìn)行排序并標(biāo)號(hào),顏色最相似的標(biāo)號(hào)為1,第二相似標(biāo)號(hào)為2,以此類推;
(3)根據(jù)顏色的標(biāo)號(hào)建立顏色特征權(quán)重,查詢圖像q和圖像d的顏色特征權(quán)重計(jì)算公式為其中Rqd表示在查詢圖像為q時(shí),圖像d的標(biāo)號(hào)。
作為本發(fā)明的進(jìn)一步說明,所述步驟S04具體為:
(1)鑒于本發(fā)明的進(jìn)制數(shù)為4,計(jì)算同一視覺單詞在各個(gè)圖像中權(quán)值的和,平均將它分為四段,每一段表示一個(gè)哈希碼,得到四個(gè)哈希碼區(qū)間;
(2)將每個(gè)視覺單詞與其對(duì)應(yīng)的視覺單詞的哈希碼區(qū)間進(jìn)行比較,分別將各個(gè)視覺單詞映射給哈希碼,得到圖像的哈希碼序列。
本發(fā)明的有益效果是,將圖像的顏色特征作為全局權(quán)值加入到視覺單詞的權(quán)值匹配中去,將全局特征與局部特征綜合考慮,并引入感知哈希算法原理,在有效節(jié)約檢索時(shí)間的基礎(chǔ)上,也一定程度提高了車輛圖像檢索的準(zhǔn)確率。
附圖說明
圖1為本發(fā)明所提供的一種融合顏色特征與詞匯樹的車輛圖像檢索方法流程圖。
具體實(shí)施方式
下面結(jié)合附圖所示的各實(shí)施方式對(duì)本發(fā)明進(jìn)行詳細(xì)說明,但應(yīng)當(dāng)說明的是,這些實(shí)施方式并非對(duì)本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員根據(jù)這些實(shí)施方式所作的功能、方法、或者結(jié)構(gòu)上的等效變換或替代,均屬于本發(fā)明的保護(hù)范圍之內(nèi)。
針對(duì)當(dāng)前基于詞袋模型以及詞匯樹的車輛圖像檢索方法采用的SIFT特征只基于灰度信息,忽略了圖像的顏色信息,本發(fā)明提出了一種融合顏色特征與詞匯樹的車輛圖像檢索方法,下面進(jìn)行詳細(xì)說明:
在本實(shí)施方式中,一種融合顏色特征與詞匯樹的車輛檢索方法,其包括以下部分:
S01、詞匯樹的創(chuàng)建:對(duì)訓(xùn)練圖像庫(kù)中的每幅圖像先提取車身部分,對(duì)于剔除掉背景部分的車輛圖像提取SIFT特征,這樣就得到了一個(gè)特征集合F={f(i)}。然后對(duì)特征集合F進(jìn)行分層k-means聚類。初始時(shí),在詞匯樹的第一層上對(duì)特征集合F進(jìn)行第一次k-means聚類,計(jì)算出每個(gè)聚類的中心向量Ci。類似的,對(duì)新產(chǎn)生的每個(gè)聚類再用k-means聚類聚成k個(gè)簇集,不斷地重復(fù)上述操作直到樹的深度達(dá)到預(yù)先設(shè)定的L值,每個(gè)簇集定義為一個(gè)視覺單詞,得到視覺單詞詞匯樹;
S02、用權(quán)值向量來表示圖像:提取測(cè)試圖像庫(kù)中圖像的車身部分,對(duì)于剔除掉背景部分的車輛圖像提取SIFT特征,分別將每個(gè)SIFT特征分配給詞匯樹中最為接近的視覺單詞,然后依據(jù)每幅圖像中視覺單詞出現(xiàn)的次數(shù)以及視覺單詞與圖像的相關(guān)程度來計(jì)算圖像的視覺單詞權(quán)值;
所述步驟S02具體為:
(1)對(duì)測(cè)試庫(kù)中每一幅圖像首先提取車身部分,對(duì)車身部分提取SIFT特征,這樣就得到了一個(gè)特征集合F={f(i)}以及相應(yīng)的圖像ID集合imgID={id(i)};
(2)根據(jù)距離最近原則將SIFT特征分配給詞匯樹中最鄰近的視覺單詞,這樣每幅圖像的SIFT特征就轉(zhuǎn)化成了視覺單詞;
(3)wi,j則表示圖像dj中視覺單詞Fi的權(quán)值,即視覺單詞Fi與圖像dj的相關(guān)程度。權(quán)值是按照TF-IDF的原理定義的,mi,j表示視覺單詞Fi在圖像dj中出現(xiàn)的次數(shù),它可以用來衡量視覺單詞用來描述圖像的好壞程度。N表示圖像庫(kù)中圖像的總數(shù),ni表示包含視覺單詞Fi的圖像數(shù)目。逆文獻(xiàn)頻率定義為idfi=lg(N/ni),它表示的含義是視覺單詞對(duì)于區(qū)分相似圖像和不相似圖像的作用大小。所以,wi,j可以表示為
(4)圖像dj可以用視覺單詞的權(quán)值向量來表示為dj=[w1,j,w2,j,L,wt,j],測(cè)試圖像庫(kù)中的所有圖像可以用矩陣表示為
S03、顏色特征權(quán)重的計(jì)算:提取圖像車身部分HSV顏色空間模型,采用均勻分段的方法對(duì)特征進(jìn)行量化,再將特征向量統(tǒng)一到一個(gè)特征度中,計(jì)算查詢圖像與待檢索圖像之間的特征度歐式距離排序并標(biāo)號(hào),根據(jù)顏色標(biāo)號(hào)建立顏色特征權(quán)重;
所述步驟S03具體為:
(1)對(duì)圖像直接提取HSV空間顏色特征向量,為了降低計(jì)算復(fù)雜程度,采用均勻分段的方法對(duì)顏色特征進(jìn)行量化,為了降低計(jì)算復(fù)雜程度,采用均勻分段的方法對(duì)顏色特征進(jìn)行量化,在根據(jù)公式L=HQSQV+SQV+V將特征向量統(tǒng)一到一個(gè)特征度中,其中QS、QV分別表示飽和度和亮度分量的量化級(jí)數(shù);
(2)計(jì)算查詢圖像與待檢索圖像之間的特征度歐式距離,根據(jù)歐式距離由小到大進(jìn)行排序并標(biāo)號(hào),顏色最相似的標(biāo)號(hào)為1,第二相似標(biāo)號(hào)為2,以此類推;
(3)根據(jù)顏色的標(biāo)號(hào)建立顏色特征權(quán)重,查詢圖像q和圖像d的顏色特征權(quán)重計(jì)算公式為其中Rqd表示在查詢圖像為q時(shí),圖像d的標(biāo)號(hào)。
S04、感知哈希進(jìn)制數(shù)的選擇:為提高大規(guī)模圖像的檢索效率,本發(fā)明采用感知哈希算法原理,將視覺單詞分別量化給不同的哈希碼,在綜合考慮本發(fā)明的量化時(shí)間與檢索正確率之后,本發(fā)明的進(jìn)制數(shù)選取為4;
所述步驟S04具體為:
(1)鑒于本發(fā)明的進(jìn)制數(shù)為4,計(jì)算同一視覺單詞在各個(gè)圖像中權(quán)值的和,平均將它分為四段,每一段表示一個(gè)哈希碼,得到四個(gè)哈希碼區(qū)間;
(2)將每個(gè)視覺單詞與其對(duì)應(yīng)的視覺單詞的哈希碼區(qū)間進(jìn)行比較,分別將各個(gè)視覺單詞映射給哈希碼,得到圖像的哈希碼序列。
S05、圖像相似度計(jì)算:通過漢明距離計(jì)算圖像哈希序列的感知距離,再將顏色特征權(quán)重作為漢明距離的加權(quán)系數(shù)得到最終查詢圖像與待檢索圖像的相似度sim(q,d)=CqdHqd,將最為相似圖像輸出。
以上已以較佳實(shí)施例公開了本發(fā)明,然其并非用以限制本發(fā)明,凡采用等同替換或者等效變換方式所獲得的技術(shù)方案,均落在本發(fā)明的保護(hù)范圍之內(nèi)。
對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
此外,雖然本說明書按照實(shí)施方式加以描述,但并非每個(gè)實(shí)施方式僅包含一個(gè)獨(dú)立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)將說明書作為一個(gè)整體,各實(shí)施例中的技術(shù)方案也可以經(jīng)適當(dāng)組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實(shí)施方式。