本發(fā)明涉及一種圖像識別技術(shù),尤其涉及的是一種中級視覺毒品圖像識別方法。
背景技術(shù):
隨著毒品的泛濫,毒品對人們的危害越來越大,輕者身體受到傷害,重者家破人亡?,F(xiàn)在去識別毒品的方法主要靠以下幾種方法:1.靠緝毒犬2.人工緝毒(嗅聞和手捻)3.昆蟲探測毒品(蜜蜂)4.毒品檢測器等。這些方法很好,但也有很多不足。如果販賣毒品人員把毒品圖片放在網(wǎng)上銷售毒品并以其它名字命名,那么以上幾種方法就行不通。還有一種情況就是,比如警察掃黃打黑中不能每次都帶緝毒犬,緝毒人員,和緝毒工具,這樣現(xiàn)場可能就存在毒品,那么就會有毒品沒識別出來,讓它流失到市場危害人群。如果利用計(jì)算機(jī)視覺識別就會方便很多,只需要把一些現(xiàn)場的圖片拿來測試就可知道其試不試毒品,只是需要采集大量的毒品圖片去訓(xùn)練模型。
計(jì)算機(jī)視覺識別的方法有很多種:
1、基于局部特征的方法是一種自底向上的識別方法。這種方法首先在整個(gè)圖像中提取一組毒品圖像的局部紋理、形狀等特征,然后把這些特征送入svm、貝葉斯或單層神經(jīng)網(wǎng)絡(luò)等分類器中訓(xùn)練這些分類器。在識別階段用和訓(xùn)練階段同樣的方法提取特征送入已訓(xùn)練好的分類器判斷結(jié)果。
基于局部特征的識別方法采用何種低級視覺特征、如何選擇分類器都是根據(jù)經(jīng)驗(yàn)的,很難保證最佳識別效果,識別計(jì)算比較耗時(shí),效率不高。
2、基于視覺詞袋的高級語義模型的毒品圖像識別方法,在訓(xùn)練階段提取sift或者dense-sift、hue-sift等特征通過聚類的方法構(gòu)建視覺詞袋,每一幅訓(xùn)練圖像都利用構(gòu)建的視覺詞袋表示為一個(gè)高維特征向量,使用這些特征向量訓(xùn)練一個(gè)svm分類器。對待檢測的圖像用同樣方法提取特征送入已訓(xùn)練好的分類器即可獲得結(jié)果。
這種方法采用何種特征構(gòu)建視覺詞袋是困難的,視覺詞袋的大小沒有對應(yīng)的評價(jià)標(biāo)準(zhǔn)。
3、基于深度學(xué)習(xí)的毒品圖像識別方法,采集大量的毒品圖片并做好訓(xùn)練的標(biāo)簽,訓(xùn)練分兩種情況:如果訓(xùn)練數(shù)據(jù)比較少,首先通過大數(shù)據(jù)集imagenet訓(xùn)練,用經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu)(比如vgg和alexnet等),甚至可以用多達(dá)152層的殘基網(wǎng)絡(luò)以提取圖像的低級、中級和高級語義特征;然后使用采取的數(shù)據(jù)在此基礎(chǔ)上進(jìn)一步提高其特征的有效性:如果訓(xùn)練數(shù)據(jù)量很大,在經(jīng)典的網(wǎng)絡(luò)上訓(xùn)練,提取圖片的低級、中級和高級語義特征。最后通過這些特征用分類器去分類。
這種方法的缺點(diǎn)是:神經(jīng)網(wǎng)絡(luò)易陷入局部極小值和過擬合等現(xiàn)象;計(jì)算量大,耗時(shí)比較長;對數(shù)據(jù)依賴很強(qiáng)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種中級視覺毒品圖像識別方法,能夠利用計(jì)算機(jī)識別毒品。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明包括以下步驟:
(1)通過人工標(biāo)定的方法獲取毒品的圖像與非毒品圖像,對這些圖像進(jìn)行預(yù)處理與增強(qiáng)獲得有效的方形訓(xùn)練圖像;
(2)隨機(jī)從訓(xùn)練集中選圖像,將每一張圖像分割成m個(gè)不同的部分,這m個(gè)部分即為中級視覺圖,將中級視覺圖放入下面公式(1),(2)中進(jìn)行自主學(xué)習(xí),經(jīng)過多次迭代,最后分配給每個(gè)中級視覺圖不同的權(quán)重值即概率;
(3)將m個(gè)中層視覺圖及其概率,放入到貝葉斯中分類器中進(jìn)行分類,經(jīng)過多次迭代最后得到模型;
(4)將得到的模型在測試集上進(jìn)行測試,根據(jù)測試結(jié)果調(diào)整訓(xùn)練集數(shù)據(jù),把識別錯(cuò)誤的物體放入到貝葉斯分類器中繼續(xù)訓(xùn)練,得到最終的模型;
(5)隨機(jī)測試某張圖片在訓(xùn)練好的模型上,輸出結(jié)果判斷是哪一種毒品。
所述步驟(1)中,通過人工標(biāo)定的方法,獲得每種毒品的足夠量的照片,隨機(jī)將每個(gè)種類的毒品照片分別劃分為訓(xùn)練集、測試集。
所述訓(xùn)練集和測試集的圖像通過轉(zhuǎn)置、水平鏡像翻轉(zhuǎn)、高斯模糊、添加隨機(jī)噪聲實(shí)現(xiàn)增強(qiáng)。
所述步驟(2)中,使用二值化歸一梯度,檢測候選框?qū)⒄麖垐D像中可能是物體的部分框出,并根據(jù)框出部分的坐標(biāo)將其分割出來,最終得到m個(gè)不同大小中級視覺圖。
每次放一定數(shù)量的圖片去訓(xùn)練m個(gè)視覺圖的權(quán)重,不斷更新m個(gè)部分的權(quán)重,最后得到最終的權(quán)重,是正樣本的權(quán)重占的比例大些,是負(fù)樣本的權(quán)重占的小些。
所述權(quán)重計(jì)算公式如下:
定義
中級視覺正樣本數(shù)據(jù)集為
一般特征提取采用的都是像素級別的特征去訓(xùn)練模型,比如比較熱門的深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一個(gè)分支,就是采用像素級特征去訓(xùn)練模型的。而本發(fā)明提出中級視覺概率的框架思想去訓(xùn)練模型分類網(wǎng)絡(luò)。所謂中級視覺,其實(shí)就是把圖片分割成很多小部分,如假設(shè)圖片為p,那么p有很多中級視覺圖片,分別記為p1,p2,..pm。以這些中級視覺的概率作為貝葉斯分類器的輸入,是正樣本的權(quán)重比例大,負(fù)樣本的權(quán)重比例小。本發(fā)明旨在提出構(gòu)建中級視覺概率框架的方法,其中中級視覺概率與訓(xùn)練分類器模型集成在統(tǒng)一概率框架中,具有明顯的可區(qū)分性和解釋性,因而部分解決了深度學(xué)習(xí)的黑盒子問題,同時(shí)也有效地提升了模型的識別性能。
本發(fā)明相比現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn):本發(fā)明把中層視覺和概率很好的結(jié)合在一起,為后面訓(xùn)練優(yōu)化的模型做了鋪墊,構(gòu)建中層視覺和概率結(jié)合的框架,最后可以很好地訓(xùn)練出一個(gè)模型;中層視覺概率框架和訓(xùn)練緊密的鏈接在一起,提高的模型的準(zhǔn)確性。
附圖說明
圖1是本發(fā)明的流程圖;
圖2是圖像增強(qiáng)流程圖。
具體實(shí)施方式
下面對本發(fā)明的實(shí)施例作詳細(xì)說明,本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
如圖1和圖2所示,本實(shí)施例包括以下步驟:
(1)數(shù)據(jù)預(yù)處理以及增強(qiáng):
通過人工標(biāo)定的方法獲得4種毒品(大麻、冰毒、海洛因、鴉片)共10000張毒品圖片,其中每種毒品有2500張。將這些圖片分為兩個(gè)圖像集:訓(xùn)練集(8000張),測試集(2000張)。
為了使訓(xùn)練出的網(wǎng)絡(luò)有更好的魯棒性,更好的學(xué)習(xí)毒品的特征,對訓(xùn)練集和測試集進(jìn)行轉(zhuǎn)置、水平鏡像翻轉(zhuǎn)、高斯模糊、添加隨機(jī)噪聲等操作以此增強(qiáng)數(shù)據(jù)。
(2)分類模型的訓(xùn)練
傳統(tǒng)的分類方法,部件學(xué)習(xí)和分類是二個(gè)不同的階段,而本發(fā)明提出的基于中層視覺概率框架很好的把二者集成在一個(gè)框架下。此方法通俗易懂,打破了傳統(tǒng)的區(qū)域圖像的選擇然后在去做分類模型,其很好把中級視覺概率和訓(xùn)練模型緊密的結(jié)合,區(qū)別于先前的方法,區(qū)域的選擇和訓(xùn)練模型是分離的。以下詳細(xì)介紹應(yīng)用中層視覺概率去分類。描述如下:
(21)使用二值化歸一梯度,能夠有效地檢測候選框?qū)⒄麖垐D像中可能是物體的框出,并根據(jù)這些框的坐標(biāo)把他們分割出來,最終會得到m個(gè)不同大小中級視覺圖。
(22)用(21)的方法去處理訓(xùn)練數(shù)據(jù)集,每張圖片可有m個(gè)部分組成,每個(gè)部分大小不一,然后每次放128張圖片去訓(xùn)練m個(gè)部分的權(quán)重,不斷的更新m個(gè)部分的權(quán)重(即中層視覺的概率),最后得到一組最終的權(quán)重,是正樣本的權(quán)重(概率)占的比例大些,是負(fù)樣本的權(quán)重(概率)占的小些。
(23)上述概率用以下公式去計(jì)算:
定義
中級視覺正樣本數(shù)據(jù)集為
(3)將得到一組比較好的中層視覺概率,然后把中層視覺以及他們的概率放到貝葉斯分類中去訓(xùn)練模型;
(4)將得到的模型在測試集上進(jìn)行測試,根據(jù)測試結(jié)果調(diào)整訓(xùn)練集,把一些困難樣本放入到框架中繼續(xù)訓(xùn)練訓(xùn)練集,得到最終的模型;
(5)隨機(jī)測試張圖片在訓(xùn)練好的模型進(jìn)行測試,輸出結(jié)果判斷是哪一種毒品。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。