專利名稱:基于連續(xù)度的多尺度高分辨圖像目標檢測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及圖像分割以及分類,可用于自然圖像中各種大尺度高分辨復(fù)雜背景場景中的目標檢測與定位。
背景技術(shù):
隨著計算機技術(shù)的發(fā)展和計算機視覺原理的廣泛應(yīng)用,利用計算機圖像處理技術(shù)對目標進行實時跟蹤研究越來越熱門,目標的檢測定位在智能化交通系統(tǒng)、智能監(jiān)控系統(tǒng)、軍事目標檢測及醫(yī)學(xué)導(dǎo)航手術(shù)中手術(shù)器械定位等方面具有廣泛的應(yīng)用價值。目標檢測,是一種基于目標幾何和統(tǒng)計特征的圖像分割,它將目標的分割和識別合二為一,其準確性和實時性是整個系統(tǒng)的一項重要能力。尤其是在復(fù)雜場景中,需要對多個目標進行實時處理時,目標自動提取和識別就顯得特別重要。 目標檢測主要包括兩個步驟特征提取和分類器的訓(xùn)練。特征的表征能力將直接影響分類器的性能。常用的特征有原始灰度特征、Haaris小波特征、形狀描述符特征、Gabor特征、有向梯度直方圖HOG特征、Forstner特征和SIFT特征等。常用的分類器有基于神經(jīng)網(wǎng)絡(luò)的方法、隱馬爾科夫模型(HMM)、基于Kullback信息理論的方法、基于支持矢量機SVM的方法、貝葉斯決策方法和基于AdaBoost的方法。比較經(jīng)典的目標檢測算法是利用HOG算子提取特征,AdaBoost訓(xùn)練分類器的目標檢測框架。在背景中存在干擾邊緣時,HOG特征表現(xiàn)的比較差,會出現(xiàn)把一些背景中的特征判斷為目標特征的情況,因此檢測的虛警率較高。AdaBoost是一種具有自適應(yīng)性的Boosting算法,它通過建立多學(xué)習(xí)機組合使得弱學(xué)習(xí)機的性能得到提升,由于其獨有的對學(xué)習(xí)機性能的自適應(yīng)和對過學(xué)習(xí)現(xiàn)象的免疫性,近年來引起了廣泛的關(guān)注。但是這種方法同樣還存在一些缺陷,HOG算子結(jié)合AdaBoost的方法需要對大量未知的特征進行訓(xùn)練得到最終的分類器,整個過程需要對海量數(shù)據(jù)進行處理分析,計算復(fù)雜度與時間復(fù)雜度都非常聞。后來有些學(xué)者研究了人眼視覺成像的機理,人眼在識別目標時,是將目標分解為多個組件,根據(jù)人眼檢測到的許多目標組件,結(jié)合目標組件的空間結(jié)構(gòu)分布,識別目標。對于某種目標來說,僅僅需要幾個關(guān)鍵的部件,聯(lián)合部件的空間關(guān)系,就可以用來表征這個目標,形成了最初基于稀疏的目標檢測原理。Shivani Agarwal和Dan Roth最早提出了基于稀疏表示的目標檢測方法,在該目標檢測框架中,采用了 Forstner算子提取目標關(guān)鍵特征,采用稀疏神經(jīng)網(wǎng)絡(luò)框架(Sparse Network of Winnow, SNOW)框架進行分類器的訓(xùn)練。該框架可以使用極少數(shù)的特征來進行目標的表征,通過對這些極少數(shù)特征的訓(xùn)練,來得到一個可以用于對一個窗口進行判決的分類器。對一幅待檢測圖像進行尺度縮放、滑窗掃描,利用得到的分類器實現(xiàn)圖像中的目標檢測。經(jīng)實驗驗證,該算法對于小尺度、低分辨率圖像中的目標檢測具有較高的準確率與較低的虛警率。但是對于大尺度、高分辨率的圖像,該算法具有較高的虛警率,并且對于大尺度的圖像,進行多尺度縮放以及在每個尺度上滑窗掃描,是一個非常耗時的過程。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對上述已有技術(shù)的不足,提出一種基于連續(xù)度的多尺度高分辨圖像目標檢測方法,以有效降低復(fù)雜背景中的虛警,并降低計算復(fù)雜度,提高目標檢測的準確率與時效性。實現(xiàn)本發(fā)明目的的技術(shù)原理是利用Forstner算子提取目標特征,采用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進行分類器的訓(xùn)練,對輸入的待檢測圖像,提取基于突變的感興趣區(qū)域,并對感興趣區(qū)域進行多尺度縮放,得到基于連續(xù)度的目標檢測結(jié)果,具體步驟包括如下I. 一種基于連續(xù)度的目標檢測方法,包括如下步驟(I)從網(wǎng)絡(luò)或視頻中獲取大小為100X40的正訓(xùn)練樣本和負訓(xùn)練樣本,構(gòu)成訓(xùn)練
樣本集合;
(2)從正類訓(xùn)練樣本集中提取基于Forstner算子的像素塊作為正類樣本特征,構(gòu)造正類樣本特征字典,然后對字典進行聚類,得到多類特征子集,并為每一類子集賦予類別標記;(3)計算正類樣本特征之間存在的所有空間關(guān)系,該空間關(guān)系包括距離和角度,給每種空間關(guān)系特征分別賦予類別標記;(4)對步驟⑵得到的正類樣本特征,利用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進行訓(xùn)練,得到分類器;(5)輸入任意大小的待檢測圖像,依次進行均值濾波與二值化處理,得到二值圖像;(6)從二值圖像中檢測灰度連續(xù)突變,根據(jù)突變提取感興趣區(qū)域ROI (6a)在一幅二值圖像中,用X,y分別表示像素的橫縱坐標點,f(x,y)為該坐標點的像素灰度值,按照從下往上,從左到右的方式對二值圖像進行掃描,若在坐標點(X,y)處檢測到突變點,則f(X,y)為突變點的像素灰度值,坐標(X,y)為突變行的左端點,在橫坐標中繼續(xù)向右,判斷坐標點(x+1,y)處的像素灰度值f (x+1,y)是否與f(x,y)值相同,如此不斷往右檢測,當(dāng)檢測到連續(xù)數(shù)量坐標點的像素灰度值與f(x,y)不同時,記錄此時坐標點(x+k, y)為突變行的右端點;(6b)從突變行右端點的下一個坐標(x+k+1,y)開始,繼續(xù)檢測下一個突變行;(6c)對整幅圖像自下而上,從左至右,不斷檢測突變行,并將突變行上像素標記為1,其余像素標記為0,得到最終突變結(jié)果圖;(6d)選取突變的長度為寬、突變長度按100 40的比例縮放得到的長度為高構(gòu)成的矩形區(qū)域,標記為感興趣區(qū)域。
(7)對圖像中的感興趣區(qū)域進行多尺度縮放,并用一個100X40的窗口在每一層縮放圖像上滑窗掃描,將每個掃描窗口中的圖像用步驟(2)和步驟(3)得到的樣本特征表示為特征矢量,并將該特征矢量輸入到步驟(4)得到的分類器中,由分類器輸出該窗口圖像的目標活性值,并在該縮放尺度的整幅圖像上不斷滑動窗口,由分類器輸出所有滑動窗口的目標活性值,最終得到該層縮放圖像的目標活性值分布圖;(8)在每一層縮放尺度活性值分布圖中,利用鄰域抑制和重復(fù)樣本特征消除法,查找活性值峰值點作為該縮放尺度上的目標點,同時記錄目標點所在的縮放尺度上的縮放倍數(shù)Ti、該點的橫縱坐標Li、Ri,計算目標在多層縮放尺度上的連續(xù)度C
權(quán)利要求
1.一種基于連續(xù)度的目標檢測方法,包括如下步驟 (1)從網(wǎng)絡(luò)或視頻中獲取大小為100X40的正類訓(xùn)練樣本和負類訓(xùn)練樣本,構(gòu)成訓(xùn)練樣本集合; (2)從正類訓(xùn)練樣本集中提取基于Forstner算子的像素塊作為正類樣本特征,構(gòu)造樣本特征字典,然后對字典進行聚類,得到多類特征子集,并為每一類子集賦予類別標記; (3)計算樣本特征之間存在的所有空間關(guān)系,該空間關(guān)系包括距離和角度,給每種空間關(guān)系特征分別賦予類別標記; (4)對步驟(2)得到的正類樣本特征,利用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進行訓(xùn)練,得到分類器; (5)輸入任意大小的待檢測圖像,依次進行均值濾波與二值化處理,得到二值圖像; (6)從二值化圖像中檢測像素灰度連續(xù)突變,根據(jù)突變提取感興趣區(qū)域ROI (6a)在一幅二值圖像中,用X,y分別表示像素的橫縱坐標點,f(x,y)為該坐標點的像素值,按照從下往上,從左到右的方式對二值圖像進行掃描,若在點(X,y)處檢測到突變點,則f(x,y)為突變點的像素灰度值,坐標點(x,y)為突變行的左端點,在橫坐標中繼續(xù)向右,判斷坐標點(x+1,y)處的像素灰度值f (x+1,y)是否與f(x,y)值相同,如此不斷往右檢測,當(dāng)檢測到連續(xù)數(shù)量坐標點的像素與f(x,y)不同時,記錄此時坐標點(x+k,y)為突變行的右端點; (6b)從突變行右端點的下一個坐標(x+k+1,y)開始,繼續(xù)檢測下一個突變行; (6c)對整幅圖像自下而上,自左至右,不斷檢測突變行,并將突變行上像素標記為1,其余像素標記為0,得到最終突變結(jié)果圖; (6d)選取突變的長度為寬、突變長度按100 40的比例縮放得到的長度為高構(gòu)成的矩形區(qū)域,標記為感興趣區(qū)域。
(7)對圖像中的感興趣區(qū)域進行多尺度縮放,并用一個100X40的窗口在每一層縮放圖像上從左至右、從上而下滑窗掃描,將每個掃描窗口中的圖像用步驟(2)和步驟(3)得到的樣本特征表示為特征矢量,并將該特征矢量輸入到步驟(4)得到的分類器中,由分類器輸出該窗口圖像的目標活性值,并在該縮放尺度的整幅圖像上不斷滑動窗口,由分類器輸出所有滑動窗口的目標活性值,最終得到該層縮放圖像的目標活性值分布圖; (8)在每一層縮放尺度活性值分布圖中,利用鄰域抑制和重復(fù)樣本特征消除法,查找活性值峰值點作為該縮放尺度上的目標點,同時記錄目標點所在的縮放尺度上的縮放倍數(shù)Ti、該點的橫縱坐標Li、Ri,計算目標在多層縮放尺度上的連續(xù)度C 1 C = ^-, ( -I) 其中,Ti表示第i個目標的縮放倍數(shù),η表示連續(xù)檢測到的目標的個數(shù)。
(9)根據(jù)目標的連續(xù)度、在多個縮放尺度上的縮放倍數(shù)以及橫縱坐標,計算目標在待檢測圖像中的位置與大小若在某鄰域范圍內(nèi)的多個縮放尺度上檢測到目標,目標個數(shù)為η,目標連續(xù)度C大于O. 02,并且個數(shù)η大于4,則確定該鄰域內(nèi)存在目標,并用如下公式計算目標在待檢測圖像中的位直以及覽和聞
2.根據(jù)權(quán)利要求I所述的目標檢測方法,其中步驟(2)所述的從正類訓(xùn)練樣本集中提取基于Forstner算子的像素塊作為正類樣本特征,構(gòu)造正類樣本特征字典,按如下步驟進行 (2a)對大小均為100X40的50幅正類訓(xùn)練樣本,應(yīng)用Forstner算子檢測特征點,提取特征點周圍13X13大小的像素塊作為正類樣本特征,共得到400個正類樣本特征; (2b)將每一個13X13的正類樣本特征轉(zhuǎn)換成1X169的特征矢量,用所有正類樣本特征構(gòu)成400X 169的二維的特征矢量,將二維的特征矢量作為正類樣本特征字典。
3.根據(jù)權(quán)利要求I所述的目標檢測方法,其中步驟(2)所述的對字典進行聚類,按如下步驟進行 (2a)使用自底向上Bottom-Up聚類方法進行字典聚類,即先將字典中每一個正類樣本特征獨立為一個子類,然后計算每兩個子類的相似度,合并相似度高的子類; (2b)重復(fù)步驟(3a),將所有相似度高的子類聚集到同一個類中,得到字典最終的聚類結(jié)果。
4.根據(jù)權(quán)利要求I所述的目標檢測方法,其中步驟(3)所述的計算正類樣本特征之間存在的所有空間關(guān)系,按如下步驟進行 (3a)將空間關(guān)系中的距離劃分為5個尺度,每一個尺度對應(yīng)一個距離范圍,給每個范圍賦予對應(yīng)的尺度特征標記,計算兩個樣本特征在原圖中的歐式距離,根據(jù)距離大小賦予相對應(yīng)的尺度特征標記; (3b)將空間關(guān)系中的角度離散為4個角度特征,分別對應(yīng)角度范圍為0-45°、45° -90°、90° -135°、135° -180°,計算兩個樣本特征在原圖中的角度關(guān)系,分配對應(yīng)的角度特征標記; (3c)級聯(lián)5個距離特征與4個角度特征,則樣本特征之間存在的20種空間關(guān)系特征,分別給每一種空間關(guān)系特征分配一個空間關(guān)系特征標記。
5.根據(jù)權(quán)利要求I所述的目標檢測方法,其中步驟⑷所述的對步驟⑵得到的正類樣本特征利用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進行訓(xùn)練,具體步驟如下; (4a)給每一類樣本特征與空間關(guān)系特征分配初始權(quán)重; (4b)用500個正訓(xùn)練樣本與500個負訓(xùn)練樣本訓(xùn)練分類器,輸入訓(xùn)練樣本,將每一個訓(xùn)練樣本表示為由正類樣本特征與空間關(guān)系特征構(gòu)成的二元特征矢量,該二元特征矢量作為稀疏神經(jīng)網(wǎng)絡(luò)的輸入,稀疏神經(jīng)網(wǎng)絡(luò)輸出目標活性值,根據(jù)目標活性值進行分類,判斷分類結(jié)果與輸入的訓(xùn)練樣本標記是否一致,從而修正并更新特征權(quán)重; (4c)重復(fù)步驟(4b),不斷修正并更新特征權(quán)重,得到最終的分類器。
6.根據(jù)權(quán)利要求I所述的目標檢測方法,其中步驟(8)所述的在每一層縮放尺度活性值分布圖中,利用鄰域抑制和重復(fù)樣本特征消除法,查找活性值峰值點作為該縮放尺度上的目標點,具體步驟如下 (8a)在活性值分布圖中,目標點鄰域分布多個不同的活性值,查找其中活性值最大的占. (8b)在活性值最大點所在鄰域中如果有其他點的活性值已被確定為活性峰值點,則將該點處活性值置為O,如果沒有其他點已被確定為活性峰值點,則將該活性值最大的點確定為目標點,將鄰域內(nèi)其他點的活性值全置為O,該活性峰值點即為當(dāng)前縮放尺度上最終檢測到的目標點。
全文摘要
本發(fā)明提出了一種基于連續(xù)度的目標檢測方法,主要解決現(xiàn)有目標檢測技術(shù)中虛警率高及耗時的問題。其實現(xiàn)步驟為從50幅正類訓(xùn)練樣本中提取基于forstner算子的樣本特征;結(jié)合樣本特征間的空間關(guān)系特征構(gòu)造字典,對字典進行聚類;使用稀疏神經(jīng)網(wǎng)絡(luò)訓(xùn)練分類器;輸入待檢測圖像,進行均值濾波與二值化,提取基于突變的感興趣區(qū)域;對感興趣區(qū)域進行多尺度縮放,在每一層上滑動100×40的窗口,將分類器應(yīng)用到窗口計算活性值,得到活性值分布圖;利用鄰域抑制和重復(fù)部件消除方法,尋找目標活性峰值點;計算目標連續(xù)度,根據(jù)連續(xù)度得到最終目標檢測結(jié)果。本發(fā)明具有檢測正確率高、虛警率低、時效性高的優(yōu)點,可用于大尺度高分辨圖像的目標檢測與定位。
文檔編號G06K9/62GK102722712SQ20121000036
公開日2012年10月10日 申請日期2012年1月2日 優(yōu)先權(quán)日2012年1月2日
發(fā)明者劉芳, 焦李成, 王爽, 白靜, 霍麗娜, 高婷 申請人:西安電子科技大學(xué)