專利名稱::綜合多方向多尺度與bp神經(jīng)網(wǎng)絡的人耳識別方法
技術(shù)領域:
:本發(fā)明涉及一種人體生物特征的個人身份識別技術(shù),特別涉及一個綜合多方向多尺度與神經(jīng)網(wǎng)絡識別人耳特征的方法。
背景技術(shù):
:近年來,生物鑒別受到越來越多研究人員的關(guān)注。它從身份認證到通道入口安檢的各個方面都發(fā)揮了重要作用。但是現(xiàn)階段大部分生物鑒別技術(shù)都對其工作環(huán)境有苛刻的要求,因而限制了其適用范圍。所以研究人員都在努力尋找新的生物鑒別技術(shù)。人耳識別是一種新型識別技術(shù),目前國內(nèi)外的相關(guān)研究都還不多。人耳識別技術(shù)以其獨特的生理特征和觀測角度,使它具有很高的理論研究價值和實際應用前景。它涉及到生物特征提取、計算機視覺、圖像處理、模式識別和身份認證技術(shù)等諸多領域。人耳不僅具有與其他個體生物特征共同之處,還具有一些獨特的特征結(jié)構(gòu)穩(wěn)定,不受面部表情的影響,位置固定,樣本采集不會有相關(guān)的衛(wèi)生問題,也不會使人緊張,更容易讓人接受。雖然人耳比人臉、掌紋要小,但由于比虹膜、視網(wǎng)膜、指紋大,比較容易采集,因此人耳檢測和識別技術(shù)正逐漸成為生物特征4企測和識別領域的又一熱點。多尺度分析又稱為多分辨率分析,它是由Mallat于1989年首先提出的。以小波變換為代表的多尺度分析方法,被認為是分析工具及方法上的重大突破。小波分析在時域或頻域上都具有良好的局部特性,而且由于對高頻信號采取逐步精細的時域或空域步長,從而可以聚焦到分析對象的任意細節(jié)。隨后取得了許多研究成果,如基于小波域的軟閾值噪聲圖像增強、基于小波變換的自適應增強算法等。雖然小波分析理論雖然在圖像增強領域取得了一定的發(fā)展,但小波變換應用范圍存在著局限性,小波變換在分析一維和二維點奇異信號時具有良好的性能,但對于二維或高維空間,除了點奇異性外,還有沿著各種曲線或超平面分布的奇性,小波變換就失去了它的分析優(yōu)勢。近幾年來,Candes和Donoho提出了一種新的多尺度變換-Ridgelet變換,該變換能有效的描述二維空間上具有直線奇異性的信號。針對高維空間中的曲線奇異性信號,人們在Ridgelet變換的基礎上,又^是出了Curvelet與Contourlet變換,這種變換能夠有效的描述具有曲線或超平面奇異性的高維信號,人們將Curvelet與Contourlet變換應用于圖^象的對比度增強,增強的原理同小波相似,也是通過線性或非線性的函數(shù)對Curvelet與Contourlet域內(nèi)的系數(shù)進行調(diào)整,已經(jīng)取得了良好的增強效果。雖然Curvelet與Contourlet變換具有廣闊的應用前景,但在圖像增強方面的應用還處于探索階段。2003年春,在洛杉磯召開的"純粹與應用數(shù)學"會議上提出了"多尺度幾何分析"的概念。多尺度幾何分析主要是為了解決小波變換在圖像處理中的缺陷而提出的,是為了充分挖掘并利用圖像自身的幾何正則性,檢測、表示和處理高維空間的數(shù)據(jù),解決高維逼近問題。對于二維圖像,奇異性主要由邊緣所刻畫,因此主要的任務是處理邊緣。目前,現(xiàn)有的多尺度幾何分析方法主要有Ridgelet、Curvelet等。脊波理i侖由Candes在1998年提出,是一種非自適應的高維函數(shù)表示方法。脊波變換對于具有直線奇異的多變量函數(shù)有良好的逼近性能,但對于含曲線奇異的多變量函數(shù),其逼近性能只相當于小波變換。為了解決含曲線奇異的多變量函數(shù)的稀疏逼近問題,Candes提出了單尺度脊波變換。單尺度脊波對于具有曲線奇異的多變量函數(shù)的逼近性能比小波有明顯的提高。Curvelet變換是Candes和Donoho在1999年提出,由脊波理論衍生而來。單尺度脊波的基本尺度是固定的,而Curvelet變換則是在所有可能的尺度上進行分解,Curvelet變換是由一種特殊的濾波過程和多尺度脊波變換組合而成。Curvelet對于具有曲線奇異的多變量函數(shù)的逼近性能比單尺度脊波有明顯的提高。利用矩不變量進行圖像識別是視覺及模式識別中的一種重要方法,在二維圖像模式識別中應用很廣。Hu在1961年首先提出了矩不變量的概念,他使用幾何矩的非線性組合得出了一組具有期望的尺度不變性、平移不變性和旋轉(zhuǎn)不變性的矩不變量,一般稱之為Hu矩。但是,Hu矩有一些缺點。其中之一是隨著矩的階數(shù)的升高計算量會迅猛增長,另外,由于這些矩不是源于正交函數(shù)族,所以包含了很多冗余信息。上述方法不能對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本進行識別,特別是對有光照變化、角度變化和遮擋變化的人耳圖像樣本進行識別。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種綜合多方向多尺度與BP神經(jīng)網(wǎng)絡的人耳識別方法,本發(fā)明方法在神經(jīng)網(wǎng)絡中構(gòu)建人耳自動識別系統(tǒng)模塊,利用多方向多尺度方法和小波不變量方法識別人耳,對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本進行識別,特別是對有光照變化、角度變化和遮擋變化的人耳圖l象樣本進行識別,所述方法有才企測快速、方法簡單、識別率高等優(yōu)點。綜合多方向多尺度與BP神經(jīng)網(wǎng)絡的人耳識別方法有以下步驟(1)建立人耳數(shù)據(jù)庫采集人耳圖像,所述圖像分為左耳子庫和右耳子庫,每個子庫均有光照變化、角度變化和遮擋變化的模式,建立人耳數(shù)據(jù)庫的基本信息和輔助信息;(2)將不加噪聲和加噪聲的人耳圖像的灰度圖像進行計算機識別;(3)步驟(2)得到的人耳圖像進行預處理;(4)步驟(3)得到的人耳圖用小波矩不變量的特征提取和特征數(shù)據(jù)加權(quán)處理;(5)將經(jīng)步驟(4)處理過的圖像的Hu矩、改進小波矩特征輸入BP神經(jīng)網(wǎng)絡識別器,對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本進行識別。步驟(3)中所述的人耳圖像的預處理方法是1)用Matlab法對人耳圖像進行分割、圖像尺度歸一化的處理2)采用多方向多尺度方法對人耳圖像進行去噪、增強的處理;3)采用小波模極大值對步驟2)的人耳圖像進行去噪和邊緣提取的光照強度歸一化的處理,得到圖像的特征值。所述人耳的去噪與增強是對圖像f作曲波變換分解,將圖像分塊,再對每個塊估文Ridgelet變^灸。所述圖像f的曲波變換分解有以下步驟①子帶分解對圖像/的小波變換將其分解為多個子帶分量;②平滑分割將步驟Q所述各個子帶采用平滑窗分割為若干子塊;設圖像塊尺寸為》,則A產(chǎn)2",其中,B^為分塊的尺寸;③脊波分析用二進小波對分割得到的各子塊作局部脊波變換)=1;&=/(乂,力whi1e(_/</){&+1/(1,力=52》何+1}endwhile;式中,2J是表示二進制離散,j表示二進制離散插入的點數(shù)量,g/0c,力和力分別是尺度2;下圖像的水平高頻信息和垂直高頻信息,力表示圖像的一個平滑^f象。本發(fā)明選用了二維圖像的Zernike矩不變量,將其與小波矩進行比較。本發(fā)明在傳統(tǒng)小波矩不變量的基礎上,結(jié)合數(shù)字圖像本身的特點,使用模板來計算圖像的采樣算法,并通過大量實驗驗證了結(jié)合Mallat算法可以用來加快小波矩的運算速度。S.Mallat在1992年將Lipschitz指數(shù)與小波變換后系數(shù);漠的局部極大值聯(lián):系起來,通過小波變換后局部極大值在不同尺度上的衰減速度來衡量信號的局部奇異性?;谛〔ㄗ儞Q的信號奇異檢測可應用于故障診斷、圖像的多尺度邊緣提取、信號恢復和去噪等領域。Mallat已經(jīng)證明1)小波變換模極大值方法具有平移不變性;2)如果信號本身的傅立葉變換是帶限的且小波函數(shù)是緊支撐的,則小波變換模極大值的表示是完備的(參考文獻MallatS.Waveletforavision[J].IEEEProc,1996,84(4):604-614.)。所以小波變換模極大值算法適用于圖像的去噪與邊緣提取。Curvelet變換的基礎是Ridgelet變換。Ridgelet變換是為解決二維或更高維奇異性而產(chǎn)生的一種新的分析工具。由于它能很好檢測直線,因此采用這種變換來檢測邊緣的效果比一般傳統(tǒng)變換好。但對于圖像而言,線條多以曲線居多,通過把圖像分塊,使每個塊內(nèi)的曲線近似于直線,再對每個塊做Ridgelet變換,這樣的效果會更好。Li利用Fourier-Mellin變換的不變性推導出一種構(gòu)造任意階矩不變量的方法,并指出Hu矩不變量就是其中一個特例。Teague建議利用正交多項式構(gòu)造正交矩來克服Hu矩不變量包含大量冗余信息的缺點。Zernike矩和Legendre矩不變量就是正交的矩不變量。正交矩有非常顯著的優(yōu)點,它有非常簡單的反變換形式,解決了用矩進行圖像重建的難題。此外,正交矩還有較小的數(shù)據(jù)冗余度及噪聲敏感性,K.Hotanzad和Belkasim等人指出正交矩在信息冗余度、圖像表達以及在識別效果方面比其他類型的矩更好。旋轉(zhuǎn)矩的優(yōu)點是旋轉(zhuǎn)不變性,Chebyshev矩處理離散圖寸象步文果4青確。Cho和Roland比4交了幾《可矩、Legendre頭巨、Zernike頭巨、pseudo—Zernike頭巨、Fourier—Mel1in頭巨、4^壽爭頭巨以及復凄t頭巨對噪聲的敏感性、信息冗余和圖形描述的能力,結(jié)果是Zernike矩具有最全面的性能。本發(fā)明利用Zernike矩對人耳圖像的旋轉(zhuǎn)矩以及復數(shù)矩對噪聲的敏感性、信息冗余和圖形的描述能力最全面的性能的特性,用于對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本的識別,特別是對有光照變化、角度變化和遮擋變化的人耳圖像樣本的識別,有檢測快速、方法簡單、識別率高等優(yōu)點。本發(fā)明綜合運用了多方向多尺度的預處理方法、改進小波矩特征提取方法和BP神經(jīng)網(wǎng)絡的特征分類方法,在盡量降低識別所需時間的基礎上,大大提高了識別正確率。經(jīng)過200幅圖像的驗證試驗,本發(fā)明的識別率可達97%以上。本發(fā)明與經(jīng)典Hu矩相對比,改進算法的小波矩不變量描述圖像特征的性能大幅提高,將改進算法的小波矩不變量在實際應用中與傳統(tǒng)小波矩與Hu矩的時間與性能上找到了一個平衡點。圖1為同一人的左耳圖像;圖2為同一人的右耳圖像;圖3為光照變化模式下部分人的左耳圖像;圖4為角度變化模式下部分人的左耳圖像;圖5為遮擋模式下5人的左耳圖像;圖6為Curvelet變換對曝光不足的人耳圖像增強,其中,(a)(b)為光照不充分時采集到的人耳照片,(c)為圖(a)對應的增強圖像,(d)為圖(b)對應的增強圖像;圖7為原始人耳圖像;圖8為各種噪聲的去噪效果圖,其中,(a)為加噪5%的圖像,(b)為加噪10%的圖像,(c)為加噪15。/。的圖像,(d)為圖(a)對應的去噪圖,(e)為圖(b)對應的去噪圖,(f)為圖(c)對應的去噪圖9為不同環(huán)境下采集的同一人耳圖像,其中,(a)為弱光照圖像,(b)為強光照圖像,(c)為加噪聲圖像;圖IO為圖4所示圖像預處理后的圖像,其中,(a)為弱光照圖像,(b)為強光照圖像,(c)為加噪聲圖像;圖11為同一人耳不同狀態(tài)下的圖像;圖12為BP算法實現(xiàn)的流程圖。具體實施例方式本發(fā)明方法有以下步驟(1)建立人耳數(shù)據(jù)庫采集人耳圖像,所述圖像分為左耳子庫和右耳子庫,每個子庫均有光照變化、角度變化和遮擋變化的模式,建立人耳數(shù)據(jù)庫的基本信息和輔助信息;(2)將不加噪聲和加噪聲的人耳圓像的灰度圖像進行計算機識別;(3)識別后的人耳圖像進行人耳圖像的預處理用多方向多尺度方法應用于圖像的增強與去噪,才艮據(jù)人耳圖像的自身特點將其應用于人耳圖像的預處理。然后使用小波模極大值提取去噪與增強后的人耳圖像的邊緣,以消除光照不均勻、光照變化的影響,將構(gòu)建人耳識別系統(tǒng)的預處理模塊設置在神經(jīng)網(wǎng)絡中。(4)步驟(3)得到的人耳圖用小波矩不變量的特征提取和特征數(shù)據(jù)加權(quán)處理通過大量實驗對現(xiàn)有幾種小波矩算法的速度和精度進行比較,選擇最優(yōu)算法,并利用小波矩不變量算法對圖像特征進行提取。分析圖像特征誤差產(chǎn)生的原因,采取加權(quán)方法減小誤差對分類識別的影響,并通過大量實驗結(jié)果從中得到最佳權(quán)值。(5)在特征數(shù)據(jù)處理后,將處理過的圖像的Hu矩、改進小波矩特征輸入BP神經(jīng)網(wǎng)絡識別器,對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本進行識別。將處理過的圖像的Hu矩、改進小波矩特征輸入BP神經(jīng)網(wǎng)絡識別器,對小尺寸小樣本數(shù)量的人耳圖像樣本以及大尺寸大樣本數(shù)量的人耳圖像樣本進行識別。步驟(3)中所述的人耳圖像的預處理方法是1)用Matlab法對人耳圖4象進行分割、圖像尺度歸一化的處理2)采用多方向多尺度方法對人耳圖像進行去噪、增強的處理;3)采用小波模極大值對步驟2)的人耳圖像進行去噪和邊緣提取的光照強度歸一化的處理,得到圖像的特征值。所述人耳的去噪與增強是對圖像f作曲波變換分解,將圖像分塊,再對每個塊啦文Ridgelet變才灸。所述圖像f作曲波變換分解油以下步驟①子帶分解對圖像/的小波變換將其分解為多個子帶分量;②平滑分割將步驟①所述各個子帶采用平滑窗分割為若干子塊;設圖像塊尺寸為",則及+1=2》,其中,B^為分塊的尺寸;③脊波分析用二進小波對分割得到的各子塊作局部脊波變換。實施例1,步驟一對人耳圖像的采集本發(fā)明使用是人耳數(shù)據(jù)庫是本實驗室創(chuàng)建的人耳數(shù)據(jù)庫——中國人人耳數(shù)據(jù)庫(ChineseEarImageDatabase,CEID)。該數(shù)據(jù)庫共采集了200個中國人的人耳圖像。這些圖像分為左耳子庫和右耳子庫,每個子庫均有光照變化、角度變化和遮擋變化3種變化模式。對于每個被拍攝者,每個子庫都拍攝了16幅圖像,其中包括各個變化模式,以滿足不同研究工作的要求。CEID存入了每個被拍攝者的基本信息和輔助信息,供以后查詢用?;拘畔ㄐ詣e、年齡、民族、籍貫等,輔助信息包括左耳右耳、拍攝角度、光照類型、有無遮擋等。l.CEID的命名-見則每個人有32張照片,每張圖片以1M,8位深度,無損壓縮的jpg文件格式存放。圖像文件可自解釋,文件命名規(guī)則為xxxxxMUxPxAxYxxFxxXX.jpg(共21位)人員編號(5位);性別(l位)一一男性用M表示,女性用F表示;左右(l位)一_左耳用L表示,右耳用R表示;光照(2位)一一I為光照標記,后一位表示各種光照,O表示弱光照,l表示中強光照,2表示強光照;角度(2位)一一P為攝像機位置標記,即拍攝角度標記,后一位表示各種不同角度,0表示+30度,l表示+15度,2表示0度,3表示-15度;飾物(2位)——A為飾物標記,后一位表示有無遮擋,O表示無遮擋,l表示有耳機遮擋;年齡(3位)——Y為年齡標記,后兩位具體年齡的數(shù)字;民族(3位)——F為民族標記,后兩位民族索引碼[5];籍貫(2位)一一省份簡稱[6]。例如文件名為00001MLI1P2A0Y21F0111.jpg的人耳圖片是編號為00001號的被拍攝者在中強光照、O度方向、無耳機遮擋情況下拍攝的左耳圖像,這名被拍攝者為北京市一名21歲的漢族男性。2.人耳庫圖像變化模式CEID包括200個中國人的人耳圖像,這些人耳圖像可以分為左耳右耳兩個子庫。對于每一個被拍攝者,每個子庫包括三種不同光照、四種不同角度及遮擋模式下的16幅人耳圖像。左耳圖像如圖1所示,右耳圖像如圖2所示。2.1光照變化模式在遮擋外界光照的情況下,用人工光照來模擬自然光照,拍攝弱光照、中強光照和強光照三種不同光照下的人耳圖像,對三種不同光照分別進行了四個不同角度的拍攝。圖3展示的是弱光照、中強光照和強光照情況下拍攝的0度左耳圖像。2.2角度變化模式在三種不同光照和遮擋情況下,對左右耳都進行了+30度、+15度、0度、-15度四種不同角度的拍攝。圖4展示的是強光照、無遮擋下拍攝的+30度、+15度、Q度、-15度左耳圖像。2.3遮擋模式在強光照情況下,讓被拍攝者戴上耳機,造成一定的遮擋。對有遮擋的情況也進行了四個角度的拍攝,圖5為5個人左耳在強光照、O度角度、有耳機遮擋下的圖像。步驟二人耳圖l象的預處理由步驟一我們可以看出人耳圖像的獲取包含了各種光照和角度的變化以及各種遮擋。另外,由于圖像傳感器的原因,在實際人耳圖像獲取中參雜了噪聲。如果直接對采集到的人耳圖像提取特征,會因為非本質(zhì)的干擾因素太大而增加正確分類識別的難度,因而在提取人耳圖像特征之前必須去除這些干擾。這就是人耳圖像的預處理。其中包括圖像中人耳的分割、圖像尺度歸一化、去噪、增強和光照強度的歸一化。在本發(fā)明中,人耳圖像的分割是指在選定圖像中選擇出人耳圖像,隨后把該圖像歸一化,制成同樣大小的圖片,以便后續(xù)處理中的使用。這兩個步驟使用的是Matlab進行圖像處理的程序。人耳圖像的去噪與增強使用多方向多尺度方法,而圖像光照強度的歸一化將使用小波模極大值的去噪和邊緣提取方法(見本申請人的另一申請?zhí)枮?00810233050.9發(fā)明專利所述內(nèi)容),提取不受光照影響的人耳圖像邊緣。這種邊緣圖將可以直接用來提取圖像的矩不變量以用于分類識別。下面我們將分步進行這兩項人耳圖像預處理。1人耳圖像的增強與去噪利用小波分析的多尺度分析方法在時域或頻域上都具有良好的局部特性,而且由于對高頻信號采取逐步精細的時域或空域步長,從而可以聚焦到分析對象的任意細節(jié)。在單尺度脊波或局部變換的基礎上可以構(gòu)造曲波來描述具有曲線奇異性邊界的對象,曲波綜合了脊波擅長表示直線特征和小波適于表現(xiàn)點狀特征的優(yōu)點,并充分利用了多尺度分析獨特的優(yōu)勢,適用于一大類圖像處理問題并在實際應用中已取得了相當好的結(jié)果。因此,本發(fā)明將曲波變換算法引入到人耳圖像的預處理中。Curvelet變換其實就是一種多尺度的Ridgelet變換,首先將圖像用濾波器分成不同尺度的子帶,在不同的子帶上,邊緣信息和噪聲信息就比較清楚的分離開,再對每個子帶的分塊后的圖像應用Ridgelet變換。具體的說,對圖像f作曲波變分解主要包括以下步驟13①子帶分解通過小波變換將其分解成多個子帶分量。對于尺寸為N*N的圖像F,分解得到F二i^+尤VJ。其中尸。/為低頻分量,|>,/為高頻分量,S為指S個子帶■=15=1分量。②平滑分割將步驟①中人耳圖像的各個子帶分割為若干子塊,各個尺度上分割得到的子塊大小根據(jù)具體需要確定,可以互不相同。為了減小分塊引起的邊緣效應,需要在分塊時進行平滑處理,即采用平滑窗進行處理。③脊波分析。對分割得到的各子塊作局部脊波變換。子帶濾波后產(chǎn)生從低頻到高頻的一系列Wavelet子帶(本發(fā)明中子帶數(shù)目選擇J-8),分解后的Wavelet子帶要轉(zhuǎn)換為Curvelet子帶,因此,兩子帶之間滿足一定的對應關(guān)系。對一副大小為256*256的圖^象,加入經(jīng)Wavelet變換產(chǎn)生了8個子帶,用j=0,1,2,...,7來表示,這些子帶轉(zhuǎn)換為Curvelet子帶,則Curvelet子帶s=l對應于Wavelet子帶j=0,1,2,3;Curvelet子帶s=2對應Wavelet子帶j=4,5;Curvelet子帶s=3對應于Wavelet子帶j=6,7。當構(gòu)造好Curvelet變換的子帶后,緊接著我們要對子帶從空間上進行分塊。因為Curvelet的三個子帶分別處于從低頻到高頻的頻帶順序,分塊的原則也各有不同,我們對s=l的低頻子帶不進行處理,對s=2和s=3的高頻子帶進行分塊,分塊的大小可以選4奪8*8、16*16、32*32和64*64幾種方式。一^殳來講對于最高頻子帶我們分的塊最小,然后其他子帶以2的倍數(shù)遞增,如最高頻我們選擇8*8,下一子帶就選擇16*16。當然對不同的應用對象我們分塊的大小也不一樣。這里值得注意的是如果分塊方案選擇的不好將加重分塊效應的影響。本發(fā)明通過分塊交疊的方法來去除分塊效應,對于邊長為b的分塊使每一塊交疊b/2。按如上方法分割的同時會造成數(shù)據(jù)冗余,分層越多,冗余越多,因此,分層不宜太多。二進小波是對連續(xù)小波尺度參數(shù)作二進離散后得的小波序列。二進小波變換不包含采樣率變化的過程,具有平移不變性,可以很好的檢測信號的奇異點的位置和奇異性大小,更有利于邊緣檢測和去噪。本發(fā)明采用二進小波變換進行人耳圖像的去噪、增強。二進小波變換算法的實現(xiàn)二維離散二進小波變換可以通過濾波器的巻積運算來實現(xiàn),記A'(H,L)表示這樣的運算。圖像A的每一行與一維濾波器H作巻積,再將結(jié)果的每一列與一維濾波器L作巻積。令S7(x,力表示圖像,H,G,L分別表示一維的濾波器,它們由適當?shù)男〔ê瘮?shù)推導出來。Hj,Gj,Lj分別表示在H,G,L的相鄰數(shù)間插入2W-1個零而得到的尺度2J上的離散濾波器,則尺度2j下的圖像邊緣可如下求出<formula>formulaseeoriginaldocumentpage15</formula>其中,2J是指二進制離散,j表示二進制離散的數(shù)量,用在圖像上就是指離散插入的點數(shù)量,^/(x,力和巧/(x,力分別是尺度2V下圖像的水平高頻(邊緣)信息和垂直高頻(邊緣)信息,S2,+1/(x,_y)則是圖像的一個平滑像。有了W/0,力和^/(^力可求得該尺度下的梯度向量模M^./(x,力,其局部極值點構(gòu)成該尺度下的圖像邊緣。二進小波的時間域上具有平移不變性,因而其模值也具有平移不變性,這在邊緣檢測時具有重要意義。實際上(^/(x,力,巧/(x,力)完備地描述了原信號,即由這些變換系數(shù)可以精確地重構(gòu)原圖像。如使用Curvelet變換(曲波變換)對兩幅曝光不足的人耳圖像進行處理。如圖6,(a)(b)為在光照很差的情況下得到的對比度十分差的圖像,(c)(d)為與之對應的增強后的圖像。為了驗證Curvelet變換用于圖像去噪的效果,我們選用一副圖像,人為模擬加入不同的噪聲,然后進行去噪處理。如圖7,為原始采集到的人耳圖像,圖8(a)-圖8(c)是模擬加入不同程度噪聲的圖像,圖8(d)-圖8(f)顯示的是相對應的經(jīng)過Curvelet變換的去噪圖^f象。處理結(jié)果如表1所示_表1人耳圖^象的Curvelet變換去噪的PSNR值_噪聲類型噪聲方差o噪聲圖像Curvdet變換去噪26.046137.542320.006833.713716.466931.29822基于小波模極大值的歸一化處理人耳增強與去噪后接著進行圖像的光照歸一化。(具體方法見本申請人申請?zhí)枮?00810233050.9發(fā)明專利所述內(nèi)容)本發(fā)明使用小波模極大值提取人耳圖像邊緣的同時也進行小波模極大值的去噪實驗。模極大值去噪法是一種非常有效的小波去噪方法。噪聲的模極大值的幅度隨尺度的減小而迅速增力口,而正常信號的情況恰恰相反,因此利用適當尺度的小波變換,就可以很容易從正常信號中剔除噪聲。這種方法對去除高斯白噪聲和脈沖噪聲都有很好的效果。另外,小波變換極大值檢測算子不僅能確定突變與緩變的位置,而且能夠檢測信號變化的奇異性。因為小波變換對奇異特性非常敏感,所以它更適合檢測圖像的邊緣和細節(jié)。一些小波的圖像邊緣正好對應于小波變換的局部模極大值。這種邊緣是對象所固有的邊緣,絕不會有光照陰影產(chǎn)生的偽邊緣。小波模極大值描述的是圖像中目標的多尺度邊界,是對多尺度小波變換進行不規(guī)則抽樣的基礎上得到的,具有方向不變性。因此,使用它作圖像預處理可以將噪聲和光照不均對圖像的影響降到最低。本發(fā)明先對圖像進行小波去噪和多尺度小波變換,在得到小波分解各尺度下模極大值邊界圖像的基礎上,再計算改進的小波矩不變量,共同組成圖像的特征值。圖9所示是在陰暗處、強光處以及有強噪聲干擾攝像設備時得到的人耳圖像。這是由于圖像采集處的天氣變化造成的光照變化,以及設備本身的原因而斯噪聲5%10%15%帶來的噪聲。圖10是采用多尺度小波去噪和模局部極大值邊緣檢測相結(jié)合的方法得到的圖像的無噪邊緣。從圖10中可以看出這些邊緣可以不受噪聲、光照變化等的干擾。它保證了使用改進小波矩不變量來處理的圖像只有旋轉(zhuǎn)、平移縮放的狀態(tài)而沒有噪聲與光照的影響。步驟三改進小波矩不變量的特征^是取單獨使用改進小波矩不變量提取圖像的特征會受光照變化與不均的影響,而結(jié)合小波變換模極大值去噪與提取邊緣便能較好地解決這些問題。小波模極大值方法查找圖像邊緣的方法(見本申請人申請?zhí)枮?00810069589.5發(fā)明專利內(nèi)容)將邊緣檢測的二維二進小波設計為一維二進小波的可分積,其傅立葉變換表示為<formula>formulaseeoriginaldocumentpage17</formula>其中,WX(^,wy)、^(^,w」分別是二維平滑函數(shù)《x,y)的偏導數(shù),^(^,5),一K,,)分別是它們的傅里葉變化。纟O)是一個低通濾波器,而G(M/)=-/V^-'W2sin(W2)是一個高通數(shù)字濾波器;若尺度函數(shù)滿足如下二尺度方程<formula>formulaseeoriginaldocumentpage17</formula>若選擇尺度函數(shù)為m次樣條,即則可得i/(w)=V^-^/2[cOS(W2)]m+1為低通濾波器的傅里葉變換;若采樣間隔等于l,則離散小波系數(shù)為:同樣,定義原始圖^象信號為:fl0(",w)=〈/(x,_y),w)〉和j^)時的平滑圖像信號aj(n,m)=〈f(x,y),^(x-n衡-m)那么,二維離散二進小波變換的"trous算法表示為如下離散巻積形式:i《+1(W,附)=0^*3gy.(",w)其中:A,A,(w,w)=/z,(w)/^.(m)式中,",+1是",沿橫向和縱向低通濾波的結(jié)果,《+1是",沿橫向高通濾波的結(jié)果,《+,是"/沿縱向高通濾波的結(jié)果。人耳類似剛體,在采集的圖像中只有旋轉(zhuǎn)、平移、縮;故幾種狀態(tài)。不會存在類似人臉的形變。不變矩的特征提取恰好能從上述狀態(tài)中提取矩不變量。本發(fā)明所提出的的改進的小波矩不變量算法正好可以使用在預處理后人耳圖像特征提取上。人耳圖像小波不變矩特征提取用如下仿真實驗進行驗證。實驗用同一人耳不同旋轉(zhuǎn)角度、比例縮放狀態(tài)的圖像,以及對應狀態(tài)下加噪聲的圖像24個狀態(tài)(如圖ll所示)。這些圖像都先使用Curvelet變換增強、去噪,然后用小模極大提取邊緣。對圖11進行改進小波矩不變量的特征提取,結(jié)果如表2所示。由于各種矩的數(shù)值都很大,為了便于觀察,我們對各種不變量都統(tǒng)一作了如下變換其中等式左面表示矩不變量變換后的值,右面為變換前的值。并與經(jīng)典的Hu矩以及傳統(tǒng)3次B樣條小波矩不變量進行比較。因為一幅圖的Hu矩只有7個矩不變的特征量,而一幅圖的小波矩不變量的個數(shù)會隨圖像大小、小波分解層數(shù)的增加而增加。為了與Hu矩進行對比我們對小波矩也取其中的7個特征量。在對各種矩不變量的圖像表示與描述能力的評定中我們采用了標準不確定度的A類評定(《中國計量》總第五十四期2000.5,53-55頁)。最終評定結(jié)果使用標準不確定度A類評定中的不確定度與均值的比值。從表2可知,不同旋轉(zhuǎn)與縮放的各個不變矩的值變化很小,實現(xiàn)了圖像的旋轉(zhuǎn)、平移縮放不變性。而且改進算法的小波矩不變量與傳統(tǒng)的小波矩不變量算法相對比只以微小的性能損失,卻大大加快了運算速度。與經(jīng)典Hu矩相對比,改進算法的小波矩不變量描述圖像特征的性能大幅提高,但時間稍長。可以說改進算法的小波矩不變量在實際應用中是在傳統(tǒng)小波矩與Hu矩的時間與性能上找到了一個平衡點。表2各種矩不變量對圖像的表示與描述的性能表<table>tableseeoriginaldocumentpage19</column></row><table>步驟四特征的數(shù)據(jù)處理及BP神經(jīng)網(wǎng)絡識別使用矩不變量提取不同狀態(tài)圖像特征產(chǎn)生誤差的主要原因可歸結(jié)為數(shù)據(jù)的數(shù)字化本質(zhì),特別是對于旋轉(zhuǎn)的圖像更是如此。但是對一種特定的圖像矩不變量,每個分量的誤差性質(zhì)都是可以掌握并且其規(guī)律是可預測的。將不變矩看成是一個系統(tǒng),用它提取出的圖像矩不變量的誤差可以認為是系統(tǒng)誤差。這種系統(tǒng)誤差可以通過測試大量圖^f象的不同狀態(tài)統(tǒng)計出來。當完成特征信息提取與誤差處理以后,人耳圖像識別的下一步是圖像分類,即把獲取的特征信息送入分類器,最后通過分類器獲得識別結(jié)果。人耳圖像分類中分類器的作用是根據(jù)特征提取器得到的特征向量來給一個待識別對象賦予一個類別標記。BP神經(jīng)網(wǎng)絡用于模式識別分類,包括兩個階段訓練學習階段和工作識別階段。學習時要輸入訓練樣本,每輸入一次全部訓練樣本稱為一個訓練周期,學習要一個周期一個周期的進行,直到目標函數(shù)達到最小值或小于某一給定值。學習階段根據(jù)輸入的訓練樣本對整個網(wǎng)絡的連接斥又值進行調(diào)整,直至網(wǎng)絡的輸出誤差小于某一數(shù)值為止,這一階段也是BP算法的工作階段;工作識別階段運用已經(jīng)訓練好的BP網(wǎng)絡實現(xiàn)對測試樣本的識別分類,在此過程中,只有前向計算而沒有誤差的反向傳播,而且網(wǎng)絡的結(jié)構(gòu)和連接權(quán)值'都是固定不變的。本發(fā)明中使用的BP算法的步驟如下設本發(fā)明的神經(jīng)網(wǎng)絡含n個節(jié)點,網(wǎng)絡的輸出為y,任一節(jié)點i的輸出為0i,并設有N個樣本(Xk,yk)(k=l,2,...,N),對某一輸出xk,網(wǎng)絡輸出為yk,節(jié)點i的輸出為0ik,節(jié)點j的輸出為使用平方型誤差函數(shù)其中x為網(wǎng)絡之實際輸出,定義<formula>formulaseeoriginaldocumentpage20</formula>(3)")(5)<formula>formulaseeoriginaldocumentpage20</formula>于是<formula>formulaseeoriginaldocumentpage21</formula>當j為輸出節(jié)點時,<formula>formulaseeoriginaldocumentpage21</formula>當j不為輸出節(jié)點時,有<formula>formulaseeoriginaldocumentpage21</formula>因此<formula>formulaseeoriginaldocumentpage21</formula>如果網(wǎng)絡有M層,而第M層僅含輸出節(jié)點,第一層為輸入節(jié)點,則BP算法可描述為(1)選定初始4又ilw;(2)重復下述過程直到收斂a.對k=l到N(a)計算A(節(jié)點f的輸出)、"e(節(jié)點7的輸出)和51(正向過程)(b)對各層從M到2反向計算(反向過程)b.對同一層節(jié)點y/eM由式(6)~(9)計算得&;(3)修正權(quán)值<formula>formulaseeoriginaldocumentpage21</formula>JL中<formula>formulaseeoriginaldocumentpage21</formula>以上學習過程的流程圖如閨12所示<從以上步驟可以看出,每輸入一個樣本,都要回傳誤差并調(diào)整權(quán)值,這種對每個樣本輪訓的權(quán)值調(diào)整方法又稱為單樣本訓練。通常,經(jīng)過訓練的網(wǎng)絡還應該進行性能測試。測試的方法就是選取測試才莫式集合,將其提供給網(wǎng)絡,檢驗網(wǎng)絡對其分類的準確度。各個測試模式應包含今后網(wǎng)絡應用中將要遇到的主要典型模式。這些模式數(shù)據(jù)可以是從實例中直接測取的,也可以是通過仿真得到的,在模式數(shù)據(jù)較少或較難得到的情況下,也可以通過在學習模式加上適當噪聲量或按一定規(guī)則插值得到??傊?,一個良好的測試集合應該不包含和學習模式集合完全相同的模式。本
發(fā)明內(nèi)容的實驗結(jié)果與分析由于本發(fā)明在預處理中的仿真實驗中,主要考慮正面采集到的人耳圖像的識別,每個人的人耳圖像狀態(tài)如圖11中有各種平面旋轉(zhuǎn)與不同大小,并且每種狀態(tài)還有相應人為加入噪聲。先對600幅不加噪聲的與600幅加噪聲的共50類(指50個人的人耳圖像,每個人的人耳包括12幅圖像)人耳圖像的灰度圖像進行計算機識別的實驗,每張人耳圖的大小為110*160像素大小,其中每幅人耳的12種狀態(tài),并且每種狀態(tài)相應加入方差為0.01的高斯噪聲。先按該人耳識別系統(tǒng)的流程進行Curvelet變換的增強與去噪,然后進行小波模極大值的光照歸一化處理,再進行小波矩不變量的特征提取和特征數(shù)據(jù)加權(quán)處理,最后進行基于BP神經(jīng)網(wǎng)絡的分類識別。在進行特征數(shù)據(jù)加權(quán)處理時,用IO類圖像訓練系統(tǒng)得到不變矩分量的權(quán)值。在最后的識別仿真中,仿真實驗中使用400幅圖《象作為訓練樣本,其余800幅圖像作為測試樣本(無噪聲實驗數(shù)據(jù)是將噪聲方差改為零,圖像數(shù)量與加噪聲實驗相同)。本發(fā)明中使用3層BP神經(jīng)網(wǎng)絡作為分類器,輸入特征維度用KL變換統(tǒng)一降為15維,BP神經(jīng)網(wǎng)絡隱層的神經(jīng)元結(jié)點取31。并在結(jié)果中加入經(jīng)典的Hu矩提取特征的分類識別率進行比較。表3為分類結(jié)果,從中可以看出,在樣本為50類,使用較小的圖像尺寸與較大的噪聲情況,本系統(tǒng)都能取得很好的分類效果。表3三種矩不變量用于灰度人耳圖像的識別率方法_訓練樣本數(shù)測試樣本數(shù)識別率(無噪)識別率(加噪)Hu矩40080085.9%^艮差空間域小波矩40080097.7%95.1%頻率域小波矩40080097.0%95.6%為了進行一步測試大樣本下該人耳識別系統(tǒng)的識別能力,將人耳圖像樣本數(shù)從50類逐漸加大到200類(即將50個人的人耳圖像增加到200個人的人耳圖像),圖像大小增大到360*480像素,并且每類人耳分別有弱光照、中強光照和強光照3種光照,每種光照下的人耳圖像有12種狀態(tài)(12種狀態(tài)是指同一人耳圖像的12種不同旋轉(zhuǎn)角度)及相對應的加噪狀態(tài)(如圖11所示),再次進行計算機識別。在識別仿真中,每類使用8幅圖像作為訓練樣本,其余16幅圖像作為測試樣本。表4為分類結(jié)果,從中可以看出當圖4象尺寸增加后本系統(tǒng)的識別率有很大的提高,而在最后一步使用Hu矩識別率與圖像大小相關(guān)不大,識別率與表3相同。表4二種矩不變量用于灰度人耳圖像的識別率樣本數(shù)量空間域小波矩(無噪)空間域小波矩(力口噪)頻率域小波矩(無噪)頻率域小波矩(加噪)10100%100%100%100%20100%100%100%100%30100%100%100%100%40100%100%100%100%50100%99.83%100%99.92%60100%99.58%99.98%99.81%7099.88%99.32%99.79%99.64%8099.48%99.05%99.42%99.47%卯99.11%98.78%99.03%99.27%10099.00%98.51%98.87%99.06%11098.88%98.24%98.70%98.85%12098.78%97.98%98.55%98.61%13098.69%97.71%98.42%98.36%14098.62%97.44%98.30%98.09%15098.56%97.17%98.20%97.81%16098.51%96.91%98.12%97.50%17098.47%96.65%98.05%97.18%18098.4線96.38%97.99%96.84%19098.43%96.12%%97.97%96.48%20098.42%95.83%97.96%96.07%結(jié)論本發(fā)明創(chuàng)建了一個人耳圖像識別系統(tǒng)。首先建立了一個人耳數(shù)據(jù)庫,將Curvelet變換用于人耳圖像的增強與去噪,并利用小波模極大值進行光照歸一化,然后進行了改進小波矩不變量的人耳圖像特征提取和數(shù)據(jù)處理,最后利用BP神經(jīng)網(wǎng)絡算法對人耳閨像進行分類識別。實—驗結(jié)果表明,該人耳識別系統(tǒng)不但可以解決光照不均、對比度不高、光照變化、噪聲干擾的問題,而且能解決人耳圖像采集過程中的平移、平面旋轉(zhuǎn)縮放問題。該發(fā)明實現(xiàn)了人耳圖像的自動識別,在200類大尺寸人耳圖像的識別中,其識別率達到了97%以上。權(quán)利要求1.一種綜合多方向多尺度與BP神經(jīng)網(wǎng)絡的人耳識別方法,其特征在于有以下步驟(1)建立人耳數(shù)據(jù)庫采集人耳圖像,所述圖像分為左耳子庫和右耳子庫,每個子庫均有光照變化、角度變化和遮擋變化的模式,建立人耳數(shù)據(jù)庫的基本信息和輔助信息;(2)將不加噪聲和加噪聲的人耳圖像的灰度圖像進行處理;(3)步驟(2)得到的人耳圖像進行預處理;(4)步驟(3)得到的人耳圖像用小波矩不變量的特征提取和特征數(shù)據(jù)加權(quán)處理;(5)將經(jīng)步驟(4)處理過的圖像的Hu矩、改進小波矩特征輸入BP神經(jīng)網(wǎng)絡識別器,對人耳圖像樣本進行識別。2.根據(jù)權(quán)利要求1所述的方法,其特征在于步驟(3)中所述的人耳圖像的預處理方法是1)用Matlab法對人耳圖像進行分割、圖像尺度歸一化的處理2)采用多方向多尺度方法對人耳圖像進行去噪、增強的處理;3)采用小波模極大值對步驟2)的人耳圖像進行去噪和邊緣提取的光照強度歸一化的處理,得到圖像的特征值。3.根據(jù)權(quán)利要求2所迷的方法,其特征在于所述人耳的去噪與增強是對圖像f作曲波變換分解,將圖像分塊,再對每個塊做Ridgelet變換。4.根據(jù)權(quán)利要求3所述的方法,其特征在于所述圖像f的曲波變換分解有以下步驟①子帶分解對圖像/的小波變換將其分解為多個子帶分量;②平滑分割將步驟①所述各個子帶采用平滑窗分割為若干子塊;設圖像塊尺寸為》,則A+1=2A其中,B^為分塊的尺寸;③脊波分析用二進小波對分割得到的各子塊作局部脊波變換<formula>formulaseeoriginaldocumentpage3</formula>endwhile;式中,2J是表示二進制離散,j表示二進制離散插入的點數(shù)量,K/(x,力和%力分別是尺度下圖像的水平高頻信息和垂直高頻信息,S2,+1/0,力表示圖像的一個平滑像。全文摘要本發(fā)明涉及一種綜合多方向多尺度與BP神經(jīng)網(wǎng)絡的人耳識別方法,有以下步驟(1)建立人耳數(shù)據(jù)庫采集人耳圖像,建立人耳數(shù)據(jù)庫的信息;(2)將不加噪聲和加噪聲的人耳圖像的灰度圖像進行處理;(3)對人耳圖像進行預處理;(4)人耳圖像用小波矩不變量的特征提??;(5)將處理過的圖像的Hu矩、改進小波矩特征輸入BP神經(jīng)網(wǎng)絡識別器,對人耳圖像樣本進行識別。本發(fā)明方法在神經(jīng)網(wǎng)絡中構(gòu)建人耳自動識別系統(tǒng)模塊,利用多方向多尺度方法和小波矩不變量方法識別人耳,對人耳圖像樣本,特別是對有光照變化、角度變化和遮擋變化的人耳圖像樣本進行識別,所述方法有檢測快速、方法簡單、識別率高等優(yōu)點。文檔編號G06K9/00GK101673340SQ20091010461公開日2010年3月17日申請日期2009年8月13日優(yōu)先權(quán)日2009年8月13日發(fā)明者劉嘉敏,朱晟君,謝海軍,邱兆春,黃虹溥申請人:重慶大學