亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖像識(shí)別方法及裝置的制作方法

文檔序號(hào):6380954閱讀:366來(lái)源:國(guó)知局
專利名稱:一種圖像識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像信息處理技術(shù)領(lǐng)域,特別涉及圖像識(shí)別方法及裝置。
背景技術(shù)
現(xiàn)在的圖像識(shí)別系統(tǒng)越來(lái)越廣泛的應(yīng)用,比如人臉識(shí)別、指紋識(shí)別,靜脈識(shí)別,手寫字體識(shí)別,印刷字體識(shí)別和車輛字符識(shí)別系統(tǒng)等,這些圖像識(shí)別系統(tǒng)主要是將待識(shí)別圖像通過(guò)一定的識(shí)別運(yùn)算后,得到一定的信息比如圖像中所表示的字符等。例如,車輛牌照識(shí)別系統(tǒng)在交通系統(tǒng)中有著不可替代的作用,主要是把攝像頭采集到車牌圖像輸入到車輛牌照識(shí)別系統(tǒng)后,該車輛牌照識(shí)別系統(tǒng)可以通過(guò)圖像處理和分析,分割出車牌字符,最后對(duì)分割出來(lái)的字符進(jìn)行模式識(shí)別,得到該車牌圖像所表示的車牌號(hào)碼,比如“粵B12345”,這樣給交通系統(tǒng)的自動(dòng)管理提供了極大的方便。車輛牌照識(shí)別系統(tǒng)包括車牌檢測(cè),歪斜校正,邊界確定,字符切分和字符識(shí)別等功能,其中,車牌字符識(shí)別是識(shí)別車牌號(hào)碼過(guò)程中的重要部分。目前,圖像識(shí)別方法主要包括模板匹配,神經(jīng)網(wǎng)絡(luò)(Artificial NeuralNetwork, ANN),隱馬爾可夫模型(Hidden Markov Model, HMM),支持向量機(jī)(SupportVector Machine, SVM)和降維等方法,其中有些方法可以提高識(shí)別速度但是損失了識(shí)別準(zhǔn)確度,有些方法提高了識(shí)別準(zhǔn)確度但是損失了識(shí)別速度。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供圖像識(shí)別方法及裝置,在提高識(shí)別速度的同時(shí)提高了識(shí)別準(zhǔn)確度。本發(fā)明實(shí)施例提供一種圖像識(shí)別方法,包括用第一圖像識(shí)別方法在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本,所述s為大于I的自然數(shù);用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型;根據(jù)所述選出的前s類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到所述待識(shí)別圖像所包含的信息。本發(fā)明實(shí)施例提供一種圖像識(shí)別裝置,包括樣本選取單元,用于利用第一圖像識(shí)別方法,在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前S類訓(xùn)練樣本,所述s為大于I的自然數(shù);模型確定單元,用于用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型;識(shí)別單元,用于根據(jù)所述選出的前s類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到所述待識(shí)別圖像所包含的信息。在本發(fā)明實(shí)施例的圖像識(shí)別方法中,圖像識(shí)別系統(tǒng)對(duì)待識(shí)別圖像進(jìn)行粗分類,即利用第一圖像識(shí)別方法,在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本;然后再根據(jù)粗分類結(jié)果進(jìn)行精確分類,即用第二圖像識(shí)別方法對(duì)已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型,并根據(jù)選出的前S類訓(xùn)練樣本,將待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到待識(shí)別圖像所包含的信息。本發(fā)明實(shí)施例中結(jié)合了兩種圖像識(shí)別的方法,這樣可以采用識(shí)別速度較高的第一圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行粗分類,然后采用準(zhǔn)確度較高的第二圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行精確分類時(shí)可以提高圖像識(shí)別準(zhǔn)確度,而由于在精確分類時(shí)是將待識(shí)別圖像與粗分類后確定的幾種類別的訓(xùn)練樣本進(jìn)行比較,而不是與全部類別的訓(xùn)練樣本進(jìn)行比較,這樣可以提高精確分類的速度。可見(jiàn),本發(fā)明實(shí)施例的方法可以在提高識(shí)別速度的同時(shí)提高了識(shí)別準(zhǔn)確度。


為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的一種圖像識(shí)別方法的流程圖;圖2是本發(fā)明實(shí)施例中在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本的方法流程圖;圖3是本發(fā)明具體的實(shí)施例提供的車輛牌照識(shí)別系統(tǒng)中兩種機(jī)器學(xué)習(xí)方法的流程圖;圖4是本發(fā)明具體的實(shí)施例提供的車牌字符識(shí)別方法的流程圖;圖5是本發(fā)明實(shí)施例提供的一種圖像識(shí)別裝置的結(jié)構(gòu)示意圖;圖6是本發(fā)明實(shí)施例提供的另一種圖像識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例提供一種圖像識(shí)別方法,主要是圖像識(shí)別系統(tǒng)將待識(shí)別圖像經(jīng)過(guò)一定的識(shí)別運(yùn)算得到待識(shí)別圖像中的一些信息比如字符等信息的方法,對(duì)于車輛牌照識(shí)別系統(tǒng)來(lái)說(shuō)主要是從車牌圖像中識(shí)別出車牌字符等,流程圖如圖1所示,包括步驟101,用第一圖像識(shí)別方法在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本,這里s為大于I的自然數(shù),這里第一圖像識(shí)別方法可以是降維的圖像識(shí)別方法等。本發(fā)明實(shí)施例中對(duì)于圖像的識(shí)別是先通過(guò)降維的圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行粗分類,具體地,可以通過(guò)大量前期收集的試驗(yàn)樣本作為訓(xùn)練樣本集,在訓(xùn)練樣本集中可以包括多種類別的訓(xùn)練樣本,先經(jīng)過(guò)訓(xùn)練得到訓(xùn)練樣本的協(xié)方差矩陣的特征值矩陣和特征向量矩陣,其中協(xié)方差矩陣可以表示訓(xùn)練樣本的不同維度之間的協(xié)方差即兩個(gè)隨機(jī)變量關(guān)系的統(tǒng)計(jì)量,協(xié)方差越大,說(shuō)明兩個(gè)變量關(guān)系越大,且協(xié)方差矩陣的特征值越大,說(shuō)明對(duì)應(yīng)的元素區(qū)分度越大;然后將特征值較大的特征向量組成的特征向量矩陣作為投影矩陣;最后將訓(xùn)練樣本和待識(shí)別圖像通過(guò)投影矩陣分別投影到最佳投影空間,即可將訓(xùn)練樣本和待識(shí)別圖像分別降到低維空間,從而可以在低維空間中比較訓(xùn)練樣本與待識(shí)別圖像,得到本步驟中最相近的前S類訓(xùn)練樣本。具體參見(jiàn)圖2所示,可以通過(guò)如下的步驟來(lái)實(shí)現(xiàn)A :利用降維方法對(duì)已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到表示元素區(qū)分度的矩陣,這里已知類別的訓(xùn)練樣本是指每個(gè)類別的字符對(duì)應(yīng)的圖像樣本,例如對(duì)于漢字來(lái)說(shuō),共有31個(gè)類別,而字母有24個(gè)類別,數(shù)字0-9和字母A-Z (除I和0)共有34個(gè)類別等,其中每個(gè)類別都可以有多種圖像樣本,用來(lái)與待識(shí)別圖像進(jìn)行比較。在得到表示元素區(qū)分度的矩陣時(shí),圖像識(shí)別系統(tǒng)具體可以采用線性降維和/或非線性降維相結(jié)合的方法,其中線性降維方法包括主成分分析(Principal ComponentAnalysis, PCA)法、線性鑒別分析(Linear Discriminant Analysis, LDA)法、獨(dú)立成分分析(Independent Component Analysis, ICA)法、二維主成分分析(2DPCA)法和二維線性鑒別分析(2DLDA)法等,而非線性降維方法包括核主成分分析(KPCA)法、核線性鑒別分析(KLDA)法和核獨(dú)立成分分析(KICA)法等。且圖像識(shí)別系統(tǒng)在對(duì)已知類型的訓(xùn)練樣本進(jìn)行訓(xùn)練時(shí),具體是對(duì)已知類型的訓(xùn)練樣本進(jìn)行特征提取,其中上述PCA法主要是提取出訓(xùn)練樣本中最主要的元素和結(jié)構(gòu),去除噪音和冗余后,將原有的復(fù)雜數(shù)據(jù)降維,而2DPCA法與PCA法類似,不同的是2DPCA法不需要將訓(xùn)練樣本的圖像數(shù)據(jù)展開(kāi)成一維向量,直接利用圖像的二維信息產(chǎn)生協(xié)方差矩陣,大大節(jié)約了訓(xùn)練過(guò)程;LDA法主要針對(duì)線性可分的情況,具體地確定一個(gè)線性轉(zhuǎn)換矩陣即一組投影方向,使訓(xùn)練樣本在該投影方向投影的類內(nèi)散布矩陣最小(即每一類的訓(xùn)練樣本盡可能多的聚在一起),而類間散布矩陣最大(即不同類別的訓(xùn)練樣本最大程度分開(kāi)),2DLDA法與LDA法的關(guān)系類似于2DPCA法與PCA法的關(guān)系,這里不在贅述;ICA法主要是將訓(xùn)練樣本進(jìn)行某種線性分解,使其分解成統(tǒng)計(jì)獨(dú)立的成分,這樣各個(gè)成分之間是相互獨(dú)立的;KPCA法,KLDA法,KICA法是三種基于核的方法,主要是通過(guò)核函數(shù)將線性不可分的訓(xùn)練樣本映射到線性可分的高維空間中,這樣,訓(xùn)練樣本在高維空間中是線性可分的;然后再利用相應(yīng)的PCA法、LDA法、ICA法等方法在高維線性空間的訓(xùn)練樣本進(jìn)行特征提取。B :基于上述步驟A中得到的表示元素區(qū)分度的矩陣,選擇特征值大于預(yù)置特征值所對(duì)應(yīng)的特征向量組成投影矩陣,這里的特征值是步驟A中得到的表示元素區(qū)分度的矩陣的特征值,且每個(gè)特征值對(duì)應(yīng)一個(gè)特征向量,本發(fā)明實(shí)施例中,需要在上述元素區(qū)分度的矩陣對(duì)應(yīng)的所有特征值中選擇部分特征值。C :將待識(shí)別圖像和已知類型的訓(xùn)練樣本分別根據(jù)上述投影矩陣投影到最佳投影空間(即一個(gè)低維空間),分別得到待識(shí)別圖像在最佳投影空間的特征向量及各類別樣本的最佳分類特征矩陣,這里投影過(guò)程具體是將待識(shí)別圖像對(duì)應(yīng)的向量與投影矩陣相乘得到待識(shí)別圖像在最佳投影空間的特征向量,且將已知的各個(gè)類別的訓(xùn)練樣本分別與投影矩陣相乘得到相應(yīng)類別樣本在最佳投影空間的特征向量即最佳分類特征矩陣。D :計(jì)算待識(shí)別圖像在最佳投影空間的特征向量分別與各類別樣本的最佳分類特征矩陣的歐式距離,歐式距離越小,則說(shuō)明待識(shí)別圖像與已知類別的訓(xùn)練樣本越相近,在各類別樣本分別對(duì)應(yīng)的歐式距離中選取較小的前S個(gè)歐式距離所對(duì)應(yīng)的訓(xùn)練樣本的類別,即為與待識(shí)別圖像最相近的前S類訓(xùn)練樣本。步驟102,用第二圖像識(shí)別方法對(duì)已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型,即對(duì)已知類別的訓(xùn)練樣本進(jìn)行特征提取得到這里第二圖像識(shí)別方法是與第一圖像識(shí)別方法不同的方法,可以包括SVM法,HM法或ANN等方法,從而可以分別得到的最終識(shí)別模型為SVM模型,HMM模型或ANN模型。這里最終識(shí)別模型中可以包括訓(xùn)練樣本中圖像特征的信息,比如支撐向量和特征個(gè)數(shù)等各種數(shù)據(jù)。其中,對(duì)于SVM方法來(lái)說(shuō),進(jìn)行SVM訓(xùn)練的過(guò)程即為對(duì)訓(xùn)練樣本進(jìn)行特征提取,并尋找最佳分類線或最佳分類面的過(guò)程,對(duì)于兩類線性可分的圖像,SVM訓(xùn)練即為尋找最佳分類線的過(guò)程,使得通過(guò)該最佳分類線不僅可以將兩類分開(kāi),而且使得分類間隔較大,可以實(shí)現(xiàn)最佳的分類效果;對(duì)于兩類線性不可分的圖像,可以找到一種滿足Mercer條件核函數(shù),該核函數(shù)即對(duì)應(yīng)某一變換空間中的內(nèi)積,則對(duì)已知的低維特征空間中的訓(xùn)練樣本可以通過(guò)核函數(shù)進(jìn)行內(nèi)積,變換到高維的線性空間,使得訓(xùn)練樣本在高維的線性空間中線性可分,此時(shí)最佳分類線對(duì)應(yīng)最佳分類面,因此SVM訓(xùn)練的過(guò)程即為找到最佳分類面的過(guò)程。對(duì)于HM法或ANN法的訓(xùn)練過(guò)程在此不進(jìn)行贅述。步驟103,根據(jù)步驟101中選出的前s類訓(xùn)練樣本,將待識(shí)別圖像在最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到所述待識(shí)別圖像所包含的信息,即利用最終識(shí)別模型將待識(shí)別圖像與上述前s類訓(xùn)練樣本進(jìn)行逐一對(duì)比,而得到與待識(shí)別圖像最接近的一個(gè)訓(xùn)練樣本,而不用與全部類別的訓(xùn)練樣本進(jìn)行對(duì)比,提高識(shí)別速度。具體地,可以將待識(shí)別圖像相應(yīng)地在SVM模型,HMM模型或ANN模型中識(shí)別運(yùn)算。在通過(guò)步驟101的粗分類之后,圖像識(shí)別系統(tǒng)就可以確定與待識(shí)別圖像最相近的幾個(gè)類別的訓(xùn)練樣本,然后通過(guò)本步驟進(jìn)行精確分類,即可精確地識(shí)別出該待識(shí)別圖像中所包含的信息。需要說(shuō)明的是,上述步驟101與步驟102之間沒(méi)有絕對(duì)的順序關(guān)系,可以同時(shí)執(zhí)行也可以順序執(zhí)行,圖1中所示的只是其中一種具體的實(shí)現(xiàn)方案。其上述第一圖像識(shí)別方法和第二圖像識(shí)別方法也可以有其它的組合方式,可以是用戶根據(jù)實(shí)際需要選擇的,一般情況下,在粗分類時(shí)可以選取識(shí)別速度較快的圖像識(shí)別方法,而在精確分類時(shí)可以采用識(shí)別準(zhǔn)確度較高的圖像識(shí)別方法,這樣就可以兼顧到識(shí)別準(zhǔn)確度和識(shí)別速度。可見(jiàn),在本發(fā)明實(shí)施例的圖像識(shí)別方法中,圖像識(shí)別系統(tǒng)對(duì)待識(shí)別圖像進(jìn)行粗分類,即利用第一圖像識(shí)別方法,在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本;然后再根據(jù)粗分類結(jié)果進(jìn)行精確分類,即用第二圖像識(shí)別方法對(duì)已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型,并根據(jù)選出的前s類訓(xùn)練樣本,將待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到待識(shí)別圖像所包含的信息。本發(fā)明實(shí)施例中結(jié)合了兩種圖像識(shí)別的方法,這樣可以采用識(shí)別速度較高的第一圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行粗分類,然后采用準(zhǔn)確度較高的第二圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行精確分類時(shí)可以提高圖像識(shí)別準(zhǔn)確度,而由于在精確分類時(shí)是將待識(shí)別圖像與粗分類后確定的幾種類別的訓(xùn)練樣本進(jìn)行比較,而不是與全部類別的訓(xùn)練樣本進(jìn)行比較,這樣可以提高精確分類的速度。可見(jiàn),本發(fā)明實(shí)施例的方法可以在提高識(shí)別速度的同時(shí)提高了識(shí)別準(zhǔn)確度。需要說(shuō)明的是,上述步驟101到103是采用一種已知類別的訓(xùn)練樣本對(duì)待識(shí)別圖像進(jìn)行識(shí)別,而在實(shí)際應(yīng)用過(guò)程中,有些實(shí)際獲取的圖像往往包含多種信息,比如漢字、數(shù)字或字母等字符,這就需要分別采用不同的已知類別的訓(xùn)練樣本來(lái)識(shí)別。比如對(duì)于包含漢字的圖像部分,需要采用漢字的31類訓(xùn)練樣本來(lái)識(shí)別,而對(duì)于包含數(shù)字的圖像部分,需要采用數(shù)字的10類訓(xùn)練樣本來(lái)識(shí)別。為了更進(jìn)一步地提高識(shí)別速度且提高識(shí)別準(zhǔn)確度,圖像識(shí)別系統(tǒng)可以在執(zhí)行上述步驟101之前,可以先獲取圖像,并對(duì)獲取的圖像進(jìn)行分割,分割成多個(gè)待識(shí)別圖像,每個(gè)待識(shí)別圖像中可以包含不同種類的信息,比如包含漢字、數(shù)字或字母等;然后對(duì)多個(gè)識(shí) 別圖像采用不同和/或相同的已知類型的訓(xùn)練樣本,進(jìn)行上述步驟101到103,即選出前s類型訓(xùn)練樣本,得到最終識(shí)別模型及在最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算的步驟。具體地,對(duì)于車牌字符的識(shí)別來(lái)說(shuō),由于每個(gè)車牌的第一個(gè)字符是漢字表示省份,第二個(gè)字符是英文字母表示發(fā)牌機(jī)關(guān),第三到第七個(gè)字符是由字符和數(shù)字組成。這樣可以先將獲取的車牌圖像分割成七個(gè)待識(shí)別圖像,第一個(gè)待識(shí)別圖像采用漢字的31類訓(xùn)練樣本來(lái)識(shí)別,第二個(gè)待識(shí)別圖像采用字母的24類訓(xùn)練樣本來(lái)識(shí)別,第三到第七個(gè)待識(shí)別圖像分別都采用數(shù)字0-9和字母A-Z (除I和0)的34類訓(xùn)練樣本來(lái)識(shí)別。上述對(duì)實(shí)際圖像需要進(jìn)行分割后才進(jìn)行識(shí)別的方法只是適用于某些圖像識(shí)別系統(tǒng)中,比如車輛牌照識(shí)別系統(tǒng),手寫字體識(shí)別系統(tǒng)和印刷字體識(shí)別系統(tǒng),而對(duì)于有些識(shí)別系統(tǒng)比如人臉識(shí)別或指紋識(shí)別系統(tǒng)中,獲取的圖像是一個(gè)整體的不能分割,則不需要對(duì)獲取的圖像進(jìn)行分割而直接將該獲取的圖像作為待識(shí)別圖像進(jìn)行識(shí)別。在具體實(shí)際應(yīng)用例中,對(duì)于一個(gè)類別的一個(gè)訓(xùn)練樣本來(lái)說(shuō),可以表示為mXn的二維圖像矩陣,且通過(guò)各行的首尾相連將其轉(zhuǎn)換成一維向量,長(zhǎng)度為D = mXn ;用N1,N2,......,隊(duì)分別表示每個(gè)類別的訓(xùn)練樣本的數(shù)目,其中N為訓(xùn)練樣本的總數(shù),L表示類別
的數(shù)量,而第c類別的訓(xùn)練樣本集合表示為Ie則所有類別的訓(xùn)練樣
,
本集可表示為
權(quán)利要求
1.一種圖像識(shí)別方法,其特征在于,包括 用第一圖像識(shí)別方法在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前S類訓(xùn)練樣本,所述S為大于I的自然數(shù); 用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型; 根據(jù)所述選出的前S類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到所述待識(shí)別圖像所包含的信息。
2.如權(quán)利要求I所述的方法,其特征在于,所述用第一圖像識(shí)別方法在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本,具體包括 利用降維方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到表示元素區(qū)分度的矩陣; 基于所述表示元素區(qū)分度的矩陣,選擇特征值大于預(yù)置特征值所對(duì)應(yīng)的特征向量組成投影矩陣; 將所述待識(shí)別圖像和已知類型的訓(xùn)練樣本通過(guò)所述投影矩陣分別投影到所述最佳投影空間,并分別得到待識(shí)別圖像在所述最佳投影空間的特征向量及各類別樣本的最佳分類特征矩陣; 計(jì)算所述待識(shí)別圖像在所述最佳投影空間的特征向量分別與各個(gè)類別樣本的最佳分類特征矩陣的歐式距離,并選取較小的前s個(gè)歐式距離所對(duì)應(yīng)的訓(xùn)練樣本的類別。
3.如權(quán)利要求2所述的方法,其特征在于,所述降維方法包括線性降維法和/或非線性降維法的結(jié)合; 所述線性降維法包括主成分分析PCA法、線性鑒別分析LDA法、獨(dú)立成分分析ICA法、二維主成分分析2DPCA法或二維線性鑒別分析2DLDA法;所述非線性降維法包括核主成分分析KPCA法、核線性鑒別分析KLDA法或核獨(dú)立成分分析KICA法。
4.如權(quán)利要求I至3任一項(xiàng)所述的方法,其特征在于, 所述用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型具體包括對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行支持向量機(jī)SVM的訓(xùn)練得到SVM模型;根據(jù)所述選出的前s類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算具體包括將所述待識(shí)別圖像在所述SVM模型中按照所述前s類訓(xùn)練樣本進(jìn)行識(shí)別運(yùn)算;或, 所述用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型具體包括對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行隱馬爾科夫模型HMM的訓(xùn)練得到HMM模型;根據(jù)所述選出的前s類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算具體包括將所述待識(shí)別圖像在所述HMM模型中按照所述前s類訓(xùn)練樣本進(jìn)行識(shí)別運(yùn)算;或, 所述用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型具體包括對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行神經(jīng)網(wǎng)絡(luò)ANN的訓(xùn)練得到ANN模型;根據(jù)所述選出的前s類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算具體包括將所述待識(shí)別圖像在所述ANN模型中按照所述前s類訓(xùn)練樣本進(jìn)行識(shí)別運(yùn)算。
5.如權(quán)利要求I至3任一項(xiàng)所述方法,其特征在于,所述在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本之前還包括 獲取圖像,并將獲取的圖像進(jìn)行分割成多個(gè)待識(shí)別圖像,并對(duì)所述多個(gè)待識(shí)別圖像采用不同和/或相同的已知類型的訓(xùn)練樣本,進(jìn)行上述選出前s類訓(xùn)練樣本,得到最終識(shí)別模型及在最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算的步驟。
6.一種圖像識(shí)別裝置,其特征在于,包括 樣本選取單元,用于利用第一圖像識(shí)別方法,在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本,所述s為大于I的自然數(shù); 模型確定單元,用于用第二圖像識(shí)別方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到最終識(shí)別模型; 識(shí)別單元,用于根據(jù)所述選出的前S類訓(xùn)練樣本,將所述待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算,得到所述待識(shí)別圖像所包含的信息。
7.如權(quán)利要求6所述的裝置,其特征在于,所述樣本選取單元具體包括 訓(xùn)練單元,用于利用降維方法對(duì)所述已知類別的訓(xùn)練樣本進(jìn)行訓(xùn)練得到表示元素區(qū)分度的矩陣; 投影矩陣確定單元,用于基于所述表示元素區(qū)分度的矩陣,選擇特征值大于預(yù)置特征值所對(duì)應(yīng)的特征向量組成投影矩陣; 投影單元,用于將所述待識(shí)別圖像和已知類型的訓(xùn)練樣本通過(guò)所述投影矩陣分別投影到所述最佳投影空間,并分別得到待識(shí)別圖像在所述最佳投影空間的特征向量及各類別樣本的最佳分類特征矩陣; 計(jì)算選取單元,用于計(jì)算所述待識(shí)別圖像在所述最佳投影空間的特征向量分別與各個(gè)類別樣本的最佳分類特征矩陣的歐式距離,并選取較小的前s個(gè)歐式距離所對(duì)應(yīng)的訓(xùn)練樣本的類別。
8.如權(quán)利要求6或7所述的裝置,其特征在于,還包括 圖像分割單元,用于獲取圖像,并將獲取的圖像進(jìn)行分割成多個(gè)待識(shí)別圖像; 所述樣本選取單元,模型確定單元和識(shí)別單元,分別用于對(duì)所述多個(gè)待識(shí)別圖像采用不同和/或相同的已知類型的訓(xùn)練樣本,進(jìn)行所述選出前s類型訓(xùn)練樣本,得到最終識(shí)別模型及在最終識(shí)別模型中進(jìn)行識(shí)別運(yùn)算的步驟。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了圖像識(shí)別方法及裝置,應(yīng)用于圖像信息處理技術(shù)領(lǐng)域。在本發(fā)明實(shí)施例的圖像識(shí)別方法中,結(jié)合了兩種圖像識(shí)別的方法,這樣可以采用識(shí)別速度較高的第一圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行粗分類,利用第一圖像識(shí)別方法,在已知類別的訓(xùn)練樣本中選出與待識(shí)別圖像最相近的前s類訓(xùn)練樣本;然后采用準(zhǔn)確度較高的第二圖像識(shí)別方法對(duì)待識(shí)別圖像進(jìn)行精確分類時(shí)可以提高圖像識(shí)別準(zhǔn)確度,將待識(shí)別圖像在所述最終識(shí)別模型中進(jìn)行識(shí)別,而由于在精確分類時(shí)是將待識(shí)別圖像與粗分類后確定的幾種類別的訓(xùn)練樣本進(jìn)行比較,而不是與全部類別的訓(xùn)練樣本進(jìn)行比較,這樣可以提高精確分類的速度,這樣可以在提高識(shí)別速度的同時(shí)提高了識(shí)別準(zhǔn)確度。
文檔編號(hào)G06K9/66GK102982349SQ20121044739
公開(kāi)日2013年3月20日 申請(qǐng)日期2012年11月9日 優(yōu)先權(quán)日2012年11月9日
發(fā)明者唐健, 陶昆, 吳偉華, 廖振生 申請(qǐng)人:深圳市捷順科技實(shí)業(yè)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1