本發(fā)明涉及機(jī)器學(xué)習(xí)技術(shù),尤其涉及一種語(yǔ)種識(shí)別方法及裝置。
背景技術(shù):
::隨著人和計(jì)算機(jī)進(jìn)行交互的需求的增多,為了使人機(jī)交互更加高效,希望能有一個(gè)系統(tǒng)可以處理多種諸如印刷體和手寫體文檔形式的輸入。盡管計(jì)算機(jī)被廣泛應(yīng)用于幾乎所有領(lǐng)域,但是紙質(zhì)文檔仍然在接下來的很長(zhǎng)時(shí)間內(nèi)擁有重要的地位。此外,物理形式的商業(yè)文檔廣泛存在以滿足現(xiàn)實(shí)中的多種需求。例如,傳真文件,出示在法庭上的文件等等。因此,我們迫切需要能夠自動(dòng)提取、分析和存儲(chǔ)來自現(xiàn)有的紙質(zhì)表單的信息,以及,在需要時(shí)進(jìn)行維護(hù)和訪問的方法和系統(tǒng)。所有這些問題歸結(jié)于文本圖像分析。語(yǔ)種識(shí)別是文本圖像處理領(lǐng)域中的一個(gè)重要組成部分,其應(yīng)用場(chǎng)景有文本圖像排序、搜索包含特定語(yǔ)言的在線文本文檔、設(shè)計(jì)出多語(yǔ)種光學(xué)字符識(shí)別(opticalcharacterrecognition,ocr)系統(tǒng)以及基于基礎(chǔ)文檔的語(yǔ)種自動(dòng)文本檢索系統(tǒng)等等。目前,可以基于圖像的紋理特征進(jìn)行語(yǔ)種識(shí)別?,F(xiàn)有的基于紋理特征的語(yǔ)種識(shí)別方法主要有:基于灰度級(jí)共生矩陣法、基于分形維數(shù)法以及基于gabor濾波器法等幾種。這些方法首先均需要提取圖像的紋理特征?;诨叶燃?jí)共生矩陣法是根據(jù)共生矩陣來提取圖像的特征值從而進(jìn)行語(yǔ)種識(shí)別的方法。實(shí)際應(yīng)用中,因?yàn)榛叶裙采仃嚨挠?jì)算比較復(fù)雜,一般會(huì)通過圖像二值化的預(yù)處理來降低運(yùn)算的復(fù)雜度。這樣處理后的圖像的灰度級(jí)共生矩陣會(huì)產(chǎn)生三個(gè)值,將這三個(gè)值作為紋理特征能夠用于語(yǔ)種識(shí)別。基于分形維數(shù)的方法的基本理念是將圖像理解為一個(gè)多重的分形集,圖像的紋理特征通過對(duì)相應(yīng)的廣義維數(shù)譜的計(jì)算得。基于分形維數(shù)的方法將文本圖像當(dāng)做一個(gè)分形模型來進(jìn)行處理,圖像的紋理特征通過差分計(jì)盒維數(shù)計(jì)算出的分形維數(shù)來表達(dá),從而完成語(yǔ)種識(shí)別的任務(wù)。基于gabor濾波器方法構(gòu)造基于gabor濾波器的多通道模型,從而對(duì)文本圖像進(jìn)行紋理特征提取,可以實(shí)現(xiàn)語(yǔ)種識(shí)別的目的。但是,上述這些方法中均存在計(jì)算量大、紋理特征提取的時(shí)間長(zhǎng)的缺陷,因此,目前的語(yǔ)種識(shí)別方法效率較低。技術(shù)實(shí)現(xiàn)要素:為解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種語(yǔ)種識(shí)別方法及裝置,以提高語(yǔ)種識(shí)別的效率。第一方面,本發(fā)明實(shí)施例提供一種語(yǔ)種識(shí)別方法,包括:采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量;將所述待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取所述待識(shí)別圖像中文本的語(yǔ)種。如上所示的方法中,所述采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量,包括:采用插值濾波法對(duì)所述待識(shí)別圖像進(jìn)行處理,獲取所述待識(shí)別圖像的系數(shù)矩陣;將所述系數(shù)矩陣中所有行的前半行元素作為二階多小波的第一尺度函數(shù)的參數(shù),將所述系數(shù)矩陣中所有行的后半行元素作為二階多小波的第二尺度函數(shù)的參數(shù);根據(jù)所述第一尺度函數(shù)的參數(shù)與所述第二尺度函數(shù)的參數(shù)確定所述二階多小波;根據(jù)所述二階多小波對(duì)所述系數(shù)矩陣進(jìn)行分解,獲取所述待識(shí)別圖像的第一預(yù)設(shè)數(shù)量的細(xì)節(jié)子圖和第二預(yù)設(shè)數(shù)量的逼近子圖;分別確定每個(gè)所述細(xì)節(jié)子圖的能量均值和能量方差;將每個(gè)所述細(xì)節(jié)子圖的能量均值和能量方差作為所述待識(shí)別圖像的紋理特征矢量。如上所示的方法中,所述采用插值濾波法對(duì)所述待識(shí)別圖像進(jìn)行預(yù)處理之前,所述方法還包括:對(duì)所述待識(shí)別圖像的每個(gè)像素點(diǎn)的能量進(jìn)行歸一化處理,獲取歸一化后的待識(shí)別圖像;所述采用插值濾波法對(duì)所述待識(shí)別圖像進(jìn)行處理,包括:采用插值濾波法對(duì)所述歸一化后的待識(shí)別圖像進(jìn)行處理。如上所示的方法中,所述對(duì)所述待識(shí)別圖像的每個(gè)像素點(diǎn)的能量進(jìn)行歸一化處理,獲取歸一化后的待識(shí)別圖像,包括:根據(jù)公式獲取所述待識(shí)別圖像中每個(gè)像素點(diǎn)歸一化后的能量;其中,m表示所述待識(shí)別圖像中像素點(diǎn)的行序號(hào),n表示所述待識(shí)別圖像中像素點(diǎn)的列序號(hào),w(m,n)表示像素點(diǎn)(m,n)的能量,q表示所述待識(shí)別圖像中每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù);根據(jù)所有像素點(diǎn)歸一化后的能量確定所述歸一化后的待識(shí)別圖像。如上所示的方法中,所述分別確定每個(gè)所述細(xì)節(jié)子圖的能量均值和能量方差,包括:根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的能量值;其中:a表示所述細(xì)節(jié)子圖中像素點(diǎn)的行序號(hào),b表示所述細(xì)節(jié)子圖中像素點(diǎn)的列序號(hào),l=(1,2,3,4),表示每級(jí)分解同一個(gè)方向上的四個(gè)細(xì)節(jié)子圖;j=(1,2),表示分解級(jí)數(shù);k=(1,2,3),表示水平、垂直和對(duì)角三個(gè)方向;n表示所述細(xì)節(jié)子圖的每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù),w(a,b)表示像素點(diǎn)(a,b)的能量;根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的平均能量值;根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的能量方差。如上所示的方法中,在將所述待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的支持向量機(jī)svm中,獲取所述待識(shí)別圖像中文本的語(yǔ)種之前,所述方法還包括:采用多小波變換方法獲取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的紋理特征矢量;根據(jù)每個(gè)所述訓(xùn)練圖像的紋理特征矢量以及所述每個(gè)訓(xùn)練圖像的語(yǔ)種標(biāo)定結(jié)果,確定所述svm的分類面;所述將所述待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取所述待識(shí)別圖像中文本的語(yǔ)種,包括:根據(jù)所述待識(shí)別圖像的紋理特征矢量以及所述svm的分類面,確定所述待識(shí)別圖像中文本的語(yǔ)種。第二方面,本發(fā)明實(shí)施例提供一種語(yǔ)種識(shí)別裝置,包括:第一獲取模塊,用于采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量;第二獲取模塊,用于將所述待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的支持向量機(jī)svm中,獲取所述待識(shí)別圖像中文本的語(yǔ)種。如上所示的裝置中,所述第一獲取模塊具體用于:采用插值濾波法對(duì)所述待識(shí)別圖像進(jìn)行處理,獲取所述待識(shí)別圖像的系數(shù)矩陣;將所述系數(shù)矩陣中所有行的前半行元素作為二階多小波的第一尺度函數(shù)的參數(shù),將所述系數(shù)矩陣中所有行的后半行元素作為二階多小波的第二尺度函數(shù)的參數(shù);根據(jù)所述第一尺度函數(shù)的參數(shù)與所述第二尺度函數(shù)的參數(shù)確定所述二階多小波;根據(jù)所述二階多小波對(duì)所述系數(shù)矩陣進(jìn)行分解,獲取所述待識(shí)別圖像的第一預(yù)設(shè)數(shù)量的細(xì)節(jié)子圖和第二預(yù)設(shè)數(shù)量的逼近子圖;分別確定每個(gè)所述細(xì)節(jié)子圖的能量均值和能量方差;將每個(gè)所述細(xì)節(jié)子圖的能量均值和能量方差作為所述待識(shí)別圖像的紋理特征矢量。如上所示的裝置中,所述裝置還包括:歸一化處理模塊,用于對(duì)所述待識(shí)別圖像的每個(gè)像素點(diǎn)的能量進(jìn)行歸一化處理,獲取歸一化后的待識(shí)別圖像;所述第一獲取模塊采用插值濾波法對(duì)所述待識(shí)別圖像進(jìn)行處理,具體包括:采用插值濾波法對(duì)所述歸一化后的待識(shí)別圖像進(jìn)行處理。如上所示的裝置中,所述歸一化處理模塊用于:根據(jù)公式獲取所述待識(shí)別圖像中每個(gè)像素點(diǎn)歸一化后的能量;其中,m表示所述待識(shí)別圖像中像素點(diǎn)的行序號(hào),n表示所述待識(shí)別圖像中像素點(diǎn)的列序號(hào),w(m,n)表示像素點(diǎn)(m,n)的能量,q表示所述待識(shí)別圖像中每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù);根據(jù)所有像素點(diǎn)歸一化后的能量確定所述歸一化后的待識(shí)別圖像。本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法及裝置,通過采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量,將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種,實(shí)現(xiàn)了采用多小波變換方法獲取紋理特征矢量,由于多小波變換方法獲取紋理特征矢量的過程較快,因此,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法的識(shí)別效率較高。同時(shí),由于多小波變換方法的特性,本發(fā)明實(shí)施例的語(yǔ)種識(shí)別方法的識(shí)別準(zhǔn)確率也較高。因此,采用本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法提高了語(yǔ)種識(shí)別的效率和準(zhǔn)確率。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的流程示意圖;圖2為圖1所示實(shí)施例中s101的一種具體的實(shí)現(xiàn)方式的流程示意圖;圖3為圖2中進(jìn)行多小波變換的示意圖;圖4為圖3中的實(shí)驗(yàn)結(jié)果示意圖;圖5為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的一種具體實(shí)現(xiàn)方法的流程示意圖;圖6a為驗(yàn)證本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的第一圖像庫(kù)的示意圖;圖6b為驗(yàn)證本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的第二圖像庫(kù)的示意圖;圖7為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置實(shí)施例的結(jié)構(gòu)示意圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”、“第三”及“第四”等(如果存在)是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。下面以具體的實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。下面這幾個(gè)具體的實(shí)施例可以相互結(jié)合,對(duì)于相同或相似的概念或過程可能在某些實(shí)施例不再贅述。圖1為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的流程示意圖。如圖1所示,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法包括如下步驟:s101:采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量。具體地,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法可以由計(jì)算機(jī)執(zhí)行。確定圖像中文本的語(yǔ)種可以應(yīng)用于對(duì)文本圖像的排序或者搜索包含特定語(yǔ)言的在線文本文檔等。基于語(yǔ)種識(shí)別不同的應(yīng)用場(chǎng)景,本發(fā)明實(shí)施例中的計(jì)算機(jī)可以是搜索引擎的服務(wù)器,或者,文獻(xiàn)數(shù)據(jù)庫(kù)中的服務(wù)器。圖像的紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺特征,指的是空間變化的像素強(qiáng)度的函數(shù)。因此,待識(shí)別圖像的紋理特征矢量可以反映待識(shí)別圖像的隨空間變化的像素強(qiáng)度。本發(fā)明實(shí)施例中的待識(shí)別圖像可以是由紙質(zhì)材料掃描得到的文本圖像,或者,是由文字編輯軟件生成的文檔轉(zhuǎn)換而成的文本圖像。待識(shí)別圖像中的文字的內(nèi)容可以是各種語(yǔ)言的小說以及文獻(xiàn)等。圖2為圖1所示實(shí)施例中s101的一種具體的實(shí)現(xiàn)方式的流程示意圖。如圖2所示,在一種可能的實(shí)現(xiàn)方式中,采用多小波變化方法獲取待識(shí)別圖像的紋理特征矢量的具體過程如下:s1011:采用插值濾波法對(duì)待識(shí)別圖像進(jìn)行處理,獲取待識(shí)別圖像的系數(shù)矩陣。由于多小波變換只適用于向量信號(hào),因此,要對(duì)圖像信號(hào)進(jìn)行多小波變換,必須要先對(duì)圖像的行和列進(jìn)行預(yù)濾波,然后將經(jīng)過預(yù)濾波的圖像的行和列,按照一定的規(guī)則組成向量信號(hào),再進(jìn)行多小波變換。表示一幅n×n的待識(shí)別圖像。其中,n表示這個(gè)圖像的每一行和每一列的像素點(diǎn)的總個(gè)數(shù),可以看出,這個(gè)圖像是一個(gè)正方形的圖像,ai,j表示像素點(diǎn)(i,j)的像素值,1≤i≤n,0≤j≤n,像素點(diǎn)(i,j)表示的是第i行第j列的像素點(diǎn)。插值濾波法的具體過程如下所示:首先將待識(shí)別圖像a的每一行按照下面的方式組成行向量信號(hào):然后對(duì)airow(n)進(jìn)行前置預(yù)濾波:其中,其表示預(yù)濾波器的沖激響應(yīng),則iirow(n)組成的i1為2n行,n/2列的矩陣。再進(jìn)行列前置預(yù)濾波:將i1的每一列按照下面的方式組成列向量信號(hào):然后對(duì)bicol(n)進(jìn)行前置預(yù)濾波:最終得到的iicol(n)組成的i2就是該待識(shí)別圖像的系數(shù)矩陣。s1012:將系數(shù)矩陣中所有行的前半行元素作為二階多小波的第一尺度函數(shù)的參數(shù),將系數(shù)矩陣中所有行的后半行元素作為二階多小波的第二尺度函數(shù)的參數(shù)。具體地,可選的,本發(fā)明實(shí)施例中選取雙正交多小波“ghmap2”對(duì)系數(shù)矩陣進(jìn)行分解。ghmap2是雙正交的多重小波函數(shù),由兩個(gè)尺度函數(shù)構(gòu)造。該二階多小波有兩個(gè)參數(shù):第一尺度函數(shù)和第二尺度函數(shù)。確定了第一尺度函數(shù)的參數(shù)和第二尺度函數(shù)的參數(shù)就確定了二階多小波。第一尺度函數(shù)和第二尺度函數(shù)的參數(shù)指的是第一尺度函數(shù)和第二尺度函數(shù)的尺度因子。根據(jù)系數(shù)矩陣可以確定第一尺度函數(shù)的參數(shù)和第二尺度函數(shù)的參數(shù)。s1013:根據(jù)第一尺度函數(shù)的參數(shù)與第二尺度函數(shù)的參數(shù)確定二階多小波。s1014:根據(jù)二階多小波對(duì)系數(shù)矩陣進(jìn)行分解,獲取待識(shí)別圖像的第一預(yù)設(shè)數(shù)量的細(xì)節(jié)子圖和第二預(yù)設(shè)數(shù)量的逼近子圖。具體地,本發(fā)明實(shí)施例中,對(duì)系數(shù)矩陣進(jìn)行了兩級(jí)分解,最終可以獲得4個(gè)逼近子圖和24個(gè)細(xì)節(jié)子圖。圖3為圖2中進(jìn)行多小波變換的示意圖。如圖3所示,先對(duì)待識(shí)別圖像進(jìn)行預(yù)濾波處理,獲取待識(shí)別圖像的系數(shù)矩陣。再對(duì)系數(shù)矩陣進(jìn)行一級(jí)分解和二級(jí)分解。一級(jí)分解后有四類圖:ll、hl、lh和hh。該四類圖是根據(jù)多分辨分析理論將二維離散小波變換等效成通過兩組鏡像濾波器分解,重建信號(hào)的過程得到的參數(shù)。ll對(duì)應(yīng)行、列分別卷積分解濾波器中的低通濾波器,hl對(duì)應(yīng)行卷積分解高通濾波器、列卷積分解低通濾波器,以次類推lh和hh。其中hh、lh和hl保持了原始圖像的邊緣細(xì)節(jié)信息,刻畫了圖像的細(xì)節(jié)特征,稱為細(xì)節(jié)子圖。ll保留了原圖的較多能量信息,稱為逼近子圖。二級(jí)分解中,對(duì)ll圖再進(jìn)行分解,得到16個(gè)子圖。這16個(gè)子圖中,有4個(gè)ll圖,該4個(gè)ll圖31為逼近子圖,二級(jí)分解后的其他圖為細(xì)節(jié)子圖,因此,細(xì)節(jié)子圖的數(shù)量的12+12=24個(gè)。圖4為圖3中的實(shí)驗(yàn)結(jié)果示意圖,圖4中圖41為逼近子圖,其他圖為細(xì)節(jié)子圖。本發(fā)明實(shí)施例中的細(xì)節(jié)子圖和逼近子圖指的是二級(jí)分解后的圖。s1015:分別確定每個(gè)細(xì)節(jié)子圖的能量均值和能量方差。具體地,可以根據(jù)細(xì)節(jié)子圖中每個(gè)像素點(diǎn)的能量確定每個(gè)細(xì)節(jié)子圖的能量均值和能量方差。細(xì)節(jié)子圖以矩陣的形式存儲(chǔ),矩陣中每個(gè)元素的值表示的即是這個(gè)元素代表的像素點(diǎn)的能量。根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的能量值。其中:a表示細(xì)節(jié)子圖中像素點(diǎn)的行序號(hào),b表示細(xì)節(jié)子圖中像素點(diǎn)的列序號(hào),l=(1,2,3,4),表示每級(jí)分解同一個(gè)方向上的四個(gè)細(xì)節(jié)子圖;j=(1,2),表示分解級(jí)數(shù);k=(1,2,3),表示水平、垂直和對(duì)角三個(gè)方向;n表示細(xì)節(jié)子圖的每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù)??梢钥吹?,細(xì)節(jié)子圖為正方形。根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的平均能量值。根據(jù)公式確定每個(gè)細(xì)節(jié)子圖的能量方差。s1016:將每個(gè)細(xì)節(jié)子圖的能量均值和能量方差作為待識(shí)別圖像的紋理特征矢量??紤]到針對(duì)文本圖像,不同的方向和頻率上的信息分布是不同的,而細(xì)節(jié)子圖針對(duì)邊緣信息的表達(dá)能力強(qiáng),因此,本發(fā)明實(shí)施例中采用全部細(xì)節(jié)子圖的能量均值和能量方差來構(gòu)造待識(shí)別圖像的紋理特征。在確定出了每個(gè)細(xì)節(jié)子圖的能量均值和能量方差之后,將這些能量均值和能量方差作為待識(shí)別圖像的紋理特征矢量。由于細(xì)節(jié)子圖的數(shù)量為24個(gè),每個(gè)細(xì)節(jié)子圖有能量均值和能量方差兩個(gè)維度的度量,因此,紋理特征矢量是48維的。紋理特征矢量表示如下:s102:將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種。具體地,支持向量機(jī)(supportvectormachine,svm)是根據(jù)訓(xùn)練圖像集確定的。在s102之前,需要確定svm中的分類面,該過程為:采用多小波變換方法獲取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的紋理特征矢量;根據(jù)每個(gè)訓(xùn)練圖像的紋理特征矢量以及每個(gè)訓(xùn)練圖像的語(yǔ)種標(biāo)定結(jié)果,確定svm的分類面。每個(gè)訓(xùn)練圖像的語(yǔ)種標(biāo)定結(jié)果指的是根據(jù)人工或者其他方式確定的該訓(xùn)練圖像中文本的正確的語(yǔ)種結(jié)果??蛇x的,在將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種可以為:根據(jù)待識(shí)別圖像的紋理特征矢量以及svm的分類面,確定待識(shí)別圖像中文本的語(yǔ)種。本發(fā)明實(shí)施例中可以采用libsvm工具包確定svm。這是一個(gè)簡(jiǎn)單有效的關(guān)于svm的工具包,提供了多種接口,方便我們針對(duì)具體應(yīng)用進(jìn)行調(diào)節(jié)。同時(shí),提供了很多的默認(rèn)參數(shù),簡(jiǎn)化了調(diào)節(jié)參數(shù),同時(shí)提供了交互檢驗(yàn)的功能。分類步驟如下:1)根據(jù)如下格式準(zhǔn)備數(shù)據(jù)集:<label><index1>:<value1><index2>:<value2>...其中<label>用來標(biāo)志一個(gè)類別。<index>是以1開始的整數(shù),可以是不連續(xù)的;<value>為實(shí)數(shù)。2)使用scale方法縮放數(shù)據(jù)來提高運(yùn)行效率;3)選擇徑向基核函數(shù)作為核函數(shù);4)訓(xùn)練調(diào)節(jié)參數(shù)c與g;5)根據(jù)參數(shù)c和g完成模型的訓(xùn)練;6)利用訓(xùn)練好的svm分類器在測(cè)試集上進(jìn)行測(cè)試??蛇x的,可以對(duì)待識(shí)別圖像進(jìn)行能量歸一化。對(duì)于不同的待識(shí)別圖像,會(huì)有不同的能量,從而影響子圖能量的計(jì)算,因此,在進(jìn)行多小波變換前,對(duì)待識(shí)別圖像的每個(gè)像素點(diǎn)的能量進(jìn)行歸一化處理,獲取歸一化后的待識(shí)別圖像。則在采用插值濾波法對(duì)待識(shí)別圖像進(jìn)行處理時(shí),為采用插值濾波法對(duì)歸一化后的待識(shí)別圖像進(jìn)行處理??梢愿鶕?jù)公式獲取待識(shí)別圖像中每個(gè)像素點(diǎn)歸一化后的能量。其中,m表示待識(shí)別圖像中像素點(diǎn)的行序號(hào),n表示待識(shí)別圖像中像素點(diǎn)的列序號(hào),w(m,n)表示像素點(diǎn)(m,n)的能量,q表示待識(shí)別圖像中每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù)。在確定所有像素點(diǎn)歸一化后的能量后,將這些像素點(diǎn)的能量以矩陣的形式進(jìn)行排列,則該矩陣表示的即是歸一化后的待識(shí)別圖像。即,根據(jù)所有像素點(diǎn)歸一化后的能量確定歸一化后的待識(shí)別圖像。圖5為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的一種具體實(shí)現(xiàn)方法的流程示意圖。如圖5所示,有一待識(shí)別圖像51,對(duì)該待識(shí)別圖像51進(jìn)行能量歸一化。對(duì)歸一化后的待識(shí)別圖像進(jìn)行多小波分解,獲取分解圖,從這些分解圖中可以獲取該待識(shí)別圖像的紋理特征矢量。將紋理特征矢量輸入svm中,即可以獲取該待識(shí)別圖像的文本的語(yǔ)種。這里的語(yǔ)種可以是英文、中文、俄文、日文或者阿拉伯文等。需要說明的是,一個(gè)svm為一個(gè)二分類的分類器。在本發(fā)明實(shí)施例中,可以預(yù)先確定多個(gè)svm,以實(shí)現(xiàn)多語(yǔ)種的識(shí)別。例如,svm1為中文與英文的分類器,svm2為俄文與日文的分類器,則svm1與svm2組成的svm系統(tǒng)可以實(shí)現(xiàn)4個(gè)語(yǔ)種的識(shí)別。以下描述驗(yàn)證本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法的過程。圖6a為驗(yàn)證本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的第一圖像庫(kù)的示意圖。圖6b為驗(yàn)證本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法實(shí)施例的第二圖像庫(kù)的示意圖。由于語(yǔ)種識(shí)別問題的研究領(lǐng)域并沒有權(quán)威的可以獲得的文本圖像庫(kù),因此,本發(fā)明采集并建立了兩個(gè)文本圖像庫(kù)來檢驗(yàn)提出的方法。為了測(cè)試多小波變換提取紋理特征方法對(duì)于圖像質(zhì)量的魯棒性,專門建立了第二圖像庫(kù)。第一圖像庫(kù):將文字編輯軟件形成的文檔轉(zhuǎn)換成靜止圖像,文字內(nèi)容主要來自于中英文小說和民族語(yǔ)文翻譯中心的多民族語(yǔ)言材料,大小為128x128,存儲(chǔ)為8位灰度圖像,包含中、英、藏、維四種文字的文本圖像各300幅,幾乎無質(zhì)量退化現(xiàn)象。每一幅圖像含有8個(gè)文本行。如圖6a所示。第二圖像庫(kù):由紙質(zhì)材料掃描得到文本圖像,圖像來源為互聯(lián)網(wǎng)上采集以及低質(zhì)量的便攜式文檔格式(portabledocumentformat,pdf)的轉(zhuǎn)換。大小為128x128,存儲(chǔ)為8位灰度圖像,包含英、中兩種文字的文本圖像各200幅。此類圖像來源比較復(fù)雜,普遍具有質(zhì)量退化的現(xiàn)象,比如斷裂、噪點(diǎn)、傾斜等。如圖6b所示。該驗(yàn)證過程所使用的硬件和軟件配置如下:1、硬件環(huán)境:中央處理器(centralprocessingunit,cpu):intel(r)core(tm)quadcpu@2.40ghz,內(nèi)存:4g;2、軟件環(huán)境:操作系統(tǒng):64位windows8操作系統(tǒng)。實(shí)驗(yàn)平臺(tái):matlabr2014a在該驗(yàn)證過程中,算法性能的評(píng)價(jià)指標(biāo)分為兩個(gè)部分:語(yǔ)種識(shí)別的效率和語(yǔ)種識(shí)別的效果。效率主要參考紋理特征矢量的提取時(shí)間,效果主要參考交叉驗(yàn)證的準(zhǔn)確率和召回率。準(zhǔn)確率的定義為:1.準(zhǔn)確率=分類正確樣本數(shù)/分為該類別的總樣本數(shù);召回率的定義為:2.召回率=分類正確樣本數(shù)/樣本集中該類樣本數(shù)。分別在第一圖像庫(kù)和第二圖像庫(kù)上進(jìn)行了實(shí)驗(yàn),并采用十次十折交叉驗(yàn)證的方法對(duì)算法進(jìn)行驗(yàn)證,得到準(zhǔn)確率和召回率,并統(tǒng)計(jì)平均的特征分析時(shí)間。通過計(jì)算,本發(fā)明單幅圖像的提取時(shí)間在0.4639s左右。表1為針對(duì)第一圖像庫(kù)的實(shí)驗(yàn)結(jié)果。表2為針對(duì)第二圖像庫(kù)的實(shí)驗(yàn)結(jié)果。表1針對(duì)第一圖像庫(kù)的實(shí)驗(yàn)結(jié)果表2針對(duì)第二圖像庫(kù)的實(shí)驗(yàn)結(jié)果從表1和表2可以看出,采用本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法英文圖像分類的準(zhǔn)確率在90%左右,識(shí)別的準(zhǔn)確率較高。本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法,通過采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量,將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種,實(shí)現(xiàn)了采用多小波變換方法獲取紋理特征矢量,由于多小波變換方法獲取紋理特征矢量的過程較快,因此,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法的識(shí)別效率較高。同時(shí),由于多小波變換方法的特性,本發(fā)明實(shí)施例的語(yǔ)種識(shí)別方法的識(shí)別準(zhǔn)確率也較高。因此,采用本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別方法提高了語(yǔ)種識(shí)別的效率和準(zhǔn)確率。圖7為本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置實(shí)施例的結(jié)構(gòu)示意圖。如圖7所示,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置包括如下模塊:第一獲取模塊71,用于采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量??蛇x的,第一獲取模塊71具體用于:采用插值濾波法對(duì)待識(shí)別圖像進(jìn)行處理,獲取待識(shí)別圖像的系數(shù)矩陣;將系數(shù)矩陣中所有行的前半行元素作為二階多小波的第一尺度函數(shù)的參數(shù),將系數(shù)矩陣中所有行的后半行元素作為二階多小波的第二尺度函數(shù)的參數(shù);根據(jù)第一尺度函數(shù)的參數(shù)與第二尺度函數(shù)的參數(shù)確定二階多小波;根據(jù)二階多小波對(duì)系數(shù)矩陣進(jìn)行分解,獲取待識(shí)別圖像的第一預(yù)設(shè)數(shù)量的細(xì)節(jié)子圖和第二預(yù)設(shè)數(shù)量的逼近子圖;分別確定每個(gè)細(xì)節(jié)子圖的能量均值和能量方差;將每個(gè)細(xì)節(jié)子圖的能量均值和能量方差作為待識(shí)別圖像的紋理特征矢量。第二獲取模塊72,用于將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種??蛇x的,該裝置還包括:歸一化處理模塊,用于對(duì)待識(shí)別圖像的每個(gè)像素點(diǎn)的能量進(jìn)行歸一化處理,獲取歸一化后的待識(shí)別圖像。則第一獲取模塊71采用插值濾波法對(duì)待識(shí)別圖像進(jìn)行處理,具體包括:采用插值濾波法對(duì)歸一化后的待識(shí)別圖像進(jìn)行處理。歸一化處理模塊具體用于:根據(jù)公式獲取待識(shí)別圖像中每個(gè)像素點(diǎn)歸一化后的能量;其中,m表示待識(shí)別圖像中像素點(diǎn)的行序號(hào),n表示待識(shí)別圖像中像素點(diǎn)的列序號(hào),w(m,n)表示像素點(diǎn)(m,n)的能量,q表示待識(shí)別圖像中每一行像素點(diǎn)的總個(gè)數(shù)和每一列像素點(diǎn)的總個(gè)數(shù);根據(jù)所有像素點(diǎn)歸一化后的能量確定歸一化后的待識(shí)別圖像。該裝置還包括:第三獲取模塊,用于采用多小波變換方法獲取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的紋理特征矢量;確定模塊,用于根據(jù)每個(gè)訓(xùn)練圖像的紋理特征矢量以及每個(gè)訓(xùn)練圖像的語(yǔ)種標(biāo)定結(jié)果,確定svm的分類面。則第二獲取模塊72具體用于根據(jù)待識(shí)別圖像的紋理特征矢量以及svm的分類面,確定待識(shí)別圖像中文本的語(yǔ)種。本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置具體可用于執(zhí)行圖1所示實(shí)施例的語(yǔ)種識(shí)別方法,其實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置,通過設(shè)置第一獲取模塊,用于采用多小波變換方法獲取待識(shí)別圖像的紋理特征矢量,第二獲取模塊,用于將待識(shí)別圖像的紋理特征矢量輸入預(yù)先確定的svm中,獲取待識(shí)別圖像中文本的語(yǔ)種,實(shí)現(xiàn)了采用多小波變換方法獲取紋理特征矢量,由于多小波變換方法獲取紋理特征矢量的過程較快,因此,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置的識(shí)別效率較高。同時(shí),由于多小波變換方法的特性,本發(fā)明實(shí)施例的語(yǔ)種識(shí)別裝置的識(shí)別準(zhǔn)確率也較高。因此,本發(fā)明實(shí)施例提供的語(yǔ)種識(shí)別裝置提高了語(yǔ)種識(shí)別的效率和準(zhǔn)確率。本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12