本申請(qǐng)涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種手寫體數(shù)字識(shí)別方法及裝置。
背景技術(shù):目前,手寫體數(shù)字識(shí)別的應(yīng)用較為廣泛,如郵件分揀中的郵政編碼識(shí)別、財(cái)稅識(shí)別、金融數(shù)字識(shí)別等應(yīng)用領(lǐng)域,人們對(duì)手寫體數(shù)字識(shí)別的精度與準(zhǔn)確度的要求日漸增高。K近鄰分類器是一種經(jīng)典的分類器,由于其計(jì)算方便得到廣泛應(yīng)用。但在K近鄰分類器中的方案中涉及到的樣本點(diǎn)之間的距離測(cè)度是預(yù)先制定的,因此,這種方案會(huì)使得進(jìn)行手寫體數(shù)字識(shí)別的準(zhǔn)確率明顯降低。
技術(shù)實(shí)現(xiàn)要素:本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種手寫體數(shù)字識(shí)別方法及裝置,用以解決現(xiàn)有技術(shù)中K近鄰分類器中的距離測(cè)度預(yù)先制定,使得進(jìn)行手寫體數(shù)字識(shí)別的準(zhǔn)確率降低的技術(shù)問(wèn)題,進(jìn)一步解決了現(xiàn)有近鄰成分分析方案對(duì)小樣本無(wú)法處理的技術(shù)問(wèn)題。本申請(qǐng)?zhí)峁┝艘环N手寫體數(shù)字識(shí)別方法,包括:分別將第一空間中的訓(xùn)練樣本集合和手寫體數(shù)字的待測(cè)樣本映射至第二空間中;其中,所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),所述訓(xùn)練樣本集合中的訓(xùn)練樣本包含至少兩種數(shù)字類別;依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣;利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;依據(jù)每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。上述方法,優(yōu)選的,所述分別將第一空間中的訓(xùn)練樣本集合和測(cè)試樣本集合映射至第二空間中,包括:利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,將第一空間中的訓(xùn)練樣本集合映射至第二空間中;其中,zi為所述第二空間中訓(xùn)練樣本集合內(nèi)的訓(xùn)練樣本,Φ(xi)為預(yù)設(shè)的映射函數(shù),xi為所述第一空間中訓(xùn)練樣本集合中的訓(xùn)練樣本,k(xi,xj)為核函數(shù);利用z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T,將所述第一空間中的測(cè)試樣本映射至所述第二空間中;其中,x為所述第一空間中的待測(cè)樣本,k(x,xj)為核函數(shù),z為被映射至所述第二空間中的待測(cè)樣本。上述方法,優(yōu)選的,所述依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣,包括:利用獲取每個(gè)所述訓(xùn)練樣本分別與區(qū)別于其自身的訓(xùn)練樣本之間的近鄰概率值;其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值;依據(jù)每個(gè)所述訓(xùn)練樣本的近鄰概率值,確定每個(gè)所述訓(xùn)練樣本屬于每種所述數(shù)字類別的類別概率值;利用d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)及每個(gè)所述訓(xùn)練樣本的類別概率值,確定測(cè)度變換矩陣;其中,d(zi,zj)為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj的距離,Q=ATA,A為所述第二空間中的測(cè)度變換矩陣。上述方法,優(yōu)選的,所述利用測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值,包括:利用d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N,獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;其中,d(z,zi)為所述待測(cè)樣本z與所述訓(xùn)練樣本zi之間的距離值,A為所述測(cè)度變換矩陣,N為所述訓(xùn)練樣本集合中訓(xùn)練樣本的總個(gè)數(shù)。上述方法,優(yōu)選的,所述依據(jù)每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別,包括:選取所述距離值小于或等于預(yù)設(shè)限值的訓(xùn)練樣本;依據(jù)選取的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。本申請(qǐng)還提供了一種手寫體數(shù)字識(shí)別裝置,包括:樣本映射單元,用于分別將第一空間中的訓(xùn)練樣本集合和待測(cè)樣本映射至第二空間中;其中,所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),所述訓(xùn)練樣本集合包含至少兩種數(shù)字類別的訓(xùn)練樣本;測(cè)度矩陣確定單元,用于依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣;距離值獲取單元,用于利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;類別確定單元,用于依據(jù)所述每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。上述裝置,優(yōu)選的,所述樣本映射單元包括:第一映射子單元,用于利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,將第一空間中的訓(xùn)練樣本集合映射至第二空間中;其中,zi為所述第二空間中訓(xùn)練樣本集合內(nèi)的訓(xùn)練樣本,Φ(xi)為預(yù)設(shè)的映射函數(shù),xi為所述第一空間中訓(xùn)練樣本集合中的訓(xùn)練樣本,k(xi,xj)為核函數(shù);第二映射子單元,用于利用z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T,將所述第一空間中的測(cè)試樣本映射至所述第二空間中;其中,x為所述第一空間中的待測(cè)樣本,k(x,xj)為核函數(shù),z為被映射至所述第二空間中的待測(cè)樣本。上述裝置,優(yōu)選的,所述測(cè)度矩陣確定單元包括:近鄰概率值獲取子單元,用于利用獲取每個(gè)所述訓(xùn)練樣本分別與區(qū)別于其自身的訓(xùn)練樣本之間的近鄰概率值;其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值;類別概率值獲取子單元,用于依據(jù)每個(gè)所述訓(xùn)練樣本的近鄰概率值,確定每個(gè)所述訓(xùn)練樣本屬于每種所述數(shù)字類別的類別概率值;測(cè)度矩陣確定子單元,用于利用d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)及每個(gè)所述訓(xùn)練樣本的類別概率值,確定測(cè)度變換矩陣;其中,d(zi,zj)為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj的距離,Q=ATA,A為所述第二空間中的測(cè)度變換矩陣。上述裝置,優(yōu)選的,所述距離值獲取單元具體用于利用d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N,獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;其中,d(z,zi)為所述待測(cè)樣本z與所述訓(xùn)練樣本zi之間的距離值,A為所述測(cè)度變換矩陣,N為所述訓(xùn)練樣本集合中訓(xùn)練樣本的總個(gè)數(shù)。上述裝置,優(yōu)選的,所述類別確定單元包括:樣本選取子單元,用于選取所述距離值小于或等于預(yù)設(shè)限值的訓(xùn)練樣本;類別確定子單元,用于依據(jù)選取的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。由上述方案可知,本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法及裝置,首先分別將第一空間中的訓(xùn)練樣本集合和手寫體數(shù)字的待測(cè)樣本映射至第二空間中,再依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣,之后利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值,進(jìn)而依據(jù)每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。本申請(qǐng)實(shí)施例通過(guò)將第一空間的訓(xùn)練樣本及待測(cè)樣本映射至第二空間中,再在第二空間中學(xué)習(xí)一個(gè)測(cè)度變換矩陣,由此計(jì)算待測(cè)樣本與訓(xùn)練樣本之間的距離,進(jìn)而確定待測(cè)樣本的數(shù)字類別,相對(duì)于現(xiàn)有技術(shù)中預(yù)先制定距離測(cè)度的情況,在實(shí)現(xiàn)識(shí)別手寫體數(shù)字的前提下,提高了手寫體數(shù)字識(shí)別的準(zhǔn)確率。進(jìn)一步的,現(xiàn)有技術(shù)中通過(guò)留一法誤差分析來(lái)學(xué)習(xí)馬氏距離測(cè)度實(shí)現(xiàn)手寫體數(shù)字識(shí)別的方案中(即近鄰成分分析算法),在對(duì)小樣本問(wèn)題的實(shí)際應(yīng)用時(shí),會(huì)產(chǎn)生過(guò)擬合問(wèn)題,而且在優(yōu)化的時(shí)候容易陷入局部極小點(diǎn),殺跌當(dāng)樣本不是線性可分時(shí),分類效果較差,識(shí)別效率較低。本申請(qǐng)實(shí)施例針對(duì)上述近鄰成分分析算法,能夠有效處理小樣本問(wèn)題,同時(shí)識(shí)別率較高。附圖說(shuō)明為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例一的流程圖;圖2為本申請(qǐng)實(shí)施例一的部分流程圖;圖3為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例二的部分流程圖;圖4為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例三的部分流程圖;圖5為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別裝置實(shí)施例四的結(jié)構(gòu)示意圖;圖6為本申請(qǐng)實(shí)施例四中的部分結(jié)構(gòu)示意圖;圖7為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別裝置實(shí)施例五的部分結(jié)構(gòu)示意圖;圖8為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例六的部分結(jié)構(gòu)示意圖;圖9為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。具體實(shí)施方式下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。參考圖1,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例一的流程圖,所述方法適用于手寫體郵政編碼的識(shí)別、金融數(shù)字化識(shí)別及財(cái)稅手寫體識(shí)別等應(yīng)用中,所述方法可以包括以下步驟:步驟101:分別將第一空間中的訓(xùn)練樣本集合和手寫體數(shù)字的待測(cè)樣本映射至第二空間中。其中,所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),所述訓(xùn)練樣本集合中的訓(xùn)練樣本包含至少兩種數(shù)字類別。需要說(shuō)明的是,所述第一空間可以為當(dāng)前原空間,所述第二空間可以為預(yù)設(shè)隱空間。而所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),如1、2、5、7等標(biāo)識(shí),所述訓(xùn)練樣本集合中的訓(xùn)練樣本包含至少兩種數(shù)字類別,例如,所述訓(xùn)練樣本集合中包括1、3、7、8、9五種數(shù)字類別的訓(xùn)練樣本,即為所述訓(xùn)練樣本集合中每個(gè)訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí)為所述1、3、7、8、9五種數(shù)字類別中的一種。由上述說(shuō)明可知,所述步驟101可以理解為,分別將原空間中的訓(xùn)練樣本集合和待測(cè)樣本映射至隱空間中。步驟102:依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣。其中,所述步驟102可以理解為:依據(jù)所述訓(xùn)練樣本集合,在隱空間中學(xué)習(xí)獲取一個(gè)測(cè)度變換矩陣。在所述步驟102中,可以用馬氏距離實(shí)現(xiàn)。步驟103:利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值。其中,所述步驟103可以理解為:在所述隱空間中,計(jì)算所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值。步驟104:依據(jù)所述每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。其中,在N個(gè)訓(xùn)練樣本所各自對(duì)應(yīng)的距離值中,距離值越小,表明待測(cè)樣本與訓(xùn)練樣本越為接近,由此,可以根據(jù)K個(gè)與待測(cè)樣本的距離值最小的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí)確定待測(cè)樣本的數(shù)字類別。參考圖2,為本申請(qǐng)實(shí)施例中所述步驟104的流程圖,所述步驟104可以包括以下步驟:步驟201:選取所述距離值小于或等于預(yù)設(shè)限值的訓(xùn)練樣本。其中,所述預(yù)設(shè)限值可以由用戶設(shè)置,也可以對(duì)所述訓(xùn)練樣本依據(jù)其各自對(duì)應(yīng)距離值的小大順序進(jìn)行排序后,依據(jù)排序后的訓(xùn)練樣本的距離值進(jìn)行設(shè)置,由此,所述步驟201可以通過(guò)以下方式實(shí)現(xiàn):依據(jù)其距離值的小大順序?qū)λ鲇?xùn)練樣本進(jìn)行排序,選取排序在前K個(gè)的訓(xùn)練樣本,此時(shí),所述預(yù)設(shè)限值為排序在第K個(gè)訓(xùn)練樣本的距離值,也可以為排序在第K個(gè)和第K+1個(gè)兩個(gè)訓(xùn)練樣本的距離值之間的任意數(shù)值。步驟202:依據(jù)選取的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。其中,所述步驟202可以通過(guò)以下方式實(shí)現(xiàn):在所述選取的訓(xùn)練樣本中,將其數(shù)字類別標(biāo)識(shí)所占比例最多的訓(xùn)練樣本的數(shù)字類別作為所述待測(cè)樣本的數(shù)字類別。例如,選取的訓(xùn)練樣本中各自的數(shù)字類別標(biāo)識(shí)分別為3、5、3、6、6、4、6、8、6、6、6、9、5、4,由此可知,其數(shù)字類別標(biāo)識(shí)所占比例最多的訓(xùn)練樣本的數(shù)字類別為6,因此,6即為所述待測(cè)樣本的數(shù)字類別。由上述方案可知,本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例一,首先分別將第一空間中的訓(xùn)練樣本集合和手寫體數(shù)字的待測(cè)樣本映射至第二空間中,再依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣,之后利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值,進(jìn)而依據(jù)每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。本申請(qǐng)實(shí)施例通過(guò)將第一空間的訓(xùn)練樣本及待測(cè)樣本映射至第二空間中,再在第二空間中學(xué)習(xí)一個(gè)測(cè)度變換矩陣,由此計(jì)算待測(cè)樣本與訓(xùn)練樣本之間的距離,進(jìn)而確定待測(cè)樣本的數(shù)字類別,相對(duì)于現(xiàn)有技術(shù)中預(yù)先制定距離測(cè)度的情況,在實(shí)現(xiàn)識(shí)別手寫體數(shù)字的前提下,提高了手寫體數(shù)字識(shí)別的準(zhǔn)確率。進(jìn)一步的,現(xiàn)有技術(shù)中通過(guò)留一法誤差分析來(lái)學(xué)習(xí)馬氏距離測(cè)度實(shí)現(xiàn)手寫體數(shù)字識(shí)別的方案中(即近鄰成分分析算法),在對(duì)小樣本問(wèn)題的實(shí)際應(yīng)用時(shí),會(huì)產(chǎn)生過(guò)擬合問(wèn)題,而且在優(yōu)化的時(shí)候容易陷入局部極小點(diǎn),殺跌當(dāng)樣本不是線性可分時(shí),分類效果較差,識(shí)別效率較低。本申請(qǐng)實(shí)施例針對(duì)上述近鄰成分分析算法,能夠有效處理小樣本問(wèn)題,同時(shí)識(shí)別率較高。參考圖3,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例二中所述步驟101的流程圖,其中,所述步驟101可與包括以下步驟:步驟301:利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,將第一空間中的訓(xùn)練樣本集合映射至第二空間中;其中,zi為所述第二空間中訓(xùn)練樣本集合內(nèi)的訓(xùn)練樣本,Φ(xi)為預(yù)設(shè)的映射函數(shù),xi為所述第一空間中訓(xùn)練樣本集合中的訓(xùn)練樣本,k(xi,xj)為核函數(shù)。其中,所述映射函數(shù)可以通過(guò)解析歷史數(shù)據(jù)獲取。步驟302:利用z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T,將所述第一空間中的測(cè)試樣本映射至所述第二空間中;其中,x為所述第一空間中的待測(cè)樣本,k(x,xj)為核函數(shù),z為被映射至所述第二空間中的待測(cè)樣本。需要說(shuō)明的是,所述步驟301和所述步驟302之間可以并行執(zhí)行,也可以有一定的先后順序。參考圖4,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例三中所述步驟102的流程圖,所述步驟102可以包括以下步驟:步驟401:利用獲取每個(gè)所述訓(xùn)練樣本分別與區(qū)別于其自身的訓(xùn)練樣本之間的近鄰概率值;其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值。步驟402:依據(jù)每個(gè)所述訓(xùn)練樣本的近鄰概率值,確定每個(gè)所述訓(xùn)練樣本屬于每種所述數(shù)字類別的類別概率值。其中,所述步驟402可以通過(guò)以下方式實(shí)現(xiàn):利用確定每個(gè)所述訓(xùn)練樣本屬于每種數(shù)字類別的類別概率值,其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值,ω為數(shù)字類別的標(biāo)簽,pω為每個(gè)所述訓(xùn)練樣本屬于數(shù)字類別ω的概率值。步驟403:利用d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)及每個(gè)所述訓(xùn)練樣本的類別概率值,確定測(cè)度變換矩陣;其中,d(zi,zj)為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj的距離,Q=ATA,A為所述第二空間中的測(cè)度變換矩陣。需要說(shuō)明的是,兩個(gè)所述訓(xùn)練樣本之間的距離越近,那么這兩個(gè)訓(xùn)練樣本對(duì)應(yīng)的pω越大,因此,所述步驟403可以通過(guò)以下方式實(shí)現(xiàn):對(duì)每個(gè)所述類別概率值pω最大化,利用上述d(zi,zj),確定測(cè)度變換矩陣。其中,在本申請(qǐng)實(shí)施例中,所述步驟103在利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值時(shí),可以通過(guò)以下方式實(shí)現(xiàn):利用d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N,獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;其中,d(z,zi)為所述待測(cè)樣本z與所述訓(xùn)練樣本zi之間的距離值,A為所述測(cè)度變換矩陣,N為所述訓(xùn)練樣本集合中訓(xùn)練樣本的總個(gè)數(shù)。參考圖5,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別裝置實(shí)施例四的結(jié)構(gòu)示意圖,所述裝置可以包括:樣本映射單元501,用于分別將第一空間中的訓(xùn)練樣本集合和待測(cè)樣本映射至第二空間中;其中,所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),所述訓(xùn)練樣本集合包含至少兩種數(shù)字類別的訓(xùn)練樣本。其中,所述第一空間可以為當(dāng)前原空間,所述第二空間可以為預(yù)設(shè)隱空間。而所述訓(xùn)練樣本集合包括至少兩個(gè)訓(xùn)練樣本,每個(gè)所述訓(xùn)練樣本分別具有一個(gè)數(shù)字類別標(biāo)識(shí),如1、2、5、7等標(biāo)識(shí),所述訓(xùn)練樣本集合中的訓(xùn)練樣本包含至少兩種數(shù)字類別,例如,所述訓(xùn)練樣本集合中包括1、3、7、8、9五種數(shù)字類別的訓(xùn)練樣本,即為所述訓(xùn)練樣本集合中每個(gè)訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí)為所述1、3、7、8、9五種數(shù)字類別中的一種。由上述說(shuō)明可知,所述樣本映射單元501可以理解為,分別將原空間中的訓(xùn)練樣本集合和待測(cè)樣本映射至隱空間中。測(cè)度矩陣確定單元502,用于依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣。其中,所述測(cè)度矩陣確定單元502可以理解為:依據(jù)所述訓(xùn)練樣本集合,在隱空間中學(xué)習(xí)獲取一個(gè)測(cè)度變換矩陣。在所述測(cè)度矩陣確定單元502中,可以用馬氏距離實(shí)現(xiàn)。距離值獲取單元503,用于利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值。其中,所述距離值獲取單元503可以理解為:在所述隱空間中,計(jì)算所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值。類別確定單元504,用于依據(jù)所述每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。其中,在N個(gè)訓(xùn)練樣本所各自對(duì)應(yīng)的距離值中,距離值越小,表明待測(cè)樣本與訓(xùn)練樣本越為接近,由此,可以根據(jù)K個(gè)與待測(cè)樣本的距離值最小的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí)確定待測(cè)樣本的數(shù)字類別。參考圖6,為本申請(qǐng)實(shí)施例中所述類別確定單元504的結(jié)構(gòu)示意圖,其中,所述類別確定單元504可以包括:樣本選取子單元541,用于選取所述距離值小于或等于預(yù)設(shè)限值的訓(xùn)練樣本。其中,所述預(yù)設(shè)限值可以由用戶設(shè)置,也可以對(duì)所述訓(xùn)練樣本依據(jù)其各自對(duì)應(yīng)距離值的小大順序進(jìn)行排序后,依據(jù)排序后的訓(xùn)練樣本的距離值進(jìn)行設(shè)置,由此,所述樣本選取子單元541可以通過(guò)以下方式實(shí)現(xiàn):依據(jù)其距離值的小大順序?qū)λ鲇?xùn)練樣本進(jìn)行排序,選取排序在前K個(gè)的訓(xùn)練樣本,此時(shí),所述預(yù)設(shè)限值為排序在第K個(gè)訓(xùn)練樣本的距離值,也可以為排序在第K個(gè)和第K+1個(gè)兩個(gè)訓(xùn)練樣本的距離值之間的任意數(shù)值。類別確定子單元542,用于依據(jù)選取的訓(xùn)練樣本的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。其中,所述類別確定子單元542可以通過(guò)以下方式實(shí)現(xiàn):在所述選取的訓(xùn)練樣本中,將其數(shù)字類別標(biāo)識(shí)所占比例最多的訓(xùn)練樣本的數(shù)字類別作為所述待測(cè)樣本的數(shù)字類別。例如,選取的訓(xùn)練樣本中各自的數(shù)字類別標(biāo)識(shí)分別為3、5、3、6、6、4、6、8、6、6、6、9、5、4,由此可知,其數(shù)字類別標(biāo)識(shí)所占比例最多的訓(xùn)練樣本的數(shù)字類別為6,因此,6即為所述待測(cè)樣本的數(shù)字類別。由上述方案可知,本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別裝置實(shí)施例四,首先分別將第一空間中的訓(xùn)練樣本集合和手寫體數(shù)字的待測(cè)樣本映射至第二空間中,再依據(jù)所述第二空間中的訓(xùn)練樣本集合,確定測(cè)度變換矩陣,之后利用所述測(cè)度變換矩陣,分別獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值,進(jìn)而依據(jù)每個(gè)所述距離值及其各自對(duì)應(yīng)的數(shù)字類別標(biāo)識(shí),確定所述待測(cè)樣本的數(shù)字類別。本申請(qǐng)實(shí)施例通過(guò)將第一空間的訓(xùn)練樣本及待測(cè)樣本映射至第二空間中,再在第二空間中學(xué)習(xí)一個(gè)測(cè)度變換矩陣,由此計(jì)算待測(cè)樣本與訓(xùn)練樣本之間的距離,進(jìn)而確定待測(cè)樣本的數(shù)字類別,相對(duì)于現(xiàn)有技術(shù)中預(yù)先制定距離測(cè)度的情況,在實(shí)現(xiàn)識(shí)別手寫體數(shù)字的前提下,提高了手寫體數(shù)字識(shí)別的準(zhǔn)確率。參考圖7,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別裝置實(shí)施例五中所述樣本映射單元501的結(jié)構(gòu)示意圖,所述樣本映射單元501可以包括:第一映射子單元511,用于利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,將第一空間中的訓(xùn)練樣本集合映射至第二空間中;其中,zi為所述第二空間中訓(xùn)練樣本集合內(nèi)的訓(xùn)練樣本,Φ(xi)為預(yù)設(shè)的映射函數(shù),xi為所述第一空間中訓(xùn)練樣本集合中的訓(xùn)練樣本,k(xi,xj)為核函數(shù)。其中,在本申請(qǐng)實(shí)施例中,所述第一映射子單元可以通過(guò)解析歷史數(shù)據(jù)獲取所述映射函數(shù)。第二映射子單元512,用于利用z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T,將所述第一空間中的測(cè)試樣本映射至所述第二空間中;其中,x為所述第一空間中的待測(cè)樣本,k(x,xj)為核函數(shù),z為被映射至所述第二空間中的待測(cè)樣本。需要說(shuō)明的是,所述第一映射子單元511和所述第二映射子單元512之間具有獨(dú)立性,各自的運(yùn)行不受對(duì)方制約或控制。參考圖8,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別方法實(shí)施例六中所述測(cè)度矩陣確定單元502的結(jié)構(gòu)示意圖,所述測(cè)度矩陣確定單元502可以包括:近鄰概率值獲取子單元521,用于利用獲取每個(gè)所述訓(xùn)練樣本分別與區(qū)別于其自身的訓(xùn)練樣本之間的近鄰概率值;其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值。類別概率值獲取子單元522,用于依據(jù)每個(gè)所述訓(xùn)練樣本的近鄰概率值,確定每個(gè)所述訓(xùn)練樣本屬于每種所述數(shù)字類別的類別概率值。其中,所述類別概率值獲取子單元522可以通過(guò)以下方式實(shí)現(xiàn):利用確定每個(gè)所述訓(xùn)練樣本屬于每種數(shù)字類別的類別概率值,其中,pij為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj作為近鄰樣本的概率值,ω為數(shù)字類別的標(biāo)簽,pω為每個(gè)所述訓(xùn)練樣本屬于數(shù)字類別ω的概率值。測(cè)度矩陣確定子單元523,用于利用d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)及每個(gè)所述訓(xùn)練樣本的類別概率值,確定測(cè)度變換矩陣;其中,d(zi,zj)為所述第二空間的訓(xùn)練樣本集合中訓(xùn)練樣本zi與訓(xùn)練樣本zj的距離,Q=ATA,A為所述第二空間中的測(cè)度變換矩陣。需要說(shuō)明的是,兩個(gè)所述訓(xùn)練樣本之間的距離越近,那么這兩個(gè)訓(xùn)練樣本對(duì)應(yīng)的pω越大,因此,所述測(cè)度矩陣確定子單元523可以通過(guò)以下方式實(shí)現(xiàn):對(duì)每個(gè)所述類別概率值pω最大化,利用上述d(zi,zj),確定測(cè)度變換矩陣。其中,在本申請(qǐng)實(shí)施例中,所述距離值獲取單元503可以通過(guò)以下方式實(shí)現(xiàn):利用d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N,獲取所述待測(cè)樣本與每個(gè)所述訓(xùn)練樣本之間的距離值;其中,d(z,zi)為所述待測(cè)樣本z與所述訓(xùn)練樣本zi之間的距離值,A為所述測(cè)度變換矩陣,N為所述訓(xùn)練樣本集合中訓(xùn)練樣本的總個(gè)數(shù)。參考圖9,為本申請(qǐng)?zhí)峁┑囊环N手寫體數(shù)字識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖,所述系統(tǒng)包括訓(xùn)練模塊901和分類模塊902。在所述訓(xùn)練模塊901中,包括兩個(gè)子模塊:第一預(yù)處理子模塊和學(xué)習(xí)測(cè)度變換矩陣A子模塊,其中:所述第一預(yù)處理子模塊,用于原空間的訓(xùn)練樣本進(jìn)行處理,構(gòu)造隱空間中的訓(xùn)練樣本。所述原空間即為上文中提及的第一空間,所述隱空間即為所述第二空間。在所述第一預(yù)處理子模塊中,設(shè)已有原空間的訓(xùn)練樣本集為yi是xi的類別標(biāo)簽,c表示類別數(shù),N表示訓(xùn)練樣本的總個(gè)數(shù),D表示訓(xùn)練樣本的維數(shù)。利用如下經(jīng)驗(yàn)映射函數(shù)Φ(xi):zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T把原空間的訓(xùn)練樣本xi映射成隱空間中的訓(xùn)練樣本zi,其中k(xi,xj)是一個(gè)核函數(shù)。經(jīng)過(guò)映射后,得到隱空間的訓(xùn)練樣本集zi∈RN。在所述學(xué)習(xí)測(cè)度變換矩陣A子模塊中,對(duì)隱空間的訓(xùn)練樣本,用馬氏距離來(lái)作為測(cè)度,即d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)。其中,Q=ATA,A是測(cè)度變換矩陣。在隱空間中,對(duì)每個(gè)樣本zi選擇另一個(gè)樣本zj以概率pij作為它的近鄰,概率概率pij的計(jì)算公式如下:若兩個(gè)樣本離得越近,則其pij值應(yīng)該越大。zi被正確分類為第ω類的概率為之后,通過(guò)最大化pω,求出測(cè)度變換矩陣A。所述分類模塊902包括兩個(gè)子模塊:第二預(yù)處理子模塊和分類子模塊。所述第二預(yù)處理子模塊用于對(duì)原空間的待測(cè)樣本進(jìn)行處理,構(gòu)造隱空間中的待測(cè)樣本。設(shè)原空間的待測(cè)樣本x,利用經(jīng)驗(yàn)映射函數(shù)Φ(x):z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T把原空間的待測(cè)樣本x映射成隱空間中的待測(cè)樣本z。所述分類子模塊對(duì)隱空間的待測(cè)樣本z,計(jì)算其與隱空間的訓(xùn)練樣本的距離,計(jì)算公式為:d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N在N個(gè)距離d(z,zi)中,尋找距離z最小的K個(gè)隱空間訓(xùn)練樣本。最后利用K個(gè)隱空間訓(xùn)練樣本對(duì)應(yīng)的類別標(biāo)簽來(lái)對(duì)待測(cè)樣本x進(jìn)行分類:哪個(gè)類別標(biāo)簽占多數(shù),就把哪個(gè)類別賦予x。以下利用本申請(qǐng)實(shí)施例進(jìn)行手寫體數(shù)字識(shí)別的應(yīng)用示例說(shuō)明:本申請(qǐng)?jiān)贛NIST手寫體數(shù)字?jǐn)?shù)據(jù)集中進(jìn)行了測(cè)試,MNIST是美國(guó)著名數(shù)據(jù)集NIST的子集,是模式識(shí)別常用的實(shí)驗(yàn)數(shù)據(jù)集之一。MNIST手寫體數(shù)據(jù)庫(kù)共有10類,共有60000個(gè)訓(xùn)練樣本和10000個(gè)測(cè)試樣本。在本示例中,可以選擇其中五類進(jìn)行測(cè)試,每類分別從訓(xùn)練集和測(cè)試集上隨機(jī)選取50個(gè)。這里的實(shí)驗(yàn)取了數(shù)字1,3,7,8和9,共5類。在該數(shù)據(jù)集上的訓(xùn)練樣本和測(cè)試樣本中,每類各取50個(gè)。待測(cè)樣本有250個(gè),重復(fù)分類模塊250次。表1給出在測(cè)試集上的估計(jì)性能。實(shí)驗(yàn)對(duì)比方法有K近鄰算法和近鄰成分分析。通過(guò)實(shí)驗(yàn)結(jié)果我們可以看出本發(fā)明的手寫體識(shí)別效果明顯優(yōu)于K近鄰算法和近鄰成分分析方法,并表現(xiàn)出了較強(qiáng)的穩(wěn)定性,具有一定的優(yōu)勢(shì)。表1三種方法對(duì)5類手寫體數(shù)字的分類性能(識(shí)別率%)對(duì)比數(shù)字類別K近鄰近鄰成分分析本發(fā)明1100.00±0.0099.25±1.0397.25±1.48383.75±3.9282.00±4.4090.50±4.75776.50±5.8381.25±5.8489.00±5.55881.50±8.4083.75±5.3985.25±3.53988.75±3.9983.25±4.7791.25±3.19平均值86.10±3.0085.90±2.8290.65±1.51需要說(shuō)明的是,本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。最后,還需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。以上對(duì)本發(fā)明所提供的一種手寫體數(shù)字識(shí)別方法及裝置進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。