本發(fā)明屬于模式識(shí)別與人工智能領(lǐng)域,尤其涉及一種基于超聲波傳感器的三維空間手寫(xiě)識(shí)別預(yù)處理方法。
背景技術(shù):
隨著硬件和軟件技術(shù)的不斷發(fā)展,以人為主體的自然的人機(jī)交互已然成為可能,新興的交互概念和交互技術(shù)的不斷提出,讓人機(jī)交互方式逐漸成為了研究熱點(diǎn)。其中筆式交互沿用了人們傳統(tǒng)的用筆習(xí)慣,可以達(dá)到自然簡(jiǎn)便的交互效果,如何處理三維空間下的筆式軌跡對(duì)三維筆式交互有很重要的意義。
手寫(xiě)識(shí)別技術(shù)已經(jīng)發(fā)展了十幾年,按照書(shū)寫(xiě)空間的不同可分為平面手寫(xiě)識(shí)別技術(shù)和空間手寫(xiě)識(shí)別技術(shù)。如果對(duì)用戶的空間手寫(xiě)內(nèi)容識(shí)別出來(lái),用戶只需要手握嵌入超聲波傳感器的筆式交互設(shè)備在空中自由的書(shū)寫(xiě),它既不受某個(gè)特定平面的限制(如手寫(xiě)板、觸摸屏),也不需要任何其它輔助設(shè)備(如攝像頭)的限制,這將是一種全新的人機(jī)交互實(shí)現(xiàn)方式。在虛擬現(xiàn)實(shí)、遠(yuǎn)程交互技術(shù)的普及同時(shí),空間手寫(xiě)識(shí)別將會(huì)有更多的應(yīng)用場(chǎng)景和發(fā)展空間。
針對(duì)將空間手寫(xiě)識(shí)別回歸為平面手寫(xiě)識(shí)別問(wèn)題,2011年,譚嘯峰,沈海斌等提出了,采用基于主元分析的投影算法對(duì)空間手寫(xiě)字符軌跡進(jìn)行了平面化處理。目前對(duì)于空間手寫(xiě)識(shí)別技術(shù)的研究還相對(duì)較少,對(duì)如何處理空間手寫(xiě)字符的流程還沒(méi)有公認(rèn)的處理方法。無(wú)論書(shū)寫(xiě)者想進(jìn)行內(nèi)容的輸入還是進(jìn)行人機(jī)的交互,輸入的內(nèi)容如何被計(jì)算機(jī)有效的識(shí)別,計(jì)算機(jī)進(jìn)一步如何反饋書(shū)寫(xiě)者的意圖目前還沒(méi)有一種有效的方法。如果利用空間手寫(xiě)字符的特點(diǎn)將空間手寫(xiě)筆跡平面化,利用現(xiàn)有的平面手寫(xiě)識(shí)別技術(shù)進(jìn)行處理識(shí)別可行性高,所以如何自適應(yīng)地找到最佳的投影平面是解決這一問(wèn)題的關(guān)鍵。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種三維筆式識(shí)別預(yù)處理方法,以解決目前用戶空間手寫(xiě)找不到最佳的投影平面、無(wú)法進(jìn)一步高效自然的進(jìn)行三維空間筆式交互的問(wèn)題。
本發(fā)明采取的技術(shù)方案是,包括下列步驟:
(一)、獲取不同時(shí)刻下的三維筆式軌跡坐標(biāo)
(二)、通過(guò)距離參量尋找到每個(gè)樣本點(diǎn)的k個(gè)近鄰點(diǎn)zij,其中zij(j=1,2…k)為xi的k個(gè)近鄰點(diǎn),
(三)、計(jì)算出每個(gè)樣本點(diǎn)的局部重建權(quán)值,得出樣本點(diǎn)的局部重建權(quán)值矩陣w,引入誤差函數(shù)minε(w)通過(guò)拉格朗日乘子法求出局部重建權(quán)值矩陣w,計(jì)算方法如公式(1)所示:
其中minε(w)為定義的誤差函數(shù),
(四)、根據(jù)局部重建權(quán)值矩陣w計(jì)算輸出矩陣s,引入損失函數(shù)值minε(s)利用拉格朗日乘子法求出約束條件下最優(yōu)解,計(jì)算方法如公式(2)所示:
其中,minε(y)為損失函數(shù)值,si為xi的輸出向量,qij(j=1,2…k)是si的k個(gè)近鄰點(diǎn),且要滿足:
其中,i為d*d的單位矩陣,d為輸出矩陣維數(shù),將
其中,m=(i-w)(i-w)t,mij是m矩陣中第i行第j列的值;
(五)、求解m矩陣的特征值和特征向量,將特征值從小到大排列,舍去第一個(gè)特征值,取第2到第(d+1)個(gè)特征值對(duì)應(yīng)的特征向量作為輸出結(jié)果。
本發(fā)明所述步驟(二)中的距離參量表示為:
本發(fā)明所述步驟(二)中求出每個(gè)樣本點(diǎn)距離所有樣本點(diǎn)的歐氏距離按從小到大排序,取前60%的歐氏距離對(duì)應(yīng)的樣本點(diǎn)作為近鄰點(diǎn),確定k值。
本發(fā)明所述步驟(四)輸出矩陣的矩陣維數(shù)d為2。
本發(fā)明優(yōu)點(diǎn)是將三維筆式軌跡的坐標(biāo)進(jìn)行降維處理,自適應(yīng)的將三維非線性數(shù)據(jù)映射到二維空間中,處理后仍能夠保持原有數(shù)據(jù)的拓?fù)潢P(guān)系,這一過(guò)程將空間手寫(xiě)字符軌跡平面化,利用現(xiàn)有的平面手寫(xiě)識(shí)別技術(shù)進(jìn)行處理可行性高,可以實(shí)現(xiàn)空間筆式動(dòng)作、筆式輸入內(nèi)容的有效識(shí)別,完成三維空間下的筆式交互,對(duì)于三維空間下筆式的內(nèi)容輸入還是人機(jī)交互有重要的意義。
附圖說(shuō)明
圖1是本發(fā)明的流程圖;
圖2是本發(fā)明三維手寫(xiě)字符原圖;
圖3是本發(fā)明三維手寫(xiě)字符預(yù)處理后的效果圖。
具體實(shí)施方式
實(shí)施本發(fā)明所用的輸入設(shè)備是基于超聲波傳感器的三維筆式交互裝置,基于超聲波傳感器的三維筆式識(shí)別預(yù)處理方法的系統(tǒng)流程圖如圖1所示,具體步驟如下:
(一)、獲取不同時(shí)刻下的三維筆式軌跡坐標(biāo)
(二)、通過(guò)距離參量尋找到每個(gè)樣本點(diǎn)的k個(gè)近鄰點(diǎn)zij,其中zij(j=1,2…k)為xi的k個(gè)近鄰點(diǎn),
(三)、計(jì)算出每個(gè)樣本點(diǎn)的局部重建權(quán)值,得出樣本點(diǎn)的局部重建權(quán)值矩陣w,引入誤差函數(shù)minε(w)通過(guò)拉格朗日乘子法求出局部重建權(quán)值矩陣w,計(jì)算方法如公式(1)所示:
其中minε(w)為定義的誤差函數(shù),
(四)、根據(jù)局部重建權(quán)值矩陣w計(jì)算輸出矩陣s,引入損失函數(shù)值minε(s)利用拉格朗日乘子法求出約束條件下最優(yōu)解,計(jì)算方法如公式(2)所示:
其中,minε(y)為損失函數(shù)值,si為xi的輸出向量,qij(j=1,2…k)是si的k個(gè)近鄰點(diǎn),且要滿足:
其中,i為d*d的單位矩陣,d為輸出矩陣維數(shù),將
其中,m=(i-w)(i-w)t,mij是m矩陣中第i行第j列的值;
(五)、求解m矩陣的特征值和特征向量,將特征值從小到大排列,舍去第一個(gè)特征值,取第2到第(d+1)個(gè)特征值對(duì)應(yīng)的特征向量作為輸出結(jié)果。
本發(fā)明所述步驟(二)中的距離參量表示為:
本發(fā)明所述步驟(二)中求出每個(gè)樣本點(diǎn)距離所有樣本點(diǎn)的歐氏距離按從小到大排序,取前60%的歐氏距離對(duì)應(yīng)的樣本點(diǎn)作為近鄰點(diǎn),確定k值;
本發(fā)明所述步驟(四)輸出矩陣的矩陣維數(shù)d為;
下邊通過(guò)具體實(shí)例來(lái)進(jìn)一步說(shuō)明本發(fā)明。
空間手寫(xiě)字符與平面手寫(xiě)字符的最主要區(qū)別在于空間手寫(xiě)字符不僅有長(zhǎng)度和寬度,還具有厚度這一屬性。如果投影平面選取不當(dāng),肯定會(huì)與書(shū)寫(xiě)者的意圖相去甚遠(yuǎn)。本實(shí)例基于超聲波傳感器的三維書(shū)寫(xiě)筆和配套采集軟件,采集了9個(gè)實(shí)驗(yàn)者的數(shù)據(jù),每個(gè)實(shí)驗(yàn)者手握基于超聲波傳感器的三維書(shū)寫(xiě)筆在三維空間手寫(xiě)數(shù)字字符0到9,每個(gè)實(shí)驗(yàn)者在三維空間中書(shū)寫(xiě)每個(gè)數(shù)字字符5次,共采集數(shù)據(jù)450次,求出每個(gè)數(shù)字字符在空間中尺寸,如下表所示:
得出的結(jié)論是,按照書(shū)寫(xiě)者以平面書(shū)寫(xiě)習(xí)慣來(lái)書(shū)寫(xiě)空間數(shù)字字符,除字符“1”之外,字符的長(zhǎng)度和寬度的平均值應(yīng)該遠(yuǎn)遠(yuǎn)比厚度的平均值要大,而且手寫(xiě)軌跡明顯呈曲線形式。這樣可以確定一個(gè)投影平面,只要找到字符軌跡最扁平的觀測(cè)方向并垂直于這個(gè)方向的投影,就可以得到最佳的投影效果,而對(duì)于字符“1”,向長(zhǎng)度和厚度投影出來(lái)的字符區(qū)別不大,所以同樣適用上述的投影原則。而求解m矩陣的特征值和特征向量時(shí),按照從小到大排序先保留了前3個(gè)特征值對(duì)應(yīng)的特征向量,使矩陣可以表示成為每個(gè)向量在各個(gè)投影向量上面的投影長(zhǎng)度,其特征值則是權(quán)重。舍掉了最小的特征值對(duì)應(yīng)的特征向量,保留了投影能量最大的那些分量,這樣最大化保留了矩陣代表的信息,同時(shí)舍棄了字符軌跡的最小尺寸,得到書(shū)寫(xiě)者最想得到的平面。
確定了投影平面后,字符的方向還沒(méi)有確定。但是對(duì)于空間書(shū)寫(xiě)字符的長(zhǎng)度和寬度很難判定字符正確的方向,所以保留了2種不同的結(jié)果為書(shū)寫(xiě)者確定。
從圖2和圖3中可以看到,采用本發(fā)明提出的三維手寫(xiě)字符預(yù)處理方法可以有效的找出最佳投影平面識(shí)別手寫(xiě)字符輪廓,對(duì)書(shū)寫(xiě)者的動(dòng)作有很好的自適應(yīng)性,讓空間筆式識(shí)別有良好的應(yīng)用前景,最終發(fā)揮其應(yīng)有的潛力。