一種筆跡特征提取的方法和裝置制造方法
【專(zhuān)利摘要】本申請(qǐng)?zhí)峁┝艘环N筆跡特征提取的方法和裝置,包括:按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù)據(jù);依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆畫(huà)段向量;獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆畫(huà)段向量的角度和中心坐標(biāo);根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重心提取所述預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征;依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一化處理的結(jié)果作為采集的所述筆跡數(shù)據(jù)的特征。因此,本申請(qǐng)解決了聯(lián)機(jī)手寫(xiě)筆跡數(shù)據(jù)特征識(shí)別準(zhǔn)確率低的問(wèn)題。
【專(zhuān)利說(shuō)明】一種筆跡特征提取的方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及聯(lián)機(jī)手寫(xiě)漢字識(shí)別【技術(shù)領(lǐng)域】,特別是涉及一種筆跡特征提取的方法和 裝直。
【背景技術(shù)】
[0002] 聯(lián)機(jī)手寫(xiě)的筆跡數(shù)據(jù),由于書(shū)寫(xiě)者的書(shū)寫(xiě)習(xí)慣、筆跡采集設(shè)備的精度的不同,對(duì)于 相同的文字,存在很大的形變和圖形上的差異,因此,對(duì)于筆跡數(shù)據(jù)的特征提取提出了更高 的要求,需要在筆跡數(shù)據(jù)特征提取時(shí)能夠有效的表達(dá)手寫(xiě)筆跡數(shù)據(jù)的本質(zhì),體現(xiàn)相同字的 筆跡數(shù)據(jù)的相同點(diǎn),并區(qū)分不同字的筆跡數(shù)據(jù)的不同點(diǎn)。
[0003] 目前傳統(tǒng)筆跡數(shù)據(jù)的特征提取方法,是通過(guò)對(duì)筆跡數(shù)據(jù)進(jìn)行順序掃描方法和網(wǎng)格 統(tǒng)計(jì)方法進(jìn)行筆跡數(shù)據(jù)特征的提取。其中,筆跡數(shù)據(jù)進(jìn)行順序掃描方法是按照書(shū)寫(xiě)的順序 對(duì)筆跡數(shù)據(jù)中的點(diǎn)位置或角度進(jìn)行掃描,該方法未考慮筆跡數(shù)據(jù)特征中的軌跡的角度變化 信息,也未考慮筆跡數(shù)據(jù)特征相鄰角度間的相似性。網(wǎng)絡(luò)統(tǒng)計(jì)方法是按照等寬和等高的方 式進(jìn)行筆跡數(shù)據(jù)特征的提取,該方法未考慮筆跡數(shù)據(jù)特征對(duì)稱(chēng)投影的信息,并且,該方法存 在手寫(xiě)筆跡特征的提取過(guò)于機(jī)械、規(guī)整以及形變適應(yīng)性不佳的問(wèn)題。
[0004] 上述方法,存在筆跡數(shù)據(jù)特征提取不全面和筆跡數(shù)據(jù)特征適應(yīng)性不佳的問(wèn)題,以 上問(wèn)題嚴(yán)重影響了后續(xù)分類(lèi)器的分類(lèi)效果,進(jìn)而導(dǎo)致了聯(lián)機(jī)手寫(xiě)筆跡數(shù)據(jù)特征識(shí)別準(zhǔn)確率 低的問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 本申請(qǐng)?zhí)峁┮环N筆跡特征提取的方法和裝置,以解決聯(lián)機(jī)手寫(xiě)筆跡數(shù)據(jù)特征識(shí)別 準(zhǔn)確率低的問(wèn)題。
[0006] 為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種筆跡特征提取的方法,包括:
[0007] 按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡 數(shù)據(jù);
[0008] 依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆畫(huà)段 向量;
[0009] 獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆畫(huà)段向量的 角度和中心坐標(biāo);
[0010] 根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重心提取所述 預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征;
[0011] 依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一化處理的 結(jié)果作為采集的所述筆跡數(shù)據(jù)的特征。
[0012] 優(yōu)選地,所述按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù) 處理后的筆跡數(shù)據(jù)的步驟包括:
[0013] 將采集的筆跡數(shù)據(jù)按照書(shū)寫(xiě)的時(shí)間序列進(jìn)行線(xiàn)性尺寸規(guī)整化后,獲得各個(gè)自然筆 畫(huà)段長(zhǎng)度;
[0014] 依據(jù)獲得的所述各個(gè)自然筆畫(huà)段長(zhǎng)度,得到由所述各個(gè)自然筆畫(huà)段組成的筆跡數(shù) 據(jù)的長(zhǎng)度。
[0015] 優(yōu)選地,所述多個(gè)筆畫(huà)段向量的角度包括:各個(gè)筆畫(huà)段向量與X軸正方向的角度、 各個(gè)筆畫(huà)段向量與Y軸正方向的角度以及各個(gè)筆畫(huà)段向量與其相鄰的筆畫(huà)段向量之間的 角度。
[0016] 優(yōu)選地,其特征在于,所述脫機(jī)特征包括投影脫機(jī)特征、或網(wǎng)格脫機(jī)特征、或扇形 脫機(jī)特征、或輪廓脫機(jī)特征。
[0017] 優(yōu)選地,當(dāng)所述脫機(jī)特征為所述投影脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù) 處理后的筆跡數(shù)據(jù)的脫機(jī)特征的步驟包括:
[0018] 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割 和垂直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上部分區(qū)域和下部分區(qū) 域,從垂直方向分割為左部分區(qū)域和右部分區(qū)域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在 所述上部分區(qū)域、下部分區(qū)域、左部分區(qū)域和右部分區(qū)域出現(xiàn)的個(gè)數(shù);
[0019] 當(dāng)所述脫機(jī)特征為所述網(wǎng)格脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的 筆跡數(shù)據(jù)的脫機(jī)特征的步驟包括:
[0020] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0021] 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割 和垂直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上網(wǎng)格和下網(wǎng)格,從垂直 方向分割為左網(wǎng)格和右網(wǎng)格,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上網(wǎng)格、下網(wǎng)格、 左網(wǎng)格和右網(wǎng)格的八個(gè)方向上出現(xiàn)的個(gè)數(shù);
[0022] 當(dāng)所述脫機(jī)特征為所述扇形脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的 筆跡數(shù)據(jù)的扇形脫機(jī)特征的步驟包括:
[0023] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0024] 以所述筆跡數(shù)據(jù)的重心為圓心,對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)分割為多個(gè)扇形區(qū) 域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向上出現(xiàn)的個(gè)數(shù);
[0025] 當(dāng)所述脫機(jī)特征為所述輪廓脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的 筆跡數(shù)據(jù)的輪廓脫機(jī)特征的步驟包括:
[0026] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0027] 以所述筆跡數(shù)據(jù)的重心為結(jié)束點(diǎn),分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方 向出現(xiàn)的個(gè)數(shù)。
[0028] 為了解決上述問(wèn)題,本申請(qǐng)還公開(kāi)了一種筆跡特征提取的裝置,包括:
[0029] 獲取模塊,用于按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得 預(yù)處理后的筆跡數(shù)據(jù);
[0030] 分割模塊,用于依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段, 獲得多個(gè)筆畫(huà)段向量;
[0031] 計(jì)算模塊,用于獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多 個(gè)筆畫(huà)段向量的角度和中心坐標(biāo);
[0032] 提取模塊,用于根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所 述重心提取所述預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征;
[0033] 處理模塊,用于依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值 歸一化處理的結(jié)果作為采集的所述筆跡數(shù)據(jù)的特征。
[0034] 優(yōu)選地,所述獲取模塊包括:線(xiàn)性規(guī)整模塊,用于將采集的筆跡數(shù)據(jù)按照書(shū)寫(xiě)的時(shí) 間序列進(jìn)行線(xiàn)性尺寸規(guī)整化后,獲得各個(gè)自然筆畫(huà)段長(zhǎng)度;
[0035] 長(zhǎng)度獲取模塊,用于依據(jù)獲得的所述各個(gè)自然筆畫(huà)段長(zhǎng)度,得到由所述各個(gè)自然 筆畫(huà)段組成的筆跡數(shù)據(jù)的長(zhǎng)度。
[0036] 優(yōu)選地,所述多個(gè)筆畫(huà)段向量的角度包括:各個(gè)筆畫(huà)段向量與X軸正方向的角度、 各個(gè)筆畫(huà)段向量與Y軸正方向的角度以及各個(gè)筆畫(huà)段向量與其相鄰的筆畫(huà)段向量之間的 角度。
[0037] 優(yōu)選地,所述脫機(jī)特征包括投影脫機(jī)特征、或網(wǎng)格脫機(jī)特征、或扇形脫機(jī)特征、或 輪廓脫機(jī)特征。
[0038] 優(yōu)選地,當(dāng)所述脫機(jī)特征為所述投影脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心 提取所述預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征時(shí):
[0039] 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割 和垂直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上部分區(qū)域和下部分區(qū) 域,從垂直方向分割為左部分區(qū)域和右部分區(qū)域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在 所述上部分區(qū)域、下部分區(qū)域、左部分區(qū)域和右部分區(qū)域出現(xiàn)的個(gè)數(shù);
[0040] 當(dāng)所述脫機(jī)特征為所述網(wǎng)格脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述 預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征時(shí):
[0041] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0042] 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割 和垂直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上網(wǎng)格和下網(wǎng)格,從垂直 方向分割為左網(wǎng)格和右網(wǎng)格,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上網(wǎng)格、下網(wǎng)格、 左網(wǎng)格和右網(wǎng)格的八個(gè)方向上出現(xiàn)的個(gè)數(shù);
[0043] 當(dāng)所述脫機(jī)特征為所述扇形脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述 預(yù)處理后的筆跡數(shù)據(jù)的扇形脫機(jī)特征時(shí):
[0044] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0045] 以所述筆跡數(shù)據(jù)的重心為圓心,對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)分割為多個(gè)扇形區(qū) 域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向上出現(xiàn)的個(gè)數(shù);
[0046] 當(dāng)所述脫機(jī)特征為所述輪廓脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述 預(yù)處理后的筆跡數(shù)據(jù)的輪廓脫機(jī)特征時(shí):
[0047] 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北;
[0048] 以所述筆跡數(shù)據(jù)的重心為結(jié)束點(diǎn),分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方 向出現(xiàn)的個(gè)數(shù)。
[0049] 與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):
[0050] 首先,本申請(qǐng)依據(jù)時(shí)間序列對(duì)預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆 畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括多個(gè)筆畫(huà)段向量的角度和中心坐標(biāo)。通過(guò)計(jì)算多 個(gè)筆畫(huà)段向量的角度和中心坐標(biāo),從而使筆跡數(shù)據(jù)的特征提取覆蓋了筆跡數(shù)據(jù)的局部特性 和全局特性,避免了現(xiàn)有方法中僅考慮筆跡數(shù)據(jù)特征點(diǎn)的位置,從而造成筆跡數(shù)據(jù)特征提 取不全面的問(wèn)題。
[0051] 其次,本申請(qǐng)通過(guò)對(duì)預(yù)處理后的筆跡數(shù)據(jù)獲取筆跡數(shù)據(jù)的重心,并依據(jù)重心進(jìn)行 對(duì)稱(chēng)投影,然后提取相鄰區(qū)域的筆跡數(shù)據(jù)的局部特征和全局特性,從而避免了等寬和等高 方式進(jìn)行提取筆跡數(shù)據(jù)特征時(shí)過(guò)于機(jī)械和形變適應(yīng)性不佳的問(wèn)題。
[0052] 再次,本申請(qǐng)通過(guò)對(duì)提取的聯(lián)機(jī)特征和脫機(jī)特征的組合,得到了有效的筆跡數(shù)據(jù) 特征,進(jìn)而保證了后續(xù)分類(lèi)器訓(xùn)練的可靠性,并顯著提高了分類(lèi)器的分類(lèi)準(zhǔn)確度,最終提高 了聯(lián)機(jī)手寫(xiě)的識(shí)別準(zhǔn)確率。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0053] 圖1是本申請(qǐng)實(shí)施例一中的一種筆跡特征提取的方法的流程圖;
[0054] 圖2是本申請(qǐng)中的筆跡數(shù)據(jù)經(jīng)采集設(shè)備后采集的筆跡數(shù)據(jù)示意圖;
[0055] 圖3是本申請(qǐng)實(shí)施例二中的一種筆跡特征提取的方法的流程圖;
[0056] 圖4是本申請(qǐng)中的筆畫(huà)段向量與相鄰筆畫(huà)段向量的夾角示意圖;
[0057] 圖5是本申請(qǐng)中的以筆跡數(shù)據(jù)的重心為分割點(diǎn)的投影脫機(jī)特征的示意圖;
[0058] 圖6是本申請(qǐng)中的二維平面的八個(gè)方向的示意圖;
[0059] 圖7是本申請(qǐng)中的以筆跡數(shù)據(jù)的重心為分割點(diǎn)的扇形脫機(jī)特征的示意圖;
[0060] 圖8是本申請(qǐng)實(shí)施例三中的一種筆跡特征提取裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0061] 為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。
[0062] 參照?qǐng)D1,示出了本申請(qǐng)實(shí)施例一中的一種筆跡特征提取的方法,包括:
[0063] 步驟101 :按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處 理后的筆跡數(shù)據(jù)。
[0064] 其中,筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列是通過(guò)采集設(shè)備獲取的。
[0065] 一種筆跡數(shù)據(jù)經(jīng)采集設(shè)備后采集的筆跡數(shù)據(jù)如圖2所示,其中,筆跡數(shù)據(jù)經(jīng)過(guò)采 集設(shè)備后,采集到一系列的數(shù)據(jù)坐標(biāo)點(diǎn),數(shù)據(jù)坐標(biāo)點(diǎn)包括每個(gè)點(diǎn)的橫坐標(biāo)值和縱坐標(biāo)值,以 及,每個(gè)筆畫(huà)的結(jié)束標(biāo)志和整個(gè)字的結(jié)束標(biāo)志。例如:采集到的數(shù)據(jù)坐標(biāo)點(diǎn)包括(Xy Y。)、 (Xi,Yi)、(x2, Y2)……(χη,Υη)。采集到的一系列數(shù)據(jù)坐標(biāo)點(diǎn)中包含有筆跡數(shù)據(jù)的本質(zhì)特征, 可以依據(jù)這些特征對(duì)筆跡數(shù)據(jù)進(jìn)行處理,進(jìn)而提取筆跡特征。
[0066] 步驟102 :依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得 多個(gè)筆畫(huà)段向量。
[0067] 根據(jù)采集設(shè)備對(duì)用戶(hù)書(shū)寫(xiě)的時(shí)間序列的筆劃進(jìn)行準(zhǔn)確的等間隔分段,分段后的筆 跡數(shù)據(jù)即為筆畫(huà)段向量。
[0068] 步驟103 :獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆 畫(huà)段向量的角度和中心坐標(biāo)。
[0069] 筆畫(huà)段向量的中心坐標(biāo)可以通過(guò)以下公式獲得:
[0070]
【權(quán)利要求】
1. 一種筆跡特征提取的方法,其特征在于,包括: 按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù) 據(jù); 依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆畫(huà)段向 量; 獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆畫(huà)段向量的角度 和中心坐標(biāo); 根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的脫機(jī)特征; 依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一化處理的結(jié)果 作為采集的所述筆跡數(shù)據(jù)的特征。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集 筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù)據(jù)的步驟包括: 將采集的筆跡數(shù)據(jù)按照書(shū)寫(xiě)的時(shí)間序列進(jìn)行線(xiàn)性尺寸規(guī)整化后,獲得各個(gè)自然筆畫(huà)段 長(zhǎng)度; 依據(jù)獲得的所述各個(gè)自然筆畫(huà)段長(zhǎng)度,得到由所述各個(gè)自然筆畫(huà)段組成的筆跡數(shù)據(jù)的 長(zhǎng)度。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個(gè)筆畫(huà)段向量的角度包括:各個(gè)筆 畫(huà)段向量與X軸正方向的角度、各個(gè)筆畫(huà)段向量與Y軸正方向的角度以及各個(gè)筆畫(huà)段向量 與其相鄰的筆畫(huà)段向量之間的角度。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述脫機(jī)特征包括投影脫機(jī)特征、或網(wǎng)格 脫機(jī)特征、或扇形脫機(jī)特征、或輪廓脫機(jī)特征。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于, 當(dāng)所述脫機(jī)特征為所述投影脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的脫機(jī)特征的步驟包括: 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上部分區(qū)域和下部分區(qū)域,從 垂直方向分割為左部分區(qū)域和右部分區(qū)域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上 部分區(qū)域、下部分區(qū)域、左部分區(qū)域和右部分區(qū)域出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述網(wǎng)格脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上網(wǎng)格和下網(wǎng)格,從垂直方向 分割為左網(wǎng)格和右網(wǎng)格,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上網(wǎng)格、下網(wǎng)格、左網(wǎng) 格和右網(wǎng)格的八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述扇形脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的扇形脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為圓心,對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)分割為多個(gè)扇形區(qū)域,分 別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述輪廓脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的輪廓脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為結(jié)束點(diǎn),分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向出 現(xiàn)的個(gè)數(shù)。
6. -種筆跡特征提取的裝置,其特征在于,包括: 獲取模塊,用于按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處 理后的筆跡數(shù)據(jù); 分割模塊,用于依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得 多個(gè)筆畫(huà)段向量; 計(jì)算模塊,用于獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆 畫(huà)段向量的角度和中心坐標(biāo); 提取模塊,用于根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重 心提取所述預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征; 處理模塊,用于依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一 化處理的結(jié)果作為采集的所述筆跡數(shù)據(jù)的特征。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取模塊包括: 線(xiàn)性規(guī)整模塊,用于將采集的筆跡數(shù)據(jù)按照書(shū)寫(xiě)的時(shí)間序列進(jìn)行線(xiàn)性尺寸規(guī)整化后, 獲得各個(gè)自然筆畫(huà)段長(zhǎng)度; 長(zhǎng)度獲取模塊,用于依據(jù)獲得的所述各個(gè)自然筆畫(huà)段長(zhǎng)度,得到由所述各個(gè)自然筆畫(huà) 段組成的筆跡數(shù)據(jù)的長(zhǎng)度。
8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述多個(gè)筆畫(huà)段向量的角度包括:各個(gè)筆 畫(huà)段向量與X軸正方向的角度、各個(gè)筆畫(huà)段向量與Y軸正方向的角度以及各個(gè)筆畫(huà)段向量 與其相鄰的筆畫(huà)段向量之間的角度。
9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述脫機(jī)特征包括投影脫機(jī)特征、或網(wǎng)格 脫機(jī)特征、或扇形脫機(jī)特征、或輪廓脫機(jī)特征。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于, 當(dāng)所述脫機(jī)特征為所述投影脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的脫機(jī)特征時(shí): 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上部分區(qū)域和下部分區(qū)域,從 垂直方向分割為左部分區(qū)域和右部分區(qū)域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上 部分區(qū)域、下部分區(qū)域、左部分區(qū)域和右部分區(qū)域出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述網(wǎng)格脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的脫機(jī)特征時(shí): 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上網(wǎng)格和下網(wǎng)格,從垂直方向 分割為左網(wǎng)格和右網(wǎng)格,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上網(wǎng)格、下網(wǎng)格、左網(wǎng) 格和右網(wǎng)格的八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述扇形脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的扇形脫機(jī)特征時(shí): 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為圓心,對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)分割為多個(gè)扇形區(qū)域,分 別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述輪廓脫機(jī)特征時(shí),所述提取模塊在依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的輪廓脫機(jī)特征時(shí): 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為結(jié)束點(diǎn),分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向出 現(xiàn)的個(gè)數(shù)。
【文檔編號(hào)】G06K9/46GK104063705SQ201410247878
【公開(kāi)日】2014年9月24日 申請(qǐng)日期:2014年6月5日 優(yōu)先權(quán)日:2014年6月5日
【發(fā)明者】曹驥, 李健, 張連毅, 武衛(wèi)東 申請(qǐng)人:北京捷通華聲語(yǔ)音技術(shù)有限公司