專利名稱:從劃線標(biāo)記識(shí)別字符的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總的來(lái)說(shuō)涉及一種為代表字符的劃線標(biāo)記分配適配模板的方法,和涉及一種識(shí)別代表字符的劃線標(biāo)記的方法,以及一種電子裝置。
背景技術(shù):
從依賴用戶的劃線標(biāo)記中識(shí)別字符是現(xiàn)代人機(jī)接口技術(shù)中的一項(xiàng)突出難題。例如,隨著手持設(shè)備越來(lái)越流行,對(duì)于一種輸入文本(比如短的文本信息)的簡(jiǎn)單方法的需求變得更加緊要。當(dāng)觸摸屏可用時(shí),劃線字符(標(biāo)記)的手寫識(shí)別提供了一種最自然的文字輸入界面,尤其(但不限于)對(duì)東方的表意字符集,比如漢字。
手寫劃線字符的在線識(shí)別被認(rèn)為是一項(xiàng)困難的圖案識(shí)別問(wèn)題。一個(gè)困難來(lái)自于一個(gè)字符具有很大的形狀可變性。不同的書寫者在他們的日常生活中可以寫出不同的墨水形狀。圖1例舉了漢字字符的兩種形狀變化。在圖1(a)和(b)中,字符100、102是各自的標(biāo)準(zhǔn)形狀,而字符104、106分別表示依賴用戶的變體。通過(guò)應(yīng)用一種統(tǒng)計(jì)的圖案識(shí)別方法,識(shí)別器能夠大致正確地識(shí)別那些在訓(xùn)練樣本中出現(xiàn)過(guò)的字符形狀。但實(shí)際上,收集覆蓋所有變化的足夠的訓(xùn)練樣本幾乎是不可能的。
因此,需要一種靈活的識(shí)別器技術(shù),其可以適于識(shí)別依賴用戶的劃線字符,比如代表相對(duì)復(fù)雜字符的簡(jiǎn)寫劃線標(biāo)記。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一個(gè)方面,提供了一種為代表字符的劃線標(biāo)記分配適配模板的方法,該方法包括從劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)的各個(gè)參考筆劃段向量的多個(gè)概率分布函數(shù)(PDF)中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并為劃線標(biāo)記分配適配模板,其中適配模板包括多個(gè)識(shí)別符,用于為每一個(gè)提取的筆劃段向量識(shí)別存儲(chǔ)的最接近的PDF,并將劃線標(biāo)記連接至它代表的字符,以便在適配字典中存儲(chǔ)。
多個(gè)存儲(chǔ)的PDF可被以一個(gè)PDF字典和一個(gè)PDF密碼本的形式存儲(chǔ);其中,存儲(chǔ)在PDF密碼本中的PDF的數(shù)目小于存儲(chǔ)在PDF字典中的PDF數(shù)目,而且PDF字典中的每一個(gè)PDF與一個(gè)在PDF密碼本中識(shí)別最相似PDF的指針相關(guān)聯(lián)。
PDF密碼本中的PDF可以基于利用相對(duì)熵(Kullback-Leiblerdivergence)計(jì)算失真測(cè)量對(duì)PDF字典中PDF進(jìn)行的量化來(lái)選擇。
存儲(chǔ)的各個(gè)參考筆劃段向量的PDF可以與不同的參考字符相關(guān)聯(lián)。
該方法可能還包括為適配模板分配一個(gè)年齡值ToL,和在適配字典中存儲(chǔ)適配模板和分配的ToL。
存儲(chǔ)適配模板的步驟可能還包括替換適配字典中具有最高ToL的現(xiàn)存項(xiàng)目(existing entry),并且將其它現(xiàn)存項(xiàng)目的ToL值增加一預(yù)定量。
根據(jù)本發(fā)明的第二個(gè)方面,提供了一種識(shí)別代表字符的劃線標(biāo)記的方法,該方法包括從劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)的各個(gè)參考筆劃段向量的多個(gè)PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并基于確定的最接近的PDF搜索適配模板字典以確定劃線標(biāo)記的識(shí)別匹配,其中每一個(gè)適配模板都含有多個(gè)識(shí)別符,用于為參考字符的每一個(gè)筆劃段向量識(shí)別一個(gè)存儲(chǔ)的PDF。
該方法可能還包括根據(jù)本發(fā)明的第一個(gè)方面分配一個(gè)新的適配模板。
根據(jù)本發(fā)明的第三個(gè)方面,提供了一種電子裝置,包括一個(gè)用戶界面,用于輸入代表字符的劃線標(biāo)記;一個(gè)存儲(chǔ)單元;和一個(gè)處理器。其中處理器從劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)單元存儲(chǔ)的多個(gè)的各個(gè)參考筆劃段向量的PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并為劃線標(biāo)記分配一個(gè)適配模板,適配模板含有多個(gè)識(shí)別符,用于為每一個(gè)提取的筆劃段向量識(shí)別存儲(chǔ)的最接近的PDF,并將劃線標(biāo)記連接至它代表的字符,以便在存儲(chǔ)單元的適配字典中存儲(chǔ)。
多個(gè)存儲(chǔ)的PDF可以被以一個(gè)PDF字典和一個(gè)PDF密碼本的形式存儲(chǔ)在存儲(chǔ)單元中;其中存儲(chǔ)在PDF密碼本中的PDF的數(shù)目小于存儲(chǔ)在PDF字典中的PDF數(shù)目,而且PDF字典中的每一個(gè)PDF與一個(gè)在PDF密碼本中識(shí)別最相似PDF的指針相關(guān)聯(lián)。
PDF字典和PDF密碼本可以存儲(chǔ)在存儲(chǔ)單元的只讀存儲(chǔ)元件中。
PDF密碼本中的PDF可以基于利用相對(duì)熵計(jì)算失真測(cè)量對(duì)PDF字典中PDF進(jìn)行的量化來(lái)選擇。
存儲(chǔ)的各個(gè)參考筆劃段向量的PDF可以與不同的參考字符相關(guān)聯(lián)。
處理器還可以為適配模板分配一個(gè)年齡值ToL,并在存儲(chǔ)單元的適配字典中存儲(chǔ)適配模板和分配的ToL。
處理器可以替換適配字典中具有最高ToL的現(xiàn)存項(xiàng)目,并將其它現(xiàn)存項(xiàng)目的ToL值增加一預(yù)定量。
適配字典可以存儲(chǔ)在存儲(chǔ)單元的隨機(jī)存取存儲(chǔ)元件或閃存元件中。
根據(jù)本發(fā)明的第四個(gè)方面,提供了一種電子裝置,包括一個(gè)用戶界面,用于輸入代表字符的劃線標(biāo)記;一個(gè)存儲(chǔ)單元;和一個(gè)處理器。其中,處理器從劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)單元存儲(chǔ)的各個(gè)參考筆劃段向量的多個(gè)PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并基于確定的最接近的PDF在存儲(chǔ)單元中搜索適配字典以確定劃線標(biāo)記的識(shí)別匹配,適配字典中的每一個(gè)適配模板都含有多個(gè)識(shí)別符,用于為參考字符的每一個(gè)筆劃段向量識(shí)別一個(gè)存儲(chǔ)的PDF。
處理器可以為輸入字符分配一個(gè)新的適配模板,該適配模板含有一個(gè)識(shí)別符數(shù)組,用于為每一個(gè)筆劃段向量識(shí)別存儲(chǔ)的最接近的PDF,以便在適配字典中存儲(chǔ)。
從以下書面說(shuō)明中,通過(guò)例子并結(jié)合附圖,本發(fā)明的實(shí)施例對(duì)本領(lǐng)域的一名普通技術(shù)人員來(lái)說(shuō)是非常明顯的,會(huì)為他更好地理解。
圖1顯示了字符形狀可變性的例子。
圖2是說(shuō)明用于實(shí)施根據(jù)一個(gè)示范實(shí)施例的方法和系統(tǒng)的電子裝置的示意圖。
圖3顯示了根據(jù)本發(fā)明的一個(gè)實(shí)施例的具有用戶適配功能性的字符識(shí)別分類器的流程圖。
圖4是說(shuō)明基于分類的筆劃匹配的示意圖。
圖5表示劃線標(biāo)記段的高斯概率密度函數(shù)密碼本選擇的示意圖。
圖6顯示了根據(jù)一個(gè)示范實(shí)施例的產(chǎn)生一個(gè)新的適配模板的流程圖。
圖7顯示了根據(jù)一個(gè)示范實(shí)施例的添加一個(gè)新的適配模板的流程圖。
發(fā)明優(yōu)選實(shí)施例的詳細(xì)說(shuō)明圖2說(shuō)明了一種電子裝置201。所述裝置201是一種手持PDA電話機(jī),包括一個(gè)射頻通信單元202,其與一個(gè)處理器203相連并通信;一個(gè)觸摸屏205形式(典型的是液晶顯示器)的用戶界面和一個(gè)可選的鍵盤206也與處理器203相連通信。
處理器203包括一個(gè)編碼器/解碼器211,該編碼器/解碼器具有一個(gè)存儲(chǔ)數(shù)據(jù)的相關(guān)聯(lián)的代碼只讀存儲(chǔ)器(ROM)212,用于對(duì)被電子裝置201發(fā)送和接收的語(yǔ)音和其它信號(hào)進(jìn)行編碼和解碼。處理器203還包括一個(gè)微處理器213,通過(guò)公用總線218與編碼器/解碼器211和相關(guān)聯(lián)的字符只讀存儲(chǔ)器(ROM)214相連。微處理器213還通過(guò)公用總線218與一個(gè)隨機(jī)存儲(chǔ)器(RAM)204和一個(gè)靜態(tài)可編程存儲(chǔ)器216相連。除了其它的特征和功能,該靜態(tài)可編程存儲(chǔ)器216存儲(chǔ)用于字符識(shí)別的適配模板、一個(gè)帶有電話號(hào)碼以及相關(guān)聯(lián)的識(shí)別符(與每一個(gè)號(hào)碼相關(guān)聯(lián)的人的名字)數(shù)據(jù)庫(kù)。
微處理器213的輔助輸出與一個(gè)報(bào)警模塊215相連,該報(bào)警模塊典型地包括揚(yáng)聲器、振動(dòng)器及相關(guān)驅(qū)動(dòng)裝置。字符只讀存儲(chǔ)器214存儲(chǔ)用于對(duì)文本消息進(jìn)行解碼或編碼的代碼,該文本消息在觸摸屏205或可選鍵盤206輸入、并由通信單元202接收。在該實(shí)施例中,字符只讀存儲(chǔ)器214還存儲(chǔ)微處理器213的操作碼(OC),和用于字符識(shí)別的固定識(shí)別字典。操作碼(OC)用于在電子裝置201上運(yùn)行應(yīng)用程序。
射頻通信單元202是一個(gè)具有天線207的接收器和發(fā)送器的組合裝置。通信單元202有一個(gè)收發(fā)器208,經(jīng)射頻放大器209與天線207相連。收發(fā)器208還與一個(gè)將通信單元202連接至處理器203的調(diào)制器/解調(diào)器組合裝置210相連。
圖3顯示了根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的具有用戶適配功能性的分類器的流程圖。在框301中,輸入一個(gè)代表字符的劃線標(biāo)記,例如利用手持設(shè)備如PDA電話機(jī)201(圖2)的觸摸屏來(lái)輸入。
對(duì)于劃線標(biāo)記,方框302執(zhí)行平滑、除噪、尺寸歸一化并提取筆劃段向量。平滑是這樣進(jìn)行通過(guò)對(duì)一個(gè)點(diǎn)與它的相鄰點(diǎn)的坐標(biāo)(x,y)取平均值,并用計(jì)算出的平均值替換該點(diǎn)的坐標(biāo)值(x,y)來(lái)完成。經(jīng)過(guò)平滑處理后,由高頻噪聲產(chǎn)生的冗余的點(diǎn)被除去了。這些冗余的點(diǎn)是坐標(biāo)值(x,y)與它們替換的點(diǎn)(predecessor)相同的那些點(diǎn)。然后,該標(biāo)記被縮放到適合一個(gè)標(biāo)準(zhǔn)矩形大小,比如本發(fā)明的實(shí)施例的180×180。
在示范實(shí)施例中的一個(gè)筆劃段是在劃線標(biāo)記的局部最大方向角變化之間的線段。筆劃段向量是得自每一段的二維向量ot=(dx,dy),其中dx和dy是在線段的起始點(diǎn)和結(jié)束點(diǎn)之間的坐標(biāo)的差值。依賴于劃線標(biāo)記的復(fù)雜性,筆劃段向量的數(shù)量可能會(huì)變化。
方框303和304組成示范實(shí)施例的流程圖300的搜索階段308。在搜索階段308,在方框302提取的每一個(gè)筆劃段由一個(gè)概率分布函數(shù)(PDF)進(jìn)行模型化,例如,概率分布函數(shù)的形式為bj(·)=Σk=1kωjkN(·;μjk,σjk)]]>的高斯混合PDF。如圖4所示,在固定識(shí)別字典中的每一個(gè)字符模型是一個(gè)高斯混合PDF序列(b1,b2,...,bN),例如402,N是字符的平均筆劃數(shù)。動(dòng)態(tài)程序設(shè)計(jì)(DP)過(guò)程用于根據(jù)提取的筆劃段如406,以模型化了的筆劃段去匹配存儲(chǔ)的每一個(gè)字符模型如402(固定字典中的PDF序列)。具有最大匹配得分的字符模型就是劃線標(biāo)記404的識(shí)別結(jié)果。
本領(lǐng)域的一名技術(shù)人員會(huì)認(rèn)識(shí)到,存儲(chǔ)在固定識(shí)別字典中的字符模型,比如402,源自于以前收集的訓(xùn)練樣本的庫(kù)。對(duì)于每個(gè)訓(xùn)練樣本,代表一個(gè)給定字符的劃線標(biāo)記的筆劃段被提取出來(lái)。一個(gè)字符模型,即各個(gè)提取的筆劃段的高斯混合PDF的一個(gè)序列,被模型化并連接至樣本劃線標(biāo)記所代表的字符。
回到圖3,在示范實(shí)施例中,方框304執(zhí)行在適配字典中的搜索。適配字典的詳情會(huì)在下面進(jìn)行說(shuō)明。在方框305中,如果一個(gè)輸入的字符在搜索過(guò)程308之后沒(méi)有被正確地識(shí)別,就會(huì)產(chǎn)生一個(gè)新的字符模型(在方框306中)并進(jìn)行適配字典的更新(在方框307中)。示范實(shí)施例中,方框306和307的詳情會(huì)在下面進(jìn)行說(shuō)明。
一個(gè)表意字符集,比如漢字字符集,具有多個(gè)的詞匯,而且每一個(gè)字符可能有許多筆劃(見(jiàn)圖4,字符404和線段如406)。因?yàn)槊恳粋€(gè)筆劃段都被諸如高斯混合PDF模型化,在方框403中所用的固定識(shí)別字典可能會(huì)占用非常大的存儲(chǔ)空間。在示范實(shí)施例中,方框303中的所有高斯PDF在密碼本中都被量化成一定數(shù)量(比如256)的高斯PDF。在示范實(shí)施例的高斯PDF群集中,兩個(gè)高斯PDF N(·;μi,∑i)和N(·;μj,∑j)之間的失真測(cè)量被作為相對(duì)熵(Kullback-Leibler(KL)divergence)計(jì)算。兩個(gè)高斯PDF N(·;μi,∑i)和N(·;μj,∑j)的相對(duì)熵被定義為JKL(i,j)=12tr[(Σi-Σj)(Σ-1j-Σ-1i)]+12tr[(Σ-1i+Σ-1j)(μi-μj)(μi-μj)t]]]>其中“tr[]”表示矩陣的跡。
作為進(jìn)一步參考,讀者可直接查閱“S.Kullback Information Theoryand Statistics.New YorkWiley,1959”,換言之,該書被以引用方式融入本說(shuō)明書。
如圖5所示出的,在示范實(shí)施例中,一個(gè)用戶創(chuàng)建的(即簡(jiǎn)寫符或個(gè)人化字符)劃線標(biāo)記501被分割為線段模型序列。線段模型序列中的每一個(gè)具有一個(gè)高斯PDF,而且為固定識(shí)別字典502中的每一個(gè)高斯PDF,比如500,在密碼本506中找到一個(gè)稱為代碼字504的最相似的PDF。因而,在示例的實(shí)施例中,方框203(圖2)中所用的每一個(gè)PDF如500,實(shí)際上是一個(gè)索引該索引指向密碼本中256個(gè)代碼字中的一個(gè),比如504。
圖6說(shuō)明了示范實(shí)施例中產(chǎn)生一個(gè)新的適配模板的方法。在示范實(shí)施例中,對(duì)于在方框601中輸入的代表字符的劃線標(biāo)記,經(jīng)過(guò)對(duì)標(biāo)記的預(yù)處理后,在方框602中提取出一個(gè)具有T個(gè)筆劃段向量的筆劃段向量序列{o1,o2,o3,...oT}。設(shè)定計(jì)數(shù)器i=0(方框603),并為每一個(gè)筆劃段向量oi確定最接近的高斯代碼字N(·;μj,∑j),其中j=argmax1≤k≤256N(oi;μk,Σk)]]>(方框604)。設(shè)定A[i]=j(luò)(方框605),識(shí)別為第i個(gè)筆劃向量確定的最接近的高斯代碼字。重復(fù)方框604和605,直到i=T(方框606)。在示例實(shí)施例中,識(shí)別符A
被作為將劃線標(biāo)記連接至其代表的字符的適配模板分配。
劃線標(biāo)記代表的字符可能被確定為該劃線標(biāo)記的初始輸入的一部分,例如,通過(guò)從顯示在PDA電話機(jī)(圖2)201的、處于學(xué)習(xí)模式的觸摸屏205(圖2)中的多個(gè)字符中得到的選擇集。不過(guò),應(yīng)該認(rèn)識(shí)到,在不同的示范實(shí)施例中,劃線標(biāo)記代表的字符可能在產(chǎn)生新的適配模板的不同的點(diǎn)被確定,包括在向適配字典中添加適配模板的過(guò)程中確定索引數(shù)組A
之后(方框607)。
圖3的方框303中提到的固定識(shí)別字典能夠存儲(chǔ)在ROM214中,同時(shí)適配字典(圖3的方框304)存儲(chǔ)在存儲(chǔ)器216中并在加電時(shí)裝載到RAM 204中。一個(gè)手寫引擎的可用的RAM 204可能是非常有限的,比如,僅可存儲(chǔ)100個(gè)適配模板。在示范實(shí)施例中,如參考圖7的介紹,提供了一種更新適配字典(圖3的方框307)的方法。
每一個(gè)現(xiàn)存的適配模板有一個(gè)越來(lái)越大的整數(shù)用來(lái)記錄它的年齡值(ToL),這個(gè)數(shù)字實(shí)質(zhì)上標(biāo)識(shí)了每一個(gè)適配模板在適配字典中存儲(chǔ)的順序。對(duì)于在方框701中輸入的每一個(gè)字符的劃線標(biāo)記,筆劃段向量序列被提取出來(lái)(方框702),并與固定識(shí)別字典和適配字典中的適配模板匹配(方框703)。與適配模板的匹配過(guò)程包括在多個(gè)存儲(chǔ)的各個(gè)參考筆劃段向量的PDF中,為每一個(gè)提取的筆劃段向量確定最接近的PDF;和搜索一個(gè)適配模板,該適配模板識(shí)別與為提取的筆劃段向量確定的PDF相同的PDF。
從方框703有兩路輸出給方框704和708??紤]從方框703給方框708的輸入,如果頂部的侯選者(C1)來(lái)自于適配字典(方框708),那么該模板的ToL值被置為0(方框709);或者,如果在方框708確定頂部的侯選者(C1)不是來(lái)自于適配字典,那么繞過(guò)方框710,ToL值不變。
考慮從方框703給方框704的輸入,在方框704中,如果侯選字符需要添加到適配字典中,即侯選者C1(方框703)不是所輸入字符的正確識(shí)別,如上所述根據(jù)圖6,就產(chǎn)生一個(gè)新的適配模板。否則程序終止。
如果在步驟704中,確定侯選字符需要添加到適配字典中,那么在方框705中檢測(cè)是否適配字典已滿。如果適配字典不滿,就添加一個(gè)新的模板到字典中(方框710)并將該模板的ToL值置為0。如果適配字典是滿的,那么找到具有最大ToL值的模板,用新的模板將其替換掉(方框706)。該新模板的ToL值同樣被置為0。最后,增加所有現(xiàn)存適配模板的ToL值(例如ToL=ToL+1)(方框707)。應(yīng)當(dāng)注意,由于在方框707中所有的ToL值都增大了,有些字符的ToL值的計(jì)數(shù)可能會(huì)變得過(guò)大,因此對(duì)這些計(jì)數(shù)值進(jìn)行規(guī)一化處理可能是適當(dāng)?shù)模?,通過(guò)對(duì)全部ToL值運(yùn)用整數(shù)除法。
示范實(shí)施例提供了識(shí)別依賴用戶的字符的方法。基于隨機(jī)線段匹配分類和高斯PDF群集方法,示范實(shí)施例提供了一種適配模板生成方法和一種字典更新方法以提高手寫識(shí)別(HWR)產(chǎn)品對(duì)特定用戶的可用性。從而,用戶能夠書寫對(duì)相對(duì)復(fù)雜的字符簡(jiǎn)寫的個(gè)人化標(biāo)記。該劃線標(biāo)記通過(guò)密碼本與復(fù)雜的字符相關(guān)聯(lián)并能夠用于向設(shè)備中輸入字符。
本領(lǐng)域的一名技術(shù)人員會(huì)認(rèn)識(shí)到,在特定實(shí)施例中所示的本發(fā)明的許多變型和更改可以做出,而不脫離本發(fā)明所寬泛描述的要旨或范圍。因此,無(wú)論在哪方面,這些實(shí)施例都應(yīng)被認(rèn)為是說(shuō)明性的而不是限制性的。
權(quán)利要求
1.一種為代表字符的劃線標(biāo)記分配適配模板的方法,該方法包括從所述劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)的各個(gè)參考筆劃段向量的多個(gè)概率分布函數(shù)(PDF)中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,和為所述劃線標(biāo)記分配適配模板,其中,所述適配模板含有多個(gè)識(shí)別符,用于為每一個(gè)提取的筆劃段向量識(shí)別所述存儲(chǔ)的最接近的PDF,并且該適配模板將所述劃線標(biāo)記連接至它代表的字符,以便在適配字典中存儲(chǔ)。
2.如權(quán)利要求1所述的方法,其中,所述多個(gè)存儲(chǔ)的PDF以一個(gè)PDF字典和一個(gè)PDF密碼本的形式存儲(chǔ);其中,存儲(chǔ)在所述PDF密碼本中的PDF的數(shù)目小于在所述PDF字典中的PDF數(shù)目,而且,所述PDF字典中的每一個(gè)PDF與一個(gè)在PDF密碼本中識(shí)別最相似PDF的指針相關(guān)聯(lián)。
3.如權(quán)利要求2所述的方法,其中,所述PDF密碼本中的PDF是基于利用相對(duì)熵來(lái)計(jì)算失真測(cè)量對(duì)PDF字典中PDF進(jìn)行的量化來(lái)選擇。
4.如權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,所述存儲(chǔ)的各個(gè)參考筆劃段向量的PDF與不同的參考字符相關(guān)聯(lián)。
5.如權(quán)利要求1-4中任一項(xiàng)所述的方法,還包括為所述適配模板分配一個(gè)年齡值ToL,并在適配字典中存儲(chǔ)所述適配模板和分配的ToL。
6.如權(quán)利要求5所述的方法,其中,存儲(chǔ)所述適配模板的步驟包括替換適配字典中具有最高ToL的現(xiàn)存項(xiàng)目,和將其它現(xiàn)存項(xiàng)目的ToL值增加預(yù)定量。
7.一種用于識(shí)別代表字符的劃線標(biāo)記的方法,該方法包括從所述劃線標(biāo)記中提取多個(gè)的筆劃段向量;在所述存儲(chǔ)的各個(gè)參考筆劃段向量的多個(gè)PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,和基于所述確定的最接近的PDF,搜索適配模板字典以確定所述劃線標(biāo)記的識(shí)別匹配,其中,每一個(gè)適配模板都含有識(shí)別符,用于為參考字符的每一個(gè)筆劃段向量識(shí)別一個(gè)存儲(chǔ)的PDF。
8.如權(quán)利要求7所述的方法,還包括當(dāng)找不到匹配項(xiàng)時(shí),根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的方法來(lái)分配一個(gè)新的適配模板。
9.一種電子裝置,其包括用戶界面,用于輸入代表字符的劃線標(biāo)記;存儲(chǔ)單元;和處理器;其中,所述處理器從所述劃線標(biāo)記中提取多個(gè)的筆劃段向量;在存儲(chǔ)單元中的各個(gè)參考筆劃段向量的多個(gè)PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并為所述劃線標(biāo)記分配一個(gè)適配模板,和其中,所述適配模板含有多個(gè)識(shí)別符,用于為每一個(gè)提取的筆劃段向量識(shí)別所述存儲(chǔ)的最接近的PDF,并將所述劃線標(biāo)記連接至它代表的字符,以便在所述存儲(chǔ)單元的適配字典中存儲(chǔ)。
10.如權(quán)利要求9所述的電子裝置,其中,所述多個(gè)存儲(chǔ)的PDF以PDF字典和PDF密碼本的形式存儲(chǔ)在所述存儲(chǔ)單元中;存儲(chǔ)在所述PDF密碼本中的PDF的數(shù)目小于存儲(chǔ)在所述PDF字典中的PDF數(shù)目,而且所述PDF字典中的每一個(gè)PDF與在所述PDF密碼本中識(shí)別最相似PDF的一指針相關(guān)聯(lián)。
11.如權(quán)利要求10所述的電子裝置,其中,所述PDF字典和PDF密碼本存儲(chǔ)在所述存儲(chǔ)單元的只讀存儲(chǔ)元件中。
12.如權(quán)利要求10或11所述的電子裝置,其中,PDF密碼本中的PDF是基于利用相對(duì)熵計(jì)算失真測(cè)量對(duì)PDF字典中PDF進(jìn)行的量化來(lái)選擇。
13.如權(quán)利要求9-12中任一項(xiàng)所述的電子裝置,其中,所述存儲(chǔ)的各個(gè)參考筆劃段向量的PDF與不同的參考字符相關(guān)聯(lián)。
14.如權(quán)利要求9-13中任一項(xiàng)所述的電子裝置,其中,所述處理器還為所述適配模板分配一個(gè)年齡值ToL,并在所述存儲(chǔ)單元的適配字典中存儲(chǔ)所述適配模板和分配的ToL。
15.如權(quán)利要求14所述的電子裝置,其中,所述處理器替換所述適配字典中具有最高ToL的現(xiàn)存項(xiàng)目,并將其它現(xiàn)存項(xiàng)目的ToL值增加一預(yù)定量。
16.如權(quán)利要求9-15中任一項(xiàng)所述的電子裝置,其中,所述適配字典存儲(chǔ)在所述存儲(chǔ)單元的隨機(jī)存取存儲(chǔ)元件或閃存元件中。
17.一種電子裝置,其包括用戶界面,用于輸入代表字符的劃線標(biāo)記;存儲(chǔ)單元;和處理器;其中,所述處理器從所述劃線標(biāo)記中提取多個(gè)的筆劃段向量;在所述存儲(chǔ)單元中存儲(chǔ)的多個(gè)PDF中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF,并基于所述確定的最接近的PDF,在所述存儲(chǔ)單元中搜索適配字典以確定所述劃線標(biāo)記的識(shí)別匹配,其中,所述適配字典中的每一個(gè)適配模板都含有多個(gè)識(shí)別符,用于為參考字符的每一個(gè)筆劃段向量識(shí)別一個(gè)存儲(chǔ)的PDF。
18.如權(quán)利要求17所述的電子裝置,其中,如果找不到匹配項(xiàng),所述處理器就為所述輸入字符分配一個(gè)新的適配模板,該適配模板包括一個(gè)識(shí)別符數(shù)組,用于為每一個(gè)筆劃段向量識(shí)別存儲(chǔ)的最接近的PDF,以便在所述適配字典中存儲(chǔ)。
全文摘要
一種為代表字符的劃線標(biāo)記分配適配模板的方法,該方法包括從劃線標(biāo)記中提取多個(gè)的筆劃段向量(方框602)在存儲(chǔ)的多個(gè)的各個(gè)參考筆劃段向量的概率分布函數(shù)(PDF)中,為每一個(gè)提取的筆劃段向量確定一個(gè)最接近的PDF(方框604),并為劃線標(biāo)記分配適配模板,其中適配模板包括識(shí)別器,用于為每一個(gè)提取的筆劃段向量識(shí)別存儲(chǔ)的最接近的PDF,并將劃線標(biāo)記連接至它代表的字符(方框605),以便在適配字典中存儲(chǔ)。
文檔編號(hào)G06K9/62GK1731415SQ20041005651
公開(kāi)日2006年2月8日 申請(qǐng)日期2004年8月6日 優(yōu)先權(quán)日2004年8月6日
發(fā)明者葛勇, 鎮(zhèn)立新 申請(qǐng)人:摩托羅拉公司