專(zhuān)利名稱(chēng):字符檢索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基于由可輸入筆跡的指示裝置以手寫(xiě)方式輸入的圖形,進(jìn)行字符或符號(hào)的檢索的字符檢索裝置,特別涉及可以高效地進(jìn)行與所輸入的圖形的至少一部分一致的字符或符號(hào)的檢索的字符檢索裝置。
背景技術(shù):
以往,可以通過(guò)手寫(xiě)板或鼠標(biāo)等可輸入筆跡的指示裝置用手寫(xiě)方式來(lái)輸入字符或符號(hào)的信息處理裝置是廣泛熟知的。以往關(guān)于在這樣的信息處理裝置中,通過(guò)比較所輸入的圖形和字典中登記的字符或符號(hào)的圖形,來(lái)判斷手寫(xiě)輸入的圖形與字符字典中登記的字符或符號(hào)中的哪一個(gè)一致或相似的手寫(xiě)字符識(shí)別(也稱(chēng)為手寫(xiě)字符檢索),提出了各種方法。
此外,從下述方面考慮而非常方便在用戶(hù)要輸入漢字的情況下,由于漢字比假名筆劃數(shù)多,所以即使字符整體的輸入未結(jié)束,只要能夠基于部分圖形檢索字符而向用戶(hù)提示相似度高的字符候選,就可省去用戶(hù)輸入的麻煩,即使用戶(hù)不記得漢字整體的結(jié)構(gòu)也可進(jìn)行漢字輸入。在圖7中示出通過(guò)部分圖形進(jìn)行的字符檢索的一例。在圖7所示的例子中,用戶(hù)手寫(xiě)輸入漢字的至少一部分時(shí),顯示包含與所輸入的部分圖形相似的圖形的字符候選作為檢索結(jié)果。從而,用戶(hù)從顯示出的字符候選中選擇自己要輸入的漢字即可。
作為現(xiàn)有的手寫(xiě)字符識(shí)別或手寫(xiě)字符檢索方法,例如公知有如下的技術(shù)。
例如,在日本特開(kāi)平7-57056號(hào)公報(bào)中公開(kāi)了如下的在線(xiàn)字符識(shí)別裝置通過(guò)按照筆劃、部分圖形、以及字符的順序識(shí)別手寫(xiě)字符,從而可以進(jìn)行高速且高精度的字符識(shí)別。
此外,在日本專(zhuān)利第3155577號(hào)公報(bào)中公開(kāi)了如下的字符識(shí)別方法通過(guò)在輸入和字典的各筆劃之間求出相似度而生成相似度矩陣,對(duì)各行唯一地確定在各列上具有最大的相似度的元素,通過(guò)取其最大相似度之和而求出字符間的相似度,從而識(shí)別字符。根據(jù)該字符識(shí)別方法,可以進(jìn)行不取決于筆順的字符檢索。
進(jìn)而,在小高和巳、若原徹、梅田三千雄,‘ 択的ストロ一ク結(jié)合による畫(huà)數(shù)·筆順に依存しないオンライン文字認(rèn)識(shí)’,電子通信學(xué)會(huì)論文志,昭和58年5月,J66-D,No.5,p.593-600中公開(kāi)了如下的技術(shù)在筆劃-筆劃列間取大致的對(duì)應(yīng),然后,與筆劃對(duì)應(yīng)不重復(fù)地取得匹配,從而實(shí)現(xiàn)允許筆順不同或筆劃的連寫(xiě)的字符識(shí)別。
此外,在日本特開(kāi)平8-123903號(hào)公報(bào)中公開(kāi)了如下的技術(shù)以部分圖形作為對(duì)象進(jìn)行圖形識(shí)別,從部分圖形和漢字之間的對(duì)應(yīng)表中搜索漢字,由此實(shí)現(xiàn)部分圖形字符檢索。
此外,在日本特開(kāi)平9-190499號(hào)公報(bào)中公開(kāi)了如下的方法使用存儲(chǔ)了筆劃形狀和筆劃間的相對(duì)關(guān)系的字典,一筆一劃地依次對(duì)照輸入圖形和字典圖形的筆劃,從而進(jìn)行部分圖形字符檢索。該方法不受可檢索的部分圖形的類(lèi)型的限制,所以可以進(jìn)行靈活的檢索。
在通過(guò)手寫(xiě)進(jìn)行字符輸入的情況下,特別是在筆劃數(shù)多且復(fù)雜的漢字的情況下,有時(shí)難以正確地書(shū)寫(xiě)字符整體。此外,本來(lái)由多筆構(gòu)成的部分圖形常常因連寫(xiě)而被按照1筆來(lái)輸入。因此,最好在沒(méi)有正確地書(shū)寫(xiě)字符整體的情況下,或在多筆按照1筆來(lái)輸入的情況下,均可進(jìn)行基于部分圖形的字符檢索。
例如,在上述的日本特開(kāi)平8-123903號(hào)公報(bào)所記載的檢索方法中,無(wú)法檢索在部分圖形和字符之間的對(duì)應(yīng)表中不存在的字符,寫(xiě)了部分圖形字典中所不存在的圖形也無(wú)法檢索。此外,難以作成完整的對(duì)應(yīng)表或部分圖形字典。
此外,在日本特開(kāi)平9-190499號(hào)公報(bào)所記載的方法中,由于一筆一劃地將輸入圖形的筆劃與字典圖形的筆劃進(jìn)行對(duì)照,因此在多筆被按照1筆來(lái)輸入的情況下,不能進(jìn)行正確的檢索。
作為應(yīng)對(duì)多筆連寫(xiě)的字符識(shí)別方式,提出了上述的小高等的‘選択的ストロ一ク結(jié)合による畫(huà)數(shù)·筆順に依存しないオンライン文字認(rèn)識(shí)’所記載的方法,但該方法是以完成了整個(gè)字符的書(shū)寫(xiě)為前提的方式,不能減輕用戶(hù)輸入的麻煩。此外,該方法包含除去對(duì)應(yīng)的重復(fù)的處理,以使筆順不同的筆劃對(duì)應(yīng)起來(lái),高精度地進(jìn)行識(shí)別,這導(dǎo)致處理量的大幅增加。
發(fā)明內(nèi)容
鑒于上述課題,本發(fā)明的目的在于提供在多筆被按照1筆來(lái)輸入的情況下,也可以進(jìn)行基于部分圖形的字符或符號(hào)的檢索的字符檢索裝置。
為了達(dá)成上述目的,本發(fā)明的字符檢索裝置將可輸入筆跡的指示裝置的輸入圖形和登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),其特征在于,在所述字典存儲(chǔ)部中至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述字符檢索裝置具有筆劃相似度計(jì)算部,其參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成部,其基于由所述筆劃相似度計(jì)算部求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算部,其根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有的輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法部,其參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示部,其按照所述懲罰值減法部求出的圖形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
關(guān)于本發(fā)明,‘筆劃’是指一次落筆到提筆為止書(shū)寫(xiě)的筆跡。此外,‘圖形’是指由一個(gè)或多個(gè)‘筆劃’形成的、字符或符號(hào)的整體或部分圖形。
根據(jù)上述結(jié)構(gòu),相似度表作成部基于由筆劃相似度計(jì)算部求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表,相似度和計(jì)算部根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有的輸入筆劃的最大相似度的總和,作為最大相似度和,從而在本來(lái)應(yīng)多筆書(shū)寫(xiě)的圖形被按照1筆來(lái)輸入的情況下,也可以進(jìn)行基于部分圖形的字符或符號(hào)的檢索。此外,懲罰值減法部參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,求出圖形一致度,可以提高基于部分圖形的字符或符號(hào)的檢索精度。
在上述的字符檢索裝置中,所述懲罰條件如下例如,對(duì)某一輸入圖形中所包含的一個(gè)輸入筆劃提供最大的相似度的字典筆劃列對(duì)于同一輸入圖形中所包含的其它的輸入筆劃也提供最大的相似度。
在上述的字符檢索裝置中,所述懲罰條件如下例如,存在對(duì)某一輸入筆劃以大于等于一定值的相似度對(duì)應(yīng)的字典筆劃,并且在該字典筆劃之后,沒(méi)有對(duì)所述輸入筆劃的下一個(gè)輸入筆劃以大于等于所述一定值的相似度對(duì)應(yīng)的字典筆劃。
在上述的字符檢索裝置中,所述懲罰條件如下例如,沒(méi)有對(duì)輸入筆劃以大于等于一定值的相似度對(duì)應(yīng)的字典筆劃。
在上述的字符檢索裝置中,優(yōu)選為所述筆劃相似度計(jì)算部根據(jù)彈性匹配法,求出輸入筆劃和字典筆劃列之間的相似度。
此外,為了達(dá)成上述目的,本發(fā)明的程序使計(jì)算機(jī)執(zhí)行文字檢索處理,該文字檢索處理將可輸入筆跡的指示裝置的輸入圖形和登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),該程序的特征在于,在所述字典存儲(chǔ)部中,至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述程序使計(jì)算機(jī)執(zhí)行以下處理筆劃相似度計(jì)算處理,參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成處理,基于由所述筆劃相似度計(jì)算處理求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算處理,根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有的輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法處理,參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示處理,按照所述懲罰值減法處理所求出的圖形一致度的高低順序提示字符或符號(hào),作為檢索結(jié)果。
根據(jù)本發(fā)明,可以提供在多筆被按照1筆來(lái)輸入的情況下,也可以進(jìn)行基于部分圖形的字符或符號(hào)的檢索的字符檢索裝置。
圖1是本發(fā)明的一種實(shí)施方式的字符檢索裝置的方框圖。
圖2是用于說(shuō)明本發(fā)明的一種實(shí)施方式的字符檢索裝置中的輸入圖形(a)和字典圖形(b)之間的對(duì)應(yīng)關(guān)系的圖。
圖3是表示本發(fā)明的一種實(shí)施方式的字符檢測(cè)裝置中的附加了懲罰條件的情況下的輸入圖形(a)和字典圖形(b)的組合的一例的圖。
圖4是表示本發(fā)明的一種實(shí)施方式的字符檢測(cè)裝置中的附加了懲罰條件的情況下的輸入圖形(a)和字典圖形(b)的組合的一例、以及在與所述輸入圖形的組合中未附加懲罰條件的字典圖形(c)的例子的圖。
圖5是表示本發(fā)明的一種實(shí)施方式的字符檢測(cè)裝置中的附加了懲罰條件的情況下的輸入圖形(a)和字典圖形(b)的組合的一例、以及在與所述輸入圖形的組合中未附加懲罰條件的字典圖形(c)的例子的圖。
圖6是表示本發(fā)明的字符檢索方法的步驟的一例的流程圖。
圖7是現(xiàn)有的部分圖形字符檢索裝置的畫(huà)面例。
具體實(shí)施例方式
以下,參照
本發(fā)明的一種實(shí)施方式。
另外,本發(fā)明涉及用于進(jìn)行基于部分圖形的字符或符號(hào)的檢索的裝置、方法、以及程序等,在作為檢索對(duì)象的字符或符號(hào)中包含假名、漢字、以及數(shù)字以外,還包含任意的符號(hào)。此外,在本說(shuō)明書(shū)以及權(quán)利要求書(shū)中,將這些字符或符號(hào)的檢索簡(jiǎn)稱(chēng)為‘字符檢索’。
本發(fā)明被作為連接了手寫(xiě)板或鼠標(biāo)等可輸入筆跡的指示裝置的、計(jì)算機(jī)或便攜信息終端等來(lái)實(shí)施。在這樣作為計(jì)算機(jī)或便攜信息終端等來(lái)實(shí)施本發(fā)明的字符檢索裝置的情況下,計(jì)算機(jī)或便攜信息終端可具有字符檢索功能以外的任意的功能。此外,本發(fā)明也可以作為在連接了可輸入筆跡的指示裝置的計(jì)算機(jī)環(huán)境上執(zhí)行的字符檢索程序、或記錄了這樣的字符檢索程序的程序記錄介質(zhì)來(lái)實(shí)施。
以下,作為本發(fā)明的字符檢索裝置的一種實(shí)施方式,說(shuō)明具有字符檢索功能的計(jì)算機(jī)。
圖1是表示在本實(shí)施方式的計(jì)算機(jī)中,通過(guò)執(zhí)行本發(fā)明的字符檢索程序而實(shí)現(xiàn)的功能結(jié)構(gòu)的方框圖。
如圖1所示,本實(shí)施方式的計(jì)算機(jī)1具有指示裝置11和顯示器12,以使用戶(hù)輸入手寫(xiě)字符。此外,計(jì)算機(jī)1具有筆劃相似度計(jì)算部13、相似度表作成部14、相似度和計(jì)算部15、懲罰值減法部16、筆劃字典存儲(chǔ)部17、輸入筆劃存儲(chǔ)部18、以及檢索結(jié)果提示部19,以實(shí)現(xiàn)字符檢索功能。另外,筆劃相似度計(jì)算部13、相似度表作成部14、相似度和計(jì)算部15、懲罰值減法部16、以及檢索結(jié)果提示部19通過(guò)計(jì)算機(jī)1的處理器(未圖示)執(zhí)行安裝在存儲(chǔ)器(未圖示)中的字符檢索程序而使其功能得以實(shí)現(xiàn),不一定存在與這些各部分分別對(duì)應(yīng)的硬件。
作為指示裝置11,使用了鼠標(biāo)或手寫(xiě)板等的、可手寫(xiě)輸入的輸入裝置。另外,在使用顯示器一體型的手寫(xiě)板作為指示裝置11的情況下,可省略顯示器12。
由用戶(hù)進(jìn)行手寫(xiě)輸入時(shí),指示裝置11對(duì)輸入圖形的每個(gè)筆劃取得輸入筆劃數(shù)據(jù)。所取得的輸入筆劃數(shù)據(jù)被存儲(chǔ)在輸入筆劃存儲(chǔ)部18中。另外,‘1筆’是指從落筆到提筆為止(在鼠標(biāo)的情況下,從拖動(dòng)開(kāi)始到拖動(dòng)結(jié)束為止)繪制出的連續(xù)的軌跡。
這里,輸入筆劃數(shù)據(jù)是表示為(xi,yi,ti)0≤i<n的時(shí)序的特征點(diǎn)數(shù)據(jù)。xi,yi是特征點(diǎn)坐標(biāo),ti是提筆落筆信息,i是特征點(diǎn)序號(hào),n是整數(shù)。特征點(diǎn)是從筆劃的采樣數(shù)據(jù)中提取特征性的點(diǎn)而得到的。對(duì)于特征點(diǎn)提取提出了遞歸最遠(yuǎn)點(diǎn)分離法、按照一定的時(shí)間間隔反復(fù)進(jìn)行采樣的方法、對(duì)方向成分進(jìn)行量化的方法等各種方法。本發(fā)明不特別取決于特征點(diǎn)提取的方法。此外,在輸入了多個(gè)筆劃的情況下,對(duì)這些輸入筆劃的筆劃數(shù)據(jù)、按照書(shū)寫(xiě)的順序標(biāo)以筆劃號(hào),存儲(chǔ)在輸入筆劃存儲(chǔ)部18中。在本實(shí)施方式中,附加了筆劃號(hào),但只要依次保存筆劃數(shù)據(jù)或保存筆劃數(shù)據(jù)列來(lái)以可知筆劃順序的方式保存,就不必非要附加筆劃號(hào)。
在筆劃字典存儲(chǔ)部17中存儲(chǔ)有以構(gòu)成該圖形的筆劃表示各種字符或符號(hào)的圖形的字典筆劃數(shù)據(jù)。存儲(chǔ)有以時(shí)序的特征點(diǎn)數(shù)據(jù)定義的字典筆劃數(shù)據(jù)。字典筆劃數(shù)據(jù)被表示為(vxij,vyij,vtij)0≤i<m,0≤j<k。
vxij,vij是特征點(diǎn)坐標(biāo),vtij是提筆落筆信息。j是特征點(diǎn)序號(hào)。i是該字符圖形中的筆劃號(hào)。按照各筆劃的筆順來(lái)附加筆劃號(hào)。m、k是整數(shù)。
筆劃相似度計(jì)算部13參照筆劃字典存儲(chǔ)部17,求出輸入筆劃和構(gòu)成一個(gè)字符圖形的字典筆劃組中、一個(gè)字典筆劃或連續(xù)書(shū)寫(xiě)的字典筆劃列之間的相似度。所求出的相似度傳遞給相似度表作成部14。另外,‘字典筆劃列’是指構(gòu)成一個(gè)字符圖形的多個(gè)字典筆劃中、時(shí)序連續(xù)的多個(gè)筆劃。換言之,在用戶(hù)進(jìn)行手寫(xiě)輸入時(shí),由于連寫(xiě),常常將本來(lái)應(yīng)多筆書(shū)寫(xiě)的部分按照1筆來(lái)書(shū)寫(xiě)。因此,筆劃相似度計(jì)算部13通過(guò)將一個(gè)輸入筆劃與多個(gè)字典筆劃(即,字典筆劃列)依次進(jìn)行對(duì)比來(lái)求出相似度。
筆劃相似度計(jì)算部13在求出輸入筆劃和字典筆劃列之間的相似度時(shí),使用彈性匹配的方法。作為在彈性匹配中最為周知的方法之一有基于動(dòng)態(tài)規(guī)劃法的匹配(所謂DP匹配),但可應(yīng)用于本發(fā)明的彈性匹配不限于DP匹配。另外,為了確定到字典筆劃列的第幾筆為止與一個(gè)輸入筆劃對(duì)應(yīng),考慮了如下的方法。即例如,在一個(gè)輸入筆劃和從字典筆劃列的第1筆的筆劃到第t筆的筆劃為止所形成的圖形之間的相似度s(t)大于同一輸入筆劃和從同一字典筆劃列的第1筆的筆劃到第(t+1)筆的筆劃為止形成圖形之間的相似度s(t+1)的情況下,確定為從字典筆劃列的第1筆到第t筆為止的筆劃與所述一個(gè)輸入筆劃對(duì)應(yīng)。
由此,例如,在存在圖2(a)所示的輸入筆劃Sin1和圖2(b)所示的字典圖形的情況下,筆劃相似度計(jì)算部13可確定為與圖2(a)的輸入筆劃Sin1對(duì)應(yīng)的字典筆劃是圖2(b)的Sdic1以及Sdic2。
作為筆劃相似度計(jì)算部13求出輸入筆劃和字典筆劃列之間的相似度用的其它的方法,還有如下的方法。例如,將輸入筆劃的特征點(diǎn)(xp,yp)和字典筆劃的特征點(diǎn)(vxiq,vyiq)之間的對(duì)應(yīng)表示為[p,q],其局部的評(píng)價(jià)值由f(p,q)給出時(shí),按照使f(p’,q’)最大的方式、從[p+1,q]、[p,q+1]、[p+1,q+1]中選擇對(duì)應(yīng)[p,q]的下一個(gè)對(duì)應(yīng)[p’,q’],重復(fù)該動(dòng)作。然后,在其重復(fù)處理的過(guò)程中,在輸入筆劃以及字典筆劃同時(shí)達(dá)到最終筆劃的時(shí)刻,結(jié)束匹配。
相似度表作成部14基于筆劃相似度計(jì)算部13的處理結(jié)果,關(guān)于輸入圖形和登記在字典中的所有的字符圖形的組合,作成字典筆劃列相對(duì)于輸入筆劃的相似度的表(以后,將該表稱(chēng)為‘相似度表’。),至少暫時(shí)地進(jìn)行存儲(chǔ)。另外,‘作成相似度表’是指關(guān)于輸入筆劃和字典筆劃列的所有的組合循環(huán)地求出相似度,不一定要求出表形式的輸出。
這里,相似度表作成部14在作成一個(gè)輸入圖形和一個(gè)字符圖形的相似度表時(shí),關(guān)于構(gòu)成該一個(gè)輸入圖形的各個(gè)筆劃和以該一個(gè)字符圖形的各個(gè)字典筆劃為開(kāi)頭的字典筆劃列的組合,使用筆劃相似度計(jì)算部13求出相似度。換言之,如果將輸入圖形的筆劃數(shù)設(shè)為nin,將登記在字典中的某一字符圖形的筆劃數(shù)設(shè)為ndic,則關(guān)于該輸入圖形和字符圖形的組合作出nin×ndic大小的相似度表。
例如,假設(shè)輸入圖形的筆劃數(shù)為3,登記在字典中的某一字符圖形的筆劃數(shù)為5。在該情況下,關(guān)于該輸入圖形和字符圖形的組合,分別對(duì)于輸入圖形的三個(gè)筆劃,通過(guò)筆劃相似度計(jì)算部13求出與如下的(1)~(5)的5種字典筆劃列之間的相似度,作成3×5的相似度表。假設(shè)將該相似度表的各元素表示為ss(i,j)。這里,i是輸入圖形中的筆劃號(hào),j是作為字典筆劃列的開(kāi)頭的字典筆劃號(hào)。
(1)由字符圖形的字典筆劃的第1筆~第5筆構(gòu)成的字典筆劃列;(2)由第2筆~第5筆構(gòu)成的字典筆劃列;(3)由第3筆~第5筆構(gòu)成的字典筆劃列;(4)由第4及第5筆構(gòu)成的字典筆劃列;(5)由第5筆構(gòu)成的字典筆劃列。
相似度和計(jì)算部15從由相似度表作成部14作成的相似度表中選出對(duì)各輸入筆劃提供最大的相似度的字典筆劃列,關(guān)于所有的輸入筆劃,求出所選出的最大相似度之和st。即,通過(guò)以下的算式來(lái)求出和st。
st=∑[i=0~(nin-1)]max{ss(i,j)| 0≤j<ndic}懲罰值減法部16參照由相似度表作成部14作成的相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述筆劃字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立的情況下,從由相似度和計(jì)算部15計(jì)算出的最大相似度和st中減去與該懲罰條件對(duì)應(yīng)的預(yù)定的懲罰值。作為其結(jié)果得到的值成為輸入圖形和字符圖形之間的圖形一致度。在后面詳細(xì)說(shuō)明懲罰值的計(jì)算。
檢索結(jié)果提示部19按照分別對(duì)于輸入圖形和登記在字典中的所有的字符圖形的組合求出的圖形一致度的大小順序、將字符圖形顯示在顯示器12上,作為檢索結(jié)果。
這里,說(shuō)明懲罰值減法部16的處理的細(xì)節(jié)。作為在懲罰值減法部16中,要進(jìn)行懲罰值的減法運(yùn)算的懲罰條件,例如考慮了以下的第一~第三條件。
第一條件是,懲罰值減法部16參照由相似度表作成部14作成的相似度表,使對(duì)某一輸入圖形中包含的一個(gè)輸入筆劃提供最大相似度的字典筆劃列對(duì)同一輸入圖形中包含的其它輸入筆劃也提供最大相似度。在該情況下,懲罰值減法部16視為輸入筆劃和字典筆劃之間的對(duì)應(yīng)有重復(fù),從最大相似度和st中減去預(yù)定的懲罰值p1。
如上所述,在本實(shí)施方式中,筆劃相似度計(jì)算部13、相似度表作成部14、以及相似度和計(jì)算部15進(jìn)行允許輸入圖形和字典的字符圖形中的筆劃對(duì)應(yīng)的重復(fù)而計(jì)算相似度的處理。但是,如果這樣允許輸入圖形的各筆劃還與本來(lái)應(yīng)對(duì)應(yīng)的字典筆劃以外的筆劃重復(fù)地對(duì)應(yīng),則難以進(jìn)行例如具有排列幾個(gè)同樣的筆劃而成的圖形的字符間的識(shí)別。上述第一條件的懲罰值減法運(yùn)算具有在一定程度上減輕筆劃的重復(fù)所引起的識(shí)別的困難度、達(dá)到高精度的作用。
例如,在將構(gòu)成圖3(a)所示的輸入圖形的三個(gè)輸入筆劃Sin1~Sin3與圖3(b)所示的字符圖形的字典筆劃Sdic1~Sdic3進(jìn)行比較來(lái)求出相似度的情況下,輸入筆劃Sin1和Sin2分別相對(duì)于字典筆劃Sdic1具有最大相似度,輸入筆劃Sin3相對(duì)于字典筆劃Sdic3具有最大相似度。如果沒(méi)有通過(guò)懲罰值減法部16進(jìn)行懲罰值減法運(yùn)算,則關(guān)于所有的輸入筆劃Sin1~Sin3存在位置、形狀都很相似的字典筆劃,所以圖3(a)的輸入圖形和圖3(b)的字符圖形之間的圖形一致度變得非常高。但是圖3(a)的輸入圖形不是圖3(b)的字符圖形的部分圖形,所以圖形一致度變得過(guò)高則不理想。因此,在滿(mǎn)足了上述第一條件的情況下,懲罰值減法部16對(duì)提供最大相似度的筆劃的重復(fù)施加懲罰,由此可以提高作為字符整體的檢索的準(zhǔn)確性。
第二條件是,存在對(duì)某一輸入筆劃a、按照大于等于一定值的相似度對(duì)應(yīng)的字典筆劃A時(shí),在該字典筆劃A之后,沒(méi)有對(duì)輸入筆劃a的下一個(gè)輸入筆劃b、按照大于等于一定值的相似度對(duì)應(yīng)的字典筆劃。在該情況下,懲罰值減法部16從最大相似度和st中減去預(yù)定的懲罰值p2。由此,還可以對(duì)筆順的不同施加一定程度上的懲罰。
例如,圖4(a)的輸入圖形‘白’是圖4(b)的字典圖形‘鮮’和圖4(c)的字典圖形‘的’兩者的部分圖形。另外,假設(shè)圖4(a)的輸入圖形是按照字符‘白’的正確的筆順來(lái)手寫(xiě)輸入而成的。這里,相對(duì)于圖4(a)的輸入圖形的各筆劃,圖4(b)的字典圖形‘鮮’也與圖4(c)的字典圖形‘白’同樣,有具有非常相似的位置和形狀的字典筆劃。從而,如果僅考慮輸入筆劃和字典筆劃列之間的相似度,則對(duì)于圖4(a)的輸入圖形‘白’,圖4(b)的字典圖形‘鮮’越是與圖4(c)的字典圖形‘白’排列在同列上,則越能取得高的相似度。但是對(duì)于圖4(a)的輸入圖形,最好是在左側(cè)具有‘白’的字符與在左側(cè)具有‘焦’的字符相比在檢索結(jié)果中處于上位。
對(duì)于圖4(a)的輸入圖形,圖4(c)的字典圖形‘的’的各筆劃依次以高的相似度對(duì)應(yīng)。但是,對(duì)于圖4(a)的輸入圖形,圖4(b)的字典圖形‘鮮’的各筆劃不一定以高的相似度對(duì)應(yīng)。例如,圖4(a)的輸入圖形‘白’的第一個(gè)筆劃Sin1和圖4(b)的字典圖形‘鮮’的第一個(gè)筆劃Sdic1的位置、形狀都相似,可以取得高的相似度。但是,圖4(a)的輸入圖形‘白’的第二個(gè)筆劃Sin2和圖4(b)的字典圖形‘鮮’的第二個(gè)筆劃Sdic2的形狀差大,相似度低。
因此,根據(jù)上述第二條件,判斷字典筆劃是否按照輸入筆劃的筆順、以高的相似度對(duì)應(yīng),在未對(duì)應(yīng)的情況下,從最大相似度和st中減去預(yù)定的懲罰值p2。由此,得到如下效果對(duì)于圖4(a)的輸入圖形‘白’,圖4(c)的字典圖形‘的’與圖4(b)的字典圖形‘鮮’相比,其在檢索結(jié)果中的順位更高。
第三條件是,存在沒(méi)有按照大于等于一定值的相似度與字典筆劃對(duì)應(yīng)的輸入筆劃,換言之,沒(méi)有可視為對(duì)應(yīng)于某一輸入筆劃的字典筆劃。此時(shí),懲罰值減法部16從最大相似度和st中減去預(yù)定的懲罰值p3。
例如,圖5(a)的輸入圖形的筆劃Sin1~Sin5按照非常高的相似度與圖5(b)的字典圖形‘龍’的筆劃Sdic1~Sdic5對(duì)應(yīng)。但是圖5(a)的輸入圖形的筆劃Sin6與圖5(b)的字典圖形‘龍’的任何部分均不相似。如果僅考慮輸入筆劃和字典筆劃列之間的相似度,則導(dǎo)致如下結(jié)果對(duì)于圖5(a)的輸入圖形,盡管圖5(b)的字典圖形‘龍’不含有與輸入筆劃Sin6相似的筆劃,但與含有與輸入筆劃Sin6相似的筆劃的圖5(c)的字典圖形‘部’同樣,具有高的圖形一致度。
因此,根據(jù)上述第三條件,在輸入圖形的一部分與字典圖形的任何部分均不相似的情況下,從最大相似度和st中減去預(yù)定的懲罰值p3,從而不使該字典圖形的字符在檢索結(jié)果中處于上位。
另外,分別根據(jù)上述第一~第三條件應(yīng)用的懲罰值p1~p3通過(guò)實(shí)驗(yàn)來(lái)求出適當(dāng)?shù)闹导纯?。例如,在作為懲罰值減法部16的運(yùn)算結(jié)果得到的圖形一致度可以取0~1000的值的情況下,一邊使用各種手寫(xiě)字符圖形進(jìn)行仿真,一邊每過(guò)預(yù)定值(例如每次50)變更懲罰值,采用得到最適當(dāng)?shù)臋z測(cè)結(jié)果的懲罰值即可。
如以上所述,關(guān)于懲罰值減法部16的懲罰值的應(yīng)用條件,例示了第一~第三的三個(gè)具體條件,但在通過(guò)懲罰值減法部16計(jì)算懲罰值時(shí),組合多個(gè)上述第一~第三條件而應(yīng)用的做法也是有效的。
接著,參照?qǐng)D6說(shuō)明本發(fā)明的字符檢索方法的步驟。
用戶(hù)使用指示裝置11輸入手寫(xiě)圖形時(shí),指示裝置11對(duì)輸入圖形的每1個(gè)筆劃取得輸入筆劃數(shù)據(jù),存儲(chǔ)在輸入筆劃存儲(chǔ)部18中(步驟Op1)。
接著,相似度表作成部14選擇輸入圖形的最初的筆劃和登記在筆劃字典存儲(chǔ)部17中的最初的字符圖形,作成輸入筆劃和該字符圖形的字典筆劃列的相似度表(步驟Op2)。在該步驟Op2中,求出輸入筆劃和字典筆劃列之間的相似度時(shí),筆劃相似度計(jì)算部13例如使用彈性匹配的方法。
相似度表作成部14重復(fù)執(zhí)行步驟Op2,直到相似度表完成為止,即如果將輸入筆劃數(shù)設(shè)為nin,將所述字符圖形的字典筆劃數(shù)設(shè)為ndic,則關(guān)于輸入筆劃和字典筆劃列的所有的組合,完成nin×ndic大小的相似度表為止(在步驟Op3中為‘是’)。
接著,相似度和計(jì)算部15從步驟Op2所作成的相似度表中選出對(duì)各輸入筆劃提供最大的相似度的字典筆劃列,關(guān)于所有的輸入筆劃,求出所選出的最大相似度之和st(步驟Op4)。
接著,懲罰值減法部16基于步驟Op2所作成的相似度表計(jì)算懲罰值,從步驟Op4所計(jì)算出的最大相似度和st中減去所計(jì)算出的懲罰值,從而求出輸入圖形和字符圖形之間的圖形一致度(步驟Op5)。
重復(fù)上述步驟Op2~Op5,直到關(guān)于輸入圖形和登記在筆劃字典存儲(chǔ)部17中的所有的字符圖形的組合求出圖形一致度為止(在步驟Op6中為‘是’)。
并且,最后,檢索結(jié)果提示部19按照相對(duì)于輸入圖形的圖形一致度的高低順序,在顯示器12上顯示作為檢索結(jié)果的字符圖形(Op7)。
通過(guò)以上的步驟,在多筆被按照1筆來(lái)輸入的情況下,也可以高效地且高精度地檢索包含與輸入圖形部分一致的圖形的字符。
本發(fā)明可以作為即使在多筆被按照1筆來(lái)輸入的情況下、也可以進(jìn)行基于部分圖形的字符檢索的字符檢索裝置以及實(shí)現(xiàn)該字符檢索裝置的計(jì)算機(jī)程序而使用。
權(quán)利要求
1.一種字符檢索裝置,將可輸入筆跡的指示裝置的輸入圖形與登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),其特征在于,在所述字典存儲(chǔ)部中至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述字符檢索裝置具有筆劃相似度計(jì)算部,其參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成部,其基于由所述筆劃相似度計(jì)算部求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算部,其根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法部,其參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示部,其按照所述懲罰值減法部所求出的圖形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
2.如權(quán)利要求1所述的字符檢索裝置,其中,所述懲罰條件是對(duì)某一輸入圖形中所包含的一個(gè)輸入筆劃提供最大的相似度的字典筆劃列對(duì)同一輸入圖形中所包含的其它的輸入筆劃也提供最大的相似度。
3.如權(quán)利要求1所述的字符檢索裝置,其中,所述懲罰條件是存在對(duì)某一輸入筆劃、按照大于等于一定值的相似度對(duì)應(yīng)的字典筆劃,并且在該字典筆劃之后,沒(méi)有對(duì)所述輸入筆劃的下一個(gè)輸入筆劃、按照所述大于等于一定值的相似度對(duì)應(yīng)的字典筆劃。
4.如權(quán)利要求1所述的字符檢索裝置,其中,所述懲罰條件是沒(méi)有對(duì)于輸入筆劃、按照大于等于一定值的相似度對(duì)應(yīng)的字典筆劃。
5.如權(quán)利要求1~4中的任意一項(xiàng)所述的字符檢索裝置,其中,所述筆劃相似度計(jì)算部根據(jù)彈性匹配法,求出輸入筆劃和字典筆劃列之間的相似度。
6.一種字符檢索方法,將可輸入筆跡的指示裝置的輸入圖形與登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),其特征在于,在所述字典存儲(chǔ)部中至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述字符檢索方法包括筆劃相似度計(jì)算處理,參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成處理,基于由所述筆劃相似度計(jì)算處理求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算處理,根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法處理,參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示處理,按照所述懲罰值減法處理所求出的圖形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
7.一種程序,使計(jì)算機(jī)執(zhí)行文字檢索處理,該文字檢索處理將可輸入筆跡的指示裝置的輸入圖形和登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),該程序的特征在于,在所述字典存儲(chǔ)部中至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述程序使計(jì)算機(jī)執(zhí)行以下處理筆劃相似度計(jì)算處理,參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成處理,基于由所述筆劃相似度計(jì)算處理求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算處理,根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法處理,參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示處理,按照所述懲罰值減法處理所求出的圖形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
8.一種程序記錄介質(zhì),記錄了使計(jì)算機(jī)執(zhí)行字符檢索處理的程序,該字符檢索處理將可輸入筆跡的指示裝置的輸入圖形和登記在字典存儲(chǔ)部中的字符或符號(hào)的圖形進(jìn)行對(duì)比,提示整體或部分與所述輸入圖形一致或相似的字符或符號(hào),該程序記錄介質(zhì)的特征在于,在所述字典存儲(chǔ)部中至少登記了表示作為構(gòu)成字符或符號(hào)的筆劃的字典筆劃的數(shù)據(jù)和表示各字典筆劃的筆順的筆順數(shù)據(jù),作為表示該字符或符號(hào)的圖形的數(shù)據(jù),所述程序使計(jì)算機(jī)執(zhí)行以下處理筆劃相似度計(jì)算處理,參照所述字典存儲(chǔ)部,求出輸入圖形中所包含的輸入筆劃和一個(gè)字典筆劃或作為連續(xù)書(shū)寫(xiě)的多個(gè)字典筆劃的字典筆劃列之間的相似度;相似度表作成處理,基于由所述筆劃相似度計(jì)算處理求出的相似度,關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和登記在所述字典存儲(chǔ)部中的一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算處理,根據(jù)所述相似度表,確定對(duì)各輸入筆劃提供最大相似度的字典筆劃列,求出對(duì)于所有輸入筆劃的最大相似度的總和,作為最大相似度和;懲罰值減法處理,參照所述相似度表,在應(yīng)降低相似度的預(yù)定的懲罰條件在輸入圖形和登記在所述字典存儲(chǔ)部中的字符或符號(hào)的圖形之間成立時(shí),從所述最大相似度和中減去與所述條件對(duì)應(yīng)的預(yù)定的懲罰值,作為圖形一致度,在預(yù)定的懲罰條件不成立時(shí),將所述最大相似度和作為圖形一致度;以及檢索結(jié)果提示處理,按照所述懲罰值減法處理所求出的圖形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
全文摘要
本發(fā)明的字符檢索裝置在多筆被按照1筆來(lái)輸入的情況下、也可以進(jìn)行基于部分圖形的字符檢索。所述字符檢索裝置具有筆劃相似度計(jì)算部(13),其參照至少登記了字典筆劃和筆順數(shù)據(jù)的筆劃字典存儲(chǔ)部(17),求出輸入筆劃和字典筆劃列之間的相似度;相似度表作成部(14),其關(guān)于一個(gè)輸入圖形中所包含的輸入筆劃和一個(gè)字符或符號(hào)的字典筆劃列的組合,作成相似度表;相似度和計(jì)算部(15),其根據(jù)所述相似度表,求出對(duì)于各輸入筆劃的最大相似度的總和;懲罰值減法部(16),其參照所述相似度表,在預(yù)定的懲罰條件成立時(shí),從最大相似度和中減去預(yù)定的懲罰值來(lái)求出圖形一致度;以及檢索結(jié)果提示部(18),其按照?qǐng)D形一致度的高低順序,提示字符或符號(hào),作為檢索結(jié)果。
文檔編號(hào)G06K9/62GK101017531SQ20061008508
公開(kāi)日2007年8月15日 申請(qǐng)日期2006年5月31日 優(yōu)先權(quán)日2006年2月10日
發(fā)明者秋山勝?gòu)?申請(qǐng)人:富士通株式會(huì)社