專利名稱:圖案列匹配裝置和圖案列匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于文字識別裝置等的圖案列匹配裝置和圖案列匹配方法,該裝置和方法,例如,對由識別結(jié)果文字構(gòu)成的想要匹配的文字列等的第1文字列和被登錄在數(shù)據(jù)庫中的文字列等的第2文字列進行匹配。
以往,在從圖象數(shù)據(jù)識別文字的文字識別裝置中,作為最終要得到文字識別結(jié)果的重要的處理,有圖案列匹配處理。該圖案列匹配處理,對作為由在文字識別中得到的文字候補構(gòu)成的想要匹配的文字列的第1文字列的候補與作為被登錄在數(shù)據(jù)庫(辭典)中的文字列的第2文字列的候補進行匹配。由此,在圖案匹配處理中,確定從文字識別的結(jié)果得到的文字列是否和被登錄在數(shù)據(jù)庫中的某文字列最匹配。
當進行這種圖案列匹配處理的情況下,檢索文字列的候補,根據(jù)在文字識別中得到的文字候補,有各種各樣的組合。另外,對檢索文字列進行匹配的辭典文字列也存在很多候補。
在以往的圖案列匹配處理中,有DP匹配法、采用投票法的匹配處理等。
在上述DP匹配法中,對構(gòu)成檢索文字列的候補的多個文字候補進行一個循環(huán)檢索。但是,在上述DP匹配法中,如果使檢索文字列的識別文字的候補增加為1位、2位、3位,則檢索空間急劇增加,處理變得非常緩慢。
另外,采用投票法的匹配方法是,對于第2文字列的候補的各文字,對每個由識別結(jié)果的文字候補組成的第1文字列的各文字進行投票,選擇得票率最高的第2文字列的候補。但是,在該方法中未考慮文字列的文字排列。因此,在構(gòu)成檢索文字列的文字相同,文字排列不同的情況下,看不出區(qū)別。特別是由于在羅馬字文化圈中文字種類少于26種,所以這種問題更嚴重。
因此,如何高效率且正確地進行多個文字列的候補和多個文字列的候補的匹配處理就是圖案列匹配處理的最大課題。即,期望“高速”并且“考慮文字的排列”的圖案列匹配處理。
另外,在圖案列匹配處理中,干擾是個問題。例如,假設(shè)在構(gòu)成檢測文字列的文字的識別處理中,文字分離失敗,在檢索文字列中包含和單詞不同的文字列。這種情況下,盡管在檢索文字列中包含正確的文字列,但在DP匹配法等的以往的方法中不能匹配的現(xiàn)象很多。
另外,即使在投票法中進行匹配后,也很難知道哪部分匹配,并且很難去掉干擾。
這樣,在匹配處理中,就期望“抗干擾性”高,“干擾位置的特定”高精度。
如上所述,就是期望高速并且高精度、考慮到文字排列的匹配處理,為此,本發(fā)明以提供可以高速并且高精度、考慮到文字排列的匹配處理的圖案列匹配裝置和圖案列匹配方法為目的。
另外,就是期望抗干擾性高,干擾的位置可以特定的匹配處理,為此,本發(fā)明以提供可以進行抗干擾性高,干擾位置可以特定的匹配處理的圖案列匹配裝置和圖案列匹配方法為目的。
本發(fā)明的圖案列匹配裝置,在對分別由多個圖案組成的第1圖案列和第2圖案列進行匹配處理的裝置中,包括投票單元和判定單元,其中的投票單元,在對上述第1圖案列的各圖案和上述第2圖案列的各圖案進行匹配的情況下,根據(jù)匹配的圖案在上述第1圖案列中的位置,以及在上述第2圖案列中的位置進行投票;其中的判定單元,根據(jù)該投票單元的投票結(jié)果,判定匹配結(jié)果。
本發(fā)明的圖案列匹配方法,在對由多個圖案組成的第1圖案列和第2圖案列的匹配處理的方法中,在對上述第1圖案列的各圖案和上述第2圖案列的各圖案進行匹配的情況下,根據(jù)匹配的圖案在上述第1圖案列中的位置,以及在上述第2圖案列中的位置進行投票,根據(jù)投票結(jié)果,判定匹配結(jié)果。
本發(fā)明的其它目的和優(yōu)點將通過以下的描述得以說明,并且通過以下的實施例及其組合得以實現(xiàn)。
下面將根據(jù)附圖及實施例對本發(fā)明的原理進行描述。
圖1是本發(fā)明的實施例的文字識別裝置的概略構(gòu)成的圖。
圖2是文字列匹配處理部分的概略構(gòu)成的方框圖。
圖3是矩陣的例子。
圖4是對矩陣投票例子的圖。
圖5是取矩陣的投影情況的例子的圖。
圖6是取矩陣的投影情況的例子的圖。
圖7是用于說明不考慮干擾情況下的匹配處理的流程圖。
圖8是在檢索文字列之前帶有干擾的情況的投票例子的圖。
圖9用于說明在檢索文字列的前后帶有干擾的情況下的匹配處理的流程圖。
圖10是在檢索文字列之間帶有干擾的情況下的投票例子的圖。
圖11是用于說明在檢索文字列之間帶有干擾的情況下的匹配處理的流程圖。
圖12是文字列匹配處理部分的另一構(gòu)成例子的方框圖。
圖13是用于說明對投票用的存儲器投票的圖。
圖14是用于說明在對投票用的存儲器直接投票情況下的匹配處理的流程圖。
圖15是投票用表數(shù)據(jù)庫的例子的圖。
圖16-19是根據(jù)本發(fā)明進行文字識別的實施例。
圖1是概略地展示本發(fā)明的實施例的文字識別裝置的全體構(gòu)成的圖。文字識別裝置由圖象輸入部分1、區(qū)域檢測部分2、行分離部分3、文字分離部分4、文字識別部分5,以及文字列匹配處理部分(圖案列匹配裝置)6構(gòu)成。
在上述圖象輸入部分1中,輸入圖象。上述區(qū)域檢測部分2,從由圖象輸入部分1輸入的圖象中檢測出記載有文字的區(qū)域。上述行分離部分3,從由區(qū)域檢測部分2檢測出的區(qū)域中分離出文字行。上述文字分離部分4,從由行分離部分3分離出的文字行中分離出每一文字候補。
上述文字識別部分5,對由文字分離部分4分離出的各文字候補進行文字識別處理。在該文字識別處理中,比較文字(圖案)的圖象和被存儲在文字識別辭典5a中的文字(圖案),選擇出識別文字的候補。
上述文字列匹配處理部分6,進行第1文字列和第2文字列的匹配處理。上述第1文字列,是根據(jù)由上述文字識別部分5選擇出的識別文字的候補,選擇出單詞等的每一文字列的識別結(jié)果的文字列。上述第2文字列,是預(yù)先被登錄在數(shù)據(jù)庫(后述)中的文字列。但是,上述文字列匹配處理部分6,對從在文字識別中得到的文字候補中作為想要匹配的文字列的第1文字列和預(yù)先被登錄在數(shù)據(jù)流中的第2文字列進行匹配處理。該文字列的匹配處理的結(jié)果,即第1文字列最匹配的第2文字列被作為識別結(jié)果輸出。
圖2是文字列匹配處理部分6的構(gòu)成的圖。如圖2所示,文字列匹配處理部分6由以下部分構(gòu)成匹配用文字列數(shù)據(jù)庫(文字列匹配用辭典)11、第2文字列輸入部分12、第2文字列存儲器13、第1文字列輸入部分14、第1文字列存儲器15、矩陣制成部分16、矩陣用存儲器17、比較投票部分18、投票結(jié)果計算部分10、計算值用存儲器20、匹配確定部分21、匹配結(jié)果輸出部分22、干擾消除部分23、鄰接計算部分24。
在上述匹配用文字列數(shù)據(jù)庫11中存儲著第2文字列的候補。
從匹配用文字列數(shù)據(jù)庫11向上述第2文字列輸入部分12輸入第2文字列(第2圖案列)的候補。被輸入的第2文字列,被存儲在上述第2文字列存儲器13中。
從由文字識別部分5得到的文字候補中向上述第1文字列輸入部分14輸入識別文字列(第1圖案列)。該被輸入的第1文字列,被存儲在第1文字列存儲器15中。
上述矩陣制成部分16,在矩陣用存儲器17中制成與上述第2文字列和第1文字列對應(yīng)的矩陣。該矩陣被制成如下形式,即在矩陣用存儲器17上把上述第2文字列的各文字(圖案)排列成1行作為橫軸,把上述第1文字列的各文字(圖案)排列成1列作為縱軸。即,當構(gòu)成上述第1文字列的文字數(shù)是m個,構(gòu)成上述第2文字列的文字數(shù)是n個的情況下,m行n列的矩陣被制成在矩陣用存儲器17中。
例如,如圖3所示,當對于被稱為“STRING”的第1文字列,匹配處理被稱為“STRING”的第2文字列的情況下,在矩陣用存儲器17中,制成由與作為第1文字列的STRING的各文字對應(yīng)的行,和與作為第2文字列的STRING的各文字對應(yīng)的列組成的6行6列的矩陣。
上述比較投票部分18,比較第2文字列的各文字和第1文字列的各文字,判定比較后的文字是否匹配。進而,當比較后的文字匹配的情況下,比較投票部分18,對在上述矩陣用存儲器17上的用于矩陣匹配的與第2文字列的文字和第1文字列的文字對應(yīng)的行和列交叉的位置進行投票。另外,在該投票中,也可以用與第1文字列的文字的相似度等對應(yīng)的值進行投票。
例如,如圖4所示,當相對于第2文字列“STRING”來匹配處理第1文字列“STRING”的情況下,相對于第2文字列的“S”匹配第1文字列的“S”。因此,比較投票部分18,投票于矩陣的第1行第1列。進而,比較投票部分18,對于第2文字列的“T”、“R”、“I”、“N”、“G”的各文字,也在第1文字列的匹配的文字交叉的位置,即,第2行第2列、第3行第3列、第4行第4列、第5行第5列、第6行第6列處分別進行投票。
上述投票結(jié)果計算部分19,對由比較投票部分18投票后的矩陣的傾斜方向進行計算。在該投票結(jié)果計算部分19中,用矩陣的傾斜方向的各要素進行規(guī)定的計算。例如,投票結(jié)果計算部分19,在由比較投票部分18對矩陣進行投票后,對于矩陣的行在傾斜45度方向上的每一投影部分進行規(guī)定的計算,把計算值存儲在計算值用存儲器20中。
另外,投票結(jié)果計算部分19,在把計算值存儲在計算值用存儲器20中時,制成用于把計算值存儲在計算值用存儲器20中的線段。該線段,如果假設(shè)第1文字列的長度(第1文字列的文字數(shù))為SEARCHLEN,第2文字列的長度(第2文字列的文字數(shù))為DICLEN,則其長度(計算值的數(shù))為DICLEN+SEARCHLEN-1。該線段,在第1文字列和第2文字列是同一長度(文字數(shù))的情況下,與從矩陣的左下到右上的對角線方向的線段對應(yīng)。在該線段上,存儲在矩陣的右傾斜下方的投票結(jié)果的計算值。
上述匹配確定部分21,根據(jù)被存儲在計算值用存儲器20中的計算值判斷表示第2文字列和第1文字列匹配程度的得分。進而,匹配確定部分21,根據(jù)判斷的得分確定第2文字列和第1文字列是否匹配,由匹配結(jié)果輸出部分22輸出匹配結(jié)果。
上述干擾消除部分23,如后所述,在判斷為在第1文字列上帶有干擾時,從第1文字列中消除干擾。
上述鄰接計算部分24,如后所述,當在第1文字列之間帶有干擾時,對于在被存儲在計算用存儲器20中的計算值中的峰值位置的值,和與峰值位置相鄰的位置的值進行計算。
以下,說明作為對矩陣的投票結(jié)果的計算值。
當相對于第2文字列第1文字列的各文字是相同的位置并且完全一致的情況下,在矩陣中,只對于n行n列的成分投票。因而,如果投票結(jié)果計算部分19在矩陣的傾斜方向上進行計算,則在計算值用存儲器20上,存儲只在線段中間位置上大值的計算值。
例如,如圖5所示,在第2文字列“STRING”和第1文字列“STRING”的情況下,第2文字列的文字和第1文字列的文字位置相同并且完全一致。因而,在矩陣上,只對1行1列、2行2列、3行3列、4行4列、5行5列、6行6列的成分投票。因此,如果投票結(jié)果計算部分19對從矩陣的左上向右下方向(傾斜方向)的成分進行計算,則投票結(jié)果的計算值,只在線段的中央位置增大。例如,是如圖5所示的第2文字列和第1文字列的情況下,如果把各自的投票數(shù)設(shè)置為1,取矩陣的傾斜方向的投影,則投票結(jié)果的計算值,在線段的中間位置上為6。該值和第2文字列的長度相同。
另外,即使第2文字列的各文字和第1文字列的各文字一致,當?shù)?文字列的各文字的位置,和第2文字列的各文字的位置不同時,在計算存儲器20中的線段,并不是只中間位置的計算值增大。
例如,如圖6所示,當在第2文字列“STRING”和第1文字列“GNIRTS”的情況下,雖然第2文字列的各文字和第1文字列的各文字一致,但第1文字列的各文字的位置,和第2文字列的各文字的位置不同。因而,在矩陣中,根據(jù)6行2列、5行2列、4行3列、3行4列、2行5列、1行6列的成分投票。因此,如果投票結(jié)果計算部分19對從矩陣的左上到右下方向(傾斜方向)的成分進行計算,則投票結(jié)果的計算值,分布與線段全體上。
總之,在圖6中,例如,在圖6所示的情況下,如果取矩陣的傾斜方向的投影,則投票結(jié)果的計算值,并不集中在線段的中間位置,而是在線段的全體上廣泛分布計算值。
接著,不考慮干擾,說明使用矩陣進行匹配處理的情況。進而,在以下的說明中,作為與投票結(jié)果有關(guān)的矩陣的傾斜方向中的計算例子,說明取投票數(shù)的投影的情況。
當在第1文字列中不包含干擾的情況下,一致的第1文字列的長度(文字數(shù))SEARCHLEN和第2文字列的長度(文字數(shù))DICLEN是相同的長度(文字數(shù))。這種情況下,該投票結(jié)果計算部分19,把長度(數(shù))是DICLEN+SEARCHLEN-1的線段制成在計算值用存儲器20內(nèi)。
該線段(投影部分),對應(yīng)于從矩陣的左下向右上的對角線方向的各成分。投票結(jié)果計算部分19,在制成在計算值用存儲器20內(nèi)的線段上,對每個右傾斜下方向的各成分進行投票結(jié)果的計算。
另外,當?shù)?文字列的前后不帶干擾時,如果把投影線段的長度設(shè)置成PROJLEN,則是PROJLEN=DICLEN+SEARCHLEN-1。這種情況下,在投影線段的峰值位置的兩側(cè),有DICLEN-1個塊(存儲計算值的位置)。
接著,如上所述,不考慮干擾,參照圖7所示的流程圖說明使用矩陣的匹配處理。
即,第1文字列輸入部分14,輸入第1文字列(步驟1),將其存儲在第1文字列存儲器15中。另一方面,第2文字列輸入部分12,從匹配用文字列數(shù)據(jù)庫11輸入第2文字列(步驟2),將其存儲在第2文字列存儲器13中。于是,矩陣制成部分16,在矩陣用存儲器17上,以第2文字列為橫軸,以第1文字列為縱軸制成矩陣(步驟3)。這樣制成的矩陣,由與第1文字列的各文字對應(yīng)的行,和與第2文字列的各文字對應(yīng)的列構(gòu)成。
如果制成矩陣,則比較投票部分18,判斷相對于第2文字列的各文字第1文字列的各文字是否匹配。即,如果把第1文字列的文字數(shù)設(shè)為m,把第2文字列的文字數(shù)設(shè)為n,則比較投票部分18,順序判斷第1文字列的第i(i=1~m)個文字和第2文字列的第j(j=1~n)個文字是否匹配(步驟4)。
當通過該判斷判斷為第1文字列的第i個文字和第2文字列的第j文字匹配時,比較投票部分18,對矩陣用存儲器17上的矩陣的i行、j列的成分進行投票(步驟5)。
該投票,在第1文字列的文字識別中的識別文字的候補有多個的情況下,可以在文字列的候補中某一個一致的情況下進行投票。另外,也可以投票根據(jù)第1文字列的文字識別中的識別文字的候補的優(yōu)先順序,或者識別文字的相似度加權(quán)后的數(shù)值。另外,也可以在第1文字列的文字識別中的識別文字的相似度在規(guī)定的基準值以下的情況下不投票。
在這樣的投票后,或者在上述步驟3中判斷為不匹配的情況下,判斷是否還有未比較的文字的組合(步驟6)。通過該比較當判斷為還有未比較的文字的組合的情況下,返回上述步驟4再次處理。
當判斷出全部的文字都已比較完的情況下,投票結(jié)果比較部分19,在作為投票結(jié)果得到的矩陣的傾斜方向上進行規(guī)定的計算(步驟7)。這時,投票結(jié)果計算部分19,在計算值用存儲器20中制成與矩陣的傾斜方向的成分對應(yīng)的長度(數(shù))的線段。在被制成在該計算值用存儲器20中的線段上,存儲計算結(jié)果。
如果投票結(jié)果的計算值被存儲在計算值用存儲器20中,則匹配確定部分21,根據(jù)存儲在計算值用存儲器20中的值算出表示第2文字列和第1文字列匹配的程度的得分。
例如,在匹配確定部分21中得到的得分,被作為相似度算出。這種情況下,用第2文字列的長度,或者第1文字列的長度正規(guī)化被存儲在計算值用存儲器20中的值的峰值,把該正規(guī)化后的峰值值作為文字列的匹配的相似度。該相似度,在第2文字列和第1文字列越接近時越高。
匹配確定部分21,判斷基于被存儲在計算用存儲器20中的值的峰值值的得分是否是高得分(步驟8)。是否是高得分的判斷,可以根據(jù)是否在規(guī)定的得分以上判斷,也可以根據(jù)和其它的第2文字列的候補的匹配的得分的比較結(jié)果判斷。
當通過上述判斷判斷為是高得分的情況下,匹配確定部分21,判斷為第1文字列和第2文字列匹配,并輸出匹配結(jié)果(步驟9)。
另外,當匹配確定部分21判斷為非高得分的情況下,改變第2文字列返回上述步驟2,再次執(zhí)行處理。
如上所述,對把第2文字列和第1文字列作為兩條邊的矩陣進行投票,進行投票后的矩陣傾斜方向的計算。根據(jù)該計算結(jié)果的峰值的得分判斷是否匹配。
由此,可以通過簡單的投票進行考慮了文字列的排列的匹配處理,可以防止在第1文字列的各文字的位置和第2文字列的各文字的位置不同的情況下判定為匹配的現(xiàn)象。
接著,說明在第1文字列的前后帶有干擾的情況下使用矩陣的匹配處理。
圖8是用于說明對在文字列“STRING”之前帶有稱為“IT”的2個文字程度的干擾的第1文字列的匹配處理的圖。即,圖8展示,在第1文字列是“ITSTRING”、第2文字列是“STRING”的情況下,被制成的矩陣、對矩陣的投票結(jié)果,以及匹配的投影結(jié)果。
這種情況下,因為第2文字列和第1文字列的長度不同,所以矩陣制成部分16,在矩陣用存儲器17上制成與第1文字列對應(yīng)的縱邊長(與列數(shù)相比行數(shù)多)的矩陣。
作為這樣的第1文字列“ITSTRING”的干擾的“I”以及“T”,和第2文字列“STRING”的“I”以及“T”匹配。因此,比較投票部分18,在矩陣中,在與作為第1文字列的干擾的“I”以及“T”對應(yīng)的行,和與第2文字列的“I”以及“T”對應(yīng)的列交叉的矩陣位置上進行投票。
矩陣制成部分16對應(yīng)第1文字列“ITSTRING”和第2文字列“STRING”制成的矩陣,為8行6列,行數(shù)比列數(shù)多。因此,在計算用存儲器20上,如圖8所示,制成長度(數(shù))是DICLEN+SEARCHLEN-1=13的線段。被存儲在該線段上的值,對應(yīng)相對于矩陣的行方向45度的線段的投影成分的計算值。例如,如圖8所示,在取矩陣投影的情況下,投影結(jié)果計算部分19,對通過第8行第1列和第3行第6列的方向的成分計算線段的投影。
在這樣制成于計算用存儲器20上的線段上,存儲相對于矩陣的右傾斜下方向的成分的投票結(jié)果的計算值。根據(jù)被存儲在該計算值用存儲器20中的值,可以得到峰值的位置離開線段中心的值。這是因為,由于稱為干擾的文字的長度(文字數(shù))附在第1文字列上所以第1文字列的長度比第2文字列的長度長,相當于干擾的部分出現(xiàn)在作為投票結(jié)果的計算值的線段上的緣故。因而,對前后有干擾的第1文字列和第2文字列進行匹配的情況下,可以根據(jù)投票結(jié)果的計算值判斷被包含在第1文字列中的干擾。
即,在作為投票結(jié)果的計算值的線段中根據(jù)從峰值的位置到兩端的長度,就可以判斷干擾在第1文字列的前后的哪一邊,有幾個。
當在作為投票結(jié)果的計算值的線段中從峰值位置到左端部分的長度比(DICLEN-1)長的情況下,判斷為干擾附在第1文字列的前面。另外,當從峰值位置到右端的長度比(DICLEN-1)長的情況下,判斷為干擾附在第1文字列的后面。
例如,當作為投票結(jié)果的計算值取矩陣的傾斜方向的投影的情況下,如果假設(shè)投影線段的長度是PROJLEN、從投影線段的左下到峰值位置的長度是PEAKLEN、第2文字列的長度是DICLEN時,附在第1文字列的前面的干擾的數(shù)NHEAD為NHEAD=PROJLEN-PEAKLEN-(DICLEN-1)另外,附在第1文字列后面的干擾的數(shù)NTAIL為NTAIL=(PEAKLEN-1)-(DICLEN-1)如上所述,當在第1文字列的前后附有干擾時,根據(jù)作為投票結(jié)果的計算值的線段的從峰值的位置到端部的長度就可以判斷干擾的數(shù)。另外,長度比(DICLEN-1)長的一方根據(jù)從峰值的位置向右端還是向左端就可以判斷干擾是附在第1文字列的前面還是附在后面。
接著,如上所述,參照圖9的流程圖說明在第1文字列的前后附有干擾情況下的匹配處理。
即,和上述步驟1~步驟8一樣,第1文字列輸入部分14,以及第2文字列輸入部分12,把第1文字列、第2文字列存儲在第1文字列存儲器15、第2文字列存儲器13中(步驟11、12)。矩陣制成部分16,在矩陣用存儲器17中以第2文字列為橫軸,以第1文字列為縱軸制成矩陣(步驟13)。
而后,比較投票部分18,對于各文字,判斷第2文字列的文字和第1文字列的文字各文字是否匹配,在匹配的情況下,對矩陣進行投票(步驟14、15、16)。
如果有關(guān)全部的文字的組合的比較結(jié)束,則投票結(jié)果計算部分19,根據(jù)投票結(jié)果的矩陣進行傾斜方向的計算(步驟17)。該計算值,被存儲在被制成在計算用存儲器20中的線段上。根據(jù)被存儲在該計算值用存儲器20中的計算值,匹配確定部分21,判斷基于峰值的得分是否是高得分(步驟18)。通過該判斷當判斷為基于峰值的得分不是高得分的情況下,改變第2文字列返回上述步驟12,再次執(zhí)行處理。
另外,當判斷為基于峰值的得分是高得分的情況下,干擾消除部分23,分別計數(shù)從被存儲在計算值存儲器20中的作為計算值的線段的峰值位置到右端以及到左端的長度。干擾消除部分23,根據(jù)是否比這樣計數(shù)的“長度是辭典文字列的長度-1(DICLEN-1)”長,判斷在第1文字列的前后是否有多余的干擾(與干擾對應(yīng)的線段上的計算值)(步驟19)??傊?,當兩端距峰值位置的長度都是DICLEN-1的情況下,判斷為沒有多余的干擾,當距峰值位置的長度比DICLEN-1長的情況下,判斷為有多余的干擾。
當通過該判斷判斷為沒有多余的干擾的情況下,干擾消除部分23,輸出由匹配確定部分21確定的匹配結(jié)果(步驟20)。
另外,當判斷為有多余的干擾的情況下,干擾消除部分23,只根據(jù)多余干擾的數(shù),從第1文字列的前面或者后面消除多余的干擾文字(步驟21),并作為匹配結(jié)果輸出(步驟22)。這時,干擾消除部分23,從距峰值位置的長度比DICLEN-1長的一端,只將比DICLEN-1長的部分作為干擾消除。由此,就可以消除附在第1文字列的前面或者后面的干擾。
如上所述,在與第1文字列和第2文字列對應(yīng)矩陣中對相同文字交叉的位置上進行投票,進行傾斜方向的計算。根據(jù)該計算結(jié)果判斷峰值的位置,根據(jù)峰值判斷匹配的結(jié)果。進而,根據(jù)從峰值位置到右端或者左端的長度是否比“第2文字列的長度-1”長判斷干擾的有無。
由此,即使在第1文字列中包含有干擾,也可以實現(xiàn)高精度的匹配處理,可以判定第1文字列的干擾的有無。
另外,在判斷為有干擾時,判定為從投影的峰值位置到投影的2端的長度(數(shù))中,在比“第2文字列的長度-1”長的一方中包含有干擾,從距峰值位置的長度長的一端,只將長度長的部分判斷為干擾并消除。
由此,作為匹配的結(jié)果可以輸出消除了干擾的文字列,可以提高匹配的精度。
接著,說明在第1文字列中包含干擾的情況下的使用矩陣的匹配處理。
圖10是用于說明在文字列“STRING”之間帶有叫做“N”的干擾的第1文字列的情況下的匹配處理的圖。即,圖1O,展示在第1文字列是“STNRING”、第2文字列是“STRING”的情況下的矩陣、向矩陣的投票結(jié)果,以及投票結(jié)果的計算值。
這種情況下,因為第2文字列和第1文字列的長度不同,所以矩陣制成部分16,和在第1文字列的前后附有干擾的情況一樣,在矩陣用存儲器17中制成與第1文字列對應(yīng)的行比與第2文字列對應(yīng)的列多的矩陣。
作為這樣的第1文字列“STNRING”的干擾的“N”,在第2文字列“STRING”中和“N”匹配。因此,比較投票部分18,在與第1文字列的“N”對應(yīng)的行和與第2文字列的“N”對應(yīng)的列交叉的矩陣的位置上進行投票。
這種情況下,矩陣如圖10所示,為7行6列。因此,在計算用存儲器20中,制成長度為DICLEN+SEARCHLEN-1=12的線段。被存儲在該線段中的值,對應(yīng)于相對矩陣的行方向45度的線段方向的投影成分的計算值。例如,如圖10所示,當取矩陣的投影的情況下,投票結(jié)果計算部分19,對通過第7行第1列和第2行第6列的方向的成分計算線段的投影。
在這樣制成于計算值用存儲器20中的線段上,存儲相對于矩陣的右傾斜下方向的投票結(jié)果的計算值。例如,在把投票值設(shè)置為1,取矩陣的投影的情況下,如圖10所示,在計算值用存儲器20中,得到峰值位置的投票數(shù)(峰值)是4的計算結(jié)果。該峰值,不夠作為辭典文字列的長度(數(shù))的6。這是因為在附于第1文字列之間的干擾的前后,投影的線段上的位置移動了1個的緣故。
另外,在圖10所示的例子中,與干擾后的文字列對應(yīng)的部分的峰值為4,與對應(yīng)于干擾前面的部分的峰值位置相鄰的右上位置的投票數(shù)表示為2。因此,將峰值位置的投票數(shù)和與峰值位置相鄰的位置投票數(shù)相加的值,與第1文字列和第2文字完全匹配時的投票數(shù)(辭典文字列的文字列數(shù))一致。
即,當只允許包含在第1文字列之間的干擾為1個的情況下,鄰接計算部分24,通過在投票結(jié)果的計算值的線段中根據(jù)與峰值位置的計算值和與峰值位置相鄰的位置的計算值進行規(guī)定的計算(再計算)。當該相鄰位置的計算值是高得分的情況下,判斷為第1文字列和第2文字列匹配。這時,判斷為在第1文字列之間夾著1個干擾。
例如,如圖10所示,當作為投票結(jié)果的計算值取矩陣的投影的情況下,如果只允許一個包含在第1文字列之間的干擾,則加算峰值位置的投票數(shù)4和相鄰的位置的投票數(shù)2。由此,峰值位置和與峰值位置相鄰的位置的投票數(shù)為6與第2文字列的文字數(shù)一致。
另外,當增加包含在第1文字列之間的干擾數(shù)的允許范圍的情況下,鄰接計算部分24,根據(jù)峰值位置附近的位置計算值,只對允許范圍的干擾部分進行規(guī)定的再計算。由此,可以在考慮文字列的排列的同時,進行與允許的干擾數(shù)對應(yīng)的匹配處理。
如上所述,當只允許規(guī)定的數(shù)的干擾包含在第1文字列之間的干擾的情況下,根據(jù)允許的干擾的數(shù),對作為投票結(jié)果的計算值的線段的峰值位置和峰值位置附近的位置的值進行再計算,根據(jù)該計算值判定匹配。
由此,即使在第1文字列之間包含干擾的情況下,也可以實現(xiàn)考慮了文字列排列的高精度的匹配處理。
接著,如上所述,參照圖11的流程圖說明在第1文字列之間附有干擾的情況下的匹配處理。
即,和上述步驟1~步驟8一樣,第1文字列輸入部分14,以及第2文字列輸入部分12,把第1文字列、第2文字列存儲在第1文字列存儲器15、第2文字列存儲器13中(步驟31、32)。矩陣制成部分16,在矩陣用存儲器17上以第2文字列作為橫軸,以第1文字列為縱軸制成矩陣(步驟33)。
而后,比較投票部分18,對各文字,判斷第2文字列的文字和第1文字列的文字和各文字是否匹配,在匹配的情況下,對矩陣進行投票(步驟34、35、36)。
如果有關(guān)全部文字組合的比較結(jié)束,則投票結(jié)果計算部分19,根據(jù)投票結(jié)果的矩陣進行傾斜方向的計算(步驟37)。該計算值,被存儲制成于計算用存儲器20中的線段中。根據(jù)被存儲在該計算值用存儲器20中的計算值,匹配確定部分21,判斷基于峰值的得分是否是高得分(步驟38)。
當通過該判斷判斷為是基于峰值的得分是高得分的情況下,匹配確定部分21,輸出匹配結(jié)果(步驟39)。
另外,當判斷為基于峰值的得分不是高得分的情況下,鄰接計算部分24,根據(jù)峰值位置和鄰接的位置的值進行規(guī)定的計算(再計算)(步驟40)。由此,匹配確定部分21,判斷再次計算后的計算值是否是高得分(步驟41)。當通過該判斷判斷為不是高得分的情況下,改變第2文字列返回上述步驟32,再次執(zhí)行處理。
另外,當再次計算峰值位置和相鄰的位置的值的計算值是高得分的情況下,匹配確定部分21,輸出第1文字列和第2文字列匹配這一匹配結(jié)果。與此同時,匹配確定部分21,輸出在第1文字列中包含干擾的結(jié)果(步驟42)。
進而,如上述那樣當根據(jù)峰值位置和相鄰的位置的值進行的再計算后判定為匹配的情況下,還可以判斷包含在第1文字列中的干擾的位置。這種情況下,把未在峰值位置或者成為再計算的對象的峰值位置和相鄰的位置上投票的文字判定為干擾。
如上所述,在第1文字列和第2文字列對應(yīng)的矩陣中在相同的文字交叉的位置進行投票,計算在傾斜方向上的投票結(jié)果。根據(jù)作為該計算結(jié)果的線段判斷峰值位置,根據(jù)峰值位置的值判定匹配的結(jié)果。通過該判定結(jié)果當未顯示峰值位置的值匹配的情況下,根據(jù)峰值位置的值和與峰值位置相鄰的位置的值進行再計算,根據(jù)該再計算的值判定匹配的結(jié)果。
由此,即使在第1文字列之間包含干擾的情況下,也可以實現(xiàn)高精度的匹配處理,可以判定第1文字列的干擾的有無。
接著,說明不對矩陣投票,直接對存儲投票結(jié)果的計算值的線段投票的情況。
圖12是概略地展示直接向存儲投票結(jié)果的計算值的線段投票的情況下的文字列匹配處理部分30的構(gòu)成的圖。
如圖12所示,文字列匹配處理部分30,由第1文字列輸入部分14、第1文字列存儲器15、投票用表數(shù)據(jù)庫31、投票部分32、投票用存儲器33、匹配確定部分21、匹配結(jié)果輸出部分22、干擾消除部分23、鄰接計算部分24構(gòu)成。
上述投票用表數(shù)據(jù)庫31,存儲有辭典文字列。
上述投票部分32,根據(jù)被存儲在上述第1文字列存儲器15中的第1文字列和上述投票用表數(shù)據(jù)庫31的第2文字列,對投票用存儲器33投票。
接著,說明由上述那樣構(gòu)成的文字列匹配處理部分30進行的匹配處理。該文字列匹配處理部分30,不制成矩陣,而根據(jù)第1文字列的各文字和第2文字列的各文字的位置關(guān)系直接對投票用存儲器33投票,判定匹配結(jié)果。
在上述投票用存儲器33中,制成與第1文字列的長度(文字數(shù))以及第2文字列的長度(文字數(shù))對應(yīng)的長度(數(shù))的線段。被制成在該投票用存儲器33中的線段,是與以第1文字列為橫軸、以第2文字列為縱軸的矩陣的向右傾斜下方向的成分對應(yīng)的長度。在該投票用存儲器33上的線段,矩陣的傾斜方向的成分分別被投票在對應(yīng)的位置上。
在矩陣的對角線方向的位置對應(yīng)的投票用存儲器33上的線段上,累積投票的值。這時,被累積在線段上的值,在每次投票時由投票部分32進行規(guī)定的計算后被存儲在投票用存儲器33上。其結(jié)果,在投票結(jié)束時,不通過向矩陣投票,就可以在投票用存儲器33上,直接得到相當于作為對上述矩陣的投票結(jié)果的在上述計算值用存儲器22上的投票結(jié)果的計算值的線段的部分。
在此,當設(shè)第1文字列的長度為SEARCHLEN、第2文字列的長度為DICLEN的情況下,以第1文字列為橫軸、以第2文字列為縱軸的矩陣的右傾斜向下方向的成分,是SEARCHLEN+DICLEN-1個。因此,在投票用存儲器33上,準備SEARCHLEN+DICLEN-1個長度的投票位置。
在第1文字列的第SEARCHP的文字和第2文字列的第DICP的文字匹配的情況下,向投票用存儲器33投票的位置POS是POS=(SEARCHP-DICP)+(DICLEN-1)該投票的位置POS,成為以第1文字列為橫軸、以第2文字列為縱軸的矩陣的SEARCHP行DICP列的成分對應(yīng)的投票用存儲器33上的位置。
例如,當匹配處理第1文字列“STRING”和第2文字列“STRING”的情況下,在投票用存儲器33上,準備作為SEARCHLEN+DICLEN-1=11個長度的投票位置的線段。
如果把該投票用存儲器33的投票位置如圖13所示,設(shè)置成從右開始0、1、2、……、10,則在第1文字列的第i個文字和第2文字列的第j個文字是相同的文字的情況下,對投票用存儲器33的第(j-i)+(DICLEN-1)的投票位置進行投票。
例如,作為第1文字列的第2文字的“T”和作為第2文字列的第2號的“T”匹配。這種情況下,在投票用存儲器33的第POS=(2-2)+(6-1)=5位置上投票。
圖14是用于說明在作為投影線段的投影用存儲器33上直接進行投票的情況下的匹配處理的流程圖。
即,第1文字列輸入部分14,輸入第1文字列(步驟51),將其存儲在第1文字列存儲器15中。另一方面,第2文字列輸入部分12,從匹配用文字列數(shù)據(jù)庫11中輸入第2文字列(步驟52),將其存儲在第2文字列存儲器13中。
而后,如果設(shè)第1文字列的文字數(shù)為m,設(shè)第2文字列的文字數(shù)為n,則投票部分32,判斷第1文字列的第i(i=1~m)個的文字和第2文字列的第j(j=1~n)個文字是否是相同的文字(步驟53)。這時,投票部分32,在投票用存儲器33中設(shè)備m+n-1個長度的投票位置。
投票部分32,在判斷為第1文字列的第i個文字和第2文字列的第j個文字是相同的文字時,根據(jù)上式,在POS=(i-j)+(n-1)所示的投票用存儲器33的投票位置上直接進行投票(步驟54)。這時,向投票用存儲器33的投票,和向上述的矩陣投票的情況一樣,當?shù)?文字列是通過文字識別的識別文字的情況下,進行基于識別文字的相似度,或者識別文字的文字候補的優(yōu)先順序加權(quán)的投票。
另外,在進行投票時,投票部分32,用投票的值,和已經(jīng)存儲在投票用存儲器33中的值進行規(guī)定的計算,改寫被存儲在投票用存儲器33中的值。
如果對全部文字的組合的比較結(jié)束(步驟55),則匹配確定部分21,根據(jù)被存儲在該投票用存儲器33中的投票結(jié)果的值判定第2文字列和第1文字列的匹配程度(步驟56、57)。
這種情況下,匹配確定部分21,根據(jù)投票結(jié)果,可以如上述步驟18~22那樣判定第1文字列的前后的干擾,還可以如上述步驟38~步驟42那樣,判定包含在第1文字列之間的干擾。
如上所述,可以在以第1文字列為橫軸、以第2文字列為縱軸的矩陣的傾斜方向的成分對應(yīng)的線段上直接進行投票,判定匹配。
由此,第1文字列和第2文字列的匹配處理的效率高,可以謀求處理的高速化。
接著,說明通過圖15所示的投票用表數(shù)據(jù)庫31,在使用表查找的投影線段上直接進行投票的匹配處理。
這種情況下,如圖15所示,準備投票用表數(shù)據(jù)庫31。該投票用表數(shù)據(jù)庫31,具有2個表。如圖15所示,左邊的表(第1表)31a與第1文字列對應(yīng),右邊的表(第2表)31b與第2文字列對應(yīng)。
左邊的表31a,例如,如26個字母的情況下的“a”~“z”那樣取與文字種類對應(yīng)的文字(圖案的種類)為縱軸,取在第1文字列中出現(xiàn)的順序位置(第1文字列的開頭的位置)的從第1位置開始到可能的位置為橫軸。
右邊的表31b,取各第2文字列為縱軸,與各第2文字列對應(yīng)的投影線段為橫軸。相對于該各第2文字列設(shè)置的橫軸與上述計算值用存儲器20或者上述投票用存儲器33對應(yīng)。
進而,左邊的表31a和右邊的表31b,以接線連接對應(yīng)的位置。總之,右邊的表31b的各第2文字列的線段的位置與在左邊的表中特定的文字和出現(xiàn)的順序位置對應(yīng)。例如,在圖15中,左邊的表31a的“a”的第1個,和右邊的表31b的第2文字列“AMERICA”的線段的中央位置以及右端的位置連接。
使用上述那樣的表31,以第1文字列為基準,在左邊的表31a中找到相應(yīng)的位置,對該位置連接的右邊的表31b進行投票。這樣,對右邊的表31b的各第2文字列進行與第1文字列的各文字對應(yīng)的投票。
由此,在右邊的表31b中,可以得到各第2文字列對于第1文字列的投票結(jié)果的值。進而,如果在該右邊的表31b中得到各第2文字列的投票結(jié)果的值,則對于右邊的表31b進行從上邊開始的檢索,用和上述順序同樣的順序進行第1文字列和各第2文字列的匹配。
如上所述,預(yù)先使對應(yīng)第1文字列存儲文字的表,和對應(yīng)第2文字列成為投影線段的表相關(guān)聯(lián),從第1文字列直接投票到相對各第2文字列的線段。根據(jù)作為其結(jié)果得到的相對各第2文字列的投票結(jié)果的值,判定和各第2文字列的匹配結(jié)果。
由此,可以謀求在匹配處理中的處理速度的高速化。
另外,在上述實施例中,說明了第1文字列是1個的情況,但在文字識別裝置等中,因為第1文字列可以作為識別文字列的候補得到,所以可以對于第1文字列的各文字加權(quán)后進行投票。
例如,在各文字的識別結(jié)果是以文字候補的順序得到的情況下,根據(jù)識別結(jié)果的順序,可以在投票的得分上加權(quán)后投票。另外,當各文字的識別結(jié)果以相似度得到時,可以投票與各文字的相似度對應(yīng)進行加權(quán)的得分。
這樣,在第1文字列可以作為文字識別的結(jié)果得到的情況下,通過在第1文字列的各文字上進行加權(quán)后的投票,就可以進行高精度的匹配處理。
另外,當?shù)?文字列是識別文字,并且該識別文字的相似度在一定的水平之下的情況下,可以設(shè)置成即使和第2文字列的文字一致也不投票。
由此,在第1文字列由識別文字構(gòu)成時,除了相似度極低的文字外可以進行匹配處理,可以提高和由識別文字構(gòu)成的第1文字列進行匹配處理的精度。
另外,當?shù)?文字列的各文字作為文字識別結(jié)果在每個優(yōu)先位置上得到多個候補的情況下,把第1文字列的各文字作為多個候補,通過判定這些候補和第2文字列的各文字的一致就可以進行匹配。這種情況下,例如,即使和第1個候補不一致,在和第2個候補一致的情況下投票。
由此,在第1文字列由識別文字構(gòu)成時,當作為識別文字的各文字的候補有多個的情況下可以實現(xiàn)考慮了多個文字候補的高精度的匹配處理。
如上所述,比較第1文字列的各文字和第2文字列的各文字,對由與第1文字列的各文字和第2文字列的各文字分別對應(yīng)的2邊組成的矩陣投票,對矩陣傾斜方向的每個成分計算投票結(jié)果的值。根據(jù)該投票結(jié)果的計算值,判定匹配結(jié)果。由此,可以進行考慮文字排列,高速并且高精度地進行抗干擾強的匹配處理。
如上所述,如果采用本發(fā)明,則可以提供可以進行高速且高精度,考慮文字排列,進而,抗干擾性高,干擾位置可以特定的匹配處理的圖案列匹配裝置和圖案列匹配方法和文字列匹配裝置和文字列匹配方法。
權(quán)利要求
1.一種圖案列匹配裝置,用于對分別由多個圖案組成的第1圖案列和第2圖案列進行匹配處理,其特征在于包括投票單元,它用于在對上述第1圖案列的各圖案和上述第2圖案列的各圖案匹配時,對應(yīng)于匹配的圖案的上述第1圖案列中的位置以及上述第2圖案列的位置進行投票;判定單元,它根據(jù)該投票單元的投票結(jié)果,判定匹配結(jié)果。
2.如權(quán)利要求1所述的圖案列匹配裝置,其特征在于進一步包括制成單元,它制成由與上述第1圖案列的各圖案對應(yīng)的行、和與上述第2圖案列的各圖案對應(yīng)的列組成的矩陣,上述投票單元,對于由上述制成單元制成的矩陣,在第1圖案列的圖案和第2圖案列的圖案匹配的情況下,在與匹配的圖案對應(yīng)的行和列的交叉位置上投票,上述判定單元,根據(jù)用上述投票單元在上述矩陣上投票的投票結(jié)果,判定匹配結(jié)果。
3.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于進一步包括計算單元,它對用上述投票單元投票的矩陣,計算與在傾斜方向上的投票結(jié)果有關(guān)的計算值,上述判定單元,根據(jù)用上述計算單元計算出的投票結(jié)果的計算值,判定匹配結(jié)果。
4.如權(quán)利要求1所述的圖案列匹配裝置,其特征在于進一步包括存儲器,它用于在和上述第2圖案列的圖案匹配的情況下,存儲由與上述第1圖案列的各圖案對應(yīng)的行和與上述第2圖案列的各圖案對應(yīng)的列組成的矩陣在傾斜方向的計算值,根據(jù)上述投票單元投票的值,進行與上述矩陣的傾斜方向有關(guān)的計算,并將計算值存儲在上述存儲器中,在上述投票單元的投票結(jié)束時,根據(jù)被存儲在上述存儲器中的計算值判定匹配結(jié)果。
5.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于上述計算裝置包括用正規(guī)化與投票結(jié)果有關(guān)的計算值后的值進行計算的單元,上述判定單元包括根據(jù)與被正規(guī)化的投票結(jié)果有關(guān)的計算值判定匹配結(jié)果的單元。
6.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于上述判定單元包含,根據(jù)上述計算單元的計算值,和上述第1圖案列的長度,和第2圖案列的長度,判定上述第2圖案列與上述第1圖案列的哪部分匹配的單元。
7.如權(quán)利要求1所述的圖案列匹配裝置,其特征在于進一步包括第1表,它特定出現(xiàn)在上述第1圖案列中的圖案種類,和在上述第1圖案列中出現(xiàn)的圖案的順序;第2表,與用上述第1表特定的圖案的種類和出現(xiàn)的順序?qū)?yīng),對各種第2圖案列的每一列,存儲與上述矩陣的傾斜方向的投票結(jié)果有關(guān)的計算值,上述投票單元,對于上述第1圖案列的各圖案,在與用上述第1表特定的圖案的種類和出現(xiàn)的順序固定對應(yīng)的上述第2表上進行投票,上述判定單元,根據(jù)用上述投票單元投票的上述第2表判定匹配的結(jié)果。
8.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于上述第1圖案是由多個文字組成的第1文字列,上述第2文字列是由多個文字列組成的第2文字列。
9.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于上述第1文字列是由有相似度的識別文字組成的檢索文字列,上述第2文字列是辭典的辭典文字列的文字,上述投票單元根據(jù)上述第1文字列的識別文字的相似度進行投票。
10.如權(quán)利要求2所述的圖案列匹配裝置,其特征在于上述第1圖案列是由具有優(yōu)先順序的文字候補組成的檢索文字列,上述第2文字列是辭典的辭典文字列的文字,上述投票單元進行基于上述第1文字列的文字候補的優(yōu)先順序加權(quán)后的投票。
11.一種圖案列匹配方法,用于進行由多個圖案組成的第1圖案列和第2圖案列的匹配處理,其特征在于在上述第1圖案列的各圖案和上述第2圖案列的各圖案進行匹配時,對應(yīng)于匹配的圖案的上述第1圖案列中的位置以及上述第2圖案列中的位置進行投票,根據(jù)該投票結(jié)果,判定匹配結(jié)果。
12.如權(quán)利要求11所述的圖案列匹配方法,其特征在于進一步制成由與上述第1圖案列的各圖案對應(yīng)的行、和與上述第2圖案列的各圖案對應(yīng)的列組成的矩陣,上述投票,對于被制成的矩陣,在和第2圖案列的圖案匹配的情況下,在與匹配的圖案對應(yīng)的行和列交叉的位置上進行,上述判定,根據(jù)被投票在上述矩陣上的投票結(jié)果,判定匹配結(jié)果。
13.如權(quán)利要求12所述的圖案列匹配方法,其特征在于進一步對上述被投票的矩陣,計算與傾斜方向中的投票結(jié)果有關(guān)的計算值,上述判定,根據(jù)上述投票結(jié)果的計算值,判定匹配結(jié)果。
14.如權(quán)利要求11所述的圖案列匹配方法,其特征在于對上述投票的值,在進行了與上述矩陣的傾斜方向有關(guān)的計算后,在與上述第2圖案列的圖案匹配時,被存儲在存儲由與上述第1圖案列的各圖案對應(yīng)的行、和與上述第2圖案列的各圖案對應(yīng)的列組成的矩陣的在傾斜方向上的計算值的存儲器中,在上述投票結(jié)束時,根據(jù)被存儲在上述存儲器中的計算值判定匹配。
15.如權(quán)利要求12所述的圖案列匹配方法,其特征在于上述計算,用正規(guī)化與投票結(jié)果有關(guān)的計算值后的值計算,上述判定,根據(jù)與被正規(guī)化的投票結(jié)果有關(guān)的計算值判定匹配結(jié)果。
16.如權(quán)利要求12所述的圖案列匹配方法,其特征在于上述判定,根據(jù)上述計算的計算值,和上述第1圖案列的長度,和第2圖案列的長度,判定在上述第2圖案列中與上述第1圖案列的哪部分匹配。
17.如權(quán)利要求11所述的圖案列匹配方法,其特征在于上述投票,對上述第1圖案列的各圖案,在與用第1表特定的圖案的種類和出現(xiàn)的順序固定對應(yīng)的第2表上投票,上述第1表,是特定出現(xiàn)在上述第1圖案列上的圖案的種類、和在上述第1圖案列中出現(xiàn)的圖案的順序的表,上述第2表,是與在上述第1表中特定的圖案的種類和出現(xiàn)的順序固定對應(yīng)的、對各個第2圖案列的每一列存儲與上述矩陣的傾斜方向的投票結(jié)果有關(guān)的計算值的表,上述判定,根據(jù)上述被投票的上述第2表,判定匹配結(jié)果。
18.如權(quán)利要求12所述的圖案列匹配方法,其特征在于上述第1圖案是由多個文字組成的第1文字列,上述第2圖案列是由多個文字組成的第2文字列。
19.如權(quán)利要求12所述的圖案列匹配方法,其特征在于上述第1圖案列是由具有相似度的識別文字組成的檢索文字列,上述第2圖案列是根據(jù)辭典的辭典文字列的文字,上述投票對應(yīng)上述第1文字列的識別文字的相似度進行投票。
20.如權(quán)利要求12所述的圖案列匹配方法,其特征在于上述第1圖案列是由具有優(yōu)先順序的文字候補組成的檢索文字列,上述第2圖案列是根據(jù)辭典的辭典文字列的文字,上述投票進行基于上述第1文字列的文字候補的優(yōu)先順序加權(quán)后的投票。
全文摘要
本發(fā)明通過比較檢索文字列的各文字和辭典文字列的各文字,對由與檢索文字列的各文字和辭典文字列的各文字對應(yīng)的兩條邊組成的矩陣進行投票,對矩陣傾斜方向的每個成分計算投票結(jié)果的值。根據(jù)該投票結(jié)果的計算值,判定匹配結(jié)果。由此,可以考慮文字排列,高速并且高精度地進行抗干擾強的匹配處理。
文檔編號G06T7/00GK1284686SQ0012253
公開日2001年2月21日 申請日期2000年8月4日 優(yōu)先權(quán)日1999年8月6日
發(fā)明者赤木琢磨 申請人:株式會社東芝