專利名稱:圖形識(shí)別方法及圖形識(shí)別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖形識(shí)別方法、字符(character)識(shí)別方法、圖形識(shí)別程序、字符識(shí) 別程序、圖形識(shí)別裝置以及字符識(shí)別裝置。
背景技術(shù):
以往,針對(duì)圖形識(shí)別方法提出了各種方案。例如,作為識(shí)別由多個(gè)類目 (Category)組成的圖形的技術(shù),有希望使用各類目的識(shí)別結(jié)果為正確結(jié)果的概率來提高 識(shí)別精度的圖形識(shí)別方法。作為這種圖形識(shí)別方法的一例,在IEEE Trans.Pattern Analysis and Machine Intelligence, vol.11, no.l, pp.68-83, Jan.l989(非專利文獻(xiàn) 1)中,公開了這 樣的方案,即把用先驗(yàn)概率(priorprobability)除后驗(yàn)概率(posteriorprobability)的值作為 評(píng)價(jià)值,把評(píng)價(jià)值為最大的候補(bǔ)作為下一個(gè)檢索對(duì)象。而且,把后驗(yàn)概率寫為P(c|x)。 定義后驗(yàn)概率P(c|x)表示以通過識(shí)別處理而得到的輸出χ為條件,候補(bǔ)c為正確結(jié)果的概 率。此外,設(shè)先驗(yàn)概率寫為P (C)。定義先驗(yàn)概率P (c)表示在未進(jìn)行識(shí)別處理的階段, 候補(bǔ)c為正確結(jié)果的概率。以往,作為要把各類目的相似度變換為后驗(yàn)概率的嘗試,有在日本特登2739950 號(hào)公報(bào)上的方法。在日本特登2739950號(hào)公報(bào)上公開的方法是,當(dāng)賦予了某個(gè)類目Cj的 相似度Sj的情況下,求作為類目Cj的后驗(yàn)概率P(CjIsj)。但是,在日本特登2739950號(hào) 公報(bào)上公開的方法,如上所述,由于只考慮一個(gè)類目的相似度sj,因而很難提高精度。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)方式的目的在于提供一種能夠高效率地進(jìn)行高精度的圖形識(shí)別的 圖形識(shí)別方法、字符識(shí)別方法、圖形識(shí)別程序、字符識(shí)別程序、圖形識(shí)別裝置以及字符 識(shí)別裝置?!N識(shí)別輸入圖形是多個(gè)類目中的哪個(gè)類目的圖形識(shí)別方法,對(duì)各類目計(jì)算 和輸入圖形的相似度(33),根據(jù)表示每個(gè)類目的相似度和第1評(píng)價(jià)值的關(guān)系的第1表 (42),把上述計(jì)算出的針對(duì)各類目的輸入圖形的相似度變換為第1評(píng)價(jià)值(34),用上述 計(jì)算出的針對(duì)各類目的第1評(píng)價(jià)值和存儲(chǔ)在表示各類目的先驗(yàn)概率的第2表(45)中的每 個(gè)類目的先驗(yàn)概率來計(jì)算第2評(píng)價(jià)值(35),選擇上述計(jì)算出的第2評(píng)價(jià)值為最大的類目 (36)。
圖1是表示實(shí)施例中的紙片類處理裝置的分類機(jī)的概略構(gòu)成的圖。
圖2是表示字符識(shí)別部的構(gòu)成例子的圖。圖3是表示相似度存儲(chǔ)部的構(gòu)成例子的圖。圖4是表示劃分類目的第1評(píng)價(jià)值表的構(gòu)成例子的圖。圖5是表示正確結(jié)果 分布表的構(gòu)成例子的圖。圖6是表示非正確結(jié)果分布表的構(gòu)成例子的圖。
具體實(shí)施例方式以下,參照附圖詳細(xì)說明本實(shí)施例。首先,概略說明作為本實(shí)施例的圖形識(shí)別處理。作為本實(shí)施例的圖形識(shí)別處理是用于判別輸入圖形是多個(gè)類目中的哪個(gè)類目的 處理。成為識(shí)別對(duì)象的圖形只要是可以計(jì)算出與登記在識(shí)別用的辭典中的辭典圖形(類 目)的相似度(或者,稱之為可靠度、距離、評(píng)價(jià)值等的表示類目的可能性(probability) 的值)的圖形即可。例如,作為設(shè)置為識(shí)別對(duì)象的圖形,假設(shè)是在字符識(shí)別處理中的字 符圖形,或者,基于臉部圖像等生物信息的生物認(rèn)證處理中的生物信息的特征圖形等。例如,在識(shí)別記載于紙片類上的字符信息的OCR處理中,利用從輸入圖像中 檢測(cè)的字符圖形與登記在辭典數(shù)據(jù)庫19中的各字符圖形(辭典數(shù)據(jù))的相似度來識(shí)別字 符。在這種字符識(shí)別處理等的圖形識(shí)別處理中,根據(jù)相似度來判別輸入圖形是多個(gè)類目 (辭典數(shù)據(jù))中的哪個(gè)類目。在本實(shí)施例中說明的圖形識(shí)別方法是適用于判定輸入圖形是多個(gè)類目中的哪個(gè) 類目的識(shí)別處理的方法。此外,在本實(shí)施例中說明的圖形識(shí)別方法中,存儲(chǔ)針對(duì)各類目 的輸入圖形的相似度以及針對(duì)輸入圖形的可能的類目,通過計(jì)算以各類目的相似度為條 件的后驗(yàn)概率(以后詳細(xì)說明),高效率并且高速地得到高精度的圖形識(shí)別結(jié)果。以下,作為圖形識(shí)別處理的應(yīng)用例子說明具有字符識(shí)別部的紙片類處理裝置, 上述字符識(shí)別部識(shí)別記載在紙片類上的地址信息等的字符。圖1是表示作為本實(shí)施例的紙片類處理裝置的分類機(jī)1的概略構(gòu)成的圖。該分類機(jī)1如圖1所示,由分類機(jī)主體(主體)3和VCS(視頻(video)編碼系 統(tǒng))4構(gòu)成。上述分類機(jī)主體3是通過地址信息等對(duì)紙片類進(jìn)行分類處理的單元。此外, 上述VCS4通過操作者的編碼操作而輸入不能利用上述分類機(jī)主體3識(shí)別地址信息的紙片 類的地址信息。上述分類機(jī)主體3如圖1所示,在前面設(shè)置操作面板10。關(guān)于上述操作面板 10,操作者(操作員)用來指定處理模式或處理開始,或者顯示分類機(jī)的動(dòng)作狀態(tài)等。上述分類機(jī)主體3具有提供紙片類的供給部。收納在供給部11中的紙片類記載 有郵政編碼、地址、收件人姓名等字符信息(以下,只稱為地址信息)。上述供給部11 以規(guī)定的間隔一份一份地將紙片類提供給主搬運(yùn)路12。此外,在提供給上述供給部11的 紙片類中,除了地址信息外,有的還記載有表示紙片類的收件人地址姓名信息的收件人 地址姓名條形碼,或者,記載有在以后說明的OCR處理中賦予不能進(jìn)行收件人地址姓名 信息的字符識(shí)別的紙片類的作為識(shí)別信息的ID條形碼。在主搬運(yùn)路12上設(shè)置BCR(條形碼閱讀器)13、掃描儀14、BCW(條形碼記錄 器)部15,以及分類部16。這些部分根據(jù)與對(duì)各紙片類的搬運(yùn)狀態(tài)等的處理狀態(tài)相對(duì)應(yīng)的分類控制部17進(jìn)行的控制,而進(jìn)行動(dòng)作。上述BCR13是讀取在主搬運(yùn)路12上搬運(yùn)的紙片類上打字的ID條形碼或者收件人地址姓名條形碼等的條形碼的單元。上述BCR13具有讀取條形碼的圖像的讀取部;識(shí) 別讀取圖像中的條形碼的識(shí)別部。由上述BCR13得到的條形碼的識(shí)別結(jié)果被提供給分類 控制部17。上述掃描儀14讀取主搬運(yùn)路12上的紙片類的圖像。上述掃描儀14以光學(xué)方式 讀取紙片類上的圖像。上述掃描儀14與字符識(shí)別部18連接。上述字符識(shí)別部18參照 登記在辭典數(shù)據(jù)庫(DB) 19中的辭典數(shù)據(jù),從由上述掃描儀14讀取的圖像中識(shí)別地址信 息。上述字符識(shí)別部18把地址信息的識(shí)別結(jié)果提供給分類控制部17。S卩,上述掃描儀 14、字符識(shí)別部18以及辭典數(shù)據(jù)庫構(gòu)成字符識(shí)別裝置(OCR)。另外,有關(guān)上述字符識(shí) 別部18的構(gòu)成在以后詳細(xì)說明。上述BCW15根據(jù)需要在紙片類上印刷ID條形碼,或者,印刷收件人地址姓名 條形碼。例如,上述BCW15在能夠用上述字符識(shí)別部18識(shí)別地址信息的紙片類上印刷 把作為識(shí)別結(jié)果的地址信息條形碼化的收件人地址姓名條形碼。此外,上述BCW15在 不能用上述字符識(shí)別部18識(shí)別收件人地址姓名信息的紙片類上印刷ID條形碼,該ID條 形碼是將從分類控制部17賦予的識(shí)別信息(書信(Ietter)ID)條形碼化后的碼。即,上述 BCW15在能夠識(shí)別地址信息的紙片類上將其識(shí)別結(jié)果作為收件人地址姓名條形碼印刷, 在不能識(shí)別地址信息的紙片類上印刷ID條形碼。S卩,上述收件人地址姓名條形碼是表示作為OCR識(shí)別結(jié)果的收件人地址姓名信 息自身的條形碼,上述ID條形碼是表示用于識(shí)別該紙片類的識(shí)別信息的條形碼。用上述 ID條形碼表示的紙片類的識(shí)別信息是用于把在上述VCS4上通過鍵盤輸入的收件人地址 姓名信息和紙片類對(duì)應(yīng)起來的信息。換句話說,印刷有上述ID條形碼的紙片類是成為由 VCS4處理的處理對(duì)象的紙片類。在該BCW15的紙片類搬運(yùn)方向的下游一側(cè)設(shè)置分類部16,該分類部16根據(jù) 地址信息對(duì)紙片類進(jìn)行分類。該分類部16由劃分為多個(gè)段、多個(gè)列的多個(gè)分類容器 (pocket)(未圖示)構(gòu)成。各容器與每個(gè)分類目標(biāo)對(duì)應(yīng)地設(shè)定,根據(jù)地址信息或者機(jī)械代 碼將紙片類順序地集聚在與地址信息對(duì)應(yīng)的容器中。此外,在分類部16中設(shè)置集聚不能 識(shí)別分類目標(biāo)的紙片類的VCS排除容器(未圖示)。集聚在該VCS排除容器中的紙片類 在利用VCS4輸入了地址信息后,被再次提供給上述供給部11,根據(jù)該紙片類的ID代碼 和利用上述VCS4輸入的地址信息進(jìn)行再次分類。以下,說明VCS4。上述VCS4如圖1所示,由圖像存儲(chǔ)分配裝置21以及多個(gè)視頻編碼終端(以下, 稱為VCD) 22等構(gòu)成。上述圖像存儲(chǔ)分配裝置21進(jìn)行處理,把不能用上述分類機(jī)主體3識(shí)別地址信息 的紙片類的圖像分發(fā)給各VCD22,把利用上述各VCD22的地址信息的鍵盤輸入結(jié)果回送 給上述分類機(jī)主體3。上述圖像存儲(chǔ)分配裝置21連接上述分類機(jī)主體3中的掃描儀14、 分類控制部17以及字符識(shí)別部18。上述圖像存儲(chǔ)分配裝置21例如由具有圖像控制部以 及存儲(chǔ)部的個(gè)人計(jì)算機(jī)(PC)構(gòu)成。上述圖像存儲(chǔ)分配裝置21把不能用上述字符識(shí)別部 18識(shí)別地址信息的紙片類的圖像與該紙片類的識(shí)別信息(書信ID)對(duì)應(yīng)起來存儲(chǔ),把存儲(chǔ)的紙片類的圖像分發(fā)給各VCD22。上述VCD22具有顯示器(顯示部)或者鍵盤(操作部)等。上述VCD22例如 由PC構(gòu)成。在上述VCD22中在顯示器中顯示從上述圖像存儲(chǔ)分配裝置21分配的紙片 類的圖像。在顯示紙片類的圖像的狀態(tài)下,在上述VCD22中,操作者通過鍵盤輸入地址 信息。把利用上述VCD22的輸入結(jié)果與該紙片類的識(shí)別信息(ID代碼)對(duì)應(yīng)起來回送給 上述圖像存儲(chǔ)分配裝置21。此外,上述圖像存儲(chǔ)分配裝置21把來自上述VCD22的輸入 結(jié)果和該紙片類的識(shí)別信息(ID代碼)對(duì)應(yīng)起來提供給分類控制部17。由此,在分類控 制部17中,根據(jù)賦予紙片類的ID條形碼而得到鍵盤輸入的地址信息。
以下,說明字符識(shí)別部18。 圖2是表示字符識(shí)別部18的構(gòu)成例子的圖。如圖2所示,字符識(shí)別部18具有圖像輸入部31、圖形檢測(cè)部32、相似度計(jì)算 部33、第1評(píng)價(jià)值計(jì)算部34、第2評(píng)價(jià)值計(jì)算部35、最大值選擇部36、識(shí)別結(jié)果輸出部 37、相似度存儲(chǔ)部41、劃分類目的第1評(píng)價(jià)值表42、正確結(jié)果分布表43、非正確結(jié)果分 布表44,以及先驗(yàn)概率表45等。字符識(shí)別部18由具有控制部、存儲(chǔ)部以及輸入輸出接 口等的硬件(處理基板)構(gòu)成。即,字符識(shí)別部18通過控制部執(zhí)行存儲(chǔ)在存儲(chǔ)部中的程 序,具有和實(shí)現(xiàn)各種處理功能的計(jì)算機(jī)同樣的構(gòu)成。例如,上述圖像輸入部31、圖形檢測(cè)部32、相似度計(jì)算部33、第1評(píng)價(jià)值計(jì)算 部34、第2評(píng)價(jià)值計(jì)算部35、最大值選擇部36以及識(shí)別結(jié)果輸出部37等是通過計(jì)算機(jī) (處理基板)的控制部執(zhí)行各種程序而實(shí)現(xiàn)的功能,上述相似度存儲(chǔ)部41、劃分類目的第 1評(píng)價(jià)值表42、正確結(jié)果分布表43、非正確結(jié)果分布表44以及先驗(yàn)概率表45等由計(jì)算機(jī) (處理基板)的存儲(chǔ)部實(shí)現(xiàn)。另外,在本實(shí)施例的字符識(shí)別部18中,雖然設(shè)想是通過執(zhí) 行圖形識(shí)別程序來實(shí)現(xiàn)上述各部分的功能的,但字符識(shí)別部18也可以分別用硬件構(gòu)成上 述各部分的一部分或者全部。上述圖像輸入部31是用于輸入成為字符識(shí)別對(duì)象的圖像的接口。上述圖像輸入 部31輸入由上述掃描儀14讀取的紙片類的圖像數(shù)據(jù)。上述圖形檢測(cè)部32從輸入的圖像 中檢測(cè)輸入圖形(作為識(shí)別對(duì)象的字符圖形)的候補(bǔ)。檢測(cè)各類目(層面)的圖形(單 詞)候補(bǔ)。上述圖形檢測(cè)部32例如從輸入圖像中切割出如記載地址信息那樣的地址區(qū) 域,從地址信息中切割出字符串,從字符串中切割出字符,把切割出的字符的圖形作為 輸入字符圖形。上述相似度計(jì)算部33計(jì)算從輸入的圖像中得到的輸入圖形和各類目的相似度。 上述相似度計(jì)算部33計(jì)算由上述圖形檢測(cè)部32選擇出的輸入圖形(輸入字符圖形)和作 為登記在辭典數(shù)據(jù)庫19中的各類目的各字符(辭典字符圖形)的相似度。上述相似度計(jì) 算部33把計(jì)算出的針對(duì)各類目的相似度存儲(chǔ)在相似度存儲(chǔ)部41中。上述第1評(píng)價(jià)值計(jì)算部34計(jì)算針對(duì)各類目的第1評(píng)價(jià)值。在此,上述第1評(píng)價(jià) 值計(jì)算部34參照上述劃分類目的第1評(píng)價(jià)值表42,把由上述相似度計(jì)算部33計(jì)算出的輸 入字符圖形的針對(duì)各類目(辭典字符圖形)的相似度變換為第1評(píng)價(jià)值。上述第2評(píng)價(jià)值計(jì)算部35計(jì)算針對(duì)各類目的第2評(píng)價(jià)值。在此,上述第2評(píng)價(jià) 值計(jì)算部35把根據(jù)先驗(yàn)概率表45而得到的針對(duì)各類目(辭典字符圖形)的先驗(yàn)概率和由 上述第1評(píng)價(jià)值計(jì)算部34得到的針對(duì)各類目的第1評(píng)價(jià)值相乘,計(jì)算針對(duì)各類目的第2評(píng)價(jià)值。上述 最大值選擇部36選擇由第2評(píng)價(jià)值計(jì)算部35計(jì)算出的針對(duì)各類目的第2評(píng) 價(jià)值中為最大的第2評(píng)價(jià)值。在此,上述最大值選擇部36選擇作為第2評(píng)價(jià)值為最大值 的類目的辭典字符圖形。這種情況下,可以將第2評(píng)價(jià)值為最大的字符(辭典字符圖形) 作為對(duì)輸入字符圖形的字符識(shí)別結(jié)果而獲得。上述識(shí)別結(jié)果輸出部37是輸出作為字符識(shí)別部18的地址信息的識(shí)別結(jié)果的單 元。在此,上述識(shí)別結(jié)果輸出部37通過綜合評(píng)價(jià)由上述最大值選擇部36選擇出的各字 符,輸出針對(duì)紙片類的地址信息的識(shí)別結(jié)果。上述字符識(shí)別部18是識(shí)別在紙片類的分類 處理中使用的地址信息的單元。因此,識(shí)別結(jié)果輸出部37也可以判別由最大值選擇部36 選擇出的字符是否可以作為用于正確進(jìn)行該紙片類的分類的地址信息采用。例如,識(shí)別 結(jié)果輸出部37也可以根據(jù)由最大值選擇部36作為最大值而選擇出的針對(duì)類目的第2評(píng)價(jià) 值是否大于等于規(guī)定的閾值來判定該識(shí)別結(jié)果是否可以作為正確的識(shí)別結(jié)果采用,也可 以根據(jù)由最大值選擇部36選擇出的針對(duì)類目的相似度是否大于等于規(guī)定的閾值來判定該 識(shí)別結(jié)果是否可以作為正確的識(shí)別結(jié)果采用。上述相似度存儲(chǔ)部41將由上述相似度計(jì)算部33計(jì)算出的針對(duì)各類目的相似度與 各紙片類的識(shí)別信息對(duì)應(yīng)起來存儲(chǔ),并且將由VCS4鍵盤輸入的信息作為正確結(jié)果的類目 (正確的地址信息)與紙片類的識(shí)別信息對(duì)應(yīng)起來存儲(chǔ)。存儲(chǔ)在上述相似度存儲(chǔ)部41中 的信息被用于構(gòu)筑正確結(jié)果分布表43、非正確結(jié)果分布表44以及先驗(yàn)概率表45。圖3是表示相似度存儲(chǔ)部41的構(gòu)成例子的圖。在圖3所示的例子中,在相似度存儲(chǔ)部41中針對(duì)用圖形號(hào)碼識(shí)別的各輸入圖形 存儲(chǔ)表示正確結(jié)果的類目的信息,以及表示各類目(辭典圖形)的相似度的信息。針對(duì) 各輸入圖形的各類目的相似度是用上述的相似度計(jì)算部33計(jì)算出的值。因而,當(dāng)相似度 計(jì)算部33每次計(jì)算針對(duì)某個(gè)輸入圖形的各類目(辭典圖形)的相似度時(shí),在相似度存儲(chǔ) 部41中存儲(chǔ)表示針對(duì)該輸入圖形的各類目的相似度的信息。進(jìn)而,在相似度存儲(chǔ)部41 中還存儲(chǔ)表示針對(duì)輸入圖形的正確結(jié)果的類目的信息。在上述分類機(jī)1中,假設(shè)操作者用VCS4輸入的信息(VCS信息)是表示針對(duì) 輸入圖形的正確結(jié)果的類目的信息。這種情況下,對(duì)于與各類目的相似度對(duì)應(yīng)的輸入圖 形,進(jìn)一步存儲(chǔ)表示正確結(jié)果的類目的信息。即,在上述分類機(jī)1中,在包含由字符識(shí) 別部18進(jìn)行的識(shí)別處理的在分類機(jī)主體3內(nèi)的對(duì)紙片類的處理之后,進(jìn)行利用VCS4的 紙片類的地址信息的鍵盤輸入。因此,相似度存儲(chǔ)部41在利用字符識(shí)別部18的字符識(shí) 別處理(在分類機(jī)主體3中的紙片類處理)時(shí)登記針對(duì)輸入圖形的各類目的相似度,在其 后的VCS處理(在VCS4中的鍵盤輸入的處理)時(shí)登記針對(duì)用圖形號(hào)碼識(shí)別的各輸入圖 形的正確結(jié)果的類目。例如,在圖3所示的例子中,表示針對(duì)圖形號(hào)碼“1”的輸入圖形,關(guān)于在相似 度計(jì)算部33中計(jì)算出的各類目的相似度,類目A的相似度是“585”,類目B的相似度 是“702”,類目C的相似度是“893”,用VCS4確定的正確結(jié)果的類目是類目“C”。根據(jù)上述那樣的相似度存儲(chǔ)部41,則對(duì)各輸入圖形,可以很容易地提取在字符 識(shí)別處理時(shí)得到的各類目的相似度和用VCS確定的正確結(jié)果的類目。上述劃分類目的第1評(píng)價(jià)值表42是表示各類目的相似度與第1評(píng)價(jià)值的關(guān)系的表。存儲(chǔ)在劃分類目的第1評(píng)價(jià)值表42中的值是根據(jù)存儲(chǔ)在正確結(jié)果分布表43以及非正確結(jié)果分布表44中的信息而計(jì)算的值。而且,第1評(píng)價(jià)值相當(dāng)于以后說明的式(13) 中的 R(Sc|c)、R(Sc' |c')。圖4是表示劃分類目的第1評(píng)價(jià)值表42的構(gòu)成例子的圖。在圖4所示的構(gòu)成例 子中,表示用100刻度分割相似度的頻度,但并不限于此,在劃分類目的第1評(píng)價(jià)值表42 中,也可以用任意的范圍分割相似度表示頻度。在圖4表示的例子中,例如,對(duì)于類目 A表示相似度是1000 900時(shí)的第1評(píng)價(jià)值是“322”,相似度是900 800時(shí)的第1評(píng) 價(jià)值是“95”,相似度是800 700時(shí)的第1評(píng)價(jià)值是“2.36”,相似度是700 600時(shí) 的第1評(píng)價(jià)值是“0.21”。正確結(jié)果分布表43是表示針對(duì)成為正確結(jié)果的類目的相似度分布的表。在正確 結(jié)果分布表43中存儲(chǔ)將針對(duì)成為正確結(jié)果的類目的輸入圖形的相似度合計(jì)后的數(shù)據(jù)。例 如,正確結(jié)果分布表43從相似度存儲(chǔ)部41中讀出成為正確結(jié)果的類目的相似度,并對(duì)每 種類目合計(jì)讀出的相似度,由此構(gòu)筑為表示針對(duì)每個(gè)類目的成為正確結(jié)果的圖形的相似 度的頻度值的表。而且,成為正確結(jié)果的相似度的頻度值與在以后說明的式(13)中的 P(Sc|c)對(duì)應(yīng),通過用合計(jì)值除頻度值而成為和P(Sc|c)相同的值。圖5是表示正確結(jié)果分布表43的構(gòu)成例子的圖。在圖5所示的構(gòu)成例子中,雖 然表示用100刻度分割了相似度的頻度,但并不限于此,也可以用任意范圍分割相似度 表示頻度。在圖5所示的例子中表示,例如,對(duì)于類目A,成為正確結(jié)果的數(shù)量是4414, 其中相似度是1000 900時(shí)是“310”,相似度是900 800時(shí)是“3541”,相似度是 800 700時(shí)是“512”,相似度是700 600時(shí)是“51”。非正確結(jié)果分布表44是表示針對(duì)成為非正確結(jié)果的類目的相似度的分布布的 表。在非正確結(jié)果分布表44中存儲(chǔ)對(duì)針對(duì)成為非正確結(jié)果的類目的輸入圖形的相似度 合計(jì)而得的數(shù)據(jù)。例如,非正確結(jié)果分布表44通過從相似度存儲(chǔ)部41中讀出成為非正 確結(jié)果的類目的相似度,并對(duì)每一種類目合計(jì)所讀出的相似度,來構(gòu)成表示針對(duì)每一種 類目的成為非正確結(jié)果的圖形的相似度的頻度值。而且,成為非正確結(jié)果得相似度的頻 度值與在以后說明的式(13)中的P(Sc|c的補(bǔ)集)對(duì)應(yīng),通過用合計(jì)值除頻度值而成為和 P(Sc|c的補(bǔ)集)相同的值。圖6是表示非正確結(jié)果分布表44的構(gòu)成例子的圖。在圖6所示的構(gòu)成例子中, 雖然表示用100刻度分割了相似度的頻度,但并不限于此,也可以用任意的范圍分割相 似度表示頻度。在圖6所示的例子中表示,例如,對(duì)于類目A,成為非正確結(jié)果的數(shù)量是 108722,其中在相似度是1000 900時(shí)是“341”,相似度是900 800時(shí)是“2886”, 相似度是800 700時(shí)是“13943”,在相似度是700 600時(shí)是“91552”。存儲(chǔ)到上述正確結(jié)果分布表43中的數(shù)據(jù)是針對(duì)輸入圖形的正確結(jié)果類目的相似 度的頻度值。因此,根據(jù)存儲(chǔ)在上述正確結(jié)果分布表中的數(shù)據(jù),在輸入圖形的正確結(jié)果 是類目C的條件下能夠計(jì)算針對(duì)類目c的相似度為Sc的第1概率(假設(shè)它為P(ScIc))。此外,存儲(chǔ)在上述非正確結(jié)果分布表44中的數(shù)據(jù)是對(duì)不是輸入圖形的正確結(jié)果 的類目的類目的相似度的頻度值。因此,根據(jù)存儲(chǔ)在上述非正確結(jié)果分布表中的數(shù)據(jù), 在輸入圖形的正確結(jié)果不是類目C(不是正確結(jié)果)的條件下,能夠計(jì)算針對(duì)類目C的相 似度為Sc的第2概率(假設(shè)它為P (Sc|c補(bǔ)集))。
存儲(chǔ)在上述劃分類目的第1評(píng)價(jià)值表42中的數(shù)據(jù)是針對(duì)各類目的相似度的第1 評(píng)價(jià)值。第1評(píng)價(jià)值是相當(dāng)于在以后說明的式(13)中的R(Sc|c)、R(Sc' |c')的值, 是比較上述第1概率P(Sc|c)和上述第2概率P(Sc|c的補(bǔ)集)而求得的值。即,存儲(chǔ)在 上述劃分類目的第1評(píng)價(jià)值表42中的數(shù)據(jù)(第1評(píng)價(jià)值)可以根據(jù)上述正確結(jié)果分布表 43以及上述非正確結(jié)果分布表44而計(jì)算出。先驗(yàn)概率表45是表示各類目的先驗(yàn)概率的表。即,在先驗(yàn)概率表45中存儲(chǔ)針 對(duì)各類目的先驗(yàn)概率。根據(jù)上述那樣的圖形識(shí)別處理,則能夠根據(jù)在各類目中成為正確結(jié)果的相似度 的頻度和成為非正確結(jié)果的相似度的頻度,評(píng)價(jià)針對(duì)輸入圖形的各類目的相似度,可以 實(shí)現(xiàn)高精度的圖形識(shí) 別。進(jìn)而,存儲(chǔ)針對(duì)輸入圖形的各類目的相似度和表示針對(duì)輸入圖 形的正確結(jié)果的類目的信息,能夠根據(jù)所存儲(chǔ)的信息來更新對(duì)于各類目成為正確結(jié)果的 相似度的頻度和成為非正確結(jié)果的相似度的頻度,能夠容易地實(shí)現(xiàn)學(xué)習(xí)用于評(píng)價(jià)各相似 度的數(shù)據(jù)的功能。以下,詳細(xì)說明上述的后驗(yàn)概率。一般,使用貝斯定律如以下所示地計(jì)算后驗(yàn)概率。P(ClX) = M^(1,
P(XlC)P(C)““ ΣΡ(Χ丨c')P(d)
c'eC這里,C是全部類目的集合(辭典的全部數(shù)據(jù))(例如,如果是數(shù)字辭典,則 C = {1,2,3, .··},如果是字母表(alphabet),則 C = {A,B,C, .··},如果是 臉部識(shí)別則C= {A先生,B先生,C先生,…丨)。如果是想用概率密度函數(shù)表示 圖形的分布的方法(例如,模擬貝斯;參照「F.Kimura,K.Takashina, S.Tsuraoka, and Y.Miyake, "Modified quadratic discriminate functions and the application to Chinese character recognition” , IEEE Trans.Pattern Analysis and Machine Intelligence,vol.9, no.l, pp.149-153,1987 J等),因?yàn)榈玫搅艘驭肿鳛樘卣飨蛄繒r(shí)的似然度(Likelihood) P(x|c'),所以可以使用它通過式(2)得到后驗(yàn)概率。但是,在局部空間法中,得到的是各類目的相似度,并未求得似然度。因而, 研究如下。把χ作為全部識(shí)別結(jié)果,即作為匯集了全部類目的相似度的結(jié)果(例如,χ= (A 的相似度800,B的相似度750, ···))。想求的是包含在全部類目集合C中的類目c的 后驗(yàn)概率P(c|x)。在此,為了容易理解以下所示的式子,設(shè)和代入了具體值的式子交替 排列。此外,作為具體例子假設(shè)是字母表的字符識(shí)別,c是字母表的“B”。此外,設(shè) 識(shí)別結(jié)果是χ= (A的相似度800,B的相似度750,C的相似度900,…)。進(jìn)而,把 它簡(jiǎn)單記述為χ = (A800,B750, C900, …)。P(Clx)(3)=P(B|A800,B750,C900,…)⑷
權(quán)利要求
1.一種圖形識(shí)別方法,用于識(shí)別輸入圖形是多個(gè)類目中的哪個(gè)類目,該圖形識(shí)別方 法的特征在于,對(duì)各類目計(jì)算與輸入圖形的相似度,根據(jù)表示每個(gè)類目的相似度與第1評(píng)價(jià)值的關(guān)系的第1表,把上述所計(jì)算出的針對(duì)各 類目的輸入圖形的相似度變換為第1評(píng)價(jià)值,利用上述所計(jì)算出的針對(duì)各類目的第1評(píng)價(jià)值和存儲(chǔ)在表示各類目的先驗(yàn)概率的第2 表中的每個(gè)類目的先驗(yàn)概率來計(jì)算第2評(píng)價(jià)值, 選擇上述所計(jì)算出的第2評(píng)價(jià)值為最大的類目。
2.根據(jù)權(quán)利要求1所述的圖形識(shí)別方法, 上述類目是字符。
3.根據(jù)權(quán)利要求2所述的圖形識(shí)別方法,上述第1表是在輸入圖形是相應(yīng)字符的條件下成為相應(yīng)相似度的概率與在輸入圖形 不是相應(yīng)字符這一條件下成為相應(yīng)相似度的概率之比。
4.根據(jù)權(quán)利要求2所述的圖形識(shí)別方法,進(jìn)一步把上述所計(jì)算出的各字符的相似度與表示針對(duì)輸入圖形的正確結(jié)果的字符的 信息對(duì)應(yīng)起來存儲(chǔ),根據(jù)上述存儲(chǔ)的信息更新上述第1表。
5.根據(jù)權(quán)利要求3所述的圖形識(shí)別方法,進(jìn)一步把上述所計(jì)算出的各字符的相似度與表示針對(duì)輸入圖形的正確結(jié)果的字符的 信息對(duì)應(yīng)起來存儲(chǔ),根據(jù)上述存儲(chǔ)的信息更新上述第1表。
6.—種圖形識(shí)別裝置,用于識(shí)別輸入圖形是多個(gè)類目中的哪個(gè)類目,其特征在于, 具有相似度計(jì)算部,對(duì)各類目計(jì)算與輸入圖形的相似度; 第1表,表示每個(gè)類目的相似度與第1評(píng)價(jià)值的關(guān)系;第1評(píng)價(jià)值計(jì)算部,根據(jù)用上述第1表表示的關(guān)系將由上述相似度計(jì)算部計(jì)算的針對(duì) 各類目的輸入圖形的相似度變換為第1評(píng)價(jià)值;第2評(píng)價(jià)值計(jì)算部,利用在上述第1評(píng)價(jià)值計(jì)算部中得到的針對(duì)各類目的第1評(píng)價(jià)值 和存儲(chǔ)在表示各類目的先驗(yàn)概率的第2表中的每個(gè)類目的先驗(yàn)概率來計(jì)算第2評(píng)價(jià)值; 最大值選擇部,選擇由上述第2評(píng)價(jià)值計(jì)算部計(jì)算出的第2評(píng)價(jià)值為最大的類目。
7.根據(jù)權(quán)利要求6所述的圖形識(shí)別裝置, 上述類目是字符。
全文摘要
本發(fā)明提供一種圖形識(shí)別方法及圖形識(shí)別裝置,該圖形識(shí)別方法對(duì)輸入圖形是多個(gè)類目中的哪個(gè)類目進(jìn)行識(shí)別,對(duì)各類目計(jì)算與輸入圖形的相似度(33),根據(jù)表示每個(gè)類目的相似度與第1評(píng)價(jià)值的關(guān)系的第1表(42)把上述所計(jì)算出的針對(duì)各類目的輸入圖形的相似度變換為第1評(píng)價(jià)值(34),利用上述所計(jì)算出的針對(duì)各類目的第1評(píng)價(jià)值和存儲(chǔ)在表示各類目的先驗(yàn)概率的第2表(45)中的每個(gè)類目的先驗(yàn)概率來計(jì)算第2評(píng)價(jià)值(35),選擇上述所計(jì)算出的第2評(píng)價(jià)值為最大的類目(36)。
文檔編號(hào)G06K9/62GK102024150SQ20101026940
公開日2011年4月20日 申請(qǐng)日期2010年8月31日 優(yōu)先權(quán)日2009年9月16日
發(fā)明者佐藤俊雄, 浜村倫行 申請(qǐng)人:株式會(huì)社東芝