專(zhuān)利名稱(chēng):字符串檢測(cè)裝置和方法、字符評(píng)價(jià)裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)靜止圖像或活動(dòng)圖像等的圖像的數(shù)據(jù)進(jìn)行處理并從圖像中檢測(cè)字符的字符檢測(cè)處理。
背景技術(shù):
以往,存在從圖像(靜止圖像或活動(dòng)圖像)中檢測(cè)特定的字符(關(guān)鍵詞)的較多技術(shù)。例如,在專(zhuān)利文獻(xiàn)1 3中,公開(kāi)了如下的技術(shù)切出圖像中的全部字符區(qū)域,并對(duì)切出的各個(gè)字符區(qū)域進(jìn)行字符識(shí)別處理并變換為文本數(shù)據(jù)之后,判斷是否為應(yīng)檢測(cè)的關(guān)鍵詞。但是,在上述的專(zhuān)利文獻(xiàn)1 3所述的技術(shù)中,存在如下問(wèn)題。S卩,為了判斷是否為想要檢測(cè)的字符串,需要對(duì)從圖像切出的全部字符進(jìn)行識(shí)別處理,結(jié)果,處理時(shí)間變長(zhǎng)。例如,在識(shí)別對(duì)象字符為日語(yǔ)或漢語(yǔ)的情況下,字符數(shù)較多(分別僅第一水準(zhǔn)漢字為3000字符以上,若加上第二水準(zhǔn)漢字,則6000字符以上)。因此,為了用這些語(yǔ)言執(zhí)行字符識(shí)別處理,需要與3000 6000以上的字符的比對(duì)處理,結(jié)果,字符識(shí)別處理成為需要較多時(shí)間的負(fù)荷高的處理。并且,對(duì)識(shí)別出的全部字符串施加與關(guān)鍵詞的比對(duì)處理,處理時(shí)間變得更長(zhǎng)。上述處理時(shí)間的問(wèn)題,在處理比靜止圖像更要求實(shí)時(shí)性的活動(dòng)圖像的情況下,成為更深刻的問(wèn)題。相對(duì)于上述的技術(shù),在專(zhuān)利文獻(xiàn)4、5中,公開(kāi)了如下技術(shù)比對(duì)字符區(qū)域的圖像之間,從而進(jìn)行目標(biāo)字符串檢測(cè)。具體地說(shuō),首先,以一個(gè)字符一個(gè)字符讀出并描畫(huà)構(gòu)成特定的關(guān)鍵詞的字符字體(font),從而生成與該關(guān)鍵詞對(duì)應(yīng)的字符串圖像。接著,以該字符串圖像作為關(guān)鍵,對(duì)圖像進(jìn)行相似圖像檢索,從而從上述圖像中檢索關(guān)鍵詞。根據(jù)上述專(zhuān)利文獻(xiàn)4、5所述的技術(shù),由于通過(guò)圖像之間的比對(duì)處理而進(jìn)行字符串檢測(cè),所以不需要對(duì)圖像中的全部字符區(qū)域進(jìn)行字符識(shí)別處理,與上述的專(zhuān)利文獻(xiàn)1 3所述的技術(shù)相比,能夠縮短處理時(shí)間。另外,作為用于圖像之間的比對(duì)處理的、從圖像中檢測(cè)字符的特征量的技術(shù),例如考慮在非專(zhuān)利文獻(xiàn)1中記載的角檢測(cè)技術(shù)、輪廓線檢測(cè)技術(shù)。在先技術(shù)文獻(xiàn)專(zhuān)利文獻(xiàn)1特開(kāi)平08-205043號(hào)公報(bào)(1996年8月9日公開(kāi))專(zhuān)利文獻(xiàn)2特開(kāi)2006-1;34156號(hào)公報(bào)(2006年5月25日公開(kāi))專(zhuān)利文獻(xiàn)3特開(kāi)2008-131413號(hào)公報(bào)(2008年6月5日公開(kāi))專(zhuān)利文獻(xiàn)4特開(kāi)平10-191190號(hào)公報(bào)(1998年7月21日公開(kāi))專(zhuān)利文獻(xiàn)5特開(kāi)2008-004116號(hào)公報(bào)(2008年1月10日公開(kāi))非專(zhuān)利文獻(xiàn)1奧富正敏、 辦著「〒^”夕義畫(huà)像処理」CG-ARTS協(xié)會(huì)出版、 2007年3月1日(第二版二刷)、P. 208 210、12-2節(jié)「特徵點(diǎn)検出」但是,在上述的專(zhuān)利文獻(xiàn)4、5所記載的技術(shù)中,存在如下問(wèn)題。S卩,用于存儲(chǔ)在比對(duì)處理中利用的字符串的圖像的存儲(chǔ)器容量的問(wèn)題。
例如,在英語(yǔ)中,對(duì)作為關(guān)鍵詞而指定的“desk”這樣的字符串,作為應(yīng)從圖像中檢索的字符串而考慮“deSk”、“DeSk”以及“DESK”這樣的多個(gè)書(shū)寫(xiě)模式。在日語(yǔ)中,也對(duì)“ >9 、二 (平假名),,這樣的字符串,除了 “ & r,,之外還考慮“ 'J > 3 (片假名),,這樣的書(shū)寫(xiě)模式。此外,在漢字中,對(duì)“相澤”這樣的字符串,也考慮“相澤”和“相沢”的兩種書(shū)寫(xiě)模式。在上述的專(zhuān)利文獻(xiàn)4、5所記載的技術(shù)中,存在如下問(wèn)題即使是一個(gè)相同含義內(nèi)容的關(guān)鍵詞,也因存在多個(gè)書(shū)寫(xiě)模式,所以需要與其對(duì)應(yīng)地生成多個(gè)字符串圖像,圖像生成處理的負(fù)荷增大。此外,還存在如下問(wèn)題因用于比對(duì)的圖像也預(yù)先準(zhǔn)備存儲(chǔ)了多個(gè)書(shū)寫(xiě)模式量,所以存儲(chǔ)器容量變得龐大。進(jìn)而,在日語(yǔ)、漢語(yǔ)、韓語(yǔ)等的語(yǔ)言中,作為排列字符的方向而考慮橫寫(xiě)和豎寫(xiě)的兩種。由于即使是相同的字符串,也在豎寫(xiě)和橫寫(xiě)中識(shí)別為不同的字符串圖像,所以在上述的專(zhuān)利文獻(xiàn)4、5所記載的技術(shù)中,需要準(zhǔn)備豎寫(xiě)和橫寫(xiě)的兩種圖像。因此,處理負(fù)荷的增大和存儲(chǔ)器容量的問(wèn)題變得更深刻,若這樣應(yīng)比對(duì)的圖像增加,則結(jié)果,相似圖像檢索所需的處理時(shí)間也成為問(wèn)題。如上所述,處理時(shí)間的問(wèn)題在處理比靜止圖像更要求實(shí)時(shí)性的活動(dòng)圖像的情況下,成為更深刻的問(wèn)題。上述問(wèn)題點(diǎn)并不是僅在上述的特定的語(yǔ)言的字符中產(chǎn)生的,而是在所有語(yǔ)言的字符檢測(cè)處理時(shí)共同產(chǎn)生的問(wèn)題,且是從除了活動(dòng)圖像之外還包括靜止圖像的圖像中檢測(cè)字符時(shí)同樣產(chǎn)生的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述的問(wèn)題點(diǎn)而完成的,其目的在于,實(shí)現(xiàn)一種字符檢測(cè)裝置、字符評(píng)價(jià)裝置、圖像處理裝置、字符串檢測(cè)方法、字符評(píng)價(jià)方法、控制程序和記錄介質(zhì),用于實(shí)現(xiàn)對(duì)于圖像的字符串檢測(cè)處理的處理負(fù)荷減輕和處理時(shí)間縮短。此外,本發(fā)明的其他目的在于,在執(zhí)行字符串檢測(cè)處理的字符串檢測(cè)裝置中,處理負(fù)荷減輕和處理時(shí)間縮短的同時(shí)兼顧存儲(chǔ)器的節(jié)省化。為了解決上述課題,本發(fā)明的字符串檢測(cè)裝置從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于,包括字符信息存儲(chǔ)部,按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;檢索順序決定部件,基于在作為應(yīng)檢測(cè)的字符串而輸入到本裝置的檢測(cè)對(duì)象字符串中包含的每個(gè)字符的、存儲(chǔ)在上述字符信息存儲(chǔ)部中的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索部件,根據(jù)上述檢索順序決定部件決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。根據(jù)上述結(jié)構(gòu),若對(duì)字符串檢測(cè)部件指定應(yīng)檢測(cè)的字符串,則首先,上述檢索順序決定部件從上述字符信息存儲(chǔ)部中參照指定的字符串的每個(gè)字符的評(píng)價(jià)值。評(píng)價(jià)值是表示誤檢測(cè)的難度的值。并且,基于該評(píng)價(jià)值,對(duì)指定的字符串的每個(gè)字符決定檢索順序。上述字符檢索部件按照決定的檢索順序,按每個(gè)字符進(jìn)行檢索。由此,在不進(jìn)行字符識(shí)別處理,通過(guò)字符的比對(duì)處理而進(jìn)行字符檢索的情況下,即使指定的字符串是由多個(gè)字符構(gòu)成,也能夠一個(gè)字一個(gè)字檢索,從而最終檢測(cè)指定的字符串。一個(gè)字一個(gè)字檢索的結(jié)構(gòu)與檢索多個(gè)字符的情況相比,能夠減輕處理負(fù)荷。此外,不需要考慮豎寫(xiě)和橫寫(xiě)等。結(jié)果,能夠?qū)崿F(xiàn)字符串檢測(cè)處理的負(fù)荷減輕和處理時(shí)間縮短。進(jìn)而,由于不需要對(duì)比較對(duì)象的字符串區(qū)分豎寫(xiě)和橫寫(xiě)而預(yù)先保持字符的信息,所以能夠?qū)崿F(xiàn)字符串檢測(cè)裝置中的存儲(chǔ)器節(jié)省化。此外,本發(fā)明的字符串檢測(cè)裝置是一個(gè)字一個(gè)字檢索的結(jié)構(gòu),且上述檢索順序決定部件基于上述評(píng)價(jià)值而決定要檢索的字符的順序。即,根據(jù)誤檢測(cè)的難度(容易檢測(cè)) 而決定檢索順序。根據(jù)上述結(jié)構(gòu),字符檢索部件能夠?qū)χ付ǖ淖址母鱾€(gè)字符,考慮是否為容易正確檢測(cè)的字符、難以誤檢測(cè)到什么程度(是否容易)等而實(shí)施字符檢索。因此,盡可能避免誤檢測(cè),能夠更有效地執(zhí)行字符串檢測(cè)處理,結(jié)果,能夠?qū)崿F(xiàn)處理負(fù)荷減輕和處理時(shí)間縮短。優(yōu)選地,上述檢索順序決定部件決定在上述檢測(cè)對(duì)象字符串中包含的字符中,最初檢索表示上述誤檢測(cè)的難度的評(píng)價(jià)值具有最大的值的字符。根據(jù)上述結(jié)構(gòu),與上述字符串的原來(lái)的字符的排列無(wú)關(guān)地,將正確地檢測(cè)的可能性最高的字符優(yōu)先檢索,所以能夠有效地檢測(cè)在圖像中包含的目標(biāo)字符串。此外,在圖像中沒(méi)有包含目標(biāo)字符串的情況下,能夠在字符串檢測(cè)處理的較早的階段、更正確地判斷此情況。若上述字符檢索部件從上述圖像中檢測(cè)出在上述檢測(cè)對(duì)象字符串中包含的目標(biāo)字符,則上述檢索順序決定部件將下一個(gè)要檢索的字符決定為在上述檢測(cè)對(duì)象字符串中的字符的排列中,在已檢測(cè)的字符的兩側(cè)的字符中、上述評(píng)價(jià)值大的一個(gè)。在字符的排列中已檢測(cè)的字符的兩側(cè)的字符,被認(rèn)為在上述圖像中配置在接近已檢測(cè)的字符的位置。因此,以在上述圖像中的已檢測(cè)的字符的位置作為基準(zhǔn),優(yōu)先檢索這些字符,從而能夠在較早的階段、更正確地檢測(cè)目標(biāo)字符串的有無(wú)。進(jìn)而,在兩側(cè)中,評(píng)價(jià)值大 (即,難以誤檢測(cè))的字符被優(yōu)先檢索,所以精度進(jìn)一步提高。優(yōu)選地,上述檢索順序決定部件決定上述檢索順序,使得按照字符的評(píng)價(jià)值由大到小的順序檢索出。根據(jù)上述結(jié)構(gòu),與指定的字符串的原來(lái)的字符的排列無(wú)關(guān)地,從按照容易正確地檢測(cè)的字符起按順序檢測(cè)字符。因此,能夠有效地檢測(cè)在圖像中包含的目標(biāo)字符串。此外, 在圖像中沒(méi)有包含目標(biāo)字符串的情況下,能夠在字符串檢測(cè)處理的較早的階段、更正確地判斷此情況。優(yōu)選地,上述字符檢索部件若從上述圖像中檢測(cè)出在上述檢測(cè)對(duì)象字符串中包含的目標(biāo)字符,則將用于檢索下一個(gè)字符的檢索對(duì)象區(qū)域從上述圖像的全部區(qū)域限定為已檢測(cè)的字符的相鄰區(qū)域。根據(jù)上述結(jié)構(gòu),字符檢索部件將檢索對(duì)象區(qū)域從圖像的全部區(qū)域限定為已檢測(cè)的字符的相鄰區(qū)域而進(jìn)行字符檢索。在大多情況下,字符串以豎向或橫向排列而配置,所以若檢測(cè)出目標(biāo)字符串,則在其相鄰配置其他的字符的可能性高。這樣,篩選檢測(cè)出的可能性高的區(qū)域而進(jìn)行之后的字符的檢索,所以能夠大幅削減進(jìn)行比對(duì)處理的范圍,能夠?qū)崿F(xiàn)字符串檢測(cè)處理的處理負(fù)荷減輕和處理時(shí)間縮短。優(yōu)選地,在上述已檢測(cè)的字符為在上述檢測(cè)對(duì)象字符串中的字符的排列中第η個(gè)字符,并且在下一個(gè)要檢索的字符為第(η+1)個(gè)以上的字符的情況下,上述字符檢索部件將檢索對(duì)象區(qū)域限定為上述已檢測(cè)的字符的右側(cè)和下側(cè)的相鄰區(qū)域,在下一個(gè)要檢索的字符為第(n-1)個(gè)以下的字符的情況下,上述字符檢索部件將檢索對(duì)象區(qū)域限定為上述已檢測(cè)的字符的左側(cè)和上側(cè)的相鄰區(qū)域。根據(jù)上述結(jié)構(gòu),基于原來(lái)的字符的排列,能夠從已檢測(cè)的字符的位置,更正確地篩選下一個(gè)要檢索的字符的位置。即,在指定的字符串的排列中,在下一個(gè)要檢索的字符為已檢索的字符之后的字符的情況下,若是橫寫(xiě)則配置在已檢測(cè)的字符的右側(cè)的可能性高,若是豎寫(xiě)則配置在已檢測(cè)的字符的下側(cè)的可能性高。此外,在下一個(gè)要檢索的字符為已檢索的字符之前的字符的情況下,若是橫寫(xiě)則配置在已檢測(cè)的字符的左側(cè)的可能性高,若是豎寫(xiě)則配置在已檢測(cè)的字符的上側(cè)的可能性高。這樣,篩選檢測(cè)出的可能性高的區(qū)域而進(jìn)行之后的字符的檢索,所以能夠大幅削減進(jìn)行比對(duì)處理的范圍,能夠?qū)崿F(xiàn)字符串檢測(cè)處理的處理負(fù)荷減輕和處理時(shí)間縮短。上述評(píng)價(jià)值也可以是作為字符的形狀越復(fù)雜越難以誤檢測(cè)的字符,基于字符的形狀特性而計(jì)算出的值,基于表示形成字符的線的長(zhǎng)度的要素長(zhǎng)度的特性值以及表示形成字符的線的方向的多樣性的不同方位性的特性值中的至少一個(gè),計(jì)算上述評(píng)價(jià)值。進(jìn)而,也可以與形成上述字符的線的方向?yàn)樗交虼怪狈较虻木€相比,對(duì)線的方向傾斜的線進(jìn)行加權(quán),從而計(jì)算上述要素長(zhǎng)度的特性值和上述不同方位性的特性值。也可以作為越是沒(méi)有與其他字符或其他字符的一部分相似的形狀的字符越是難以誤檢測(cè)的字符,基于表示與其他字符的判別的容易性的判別容易性的特性值,計(jì)算上述評(píng)價(jià)值。也可以作為越是字符的書(shū)寫(xiě)為一樣的字符越是難以誤檢測(cè)的字符,根據(jù)基于不同書(shū)寫(xiě)的有無(wú)或在有不同書(shū)寫(xiě)的情況下的不同書(shū)寫(xiě)字符之間的相似度而確定的書(shū)寫(xiě)一樣性的特性值,計(jì)算上述評(píng)價(jià)值。優(yōu)選地,上述圖像是由多個(gè)幀構(gòu)成的活動(dòng)圖像,上述字符檢索部件按從上述活動(dòng)圖像中作為檢索對(duì)象而提取出的每個(gè)檢索對(duì)象幀,檢索在上述檢測(cè)對(duì)象字符串中包含的各個(gè)字符,上述字符檢索部件在按照上述檢索順序檢索各個(gè)字符時(shí),在從上述檢索對(duì)象幀中不能檢測(cè)出目標(biāo)字符的情況下,結(jié)束在該檢索對(duì)象幀中的檢索,在下一個(gè)檢索對(duì)象幀中檢索檢索順序?yàn)樽畛醯淖址?。根?jù)上述結(jié)構(gòu),字符檢索部件對(duì)活動(dòng)圖像的一個(gè)幀,按照決定的檢索順序,從難以誤檢測(cè)的字符起按順序檢索目標(biāo)字符。然后,若不能檢測(cè)目標(biāo)字符,則結(jié)束對(duì)于該幀的檢索,對(duì)下一個(gè)幀,從難以誤檢測(cè)的字符起按順序重復(fù)檢索。若按照決定的檢索順序檢索字符,則能夠高效率地檢測(cè)在圖像中包含的目標(biāo)字符串,在圖像中沒(méi)有包含目標(biāo)字符串的情況下,能夠在字符串檢測(cè)處理的較早的階段、更正確地判斷此情況,所以能夠避免容易混淆且難以檢測(cè)的字符的判別花費(fèi)時(shí)間或者在最后的階段判明了沒(méi)有包含字符串從而至此為止的字符檢測(cè)處理的損失變大的不合適的情況。由此,能夠?qū)υ谔幚硪髮?shí)時(shí)性的活動(dòng)圖像而檢測(cè)字符串時(shí)成為更深刻的問(wèn)題的處理負(fù)荷和處理時(shí)間的問(wèn)題,實(shí)現(xiàn)大幅的處理負(fù)荷的削減和處理時(shí)間的縮減。為了解決上述課題,本發(fā)明的字符評(píng)價(jià)裝置,包括字符分析部件,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;字符特性存儲(chǔ)部,按每個(gè)字符預(yù)先存儲(chǔ)字符特性;特性值確定部件,基于上述字符分析部件分析的字符特性以及在上述字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算部件,使用上述特性值確定部件確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)部件,將上述評(píng)價(jià)值計(jì)算部件計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。也可以是上述字符分析部件對(duì)上述評(píng)價(jià)對(duì)象字符的形狀特性進(jìn)行分析,上述特性值確定部件基于上述字符分析部件分析的結(jié)果,對(duì)上述評(píng)價(jià)對(duì)象字符計(jì)算表示形成字符的線的長(zhǎng)度的要素長(zhǎng)度的特性值以及表示形成字符的線的方向的多樣性的不同方位性的特性值中的至少一個(gè)。上述字符特性存儲(chǔ)部也可以是,作為越是沒(méi)有與其他字符或其他字符的一部分相似的形狀的字符越是難以誤檢測(cè)的字符,將與其他字符的判別的容易性作為字符特性而對(duì)每個(gè)字符存儲(chǔ)的部,上述特性值確定部件基于在上述字符特定存儲(chǔ)部中存儲(chǔ)的、上述評(píng)價(jià)對(duì)象字符的字符特性,確定上述評(píng)價(jià)對(duì)象字符的判別容易性的特性值。上述字符特性存儲(chǔ)部也可以是,作為字符特性而將不同書(shū)寫(xiě)字符的組與不同書(shū)寫(xiě)字符之間的相似度相關(guān)聯(lián)而存儲(chǔ)的部,上述特性值確定部件基于上述評(píng)價(jià)對(duì)象字符的不同書(shū)寫(xiě)的有無(wú)或在有不同書(shū)寫(xiě)的情況下的不同書(shū)寫(xiě)字符之間的相似度,作為越是字符的書(shū)寫(xiě)為一樣的字符越是難以誤檢測(cè)的字符,確定該評(píng)價(jià)對(duì)象字符的書(shū)寫(xiě)一樣性的特性值。根據(jù)以上敘述的字符評(píng)價(jià)裝置的結(jié)構(gòu),能夠基于字符的形狀規(guī)格和語(yǔ)言特性,評(píng)價(jià)字符的誤檢測(cè)的難度。若能夠預(yù)先把握哪個(gè)字符難以誤檢測(cè)、哪個(gè)字符容易誤檢測(cè)的情況,則字符串檢測(cè)裝置能夠以短時(shí)間且低負(fù)荷處理,更有效地從圖像中檢測(cè)目標(biāo)字符串。本發(fā)明的上述的字符串檢測(cè)裝置可應(yīng)用于可處理圖像的全部圖像處理裝置,且搭載了本發(fā)明的字符串檢測(cè)裝置的、這樣的圖像處理裝置也屬于本發(fā)明的范疇。為了解決上述課題,本發(fā)明的字符串檢測(cè)方法,從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于,包括字符串取得步驟,取得作為應(yīng)檢測(cè)的字符串而輸入的檢測(cè)對(duì)象字符串;檢索順序決定步驟,基于在按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值的字符信息存儲(chǔ)部中存儲(chǔ)的、在上述字符串取得步驟中取得的上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索步驟,根據(jù)在上述檢索順序決定步驟中決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。為了解決上述課題,本發(fā)明的字符評(píng)價(jià)方法,包括字符分析步驟,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;特性值確定步驟,基于在上述字符分析步驟中分析的字符特性以及在按每個(gè)字符預(yù)先存儲(chǔ)字符特性的字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算步驟,使用在上述特性值確定步驟中確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)步驟,將在上述評(píng)價(jià)值計(jì)算步驟中計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。另外,上述字符串檢測(cè)裝置或上述字符評(píng)價(jià)裝置也可以通過(guò)計(jì)算機(jī)實(shí)現(xiàn),此時(shí),通過(guò)使計(jì)算機(jī)作為上述各個(gè)部件動(dòng)作,從而由計(jì)算機(jī)實(shí)現(xiàn)上述字符串檢測(cè)裝置或上述字符評(píng)價(jià)裝置的控制程序、以及記錄了該控制程序的計(jì)算機(jī)可讀取的記錄介質(zhì)也屬于本發(fā)明的范 為了解決上述課題,本發(fā)明的字符串檢測(cè)裝置從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于,包括字符信息存儲(chǔ)部,按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;檢索順序決定部件,基于在作為應(yīng)檢測(cè)的字符串而輸入到本裝置的檢測(cè)對(duì)象字符串中包含的每個(gè)字符的、存儲(chǔ)在上述字符信息存儲(chǔ)部中的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索部件,根據(jù)上述檢索順序決定部件決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。為了解決上述課題,本發(fā)明的字符評(píng)價(jià)裝置,包括字符分析部件,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;字符特性存儲(chǔ)部,按每個(gè)字符預(yù)先存儲(chǔ)字符特性;特性值確定部件,基于上述字符分析部件分析的字符特性以及在上述字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算部件,使用上述特性值確定部件確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)部件,將上述評(píng)價(jià)值計(jì)算部件計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。為了解決上述課題,本發(fā)明的字符串檢測(cè)方法,從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于,包括字符串取得步驟,取得作為應(yīng)檢測(cè)的字符串而輸入的檢測(cè)對(duì)象字符串;檢索順序決定步驟,基于在按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值的字符信息存儲(chǔ)部中存儲(chǔ)的、在上述字符串取得步驟中取得的上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索步驟,根據(jù)在上述檢索順序決定步驟中決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。為了解決上述課題,本發(fā)明的字符評(píng)價(jià)方法,包括字符分析步驟,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;特性值確定步驟,基于在上述字符分析步驟中分析的字符特性以及在按每個(gè)字符預(yù)先存儲(chǔ)字符特性的字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算步驟,使用在上述特性值確定步驟中確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)步驟,將在上述評(píng)價(jià)值計(jì)算步驟中計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。因此,起到能夠?qū)崿F(xiàn)對(duì)于圖像的字符串檢測(cè)處理的處理負(fù)荷減輕和處理時(shí)間縮短的效果。
圖1是表示本發(fā)明的實(shí)施方式中的DVD播放器的主要部分結(jié)構(gòu)的方框圖。圖2是字符評(píng)價(jià)裝置的字符分析部執(zhí)行的字符要素檢測(cè)處理和字符要素分解處理的一例的圖。圖3(a)和(b)是字符分析部求出的有關(guān)形狀的特性值的具體例的圖。圖4是表示字符分析部對(duì)多個(gè)字符執(zhí)行了字符分析的結(jié)果的一例的圖。圖5(a)是表示在字符特性存儲(chǔ)部中存儲(chǔ)的、有關(guān)判別容易性的字符特性信息的具體例的圖,(b)是表示在字符特性存儲(chǔ)部中存儲(chǔ)的、有關(guān)書(shū)寫(xiě)一樣性的字符特性信息的具體例的圖。圖6是表示字符評(píng)價(jià)裝置的評(píng)價(jià)值計(jì)算部計(jì)算出的評(píng)價(jià)值的一例的圖。
圖7是表示在字符串檢測(cè)裝置的字符信息存儲(chǔ)部中存儲(chǔ)的字符數(shù)據(jù)庫(kù)的具體例的圖。圖8是表示字符評(píng)價(jià)裝置執(zhí)行的字符評(píng)價(jià)處理的流程的流程圖。圖9是說(shuō)明本發(fā)明的圖像處理裝置(DVD播放器)、顯示部(電視)以及操作部(遙控器)的外觀、用戶輸入目標(biāo)字符串的情況的圖。圖10是表示在字符串檢測(cè)裝置的關(guān)鍵詞保持部中保持的關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)的一例的圖。圖11是表示相對(duì)于已檢測(cè)字符的區(qū)域的、用于檢索由字符串檢測(cè)裝置的字符檢索部決定的下一個(gè)字符的檢索對(duì)象區(qū)域的一例的圖。圖12是表示相對(duì)于已檢測(cè)字符的區(qū)域的、用于檢索由字符串檢測(cè)裝置的字符檢索部決定的下一個(gè)字符的檢索對(duì)象區(qū)域的具體例的圖。圖13是表示DVD播放器中的圖像處理和字符串檢測(cè)處理的流程的流程圖。圖14是表示字符串檢測(cè)裝置執(zhí)行的字符串檢測(cè)處理的流程的流程圖。圖15是表示誤檢測(cè)的具體例的圖。標(biāo)號(hào)說(shuō)明IDVD播放器(圖像處理裝置)2字符評(píng)價(jià)裝置3字符串檢測(cè)裝置10控制部11存儲(chǔ)部12顯示部13操作部14暫時(shí)存儲(chǔ)部14a圖像存儲(chǔ)器14b關(guān)鍵詞保持部I5 總線20字符分析部(字符分析部件/特性值確定部件)21評(píng)價(jià)值計(jì)算部(特性值確定部件/評(píng)價(jià)值計(jì)算部件/評(píng)價(jià)值存儲(chǔ)部件)22關(guān)鍵詞取得部(檢測(cè)對(duì)象字符串取得部件)
23檢索順序決定部(檢索順序決定部件)24字符檢索部(字符檢索部件)25活動(dòng)圖像再現(xiàn)部沈靜止圖像生成部27特征量提取部30圖像存儲(chǔ)部31字符特性存儲(chǔ)部32字符信息存儲(chǔ)部40 比例尺(scale)41豎線(要素)
42橫線(要素)43斜線(要素)44斜線(要素)
具體實(shí)施例方式《實(shí)施方式1》基于
本發(fā)明的實(shí)施方式,則如下。以下,作為一例,說(shuō)明將本發(fā)明的字符串檢測(cè)裝置搭載在再現(xiàn)圖像并進(jìn)行顯示的 DVD播放器的情況。另外,本發(fā)明的字符串檢測(cè)裝置并不限定于DVD播放器,可應(yīng)用于可處理圖像的全部圖像處理裝置。例如,可應(yīng)用于數(shù)字視頻記錄器/播放器、藍(lán)光盤(pán)記錄器/播放器、數(shù)字?jǐn)z像機(jī)、數(shù)字照相機(jī)、數(shù)字電視、個(gè)人計(jì)算機(jī)、移動(dòng)電話、打印機(jī)、掃描儀等處理靜止圖像和/ 或活動(dòng)圖像的各種圖像處理裝置,但并不限定于此。另外,這里,將靜止圖像數(shù)據(jù)和活動(dòng)圖像數(shù)據(jù)都稱(chēng)為圖像。DVD播放器1的結(jié)構(gòu)圖1是表示本發(fā)明的實(shí)施方式中的DVD播放器1的主要部分結(jié)構(gòu)的方框圖。如圖1所示,本實(shí)施方式的DVD播放器(圖像處理裝置)1成為包括控制部10、存儲(chǔ)部11、顯示部12、操作部13、暫時(shí)存儲(chǔ)部14以及作為在這些各個(gè)部中進(jìn)行數(shù)據(jù)的發(fā)送接收的公共的信號(hào)線的總線15的結(jié)構(gòu)。顯示部12顯示DVD播放器1處理的圖像,或者將用戶用于操作DVD播放器1的操作畫(huà)面作為⑶I (Graphical User hterface,圖形用戶界面)畫(huà)面而顯示。顯示部12例如由LCD (液晶顯示器)、有機(jī)EL顯示器等的顯示裝置構(gòu)成。操作部13是用戶對(duì)DVD播放器1輸入指示信號(hào),用于對(duì)DVD播放器1進(jìn)行操作的部。DVD播放器1也可以包括可經(jīng)由總線15直接進(jìn)行數(shù)據(jù)發(fā)送接收的顯示部12和操作部13,但并不限定于這樣的結(jié)構(gòu)。在本實(shí)施方式中,顯示部12由數(shù)字電視實(shí)現(xiàn),經(jīng)由總線15與控制部10連接的DVD 播放器 1 的外部接口(未圖示)通過(guò) HDMI (High Definition Multimedia hterface,高清多媒體接口)端子和HDMI電纜等與作為數(shù)字電視的顯示部12連接。由此,DVD播放器1 能夠?qū)⒈狙b置再現(xiàn)的圖像輸出到顯示部12進(jìn)行顯示。此外,在本實(shí)施方式中,作為一例,操作部13也可以作為上述數(shù)字電視和該DVD 播放器1共用的遙控器實(shí)現(xiàn)。與在操作部13中設(shè)置的按鈕(十字鍵、決定鍵、字符輸入鍵等)對(duì)應(yīng)的信號(hào)在其按鈕被按下時(shí),作為紅外線信號(hào)而從操作部13的發(fā)光部輸出,并經(jīng)由在DVD播放器1或上述數(shù)字電視的主體中設(shè)置的受光部而輸入到DVD播放器1或數(shù)字電視中。經(jīng)由DVD播放器1的受光部(未圖示)接收到的信號(hào)經(jīng)由總線15而提供給控制部10, 控制部10進(jìn)行對(duì)應(yīng)于上述信號(hào)的動(dòng)作。控制部10通過(guò)執(zhí)行從存儲(chǔ)部11讀出到暫時(shí)存儲(chǔ)部14的程序,從而進(jìn)行各種運(yùn)算,并且經(jīng)由總線15統(tǒng)一控制DVD播放器1包括的各個(gè)部。在本實(shí)施方式中,控制部10是作為功能模塊而至少包括關(guān)鍵詞取得部22、檢索順序決定部23以及字符檢索部M的結(jié)構(gòu)。這些各個(gè)功能模塊使DVD播放器1作為本發(fā)明的字符串檢測(cè)裝置3起作用。此外,由于DVD播放器1是圖像處理裝置,所以控制部10作為用于使DVD播放器 1作為圖像處理裝置起作用的功能模塊而包括活動(dòng)圖像再現(xiàn)部25、靜止圖像生成部沈以及特征量提取部27。上述結(jié)構(gòu)是圖像處理裝置基本上包括的功能模塊的一例,并不用于限定本發(fā)明的字符串檢測(cè)裝置3的結(jié)構(gòu),根據(jù)圖像處理裝置的功能而適當(dāng)?shù)卦O(shè)計(jì)。此外,在本實(shí)施方式的DVD播放器1中,還可以搭載本發(fā)明的字符評(píng)價(jià)裝置2。本發(fā)明的字符評(píng)價(jià)裝置2是用于對(duì)字符串檢測(cè)裝置3可檢測(cè)的全部字符進(jìn)行分析并評(píng)價(jià)的裝置,字符串檢測(cè)裝置3可使用字符評(píng)價(jià)裝置2評(píng)價(jià)并獲得的字符的信息而檢測(cè)在圖像中包含的字符串??刂撇?0作為使DVD播放器1作為本發(fā)明的字符評(píng)價(jià)裝置2起作用的功能模塊而包括字符分析部20和評(píng)價(jià)值計(jì)算部21。CPU (central processing unit,ROM (read only memory,只讀存儲(chǔ)器)等實(shí)現(xiàn)的存儲(chǔ)裝置中存儲(chǔ)的程序讀出到由RAM(rand0m access memory,隨機(jī)存取存儲(chǔ)器)等實(shí)現(xiàn)的暫時(shí)存儲(chǔ)部14中執(zhí)行,從而能夠?qū)崿F(xiàn)上述的控制部10 的各個(gè)功能模塊OO 27)。存儲(chǔ)部11存儲(chǔ)控制部10執(zhí)行的控制程序和OS程序、以及在控制部10執(zhí)行DVD 播放器1具有的各種功能(例如,圖像處理、字符串檢測(cè)處理、字符評(píng)價(jià)處理等)時(shí)讀出的各種固定數(shù)據(jù)。在本實(shí)施方式中,在存儲(chǔ)部11中,例如包括圖像存儲(chǔ)部30、字符特性存儲(chǔ)部 31以及字符信息存儲(chǔ)部32,存儲(chǔ)各種固定數(shù)據(jù)。存儲(chǔ)部11例如由作為可改寫(xiě)內(nèi)容的非易失性存儲(chǔ)器的、EPROM (ErasabIe Programmable ROM), EEPROM (ElectricalIy EI3ROM)、閃速存儲(chǔ)器等實(shí)現(xiàn)。另外,作為存儲(chǔ)不需要改寫(xiě)內(nèi)容的信息的存儲(chǔ)部,如上所述,也可以由作為與存儲(chǔ)部11不同的、未圖示的、讀出專(zhuān)用的半導(dǎo)體存儲(chǔ)器的R0M(Read Only Memory)等實(shí)現(xiàn)。圖像存儲(chǔ)部30是存儲(chǔ)成為DVD播放器1作為圖像處理裝置而處理的對(duì)象的圖像的數(shù)據(jù)的部。在本實(shí)施方式中,圖像存儲(chǔ)部30能夠?qū)㈧o止圖像和活動(dòng)圖像都作為圖像而存儲(chǔ)。字符特性存儲(chǔ)部31存儲(chǔ)與在評(píng)價(jià)值計(jì)算部21評(píng)價(jià)字符時(shí)利用的字符的特性有關(guān)的信息即字符特性信息。關(guān)于字符特性信息,在后面進(jìn)行詳細(xì)敘述。字符信息存儲(chǔ)部32將在字符串檢測(cè)裝置3執(zhí)行字符串檢測(cè)處理時(shí)利用的字符的信息化為數(shù)據(jù)庫(kù)而進(jìn)行存儲(chǔ)。字符信息存儲(chǔ)部32存儲(chǔ)的字符數(shù)據(jù)庫(kù)按每個(gè)字符,將用于唯一識(shí)別字符的字符代碼、該字符的特征量以及該字符的評(píng)價(jià)值相關(guān)聯(lián)而存儲(chǔ)。關(guān)于該字符數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu),在后面詳細(xì)敘述。暫時(shí)存儲(chǔ)部14是在DVD播放器1執(zhí)行的各種處理的過(guò)程中,將用于運(yùn)算的數(shù)據(jù)和運(yùn)算結(jié)果等暫時(shí)存儲(chǔ)的所謂的工作存儲(chǔ)器(working memory),由RAM (Random Access Memory)等實(shí)現(xiàn)。更具體地說(shuō),靜止圖像生成部沈?qū)⒃趫?zhí)行圖像處理時(shí)成為處理對(duì)象的圖像在暫時(shí)存儲(chǔ)部14的圖像存儲(chǔ)器1 中展開(kāi),由此,特征量提取部27能夠以像素為單位對(duì)圖像進(jìn)行詳細(xì)的分析。此外,在字符串檢測(cè)裝置3基于由用戶輸入的關(guān)鍵詞而執(zhí)行字符串檢測(cè)處理時(shí),輸入的上述關(guān)鍵詞暫時(shí)存儲(chǔ)到暫時(shí)存儲(chǔ)部14的關(guān)鍵詞保持部14b中。字符串檢測(cè)裝置3的各個(gè)部適當(dāng)?shù)貐⒄贞P(guān)鍵詞保持部14b,執(zhí)行從圖像中檢測(cè)指定的關(guān)鍵詞的字符串檢測(cè)處理。關(guān)于關(guān)鍵詞保持部14b的數(shù)據(jù)結(jié)構(gòu),在后面詳細(xì)敘述。控制部10的活動(dòng)圖像再現(xiàn)部25讀出在圖像存儲(chǔ)部30中存儲(chǔ)的活動(dòng)圖像,實(shí)施用于輸出到外部的處理,再現(xiàn)活動(dòng)圖像。在輸入了再現(xiàn)/顯示活動(dòng)圖像的指示的情況下,活動(dòng)圖像再現(xiàn)部25已進(jìn)行了處理的活動(dòng)圖像被暫時(shí)存儲(chǔ)到圖像存儲(chǔ)器14a中,在未圖示的顯示控制部的控制之下,按每個(gè)幀輸出到顯示部12。在輸入了從活動(dòng)圖像中檢測(cè)規(guī)定的字符串的指示的情況下,活動(dòng)圖像再現(xiàn)部25 處理的活動(dòng)圖像輸出到靜止圖像生成部26。另外,在輸入了用于顯示在圖像存儲(chǔ)部30中存儲(chǔ)的靜止圖像的指示的情況下,上述顯示控制部從圖像存儲(chǔ)部30中讀出靜止圖像,輸出到顯示部12。靜止圖像生成部沈從活動(dòng)圖像的各個(gè)幀中提取成為執(zhí)行字符串檢測(cè)處理的對(duì)象的幀,生成處理對(duì)象的靜止圖像。靜止圖像生成部沈可以將在活動(dòng)圖像中包含的全部幀分別作為靜止圖像,在本實(shí)施方式中,以規(guī)定秒為間隔或以規(guī)定幀為間隔,執(zhí)行提取成為處理對(duì)象的靜止圖像的處理。另外,在輸入了從靜止圖像中檢測(cè)規(guī)定的字符串的指示的情況下,從圖像存儲(chǔ)部 30中讀出未圖示的顯示控制部指定的靜止圖像,輸出到特征量提取部27。特征量提取部27從靜止圖像生成部沈生成的靜止圖像或上述顯示控制部讀出的靜止圖像中,提取用于字符串檢測(cè)處理的特征量。只要是字符串檢測(cè)裝置3能夠按每個(gè)字符識(shí)別字符的形狀,則本發(fā)明的字符串檢測(cè)裝置3使用的特征量可以是任意的。其中,字符檢索部M通過(guò)將上述特征量與已知的模型特征量進(jìn)行比較,從而實(shí)現(xiàn)字符的檢測(cè)。因此,優(yōu)選地,在字符信息存儲(chǔ)部32中存儲(chǔ)的每個(gè)字符的模型的特征量與特征量提取部27提取的字符的特征量是通過(guò)相同的方法提取出的特征量。另外,作為從圖像中檢測(cè)字符的特征量的技術(shù),例如考慮使用非專(zhuān)利文獻(xiàn)1所記載的角檢測(cè)技術(shù)、輪廓線(邊緣)檢測(cè)技術(shù),但特征量提取部27的結(jié)構(gòu)并不限定于此?;蛘撸址奶卣髁恳部梢允亲址膱D像。字符評(píng)價(jià)裝置2的結(jié)構(gòu)本發(fā)明的字符評(píng)價(jià)裝置2(圖1)是評(píng)價(jià)字符,關(guān)于字符的一個(gè)字一個(gè)字輸出評(píng)價(jià)值的裝置。詳細(xì)地說(shuō),字符評(píng)價(jià)裝置2基于字符的形狀特性和字符的語(yǔ)言特性,分析字符, 并從該字符難以誤檢測(cè)到什么程度(容易正確檢測(cè)到什么程度)的觀點(diǎn)進(jìn)行評(píng)價(jià),求出表示“誤檢測(cè)的難度”的評(píng)價(jià)值。評(píng)價(jià)值在字符信息存儲(chǔ)部32中對(duì)每個(gè)字符預(yù)先存儲(chǔ)。根據(jù)本發(fā)明的字符評(píng)價(jià)裝置2求出的評(píng)價(jià)值,字符串檢測(cè)裝置3能夠?qū)γ總€(gè)字符預(yù)先把握字符的誤檢測(cè)的難度。由此,字符串檢測(cè)裝置3能夠從關(guān)鍵詞中的難以誤檢測(cè)的字符起按順序進(jìn)行檢索,與以往相比能夠?qū)崿F(xiàn)有效的字符串檢測(cè)處理。這里,誤檢測(cè)是指,錯(cuò)誤地檢測(cè)在原本不是字符的背景區(qū)域中、包含有目標(biāo)字符的情況、將其他字符錯(cuò)誤地檢測(cè)為目標(biāo)字符的情況、原本是目標(biāo)字符但遺漏檢測(cè)目標(biāo)字符的情況等。在字符的形狀簡(jiǎn)單、有不同書(shū)寫(xiě)字符的情況下,容易發(fā)生這樣的誤檢測(cè)。例如,若在該字符中像字符的特征性的形狀少(數(shù)字的“1”、表示長(zhǎng)音的“_”等)、漢字的部首等經(jīng)常作為各種字符的要素的一部分使用的字符(“口”、“日”等)、雖然是不同的字符但形狀相似的字符之間(片假名的“二”和漢字的“二”、片假名的“ 口,,和漢字的“ 口 ”、通常的“,,, 和表示促音的“ ”等)、相反一種含義且多種書(shū)寫(xiě)的字符(“沢”和“澤”、“A”和“a”等), 則誤檢測(cè)的可能性高。如上可知,可以說(shuō)“誤檢測(cè)的難度”可根據(jù)字符的形狀復(fù)雜、沒(méi)有相似形狀的字符、 沒(méi)有不同書(shū)寫(xiě)字符等進(jìn)行評(píng)價(jià)。其中,并不限定于此,也可以將其他的字符形狀的特征、其他的字符特性用于誤檢測(cè)的難度的評(píng)價(jià)。按照上述的觀點(diǎn),字符評(píng)價(jià)裝置2基于字符的形狀和字符的語(yǔ)言特性來(lái)評(píng)價(jià)字符。以下,詳細(xì)說(shuō)明字符評(píng)價(jià)裝置2的結(jié)構(gòu)。控制部10的字符分析部20分析字符的形狀。在本實(shí)施方式中,字符分析部20將字符捕捉為由一個(gè)以上的線的要素構(gòu)成,從字符形狀中檢測(cè)要素。字符分析部20檢測(cè)的要素既可以是直線,也可以是曲線,或者也可以將曲線近似檢測(cè)為直線。然后,字符分析部20 根據(jù)檢測(cè)出的要素(線)的方向或者是直線還是曲線,將檢測(cè)出的各個(gè)要素分類(lèi),分解字符。圖2是表示字符分析部20執(zhí)行的字符要素檢測(cè)處理和字符要素分解處理的一例的圖。首先,想要進(jìn)行評(píng)價(jià)的評(píng)價(jià)對(duì)象的字符輸入到字符評(píng)價(jià)裝置2。這里,作為一例, 設(shè)為片假名的這樣的字符從操作部13輸入到字符評(píng)價(jià)裝置2。這里,只要字符評(píng)價(jià)裝置2能夠識(shí)別輸入的字符為“ # ”,則字符能夠以任意方式輸入。例如,字符“ #,,能夠以文本數(shù)據(jù)輸入,也能夠以圖像輸入,也能夠以字符代碼輸入,也能夠以聲音輸入。字符分析部20若取得評(píng)價(jià)對(duì)象字符“#”,則將該字符歸一化為一定大小。在圖2 所示的例子中,使用比例尺40而將字符“ 的大小歸一化,使得恰好收斂在豎X橫=6 格X6格的框內(nèi)。于是,能夠忽略在輸入了評(píng)價(jià)對(duì)象的字符時(shí)的大小的偏差,只正確地分析字符的形狀。接著,字符分析部20從在比例尺40中統(tǒng)一的字符“#”中檢測(cè)要素。在圖2所示的例子中,將曲線近似于直線,將全部的要素檢測(cè)為直線(41 44)。另外,從字符形狀中檢測(cè)線的方法并沒(méi)有特別限定,考慮適當(dāng)?shù)夭捎靡酝膱D像處理技術(shù)。例如,可使用非專(zhuān)利文獻(xiàn)1所記載的角檢測(cè)技術(shù)、輪廓線(邊緣)檢測(cè)技術(shù)。接著,字符分析部20對(duì)檢測(cè)出的全部要素,根據(jù)該線的種類(lèi)和方向等而分類(lèi),分解要素。圖2所示的例只是一例,本發(fā)明并不限定于此,例如,字符分析部20由于從字符
”中檢測(cè)出7個(gè)直線的要素,所以將這些要素分類(lèi)為豎線41、橫線42、右上斜線43、右下斜線44的4組。這樣,字符分析部20將字符“#”分解為1個(gè)豎線41、1個(gè)橫線42、1個(gè)右上斜線43、4個(gè)右下斜線44的合計(jì)7個(gè)要素(線)。關(guān)于這些分解的要素(線)的長(zhǎng)度,比例尺40也是有效的。字符分析部20使用在上述的步驟中獲得的評(píng)價(jià)對(duì)象的字符(這里是“ #”)的分析結(jié)果,求出有關(guān)評(píng)價(jià)對(duì)象字符的形狀的特性值。特性值是用數(shù)值、順序(rank)等的值表示字符特性的值,用于計(jì)算上述評(píng)價(jià)值。在本實(shí)施方式中,字符分析部20從分析結(jié)果中,作為有關(guān)形狀的特性值而求出“要素長(zhǎng)”和“不同方位性”的兩種特性值。圖3的(a)和(b)是表示字符分析部20求出的、有關(guān)形狀的特性值的具體例的圖。 圖3的(a)和(b)表示基于沿著圖2所示的步驟獲得的字符“ # ”的分析結(jié)果,字符分析部20分別求出了字符“ #,,的“要素長(zhǎng)度”和“不同方位性”的例子。(要素長(zhǎng)度的計(jì)算)特性值“要素長(zhǎng)度”表示字符具有的全部要素(線)的長(zhǎng)度。要素長(zhǎng)度越大,字符的結(jié)構(gòu)使用越多的線,因此,能夠判斷為形成字符的線越多,字符越復(fù)雜(難以誤檢測(cè))。如上所述,被分解的各個(gè)線的長(zhǎng)度能夠使用在將字符歸一化時(shí)使用的比例尺40
來(lái)表不。分析的結(jié)果,字符“ #,,由豎線41、橫線42、右上斜線43、右下斜線44的4個(gè)組構(gòu)成,所以字符分析部20首先按每個(gè)組小計(jì)線的長(zhǎng)度。在圖3(a)所示的例子中計(jì)算為如下 關(guān)于豎線41,長(zhǎng)度“5”的線為1條且小計(jì)“5”,關(guān)于橫線42,長(zhǎng)度“5. 5”的線為1條且小計(jì) “5. 5”,關(guān)于右上斜線43,長(zhǎng)度“3”的線為1條且小計(jì)“3”,關(guān)于右下斜線44,4條的長(zhǎng)度分別為 “2. 5”、“2”、“ 1. 5”、“1.5” 且小計(jì) “7. 5”。最后,字符分析部20將全部組的線的長(zhǎng)度的小計(jì)合計(jì),求出字符“ # ”的要素長(zhǎng)度為“ 21 ”。這里,數(shù)字的“ 1 ”相當(dāng)于比例尺40的1格的長(zhǎng)度。這里,在將豎線的長(zhǎng)度的小計(jì)設(shè)為X、將橫線的長(zhǎng)度的小計(jì)設(shè)為Y、將斜線的長(zhǎng)度的小計(jì)(右上、左下相加)設(shè)為Z時(shí),也可以根據(jù)下式特性值“要素長(zhǎng)度” =X+Y+kZ(其中,k > 1),計(jì)算要素長(zhǎng)度。即,相比豎橫線,對(duì)斜線的長(zhǎng)度附加加權(quán)系數(shù)的結(jié)構(gòu)。例如,若在圖3所示的例子中,設(shè)為加權(quán)系數(shù)k = 2,則豎線41、橫線42、右上斜線43、右下斜線44的小計(jì)分別成為“5”、“5.5”、“6”、“15”,字符“#”的要素長(zhǎng)度成為“31.5”。根據(jù)上述結(jié)構(gòu),能夠?qū)⑾啾蓉Q橫線(水平方向的線或垂直方向的線),多使用斜線的字符判斷為更復(fù)雜(難以誤檢測(cè))。(不同方位性的計(jì)算)特性值“不同方位性”表示構(gòu)成字符的線的方向的多樣性。能夠判斷為越是使用各種方向的線的字符,字符越復(fù)雜。例如,相比僅由橫線構(gòu)成的字符,能夠判斷為由豎線和橫線構(gòu)成的字符更復(fù)雜,進(jìn)而,能夠判斷為還使用斜線的字符更復(fù)雜。如上所述,字符“ #”分解的各個(gè)線根據(jù)線的方向,被分類(lèi)為豎線41、橫線42、右上斜線43、右下斜線44的4個(gè)組。字符分析部20首先確認(rèn)有無(wú)屬于各個(gè)組的線。由于字符 “ #,,具有上述4個(gè)組全部種類(lèi)的線,所以成為豎線“有”、橫線“有”、右上斜線“有”、右下斜線“有”。若字符“ 口,,的情況下,成為豎線“有”、橫線“有”、右上斜線“無(wú)”、右下斜線“無(wú)”。然后,字符分析部20在圖3(b)所示的表的“有無(wú)”欄中,若屬于該組的線為“有” 則存儲(chǔ)“ 1 ”,若“無(wú)”則存儲(chǔ)“0”。由于字符“ #,,被判斷為全部線為“有”,所以在“有無(wú)”欄中存儲(chǔ)“ 1 ”。也可以將這些直接合計(jì)而作為不同方位性的特性值,但在本實(shí)施方式中,使用方向系數(shù)而對(duì)斜線為“有”的情況附加權(quán)重。在圖3(b)所示的例子中,例如相對(duì)于將豎線、橫線的方向系數(shù)設(shè)為“1”,將右上斜線和右下斜線的方向系數(shù)預(yù)先設(shè)定為“2”。字符分析部20根據(jù)“有無(wú)” X “方向系數(shù)”求出每個(gè)組的不同方位性的小計(jì)。具體地說(shuō),計(jì)算為如下關(guān)于豎線41,1X1且小計(jì)“1”,關(guān)于橫線42,IX 1且小計(jì)“1”關(guān)于右上斜線43,1X2且小計(jì)“2”,關(guān)于右下斜線44,1X2且小計(jì) “2”。最后,字符分析部20將全部組的不同方位性的小計(jì)合計(jì),求出字符“ # ”的不同方位性為“6”。根據(jù)上述結(jié)構(gòu),能夠判斷為相比豎橫線,使用斜線的字符更復(fù)雜。另外,也可以對(duì)將字符如上所述那樣歸一化為一定大小時(shí)的線的長(zhǎng)度設(shè)置閾值, 在該方位的線的長(zhǎng)度的小計(jì)為一定以下的情況下,判斷為該方位的線為“無(wú)”。這里,例如將豎線的長(zhǎng)度為規(guī)定的閾值以上時(shí)設(shè)為P = 1,將不是時(shí)設(shè)為P = 0,將橫線的長(zhǎng)度為規(guī)定的閾值以上時(shí)設(shè)為Q = 1,將不是時(shí)設(shè)為Q = 0,將斜線的長(zhǎng)度為規(guī)定的閾值以上時(shí)設(shè)為R= 1,將不是時(shí)設(shè)為R = 0。此時(shí),也可以根據(jù)下式特性值“不同方位性” =P+Q+hR(其中,h > 1),計(jì)算不同方位性。這里,將斜線的方向(有右上斜線43和右下斜線44的兩組) 在1組時(shí)設(shè)為h = 2,在2組時(shí)設(shè)為h = 4。此外,將規(guī)定的閾值設(shè)為“2”?;谶@樣的規(guī)則,由于字符”的豎線的長(zhǎng)度小計(jì)為閾值以上,所以P = 1,橫線也相同地成為Q = 1,斜線也同樣成為R = 1,此外,由于有右上斜線和右下斜線的2組斜線, 所以成為h = 4。因此,根據(jù)上述的式,計(jì)算為不同方位性=1+1+4X1 = 6。例如,在字符 “ 口,,的情況下,由于豎線成為P = 1,橫線成為Q = 1,斜線成為R = 0,所以不同方位性的特性值計(jì)算為1+1 = 2。在“要素長(zhǎng)度”和“不同方位性”的計(jì)算中,對(duì)斜線進(jìn)行加權(quán)的結(jié)構(gòu)有如下所述的優(yōu)點(diǎn)。一般,在背景圖像(=非字符圖像)內(nèi),豎線或橫線相比斜線存在更多的情況較多。 因此,換言之,能夠判斷為線密集,且在該線中,斜向的線形成字符的可能性高。即,可以說(shuō)具有斜線的字符傾向于被容易檢測(cè)且難以誤檢測(cè)。因此,相比豎線或橫線,對(duì)斜線設(shè)置權(quán)重而進(jìn)行字符的評(píng)價(jià),從而能夠更正確地評(píng)價(jià)字符的“誤檢測(cè)的難度”。若使用通過(guò)這樣的評(píng)價(jià)而獲得的評(píng)價(jià)值,結(jié)果,能夠進(jìn)一步縮短字符串檢測(cè)處理的處理時(shí)間,且能夠進(jìn)一步提高檢測(cè)精度。如上求出的有關(guān)字符的形狀的各個(gè)特性值,也可以在最終計(jì)算出評(píng)價(jià)值為止的期間,暫時(shí)保存在暫時(shí)存儲(chǔ)部14中,一次求出的特性值也可以是按每個(gè)字符以非易失性的方式保存在字符特性存儲(chǔ)部31中。此外,有關(guān)字符的形狀的特性值并不限定于上述的例子,例如也可以將要素(線) 數(shù)作為特性值,也可以將筆畫(huà)數(shù)作為特性值。字符分析部20也可以對(duì)輸入的一個(gè)字符執(zhí)行以上的字符分析,也可以在輸入了關(guān)鍵詞的情況下,對(duì)構(gòu)成該關(guān)鍵詞的全部字符中的每個(gè)字符執(zhí)行以上的字符分析。圖4是表示對(duì)多個(gè)字符執(zhí)行了字符分析的結(jié)果的一例的圖。例如,在“ 口 # ,卜,, 這樣的字符串輸入到字符評(píng)價(jià)裝置2的情況下,如圖4所示,與“ # ”同樣地,字符分析部20 也對(duì)“口”、“7”、“卜”,從字符形狀進(jìn)行要素檢測(cè)并進(jìn)行要素的分解。在圖4中,由于“
的分析結(jié)果如圖2和圖3(a)、(b)所示,所以省略記載。評(píng)價(jià)值計(jì)算部21使用字符分析部20計(jì)算出的字符形狀的特性值和/或根據(jù)在字符特性存儲(chǔ)部31中存儲(chǔ)的字符特性信息所求出的特性值,計(jì)算評(píng)價(jià)對(duì)象字符的評(píng)價(jià)值(誤檢測(cè)的難度)。在字符特性存儲(chǔ)部31中,存儲(chǔ)有與通過(guò)字符分析部20的分析而獲得的有關(guān)形狀的字符特性以外的所有字符特性有關(guān)的信息。在本實(shí)施方式中,作為一例,評(píng)價(jià)值計(jì)算部21 基于在字符特性存儲(chǔ)部31中存儲(chǔ)的字符特性信息,確定評(píng)價(jià)對(duì)象字符的特性值“判別容易性”和特性值“書(shū)寫(xiě)一樣性”。
(判別容易性的確定)特性值“判別容易性”表示該字符不會(huì)被弄錯(cuò)為其他字符(且沒(méi)有向不是字符的區(qū)域混同),正確地判別為是該字符的容易性??梢哉f(shuō)字符形狀在幾何學(xué)上簡(jiǎn)單且像字符的特征性的形狀少的字符、漢字的部首等經(jīng)常作為各種字符的要素的一部分使用的字符、具有雖然是不同的字符但形狀相似的字符的判別容易性低,容易誤檢測(cè)。在本實(shí)施方式中,設(shè)為從過(guò)去的經(jīng)驗(yàn)中,已預(yù)先決定了判別容易性。例如,根據(jù)過(guò)去的誤檢測(cè)的比例、作為部首(“左偏旁”或“右偏旁”等)而成為其他字符的一部分的出現(xiàn)頻度、形狀酷似的不同的字符有多少等,設(shè)定了數(shù)值,使得越是容易混淆的字符,判別容易性成為越低的值。圖5(a)是表示在字符特性存儲(chǔ)部31中存儲(chǔ)的、有關(guān)判別容易性的字符特性信息的具體例的圖。在圖5(a)所示的例子中,判別容易性的特性值對(duì)每個(gè)字符相關(guān)聯(lián)而存儲(chǔ)。 這樣,字符特性信息也可以是“判別容易性”的特性值其本身?;蛘撸部梢允菍?duì)字符特性信息進(jìn)一步進(jìn)行其他處理,從而最終能夠確定特性值的信息。在本實(shí)施方式中,作為一例,將判別容易性的定義域設(shè)為0 <“判別容易性10。 設(shè)為越是與某一其他字符容易混淆,越是接近0的值。例如,在片假名的“口 ”是與漢字的 “口( < 6 )”相似,在幾何學(xué)上也容易混淆為不是字符的四角形。此外,漢字“葉”的“左偏旁”和漢字“知”的“右偏旁”等,作為其他字符的一部分而出現(xiàn)的概率大的字符。因此,例如將片假名的“ 口,,的判別容易性設(shè)為1。另一方面,片假名的“ #,,比“ 口,,復(fù)雜,此外,沒(méi)有相似形狀的字符,且成為其他字符的一部分的概率小。因此,例如將片假名的“ # ”的判別容易性設(shè)為“8”。關(guān)于其他的全部字符也同樣對(duì)每個(gè)字符預(yù)先存儲(chǔ)了判別容易性的特性值。根據(jù)上述結(jié)構(gòu),評(píng)價(jià)值計(jì)算部21通過(guò)參照字符特性存儲(chǔ)部31,能夠立即把握輸入的字符的判別容易性。(書(shū)寫(xiě)一樣性的確定)特性值“書(shū)寫(xiě)一樣性”表示同義且形狀不同的字符,即書(shū)寫(xiě)變化(variation)少。 若書(shū)寫(xiě)變化有多個(gè),且這些形狀差很遠(yuǎn),則在僅對(duì)一種書(shū)寫(xiě)進(jìn)行了檢索時(shí),遺漏該字符的危險(xiǎn)變高。因此,最好只有一種書(shū)寫(xiě),書(shū)寫(xiě)變化有多個(gè)的情況下也越少越好。進(jìn)而,該不同書(shū)寫(xiě)字符之間形狀越相似越好。即,字符的書(shū)寫(xiě)越一樣越難以誤檢測(cè)。因此,在本實(shí)施方式中,評(píng)價(jià)值計(jì)算部21對(duì)評(píng)價(jià)對(duì)象字符,基于有無(wú)不同書(shū)寫(xiě)字符、以及在有的情況下不同書(shū)寫(xiě)變化數(shù)和不同書(shū)寫(xiě)字符之間的相似度,將該字符的“書(shū)寫(xiě)一樣性”確定為定義域0<“書(shū)寫(xiě)一樣性10。值越大,意味著越?jīng)]有容易混淆的其他書(shū)寫(xiě), 難以誤檢測(cè)。圖5(b)是表示在字符特性存儲(chǔ)部31中存儲(chǔ)的、有關(guān)書(shū)寫(xiě)一樣性的字符特性信息的具體例的圖。在圖5(b)所示的例子中,字符特性信息是對(duì)存在不同書(shū)寫(xiě)字符的每個(gè)字符組,將這些字符之間的相似度相關(guān)聯(lián)的信息。評(píng)價(jià)值計(jì)算部21參照?qǐng)D5(b)所示的表,檢索評(píng)價(jià)對(duì)象字符是否包含在不同書(shū)寫(xiě)組中。若字符沒(méi)有包含在不同書(shū)寫(xiě)組中,則評(píng)價(jià)值計(jì)算部21將該字符的書(shū)寫(xiě)一樣性的特性值確定為最大值的“10”。在字符包含在不同書(shū)寫(xiě)組中的情況下,接著,評(píng)價(jià)值計(jì)算部21參照在這些字符之間的字符形狀的相似度。例如,相似度“10”是不同書(shū)寫(xiě)字符之間酷似的情況(例如,字母的“C”的大字符和小字符),書(shū)寫(xiě)的多樣性賦予不會(huì)對(duì)字符串檢測(cè)處理產(chǎn)生惡劣影響的字符組。評(píng)價(jià)值計(jì)算部21按照上述相似度,將這樣的字符的書(shū)寫(xiě)一樣性(特性值)確定為“10”?;蛘撸?,“口”、“ # ”、“夕”、“卜”的4個(gè)字符分別具有“^ ”、“ff”、“o”、“i”這
樣的不同的書(shū)寫(xiě)法,這些字符之間的字符形狀完全不相似。因此,也可以對(duì)這些4個(gè)不同書(shū)寫(xiě)字符組,設(shè)定相似度“ 1 ”。此時(shí),評(píng)價(jià)值計(jì)算部21按照上述相似度,將“ 口 ”、“ # ”、“ ” ”、 “卜”的4個(gè)字符的書(shū)寫(xiě)一樣性全部確定為“1”。根據(jù)上述結(jié)構(gòu),評(píng)價(jià)值計(jì)算部21能夠?qū)σ粋€(gè)評(píng)價(jià)對(duì)象字符取得有關(guān)誤檢測(cè)的難度的4種特性值。即,字符分析部20計(jì)算出的“要素長(zhǎng)度”和“不同方位性”、在字符特性存儲(chǔ)部31中存儲(chǔ)的“判別容易性”以及根據(jù)在字符特性存儲(chǔ)部31中存儲(chǔ)的有關(guān)不同書(shū)寫(xiě)的字符特性信息確定的“書(shū)寫(xiě)一樣性”這4種。評(píng)價(jià)值計(jì)算部21能夠使用這4種特性值,計(jì)算字符的評(píng)價(jià)值,評(píng)價(jià)字符的誤檢測(cè)的難度。在本實(shí)施方式中,評(píng)價(jià)值計(jì)算部21根據(jù)下式來(lái)計(jì)算評(píng)價(jià)值。評(píng)價(jià)值=要素長(zhǎng)度X不同方位性X判別容易性X書(shū)寫(xiě)一樣性圖6是表示評(píng)價(jià)值計(jì)算部21計(jì)算的評(píng)價(jià)值的一例的圖。例如,在“ 口 # ”卜”這樣的字符串輸入到字符評(píng)價(jià)裝置2的情況下,如圖6所示,評(píng)價(jià)值計(jì)算部21對(duì)“ α ”、“ # ”、 “,”、“卜”的4個(gè)字符分別取得4種(要素長(zhǎng)度、不同方位性、判別容易性、書(shū)寫(xiě)一樣性)特性值。然后,評(píng)價(jià)值計(jì)算部21根據(jù)上述式,將字符“ 口,,的評(píng)價(jià)值計(jì)算為“ 口,,的評(píng)價(jià)值 =12X2X1X1 =對(duì)。對(duì)“ # ”、“?”、“卜”也同樣地計(jì)算評(píng)價(jià)值。這樣計(jì)算出的評(píng)價(jià)值對(duì)每個(gè)字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部32中,成為字符串檢測(cè)裝置3能夠參照的狀態(tài)。另外,圖6所示的每個(gè)字符的特性值的表是用于計(jì)算評(píng)價(jià)值的途中經(jīng)過(guò)的信息, 暫時(shí)存儲(chǔ)在暫時(shí)存儲(chǔ)部14中即可,也可以如后述的圖7所示,在評(píng)價(jià)值以非易失性的方式記錄在字符信息存儲(chǔ)部32之后被刪除。但是,在DVD播放器1的字符評(píng)價(jià)裝置2對(duì)同一個(gè)字符多次進(jìn)行評(píng)價(jià)的狀況下,也可以將最初一度求出的特性值按每個(gè)字符以非易失性的方式存儲(chǔ)在存儲(chǔ)部11中。圖7是表示在字符信息存儲(chǔ)部32中存儲(chǔ)的字符數(shù)據(jù)庫(kù)的具體例的圖。如圖7所示,字符信息存儲(chǔ)部32的字符數(shù)據(jù)庫(kù)成為按每個(gè)字符,將用于唯一識(shí)別字符的字符代碼、字符評(píng)價(jià)裝置2計(jì)算出的該字符的評(píng)價(jià)值、字符串檢測(cè)裝置3在字符的比對(duì)處理中利用的字符的特征量相關(guān)聯(lián)的結(jié)構(gòu)。在這里沒(méi)有特別限定,但假設(shè)字符的特征量是以線要素捕捉字符的特征量、檢測(cè)出字符的輪廓線、邊緣的特征量、檢測(cè)出字符的角的特征量等。但是,并不限定于這些例子, 只要是字符串檢測(cè)裝置3能夠比較在字符數(shù)據(jù)庫(kù)中存儲(chǔ)的特征量和從檢測(cè)對(duì)象的活動(dòng)圖像中獲得的特征量,判斷字符的一致、不一致的信息,則特征量可以是任意信息。在圖7所示的例子中,字符“ 口 ”的評(píng)價(jià)值為“對(duì)”,字符“ # ”的評(píng)價(jià)值為“ 1008”, 字符“?”的評(píng)價(jià)值為“114”,字符“卜”的評(píng)價(jià)值為“48”。因此,在輸入了關(guān)鍵詞“口
卜”的情況下,字符串檢測(cè)裝置3參照在字符信息存儲(chǔ)部32的字符數(shù)據(jù)庫(kù),能夠把握關(guān)鍵詞內(nèi)的全部字符的誤檢測(cè)的難度。在上述的例子中,字符串檢測(cè)裝置3能夠判斷為字符“ 最難以誤檢測(cè)。
字符評(píng)價(jià)處理流程圖8是表示字符評(píng)價(jià)裝置2執(zhí)行的字符評(píng)價(jià)處理的流程的流程圖。首先,對(duì)字符評(píng)價(jià)裝置2輸入用于評(píng)價(jià)字符的指示和評(píng)價(jià)對(duì)象字符。評(píng)價(jià)對(duì)象字符也可以是一個(gè)字,也可以是多個(gè)字。若輸入評(píng)價(jià)對(duì)象字符(在SlOl中“是”),則首先,字符分析部20在一定的比例尺上將字符的大小歸一化之后分析字符的形狀,檢測(cè)構(gòu)成該字符的要素(直線、曲線等) (S102)。接著,字符分析部20按檢測(cè)出的每個(gè)要素分解字符,并按線的方向等的每個(gè)種類(lèi)分類(lèi)各個(gè)要素(S103)。然后,字符分析部20基于分解的線在上述比例尺上的長(zhǎng)度,計(jì)算特性值“要素長(zhǎng)度”(S104)。此外,字符分析部20基于分解的線的方向的多樣性,計(jì)算特性值“不同方位性,,(S105)。另一方面,評(píng)價(jià)值計(jì)算部21參照字符特性存儲(chǔ)部31,確定評(píng)價(jià)對(duì)象字符的“判別容易性”的特性值(S106)。此外,評(píng)價(jià)值計(jì)算部21參照字符特性存儲(chǔ)部31,取得有關(guān)不同書(shū)寫(xiě)的字符特性信息(S107)。然后,評(píng)價(jià)值計(jì)算部21判斷在取得的字符特性信息(例如,圖5(b))中是否作為不同書(shū)寫(xiě)組而包含上述評(píng)價(jià)對(duì)象字符(S108)。這里,評(píng)價(jià)值計(jì)算部21在判斷為評(píng)價(jià)對(duì)象字符不具有不同書(shū)寫(xiě)字符的情況下(在 S108中“否”),將該字符的“書(shū)寫(xiě)一樣性”的特性值確定為最高值(這里是“10”) (S109)。 相反,評(píng)價(jià)值計(jì)算部21在判斷為評(píng)價(jià)對(duì)象字符具有不同書(shū)寫(xiě)字符的情況下(在S108中 “是”),根據(jù)評(píng)價(jià)對(duì)象字符和該不同書(shū)寫(xiě)字符之間的相似度,確定“書(shū)寫(xiě)一樣性”的特性值
(5110)。例如,若相似度為“1”(不相似),則將“書(shū)寫(xiě)一樣性”的特性值確定為“ 1 ”。然后,評(píng)價(jià)值計(jì)算部21基于在以上的各個(gè)步驟中求出的4個(gè)特性值,即“要素長(zhǎng)度”、“不同方位性”、“判別容易性”以及“書(shū)寫(xiě)一樣性”,計(jì)算表示誤檢測(cè)的難度的評(píng)價(jià)值
(5111)。例如,也可以通過(guò)將各個(gè)特性值相乘而求出評(píng)價(jià)值。最后,評(píng)價(jià)值計(jì)算部21將計(jì)算出的評(píng)價(jià)值與該評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部32中(Si 12)。在圖8中,表示了在S104 SllO中依次求出4個(gè)特性值的例子,但這些4個(gè)特性值并不限定于圖8所示的各個(gè)步驟的順序。各個(gè)特性值也可以按任意順序求出。根據(jù)在以上敘述的字符評(píng)價(jià)裝置2的結(jié)構(gòu)和字符評(píng)價(jià)方法,能夠基于字符的形狀特性和語(yǔ)言特性來(lái)評(píng)價(jià)字符的誤檢測(cè)的難度。若能夠預(yù)先把握哪個(gè)字符難以誤檢測(cè),哪個(gè)字符容易誤檢測(cè),則字符串檢測(cè)裝置3能夠以短時(shí)間且低負(fù)荷處理,更有效地從圖像中檢測(cè)目標(biāo)字符串。另外,在本實(shí)施方式中,說(shuō)明了字符評(píng)價(jià)裝置2對(duì)成為檢測(cè)對(duì)象的全部字符預(yù)先計(jì)算每個(gè)字符的評(píng)價(jià)值的結(jié)構(gòu),但本發(fā)明并不限定于上述結(jié)構(gòu)。例如,字符評(píng)價(jià)裝置2的結(jié)構(gòu)也可以是,對(duì)字符串檢測(cè)裝置3輸入了想要檢測(cè)的關(guān)鍵詞之后,對(duì)該輸入的各個(gè)字符首先進(jìn)行評(píng)價(jià)的結(jié)構(gòu)。接著,詳細(xì)說(shuō)明使用字符評(píng)價(jià)裝置2計(jì)算出的評(píng)價(jià)值,更有效地執(zhí)行字符串檢測(cè)處理的字符串檢測(cè)裝置3的結(jié)構(gòu)。字符串檢測(cè)裝置3的結(jié)構(gòu)
本發(fā)明的字符串檢測(cè)裝置3(圖1)是利用字符評(píng)價(jià)裝置2計(jì)算出的每個(gè)字符的評(píng)價(jià)值,有效地執(zhí)行字符串檢測(cè)處理的裝置。字符串檢測(cè)處理是從活動(dòng)圖像或靜止圖像等中檢測(cè)指定的字符串(可以是1個(gè)字,也可以是多個(gè)字)的處理??刂撇?0的關(guān)鍵詞取得部22取得用于檢測(cè)字符串的指示和應(yīng)檢測(cè)的目標(biāo)字符
串ο圖9是說(shuō)明本發(fā)明的DVD播放器1、顯示部12 (電視)、以及操作部13 (遙控器) 的外觀、用戶輸入目標(biāo)字符串的情況的圖。在圖9所示的例子中,DVD播放器1將用于用戶操作字符串檢測(cè)裝置3的操作畫(huà)面輸出到顯示部12,進(jìn)行顯示。在圖9所示的例子中,顯示部12顯示用戶能夠操作操作部13而輸入檢索的字符串的GUI畫(huà)面。用戶通過(guò)操作操作部13,從而能夠?qū)ψ址畽z測(cè)裝置3輸入想要從處理對(duì)象的活動(dòng)圖像(或靜止圖像)中找出的字符串。圖9表示作為目標(biāo)字符串而輸入了關(guān)鍵詞“口# ”卜”的例子。若輸入關(guān)鍵詞之后,例如操作部13的決定按鈕等被按下,則關(guān)鍵詞取得部22取得輸入的關(guān)鍵詞(例如,“ 口 # 7卜”),并存儲(chǔ)在暫時(shí)存儲(chǔ)部14的關(guān)鍵詞保持部14b中。圖10是表示在關(guān)鍵詞保持部14b中保持的關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如圖 10所示,關(guān)鍵詞取得部22按照關(guān)鍵詞的排列順序存儲(chǔ)取得的關(guān)鍵詞的各個(gè)字符。例如,在關(guān)鍵詞“ 口 #、y卜,,的情況下,由于“ 口”是在該關(guān)鍵詞中的第一個(gè)字符,所以關(guān)鍵詞取得部 22存儲(chǔ)字符“ 口 ”,進(jìn)而對(duì)該字符相關(guān)聯(lián)而存儲(chǔ)字符順序“ 1,,的信息。對(duì)“ # ”、“、y ”、“卜,,的各個(gè)字符也同樣地相關(guān)聯(lián)而存儲(chǔ)字符順序“ 2 ”、“ 3 ”、“ 4 ”。檢索順序決定部23決定在字符檢索部M從圖像中檢索關(guān)鍵詞時(shí)的、檢索關(guān)鍵詞中的各個(gè)字符的順序。檢索順序決定部23基于字符評(píng)價(jià)裝置2計(jì)算出的評(píng)價(jià)值,決定檢索順序。具體地說(shuō),從難以誤檢測(cè)(即,容易正確地找出)的字符起優(yōu)先地進(jìn)行字符串檢測(cè)處理,評(píng)價(jià)值越高的字符,將檢索順序越設(shè)定為上位。在輸入的關(guān)鍵詞為“ α #、y卜,,的情況下,檢索順序決定部23參照如圖7所示的字符信息存儲(chǔ)部32的字符數(shù)據(jù)庫(kù),取得“ 口 ”、“#”、“, ”、“卜,,的各個(gè)字符的評(píng)價(jià)值。由于各個(gè)字符的評(píng)價(jià)值分別為“對(duì)”、“1008”、“114”、“48”,所以檢索順序決定部23將檢索順序決定為“ #,,為第一位、“ ”,,為第二位、“卜,,為第三位“ 口,,為第四位,使得從評(píng)價(jià)值高的字
符起按順序檢索。如圖10所示,檢索順序決定部23也可以將決定的檢索順序與輸入的各個(gè)字符相關(guān)聯(lián)而存儲(chǔ)。字符檢索部M執(zhí)行從圖像中檢測(cè)指定的字符串的字符串檢測(cè)處理。字符檢索部 M將在由關(guān)鍵詞取得部22取得的關(guān)鍵詞中包含的字符以一個(gè)字一個(gè)字檢索。具體地說(shuō),比較在字符信息存儲(chǔ)部32的字符數(shù)據(jù)庫(kù)中存儲(chǔ)的目標(biāo)字符的特征量和從圖像中提取出的特征量,檢測(cè)一致(match)的特征量包含在圖像中的情況,判斷為目標(biāo)字符包含在圖像中。在本發(fā)明中,字符檢索部M在檢索關(guān)鍵詞的各個(gè)字符時(shí),根據(jù)檢索順序決定部^ 決定的檢索順序來(lái)執(zhí)行字符串檢測(cè)處理。例如在上述的例子中,字符檢索部M參照在關(guān)鍵詞保持部14b中存儲(chǔ)的檢索順序(圖10),按照“ # ”、“”、“卜”、“ 口”的順序,從處理對(duì)象圖像中檢索目標(biāo)字符。字符檢索部M從最難以誤檢測(cè)的“ # ”起進(jìn)行檢索,若能夠檢測(cè)出“ # ”,則繼續(xù)下一個(gè)字符的檢索。例如,如圖10所示,也可以對(duì)能檢測(cè)出的字符賦予表示已檢測(cè)的“已”的標(biāo)志。接著,字符檢索部M從未檢測(cè)的字符中檢索順序最高的字符,重復(fù)這個(gè)步驟。字符檢索部M若不能檢測(cè)“ # ”,則判斷為在該圖像中不包含指定的關(guān)鍵詞“ 口 # ,卜”。由于該判斷是從難以誤檢測(cè)的字符起按順序進(jìn)行,所以盡早被正確地判斷,且能夠省略花費(fèi)之后的容易誤檢測(cè)的字符的時(shí)間的浪費(fèi)的檢測(cè)處理。進(jìn)而,字符檢索部M在一個(gè)以上的字符的檢測(cè)成功之后,基于已檢測(cè)的字符和想要從此檢測(cè)的字符的字符排列,預(yù)測(cè)字符之間的位置關(guān)系,將檢索對(duì)象區(qū)域篩選為已檢測(cè)的字符的相鄰區(qū)域,執(zhí)行字符串檢測(cè)處理。詳細(xì)地說(shuō),在已檢測(cè)字符為字符串中的第η個(gè)字符,且下一個(gè)要檢索的字符為字符串中的第η+1個(gè)的字符的情況下,字符檢索部M能夠?qū)z索對(duì)象區(qū)域限定為上述已檢測(cè)字符的右側(cè)和下側(cè)的規(guī)定大小的區(qū)域,而不是作為圖像全體。此外,字符檢索部M在下一個(gè)要檢索的字符為字符串中的第η-1個(gè)字符的情況下,能夠限定為上述已檢測(cè)字符的左側(cè)和上側(cè)的規(guī)定大小的區(qū)域。根據(jù)上述結(jié)構(gòu),與從圖像全體區(qū)域中檢索目標(biāo)字符的情況相比,能夠進(jìn)一步篩選檢索范圍,所以能夠進(jìn)一步縮短處理時(shí)間。若使用具體例說(shuō)明,則如下。假設(shè)在字符檢索部M檢測(cè)出檢索順序第1個(gè)字符 ”之后,接著檢索字符“ ”。根據(jù)圖10的字符順序,相對(duì)于已檢測(cè)字符“ # ”為第2個(gè),
下一個(gè)要檢索的“”’為第3個(gè)。因此,“”’在“ # ”的相鄰區(qū)域(在日語(yǔ)中,尤其是在右或下)存在的可能性高。因此,字符檢索部M將檢索“ ” ”的對(duì)象區(qū)域限定為上述已檢測(cè)字符“#”的相鄰區(qū)域。例如,如圖11所示,限定為“ #,,的右側(cè)的規(guī)定大小的區(qū)域(虛線框內(nèi)網(wǎng)點(diǎn)區(qū)域)。 例如,如圖11所示,若將已檢測(cè)字符的區(qū)域的大小設(shè)為hXh,則規(guī)定的大小可以考慮其右側(cè)的:3hx:3h的大小的區(qū)域等。在圖12所示的例子中,在已檢測(cè)字符(例如“#”)的右側(cè)區(qū)域(1)中,檢測(cè)目標(biāo)字符(例如“7”)。這樣,若限定檢索對(duì)象區(qū)域,則與檢索圖像全體的情況相比,能夠以極短時(shí)間且低負(fù)荷檢索目標(biāo)字符“,”。另外,在已檢測(cè)字符(例如“#”)的右側(cè)區(qū)域(1)中沒(méi)有發(fā)現(xiàn)目標(biāo)字符(例如 “,”)的情況下,依次擴(kuò)大檢索對(duì)象區(qū)域,使得接著成為存在發(fā)現(xiàn)的可能性的下側(cè)區(qū)域(2)、 左側(cè)區(qū)域(3)、上側(cè)區(qū)域G),繼續(xù)進(jìn)行檢索即可。但是,這樣也沒(méi)有發(fā)現(xiàn)的情況下,最終將檢索對(duì)象區(qū)域返回到圖像全體,再次進(jìn)行檢索即可。根據(jù)上述結(jié)構(gòu),能夠飛躍地提高字符檢索部M中的字符串檢測(cè)處理的處理效率。另外,字符檢索部M也可以對(duì)第η個(gè)已檢測(cè)字符,隨著下一個(gè)要檢索的字符的字
符順序成為第(η士2)個(gè)、第(η±3)個(gè)、第(η±4)個(gè).......等那樣已檢測(cè)字符和下一個(gè)要
檢索的字符之間的距離變長(zhǎng),預(yù)測(cè)其位置關(guān)系,根據(jù)位置關(guān)系來(lái)進(jìn)一步擴(kuò)大檢索對(duì)象區(qū)域。例如,在圖12所示的例子中,在檢測(cè)“知覚口 # ”卜”的“知”,接著檢測(cè)“卜”的情況下,若將已檢測(cè)字符“知”的區(qū)域的尺寸設(shè)為hXh,則考慮用于檢索“卜”的區(qū)域限定為其右側(cè)的MiXMi的大小的區(qū)域等。此時(shí),也能夠與將圖像全體設(shè)為檢索對(duì)象區(qū)域的情況相比,大幅限定檢索對(duì)象區(qū)域的面積,能夠?qū)崿F(xiàn)處理負(fù)荷的降低和處理時(shí)間的縮短。
22
進(jìn)而,字符檢索部M也可以從由圖像獲得的特征量中檢測(cè)線/邊緣密集的帶狀的區(qū)域,若是沿著水平方向的帶區(qū)域則作為字符為橫寫(xiě)的可能性高,比上下區(qū)域優(yōu)先檢索左右區(qū)域,若是沿著垂直方向的帶區(qū)域則作為字符為豎寫(xiě)的可能性高,比左右區(qū)域優(yōu)先檢索上下區(qū)域。根據(jù)上述結(jié)構(gòu),能夠進(jìn)一步提高在字符檢索部M中的處理效率。此外,字符檢索部M也可以在檢測(cè)出字符串中的某一字符(例如“#”)之后接著檢索其他字符時(shí),優(yōu)先檢索在檢測(cè)出的字符的兩側(cè)的字符(這里是“口”和“7”)中評(píng)價(jià)值大的字符(這里是“?”)。字符串檢索處理流程圖13是表示DVD播放器1中的圖像處理和字符串檢測(cè)處理的流程的流程圖。在這里,字符串檢測(cè)裝置3從活動(dòng)圖像中檢索指定的關(guān)鍵詞,輸出檢測(cè)出目標(biāo)的關(guān)鍵詞的再現(xiàn)位置。首先,對(duì)字符串檢測(cè)裝置3輸入用于檢測(cè)字符串的指示和想要檢索的目標(biāo)字符串 (例如,關(guān)鍵詞“口卜”等)。檢索對(duì)象字符串可以是1個(gè)字,也可以是多個(gè)字符。此外, 也可以在這里指定檢測(cè)對(duì)象的活動(dòng)圖像。若輸入關(guān)鍵詞(在S201中“是”),則關(guān)鍵詞取得部22將輸入的關(guān)鍵詞存儲(chǔ)在關(guān)鍵詞保持部14b中620 。這里,關(guān)鍵詞取得部22根據(jù)字符的排列,對(duì)取得的每個(gè)字符,將字符順序相關(guān)聯(lián)而存儲(chǔ)在同一個(gè)關(guān)鍵詞保持部14b中。接著,檢索順序決定部23參照字符信息存儲(chǔ)部32,對(duì)由關(guān)鍵詞取得部22取得的關(guān)鍵詞的各個(gè)字符取得評(píng)價(jià)值。然后,檢索順序決定部23按照評(píng)價(jià)值由大到小的順序決定檢索順序(S20;3)。檢索順序決定部23將決定的檢索順序按每個(gè)字符存儲(chǔ)在關(guān)鍵詞保持部 14b 中。活動(dòng)圖像再現(xiàn)部25從圖像存儲(chǔ)部30中讀出指定的檢測(cè)對(duì)象的活動(dòng)圖像,對(duì)再現(xiàn)位置t進(jìn)行初始化(設(shè)置為t = 0) (S204),開(kāi)始活動(dòng)圖像的再現(xiàn)(S205)。在本實(shí)施方式中,從處理效率的觀點(diǎn)出發(fā),不對(duì)活動(dòng)圖像的全部幀執(zhí)行字符串檢測(cè)處理,而是將以規(guī)定秒為間隔(例如,10秒)提取的幀作為檢索對(duì)象幀?;顒?dòng)圖像再現(xiàn)部25再現(xiàn)活動(dòng)圖像,直到再現(xiàn)位置t達(dá)到檢索對(duì)象幀為止(在S206 中“否”),活動(dòng)圖像再現(xiàn)部25推進(jìn)活動(dòng)圖像的再現(xiàn)(S210)。只要再現(xiàn)位置t沒(méi)有達(dá)到活動(dòng)圖像的最后幀,就能夠推進(jìn)活動(dòng)圖像的再現(xiàn)(在S211中“否”)。然后,若在再現(xiàn)位置t推進(jìn)之后,再現(xiàn)位置t達(dá)到檢索對(duì)象幀(在S206中“是”),則靜止圖像生成部沈生成達(dá)到的檢索對(duì)象幀的靜止圖像(解碼處理)(S207)。接著,特征量提取部27從生成的靜止圖像中提取特征量(S208)。上述特征量是例如使用在非專(zhuān)利文獻(xiàn)1所記載的角檢測(cè)技術(shù)、輪廓線(邊緣)檢測(cè)技術(shù)等而獲得的信息,是字符串檢測(cè)裝置3能夠識(shí)別字符形狀的信息。字符檢索部M對(duì)檢索對(duì)象幀執(zhí)行字符串檢測(cè)處理(S209)。詳細(xì)地說(shuō),進(jìn)行檢索對(duì)象幀的特征量與在字符信息存儲(chǔ)部32中存儲(chǔ)的關(guān)鍵詞中的各個(gè)字符的特征量之間的比對(duì)處理,從而判斷指定的關(guān)鍵詞(例如,“ 口 # ,卜”)是否包含在檢索對(duì)象幀中。參照?qǐng)D14 在后面敘述字符串檢測(cè)處理的流程的細(xì)節(jié)。字符檢索部M按每個(gè)字符進(jìn)行檢索,并輸出是否對(duì)該檢索對(duì)象幀檢測(cè)出指定的關(guān)鍵詞。若在S209中,上述檢索對(duì)象幀中的字符串檢測(cè)處理結(jié)束,則活動(dòng)圖像再現(xiàn)部25進(jìn)一步推進(jìn)活動(dòng)圖像的再現(xiàn)(S210)。只要再現(xiàn)位置t沒(méi)有達(dá)到活動(dòng)圖像的最后幀,活動(dòng)圖像再現(xiàn)部25就能夠推進(jìn)活動(dòng)圖像的再現(xiàn)(在S211中“否”)。然后,若達(dá)到下一個(gè)檢索對(duì)象幀,則對(duì)該檢索對(duì)象幀重復(fù)上述的字符串檢測(cè)處理。之后,字符檢索部M也以規(guī)定秒(to 秒)為間隔對(duì)檢索對(duì)象幀執(zhí)行字符串檢測(cè)處理,并存儲(chǔ)檢測(cè)出關(guān)鍵詞“ 7卜”的幀的再現(xiàn)位置。這樣,最終在再現(xiàn)位置t達(dá)到最后幀,結(jié)束了活動(dòng)圖像的再現(xiàn)的情況下(在S211 中“是”),字符檢索部M輸出字符串檢測(cè)處理的結(jié)果(S212)。例如,在活動(dòng)圖像中關(guān)鍵詞 “ α #、、J卜”一次也沒(méi)有被檢測(cè)出的情況下,字符檢索部M將檢測(cè)失敗的消息輸出到顯示部 12?;蛘?,在活動(dòng)圖像中的幀中檢測(cè)出關(guān)鍵詞的情況下,將關(guān)鍵詞的檢測(cè)成功的消息和與檢測(cè)出該關(guān)鍵詞的幀對(duì)應(yīng)的檢測(cè)再現(xiàn)位置輸出到顯示部12。字符串檢索處理流程-細(xì)節(jié)圖14是表示字符串檢測(cè)裝置3執(zhí)行的字符串檢測(cè)處理的流程的流程圖。在圖13 所示的S208中,若特征量提取部27提取檢索對(duì)象幀(靜止圖像)的特征量,則字符串檢測(cè)裝置3開(kāi)始S209的字符串檢測(cè)處理。首先,字符檢索部M參照關(guān)鍵詞保持部14b,取得在輸入的關(guān)鍵詞中、檢索順序?yàn)樽钌衔坏淖址鳛闄z測(cè)對(duì)象字符(S301)。在圖10所示的例子中,取得字符“ # ”作為檢測(cè)對(duì)象字符。然后,字符檢索部M比較從檢索對(duì)象幀(靜止圖像)中提取出的特征量和在字符信息存儲(chǔ)部32中存儲(chǔ)的“ #,,的特征量,并對(duì)上述檢索對(duì)象幀進(jìn)行檢測(cè)對(duì)象字符“ #,,的檢索(S302)。在上述檢索對(duì)象幀中不存在目標(biāo)字符(這里是“ #”)的情況下(在S303中“否”), 判斷為在該檢索對(duì)象幀中不包含指定的關(guān)鍵詞,結(jié)束對(duì)于該檢索對(duì)象幀的字符串檢測(cè)處理 (S304)。另一方面,在上述檢索對(duì)象幀中存在目標(biāo)字符(這里是“ #”)的情況下(在S303 中“是”),將字符”作為已檢測(cè)字符,如圖10所示,在關(guān)鍵詞保持部14b中,對(duì)已檢測(cè)字符“ # ”樹(shù)立已檢測(cè)標(biāo)志630 。這里,若對(duì)輸入的關(guān)鍵詞的全部字符完成檢測(cè)處理(即, 若對(duì)全部字符設(shè)定已檢測(cè)標(biāo)志)(在S306中“否”),則字符檢索部M判斷為在該檢索對(duì)象幀中包含了指定的關(guān)鍵詞,存儲(chǔ)該檢索對(duì)象幀的再現(xiàn)位置,并結(jié)束對(duì)于該檢索對(duì)象幀的字符串檢測(cè)處理(S307)。另一方面,若還有未進(jìn)行檢索的未處理字符(在S306中“是”),則字符檢索部M 取得在未處理字符(例如,圖10所示的未賦予已檢測(cè)標(biāo)志的字符)中、檢索順序?yàn)樽钌衔坏淖址?在圖10所示的例子中,字符“#”)作為下一個(gè)檢測(cè)對(duì)象字符(S308)。接著,字符檢索部M基于已檢測(cè)字符“ 的位置,限定檢索對(duì)象區(qū)域(S309)。例如,也可以在圖12所示的檢索對(duì)象幀中,將檢索對(duì)象區(qū)域限定為“ # ”的相鄰區(qū)域(1) (4).或者,也可以根據(jù)圖10所示的字符順序,由于相對(duì)于已檢測(cè)字符”為第2個(gè)字符, 下一個(gè)檢測(cè)對(duì)象字符“ ”為第3個(gè)字符,所以將檢索對(duì)象區(qū)域限定為“# ”的右區(qū)域⑴和下區(qū)域O)。字符檢索部M對(duì)限定的檢索對(duì)象區(qū)域進(jìn)行與檢測(cè)對(duì)象字符“,,,的特征量之間的比對(duì),檢索字符(S310)。在上述檢索對(duì)象區(qū)域中存在目標(biāo)字符的情況下(在S311中“是”),對(duì)在S305中檢測(cè)的字符樹(shù)立已檢測(cè)標(biāo)志。若有未處理字符,則重復(fù)字符的檢索(S308 ),若沒(méi)有,則結(jié)束在該檢索對(duì)象幀中的字符串檢測(cè)處理(S307)。另一方面,在上述檢索對(duì)象區(qū)域中不存在目標(biāo)字符的情況下(在S311中“否”), 將范圍擴(kuò)大至幀的全部區(qū)域,進(jìn)行檢測(cè)對(duì)象字符的檢索(S3U)。若這樣也不存在目標(biāo)字符 (在S303中“否”),則結(jié)束在該檢索對(duì)象幀中的字符串檢測(cè)處理(S304)。若字符檢索部M結(jié)束在該檢索對(duì)象幀中的字符串檢測(cè)處理(S304或S307),則活動(dòng)圖像再現(xiàn)部25直到達(dá)到下一個(gè)檢索對(duì)象幀為止推進(jìn)活動(dòng)圖像的再現(xiàn),對(duì)新的檢索對(duì)象幀重復(fù)上述的字符串檢索處理。根據(jù)在以上敘述的字符串檢測(cè)裝置3的結(jié)構(gòu)和字符串檢測(cè)方法,字符串檢測(cè)裝置 3在從處理對(duì)象圖像中檢測(cè)指定的關(guān)鍵詞時(shí),能夠從難以誤檢測(cè)的字符起按順序檢索字符。 難以誤檢測(cè)的字符與容易誤檢測(cè)的字符相比,從少的候選中正確且較快地檢測(cè)出的可能性高。因此,與按照關(guān)鍵詞中的字符的排列依次檢索的情況相比,能夠以短時(shí)間且低負(fù)荷處理,精度更高且更有效地從圖像中檢測(cè)目標(biāo)字符串。此外,根據(jù)本發(fā)明的字符串檢測(cè)裝置3,由于使用每個(gè)字符的特征量來(lái)一個(gè)字一個(gè)字進(jìn)行比對(duì),所以不需要將多個(gè)字符的字符串圖像和特征量作為樣本進(jìn)行保存。即,由于不需要準(zhǔn)備橫寫(xiě)、豎寫(xiě)的兩種樣本,所以能夠?qū)崿F(xiàn)字符信息存儲(chǔ)部32中的存儲(chǔ)器節(jié)省化。此外,處理時(shí)間上也比以往的結(jié)構(gòu)有利。本發(fā)明的效果本發(fā)明的字符串檢測(cè)裝置3構(gòu)成為,即使是在從圖像中檢測(cè)由多個(gè)字符構(gòu)成的關(guān)鍵詞的情況下,也使用每個(gè)字符的特征量而一個(gè)字一個(gè)字進(jìn)行比對(duì)。然后,字符串檢測(cè)裝置 3的特征在于,與關(guān)鍵詞的字符的排列無(wú)關(guān)地按照難以誤檢測(cè)的字符起按順序執(zhí)行字符串檢索處理。上述特征起到能夠解決在上述結(jié)構(gòu)中產(chǎn)生的以下問(wèn)題的效果。如上所述,在從對(duì)象圖像中一個(gè)字符一個(gè)字符進(jìn)行檢索的結(jié)構(gòu)中,不需要生成橫寫(xiě)、豎寫(xiě)的兩種的多個(gè)字符串圖像,與以往相比,處理時(shí)間和存儲(chǔ)器容量都有利。但是,在這樣的結(jié)構(gòu)中,存在如下的問(wèn)題。以下,使用具體例說(shuō)明這個(gè)問(wèn)題點(diǎn)。一般,有時(shí)在背景圖像(=非字符圖像)內(nèi),存在多個(gè)如“_”、“ + ”、“□”那樣由豎橫邊緣構(gòu)成的簡(jiǎn)單的右偏旁的花紋。因此,例如,在將圖15所示的圖像作為檢索對(duì)象圖像,作為想要檢測(cè)的關(guān)鍵詞而指定了“口#,卜”這樣的字符串的情況下,若從第ι個(gè)字符的“口” 起按順序進(jìn)行檢測(cè),則存在多個(gè)與“ 口 ”相似的形狀的區(qū)域,所以存在在檢索第1個(gè)字符的階段舉出多余的多個(gè)候選的問(wèn)題。若從圖15所示的圖像中檢索“ π ”,則存在門(mén)框150、窗
框151.......漢字“知”的右偏旁的部分152等錯(cuò)誤地當(dāng)做字符“口”,被誤檢測(cè)的問(wèn)題。通
過(guò)舉出基于這樣的誤檢測(cè)的多余的候選,其結(jié)果,存在結(jié)果會(huì)浪費(fèi)多余的處理時(shí)間的問(wèn)題。 此外,在對(duì)該候選數(shù)設(shè)置界限的情況下,還存在如下的問(wèn)題原本字幕中的片假名的“ 口”必須列舉為第一名,但由于存在多個(gè)錯(cuò)誤的候選,所以該正確的候選153從候選排除的情況, 結(jié)果檢測(cè)精度變差。此外,如字符“ π ”等那樣,成為某一其他字符的要素(“左偏旁”或“右偏旁”等) 的概率大的字符,除了想要檢測(cè)的對(duì)象之外,連某一其他字符的要素也被錯(cuò)誤地列舉為候選的概率大。例如,作為關(guān)鍵詞而指定了7卜”這樣的字符串的情況下,“ 口”是“葉”的“左偏旁”且“知”的右偏旁等,成為某一其他字符的要素的概率大的字符。因此,例如在對(duì)象圖像中存在“知覚口 # ,卜”這樣的字符串的情況下,若從“ 口 ”開(kāi)始檢索,則在最初的檢索的階段,除了“ 口,,之外,“知”的右偏旁的部分也被列舉為候選,與上述相同地,結(jié)果需要多余的處理時(shí)間。此外,在對(duì)該候選數(shù)設(shè)置了界限的情況下,正確字符串從候選中排除, 結(jié)果檢測(cè)精度變差。此外,在使用字符形狀的特征量進(jìn)行字符的比較的情況下,如“desk”和“DESK”、 “ >9 h r ”和“ 'J > - ”、“澤”和“沢”那樣,雖然是相同的含義但有方式不同的書(shū)寫(xiě),若考慮這個(gè)情況,則存在所需的處理時(shí)間增加的問(wèn)題。但是,本發(fā)明的字符評(píng)價(jià)裝置2從誤檢測(cè)的難度這樣的觀點(diǎn)來(lái)評(píng)價(jià)字符并賦予評(píng)價(jià)值,能夠?qū)γ總€(gè)字符客觀地判斷難以(容易)誤檢測(cè)到什么程度。并且,將本發(fā)明的字符串檢測(cè)裝置3構(gòu)成為,在一個(gè)字一個(gè)字檢索關(guān)鍵詞的各個(gè)字符的情況下,從其中最難以誤檢測(cè)的字符起按順序檢索。因此,對(duì)如上述的字符“ π ”等那樣極容易誤檢測(cè)的字符進(jìn)行極低的評(píng)價(jià),在后面進(jìn)行檢索,而如字符“ # ”等那樣比較難以誤檢測(cè)且容易正確地檢測(cè)出的字符被優(yōu)先檢索。 此外,具有不同書(shū)寫(xiě)的字符且花費(fèi)處理時(shí)間的字符也進(jìn)行低的評(píng)價(jià),在后面進(jìn)行檢索。這樣,本發(fā)明在從對(duì)象圖像中檢測(cè)指定的字符串時(shí),通過(guò)從上述評(píng)價(jià)值大的字符起按順序進(jìn)行檢索,從而能夠縮短處理時(shí)間。此外,通過(guò)從容易正確地檢測(cè)出的字符起按順序進(jìn)行檢索,從而還能夠期待精度提高的效果。此外,由于是一個(gè)字一個(gè)字進(jìn)行比對(duì)的結(jié)構(gòu),所以成為模型(model)的特征量只要以一個(gè)字一個(gè)字保持即可,還能夠期待存儲(chǔ)器節(jié)省化的效果。大多數(shù)字符圖像具有如下特征與字符以外的圖像相比,邊緣(線)密集,且邊緣的不同方位性高(線朝向各種方向)。因此,一般,可以說(shuō)尤其強(qiáng)烈地具有這些特征的字符傾向于容易檢測(cè)且難以誤檢測(cè)(=將背景的花紋等誤檢測(cè)為字符的可能性小)。因此,通過(guò)從將這些特征決定作為指標(biāo)的評(píng)價(jià)值大的字符起進(jìn)行檢索,從而能夠在最初的檢索的階段有效地篩選候選,所以能夠縮短處理時(shí)間。例如,在作為關(guān)鍵詞而指定了 “ 口 # ,卜”這樣的字符串的情況下,通過(guò)從邊緣密集且邊緣的不同方位性高的”起開(kāi)始檢索,而不是從在背景圖像內(nèi)往往存在相似的花紋的“口”(參照?qǐng)D15)起開(kāi)始檢索,所以消除了在最初的檢索階段列舉多個(gè)多余的候選,結(jié)果,能夠縮短處理時(shí)間。此外,即使是在對(duì)候選數(shù)設(shè)置了界限的情況下,正確字符串從候選排除的可能性降低,結(jié)果還能夠提高檢測(cè)精度。此外,可以說(shuō)成為某一其他字符的要素(“左偏旁”或“右偏旁”等)的概率大的字符,除了想要檢測(cè)的對(duì)象之外,連某一其他字符的要素也被錯(cuò)誤地列舉為候選的概率大。例如,作為關(guān)鍵詞而指定了 “ 口 # ,卜,,這樣的字符串的情況下,“ 口”是“葉”的“左偏旁”且 “知”的右偏旁等,成為某一其他字符的要素的概率大的字符,所以例如在對(duì)象圖像中存在 “知覚口 # ,卜”這樣的字符串的情況下,若從“ π ”開(kāi)始檢索,則在最初的檢索的階段,除了 “ 口 ”之外,“知”的右偏旁的部分也被列舉為候選。但是,若從成為某一其他字符的要素的概率小的字符“ # ”開(kāi)始檢索,則在最初的檢索的階段,從“知覚口 # ,卜”這樣的字符串的部分中只有“ 被列舉為候選的可能性高。因此,通過(guò)著眼于這一點(diǎn)而從決定的評(píng)價(jià)值大的字符起開(kāi)始檢索,從而能夠在最初的檢索的階段有效地篩選候選,所以能夠縮短處理時(shí)間。
此外,即使是在對(duì)候選數(shù)設(shè)置了界限的情況下,正確字符串從候選中排除的可能性降低,結(jié)果還能夠提高檢測(cè)精度。此外,在不具有不同的書(shū)寫(xiě)法的字符,或者即使在具有的情況下,這些字符之間的字符形狀相似的字符,在檢索對(duì)象圖像內(nèi)時(shí)僅檢索1種字符形狀即可,所以可以說(shuō)與必須對(duì)2種以上的字符形狀進(jìn)行檢索的字符相比,容易盡快地檢測(cè)出。因此,通過(guò)著眼于這一點(diǎn)而從決定的評(píng)價(jià)值大的字符起開(kāi)始檢索,從而能夠縮短處理時(shí)間。此外,根據(jù)本發(fā)明的字符串檢測(cè)方法,由于一個(gè)字符一個(gè)字符進(jìn)行檢索,所以不需要生成橫寫(xiě)、豎寫(xiě)的兩種字符串圖像,還能夠兼顧了存儲(chǔ)器節(jié)省化。此外,根據(jù)本發(fā)明的字符串檢測(cè)裝置3,在從難以誤檢測(cè)的字符起按順序進(jìn)行檢索而檢測(cè)出目標(biāo)字符之后,在第2個(gè)字符以后的字符檢測(cè)處理中,能夠?qū)z索對(duì)象區(qū)域篩選為已檢測(cè)的字符區(qū)域相鄰而不是圖像全體。根據(jù)上述結(jié)構(gòu),字符檢索部M在檢索上述的“ 口 ”時(shí),評(píng)價(jià)值比“ 口 ”高的“ # ”、 “,”、“卜”的各個(gè)字符全部成為已檢測(cè),能夠根據(jù)這些“ 、“ , ”、“卜”的各個(gè)字符的位置關(guān)系來(lái)限定“ 口”有可能存在的區(qū)域。在圖12所示的例子中,能夠限定為區(qū)域(3)。由此,在從圖像全體中檢索“口”的結(jié)構(gòu)中,列舉門(mén)框150、窗框151......等錯(cuò)誤
的多個(gè)候選,但在本申請(qǐng)的限定為區(qū)域(3)而檢索“口”的結(jié)構(gòu)中,即使是錯(cuò)誤也停留在將 “知”的右偏旁的部分152列舉為候選的程度。由此,能夠大幅削減處理負(fù)荷,其結(jié)果,能夠大幅縮短處理時(shí)間,能夠有效且高精度地從圖像中檢測(cè)關(guān)鍵詞。本發(fā)明并不限定于上述的實(shí)施方式,在權(quán)利要求項(xiàng)中所示的范圍內(nèi)可進(jìn)行各種變更。即,將在權(quán)利要求所示的范圍內(nèi)適當(dāng)?shù)刈兏募夹g(shù)手段相組合而獲得的實(shí)施方式也包含在本發(fā)明的技術(shù)范圍中。最后,字符評(píng)價(jià)裝置2和字符串檢測(cè)裝置3的各個(gè)模塊,尤其是字符分析部20、評(píng)價(jià)值計(jì)算部21、關(guān)鍵詞取得部22、檢索順序決定部23以及字符檢索部M既可以由硬件邏輯構(gòu)成,也可以如下所示那樣使用CPU而由軟件實(shí)現(xiàn)。即,字符評(píng)價(jià)裝置2(字符串檢測(cè)裝置幻包括執(zhí)行實(shí)現(xiàn)各種功能的控制程序的命 CPU (central processing unit) >#fi|7±iifMjiWR0M(read only memory)
述程序的RAM (random access memory)、以及存儲(chǔ)上述程序和各種數(shù)據(jù)的存儲(chǔ)器等的存儲(chǔ)裝置(記錄介質(zhì))等。并且,通過(guò)將作為實(shí)現(xiàn)上述的功能的軟件的字符評(píng)價(jià)裝置2 (字符串檢測(cè)裝置幻的控制程序的程序代碼(執(zhí)行形式程序、中間代碼程序、源程序)以計(jì)算機(jī)可讀取地記錄的記錄介質(zhì)提供給上述字符評(píng)價(jià)裝置2 (字符串檢測(cè)裝置幻,該計(jì)算機(jī)(或者 CPU或MPU)讀出并執(zhí)行在記錄介質(zhì)中記錄的程序代碼,也能夠?qū)崿F(xiàn)本發(fā)明的目的。作為上述記錄介質(zhì),例如,可使用磁帶或卡帶等的帶類(lèi)、包括軟盤(pán)(注冊(cè)商標(biāo))/硬盤(pán)等的磁盤(pán)或⑶-R0M/M0/MD/DVD/⑶-R等的光盤(pán)的盤(pán)類(lèi)、IC卡(包括存儲(chǔ)卡)/光卡等的卡類(lèi)、或者掩模R0M/EPR0M/EEPR0M/閃速ROM等的半導(dǎo)體存儲(chǔ)器類(lèi)等。此外,也可以將字符評(píng)價(jià)裝置2(字符串檢測(cè)裝置幻構(gòu)成為可與通信網(wǎng)絡(luò)連接, 經(jīng)由通信網(wǎng)絡(luò)而提供上述程序代碼。作為該通信網(wǎng)絡(luò),沒(méi)有特別限定,例如可使用因特網(wǎng)、 內(nèi)部網(wǎng)、外部網(wǎng)(extra net)、LAN、ISDN、VAN、CATV 通信網(wǎng)、虛擬專(zhuān)用網(wǎng)(virtual private network)、電話線路網(wǎng)、移動(dòng)通信網(wǎng)、衛(wèi)星通信網(wǎng)等。此外,作為構(gòu)成通信網(wǎng)絡(luò)的傳輸介質(zhì),沒(méi)有特別限定,例如可使用IEEE1394、USB、電力線傳輸、電纜TV線路、電話線、ADSL線路等的有線,也可以使用IrDA或遙控那樣的紅外線、藍(lán)牙(Bluetooth)(注冊(cè)商標(biāo))、802. 11無(wú)線、HDR、移動(dòng)電話網(wǎng)、衛(wèi)星線路、地面波數(shù)字網(wǎng)等的無(wú)線。另外,本發(fā)明通過(guò)上述程序代碼以電子傳輸具體化的、埋入載波的計(jì)算機(jī)數(shù)據(jù)信號(hào)的方式也能夠?qū)崿F(xiàn)。產(chǎn)業(yè)上的可利用性本發(fā)明的字符串檢測(cè)裝置由于能夠以短時(shí)間且低負(fù)荷處理,從圖像中檢測(cè)指定的字符,所以可應(yīng)用于處理圖像的數(shù)字視頻記錄器/播放器、藍(lán)光盤(pán)記錄器/播放器、數(shù)字?jǐn)z像機(jī)、數(shù)字照相機(jī)、數(shù)字電視、個(gè)人計(jì)算機(jī)、移動(dòng)電話機(jī)、打印機(jī)、掃描儀等處理靜止圖像和/ 或活動(dòng)圖像的各種圖像處理裝置。本發(fā)明的字符串檢測(cè)裝置在負(fù)荷大的活動(dòng)圖像處理中也能夠不會(huì)損傷實(shí)時(shí)性且短時(shí)間內(nèi)檢測(cè)出字符串,所以將本發(fā)明的字符串檢測(cè)裝置應(yīng)用于活動(dòng)圖像處理裝置或活動(dòng)圖像再現(xiàn)裝置,優(yōu)點(diǎn)會(huì)尤其大。
權(quán)利要求
1.一種字符串檢測(cè)裝置,從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于, 包括字符信息存儲(chǔ)部,按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;檢索順序決定部件,基于在作為應(yīng)檢測(cè)的字符串而輸入到本裝置的檢測(cè)對(duì)象字符串中包含的每個(gè)字符的、存儲(chǔ)在上述字符信息存儲(chǔ)部中的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索部件,根據(jù)上述檢索順序決定部件決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。
2.如權(quán)利要求1所述的字符串檢測(cè)裝置,其特征在于,上述檢索順序決定部件決定在上述檢測(cè)對(duì)象字符串中包含的字符中,最初檢索表示上述誤檢測(cè)的難度的評(píng)價(jià)值具有最大的值的字符。
3.如權(quán)利要求1或2所述的字符串檢測(cè)裝置,其特征在于,若上述字符檢索部件從上述圖像中檢測(cè)出在上述檢測(cè)對(duì)象字符串中包含的目標(biāo)字符, 則上述檢索順序決定部件將下一個(gè)要檢索的字符決定為在上述檢測(cè)對(duì)象字符串中的字符的排列中,在已檢測(cè)的字符的兩側(cè)的字符中、上述評(píng)價(jià)值大的一個(gè)。
4.如權(quán)利要求1或2所述的字符串檢測(cè)裝置,其特征在于,上述檢索順序決定部件決定上述檢索順序,使得按照字符的評(píng)價(jià)值由大到小的順序檢索出。
5.如權(quán)利要求1至4的任一項(xiàng)所述的字符串檢測(cè)裝置,其特征在于,上述字符檢索部件若從上述圖像中檢測(cè)出在上述檢測(cè)對(duì)象字符串中包含的目標(biāo)字符, 則將用于檢索下一個(gè)字符的檢索對(duì)象區(qū)域從上述圖像的全部區(qū)域限定為已檢測(cè)的字符的相鄰區(qū)域。
6.如權(quán)利要求5所述的字符串檢測(cè)裝置,其特征在于,在上述已檢測(cè)的字符為在上述檢測(cè)對(duì)象字符串中的字符的排列中第η個(gè)字符,并且在下一個(gè)要檢索的字符為第(η+1)個(gè)以上的字符的情況下,上述字符檢索部件將檢索對(duì)象區(qū)域限定為上述已檢測(cè)的字符的右側(cè)和下側(cè)的相鄰區(qū)域,在下一個(gè)要檢索的字符為第(η-1)個(gè)以下的字符的情況下,上述字符檢索部件將檢索對(duì)象區(qū)域限定為上述已檢測(cè)的字符的左側(cè)和上側(cè)的相鄰區(qū)域。
7.如權(quán)利要求1至6的任一項(xiàng)所述的字符串檢測(cè)裝置,其特征在于,上述評(píng)價(jià)值是,作為字符的形狀越復(fù)雜越難以誤檢測(cè)的字符,基于字符的形狀特性而計(jì)算出的值,基于表示形成字符的線的長(zhǎng)度的要素長(zhǎng)度的特性值以及表示形成字符的線的方向的多樣性的不同方位性的特性值中的至少一個(gè),計(jì)算上述評(píng)價(jià)值。
8.如權(quán)利要求1至7的任一項(xiàng)所述的字符串檢測(cè)裝置,其特征在于,作為越是沒(méi)有與其他字符或其他字符的一部分相似的形狀的字符越是難以誤檢測(cè)的字符,基于表示與其他字符的判別的容易性的判別容易性的特性值,計(jì)算上述評(píng)價(jià)值。
9.如權(quán)利要求1至8的任一項(xiàng)所述的字符串檢測(cè)裝置,其特征在于,作為越是字符的書(shū)寫(xiě)為一樣的字符越是難以誤檢測(cè)的字符,根據(jù)基于不同書(shū)寫(xiě)的有無(wú)或在有不同書(shū)寫(xiě)的情況下的不同書(shū)寫(xiě)字符之間的相似度而確定的書(shū)寫(xiě)一樣性的特性值,計(jì)算上述評(píng)價(jià)值。
10.如權(quán)利要求7所述的字符串檢測(cè)裝置,其特征在于,與形成上述字符的線的方向?yàn)樗交虼怪狈较虻木€相比,對(duì)線的方向傾斜的線進(jìn)行加權(quán),從而計(jì)算上述要素長(zhǎng)度的特性值和上述不同方位性的特性值。
11.如權(quán)利要求1至10的任一項(xiàng)所述的字符串檢測(cè)裝置,其特征在于,上述圖像是由多個(gè)幀構(gòu)成的活動(dòng)圖像,上述字符檢索部件按從上述活動(dòng)圖像中作為檢索對(duì)象而提取出的每個(gè)檢索對(duì)象幀,檢索在上述檢測(cè)對(duì)象字符串中包含的各個(gè)字符,上述字符檢索部件在按照上述檢索順序檢索各個(gè)字符時(shí),在從上述檢索對(duì)象幀中不能檢測(cè)出目標(biāo)字符的情況下,結(jié)束在該檢索對(duì)象幀中的檢索,在下一個(gè)檢索對(duì)象幀中檢索檢索順序?yàn)樽畛醯淖址?br>
12.—種字符評(píng)價(jià)裝置,其特征在于,包括字符分析部件,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;字符特性存儲(chǔ)部,按每個(gè)字符預(yù)先存儲(chǔ)字符特性;特性值確定部件,基于上述字符分析部件分析的字符特性以及在上述字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算部件,使用上述特性值確定部件確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)部件,將上述評(píng)價(jià)值計(jì)算部件計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。
13.如權(quán)利要求12所述的字符評(píng)價(jià)裝置,其特征在于,上述字符分析部件對(duì)上述評(píng)價(jià)對(duì)象字符的形狀特性進(jìn)行分析,上述特性值確定部件基于上述字符分析部件分析的結(jié)果,對(duì)上述評(píng)價(jià)對(duì)象字符計(jì)算表示形成字符的線的長(zhǎng)度的要素長(zhǎng)度的特性值以及表示形成字符的線的方向的多樣性的不同方位性的特性值中的至少一個(gè)。
14.如權(quán)利要求12或13所述的字符評(píng)價(jià)裝置,其特征在于,上述字符特性存儲(chǔ)部,作為越是沒(méi)有與其他字符或其他字符的一部分相似的形狀的字符越是難以誤檢測(cè)的字符,將與其他字符的判別的容易性作為字符特性而對(duì)每個(gè)字符存儲(chǔ),上述特性值確定部件基于在上述字符特定存儲(chǔ)部中存儲(chǔ)的、上述評(píng)價(jià)對(duì)象字符的字符特性,確定上述評(píng)價(jià)對(duì)象字符的判別容易性的特性值。
15.如權(quán)利要求12至14的任一項(xiàng)所述的字符評(píng)價(jià)裝置,其特征在于,上述字符特性存儲(chǔ)部,作為字符特性而將不同書(shū)寫(xiě)字符的組與不同書(shū)寫(xiě)字符之間的相似度相關(guān)聯(lián)而存儲(chǔ),上述特性值確定部件基于上述評(píng)價(jià)對(duì)象字符的不同書(shū)寫(xiě)的有無(wú)或在有不同書(shū)寫(xiě)的情況下的不同書(shū)寫(xiě)字符之間的相似度,作為越是字符的書(shū)寫(xiě)為一樣的字符越是難以誤檢測(cè)的字符,確定該評(píng)價(jià)對(duì)象字符的書(shū)寫(xiě)一樣性的特性值。
16.一種圖像處理裝置,其特征在于,包括權(quán)利要求1至11的任一項(xiàng)所述的字符串檢測(cè)直ο
17.一種字符串檢測(cè)方法,從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串,其特征在于,包括字符串取得步驟,取得作為應(yīng)檢測(cè)的字符串而輸入的檢測(cè)對(duì)象字符串;檢索順序決定步驟,基于在按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值的字符信息存儲(chǔ)部中存儲(chǔ)的、在上述字符串取得步驟中取得的上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符的評(píng)價(jià)值,對(duì)該每個(gè)字符決定用于從上述圖像中檢索字符的檢索順序;以及字符檢索步驟,根據(jù)在上述檢索順序決定步驟中決定的檢索順序,按在上述檢測(cè)對(duì)象字符串中包含的每個(gè)字符,檢索上述圖像。
18.一種字符評(píng)價(jià)方法,其特征在于,包括字符分析步驟,對(duì)作為應(yīng)評(píng)價(jià)誤檢測(cè)的難度的字符而輸入的評(píng)價(jià)對(duì)象字符的字符特性進(jìn)行分析;特性值確定步驟,基于在上述字符分析步驟中分析的字符特性以及在按每個(gè)字符預(yù)先存儲(chǔ)字符特性的字符特性存儲(chǔ)部中存儲(chǔ)的字符特性中的至少一個(gè),確定上述評(píng)價(jià)對(duì)象字符的每個(gè)字符特性的特性值;評(píng)價(jià)值計(jì)算步驟,使用在上述特性值確定步驟中確定的一個(gè)以上的特性值,計(jì)算表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;以及評(píng)價(jià)值存儲(chǔ)步驟,將在上述評(píng)價(jià)值計(jì)算步驟中計(jì)算出的評(píng)價(jià)值與上述評(píng)價(jià)對(duì)象字符相關(guān)聯(lián)而存儲(chǔ)在字符信息存儲(chǔ)部中。
19.一種控制程序,用于使計(jì)算機(jī)執(zhí)行權(quán)利要求17或18所述的各個(gè)步驟。
20.一種計(jì)算機(jī)可讀取的記錄介質(zhì),記錄了權(quán)利要求19所述的控制程序。
全文摘要
提供一種字符串檢測(cè)裝置和方法、字符評(píng)價(jià)裝置和方法,實(shí)現(xiàn)對(duì)于圖像的字符串檢測(cè)處理的處理負(fù)荷減輕和處理時(shí)間縮短。本發(fā)明的字符串檢測(cè)裝置是從圖像中檢測(cè)由一個(gè)以上的字符構(gòu)成的字符串的裝置,包括字符信息存儲(chǔ)部(32),按每個(gè)字符存儲(chǔ)表示字符的誤檢測(cè)的難度的評(píng)價(jià)值;檢索順序決定部(23),基于在作為應(yīng)檢測(cè)的字符串而輸入到本裝置的關(guān)鍵詞中包含的每個(gè)字符的、存儲(chǔ)在字符信息存儲(chǔ)部(32)中的評(píng)價(jià)值,對(duì)該每個(gè)字符決定檢索順序;以及字符檢索部(24),根據(jù)決定的檢索順序,按在關(guān)鍵詞中包含的每個(gè)字符進(jìn)行檢索。
文檔編號(hào)G06K9/00GK102194101SQ20111004657
公開(kāi)日2011年9月21日 申請(qǐng)日期2011年2月25日 優(yōu)先權(quán)日2010年3月15日
發(fā)明者相澤知禎 申請(qǐng)人:歐姆龍株式會(huì)社