亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

字符識(shí)別裝置及方法

文檔序號(hào):6371378閱讀:187來源:國知局
專利名稱:字符識(shí)別裝置及方法
技術(shù)領(lǐng)域
本發(fā)明涉及光學(xué)地讀取原稿并識(shí)別字符的字符識(shí)別,特別是,涉及能夠?qū)崿F(xiàn)包含英語單詞的日本語文章等包含多種語言的文章圖像的字符識(shí)別的字符識(shí)別技術(shù)。
發(fā)明的背景在光學(xué)字符識(shí)別裝置(OCR裝置)中,通過濃度投影(histogram)來進(jìn)行字符行的剪切(字符行的提取),進(jìn)而進(jìn)行一個(gè)字符單位的字符塊剪切(字符圖像的提取)。在剪切字符塊時(shí),在字符行方向上取得濃度投影,并根據(jù)濃度投影的變化來分離字符行。接著,對(duì)于各個(gè)字符行,通過取得垂直于字符行的方向上的濃度投影,來提取出各個(gè)字符塊。而且,對(duì)于一個(gè)字符被分離成多個(gè)字符塊的情況,根據(jù)標(biāo)準(zhǔn)的字符尺寸和字符間距的估計(jì)值以及與行垂直的方向上的濃度投影值等信息,組合這些字符塊,以生成作為一個(gè)字符單位的字符圖像的最終字符塊。如果這樣的字符剪切、字符塊生成被正確執(zhí)行,就能實(shí)現(xiàn)高精度的字符識(shí)別。
但是,在第一語言中包含第二語言的文章中,就存在不能進(jìn)行正確的字符塊生成的情況。例如,在包含英語單詞的日語文章中,特別是在英語單詞成比例地出現(xiàn)在日語文章中,由于英語單詞部分的字符寬度和字符間距是不均勻的,并且與標(biāo)準(zhǔn)字符間距的估計(jì)值存在較大的差異,因此,存在錯(cuò)誤地進(jìn)行字符塊的提取,從而識(shí)別精度降低的情況。
對(duì)于混雜了英語單詞的日語文章,為了得到較高的識(shí)別精度,例如,提出了日本專利公開公報(bào)特開平5-101220號(hào)、特開平9-167206號(hào)、特開平6-301822號(hào)中記載的方法。
(1)特開平5-101220號(hào)(稱為現(xiàn)有技術(shù)1)把小于估計(jì)字符尺寸的字符作為半角候選字符,在半角候選字符連續(xù)存在并且半角候選字符串的前或后存在預(yù)定長度以上的空白空間的情況下,把其作為英語單詞候選。通過把相鄰的一對(duì)半角候選字符的尺寸與閾值進(jìn)行比較,在英語單詞候選中包含被判斷為不是英文字符的半角候選字符的情況下,從英語單詞候選中排除該字符。最終被判斷為英語單詞候選的半角候選字符作為半角英文字符,從文章圖像中被圖像剪切,另一方面,被判斷為不是英語單詞候選的半角候選字符與相鄰的半角候選字符再次組合,并剪切掉組合后的字符。
(2)特開平9-167206號(hào)(稱為現(xiàn)有技術(shù)2)一旦進(jìn)行了整個(gè)文章圖像的字符識(shí)別,從識(shí)別結(jié)果中提取出字母數(shù)字字符串,對(duì)于每個(gè)字母數(shù)字字符串判定間距格式,根據(jù)該間距格式來使用均衡間距用空格檢測處理或者固定間距用空格檢測處理,從而高精度地檢測間隔。
(3)特開平6-301822號(hào)(稱為現(xiàn)有技術(shù)3)根據(jù)空白字符、標(biāo)點(diǎn)符號(hào)、括弧等分隔符的位置,決定作為單詞的字符串的對(duì)照范圍,并執(zhí)行與單詞詞典進(jìn)行對(duì)照的后處理。
但是,在現(xiàn)有技術(shù)1中,字符塊提取處理是根據(jù)相鄰的一對(duì)半角候選字符的尺寸,通過判斷是否是英語單詞候選來確定剪切位置,例如,在均衡間距的英語單詞等的一部分字符間存在接觸的情況下,不能分離出英語單詞候選的各個(gè)字符,從而不能正確地識(shí)別英語單詞候選。此外,還不能進(jìn)行再次識(shí)別。
現(xiàn)有技術(shù)2判斷被識(shí)別為字母數(shù)字字符的部分是否均衡。在錯(cuò)誤進(jìn)行字符識(shí)別處理的情況下,對(duì)于未被識(shí)別為字母數(shù)字字符的部分,不進(jìn)行是否為均衡的判斷。而且,還不能進(jìn)行再次識(shí)別。
在現(xiàn)有技術(shù)3中,由于使用分隔符來提取單詞,因此,在未能識(shí)別出分隔符的情況下,不能進(jìn)行單詞對(duì)照。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,提供一種字符識(shí)別裝置,包括適合于對(duì)以第一語言書寫的字符圖像進(jìn)行字符識(shí)別的第一識(shí)別裝置;適合于對(duì)以第二語言書寫的字符圖像進(jìn)行字符識(shí)別的第二識(shí)別裝置;再識(shí)別范圍設(shè)定裝置,用于對(duì)使用上述第一識(shí)別裝置對(duì)字符圖像中所包含的多個(gè)字符圖像進(jìn)行字符識(shí)別的結(jié)果來設(shè)定再識(shí)別范圍,以便根據(jù)以在上述第一識(shí)別裝置中作為上述第二語言被識(shí)別的字符圖像為基點(diǎn)而相鄰的字符圖像的識(shí)別結(jié)果,使用上述第二識(shí)別裝置進(jìn)行再識(shí)別。
根據(jù)本發(fā)明的另一個(gè)方面,提供一種字符識(shí)別方法,包括以下步驟使用適合于對(duì)以第一語言書寫的字符圖像進(jìn)行字符識(shí)別的第一識(shí)別過程,對(duì)字符圖像中包含的多個(gè)字符圖像進(jìn)行字符識(shí)別;設(shè)定再識(shí)別范圍,以便于以在上述第一識(shí)別程序中作為第二語言被識(shí)別的字符圖像為基點(diǎn),根據(jù)相鄰的字符圖像的識(shí)別結(jié)果,使用適合于對(duì)以上述第二語言書寫的字符圖像進(jìn)行字符識(shí)別的第二識(shí)別過程,進(jìn)行再識(shí)別;使用上述第二識(shí)別過程對(duì)所設(shè)定的上述再識(shí)別范圍再次進(jìn)行字符識(shí)別。
本發(fā)明的這些和其他的目的、優(yōu)點(diǎn)及特征將通過結(jié)合附圖對(duì)本發(fā)明的實(shí)施例的描述而得到進(jìn)一步說明。


在此被引為說明書一部分的說明書附圖與說明書相結(jié)合,對(duì)本發(fā)明的實(shí)施例進(jìn)行說明以進(jìn)一步解釋本發(fā)明主旨。
圖1是表示本發(fā)明的一個(gè)實(shí)施例中的字符識(shí)別裝置的方框圖;圖2是表示本發(fā)明的一個(gè)實(shí)施例中的字符識(shí)別方法的流程圖;圖3是表示圖2的步驟S203中的處理的流程圖;
圖4是表示本發(fā)明的第二實(shí)施例中的字符識(shí)別方法的流程圖;圖5是表示圖4的步驟S406中的處理例子的流程圖;圖6是表示圖4的步驟S409中的處理例子的流程圖;圖7是表示替換圖5、圖6的處理的例子的流程圖;圖8是存儲(chǔ)由圖1的字符識(shí)別裝置所執(zhí)行的各種數(shù)據(jù)處理程序的存儲(chǔ)媒體的存儲(chǔ)器分配圖的例子;圖9是表示由多個(gè)設(shè)備執(zhí)行本發(fā)明所涉及的字符識(shí)別方法的字符識(shí)別系統(tǒng)的構(gòu)成例子的方框圖。
具體實(shí)施例方式
下面參照附圖來對(duì)本發(fā)明的最佳實(shí)施例進(jìn)行詳細(xì)說明。
圖1是表示依據(jù)本發(fā)明一個(gè)實(shí)施例的光學(xué)字符識(shí)別裝置(OCR裝置)等字符識(shí)別裝置的方框圖。
字符識(shí)別裝置包括磁盤等外部存儲(chǔ)裝置104和圖形掃描儀108,從外部存儲(chǔ)裝置104讀入原稿圖像數(shù)據(jù)或者直接通過圖形掃描儀108讀取原稿。字符識(shí)別裝置包括用于整體控制的CPU 101,CPU 101的控制程序存儲(chǔ)在ROM 102中。從圖形掃描儀108輸入的圖像被保持在RAM 103中,通過ROM 102內(nèi)的控制程序來執(zhí)行用于字符識(shí)別的處理。用于字符識(shí)別的識(shí)別詞典與控制程序一起存儲(chǔ)在ROM 102中,或者,對(duì)于每種需要的字符類型,從外部存儲(chǔ)裝置104讀入到RAM 103中。
當(dāng)控制程序?qū)?yīng)于多種語言例如日語、英語時(shí),可以充當(dāng)適合于各種語言的第一識(shí)別單元、第二識(shí)別單元。
根據(jù)需要,在字符識(shí)別之前,執(zhí)行去除噪聲等的預(yù)處理。
在圖1中,105是顯示器,106是鍵盤,107是鼠標(biāo)器等指示設(shè)備。而且,109是網(wǎng)絡(luò)接口,用于與未圖示的遠(yuǎn)程裝置進(jìn)行通信,能夠發(fā)送接收程序、識(shí)別詞典、數(shù)據(jù)等。
下面說明在字符識(shí)別裝置中所執(zhí)行的字符識(shí)別方法。
圖2、圖3是表示圖1所示的字符識(shí)別裝置執(zhí)行的字符識(shí)別方法的第一實(shí)施例的流程圖。
在第一實(shí)施例中,執(zhí)行由適合于日語識(shí)別的第一字符識(shí)別單元所進(jìn)行的字符識(shí)別,對(duì)于識(shí)別結(jié)果中類似度低的字符等,執(zhí)行由適合于英語識(shí)別的第二字符識(shí)別單元所進(jìn)行的再識(shí)別。
圖2的流程圖表示第一實(shí)施例的整體流程。
步驟S201首先,輸入由圖形掃描儀108讀取的圖像或者存儲(chǔ)在外部存儲(chǔ)裝置104中的圖像,前進(jìn)到步驟S202。
步驟S202由日語用第一識(shí)別單元對(duì)所輸入的圖像進(jìn)行字符識(shí)別。在此進(jìn)行的字符塊提取使用適合于提取日語字符的字符提取方法。在進(jìn)行字符識(shí)別時(shí),如在現(xiàn)有技術(shù)中所述的那樣,通過在行方向上取投影、提取行、對(duì)各個(gè)行在與行垂直的方向上取投影,提取出字符塊,使用所提取出的字符塊,估計(jì)字符寬度和字符間距。對(duì)于一個(gè)字符分離成多個(gè)塊的情況,使用估計(jì)的字符寬度和字符間距進(jìn)行組合以形成一個(gè)字符。然后,對(duì)每個(gè)字符進(jìn)行特征提取,與預(yù)先準(zhǔn)備的各字符類型的參照數(shù)據(jù)進(jìn)行比較,把類似度最好的字符類型作為該字符的識(shí)別結(jié)果。在由第一識(shí)別單元所進(jìn)行的日語用字符識(shí)別中,通過假定字符間距的變動(dòng)較少并且字符的縱橫比大致為正方形,來提取字符塊。雖然在第一識(shí)別單元中,能夠識(shí)別在日語中常用的標(biāo)準(zhǔn)字體的字母,但是,不能對(duì)應(yīng)的字體也很多。在對(duì)圖像中所有字符的字符識(shí)別結(jié)束后,前進(jìn)到步驟S203。
步驟S203對(duì)于步驟S202的識(shí)別結(jié)果,提取出各行中包含類似度低的字符的圖像區(qū)域作為再識(shí)別范圍。對(duì)于再識(shí)別范圍提取處理的內(nèi)容將在后面描述。再識(shí)別范圍是一行以內(nèi)的圖像區(qū)域或者涉及多行的圖像區(qū)域。
步驟S204在步驟S203中,判斷是否提取出一個(gè)以上再識(shí)別范圍,如果是,則前進(jìn)到步驟S205。否則,就此結(jié)束處理。
步驟S205對(duì)于再識(shí)別范圍,通過英語用第二識(shí)別單元進(jìn)行字符識(shí)別。當(dāng)再識(shí)別范圍涉及多行時(shí),與第一識(shí)別單元同樣地提取行,然后提取字符塊,并以字符單位為單位地檢查類似度。當(dāng)再識(shí)別范圍是一行內(nèi)的圖像區(qū)域時(shí),從該圖像區(qū)域提取字符塊,以字符單位為單位地分析類似度。在此進(jìn)行的字符塊提取使用適合于提取英文字符的字符提取方法。
在英語單詞中,存在字符與字符接觸和重疊(字距緊縮)的情況。因此,與第一識(shí)別單元不同,在英語用第二識(shí)別單元中,在像素的投影縮小的地方等進(jìn)行字符分離。這樣,就可以分離不能用第一識(shí)別單元分離的字符。而且,第二識(shí)別單元在準(zhǔn)備識(shí)別詞典時(shí)可以適應(yīng)于比第一識(shí)別單元更多的英語字體,從而提高識(shí)別精度。
步驟S206當(dāng)在步驟S205中進(jìn)行再識(shí)別的結(jié)果得到了比第一識(shí)別單元高的類似度時(shí),在該再識(shí)別范圍中,用第二識(shí)別單元的識(shí)別結(jié)果來置換第一識(shí)別單元的識(shí)別結(jié)果。由此,英文字符被高精度地識(shí)別。
依據(jù)第一實(shí)施例,在包含英語單詞的日語文章中,日語字符和英字符都能得到較高的識(shí)別精度。而且,進(jìn)行再識(shí)別的第二識(shí)別單元能夠與第一識(shí)別單元獨(dú)立地動(dòng)作,從而可以容易地將識(shí)別單元替換為適合于除日語和英語之外的其他語言的識(shí)別單元。這樣,通過第一、第二識(shí)別單元能夠適用于多種語言組合。
下面使用圖3的流程圖來更詳細(xì)地說明步驟S203的再識(shí)別范圍設(shè)定。
步驟S301設(shè)定閾值T1、T2,并前進(jìn)到步驟S302。閾值T1用于判斷是否把再識(shí)別范圍從由第一識(shí)別單元提取出的字符塊擴(kuò)展到包含其前后字符的區(qū)域。閾值T2用于判斷是否在所設(shè)定的再識(shí)別范圍中進(jìn)行由第二識(shí)別單元進(jìn)行的識(shí)別。
步驟S302進(jìn)行步驟S303以后的處理的結(jié)束判斷。對(duì)于由圖2的步驟S202所提取出的全部字符,當(dāng)步驟S303以后的處理結(jié)束時(shí),就此結(jié)束處理。當(dāng)尚未結(jié)束時(shí),前進(jìn)到步驟S303。
步驟S303通過日語用第一識(shí)別單元,判斷是否檢出字母或者字母與數(shù)字的組合(以下把它們稱為字母數(shù)字)。當(dāng)在日語文章中不包含英語單詞時(shí),所有字符被識(shí)別為日語字符,當(dāng)包含英語單詞時(shí),檢出字母數(shù)字。
步驟S304判斷在步驟S303中是否檢出了字母數(shù)字,當(dāng)沒有檢出時(shí),返回步驟S302,并判斷是否存在尚未檢查的識(shí)別結(jié)果。當(dāng)字母數(shù)字被檢出時(shí),移到步驟S205。在步驟S305~S308中設(shè)定再識(shí)別范圍。
步驟S305對(duì)把再識(shí)別范圍向后擴(kuò)展的條件進(jìn)行判定。在初始狀態(tài)下,再識(shí)別范圍是由第一識(shí)別單元所檢出的字母數(shù)字的范圍,但是,當(dāng)滿足一定條件時(shí),在步驟S306中把再識(shí)別范圍擴(kuò)展到后面的字符。所謂把再識(shí)別范圍擴(kuò)展到后面的條件是再識(shí)別范圍的后續(xù)字符是字母數(shù)字,或者,再識(shí)別范圍后續(xù)字符的識(shí)別結(jié)果類似度小于閾值T1。當(dāng)任一個(gè)條件被滿足時(shí),前進(jìn)到步驟S306。當(dāng)再識(shí)別范圍的后續(xù)字符任一個(gè)條件都不滿足時(shí),或者,當(dāng)不存在后續(xù)字符時(shí),移到步驟S307。而且,當(dāng)再識(shí)別范圍到達(dá)一行的結(jié)尾時(shí),后續(xù)字符是下一行的開頭字符。通過把再識(shí)別范圍擴(kuò)展到下一行,可使再識(shí)別范圍涉及多行。
步驟S306將再識(shí)別范圍的后續(xù)字符包含到再識(shí)別范圍中,從而擴(kuò)展再識(shí)別范圍。然后,再次返回步驟S305。
步驟S307在初始狀態(tài)的再識(shí)別范圍或者在步驟S306中擴(kuò)展到后面的再識(shí)別范圍內(nèi),判定將該再識(shí)別范圍向前擴(kuò)展的條件。把再識(shí)別范圍向前擴(kuò)展的條件是在再識(shí)別范圍之前存在的字符是字母數(shù)字,或者,對(duì)再識(shí)別范圍前的字符的識(shí)別結(jié)果的類似度小于閾值T1。當(dāng)任一個(gè)條件被滿足時(shí),移到步驟S308。當(dāng)再識(shí)別范圍前的字符任一個(gè)條件都不滿足時(shí),或者,當(dāng)不存在前邊的字符時(shí),移到步驟S309。當(dāng)再識(shí)別范圍到達(dá)一行的開頭時(shí),前邊的字符是前一行的結(jié)尾字符。通過把再識(shí)別范圍擴(kuò)展到前一行,也可使再識(shí)別范圍涉及多行。
步驟S308將再識(shí)別范圍前的字符包含到再識(shí)別范圍中,從而擴(kuò)展再識(shí)別范圍。然后,再次返回步驟S307。
步驟S309對(duì)于在步驟S305~S308中所設(shè)定的再識(shí)別范圍內(nèi)的字符,判定是否存在類似度為T2以下的字符。如果存在類似度為T2以下的字符,則判定第一識(shí)別單元的識(shí)別結(jié)果的可靠性存在問題,并移到步驟S311。當(dāng)不存在類似度為T2以下的字符時(shí),判定再識(shí)別范圍的字符是字母數(shù)字并且是類似度比較高的字符。這意味著對(duì)再識(shí)別范圍內(nèi)的字符的識(shí)別結(jié)果是可信賴的,因此移到步驟S310。例如,存在用日語用字符識(shí)別對(duì)以固定間距書寫的字母數(shù)字進(jìn)行高精度的識(shí)別,并且其類似度大于T2的情況。另一方面,在以可變間距書寫時(shí),類似度為T2以下,且容易誤識(shí)別。
步驟S310把在步驟S309中被判斷為字符識(shí)別結(jié)果的類似度大于T2的再識(shí)別范圍從執(zhí)行再識(shí)別的再識(shí)別范圍中去除,并返回步驟S302。由此,即使是英語單詞,由于在誤識(shí)別可能性較低的范圍內(nèi)不執(zhí)行再識(shí)別處理,可以省略不需要的處理,從而能夠提高整體處理速度。
步驟S311將在步驟S309中被判斷為存在字符識(shí)別結(jié)果的類似度為T2以下的再識(shí)別范圍確定為執(zhí)行再識(shí)別的再識(shí)別范圍,返回步驟S302。
根據(jù)上述第一實(shí)施例,能夠自動(dòng)地提取出誤識(shí)別可能性較高的英語單詞范圍作為再識(shí)別范圍,從而能夠提高識(shí)別精度。
閾值T1、T2可以使用通過進(jìn)行實(shí)驗(yàn)等而預(yù)先設(shè)定的值,也可以隨字符類型等不同而設(shè)定為不同的值。例如,可以隨平假名、片假名、漢字、字母數(shù)字等作為識(shí)別結(jié)果的字符類型而選定不同的閾值。
在上述第一實(shí)施例中說明了包含英語單詞的日語文章的例子,但是,在包含英語、拉丁語和其他字符排列不同的單詞的其他語言的文章,例如中文文章、韓文文章、其他語種文章中,也能起到同樣的效果。
圖4、圖5是表示圖1所示的字符識(shí)別裝置所執(zhí)行的字符識(shí)別方法的第二實(shí)施例的流程圖。
在第二實(shí)施例中,對(duì)于由第一字符識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果,執(zhí)行由第二識(shí)別單元進(jìn)行的再識(shí)別處理,而且,對(duì)于由第二識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果,執(zhí)行由第三識(shí)別單元進(jìn)行的再識(shí)別處理。
圖4的流程圖表示第二實(shí)施例的總體流程。
步驟S401與第一實(shí)施例的步驟S201相同,輸入圖像。
步驟S402與第一實(shí)施例的步驟S202相同,用第一識(shí)別單元來對(duì)所輸入的圖像進(jìn)行字符識(shí)別。
步驟S403與第一實(shí)施例的步驟S203相同,設(shè)定再識(shí)別范圍。
步驟S404與第一實(shí)施例的步驟S204相同,判斷是否提取出一個(gè)以上的再識(shí)別范圍。當(dāng)提取出再識(shí)別范圍時(shí),移到步驟S405,當(dāng)尚未提取出時(shí),就此結(jié)束處理。
步驟S405由第二識(shí)別單元對(duì)于再識(shí)別范圍進(jìn)行字符識(shí)別,以字符單位為單位來分析類似度。根據(jù)需要,執(zhí)行行提取、字符塊提取。
步驟S406判定是否采用由第二識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果。判定方法將在后面描述。當(dāng)判斷為采用由第二識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果時(shí),移到步驟S407,當(dāng)判斷為不采用由第二識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果時(shí),移到步驟S408。
步驟S407在由第一識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果中,用由第二識(shí)別單元所產(chǎn)生的再識(shí)別結(jié)果來替換再識(shí)別范圍。
步驟S408由第三識(shí)別單元對(duì)再識(shí)別范圍進(jìn)行字符識(shí)別,移到步驟S409。
步驟S409判定是否采用由第三識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果。判定方法與步驟S406的判定方法相同,其詳細(xì)內(nèi)容將在后面描述。當(dāng)判定采用由第三識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果時(shí),移到步驟S410,當(dāng)判定不采用由第三識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果時(shí),就此結(jié)束處理。
步驟S410在由第一識(shí)別單元所產(chǎn)生的字符識(shí)別結(jié)果中,用由第三識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果來替換再識(shí)別范圍。
圖5是表示步驟S406中的判定方法的流程圖。
步驟S501求出再識(shí)別范圍中的識(shí)別結(jié)果的類似度的平均值。
步驟S502把平均值與預(yù)定的閾值T3進(jìn)行比較,當(dāng)為閾值T3以下時(shí),移到步驟S503,當(dāng)大于閾值T3時(shí),移到步驟S504。
步驟S503不采用由第二識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果,而采用由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果。
步驟S504利用由第二識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果替換由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果。
圖6是表示步驟S409中的判定方法的流程圖。
步驟S601與圖5的步驟S501相同,求出類似度的平均值。
步驟S602把平均值與預(yù)定的閾值T4進(jìn)行比較,當(dāng)為閾值T4以下時(shí),移到步驟S603,當(dāng)大于閾值T4時(shí),移到步驟S604。
步驟S603不采用由第三識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果,而采用由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果。
步驟S604利用由第三識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果替換由第一識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果。
而且,圖5、圖6的處理中的閾值T3、T4可以相同,也可以根據(jù)經(jīng)驗(yàn)公式和實(shí)驗(yàn)結(jié)果等,設(shè)定為不同的值。
圖7是表示圖5所示的判定方法的另一個(gè)形式的流程圖。
步驟S701求出由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果的類似度平均值M1。
步驟S702求出由第二識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果的類似度平均值M2。
步驟S703比較平均值M1、M2,當(dāng)平均值M1為M2以上時(shí),移到步驟S704,當(dāng)平均值M2大于M1時(shí),移到步驟S705。
步驟S704不采用由第二識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果,而采用由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果。
步驟S705以由第二識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果替換由第一識(shí)別單元所產(chǎn)生的再識(shí)別的識(shí)別結(jié)果。
而且,圖7的判定方法也適用于由第一識(shí)別單元所進(jìn)行的識(shí)別處理和由第三識(shí)別單元所進(jìn)行的識(shí)別處理之間的比較、選擇。
在上述第二實(shí)施例中,由于根據(jù)類似度的平均值來判定識(shí)別結(jié)果的可靠性,所以可以實(shí)現(xiàn)全面的識(shí)別精度評(píng)價(jià)。而且,由于依次使用多個(gè)識(shí)別單元進(jìn)行字符識(shí)別,并比較它們的結(jié)果,因此,能夠適用于多種語言和字符類型,同時(shí),也能夠從多個(gè)識(shí)別結(jié)果中選擇最佳的識(shí)別結(jié)果。
圖1所示的字符識(shí)別裝置中的控制程序包含用于執(zhí)行字符識(shí)別方法的第一實(shí)施例和/或第二實(shí)施例的程序。用于執(zhí)行第一實(shí)施例的程序包含執(zhí)行步驟S201~S206、步驟S301~S311的處理的模塊。用于執(zhí)行第二實(shí)施例的程序包含執(zhí)行步驟S401~S410、步驟S501~S504、步驟S601~S604、步驟S701~S705的處理的模塊。
本發(fā)明所涉及的字符識(shí)別方法可以由除圖1的字符識(shí)別裝置之外的裝置,例如通用計(jì)算機(jī),來實(shí)施,在此情況下,也可以把由存儲(chǔ)媒體等所提供的控制程序設(shè)置在通用計(jì)算機(jī)的外部存儲(chǔ)裝置中,通過操作人員等的指示,由CPU等來執(zhí)行。
圖8是表示存儲(chǔ)有用于執(zhí)行字符識(shí)別方法的第一和第二實(shí)施例的程序的存儲(chǔ)媒體的存儲(chǔ)器分配圖。
在圖8中,在地址A0至A1中存儲(chǔ)目錄信息,在從A1之后的地址到地址A2的區(qū)域中存儲(chǔ)用于執(zhí)行第一實(shí)施例中圖2所示的流程的程序,在從A2之后的地址到地址A3的區(qū)域中存儲(chǔ)用于執(zhí)行第一實(shí)施例中圖3所示的流程的程序,在從A3之后的地址到地址A4的區(qū)域中存儲(chǔ)用于執(zhí)行第二實(shí)施例中圖4所示的流程的程序,在從A4之后的地址到地址A5的區(qū)域中存儲(chǔ)用于執(zhí)行第二實(shí)施例中的圖5所示的流程的程序,在從A5之后地址到地址A6的區(qū)域中存儲(chǔ)用于執(zhí)行第二實(shí)施例中的圖6的流程的程序,在從A6之后的地址到地址A7的區(qū)域中存儲(chǔ)用于執(zhí)行圖7所示的流程的程序。
雖然沒有特別圖示,從屬于各種程序的數(shù)據(jù)可以作為目錄信息來管理,而且,也可以在目錄信息內(nèi)存儲(chǔ)用于把各種程序安裝到計(jì)算機(jī)中的程序等。
圖9是表示通過多個(gè)設(shè)備來執(zhí)行本發(fā)明所涉及的字符識(shí)別方法的字符識(shí)別系統(tǒng)的一個(gè)實(shí)施例的方框圖。
在該實(shí)施例中,在因特網(wǎng)服務(wù)提供商中,包含用于字符識(shí)別的識(shí)別詞典的程序被存儲(chǔ)在服務(wù)器SV1中。因特網(wǎng)服務(wù)提供商通過通信裝置而連接在因特網(wǎng)上,通過從因特網(wǎng)訪問服務(wù)器SV1,多個(gè)用戶能夠利用字符識(shí)別程序。
用戶操作個(gè)人計(jì)算機(jī)PC1,把用掃描儀SC1讀取的原稿圖像發(fā)送給服務(wù)器SV1。在服務(wù)器中,把原稿圖像作為輸入圖像,執(zhí)行上述第一實(shí)施例或第二實(shí)施例的字符識(shí)別處理,并將其識(shí)別結(jié)果發(fā)回個(gè)人計(jì)算機(jī)PC1。
識(shí)別詞典并不一定與字符識(shí)別程序一起存在于同一個(gè)計(jì)算機(jī)上,也可以通過通信裝置等來進(jìn)行參照。例如,可以把字符識(shí)別程序設(shè)置在服務(wù)器SV1中,而把識(shí)別詞典作為另一個(gè)服務(wù)設(shè)置在另一個(gè)服務(wù)器SV2中。在此情況下,字符識(shí)別程序的持有者、識(shí)別詞典的持有者可以分別在內(nèi)部持有程序、詞典這樣的知識(shí)產(chǎn)權(quán),從而防止非法復(fù)制等。
根據(jù)本發(fā)明,能夠提高以多種語言記載的文章圖像的字符識(shí)別精度。
雖然本發(fā)明的優(yōu)選實(shí)施例已經(jīng)進(jìn)行了表示和說明,但是,應(yīng)當(dāng)知道,本領(lǐng)域的技術(shù)人員可以在不背離本發(fā)明的精神的條件下進(jìn)行變化和變型,本發(fā)明的范圍由權(quán)利要求書限定。
權(quán)利要求
1.一種字符識(shí)別裝置,包括適合于對(duì)以第一語言書寫的字符圖像進(jìn)行字符識(shí)別的第一識(shí)別裝置;適合于對(duì)以第二語言書寫的字符圖像進(jìn)行字符識(shí)別的第二識(shí)別裝置;再識(shí)別范圍設(shè)定裝置,用于在使用上述第一識(shí)別裝置對(duì)字符圖像中包含的多個(gè)字符圖像進(jìn)行字符識(shí)別的結(jié)果中設(shè)定再識(shí)別范圍,以便于根據(jù)對(duì)與在上述第一識(shí)別裝置中作為上述第二語言被識(shí)別的字符圖像相鄰的字符圖像的識(shí)別結(jié)果,使用上述第二識(shí)別裝置進(jìn)行再識(shí)別。
2.根據(jù)權(quán)利要求1所述的字符識(shí)別裝置,其特征在于,上述再識(shí)別范圍設(shè)定裝置在與上述再識(shí)別范圍相鄰的字符是上述第二語言時(shí),把上述再識(shí)別范圍擴(kuò)展到上述相鄰字符的范圍。
3.根據(jù)權(quán)利要求1所述的字符識(shí)別裝置,其特征在于,上述再識(shí)別范圍設(shè)定裝置在上述第一識(shí)別裝置對(duì)與上述再識(shí)別范圍相鄰的字符的識(shí)別結(jié)果的類似度為預(yù)定值以下時(shí),把上述再識(shí)別范圍擴(kuò)展到上述相鄰字符的范圍。
4.根據(jù)權(quán)利要求1所述的字符識(shí)別裝置,其特征在于,上述再識(shí)別范圍設(shè)定裝置在上述第一識(shí)別裝置對(duì)各再識(shí)別范圍內(nèi)的字符的識(shí)別結(jié)果的類似度為預(yù)定值以下時(shí),仍將該再識(shí)別范圍確定為進(jìn)行再識(shí)別的范圍,當(dāng)上述類似度大于預(yù)定值時(shí),把該再識(shí)別范圍從進(jìn)行再識(shí)別的范圍中排除。
5.根據(jù)權(quán)利要求1所述的字符識(shí)別裝置,其特征在于,進(jìn)一步包括識(shí)別結(jié)果選擇裝置,用于擇一地選擇由上述第一識(shí)別裝置所產(chǎn)生的識(shí)別結(jié)果和由上述第二識(shí)別裝置所產(chǎn)生的識(shí)別結(jié)果。
6.根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其特征在于,上述識(shí)別結(jié)果選擇裝置在上述第二識(shí)別裝置對(duì)上述再識(shí)別范圍內(nèi)的字符的識(shí)別結(jié)果中的字符類似度為預(yù)定值以下時(shí),選擇上述第一識(shí)別裝置的識(shí)別結(jié)果,當(dāng)上述類似度大于預(yù)定值時(shí),選擇上述第二識(shí)別裝置的識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其特征在于,上述識(shí)別結(jié)果選擇裝置在上述第二識(shí)別裝置對(duì)上述再識(shí)別范圍內(nèi)的字符的識(shí)別結(jié)果中的類似度平均值為預(yù)定值以下時(shí),選擇上述第一識(shí)別裝置的識(shí)別結(jié)果,當(dāng)上述類似度平均值大于預(yù)定值時(shí),選擇上述第二識(shí)別裝置的識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其特征在于,上述識(shí)別結(jié)果選擇裝置比較上述第一識(shí)別裝置對(duì)再識(shí)別范圍內(nèi)的字符的識(shí)別結(jié)果中的類似度平均值和上述第二識(shí)別裝置對(duì)該字符的識(shí)別結(jié)果中的類似度平均值,當(dāng)由上述第一識(shí)別裝置所產(chǎn)生的類似度平均值為由上述第二識(shí)別裝置所產(chǎn)生的類似度平均值以下時(shí),選擇由上述第一識(shí)別裝置所產(chǎn)生的識(shí)別結(jié)果,當(dāng)由上述第二識(shí)別裝置所產(chǎn)生的類似度平均值大于由上述第一識(shí)別裝置所產(chǎn)生的類似度平均值時(shí),選擇由上述第二識(shí)別裝置所產(chǎn)生的識(shí)別結(jié)果
9.根據(jù)權(quán)利要求1所述的字符識(shí)別裝置,其特征在于,進(jìn)一步包括接收裝置,用于通過網(wǎng)絡(luò)從外部裝置接收上述文章圖像;發(fā)送裝置,用于將使用上述第一識(shí)別裝置、上述第二識(shí)別裝置和上述再識(shí)別范圍設(shè)定裝置進(jìn)行字符識(shí)別的結(jié)果發(fā)送給上述外部裝置。
10.一種字符識(shí)別方法,包括以下步驟使用適合于對(duì)以第一語言書寫的字符圖像進(jìn)行字符識(shí)別的第一識(shí)別過程,對(duì)字符圖像中包含的多個(gè)字符圖像進(jìn)行字符識(shí)別;設(shè)定再識(shí)別范圍,以便于根據(jù)對(duì)與在上述第一識(shí)別過程中作為第二語言被識(shí)別的字符圖像相鄰的字符圖像的識(shí)別結(jié)果,使用適合于對(duì)以上述第二語言書寫的字符圖像進(jìn)行字符識(shí)別的第二識(shí)別過程,進(jìn)行再識(shí)別;使用上述第二識(shí)別過程對(duì)所設(shè)定的上述再識(shí)別范圍再次進(jìn)行字符識(shí)別。
11.一種用于字符識(shí)別的可編程計(jì)算機(jī),包括一個(gè)存儲(chǔ)器,具有至少一個(gè)用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行程序代碼的區(qū)域;一個(gè)處理器,用于執(zhí)行存儲(chǔ)在所述存儲(chǔ)器中的程序代碼,其中,所述處理器包括用于使用適合于對(duì)以第一語言書寫的字符圖像進(jìn)行字符識(shí)別的第一識(shí)別過程,對(duì)字符圖像中包含的多個(gè)字符圖像進(jìn)行字符識(shí)別的裝置;用于設(shè)定再識(shí)別范圍,以便于根據(jù)對(duì)與在上述第一識(shí)別過程中作為第二語言被識(shí)別的字符圖像相鄰的字符圖像的識(shí)別結(jié)果,使用適合于對(duì)以上述第二語言書寫的字符圖像進(jìn)行字符識(shí)別的第二識(shí)別過程,進(jìn)行再識(shí)別的裝置;用于使用上述第二識(shí)別過程對(duì)所設(shè)定的上述再識(shí)別范圍再次進(jìn)行字符識(shí)別的裝置。
全文摘要
本發(fā)明用于提高對(duì)包含多種語言的文章圖像的字符識(shí)別精度。根據(jù)使用第一識(shí)別單元進(jìn)行識(shí)別的結(jié)果,設(shè)定再識(shí)別范圍,通過第二識(shí)別單元再度進(jìn)行字符識(shí)別。當(dāng)進(jìn)行再識(shí)別的結(jié)果是得到了高于由第一識(shí)別單元所進(jìn)行的識(shí)別的類似度時(shí),對(duì)該再識(shí)別范圍,用由第二識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果來置換由第一識(shí)別單元所產(chǎn)生的識(shí)別結(jié)果。
文檔編號(hào)G06K9/68GK1472695SQ03147418
公開日2004年2月4日 申請(qǐng)日期2003年7月9日 優(yōu)先權(quán)日2002年7月9日
發(fā)明者池田裕章 申請(qǐng)人:佳能株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1