一種圖像的處理方法和裝置制造方法
【專利摘要】本申請?zhí)峁┝艘环N圖像的處理方法和裝置,包括:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像;使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別;當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。因此本申請可以解決在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題。
【專利說明】一種圖像的處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請涉及識別【技術(shù)領(lǐng)域】,特別是涉及一種圖像的處理方法和裝置。
【背景技術(shù)】
[0002]近年來,隨著業(yè)務(wù)的計(jì)算機(jī)化,使用了大量的電子文檔,由于這個(gè)原因,圖像識別技術(shù)作為將紙件文檔轉(zhuǎn)換為電子文檔的技術(shù)的重要性正在與日俱增。
[0003]在圖像識別時(shí),由于用戶使用的拍攝設(shè)備的不同,所得到的圖像的大小就有可能不同,將得到的圖像進(jìn)行識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并將圖像中的有效信息轉(zhuǎn)換成可編輯文字信息提供給使用者。同時(shí),現(xiàn)有的拍圖器功能比較單一,只能識別和處理一種圖像,不能滿足用戶的實(shí)際需求。
【發(fā)明內(nèi)容】
[0004]本申請?zhí)峁┮环N圖像處理方法和裝置,以解決現(xiàn)有技術(shù)中在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題。
[0005]為了解決上述問題,本申請公開了一種圖像的處理方法,包括:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像;使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別;當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
[0006]優(yōu)選地,所述多個(gè)識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個(gè);當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:
[0007]對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值;
[0008]當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值;
[0009]當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:
[0010]對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0011]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0012]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0013]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時(shí),則輸出可靠的所述識別結(jié)果;
[0014]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0015]優(yōu)選地,還包括:若多個(gè)識別引擎識別出的多個(gè)識別結(jié)果中的至少一個(gè)識別結(jié)果在可靠與不可靠之間,則比較多個(gè)識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結(jié)果。
[0016]為了解決上述問題,本申請還公開了一種圖像的處理裝置,包括:
[0017]獲取模塊,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;
[0018]處理模塊,用于將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;
[0019]預(yù)處理模塊,用于將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像;
[0020]識別模塊,用于使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別;
[0021]輸出模塊,用于當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
[0022]優(yōu)選地,所述多個(gè)識別弓I擎包括:名片識別弓丨擎、模板識別弓丨擎、文本識別引擎中的至少二個(gè);
[0023]所述識別模塊,用于:
[0024]當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值;
[0025]當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值;
[0026]當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0027]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí):
[0028]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果;
[0029]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0030]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí):
[0031]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果;
[0032]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0033]與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點(diǎn):
[0034]首先,將待識別的圖像進(jìn)行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時(shí)將獲得的有效的圖像進(jìn)行預(yù)處理,排除了干擾噪聲的影響,從而能準(zhǔn)確的獲得圖像中的有效信息。
[0035]其次,本申請通過使用多個(gè)識別引擎對獲得的預(yù)處理后的字符圖像進(jìn)行識別,從而實(shí)現(xiàn)了對多種圖片類型的處理,當(dāng)字符圖像與多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的識別結(jié)果。多個(gè)識別引擎可以對不同類型的圖像進(jìn)行處理,例如:多個(gè)識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎和車牌識別引擎等,由于本申請將獲得的預(yù)處理后的字符圖像使用多個(gè)識別引擎進(jìn)行處理,避免了現(xiàn)有方法中在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題。
【專利附圖】
【附圖說明】
[0036]圖1是本申請實(shí)施例一中的一種圖像處理方法的流程圖;
[0037]圖2是本申請實(shí)施例二中的一種圖像處理方法的流程圖;
[0038]圖3是本申請實(shí)施例三中的一種圖像處理裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0039]為使本申請的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對本申請作進(jìn)一步詳細(xì)的說明。
[0040]參照圖1,示出了本申請實(shí)施例一中的一種圖像處理方法,包括:
[0041]步驟101:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0042]待識別的圖像可以從照相管理裝置或者圖像輸入裝置中獲取待識別的圖像。
[0043]步驟102:將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0044]圖像切邊:指能夠從原圖中,將被識別圖像的邊緣從原圖切出來,常見的被識別圖像如身份證等。
[0045]將獲取的圖像進(jìn)行切邊處理,找到圖像的四個(gè)角點(diǎn),進(jìn)行透視變換,即透視變換是對圖像進(jìn)行拉縮,把斜視圖變成正視圖,得到圖像的有效內(nèi)容,得到包含字符圖像的、有效的待識別圖像范圍。
[0046]如果字符圖像的、有效的待識別圖像范圍能夠清晰的識別,則繼續(xù)識別處理過程,如果字符圖像的、有效的待識別圖像范圍不能夠清晰的識別,則提示使用者重新拍攝或輸入圖像。
[0047]步驟103:將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像。
[0048]將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理包括:對獲取的圖像進(jìn)行傾斜矯正,對圖像進(jìn)行增強(qiáng)處理、對圖像進(jìn)行二值化處理和對圖像進(jìn)行降噪處理。其中,對圖像進(jìn)行增強(qiáng)處理是使圖像的亮、暗更清楚,黑白分明;對圖像進(jìn)行二值化處理是將圖像中的字符與背景區(qū)分開;對圖像進(jìn)行降噪處理是去掉圖像中的干擾噪聲,比如碎筆畫等。將待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理后的結(jié)果是得到字符與背景分明的字符圖像。
[0049]步驟104:使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0050]步驟105:當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
[0051]當(dāng)確定預(yù)處理后的字符圖像與多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為不可靠時(shí),則繼續(xù)調(diào)用多個(gè)識別引擎中未使用的識別引擎對字符圖像進(jìn)行處理。
[0052]對是否調(diào)用多個(gè)識別引擎中的其他識別引擎,主要取決于之前使用過的識別引擎的識別結(jié)果。
[0053]通過本實(shí)施例,首先,將待識別的圖像進(jìn)行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時(shí)將獲得的有效的圖像進(jìn)行預(yù)處理,排除了干擾噪聲的影響,從而能準(zhǔn)確的獲得圖像中的有效信息。
[0054]其次,本申請通過使用多個(gè)識別引擎對獲得的預(yù)處理后的字符圖像進(jìn)行識別,從而實(shí)現(xiàn)了對多種圖片類型的處理,當(dāng)字符圖像與多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的識別結(jié)果。多個(gè)識別引擎可以對不同類型的圖像進(jìn)行處理,例如:多個(gè)識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別弓I擎和語音識別引擎等,由于本申請將獲得的預(yù)處理后的字符圖像使用多個(gè)識別引擎進(jìn)行處理,避免了現(xiàn)有方法中在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題。
[0055]參照圖2,示出了本申請實(shí)施例二中的一種圖像處理方法,包括:
[0056]步驟201:通過拍攝設(shè)備,對待識別圖像進(jìn)行拍照。
[0057]步驟202:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0058]步驟203:將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0059]步驟204:判定獲取的圖像是否清晰能夠識別,如果是,則執(zhí)行步驟205 ;如果否,則執(zhí)行步驟208。
[0060]步驟205:將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像。
[0061]將有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理包括:對獲取的圖像進(jìn)行傾斜矯正,對圖像進(jìn)行增強(qiáng)處理、對圖像進(jìn)行二值化處理和對圖像進(jìn)行降噪處理。其中,對圖像進(jìn)行增強(qiáng)處理是使圖像的亮、暗更清楚,黑白分明;對圖像進(jìn)行二值化處理是將圖像中的字符與背景區(qū)分開;對圖像進(jìn)行降噪處理是去掉圖像中的干擾噪聲,比如碎筆畫等。將待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理后的結(jié)果是得到字符與背景分明的字符圖像。
[0062]步驟206:對獲取的預(yù)處理后的字符圖像進(jìn)行光學(xué)字符識別,光學(xué)字符識別是對圖像進(jìn)行分析、識別,得到文字和版面信息。該光學(xué)字符識別可以使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0063]光學(xué)字符識別(Optical Character Recognit1n, OCR)是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。
[0064]多個(gè)識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個(gè),名片識別引擎適用于名片的識別處理,模板識別引擎適用于模板的識別處理,文本識別引擎適用于文本的識別處理。
[0065]當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:
[0066]對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值,其中,第一閾值和第二閾值都是通過統(tǒng)計(jì)得到的,也就是設(shè)定一個(gè)訓(xùn)練集,求出訓(xùn)練集合中每個(gè)圖的總相似度,通過設(shè)定第一閾值和第二閾值使得名片識別引擎的識別結(jié)果正確率和拒識準(zhǔn)確率最大化。
[0067]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:
[0068]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果;
[0069]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0070]當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值,其中,第三閾值和第四閾值都是通過統(tǒng)計(jì)得到的,也就是設(shè)定一個(gè)訓(xùn)練集,求出訓(xùn)練集合中每個(gè)圖的總相似度,通過設(shè)定第三閾值和第四閾值使得名片識別引擎的識別結(jié)果正確率和拒識準(zhǔn)確率最大化。
[0071]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果;
[0072]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0073]當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:
[0074]對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值,其中,第五閾值和第六閾值都是通過統(tǒng)計(jì)得到的,也就是設(shè)定一個(gè)訓(xùn)練集,求出訓(xùn)練集合中每個(gè)圖的總相似度,通過設(shè)定第五閾值和第六閾值使得名片識別引擎的識別結(jié)果正確率和拒識準(zhǔn)確率最大化。
[0075]模板數(shù)據(jù)庫中存儲各個(gè)模板的標(biāo)準(zhǔn)格式,例如:身份證模板,該身份證模板中的姓名、出生日期、地址等都對應(yīng)固定的位置,匹配時(shí)按照對應(yīng)的格式進(jìn)行識別。
[0076]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時(shí),則輸出可靠的所述識別結(jié)果O
[0077]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0078]進(jìn)一步的,如果通過三種識別引擎對圖像進(jìn)行識別后,所得到的識別結(jié)果均為不可靠時(shí),則提示使用者該圖像不能識別。如果通過三種識別引擎對圖像進(jìn)行識別后,所得到的結(jié)果都是在可靠與不可靠之間或者若多個(gè)識別引擎識別出的多個(gè)識別結(jié)果中的至少一個(gè)識別結(jié)果在可靠與不可靠之間,則比較多個(gè)識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結(jié)果,其中可靠與不可靠之間的范圍包括通過三種識別引擎對圖像進(jìn)行識別后,所得到的識別結(jié)果大于第一閾值,而小于第二閾值;識別結(jié)果大于第三閾值,而小于第四閾值;識別結(jié)果大于第五閾值,而小于第六閾值。
[0079]如果多個(gè)識別引擎中只包括一個(gè)識別引擎時(shí),則對字符圖像的過程也可以采用本申請限定的方法進(jìn)行字符圖像的識別。
[0080]需要說明的是,本申請的多個(gè)識別引擎可以按照預(yù)先設(shè)定順序進(jìn)行調(diào)用,也可以根據(jù)具體操作的情況調(diào)用相應(yīng)的識別引擎,本申請不加以限制。
[0081]步驟207:當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。結(jié)束流程。
[0082]步驟208:提示使用者重新拍攝或輸入圖像,重復(fù)進(jìn)行步驟201-步驟207的操作過程。
[0083]進(jìn)一步的,通過具體的應(yīng)用實(shí)例來說明本申請限定的技術(shù)方案實(shí)現(xiàn)方法。
[0084]在光學(xué)字符識別中,多種類型的圖像識別處理能力是這樣實(shí)現(xiàn)的:在光學(xué)字符識別包括多個(gè)識別引擎,例如三個(gè)引擎一名片識別引擎、模板識別引擎和文本識別引擎。
[0085]拍圖器獲得圖片并初步處理后進(jìn)入光學(xué)字符識別過程包括:可以按照一定的順序調(diào)用識別引擎,例如按照名片識別引擎、模板識別引擎、文本識別引擎的順序調(diào)用識別引擎。按照舉例的順序,拍圖器在進(jìn)行光學(xué)字符識別時(shí),先調(diào)用名片識別引擎對圖像進(jìn)行識另|J,求出圖像中各字符的相似度的判定分值,將每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將歸一化處理結(jié)果作為字符圖像的相似度的判定分值的平均值D1,其中,各字符的相似度判定分值可以是概率或者距離。預(yù)先設(shè)定兩個(gè)閾值A(chǔ)l、A2,如果Dl大于Al則識別結(jié)果可靠,光學(xué)字符識別過程不需要再調(diào)用其余的識別引擎,輸出識別結(jié)果;如果Dl小于A2,則輸出識別結(jié)果不可靠,光學(xué)字符識別過程繼續(xù)調(diào)用模板識別引擎。
[0086]在模板識別引擎對圖像進(jìn)行識別過程中,求出圖像中各字符的相似度的判定分值,將每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將歸一化處理結(jié)果作為字符圖像的相似度的判定分值的平均值D2,其中,各字符的相似度判定分值可以是概率或者距離。預(yù)先設(shè)定兩個(gè)閾值B1、B2,如果D2大于BI,則輸出識別結(jié)果可靠,光學(xué)字符識別過程不需要再調(diào)用其余的識別引擎,輸出識別結(jié)果;如果D2小于B2,則輸出識別結(jié)果不可靠,光學(xué)字符識別過程繼續(xù)調(diào)用文本識別引擎。
[0087]在文本識別引擎對圖像進(jìn)行識別過程中,求出圖像中各字符的相似度的判定分值,將每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將歸一化處理結(jié)果作為字符圖像的相似度的判定分值的平均值D3,其中,各字符的相似度判定分值可以是概率或者距離。預(yù)先設(shè)定兩個(gè)閾值C1、C2,如果D3大于Cl,則輸出識別結(jié)果可靠;如果D3小于C2,則輸出識別結(jié)果不可靠。
[0088]如果在三種識別引擎對圖像進(jìn)行識別后,所得到的識別結(jié)果都是不可靠,則提示使用者該圖像不能識別;如果在三種識別引擎對圖像進(jìn)行識別后,所得到的結(jié)果都是在可靠與不可靠之間,其中,可靠與不可靠之間的范圍是A1〈D1〈A2,B1〈D2〈B2,C1〈D3〈C2,則比較D1、D2、D3的值,將三個(gè)值中最大者對應(yīng)的識別結(jié)果作為最終的識別結(jié)果。
[0089]上述過程是以三個(gè)識別引擎為例對光學(xué)字符識別過程進(jìn)行的描述,如果識別引擎為兩個(gè)或三個(gè)以上,則光學(xué)字符識別過程采用類似的方法。
[0090]需要說明的是,本申請以舉例的方式說明多個(gè)識別引擎的調(diào)用順序,當(dāng)然也可以按照其它順序調(diào)用多個(gè)識別引擎,而且根據(jù)識別結(jié)果的情況,可以只調(diào)用其中的一個(gè)或多個(gè)識別引擎。
[0091]通過本實(shí)施例,首先,將待識別的圖像進(jìn)行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時(shí)將獲得的有效的圖像進(jìn)行預(yù)處理,排除了干擾噪聲的影響,從而能準(zhǔn)確的獲得圖像中的有效信息。
[0092]其次,本申請通過使用多個(gè)識別引擎對獲得的預(yù)處理后的字符圖像進(jìn)行識別,從而實(shí)現(xiàn)了對多種圖片類型的處理,當(dāng)字符圖像與多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的識別結(jié)果。多個(gè)識別引擎可以對不同類型的圖像進(jìn)行處理,例如:多個(gè)識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別引擎和語音識別引擎等,由于本申請將獲得的預(yù)處理后的字符圖像使用多個(gè)識別引擎進(jìn)行處理,避免了現(xiàn)有方法中在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題
[0093]基于上述方法實(shí)施例的說明,本申請還提供了相應(yīng)的一種圖像處理裝置的實(shí)施例,來實(shí)現(xiàn)上述方法實(shí)施例所述的內(nèi)容。
[0094]參見圖3,示出了本申請實(shí)施例三中的一種圖像處理裝置的結(jié)構(gòu)框圖,具體可以包括:
[0095]獲取模塊301,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0096]處理模塊302,用于將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0097]預(yù)處理模塊303,用于將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像。
[0098]識別模塊304,用于使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0099]輸出模塊305,用于當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
[0100]優(yōu)選地,所述多個(gè)識別引擎包括:名片識別引擎、模板識別引擎、文本識別引擎中的至少二個(gè);所述識別模塊,用于:
[0101]當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值。
[0102]當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值。
[0103]當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0104]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí):
[0105]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果。
[0106]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0107]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí):
[0108]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果。
[0109]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0110]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí):
[0111]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時(shí),則輸出可靠的所述識別結(jié)果。
[0112]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
[0113]優(yōu)選地,所述裝置還包括:比較模塊,用于若多個(gè)識別引擎識別出的多個(gè)識別結(jié)果中的至少一個(gè)識別結(jié)果在可靠與不可靠之間,則比較多個(gè)識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為所述字符圖像的識別結(jié)果。
[0114]通過本實(shí)施例,首先,將待識別的圖像進(jìn)行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時(shí)將獲得的有效的圖像進(jìn)行預(yù)處理,排除了干擾噪聲的影響,從而能準(zhǔn)確的獲得圖像中的有效信息。
[0115]其次,本申請通過使用多個(gè)識別引擎對獲得的預(yù)處理后的字符圖像進(jìn)行識別,從而實(shí)現(xiàn)了對多種圖片類型的處理,當(dāng)字符圖像與多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的識別結(jié)果。多個(gè)識別引擎可以對不同類型的圖像進(jìn)行處理,例如:多個(gè)識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別弓I擎和語音識別引擎等,由于本申請將獲得的預(yù)處理后的字符圖像使用多個(gè)識別引擎進(jìn)行處理,避免了現(xiàn)有方法中在進(jìn)行圖像識別時(shí),無法準(zhǔn)確的獲得圖像中的有效信息,并且識別功能單一的問題
[0116]對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
[0117]以上對本申請所提供的一種圖像處理的方法和裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本申請的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本申請的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。
【權(quán)利要求】
1.一種圖像的處理方法,其特征在于,包括: 獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像; 將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍; 將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像; 使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別; 當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個(gè)識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個(gè); 當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括: 對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值; 當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值; 當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別的步驟包括: 對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括: 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時(shí),則輸出可靠的所述識別結(jié)果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
6.根據(jù)權(quán)利要求3、4或5所述的方法,其特征在于,還包括:若多個(gè)識別引擎識別出的多個(gè)識別結(jié)果中的至少一個(gè)識別結(jié)果在可靠與不可靠之間,則比較多個(gè)識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結(jié)果。
7.一種圖像的處理裝置,其特征在于,包括: 獲取模塊,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像; 處理模塊,用于將獲取的圖像進(jìn)行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍; 預(yù)處理模塊,用于將所述有效的待識別圖像范圍內(nèi)的圖像進(jìn)行預(yù)處理,獲得預(yù)處理后的所述字符圖像; 識別模塊,用于使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別; 輸出模塊,用于當(dāng)確定預(yù)處理后的所述字符圖像與所述多個(gè)識別引擎中的至少一個(gè)識別引擎的識別結(jié)果為可靠時(shí),則輸出可靠的所述識別結(jié)果。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述多個(gè)識別引擎包括:名片識別引擎、模板識別引擎、文本識別引擎中的至少二個(gè); 所述識別模塊,用于: 當(dāng)所述多個(gè)識別引擎包括所述名片識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與名片識別引擎中的名片數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第一閾值大于第二閾值; 當(dāng)所述多個(gè)識別引擎包括所述文本識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與文本識別引擎中的文本數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第三閾值大于第四閾值; 當(dāng)所述多個(gè)識別引擎包括所述模板識別引擎時(shí),所述使用多個(gè)識別引擎,對預(yù)處理后的所述字符圖像進(jìn)行識別包括:對預(yù)處理后的所述字符圖像進(jìn)行分割,獲得多個(gè)單一字符,將每個(gè)單一字符與模板識別引擎中的模板數(shù)據(jù)庫進(jìn)行匹配,得到每個(gè)單一字符的相似度的判定分值,將所述每個(gè)單一字符的相似度的判定分值求和,并對求和結(jié)果進(jìn)行歸一化處理,將所述歸一化處理結(jié)果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第五閾值和第六閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別,其中,所述字符圖像的第五閾值大于第六閾值。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第一閾值和第二閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí): 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時(shí),則輸出可靠的所述識別結(jié)果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預(yù)先設(shè)定的字符圖像的第三閾值和第四閾值進(jìn)行比較,根據(jù)比較結(jié)果對所述字符圖像進(jìn)行識別時(shí): 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時(shí),則輸出可靠的所述識別結(jié)果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時(shí),輸出不可靠的所述識別結(jié)果,在確定還有未使用的識別引擎時(shí),繼續(xù)調(diào)用未使用的識別引擎對預(yù)處理后的所述字符圖像進(jìn)行識別。
【文檔編號】G06K9/00GK104239853SQ201410429608
【公開日】2014年12月24日 申請日期:2014年8月27日 優(yōu)先權(quán)日:2014年8月27日
【發(fā)明者】李健, 蘭志才, 張連毅, 武衛(wèi)東 申請人:北京捷通華聲語音技術(shù)有限公司