亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文字識別方法和裝置與流程

文檔序號:11276823閱讀:204來源:國知局
文字識別方法和裝置與流程

本發(fā)明涉及多媒體技術(shù),尤其涉及一種文字識別方法和裝置。



背景技術(shù):

隨著多媒體技術(shù)的不斷發(fā)展,圖片、視頻等等多媒體信息素材越來越多的應(yīng)用到各項(xiàng)技術(shù)中。在圖片、視頻等多媒體信息中,會配備有大量的文字信息,例如在圖片中具有文字說明,在視頻中具有字幕以及其他文字說明信息。在對多媒體信息進(jìn)行處理的時(shí)候,需要從單張圖片或者視頻中的各幀圖片中提取出文字,提取文字需要采用文字識別的方法。

現(xiàn)有技術(shù)中,對圖片中的文字,在人工的確定了圖片中的文字的語種之后,可以采用與該語種對應(yīng)的光學(xué)字符識別(opticalcharacterrecognition,簡稱ocr)核心庫進(jìn)行而文字的識別。

然而現(xiàn)有技術(shù)中,在進(jìn)行圖片的文字識別的時(shí)候,通常都是對大量的圖片進(jìn)行文字識別,現(xiàn)有技術(shù)中需要人工的對每一個(gè)圖片確定了圖片中的文字的語種之后,才可以采用與各語種對應(yīng)的ocr核心庫進(jìn)行文字識別,從而需要大量的人工操作,識別的時(shí)間較長,識別效率低。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供一種文字識別方法和裝置,用以解決現(xiàn)有技術(shù)中需要人工的對每一個(gè)圖片確定了圖片中的文字的語種之后,才可以采用與各語種對應(yīng)的ocr核心庫進(jìn)行文字識別,從而需要大量的人工操作,識別的時(shí)間較長,識別效率低的問題。

本發(fā)明的一方面是提供了一種文字識別方法,包括:

獲取待識別圖片;

采用至少一種語種的ocr核心庫對所述待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,所述識別結(jié)果中包括了至少一個(gè)字符;

確定各語種的識別結(jié)果的有效字符比例;

根據(jù)各語種的識別結(jié)果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結(jié)果。

如上所述的方法中,所述確定各語種的識別結(jié)果的有效字符比例,包括:

確定各語種的識別結(jié)果中的字符個(gè)數(shù),并確定各語種的識別結(jié)果中的各字符的字符編碼;

確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù);

根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù),以及各語種的識別結(jié)果的有效字符個(gè)數(shù),確定各語種的識別結(jié)果的有效字符比例。

如上所述的方法中,所述根據(jù)各語種的識別結(jié)果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結(jié)果,包括:

比較各語種的識別結(jié)果的有效字符比例的大小,確定最大值有效字符比例的語種為所述待識別圖片中的文字的語種,并確定最大值有效字符比例的語種的識別結(jié)果為所述待識別圖片的文字的識別有效結(jié)果。

如上所述的方法中,所述采用至少一種語種的ocr核心庫對所述待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,包括:

采用三種語種的ocr核心庫對所述待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,其中三種語種的ocr核心庫分別為中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫;

相應(yīng)的,所述根據(jù)各語種的識別結(jié)果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結(jié)果,包括:

若藏文語種的識別結(jié)果的有效字符比例r1大于等于預(yù)設(shè)比例,則判定所述待識別圖片中的文字的語種為藏文語種、所述待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為藏文語種、 所述待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1小于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為中文語種、所述待識別圖片中的文字的識別有效結(jié)果為中文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2小于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

本發(fā)明的另一方面是提供了一種文字識別裝置,包括:

獲取模塊,用于獲取待識別圖片;

識別模塊,用于采用至少一種語種的ocr核心庫對所述待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,所述識別結(jié)果中包括了至少一個(gè)字符;

確定模塊,用于確定各語種的識別結(jié)果的有效字符比例;

判定模塊,用于根據(jù)各語種的識別結(jié)果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結(jié)果。

如上所述的裝置中,所述確定模塊,包括:

第一確定子模塊,用于確定各語種的識別結(jié)果中的字符個(gè)數(shù),并確定各語種的識別結(jié)果中的各字符的字符編碼;

第二確定子模塊,用于確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù);

計(jì)算子模塊,用于根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù),以及各語種的識別結(jié)果的有效字符個(gè)數(shù),確定各語種的識別結(jié)果的有效字符比例。

如上所述的裝置中,所述判定模塊,具體用于:

比較各語種的識別結(jié)果的有效字符比例的大小,確定最大值有效字符比例的語種為所述待識別圖片中的文字的語種,并確定最大值有效字符比例的語種的識別結(jié)果為所述待識別圖片的文字的識別有效結(jié)果。

如上所述的裝置中,所述識別模塊,具體用于:

采用三種語種的ocr核心庫對所述待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,其中三種語種的ocr核心庫分別為中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫;

相應(yīng)的,所述判定模塊,具體用于:

若藏文語種的識別結(jié)果的有效字符比例r1大于等于預(yù)設(shè)比例,則判定所述待識別圖片中的文字的語種為藏文語種、所述待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為藏文語種、所述待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1小于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定所述待識別圖片中的文字的語種為中文語種、所述待識別圖片中的文字的識別有效結(jié)果為中文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2小于英文語種的識別結(jié)果的有效 字符比例r3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

本發(fā)明通過獲取待識別圖片,采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,識別結(jié)果中包括了至少一個(gè)字符;計(jì)算出各語種的識別結(jié)果的有效字符比例,根據(jù)各語種的識別結(jié)果的有效字符比例,判定待識別圖片中的文字的語種、以及待識別圖片中的文字的識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需要人工操作,縮短了識別的時(shí)間,提升了識別效率。

附圖說明

圖1為本發(fā)明實(shí)施例一提供的文字識別方法的流程圖;

圖2為本發(fā)明實(shí)施例二提供的文字識別方法的流程圖;

圖3為本發(fā)明實(shí)施例二提供的文字識別方法中的一種待識別圖片的示意圖;

圖4為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的中文語種識別結(jié)果的示意圖;

圖5為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的英文語種識別結(jié)果的示意圖;

圖6為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的藏文語種識別結(jié)果的示意圖;

圖7為本發(fā)明實(shí)施例三提供的文字識別方法的流程圖;

圖8為本發(fā)明實(shí)施例四提供的文字識別裝置的結(jié)構(gòu)示意圖;

圖9為本發(fā)明實(shí)施例五提供的文字識別裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于 本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

圖1為本發(fā)明實(shí)施例一提供的文字識別方法的流程圖,如圖1所示,本實(shí)施例的方法包括:

步驟101、獲取待識別圖片。

在本實(shí)施例中,具體的,在圖片、視頻等多媒體信息中,會配備有大量的文字信息,例如在圖片中具有文字說明,在微博的圖片中具有長微博文字圖片、在視頻中具有字幕以及其他文字說明信息。

首先獲取待識別的圖片,待識別的圖片包括了一張圖片,或者視頻中的單幀圖片。然后,可以對待識別圖片進(jìn)行分割,進(jìn)而便于后續(xù)步驟對分割后的待識別圖片中的文字一一進(jìn)行識別;還可以對待識別圖片進(jìn)行圖片預(yù)處理的工作,例如調(diào)整待識別圖片的亮度和對比圖、將待識別圖片調(diào)整為黑白值的圖片等。

步驟102、采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,識別結(jié)果中包括了至少一個(gè)字符。

在本實(shí)施例中,具體的,ocr識別技術(shù)具有多種語種的ocr核心庫,從而可以采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,進(jìn)而生成了各語種的識別結(jié)果,在各不同的識別結(jié)果中分別包括了至少一個(gè)字符。

舉例來說,可以采用中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫、德文語種的ocr核心庫、法文語種的ocr核心庫等對待識別圖片進(jìn)行文字識別,從而可以生成中文語種的識別結(jié)果、英文語種的識別結(jié)果、藏文語種的識別結(jié)果、德文語種的識別結(jié)果、法文語種的識別結(jié)果。

步驟103、確定各語種的識別結(jié)果的有效字符比例。

在本實(shí)施例中,具體的,對于步驟102中生成的各個(gè)語種的識別結(jié)果,計(jì)算出各語種的識別結(jié)果的有效字符比例。從而得到不同的語種的識別結(jié)果的各自的有效字符比例。

步驟104、根據(jù)各語種的識別結(jié)果的有效字符比例,判定待識別圖片中的文字的語種、以及待識別圖片中的文字的識別有效結(jié)果。

在本實(shí)施例中,具體的,根據(jù)步驟103中生成的各語種的識別結(jié)果的有 效字符比例,根據(jù)預(yù)設(shè)的判決決策來判定步驟101中的待識別圖片中的文字的語種,以及哪種語種的識別結(jié)果為待識別圖片中的文字的識別有效結(jié)果。

舉例來說,可以對待識別圖片采用至少一種語種的ocr核心庫進(jìn)行多次識別之后,對得到的各語種的識別結(jié)果的多次的有效字符比例,求取均值,從而確定均值最大值的語種為待識別圖片中的文字的語種、確定均值最大值的識別結(jié)果為待識別圖片中的文字的識別有效結(jié)果。

本實(shí)施例通過獲取待識別圖片,采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,識別結(jié)果中包括了至少一個(gè)字符;計(jì)算出各語種的識別結(jié)果的有效字符比例,根據(jù)各語種的識別結(jié)果的有效字符比例,判定待識別圖片中的文字的語種、以及待識別圖片中的文字的識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需要人工操作,縮短了識別的時(shí)間,提升了識別效率。

圖2為本發(fā)明實(shí)施例二提供的文字識別方法的流程圖,如圖2所示,在實(shí)施例一的基礎(chǔ)上,本實(shí)施例的方法中,步驟103,包括:

步驟1031、確定各語種的識別結(jié)果中的字符個(gè)數(shù),并確定各語種的識別結(jié)果中的各字符的字符編碼。

在本實(shí)施例中,具體的,由于各語種的識別結(jié)果都分別由多個(gè)字符構(gòu)成,從而可以確定出步驟102中生成的各語種的識別結(jié)果的字符個(gè)數(shù),同時(shí)確定出各語種的識別結(jié)果中的各字符的字符編碼。

步驟1032、確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù)。

在本實(shí)施例中,具體的,由于在unicode編碼下,不同的字符對應(yīng)著不同的編碼,不同語種的字符也對應(yīng)著不同的字符編碼區(qū)間。從而可以根據(jù)步驟1031中確定的各語種的識別結(jié)果中的各字符的字符編碼,分別確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù)。

舉例來說,圖3為本發(fā)明實(shí)施例二提供的文字識別方法中的一種待識別圖片的示意圖,如圖3所示,對圖3中提供的待識別圖片進(jìn)行識別;可以采 用中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫分別對圖3中的待識別圖片進(jìn)行文字識別,圖4為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的中文語種識別結(jié)果的示意圖,圖5為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的英文語種識別結(jié)果的示意圖,圖6為本發(fā)明實(shí)施例二提供的文字識別方法中的圖3的藏文語種識別結(jié)果的示意圖,如圖4、圖5和圖6所示,會生成中文語種的識別結(jié)果、英文語種的識別結(jié)果、藏文語種的識別結(jié)果;首先確定生成的中文語種的識別結(jié)果中的字符個(gè)數(shù)為6個(gè)字符,英文語種的識別結(jié)果中的字符個(gè)數(shù)為10個(gè)字符,藏文語種的識別結(jié)果中的字符個(gè)數(shù)為6個(gè)字符,并分別確定各語種的識別結(jié)果中的各字符的字符編碼;中文語種的字符編碼區(qū)間為0x4e00-0x9fa5,英文語種的字符編碼區(qū)間為0x0000-0x00ff,藏文語種的字符編碼區(qū)間為0x0f00-0x0fff;并且識別結(jié)果中的特殊字符等,并不在各語種的字符編碼區(qū)間中;從而確定中文語種的識別結(jié)果中的各字符的字符編碼,歸屬于中文語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù)為4個(gè);確定英文語種的識別結(jié)果中的各字符的字符編碼,歸屬于英文語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù)為6個(gè);確定藏文語種的識別結(jié)果中的各字符的字符編碼,歸屬于藏文語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù)為6個(gè)。

步驟1033、根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù),以及各語種的識別結(jié)果的有效字符個(gè)數(shù),確定各語種的識別結(jié)果的有效字符比例。

在本實(shí)施例中,具體的,根據(jù)步驟1031中確定出的各語種的識別結(jié)果的字符個(gè)數(shù),以及步驟1032中計(jì)算出的各語種的識別結(jié)果的有效字符個(gè)數(shù),可以分別計(jì)算出各語種的識別結(jié)果的有效字符比例。

舉例來說,可以根據(jù)中文語種的識別結(jié)果的字符個(gè)數(shù)6,中文語種的識別結(jié)果的有效字符個(gè)數(shù)4,確定中文語種的識別結(jié)果的有效字符比例為2/3;根據(jù)英文語種的識別結(jié)果的字符個(gè)數(shù)10,英文語種的識別結(jié)果的有效字符個(gè)數(shù)6,確定英文語種的識別結(jié)果的有效字符比例為3/5;根據(jù)藏文語種的識別結(jié)果的字符個(gè)數(shù)6,藏文語種的識別結(jié)果的有效字符個(gè)數(shù)6,確定藏文語種的識別結(jié)果的有效字符比例為1/1。

步驟104具體包括:

比較各語種的識別結(jié)果的有效字符比例的大小,確定最大值有效字符比 例的語種為待識別圖片中的文字的語種,并確定最大值有效字符比例的語種的識別結(jié)果為待識別圖片的文字的識別有效結(jié)果。

在本實(shí)施例中,具體的,在確定了各語種的識別結(jié)果的有效字符比例之后,可以比較各語種的識別結(jié)果的有效字符比例的大小,取有效字符比例的值最大的語種作為最終的語種的識別結(jié)果,從而可以確定出待識別圖片的語種和文字識別的結(jié)果。準(zhǔn)確來說,將最大值有效字符比例的語種作為待識別圖片中的文字的語種,將最大值有效字符比例的語種的識別結(jié)果作為待識別圖片的文字的識別有效結(jié)果。

舉例來說,中文語種的識別結(jié)果的有效字符比例為67%,英文語種的識別結(jié)果的有效字符比例為60%,藏文語種的識別結(jié)果的有效字符比例為100%,從而藏文語種的識別結(jié)果的有效字符比例的值最大,可以確定待識別圖片中的文字的語種為藏文,將藏文語種的識別結(jié)果作為待識別圖片的文字的識別有效結(jié)果。

本實(shí)施例通過確定各語種的識別結(jié)果中的字符個(gè)數(shù);并確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù);從而可以根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù)、各語種的識別結(jié)果的有效字符個(gè)數(shù),可以分別計(jì)算出各語種的識別結(jié)果的有效字符比例;進(jìn)而取最大值有效字符比例的語種為待識別圖片中的文字的語種、取最大值有效字符比例的語種的識別結(jié)果為待識別圖片的文字的識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需要人工操作,縮短了識別的時(shí)間,提升了識別效率。

圖7為本發(fā)明實(shí)施例三提供的文字識別方法的流程圖,如圖7所示,在實(shí)施例一和實(shí)施例二的基礎(chǔ)上,本實(shí)施例的方法中,步驟102具體包括:

采用三種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,其中三種語種的ocr核心庫分別為中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫;

相應(yīng)的,步驟104具體包括:

若藏文語種的識別結(jié)果的有效字符比例r1大于等于預(yù)設(shè)比例,則判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果 為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為中文語種、待識別圖片中的文字的識別有效結(jié)果為中文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

在本實(shí)施例中,具體的,在獲取了待識別圖片、對待識別圖片進(jìn)行了圖片預(yù)處理的工作之后,可以采用采用三種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,其中,三種語種的ocr核心庫分別為中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫。從而生成各語種的識別結(jié)果:中文語種的識別結(jié)果、英文語種的識別結(jié)果、藏文語種的識別結(jié)果。

分別計(jì)算出中文語種的識別結(jié)果、英文語種的識別結(jié)果、藏文語種的識別結(jié)果各自的有效字符比例。

首先,判斷藏文語種的識別結(jié)果的有效字符比例r1是否大于等于預(yù)設(shè)比例t1。若藏文語種的識別結(jié)果的有效字符比例r1大于等于預(yù)設(shè)比例t1,則 判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果。若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例t1,則判斷藏文語種的識別結(jié)果的有效字符比例r1是否大于等于中文語種的識別結(jié)果的有效字符比例r2。

然后,確定在藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例t1,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2時(shí),再去判斷藏文語種的識別結(jié)果的有效字符比例r1是否大于等于英文語種的識別結(jié)果的有效字符比例r3,若此時(shí)藏文語種的識別結(jié)果的有效字符比例r1大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果,若此時(shí)藏文語種的識別結(jié)果的有效字符比例r1小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

確定在藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例t1,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2時(shí),再去判斷中文語種的識別結(jié)果的有效字符比例r2是否大于等于英文語種的識別結(jié)果的有效字符比例r3,若此時(shí)中文語種的識別結(jié)果的有效字符比例r2大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為中文語種、待識別圖片中的文字的識別有效結(jié)果為中文語種的識別結(jié)果,若此時(shí)中文語種的識別結(jié)果的有效字符比例r2小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

本實(shí)施例在采用中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫分別對待識別圖片進(jìn)行文字識別時(shí),采用藏文語種的識別結(jié)果的有效字符比例、中文語種的識別結(jié)果的有效字符比例、英文語種的識別結(jié)果的有效字符比例進(jìn)行相互比較的決策判別方式,最終確定出待識別圖片中的文字的語種、以及識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需 要人工操作,縮短了識別的時(shí)間,提升了識別效率。

圖8為本發(fā)明實(shí)施例四提供的文字識別裝置的結(jié)構(gòu)示意圖,如圖8所示,本實(shí)施例提供的文字識別裝置,包括:

獲取模塊31,用于獲取待識別圖片;

識別模塊32,用于采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,識別結(jié)果中包括了至少一個(gè)字符;

確定模塊33,用于確定各語種的識別結(jié)果的有效字符比例;

判定模塊34,用于根據(jù)各語種的識別結(jié)果的有效字符比例,判定待識別圖片中的文字的語種、以及待識別圖片中的文字的識別有效結(jié)果。

本實(shí)施例的文字識別裝置可執(zhí)行本發(fā)明實(shí)施例一提供的文字識別方法,其實(shí)現(xiàn)原理相類似,此處不再贅述。

本實(shí)施例通過獲取待識別圖片,采用至少一種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,識別結(jié)果中包括了至少一個(gè)字符;計(jì)算出各語種的識別結(jié)果的有效字符比例,根據(jù)各語種的識別結(jié)果的有效字符比例,判定待識別圖片中的文字的語種、以及待識別圖片中的文字的識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需要人工操作,縮短了識別的時(shí)間,提升了識別效率。

圖9為本發(fā)明實(shí)施例五提供的文字識別裝置的結(jié)構(gòu)示意圖,在實(shí)施例四的基礎(chǔ)上,如圖9所示,本實(shí)施例提供的文字識別裝置,確定模塊33,包括:

第一確定子模塊331,用于確定各語種的識別結(jié)果中的字符個(gè)數(shù),并確定各語種的識別結(jié)果中的各字符的字符編碼;

第二確定子模塊332,用于確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù);

計(jì)算子模塊333,用于根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù),以及各語種的識別結(jié)果的有效字符個(gè)數(shù),確定各語種的識別結(jié)果的有效字符比例。

判定模塊34,具體用于:

比較各語種的識別結(jié)果的有效字符比例的大小,確定最大值有效字符比例的語種為待識別圖片中的文字的語種,并確定最大值有效字符比例的語種 的識別結(jié)果為待識別圖片的文字的識別有效結(jié)果。

或者,識別模塊32,具體用于:

采用三種語種的ocr核心庫對待識別圖片進(jìn)行文字識別,生成各語種的識別結(jié)果,其中三種語種的ocr核心庫分別為中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫;

相應(yīng)的,判定模塊34,具體用于:

若藏文語種的識別結(jié)果的有效字符比例r1大于等于預(yù)設(shè)比例,則判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為藏文語種、待識別圖片中的文字的識別有效結(jié)果為藏文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1大于等于中文語種的識別結(jié)果的有效字符比例r2,且藏文語種的識別結(jié)果的有效字符比例r1小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2大于等于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為中文語種、待識別圖片中的文字的識別有效結(jié)果為中文語種的識別結(jié)果;

若藏文語種的識別結(jié)果的有效字符比例r1小于預(yù)設(shè)比例,且藏文語種的識別結(jié)果的有效字符比例r1小于中文語種的識別結(jié)果的有效字符比例r2,且中文語種的識別結(jié)果的有效字符比例r2小于英文語種的識別結(jié)果的有效字符比例r3,則判定待識別圖片中的文字的語種為英文語種、待識別圖片中的文字的識別有效結(jié)果為英文語種的識別結(jié)果。

本實(shí)施例的文字識別裝置可執(zhí)行本發(fā)明實(shí)施例一和實(shí)施例二提供的文字 識別方法,其實(shí)現(xiàn)原理相類似,此處不再贅述。

本實(shí)施例通過確定各語種的識別結(jié)果中的字符個(gè)數(shù);并確定各語種的識別結(jié)果中的各字符的字符編碼,歸屬于各語種的字符編碼區(qū)間內(nèi)的有效字符個(gè)數(shù);從而可以根據(jù)各語種的識別結(jié)果的字符個(gè)數(shù)、各語種的識別結(jié)果的有效字符個(gè)數(shù),可以分別計(jì)算出各語種的識別結(jié)果的有效字符比例;進(jìn)而取最大值有效字符比例的語種為待識別圖片中的文字的語種、取最大值有效字符比例的語種的識別結(jié)果為待識別圖片的文字的識別有效結(jié)果。并且在采用中文語種的ocr核心庫、英文語種的ocr核心庫、藏文語種的ocr核心庫分別對待識別圖片進(jìn)行文字識別時(shí),采用藏文語種的識別結(jié)果的有效字符比例、中文語種的識別結(jié)果的有效字符比例、英文語種的識別結(jié)果的有效字符比例進(jìn)行相互比較的決策判別方式,最終確定出待識別圖片中的文字的語種、以及識別有效結(jié)果。從而可以不需要人工的對待識別圖片確定了圖片中的文字的語種之后,再進(jìn)行文字識別;可以自動的判定待識別圖片中的文字的語種,同時(shí)確定待識別圖片中的文字的識別結(jié)果,不需要人工操作,縮短了識別的時(shí)間,提升了識別效率。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1