亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文檔錄入方法、系統(tǒng)及電子設(shè)備與流程

文檔序號(hào):12597333閱讀:343來源:國(guó)知局
一種文檔錄入方法、系統(tǒng)及電子設(shè)備與流程

本發(fā)明涉及電子設(shè)備技術(shù)領(lǐng)域,更具體地說,涉及一種文檔錄入方法及系統(tǒng)。



背景技術(shù):

這兩年智能手機(jī)的硬件比拼進(jìn)入白熱化,手機(jī)的拍照能力也成為衡量一款手機(jī)性能的重要標(biāo)準(zhǔn),而最能反應(yīng)拍照能力的量化標(biāo)準(zhǔn)就是手機(jī)的像素。手機(jī)攝像頭的像素?cái)?shù)在這幾年的增幅很快:2010年是500萬,2011和2012年800萬是標(biāo)配,在去年,許多手機(jī)已經(jīng)提升到了1300萬像素。而現(xiàn)在,這個(gè)數(shù)字增加到1600萬,甚至是2000萬。

隨著像素的不斷提升,手機(jī)攝像頭除了能拍攝更加清晰的照片和錄制更加逼真的視頻以外,還可以實(shí)現(xiàn)更多的功能?,F(xiàn)有技術(shù)中,二維碼識(shí)別和條形碼識(shí)別已經(jīng)得到了廣泛的應(yīng)用,用戶可以通過手機(jī)攝像頭對(duì)二維碼和條形碼進(jìn)行掃碼,從而實(shí)現(xiàn)付款、獲取網(wǎng)絡(luò)地址或獲取他人名片信息等功能。但目前為止,手機(jī)還無法通過攝像頭識(shí)別文檔并將文檔信息錄入手機(jī),當(dāng)需要將文檔信息錄入手機(jī)時(shí),用戶只能通過手動(dòng)逐字逐句的輸入,耗時(shí)長(zhǎng),效率低,用戶體驗(yàn)差。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種文檔錄入方法,能夠自動(dòng)錄入文檔信息,減少了耗時(shí),提升了用戶體驗(yàn)。

為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種文檔錄入方法,其特征在于,應(yīng)用于電子設(shè)備,所述方法包括以下步驟:

獲取待錄入文檔的圖像信息;

判斷所述圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從所述字塊框中獲取字塊信息,所述字塊信息為組成所述待錄入文檔的信息;

將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

優(yōu)選地,所述當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從所述字塊框中獲取字塊信息包括:

將所述圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。

優(yōu)選地,所述當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從所述字塊框中獲取字塊信息還包括:

提取所述單個(gè)字塊信息中,所述單個(gè)字塊在所述字塊框中的位置信息。

優(yōu)選地,所述將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息包括:

將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配;

在所述文字信息、符號(hào)信息或數(shù)字信息中,將與所述字塊信息相匹配的信息確定為文檔信息。

優(yōu)選地,當(dāng)所述字塊信息符合所述文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),還包括:

基于字塊在所述字塊框中的位置信息,獲取所述字塊前后的N個(gè)字塊,其中N≥1;

將所述N個(gè)字塊的信息分別與所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配;

分別統(tǒng)計(jì)所述N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與所述符號(hào)信息的第二匹配成功率和與所述數(shù)字信息的第三匹配成功率;

將所述第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

一種文檔錄入系統(tǒng),應(yīng)用于電子設(shè)備,所述系統(tǒng)包括:

第一獲取模塊,用于獲取待錄入文檔的圖像信息;

判斷模塊,用于判斷所述圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

第二獲取模塊,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從所述字塊框中獲取字塊信息,所述字塊信息為組成所述待錄入文檔的信息;

比較模塊,用于將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

生成模塊,用于基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

優(yōu)選地,所述第二獲取模塊包括:

劃分單元,用于將所述圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。

優(yōu)選地,所述第二獲取模塊還包括:

提取單元,用于提取所述單個(gè)字塊信息中,所述單個(gè)字塊在所述字塊框中的位置信息。

優(yōu)選地,所述比較模塊包括:

判斷單元,用于將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

第一匹配單元,用于當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配;

第一確定單元,用于在所述文字信息、符號(hào)信息或數(shù)字信息中,將與所述字塊信息相匹配的信息確定為文檔信息。

優(yōu)選地,所述比較模塊還包括:

獲取單元,用于當(dāng)所述字塊信息符合所述文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),基于字塊在所述字塊框中的位置信息,獲取所述字塊前后的N個(gè)字塊,其中N≥1;

第二匹配單元,用于將所述N個(gè)字塊的信息分別與所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配;

統(tǒng)計(jì)單元,用于分別統(tǒng)計(jì)所述N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與所述符號(hào)信息的第二匹配成功率和與所述數(shù)字信息的第三匹配成功率;

第二確定單元,用于將所述第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

一種電子設(shè)備,包括:文檔錄入系統(tǒng);其中:

所述文檔錄入系統(tǒng)包括:第一獲取模塊,用于獲取待錄入文檔的圖像信息;

判斷模塊,用于判斷所述圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

第二獲取模塊,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從所述字塊框中獲取字塊信息,所述字塊信息為組成所述待錄入文檔的信息;

比較模塊,用于將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

生成模塊,用于基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

從上述技術(shù)方案可以看出,本發(fā)明提供的一種文檔錄入方法,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,減少了耗時(shí),提升了用戶體驗(yàn)。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其它的附圖。

圖1為本發(fā)明公開的一種文檔錄入方法實(shí)施例一的方法流程圖;

圖2為本發(fā)明公開的一種文檔錄入方法實(shí)施例二的方法流程圖;

圖3為本發(fā)明公開的一種文檔錄入方法實(shí)施例三的方法流程圖;

圖4為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例一的結(jié)構(gòu)示意圖;

圖5為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例二的結(jié)構(gòu)示意圖;

圖6為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例三的結(jié)構(gòu)示意圖;

圖7為本發(fā)明公開的一種電子設(shè)備實(shí)施例一的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

如圖1所示,為本發(fā)明公開的一種文檔錄入方法實(shí)施例1的流程圖,該方法應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟:

S101、獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

S102、判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

S103、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,所述字塊信息為組成待錄入文檔的信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,從字塊框中獲取字塊信息。其中,字塊信息為組成待錄入文檔的信息。

S104、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

進(jìn)一步將獲取到的字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,其中,預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息。需要說明的是,文字信息包括各國(guó)文字,如漢字、英文字母、韓文等。符號(hào)信息可以包括各種標(biāo)點(diǎn)符號(hào)及其他特殊符號(hào)。數(shù)字信息可以包括阿拉伯?dāng)?shù)字和羅馬數(shù)字。

S105、基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

最后基于獲取到的文檔信息生成與待錄入文檔對(duì)應(yīng)的文檔,實(shí)現(xiàn)自動(dòng)將待錄入文檔錄入至系統(tǒng)中。需要說明的是,在基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔后,還可以進(jìn)一步將錄入的文檔進(jìn)行存儲(chǔ),便于后續(xù)調(diào)用。在生成與待錄入文檔相對(duì)應(yīng)的文檔時(shí),可以根據(jù)用戶的實(shí)際需求選擇生成doc、txt或PDF等格式的文件。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖2所示,為本發(fā)明公開的一種文檔錄入方法實(shí)施例2的流程圖,該方法應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟:

S201、獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

S202、判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

S203、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。其中,單個(gè)字塊信息可以為文字信息、符號(hào)信息或數(shù)字信息。

在將圖像信息中的字塊框進(jìn)行字塊劃分時(shí),獲取到的圖像信息的圖像背景色為白色,圖像信息中的字塊框內(nèi)被認(rèn)為是字塊的線條為黑色,在字塊框內(nèi)尋找不包含或極少包含黑色的貫穿整個(gè)字塊框的直的帶狀區(qū)域,帶狀區(qū)域?qū)挾瓤扇?.1~1mm,這些帶狀區(qū)域即是字塊框內(nèi)行或列的分界線,可以通過這些分界線將整個(gè)字塊框分為若干行或若干列。

然后在這些行或列中,按一定的長(zhǎng)寬比例范圍,如長(zhǎng)度為寬度的1~1.5倍,尋找不包含或者極少包含黑色的,垂直于上述行或列的分界線的帶狀區(qū)域,此處帶狀區(qū)域?qū)挾热钥扇?.1~1mm,分界線將行或列分割為若干個(gè)單個(gè)字塊,此時(shí)每個(gè)單個(gè)字塊內(nèi)就只包括一個(gè)文字、數(shù)字或字符。

S204、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

將劃分得到的每個(gè)字塊信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,通過識(shí)別判斷字塊信息是否只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種。

S205、當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配;

當(dāng)通過比較確定只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),例如文字“我”因其特征較為明顯,不會(huì)出現(xiàn)在符號(hào)信息或數(shù)字信息中,通過比較能夠?qū)⑽淖帧拔摇敝苯哟_定為文字信息。例如標(biāo)點(diǎn)符號(hào)“?”因其特征較為明顯,不會(huì)出現(xiàn)在文字信息或數(shù)字信息中,通過比較能夠?qū)⒎?hào)“?”直接確定為符號(hào)信息。將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配。例如,當(dāng)確定字塊信息為文字信息時(shí),將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息進(jìn)行匹配,在預(yù)設(shè)字庫(kù)中的文字信息中找出與字塊信息相匹配的文字。

S206、在所述文字信息、符號(hào)信息或數(shù)字信息中,將與所述字塊信息相匹配的信息確定為文檔信息。

在將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配時(shí),將預(yù)設(shè)字庫(kù)中與字款信息相匹配的信息確定為文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理,最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種,當(dāng)字塊信息只符合文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將字塊信息與文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配,最后在文字信息、符號(hào)信息或數(shù)字信息中,將與字塊信息相匹配的信息確定為文檔信息。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖3所示,為本發(fā)明公開的一種文檔錄入方法實(shí)施例3的流程圖,該方法應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟:

S301、獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

S302、判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

S303、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。其中,單個(gè)字塊信息可以為文字信息、符號(hào)信息或數(shù)字信息。

在將圖像信息中的字塊框進(jìn)行字塊劃分時(shí),獲取到的圖像信息的圖像背景色為白色,圖像信息中的字塊框內(nèi)被認(rèn)為是字塊的線條為黑色,在字塊框內(nèi)尋找不包含或極少包含黑色的貫穿整個(gè)字塊框的直的帶狀區(qū)域,帶狀區(qū)域?qū)挾瓤扇?.1~1mm,這些帶狀區(qū)域即是字塊框內(nèi)行或列的分界線,可以通過這些分界線將整個(gè)字塊框分為若干行或若干列。

然后在這些行或列中,按一定的長(zhǎng)寬比例范圍,如長(zhǎng)度為寬度的1~1.5倍,尋找不包含或者極少包含黑色的,垂直于上述行或列的分界線的帶狀區(qū)域,此處帶狀區(qū)域?qū)挾热钥扇?.1~1mm,分界線將行或列分割為若干個(gè)單個(gè)字塊,此時(shí)每個(gè)單個(gè)字塊內(nèi)就只包括一個(gè)文字、數(shù)字或字符。

S304、提取單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息;

為了便于后續(xù)的文檔錄入,進(jìn)一步提取出單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息。具體可采用的方法為:給每個(gè)單個(gè)字塊設(shè)置坐標(biāo)屬性,X和Y,其中第一行第一列的單個(gè)字塊X=1,Y=1;第一行第二列的單個(gè)字塊X=2,Y=1;第二行第一列的單個(gè)字塊X=1,Y=2,以此類推。這樣可以保證文檔在錄入后還能按照原來的排列順序生成文檔。

S305、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

將劃分得到的每個(gè)字塊信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,通過識(shí)別判斷字塊信息是否只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種。

S306、當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,其中N≥1;

在將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較時(shí),某些字塊存在特殊性,在進(jìn)行比較時(shí),容易將字塊信息確定為兩種或兩種以上的信息。例如,字母“Z”,在與預(yù)設(shè)字庫(kù)中的信息進(jìn)行對(duì)比的過程中,因“Z”與文字信息中的英文字母“Z”的特征相符,可認(rèn)為其符合文字信息的特征,但“Z”還可能與數(shù)字信息中的數(shù)字“2”的特征相符,又可以認(rèn)為其符合數(shù)字信息的特征。發(fā)生這種情況的時(shí),無法直接將“Z”分類為文字信息或數(shù)字信息。

此時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,其中N≥1。例如,假設(shè)“Z”為字塊框“PIZZA”中第三個(gè)從左往右第三個(gè)單個(gè)字塊,此時(shí)“Z”位置信息即為X=3,Y=1。此時(shí)找到“Z”的前后四個(gè)單個(gè)字塊,則可以找到X=1,Y=1的“P”;X=2,Y=1的“I”;X=4,Y=1的“Z”;X=5,Y=1的“A”。

S307、將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配;

在上述例子中,需要被分類的單個(gè)字塊“Z”的前后四個(gè)單個(gè)字塊中,雖然“I”和另外一個(gè)單個(gè)字塊“Z”仍不能被直接分類為文字字塊,但單個(gè)字塊“P”和單個(gè)字塊“A”則只符合文字信息的特征,因此可以分類為文字字塊。

S308、分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率;

在匹配的過程中,分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率;例如,在上述例子中,需要被分類的單個(gè)字塊“Z”前后四個(gè)單個(gè)字塊,兩個(gè)類別不確定,兩個(gè)為文字字塊,與文字信息相匹配的成功率最大,且需要被分類的單個(gè)字塊“Z”也符合文字信息的特征,所以需要被分類的單個(gè)字塊“Z”即被確定為文字信息。

需要說明的是,在上述過程中,還可能出現(xiàn)以下幾種情況:

(1)前后若干個(gè)字塊均無法被分類;

(2)前后若干個(gè)字塊出現(xiàn)了不止一種類型的字塊,但每種字塊所占比例相同,且需要被分類的單個(gè)字塊也符合這幾種類型的特征;

(3)前后若干個(gè)字塊出現(xiàn)了一種類型字塊,但需要被分類的單個(gè)字塊不符合這種類型的特征;

在發(fā)生上述情況時(shí),則加大查找的前后單個(gè)字塊的數(shù)量,再以上述方法對(duì)上述字塊進(jìn)行分類,直到將需要被分類的單個(gè)字塊分為某一個(gè)類型的字塊為止。需要說明的是,除上述情況外,還可能出現(xiàn)其他情況,處理這些情況的方法也并不只限于本實(shí)施例中所述的方法,在此只是對(duì)針對(duì)這幾種情況的方法進(jìn)行了詳述。

S309、將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理,最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息,并提取單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種,當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配,分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率,將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖4所示,為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例1的結(jié)構(gòu)示意圖,該系統(tǒng)應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含:

第一獲取模塊401,用于獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

判斷模塊402,用于判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

第二獲取模塊403,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,所述字塊信息為組成待錄入文檔的信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,從字塊框中獲取字塊信息。其中,字塊信息為組成待錄入文檔的信息。

比較模塊404,用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

進(jìn)一步將獲取到的字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,其中,預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息。需要說明的是,文字信息包括各國(guó)文字,如漢字、英文字母、韓文等。符號(hào)信息可以包括各種標(biāo)點(diǎn)符號(hào)及其他特殊符號(hào)。數(shù)字信息可以包括阿拉伯?dāng)?shù)字和羅馬數(shù)字。

生成模塊405,用于基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

最后基于獲取到的文檔信息生成與待錄入文檔對(duì)應(yīng)的文檔,實(shí)現(xiàn)自動(dòng)將待錄入文檔錄入至系統(tǒng)中。需要說明的是,在基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔后,還可以進(jìn)一步將錄入的文檔進(jìn)行存儲(chǔ),便于后續(xù)調(diào)用。在生成與待錄入文檔相對(duì)應(yīng)的文檔時(shí),可以根據(jù)用戶的實(shí)際需求選擇生成doc、txt或PDF等格式的文件。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖5所示,為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例2的結(jié)構(gòu)示意圖,該系統(tǒng)應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含:

第一獲取模塊501,用于獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

判斷模塊502,用于判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

劃分單元503,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。其中,單個(gè)字塊信息可以為文字信息、符號(hào)信息或數(shù)字信息。

在將圖像信息中的字塊框進(jìn)行字塊劃分時(shí),獲取到的圖像信息的圖像背景色為白色,圖像信息中的字塊框內(nèi)被認(rèn)為是字塊的線條為黑色,在字塊框內(nèi)尋找不包含或極少包含黑色的貫穿整個(gè)字塊框的直的帶狀區(qū)域,帶狀區(qū)域?qū)挾瓤扇?.1~1mm,這些帶狀區(qū)域即是字塊框內(nèi)行或列的分界線,可以通過這些分界線將整個(gè)字塊框分為若干行或若干列。

然后在這些行或列中,按一定的長(zhǎng)寬比例范圍,如長(zhǎng)度為寬度的1~1.5倍,尋找不包含或者極少包含黑色的,垂直于上述行或列的分界線的帶狀區(qū)域,此處帶狀區(qū)域?qū)挾热钥扇?.1~1mm,分界線將行或列分割為若干個(gè)單個(gè)字塊,此時(shí)每個(gè)單個(gè)字塊內(nèi)就只包括一個(gè)文字、數(shù)字或字符。

判斷單元504,用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

將劃分得到的每個(gè)字塊信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,通過識(shí)別判斷字塊信息是否只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種。

第一匹配單元505,用于當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配;

當(dāng)通過比較確定只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),例如文字“我”因其特征較為明顯,不會(huì)出現(xiàn)在符號(hào)信息或數(shù)字信息中,通過比較能夠?qū)⑽淖帧拔摇敝苯哟_定為文字信息。例如標(biāo)點(diǎn)符號(hào)“?”因其特征較為明顯,不會(huì)出現(xiàn)在文字信息或數(shù)字信息中,通過比較能夠?qū)⒎?hào)“?”直接確定為符號(hào)信息。將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配。例如,當(dāng)確定字塊信息為文字信息時(shí),將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息進(jìn)行匹配,在預(yù)設(shè)字庫(kù)中的文字信息中找出與字塊信息相匹配的文字。

第一確定單元506,用于在所述文字信息、符號(hào)信息或數(shù)字信息中,將與所述字塊信息相匹配的信息確定為文檔信息。

在將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配時(shí),將預(yù)設(shè)字庫(kù)中與字款信息相匹配的信息確定為文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理,最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種,當(dāng)字塊信息只符合文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí),將字塊信息與文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配,最后在文字信息、符號(hào)信息或數(shù)字信息中,將與字塊信息相匹配的信息確定為文檔信息。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖6所示,為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例3的結(jié)構(gòu)示意圖,該系統(tǒng)應(yīng)用于電子設(shè)備,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含:

第一獲取模塊601,用于獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

判斷模塊602,用于判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

劃分單元603,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息。其中,單個(gè)字塊信息可以為文字信息、符號(hào)信息或數(shù)字信息。

在將圖像信息中的字塊框進(jìn)行字塊劃分時(shí),獲取到的圖像信息的圖像背景色為白色,圖像信息中的字塊框內(nèi)被認(rèn)為是字塊的線條為黑色,在字塊框內(nèi)尋找不包含或極少包含黑色的貫穿整個(gè)字塊框的直的帶狀區(qū)域,帶狀區(qū)域?qū)挾瓤扇?.1~1mm,這些帶狀區(qū)域即是字塊框內(nèi)行或列的分界線,可以通過這些分界線將整個(gè)字塊框分為若干行或若干列。

然后在這些行或列中,按一定的長(zhǎng)寬比例范圍,如長(zhǎng)度為寬度的1~1.5倍,尋找不包含或者極少包含黑色的,垂直于上述行或列的分界線的帶狀區(qū)域,此處帶狀區(qū)域?qū)挾热钥扇?.1~1mm,分界線將行或列分割為若干個(gè)單個(gè)字塊,此時(shí)每個(gè)單個(gè)字塊內(nèi)就只包括一個(gè)文字、數(shù)字或字符。

提取單元604,用于提取單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息;

為了便于后續(xù)的文檔錄入,進(jìn)一步提取出單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息。具體可采用的方法為:給每個(gè)單個(gè)字塊設(shè)置坐標(biāo)屬性,X和Y,其中第一行第一列的單個(gè)字塊X=1,Y=1;第一行第二列的單個(gè)字塊X=2,Y=1;第二行第一列的單個(gè)字塊X=1,Y=2,以此類推。這樣可以保證文檔在錄入后還能按照原來的排列順序生成文檔。

判斷單元605,用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種;

將劃分得到的每個(gè)字塊信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,通過識(shí)別判斷字塊信息是否只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種。

獲取單元606,用于當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,其中N≥1;

在將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較時(shí),某些字塊存在特殊性,在進(jìn)行比較時(shí),容易將字塊信息確定為兩種或兩種以上的信息。例如,字母“Z”,在與預(yù)設(shè)字庫(kù)中的信息進(jìn)行對(duì)比的過程中,因“Z”與文字信息中的英文字母“Z”的特征相符,可認(rèn)為其符合文字信息的特征,但“Z”還可能與數(shù)字信息中的數(shù)字“2”的特征相符,又可以認(rèn)為其符合數(shù)字信息的特征。發(fā)生這種情況的時(shí),無法直接將“Z”分類為文字信息或數(shù)字信息。

此時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,其中N≥1。例如,假設(shè)“Z”為字塊框“PIZZA”中第三個(gè)從左往右第三個(gè)單個(gè)字塊,此時(shí)“Z”位置信息即為X=3,Y=1。此時(shí)找到“Z”的前后四個(gè)單個(gè)字塊,則可以找到X=1,Y=1的“P”;X=2,Y=1的“I”;X=4,Y=1的“Z”;X=5,Y=1的“A”。

第二匹配單元607,用于將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配;

在上述例子中,需要被分類的單個(gè)字塊“Z”的前后四個(gè)單個(gè)字塊中,雖然“I”和另外一個(gè)單個(gè)字塊“Z”仍不能被直接分類為文字字塊,但單個(gè)字塊“P”和單個(gè)字塊“A”則只符合文字信息的特征,因此可以分類為文字字塊。

統(tǒng)計(jì)單元608,用于分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率;

在匹配的過程中,分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率;例如,在上述例子中,需要被分類的單個(gè)字塊“Z”前后四個(gè)單個(gè)字塊,兩個(gè)類別不確定,兩個(gè)為文字字塊,與文字信息相匹配的成功率最大,且需要被分類的單個(gè)字塊“Z”也符合文字信息的特征,所以需要被分類的單個(gè)字塊“Z”即被確定為文字信息。

需要說明的是,在上述過程中,還可能出現(xiàn)以下幾種情況:

(1)前后若干個(gè)字塊均無法被分類;

(2)前后若干個(gè)字塊出現(xiàn)了不止一種類型的字塊,但每種字塊所占比例相同,且需要被分類的單個(gè)字塊也符合這幾種類型的特征;

(3)前后若干個(gè)字塊出現(xiàn)了一種類型字塊,但需要被分類的單個(gè)字塊不符合這種類型的特征;

在發(fā)生上述情況時(shí),則加大查找的前后單個(gè)字塊的數(shù)量,再以上述方法對(duì)上述字塊進(jìn)行分類,直到將需要被分類的單個(gè)字塊分為某一個(gè)類型的字塊為止。需要說明的是,除上述情況外,還可能出現(xiàn)其他情況,處理這些情況的方法也并不只限于本實(shí)施例中所述的方法,在此只是對(duì)針對(duì)這幾種情況的方法進(jìn)行了詳述。

第二確定單元609,用于將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理,最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),將圖像信息中的字塊框進(jìn)行字塊劃分,生成若干個(gè)單個(gè)字塊信息,并提取單個(gè)字塊信息中,單個(gè)字塊在所述字塊框中的位置信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,判斷字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種,當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí),基于字塊在字塊框中的位置信息,獲取字塊前后的N個(gè)字塊,將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配,分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率,將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

如圖7所示,為本發(fā)明公開的一種電子設(shè)備實(shí)施例1的結(jié)構(gòu)示意圖,所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述電子設(shè)備包含文檔錄入系統(tǒng)71;其中:

文檔錄入系統(tǒng)71包括:

第一獲取模塊711,用于獲取待錄入文檔的圖像信息;

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí),開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后,首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí),可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描,將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是,為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息,電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí),每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描,以使每次獲取到圖像更加的清晰,經(jīng)過多次拍照或掃描后,獲得待錄入文檔的全部圖像信息。

判斷模塊712,用于判斷圖像信息中是否包含能夠讀取的字塊框,所述字塊框?yàn)榘龃浫胛臋n的區(qū)域;

當(dāng)獲取到待錄入文檔的圖像信息后,對(duì)待錄入文檔的圖像信息進(jìn)行判斷,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí),重新獲取待錄入文檔的圖像信息,直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是,所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

第二獲取模塊713,用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,所述字塊信息為組成待錄入文檔的信息;

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),進(jìn)一步對(duì)字塊框進(jìn)行處理,從字塊框中獲取字塊信息。其中,字塊信息為組成待錄入文檔的信息。

比較模塊714,用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息;

進(jìn)一步將獲取到的字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,其中,預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息。需要說明的是,文字信息包括各國(guó)文字,如漢字、英文字母、韓文等。符號(hào)信息可以包括各種標(biāo)點(diǎn)符號(hào)及其他特殊符號(hào)。數(shù)字信息可以包括阿拉伯?dāng)?shù)字和羅馬數(shù)字。

生成模塊715,用于基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

最后基于獲取到的文檔信息生成與待錄入文檔對(duì)應(yīng)的文檔,實(shí)現(xiàn)自動(dòng)將待錄入文檔錄入至系統(tǒng)中。需要說明的是,在基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔后,還可以進(jìn)一步將錄入的文檔進(jìn)行存儲(chǔ),便于后續(xù)調(diào)用。在生成與待錄入文檔相對(duì)應(yīng)的文檔時(shí),可以根據(jù)用戶的實(shí)際需求選擇生成doc、txt或PDF等格式的文件。

綜上所述,在上述實(shí)施例中,當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí),首先獲取待錄入文檔的圖像信息,判斷圖像信息中是否包含能夠讀取的字塊框,當(dāng)圖像信息中包含能夠讀取的字塊框時(shí),從字塊框中獲取字塊信息,然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較,獲得文檔信息,最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息,無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入,減少了耗時(shí),提升了用戶體驗(yàn)。

本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。

對(duì)所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1