一種文檔錄入方法、系統(tǒng)及電子設(shè)備與流程

文檔序號(hào)：12597333閱讀：343來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電子設(shè)備技術(shù)領(lǐng)域，更具體地說，涉及一種文檔錄入方法及系統(tǒng)。

背景技術(shù)：

這兩年智能手機(jī)的硬件比拼進(jìn)入白熱化，手機(jī)的拍照能力也成為衡量一款手機(jī)性能的重要標(biāo)準(zhǔn)，而最能反應(yīng)拍照能力的量化標(biāo)準(zhǔn)就是手機(jī)的像素。手機(jī)攝像頭的像素?cái)?shù)在這幾年的增幅很快：2010年是500萬，2011和2012年800萬是標(biāo)配，在去年，許多手機(jī)已經(jīng)提升到了1300萬像素。而現(xiàn)在，這個(gè)數(shù)字增加到1600萬，甚至是2000萬。

隨著像素的不斷提升，手機(jī)攝像頭除了能拍攝更加清晰的照片和錄制更加逼真的視頻以外，還可以實(shí)現(xiàn)更多的功能?，F(xiàn)有技術(shù)中，二維碼識(shí)別和條形碼識(shí)別已經(jīng)得到了廣泛的應(yīng)用，用戶可以通過手機(jī)攝像頭對(duì)二維碼和條形碼進(jìn)行掃碼，從而實(shí)現(xiàn)付款、獲取網(wǎng)絡(luò)地址或獲取他人名片信息等功能。但目前為止，手機(jī)還無法通過攝像頭識(shí)別文檔并將文檔信息錄入手機(jī)，當(dāng)需要將文檔信息錄入手機(jī)時(shí)，用戶只能通過手動(dòng)逐字逐句的輸入，耗時(shí)長(zhǎng)，效率低，用戶體驗(yàn)差。

技術(shù)實(shí)現(xiàn)要素：

有鑒于此，本發(fā)明的目的在于提供一種文檔錄入方法，能夠自動(dòng)錄入文檔信息，減少了耗時(shí)，提升了用戶體驗(yàn)。

為實(shí)現(xiàn)上述目的，本發(fā)明提供如下技術(shù)方案：一種文檔錄入方法，其特征在于，應(yīng)用于電子設(shè)備，所述方法包括以下步驟：

獲取待錄入文檔的圖像信息；

判斷所述圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從所述字塊框中獲取字塊信息，所述字塊信息為組成所述待錄入文檔的信息；

將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息；

基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

優(yōu)選地，所述當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從所述字塊框中獲取字塊信息包括：

將所述圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息。

優(yōu)選地，所述當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從所述字塊框中獲取字塊信息還包括：

提取所述單個(gè)字塊信息中，所述單個(gè)字塊在所述字塊框中的位置信息。

優(yōu)選地，所述將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息包括：

將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí)，將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配；

在所述文字信息、符號(hào)信息或數(shù)字信息中，將與所述字塊信息相匹配的信息確定為文檔信息。

優(yōu)選地，當(dāng)所述字塊信息符合所述文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí)，還包括：

基于字塊在所述字塊框中的位置信息，獲取所述字塊前后的N個(gè)字塊，其中N≥1；

將所述N個(gè)字塊的信息分別與所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配；

分別統(tǒng)計(jì)所述N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與所述符號(hào)信息的第二匹配成功率和與所述數(shù)字信息的第三匹配成功率；

將所述第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

一種文檔錄入系統(tǒng)，應(yīng)用于電子設(shè)備，所述系統(tǒng)包括：

第一獲取模塊，用于獲取待錄入文檔的圖像信息；

判斷模塊，用于判斷所述圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

第二獲取模塊，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從所述字塊框中獲取字塊信息，所述字塊信息為組成所述待錄入文檔的信息；

比較模塊，用于將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息；

生成模塊，用于基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

優(yōu)選地，所述第二獲取模塊包括：

劃分單元，用于將所述圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息。

優(yōu)選地，所述第二獲取模塊還包括：

提取單元，用于提取所述單個(gè)字塊信息中，所述單個(gè)字塊在所述字塊框中的位置信息。

優(yōu)選地，所述比較模塊包括：

判斷單元，用于將所述字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

第一匹配單元，用于當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí)，將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配；

第一確定單元，用于在所述文字信息、符號(hào)信息或數(shù)字信息中，將與所述字塊信息相匹配的信息確定為文檔信息。

優(yōu)選地，所述比較模塊還包括：

獲取單元，用于當(dāng)所述字塊信息符合所述文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí)，基于字塊在所述字塊框中的位置信息，獲取所述字塊前后的N個(gè)字塊，其中N≥1；

第二匹配單元，用于將所述N個(gè)字塊的信息分別與所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配；

統(tǒng)計(jì)單元，用于分別統(tǒng)計(jì)所述N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與所述符號(hào)信息的第二匹配成功率和與所述數(shù)字信息的第三匹配成功率；

第二確定單元，用于將所述第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

一種電子設(shè)備，包括：文檔錄入系統(tǒng)；其中：

所述文檔錄入系統(tǒng)包括：第一獲取模塊，用于獲取待錄入文檔的圖像信息；

判斷模塊，用于判斷所述圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

第二獲取模塊，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從所述字塊框中獲取字塊信息，所述字塊信息為組成所述待錄入文檔的信息；

生成模塊，用于基于所述文檔信息生成與所述待錄入文檔相對(duì)應(yīng)的文檔。

從上述技術(shù)方案可以看出，本發(fā)明提供的一種文檔錄入方法，當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí)，首先獲取待錄入文檔的圖像信息，判斷圖像信息中是否包含能夠讀取的字塊框，當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從字塊框中獲取字塊信息，然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息，減少了耗時(shí)，提升了用戶體驗(yàn)。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其它的附圖。

圖1為本發(fā)明公開的一種文檔錄入方法實(shí)施例一的方法流程圖；

圖2為本發(fā)明公開的一種文檔錄入方法實(shí)施例二的方法流程圖；

圖3為本發(fā)明公開的一種文檔錄入方法實(shí)施例三的方法流程圖；

圖4為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例一的結(jié)構(gòu)示意圖；

圖5為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例二的結(jié)構(gòu)示意圖；

圖6為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例三的結(jié)構(gòu)示意圖；

圖7為本發(fā)明公開的一種電子設(shè)備實(shí)施例一的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

如圖1所示，為本發(fā)明公開的一種文檔錄入方法實(shí)施例1的流程圖，該方法應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟：

S101、獲取待錄入文檔的圖像信息；

當(dāng)電子設(shè)備需要對(duì)文檔進(jìn)行自動(dòng)錄入操作時(shí)，開啟電子設(shè)備的文檔錄入功能。在開啟電子設(shè)備的文檔錄入功能后，首先獲取待錄入文檔的圖像信息。在獲取待錄入文檔的圖像信息時(shí)，可以通過電子設(shè)備自帶的攝像頭對(duì)待錄入文檔進(jìn)行拍照或掃描，將拍照或掃描到的信息發(fā)送至文檔錄入系統(tǒng)。需要說明的是，為了獲取到更加準(zhǔn)確的待錄入文檔的圖像信息，電子設(shè)備自帶的攝像頭在對(duì)文檔進(jìn)行拍照或者掃描時(shí)，每次可以只對(duì)待錄入文檔的部分文檔進(jìn)行拍照或掃描，以使每次獲取到圖像更加的清晰，經(jīng)過多次拍照或掃描后，獲得待錄入文檔的全部圖像信息。

S102、判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

當(dāng)獲取到待錄入文檔的圖像信息后，對(duì)待錄入文檔的圖像信息進(jìn)行判斷，判斷圖像信息中是否包含能夠讀取的字塊框，當(dāng)待錄入文檔的圖像信息中不包含能夠讀取的字塊框時(shí)，重新獲取待錄入文檔的圖像信息，直至判斷圖像信息中包含能夠讀取的字塊框。需要說明的是，所述的字塊框?yàn)榘浫胛臋n的區(qū)域。

S103、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從字塊框中獲取字塊信息，所述字塊信息為組成待錄入文檔的信息；

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，進(jìn)一步對(duì)字塊框進(jìn)行處理，從字塊框中獲取字塊信息。其中，字塊信息為組成待錄入文檔的信息。

S104、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息；

進(jìn)一步將獲取到的字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，其中，預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息。需要說明的是，文字信息包括各國(guó)文字，如漢字、英文字母、韓文等。符號(hào)信息可以包括各種標(biāo)點(diǎn)符號(hào)及其他特殊符號(hào)。數(shù)字信息可以包括阿拉伯?dāng)?shù)字和羅馬數(shù)字。

S105、基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

最后基于獲取到的文檔信息生成與待錄入文檔對(duì)應(yīng)的文檔，實(shí)現(xiàn)自動(dòng)將待錄入文檔錄入至系統(tǒng)中。需要說明的是，在基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔后，還可以進(jìn)一步將錄入的文檔進(jìn)行存儲(chǔ)，便于后續(xù)調(diào)用。在生成與待錄入文檔相對(duì)應(yīng)的文檔時(shí)，可以根據(jù)用戶的實(shí)際需求選擇生成doc、txt或PDF等格式的文件。

綜上所述，在上述實(shí)施例中，當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí)，首先獲取待錄入文檔的圖像信息，判斷圖像信息中是否包含能夠讀取的字塊框，當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從字塊框中獲取字塊信息，然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，最后基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。實(shí)現(xiàn)了自動(dòng)錄入文檔信息，無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入，減少了耗時(shí)，提升了用戶體驗(yàn)。

如圖2所示，為本發(fā)明公開的一種文檔錄入方法實(shí)施例2的流程圖，該方法應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟：

S201、獲取待錄入文檔的圖像信息；

S202、判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

S203、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息；

當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，進(jìn)一步對(duì)字塊框進(jìn)行處理，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息。其中，單個(gè)字塊信息可以為文字信息、符號(hào)信息或數(shù)字信息。

在將圖像信息中的字塊框進(jìn)行字塊劃分時(shí)，獲取到的圖像信息的圖像背景色為白色，圖像信息中的字塊框內(nèi)被認(rèn)為是字塊的線條為黑色，在字塊框內(nèi)尋找不包含或極少包含黑色的貫穿整個(gè)字塊框的直的帶狀區(qū)域，帶狀區(qū)域?qū)挾瓤扇?.1～1mm，這些帶狀區(qū)域即是字塊框內(nèi)行或列的分界線，可以通過這些分界線將整個(gè)字塊框分為若干行或若干列。

然后在這些行或列中，按一定的長(zhǎng)寬比例范圍，如長(zhǎng)度為寬度的1～1.5倍，尋找不包含或者極少包含黑色的，垂直于上述行或列的分界線的帶狀區(qū)域，此處帶狀區(qū)域?qū)挾热钥扇?.1～1mm，分界線將行或列分割為若干個(gè)單個(gè)字塊，此時(shí)每個(gè)單個(gè)字塊內(nèi)就只包括一個(gè)文字、數(shù)字或字符。

S204、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

將劃分得到的每個(gè)字塊信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，通過識(shí)別判斷字塊信息是否只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種。

S205、當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí)，將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配；

當(dāng)通過比較確定只為文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí)，例如文字“我”因其特征較為明顯，不會(huì)出現(xiàn)在符號(hào)信息或數(shù)字信息中，通過比較能夠?qū)⑽淖帧拔摇敝苯哟_定為文字信息。例如標(biāo)點(diǎn)符號(hào)“？”因其特征較為明顯，不會(huì)出現(xiàn)在文字信息或數(shù)字信息中，通過比較能夠?qū)⒎?hào)“？”直接確定為符號(hào)信息。將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配。例如，當(dāng)確定字塊信息為文字信息時(shí)，將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息進(jìn)行匹配，在預(yù)設(shè)字庫(kù)中的文字信息中找出與字塊信息相匹配的文字。

S206、在所述文字信息、符號(hào)信息或數(shù)字信息中，將與所述字塊信息相匹配的信息確定為文檔信息。

在將字塊信息與預(yù)設(shè)字庫(kù)中的文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配時(shí)，將預(yù)設(shè)字庫(kù)中與字款信息相匹配的信息確定為文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理，最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

如圖3所示，為本發(fā)明公開的一種文檔錄入方法實(shí)施例3的流程圖，該方法應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述方法可以包含以下步驟：

S301、獲取待錄入文檔的圖像信息；

S302、判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

S303、當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息；

S304、提取單個(gè)字塊信息中，單個(gè)字塊在所述字塊框中的位置信息；

為了便于后續(xù)的文檔錄入，進(jìn)一步提取出單個(gè)字塊信息中，單個(gè)字塊在所述字塊框中的位置信息。具體可采用的方法為：給每個(gè)單個(gè)字塊設(shè)置坐標(biāo)屬性，X和Y，其中第一行第一列的單個(gè)字塊X＝1，Y＝1；第一行第二列的單個(gè)字塊X＝2，Y＝1；第二行第一列的單個(gè)字塊X＝1，Y＝2，以此類推。這樣可以保證文檔在錄入后還能按照原來的排列順序生成文檔。

S305、將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

S306、當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí)，基于字塊在字塊框中的位置信息，獲取字塊前后的N個(gè)字塊，其中N≥1；

在將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較時(shí)，某些字塊存在特殊性，在進(jìn)行比較時(shí)，容易將字塊信息確定為兩種或兩種以上的信息。例如，字母“Z”，在與預(yù)設(shè)字庫(kù)中的信息進(jìn)行對(duì)比的過程中，因“Z”與文字信息中的英文字母“Z”的特征相符，可認(rèn)為其符合文字信息的特征，但“Z”還可能與數(shù)字信息中的數(shù)字“2”的特征相符，又可以認(rèn)為其符合數(shù)字信息的特征。發(fā)生這種情況的時(shí)，無法直接將“Z”分類為文字信息或數(shù)字信息。

此時(shí)，基于字塊在字塊框中的位置信息，獲取字塊前后的N個(gè)字塊，其中N≥1。例如，假設(shè)“Z”為字塊框“PIZZA”中第三個(gè)從左往右第三個(gè)單個(gè)字塊，此時(shí)“Z”位置信息即為X＝3，Y＝1。此時(shí)找到“Z”的前后四個(gè)單個(gè)字塊，則可以找到X＝1，Y＝1的“P”；X＝2，Y＝1的“I”；X＝4，Y＝1的“Z”；X＝5，Y＝1的“A”。

S307、將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配；

在上述例子中，需要被分類的單個(gè)字塊“Z”的前后四個(gè)單個(gè)字塊中，雖然“I”和另外一個(gè)單個(gè)字塊“Z”仍不能被直接分類為文字字塊，但單個(gè)字塊“P”和單個(gè)字塊“A”則只符合文字信息的特征，因此可以分類為文字字塊。

S308、分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率；

在匹配的過程中，分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率；例如，在上述例子中，需要被分類的單個(gè)字塊“Z”前后四個(gè)單個(gè)字塊，兩個(gè)類別不確定，兩個(gè)為文字字塊，與文字信息相匹配的成功率最大，且需要被分類的單個(gè)字塊“Z”也符合文字信息的特征，所以需要被分類的單個(gè)字塊“Z”即被確定為文字信息。

需要說明的是，在上述過程中，還可能出現(xiàn)以下幾種情況：

(1)前后若干個(gè)字塊均無法被分類；

(2)前后若干個(gè)字塊出現(xiàn)了不止一種類型的字塊，但每種字塊所占比例相同，且需要被分類的單個(gè)字塊也符合這幾種類型的特征；

(3)前后若干個(gè)字塊出現(xiàn)了一種類型字塊，但需要被分類的單個(gè)字塊不符合這種類型的特征；

在發(fā)生上述情況時(shí)，則加大查找的前后單個(gè)字塊的數(shù)量，再以上述方法對(duì)上述字塊進(jìn)行分類，直到將需要被分類的單個(gè)字塊分為某一個(gè)類型的字塊為止。需要說明的是，除上述情況外，還可能出現(xiàn)其他情況，處理這些情況的方法也并不只限于本實(shí)施例中所述的方法，在此只是對(duì)針對(duì)這幾種情況的方法進(jìn)行了詳述。

S309、將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。依照此方法逐一對(duì)每個(gè)字塊信息進(jìn)行處理，最終生成與待錄入文檔相對(duì)應(yīng)的文檔信息。

綜上所述，在上述實(shí)施例中，當(dāng)需要對(duì)文檔進(jìn)行錄入時(shí)，首先獲取待錄入文檔的圖像信息，判斷圖像信息中是否包含能夠讀取的字塊框，當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息，并提取單個(gè)字塊信息中，單個(gè)字塊在所述字塊框中的位置信息，然后將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種，當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí)，基于字塊在字塊框中的位置信息，獲取字塊前后的N個(gè)字塊，將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配，分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率，將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。實(shí)現(xiàn)了自動(dòng)錄入文檔信息，無需用戶對(duì)文檔進(jìn)行手動(dòng)輸入，減少了耗時(shí)，提升了用戶體驗(yàn)。

如圖4所示，為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例1的結(jié)構(gòu)示意圖，該系統(tǒng)應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含：

第一獲取模塊401，用于獲取待錄入文檔的圖像信息；

判斷模塊402，用于判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

第二獲取模塊403，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從字塊框中獲取字塊信息，所述字塊信息為組成待錄入文檔的信息；

比較模塊404，用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息；

生成模塊405，用于基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

如圖5所示，為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例2的結(jié)構(gòu)示意圖，該系統(tǒng)應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含：

第一獲取模塊501，用于獲取待錄入文檔的圖像信息；

判斷模塊502，用于判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

劃分單元503，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息；

判斷單元504，用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

第一匹配單元505，用于當(dāng)所述字塊信息只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種時(shí)，將所述字塊信息與所述文字信息、符號(hào)信息或數(shù)字信息進(jìn)行匹配；

第一確定單元506，用于在所述文字信息、符號(hào)信息或數(shù)字信息中，將與所述字塊信息相匹配的信息確定為文檔信息。

如圖6所示，為本發(fā)明公開的一種文檔錄入系統(tǒng)實(shí)施例3的結(jié)構(gòu)示意圖，該系統(tǒng)應(yīng)用于電子設(shè)備，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述系統(tǒng)可以包含：

第一獲取模塊601，用于獲取待錄入文檔的圖像信息；

判斷模塊602，用于判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

劃分單元603，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，將圖像信息中的字塊框進(jìn)行字塊劃分，生成若干個(gè)單個(gè)字塊信息；

提取單元604，用于提取單個(gè)字塊信息中，單個(gè)字塊在所述字塊框中的位置信息；

判斷單元605，用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，判斷所述字塊信息是否只符合所述文字信息、符號(hào)信息或數(shù)字信息中的其中一種；

獲取單元606，用于當(dāng)字塊信息符合文字信息、符號(hào)信息或數(shù)字信息中的一種以上時(shí)，基于字塊在字塊框中的位置信息，獲取字塊前后的N個(gè)字塊，其中N≥1；

第二匹配單元607，用于將N個(gè)字塊的信息分別與預(yù)設(shè)字庫(kù)中存儲(chǔ)的文字信息、符號(hào)信息和數(shù)字信息進(jìn)行匹配；

統(tǒng)計(jì)單元608，用于分別統(tǒng)計(jì)N個(gè)字塊信息中與所述文字信息的第一匹配成功率、與符號(hào)信息的第二匹配成功率和與數(shù)字信息的第三匹配成功率；

需要說明的是，在上述過程中，還可能出現(xiàn)以下幾種情況：

(1)前后若干個(gè)字塊均無法被分類；

(2)前后若干個(gè)字塊出現(xiàn)了不止一種類型的字塊，但每種字塊所占比例相同，且需要被分類的單個(gè)字塊也符合這幾種類型的特征；

(3)前后若干個(gè)字塊出現(xiàn)了一種類型字塊，但需要被分類的單個(gè)字塊不符合這種類型的特征；

第二確定單元609，用于將第一匹配成功率、第二匹配成功率和第三匹配成功率中數(shù)值最大的成功率對(duì)應(yīng)的信息確定為所述字塊信息的文檔信息。

如圖7所示，為本發(fā)明公開的一種電子設(shè)備實(shí)施例1的結(jié)構(gòu)示意圖，所述電子設(shè)備可以為手機(jī)、平板電腦等移動(dòng)終端。所述電子設(shè)備包含文檔錄入系統(tǒng)71；其中：

文檔錄入系統(tǒng)71包括：

第一獲取模塊711，用于獲取待錄入文檔的圖像信息；

判斷模塊712，用于判斷圖像信息中是否包含能夠讀取的字塊框，所述字塊框?yàn)榘龃浫胛臋n的區(qū)域；

第二獲取模塊713，用于當(dāng)圖像信息中包含能夠讀取的字塊框時(shí)，從字塊框中獲取字塊信息，所述字塊信息為組成待錄入文檔的信息；

比較模塊714，用于將字塊信息與預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息進(jìn)行比較，獲得文檔信息，所述預(yù)設(shè)字庫(kù)中存儲(chǔ)的信息包含文字信息、符號(hào)信息和數(shù)字信息；

生成模塊715，用于基于文檔信息生成與待錄入文檔相對(duì)應(yīng)的文檔。

本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述，每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處，各個(gè)實(shí)施例之間相同相似部分互相參見即可。

對(duì)所公開的實(shí)施例的上述說明，使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的，本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下，在其它實(shí)施例中實(shí)現(xiàn)。因此，本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例，而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：秦萍;易斌;吳少波;陳瑤;劉慧麗
技術(shù)所有人：珠海格力電器股份有限公司
我是此專利的發(fā)明人

上一篇：一種半自動(dòng)農(nóng)業(yè)耕種用施肥機(jī)的制作方法與工藝
上一篇：文檔處理方法和裝置與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

電子設(shè)備雷擊試驗(yàn)方法相關(guān)技術(shù)

學(xué)前教育信息系統(tǒng)錄入相關(guān)技術(shù)

信息錄入系統(tǒng)相關(guān)技術(shù)

江西教師信息錄入系統(tǒng)相關(guān)技術(shù)

全國(guó)教師信息錄入系統(tǒng)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文檔錄入方法、系統(tǒng)及電子設(shè)備與流程

一種文檔錄入方法、系統(tǒng)及電子設(shè)備與流程