專利名稱:文件建立標(biāo)簽的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種文件建立標(biāo)簽的方法和裝置。
背景技術(shù):
隨著法庭案例的不斷增多,案例文件的數(shù)量越來越龐大。目前對(duì)案例的維護(hù)主要基于人工維護(hù)。由工作人員將案例中的主要內(nèi)容如時(shí)間、案例名稱、案例內(nèi)容等輸入到數(shù)據(jù)庫中,以便后期的檢索與維護(hù)。 發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題 該人工錄入案例的過程需要花費(fèi)工作人員大量時(shí)間,且手工錄入過程中容易出現(xiàn)
錯(cuò)誤,導(dǎo)致案例文件的錄入處理過程效率很低。。
發(fā)明內(nèi)容
本發(fā)明提供一種文件建立標(biāo)簽的方法和裝置,可以快速的為大量案例文件建立標(biāo)簽,便于后期管理。 —方面,本發(fā)明提供了一種文件建立標(biāo)簽的方法,包括
獲取案例文件的掃描圖像; 對(duì)所述掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;
根據(jù)文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。
另一方面,本發(fā)明提供了一種文件建立標(biāo)簽的裝置,包括
獲取模塊,用于獲取案例文件的掃描圖像; 識(shí)別模塊,用于對(duì)所述獲取獲取的掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別; 建立模塊,用于根據(jù)所述識(shí)別模塊的文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn) 通過使用本發(fā)明提供的方法,可以快速的為大量案例文件建立標(biāo)簽,基于案例中的標(biāo)簽,可以方便的對(duì)包括大量案例的案例庫進(jìn)行存儲(chǔ)、維護(hù)以及檢索。
為了更清楚地說明本發(fā)明或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明中文件建立標(biāo)簽的方法流程 圖2是本發(fā)明中另一種文件建立標(biāo)簽的方法流程 圖3是本發(fā)明中文件建立標(biāo)簽的裝置示意圖。
具體實(shí)施例方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本 發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí) 施例,都屬于本發(fā)明保護(hù)的范圍。 本發(fā)明提供了一種文件建立標(biāo)簽的方法和裝置,可以快速的為大量案例文件建立 標(biāo)簽,便于后期管理。 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明提供的文件建立標(biāo)簽的方法和裝置進(jìn)行詳 細(xì)說明。 本發(fā)明提出一種文件建立標(biāo)簽的方法,如圖1所示,包括 步驟101、獲取案例文件的掃描圖像;具體的,對(duì)案例文件進(jìn)行掃描得到該案例文 件的掃描圖像,該掃描圖像包括文字、圖片等相關(guān)信息。
步驟102、對(duì)掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;具體的,該特定區(qū)域?yàn)闃?biāo)識(shí)案
件屬性的文字所在的區(qū)域,例如案例的圖像右上角具有標(biāo)識(shí)案件類型的文字"刑事案件"、
案件發(fā)生的時(shí)間"08-9-l"、案件發(fā)生地歸屬的公安機(jī)關(guān)的名稱,此時(shí)特定區(qū)域的具體位置
為(xl, yl)??梢愿鶕?jù)案例的文字的不同布局,調(diào)整進(jìn)行文字識(shí)別時(shí)的特定區(qū)域的具體位
置,調(diào)整時(shí)可以通過調(diào)整平面坐標(biāo)來實(shí)現(xiàn),如(x。 y)坐標(biāo)的形式,例如案例的圖像左上角具
有標(biāo)識(shí)案件屬性的信息時(shí),調(diào)整進(jìn)行文字識(shí)別的特定區(qū)域的具體位置為(x2, y2)。 步驟103、根據(jù)文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。具體的,在數(shù)據(jù)庫
中預(yù)先存儲(chǔ)了文字結(jié)果與標(biāo)簽的對(duì)應(yīng)關(guān)系,例如當(dāng)文字結(jié)果為刑事案件時(shí),對(duì)應(yīng)的標(biāo)簽為
XS. 1,以此類推,第二個(gè)案例的文字結(jié)果也為刑事案件時(shí),對(duì)應(yīng)的標(biāo)簽為XS. 2。 本發(fā)明提供的方法中,通過對(duì)案例掃描圖像中特定區(qū)域的文字進(jìn)行識(shí)別、并根據(jù)
文字識(shí)別結(jié)果為案例建立標(biāo)簽,可以快速的為大量案例文件建立標(biāo)簽,基于案例中的標(biāo)簽,
可以方便的對(duì)包括大量案例的案例庫進(jìn)行存儲(chǔ)、維護(hù)以及檢索。 以下通過具體實(shí)施例對(duì)本發(fā)明提供的方法進(jìn)行詳細(xì)說明,如圖2所示,包括
步驟201、設(shè)定獲取文字信息的特性區(qū)域的位置。具體的,該特定位置為標(biāo)識(shí)案例 屬性的文字所在的區(qū)域,若案例的圖像的右上角具有標(biāo)識(shí)案件類型的文字"刑事案件"、案 件發(fā)生的時(shí)間"08-9-l"、案件發(fā)生地歸屬的公安機(jī)關(guān)的名稱,則將特性區(qū)域的位置設(shè)定為 (x,y);若標(biāo)識(shí)案件類型的文字在圖像的左上角,則將特性區(qū)域的位置設(shè)定為(xl,yl)。具 體實(shí)現(xiàn)時(shí),可以根據(jù)案件文字的不同布局,調(diào)整特定區(qū)域的具體位置。 步驟202、獲取案例文件的掃描圖像??梢酝ㄟ^掃描儀等設(shè)備獲取案例文件的掃描 圖像。 步驟203、調(diào)整掃描圖像的大小,使其適配預(yù)定的標(biāo)準(zhǔn)。將掃描圖像的大小調(diào)整為
標(biāo)準(zhǔn)大小后,可以確保步驟201設(shè)置的具體位置,與掃描圖像的特定區(qū)域準(zhǔn)確匹配。 步驟204、獲取特性區(qū)域位置上的文字信息。獲取文字信息的具體實(shí)現(xiàn)方式可以使
用現(xiàn)有的技術(shù)。 步驟205、根據(jù)獲取的文字信息以及預(yù)置的對(duì)應(yīng)關(guān)系,為該上傳的案件標(biāo)注標(biāo)簽。
為了避免同一案例重復(fù)標(biāo)注標(biāo)簽,每次獲取到文字識(shí)別結(jié)果后,可以進(jìn)行檢驗(yàn);該 標(biāo)注的標(biāo)簽是唯一的,一般情況下按照順序進(jìn)行標(biāo)注標(biāo)簽。
為實(shí)現(xiàn)本發(fā)明提供的方法,本發(fā)明還提供了一種文件建立標(biāo)簽的裝置,如圖3所 示,包括 獲取模塊310,用于獲取案例文件的掃描圖像; 識(shí)別模塊320,用于對(duì)所述獲取獲取的掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;
建立模塊330,用于根據(jù)所述識(shí)別模塊的文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立 標(biāo)簽。
上述裝置還包括 調(diào)整模塊340,用于對(duì)所述獲取模塊310獲取的掃描圖像進(jìn)行尺寸或文字方向的 調(diào)整。 上述裝置還包括 設(shè)定模塊350,用于設(shè)定所述掃描圖像中特定區(qū)域的具體位置。
上述建立模塊330包括
存儲(chǔ)子模塊3301,用于存儲(chǔ); 查詢子模塊3302,用于根據(jù)所述識(shí)別模塊識(shí)別的文字結(jié)果以及所述存儲(chǔ)子模塊存 儲(chǔ)的文字結(jié)果與標(biāo)簽的對(duì)應(yīng)關(guān)系,為所述案例文件建立標(biāo)簽。 通過本發(fā)明提供的方法和裝置,對(duì)案例掃描圖像中特定區(qū)域的文字進(jìn)行識(shí)別、并 根據(jù)文字識(shí)別結(jié)果為案例建立標(biāo)簽,可以快速的為大量案例文件建立標(biāo)簽,基于案例中的 標(biāo)簽,可以方便的對(duì)包括大量案例的案例庫進(jìn)行存儲(chǔ)、維護(hù)以及檢索。 通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以通
過硬件實(shí)現(xiàn),也可以借助軟件加必要的通用硬件平臺(tái)的方式來實(shí)現(xiàn)?;谶@樣的理解,本發(fā)
明的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)
介質(zhì)(可以是CD-ROM, U盤,移動(dòng)硬盤等)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可
以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)所述的方法。 以上公開的僅為本發(fā)明的幾個(gè)具體,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技
術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
一種文件建立標(biāo)簽的方法,其特征在于,包括獲取案例文件的掃描圖像;對(duì)所述掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;根據(jù)文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。
2. 如權(quán)利要求1所述的方法,其特征在于,所述獲取案例文件的掃描圖像之后,還包括對(duì)所述掃描圖像進(jìn)行尺寸或文字方向的調(diào)整。
3. 如權(quán)利要求l所述的方法,其特征在于,所述獲取案例文件的掃描圖像之后,還包括設(shè)定所述掃描圖像中特定區(qū)域的具體位置。
4. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽,包括根據(jù)獲取的文字結(jié)果以及預(yù)置的文字結(jié)果與標(biāo)簽的對(duì)應(yīng)關(guān)系,為所述案例文件建立標(biāo)簽。
5. —種文件建立標(biāo)簽的裝置,其特征在于,包括獲取模塊,用于獲取案例文件的掃描圖像;識(shí)別模塊,用于對(duì)所述獲取獲取的掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;建立模塊,用于根據(jù)所述識(shí)別模塊的文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。
6. 如權(quán)利要求5所述的裝置,其特征在于,所述裝置還包括調(diào)整模塊,用于對(duì)所述獲取模塊獲取的掃描圖像進(jìn)行尺寸或文字方向的調(diào)整。
7. 如權(quán)利要求5所述的裝置,其特征在于,所述裝置還包括設(shè)定模塊,用于設(shè)定所述掃描圖像中特定區(qū)域的具體位置。
8. 如權(quán)利要求5所述的裝置,其特征在于,所述建立模塊包括存儲(chǔ)子模塊,用于存儲(chǔ);查詢子模塊,用于根據(jù)所述識(shí)別模塊識(shí)別的文字結(jié)果以及所述存儲(chǔ)子模塊存儲(chǔ)的文字結(jié)果與標(biāo)簽的對(duì)應(yīng)關(guān)系,為所述案例文件建立標(biāo)簽。
全文摘要
本發(fā)明公開了一種文件建立標(biāo)簽的方法和裝置,該方法包括獲取案例文件的掃描圖像;對(duì)所述掃描圖像中的特定區(qū)域進(jìn)行文字識(shí)別;根據(jù)文字識(shí)別結(jié)果,自動(dòng)為所述案例文件建立標(biāo)簽。通過使用本發(fā)明,可以快速的為大量案例文件建立標(biāo)簽,基于案例中的標(biāo)簽,可以方便的對(duì)包括大量案例的案例庫進(jìn)行存儲(chǔ)、維護(hù)以及檢索。
文檔編號(hào)G06F17/30GK101763367SQ20081023907
公開日2010年6月30日 申請(qǐng)日期2008年12月8日 優(yōu)先權(quán)日2008年12月8日
發(fā)明者盧有飛, 商文彬, 趙祎 申請(qǐng)人:新奧特硅谷視頻技術(shù)有限責(zé)任公司