亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文本識(shí)別方法和裝置的制造方法_4

文檔序號(hào):9631534閱讀:來源:國(guó)知局
中包含有計(jì)算機(jī)可 用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上 實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0121] 本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框 圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商?供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理 終端設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處 理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多 個(gè)方框中指定的功能的裝置。
[0122] 這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備 以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方 框或多個(gè)方框中指定的功能。
[0123] 這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在 計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程 和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0124] 盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為 包括優(yōu)選實(shí)施例以及落入本發(fā)明實(shí)施例范圍的所有變更和修改。
[0125] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來將 一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作 之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包 括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品 或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語(yǔ)句"包括一個(gè)……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
[0126] 以上對(duì)本發(fā)明所提供的一種文本識(shí)別方法和一種文本識(shí)別裝置,進(jìn)行了詳細(xì)介 紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只 是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā) 明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理 解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1. 一種文本識(shí)別方法,其特征在于,包括: 對(duì)待識(shí)別文本進(jìn)行分割,獲得若干個(gè)分割文本;其中,各個(gè)分割文本被分割為一個(gè)或多 個(gè)字段; 將所述各個(gè)分割文本中的字段,與預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的文本進(jìn)行匹配,獲得匹 配數(shù)量; 對(duì)各個(gè)所述字段分配與其匹配數(shù)量相應(yīng)的分值; 統(tǒng)計(jì)所述各個(gè)分割文本的總分值; 將總分值最高的分割文本作為所述待識(shí)別文本的最優(yōu)識(shí)別結(jié)果。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將待識(shí)別文本分割成若干個(gè)分割文 本的步驟包括: 確定待識(shí)別文本中分割符的位置; 在所述分割符的位置對(duì)所述待識(shí)別文本進(jìn)行分割,獲得2n個(gè)分割文本,η為所述待識(shí)別 文本中分割符的數(shù)量,η為正整數(shù)。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)包括主要文 本和次要文本,所述將所述各個(gè)分割文本中的字段,與預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的文本進(jìn) 行匹配,獲得匹配數(shù)量的步驟包括: 將所述各個(gè)分割文本中的字段,與所述預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的主要文本進(jìn)行匹 配,獲得匹配數(shù)量; 若某字段與所述主要文本進(jìn)行匹配所獲得的匹配數(shù)量為〇,則將其與所述預(yù)置的文本 識(shí)別數(shù)據(jù)庫(kù)中的次要文本進(jìn)行匹配,獲得匹配數(shù)量。4. 根據(jù)權(quán)利要求1或3所述的方法,其特征在于,所述對(duì)各個(gè)所述字段分配與其匹配結(jié) 果相應(yīng)的分值的步驟包括: 若某字段的匹配數(shù)量為〇,則分配的分值若某字段的匹配數(shù)量為1,則分配的分值為1 ; 若某字段的匹配數(shù)量為m,則分配的分值為*m為大于或等于2的正整數(shù)。5. 根據(jù)權(quán)利要求1或3所述的方法,其特征在于,所述對(duì)各個(gè)所述字段分配與其匹配結(jié) 果相應(yīng)的分值的步驟包括: 獲取所述各個(gè)分割文本中字段的數(shù)量P; 若某字段的匹配數(shù)量為q,則分配的分值為,其中,P為正整數(shù),q為〇或正整數(shù)。6. -種文本識(shí)別裝置,其特征在于,包括:文本分割模塊,用于對(duì)待識(shí)別文本進(jìn)行分割,獲得若干個(gè)分割文本;其中,各個(gè)分割文 本被分割為一個(gè)或多個(gè)字段; 匹配模塊,用于將所述各個(gè)分割文本中的字段,與預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的文本進(jìn) 行匹配,獲得匹配數(shù)量; 分值分配模塊,用于對(duì)各個(gè)所述字段分配與其匹配數(shù)量相應(yīng)的分值; 總分值統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)所述各個(gè)分割文本的總分值; 最優(yōu)識(shí)別結(jié)果確定模塊,用于將總分值最高的分割文本作為所述待識(shí)別文本的最優(yōu)識(shí) 別結(jié)果。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述文本分割模塊包括: 分割符位置確定子模塊,用于確定待識(shí)別文本中分割符的位置; 文本分割子模塊,用于在所述分割符的位置對(duì)所述待識(shí)別文本進(jìn)行分割,獲得2n個(gè)分 割文本,η為所述待識(shí)別文本中分割符的數(shù)量,η為正整數(shù)。8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)包括主要文 本和次要文本,所述匹配模塊包括: 第一匹配子模塊,用于將所述各個(gè)分割文本中的字段,與所述預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù) 中的主要文本進(jìn)行匹配,獲得匹配數(shù)量; 第二匹配子模塊,用于在某字段與所述主要文本進(jìn)行匹配所獲得的匹配數(shù)量為0時(shí), 則將其與所述預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的次要文本進(jìn)行匹配,獲得匹配數(shù)量。9. 根據(jù)權(quán)利要求6或8所述的裝置,其特征在于,所述分值分配模塊包括:第一分值分配子模塊,用于在某字段的匹配數(shù)量為〇時(shí),則分配的分值 第二分值分配子模塊,用于在某字段的匹配數(shù)量為1,則分配的分值為1 ;第三分值分配子模塊,用于在某字段的匹配數(shù)量為m,則分配的分值為 ,!11為大于或 等于2的正整數(shù)。10. 根據(jù)權(quán)利要求6或8所述的裝置,其特征在于,所述分值分配模塊包括:字段數(shù)量獲取子模塊,用于獲取所述各個(gè)分割文本中字段的數(shù)量P; 第四分值分配子模塊,用于在某字段的匹配數(shù)量為q時(shí),則分配的分值為 > 其中,P為 正整數(shù),q為〇或正整數(shù)。
【專利摘要】本發(fā)明實(shí)施例提供了一種文本識(shí)別方法和裝置,其中,所述方法包括:對(duì)待識(shí)別文本進(jìn)行分割,獲得若干個(gè)分割文本;其中,各個(gè)分割文本被分割為一個(gè)或多個(gè)字段;將所述各個(gè)分割文本中的字段,與預(yù)置的文本識(shí)別數(shù)據(jù)庫(kù)中的文本進(jìn)行匹配,獲得匹配數(shù)量;對(duì)各個(gè)所述字段分配與其匹配數(shù)量相應(yīng)的分值;統(tǒng)計(jì)所述各個(gè)分割文本的總分值;將總分值最高的分割文本作為所述待識(shí)別文本的最優(yōu)識(shí)別結(jié)果。本發(fā)明實(shí)施例可以適用于任意格式的待識(shí)別文本,能夠準(zhǔn)確識(shí)別復(fù)雜的、非結(jié)構(gòu)化的網(wǎng)絡(luò)文本,相對(duì)于正則匹配法而言,具有更好的通用性和更高的識(shí)別準(zhǔn)確性。
【IPC分類】G06F17/27
【公開號(hào)】CN105389305
【申請(qǐng)?zhí)枴緾N201510729704
【發(fā)明人】吳昊, 蔡龍軍, 李兆軍
【申請(qǐng)人】北京奇藝世紀(jì)科技有限公司
【公開日】2016年3月9日
【申請(qǐng)日】2015年10月30日
當(dāng)前第4頁(yè)1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1