專利名稱:用于從數(shù)字圖像中去除噪聲的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理。更具體地,本發(fā)明涉及用于促進(jìn)從數(shù)字 圖像去除噪聲的方法和裝置。
背景技術(shù):
隨著企業(yè)和其他組織進(jìn) 一 步的計(jì)算機(jī)化,在計(jì)算機(jī)系統(tǒng)上存儲(chǔ) 和維護(hù)紙質(zhì)文檔的電子版本變得越來(lái)越普遍。在計(jì)算機(jī)系統(tǒng)上存儲(chǔ) 紙質(zhì)文檔的處理通常包括"文檔成像"處理,所述處理將紙質(zhì)文檔 的副本轉(zhuǎn)換成為電子文檔。此文檔成像處理通常開始于成像步驟, 其中使用掃描儀、復(fù)印機(jī)、照相機(jī)或者其他成像設(shè)備來(lái)生成文檔的頁(yè)面圖像。在集合到諸如便攜文檔格式(PDF)文件的文檔容器中之 前,通常使用程序處理程序來(lái)分析和增強(qiáng)這些頁(yè)面圖像。通常,應(yīng)用需要從所掃描的頁(yè)面圖像識(shí)別文本以促進(jìn)后續(xù)的文 檔處理操作。這通常通過光學(xué)字符識(shí)別(OCR)處理來(lái)完成。遺憾的是,在所掃描圖像中,噪聲的出現(xiàn)將使得OCR處理的性 能顯著降級(jí),這是非常普遍的。從打印和成像處理中,將產(chǎn)生各種 類型的噪聲以及類噪聲偽像(artifact)。噪聲以及類噪聲偽像可以 包括來(lái)自成像光傳感器的量化噪聲、成像設(shè)備光學(xué)器件上的污物、 飛賊的墨跡以及著色劑污跡。由于此問題,通常在OCR處理之前對(duì)圖像應(yīng)用噪聲去除操作。 例如,普通的噪聲去除操作去除小于像素?cái)?shù)閾值的所有斑點(diǎn)(blob )。 然而,這可能導(dǎo)致去除諸如"句號(hào),,的小字符,或者可能導(dǎo)致殘留 下相當(dāng)大的噪聲偽像。幾乎不存在針對(duì)所有字符尺寸都是最優(yōu)的固 定閾值。因此,在噪聲去除處理時(shí),或者是遺留下太多的噪聲,或 者是不適當(dāng)?shù)厝コ怂鶔呙鑸D像的部分。由此,需要一種不存在上述問題的用于從圖像去除噪聲的方法和裝置。發(fā)明內(nèi)容本發(fā)明的 一 個(gè)實(shí)施例提供了 一種從圖像去除噪聲的系統(tǒng)。在操 作期間,系統(tǒng)首先識(shí)別出圖像中的斑點(diǎn),其中斑點(diǎn)是可能表示圖像 中的字符或者字符一部分的鄰近像素的集合。接著,系統(tǒng)分析所述 斑點(diǎn)以便針對(duì)斑點(diǎn)來(lái)動(dòng)態(tài)地確定"噪聲閾值"。然后,系統(tǒng)從圖像 去除低于噪聲閾值的斑點(diǎn)。在此實(shí)施例的變型中,分析斑點(diǎn)包括分析以下內(nèi)容斑點(diǎn)的尺 寸分布、斑點(diǎn)的數(shù)量、斑點(diǎn)的位置、圖像或者圖像區(qū)域的斑點(diǎn)密度、 以及斑點(diǎn)的顏色。在此實(shí)施例的變型中,系統(tǒng)通過首先識(shí)別圖像中的文本區(qū)域、 以及然后識(shí)別文本區(qū)域中的"關(guān)鍵字符,,來(lái)確定噪聲閾值,其中關(guān) 鍵字符是小字符或者字符的一部分,諸如句號(hào)、字符"i"上的點(diǎn)或 者逗號(hào)。接著,系統(tǒng)計(jì)算所識(shí)別的關(guān)鍵字符的平均尺寸,并將噪聲 閾值計(jì)算為平均尺寸的一個(gè)分?jǐn)?shù)(fraction)。在此實(shí)施例的一個(gè)變型中,在分析斑點(diǎn)之前,系統(tǒng)通過從圖4象 去除低于初始噪聲閣值的斑點(diǎn)來(lái)執(zhí)行初始噪聲去除操作。在此實(shí)施例的一個(gè)變型中,如果所確定的噪聲閾值不同于先前 的噪聲閾值,則系統(tǒng)重復(fù)噪聲去除處理。此外,如果所確定的噪聲 閾值由先前的噪聲閾值有所降低,則系統(tǒng)恢復(fù)小于先前的噪聲閾值 但是大于所確定的噪聲閾值的先前已去除斑,泉。在此實(shí)施例的 一個(gè)變型中,針對(duì)每個(gè)識(shí)別的文本區(qū)域來(lái)獨(dú)立地確定噪聲閾值。
圖1示出了4艮據(jù)本發(fā)明的一個(gè)實(shí)施例的樣本文檔;圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的樣本文檔中的數(shù)個(gè)興趣點(diǎn);圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的噪聲去除處理; 圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的計(jì)算環(huán)境; 圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的噪聲去除系統(tǒng); 圖6示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的光學(xué)字符識(shí)別(OCR) 系統(tǒng);圖7呈現(xiàn)了示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的噪聲去除處理的流 程圖;以及圖8呈現(xiàn)了根據(jù)本發(fā)明的一個(gè)實(shí)施例的OCR處理的流程圖,該 OCR處理包括對(duì)噪聲去除處理的優(yōu)化。
具體實(shí)施方式
呈現(xiàn)以下描述以便使得本領(lǐng)域技術(shù)人員能夠制造和使用本發(fā) 明,并且在特定應(yīng)用及其需求的上下文中提供了下文的描述。對(duì)所 公開的實(shí)施例的各種變型,其對(duì)于本領(lǐng)域技術(shù)人員是易見的,并且 在此定義的通用原理可以應(yīng)用于其他實(shí)施例和應(yīng)用,而并不脫離本 發(fā)明的精神和范圍。由此,本發(fā)明并非旨在于局限于所示出的實(shí)施 例,而是旨在于符合與在此公開的原理和特征的相一致的最為寬廣 的范圍。在此詳細(xì)說(shuō)明書中描述的數(shù)據(jù)結(jié)構(gòu)和代碼通常存儲(chǔ)在計(jì)算機(jī)可 讀存儲(chǔ)介質(zhì)上,所述計(jì)算機(jī)可讀介質(zhì)可以是用于由計(jì)算機(jī)系統(tǒng)使用 的能夠存儲(chǔ)代碼和/或數(shù)據(jù)的任何設(shè)備或者介質(zhì)。這包括但不限于 磁和光的存儲(chǔ)設(shè)備,諸如,磁盤驅(qū)動(dòng)器、磁帶、CD(壓縮盤)以及 DVD (數(shù)字通用盤或者數(shù)字視頻盤)。概要本發(fā)明提供了 一種用于從圖像去除噪聲的技術(shù),并且該技術(shù)可 以應(yīng)用于任何文檔,所述文檔可以包含不希望作為原始文檔的部分 的噪聲或者任何其他的無(wú)關(guān)偽像。盡管在下文中結(jié)合光學(xué)字符識(shí)別(OCR)系統(tǒng)來(lái)描述了本發(fā)明的實(shí)施例,但本發(fā)明可以容易地修改 為與用于數(shù)字圖像的任何噪聲去除系統(tǒng)相結(jié)合地工作,所述噪聲去 除系統(tǒng)包括與光學(xué)字符識(shí)別不相關(guān)的噪聲去除系統(tǒng)。例如,本發(fā)明 的實(shí)施例可以應(yīng)用于數(shù)字?jǐn)z影術(shù)。在操作期間,本發(fā)明的一個(gè)實(shí)施例接收數(shù)字形式的圖像,其中 該圖像中可以包含文本和圖像兩者。為了改進(jìn)OCR處理,有益的是, 從圖像中去除盡可能多的噪聲。去除此噪聲的第一步驟是,識(shí)別圖 像中的"斑點(diǎn)"。"斑點(diǎn)"定義為鄰近像素的聚集,其可以表示字 符、字符一部分、圖像內(nèi)的對(duì)象或者噪聲偽像。識(shí)別圖像中的斑點(diǎn) 之后,系統(tǒng)分析所述斑點(diǎn)以針對(duì)斑點(diǎn)確定"噪聲閾值"。(例如, 噪聲閾值可指定斑點(diǎn)中的最小像素?cái)?shù)。)接著,系統(tǒng)去除小于確定 噪聲閾值的所有斑點(diǎn)。注意,較大的噪聲閾值將去除更多的小偽像, 但是也可以去除字符(或者字符的部分),諸如,句號(hào)或者i-點(diǎn)(例 如,小寫"i"字符中的點(diǎn)部分)。作為對(duì)比,較小噪聲閾值不會(huì)去 除字符(或者字符的部分),但是也去除不了那么多的噪聲偽像。 最后,在去除斑點(diǎn)之后,系統(tǒng)執(zhí)行OCR處理以便識(shí)別剩余斑點(diǎn)內(nèi)的字符。在本發(fā)明的 一 個(gè)實(shí)施例中,從斑點(diǎn)分析收集的信息可以包括 斑點(diǎn)尺寸(斑點(diǎn)中的像素?cái)?shù))、斑點(diǎn)分布(數(shù)字圖像或者數(shù)字圖像 的分塊(section)中的斑點(diǎn)數(shù))、以及斑點(diǎn)間隔(在斑點(diǎn)之間的像素 數(shù))。此信息可用于估計(jì)文本尺寸。另外,可以通過識(shí)別圖像中的 關(guān)鍵字符來(lái)估計(jì)文本尺寸,然后確定這些關(guān)鍵字符的尺寸。關(guān)鍵字 符是小字符(或者字符的部分),諸如,句號(hào)、i-點(diǎn)、逗號(hào)和省略號(hào)。 在建立噪聲去除閾值時(shí),關(guān)鍵字符很有用,這是因?yàn)橥ǔjP(guān)鍵字符 是一種字體中的最小字符(或者字符的部分),并且由此可以用以 在字符(或者字符的部分)和噪聲之間有所區(qū)分。關(guān)鍵字符還可以 包括選擇用以輔助估計(jì)文本尺寸的字母和數(shù)字。通常,在斑點(diǎn)和斑 點(diǎn)高度分布之間的基線間隔是文本尺寸的良好指示符,可以對(duì)其進(jìn) 行確定而不必經(jīng)歷整個(gè)OCR處理。在本發(fā)明的一個(gè)實(shí)施例中,通過首先識(shí)別圖像中的"文本區(qū)域,,, 然后識(shí)別該文本區(qū)域內(nèi)的關(guān)鍵字符,來(lái)使系統(tǒng)確定噪聲閾值。接著, 系統(tǒng)計(jì)算所識(shí)別的關(guān)鍵字符的平均尺寸,并且將噪聲閾值計(jì)算為此 平均尺寸的一個(gè)分?jǐn)?shù)。注意,可通過用戶或者系統(tǒng)管理員來(lái)預(yù)定義 關(guān)鍵字符的列表。另外,注意,關(guān)鍵字符可用以識(shí)別字體,繼而在后續(xù)的OCR操作期間可以有助于區(qū)分字符和噪聲斑點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,上述處理是迭代的。在此實(shí)施例中, 系統(tǒng)開始于"初始噪聲閾值"。此噪聲閾值用以執(zhí)行初始噪聲去除 處理,其中從圖像中去除小于初始噪聲閾值的斑點(diǎn)。(注意,期望 的是,將此初始噪聲閾值設(shè)置得小于最小感興趣字體中的任何關(guān)鍵 字符。)接著,系統(tǒng)分析如上所述的關(guān)鍵字符以確定新的噪聲閾值。 如果新的噪聲閾值不同于先前的噪聲閾值,則系統(tǒng)重復(fù)噪聲去除處 理。當(dāng)重復(fù)此處理時(shí),如果確定噪聲閾值從先前的噪聲閾值有所降 低,則系統(tǒng)恢復(fù)小于先前噪聲闞值但是大于所確定的閾值的先前已 去除斑點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,上述迭代處理繼續(xù)直到達(dá)到"滿意 的,,閾值水平。注意,如果出現(xiàn)以下情況則可以認(rèn)為閾值是"滿意 的,,(1 )在迭代之間闊值沒有變化;(2)閾值小于預(yù)定的噪聲 容限水平;(3)閾值中的變化在預(yù)定范圍內(nèi);或者(4)噪聲去除 系統(tǒng)已經(jīng)執(zhí)行了預(yù)先指定的時(shí)間量。在本發(fā)明的一個(gè)實(shí)施例中,噪聲去除處理應(yīng)用于整個(gè)成像文檔。在本發(fā)明的另一實(shí)施例中,以逐頁(yè)為基礎(chǔ)來(lái)應(yīng)用噪聲去除處理。 在此實(shí)施例中,可以獨(dú)立地對(duì)每頁(yè)應(yīng)用處理,或者可替換地,可以 將統(tǒng)計(jì)"[言息傳?l義(carry over ) 至每個(gè)后續(xù)頁(yè)面,以輔助針對(duì)每個(gè)后 續(xù)頁(yè)面來(lái)設(shè)置初始噪聲閾值。在本發(fā)明的 一個(gè)實(shí)施例中,將成像文檔中的頁(yè)面劃分成為分塊, 并且獨(dú)立地處理每個(gè)分塊或者與其他分塊相結(jié)合進(jìn)行處理。此實(shí)施 例提供了最大的靈活性,并且在大多數(shù)情況下可產(chǎn)生最佳結(jié)果,但 是將需要較長(zhǎng)的處理時(shí)間。在本發(fā)明的一個(gè)實(shí)施例中,無(wú)論噪聲去除閾值如何變化,在噪 聲去除處理的后續(xù)迭代期間不恢復(fù)斑點(diǎn)。這有可能降低噪聲去除處 理的準(zhǔn)確度,這是因?yàn)榭赡苋コ俗鳛樽址?或者字符的部分)的 某些斑點(diǎn)。然而,還有可能增加噪聲去除處理的速度。樣本文檔圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的樣本文檔。此樣本文檔包含頭部IOI、主體102以及腳注103。樣本文檔的主體102包括 文本分塊以及包含文本的圖像兩者。另外,在整個(gè)文檔中可以看到 多個(gè)偽像104。注意,此圖像IOO是通過掃描已經(jīng)包含噪聲的文檔而 創(chuàng)建的。然而,還可能是,在掃描處理期間引入了噪聲。另外,注 意,本發(fā)明可應(yīng)用于任何數(shù)字圖像,并且并不局限于掃描文檔。興趣點(diǎn)圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的樣本文檔中的數(shù)個(gè)興趣 點(diǎn)。更具體地,圖2A示出了來(lái)自圖1中所示的樣本文檔的頭部101 的分塊。圖2A中的三個(gè)興趣點(diǎn)是噪聲偽像202、句號(hào)204以及i-點(diǎn) 206。選擇初始噪聲閾值導(dǎo)致多種可能性中的一種。如果噪聲閾值太 精細(xì),則將去除噪聲偽像202、句號(hào)204以及i-點(diǎn)206。如果噪聲閾 值太粗糙,則將保留噪聲偽像202、句號(hào)204以及i-點(diǎn)206。因?yàn)樵?聲偽像202大于某些合理的斑點(diǎn)(諸如,句號(hào)204和i-點(diǎn)206 ),因 此不存在這樣的初始閾值設(shè)置,其去除噪聲偽像202但是并不去除 句號(hào)204和i-點(diǎn)206。此示例示出了其他噪聲去除方案具有的問題, 并且其中本發(fā)明的實(shí)施例通過在0 C R處理期間調(diào)整噪聲閾值來(lái)解決 這些問題,如下文中進(jìn)一步詳細(xì)描述的。圖2B示出了來(lái)自圖1所示的樣本文檔的腳注103的分塊。兩個(gè) 興趣點(diǎn)是噪聲偽像208和句號(hào)210。選擇處于噪聲偽像208和句號(hào) 210之間某處的噪聲閾值水平來(lái)去除噪聲偽像208。這在單一迭代中很容易實(shí)現(xiàn),并且在該(OCR)處理期間不必進(jìn)行優(yōu)化。在此情況下,噪聲去除處理結(jié)束而不必對(duì)噪聲閾值進(jìn)行進(jìn)一步的優(yōu)化,并且OCR系統(tǒng)能夠?qū)⑵溆嗟陌唿c(diǎn)識(shí)別為字體中的有效字符,所述有效字 符對(duì)OCR系統(tǒng)是可識(shí)別的。圖2C示出了在圖1中示出的樣本文檔的一個(gè)分塊。此分塊包括 噪聲偽像212、圖像214以及文本216。根據(jù)文件格式以及分塊的格 式,分塊可以不經(jīng)歷噪聲去除處理。以下描述假定在噪聲去除處理 中包括在圖2C中所示出的分塊。如果將初始噪聲閾值設(shè)置為去除噪 聲偽像212的水平,則在初始噪聲去除處理期間也將去除作為圖像 214的部分的許多斑點(diǎn)。另一方面,如果初始噪聲閾值處于不改變圖 像214的水平,則在初始噪聲去除階段之后將保留噪聲偽像212。本 發(fā)明的一個(gè)實(shí)施例選擇這樣的初始噪聲閾值,該初始噪聲閾值導(dǎo)致 去除噪聲偽像212而不會(huì)影響圖像214,或者可替換地,選擇既不去 除噪聲偽像212也不影響圖像214的閾值。在后 一情況下,將在OCR 處理的后續(xù)迭代期間去除噪聲偽像212。本發(fā)明的一個(gè)實(shí)施例可以或者獨(dú)立地或者一并地處理多頁(yè)面文 檔的每個(gè)頁(yè)面。注意,如果獨(dú)立地處理每個(gè)頁(yè)面,則本發(fā)明可將來(lái)自先前處理的頁(yè)面的統(tǒng)計(jì)信息傳承以便促進(jìn)形成用于后續(xù)頁(yè)面的初 始閾4直。在本發(fā)明的另一實(shí)施例中, 一并處理在圖2A、圖2B和圖2C中 出現(xiàn)的項(xiàng)目。因?yàn)樵S多噪聲偽像的尺寸類似于合理的斑點(diǎn),在初始 噪聲去除處理期間將保留大多數(shù)的噪聲偽像。在后續(xù)迭代操作期間, 將通過調(diào)整噪聲閾值來(lái)去除剩余的噪聲偽像。處理概要圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的噪聲去除處理。在此處 理期間,接收成像文檔304、 305和306作為對(duì)噪聲去除處理316的 輸入。然后,噪聲去除處理316分別生成輸出文檔324、 325和326。 注意,通過噪聲去除處理316來(lái)將包含具有噪聲的文本309、 310、311和312的區(qū)域轉(zhuǎn)換成為包含不具有噪聲的文本307、 329、 330 和331的區(qū)域。噪聲去除處理316沒有處理在成像文檔304以及305 中的非文本區(qū)域307和308,并且將其分別保持作為輸出文檔324 和325中的非文本區(qū)域307和308。計(jì)算環(huán)境圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的計(jì)算環(huán)境400。計(jì)算環(huán)境 400包括客戶端410和膝上型計(jì)算機(jī)420。客戶端410和膝上型計(jì)算 機(jī)420兩者都耦接至網(wǎng)絡(luò)440。另外,客戶端410和膝上型計(jì)算機(jī) 420有能力與數(shù)個(gè)設(shè)備通信,包括打印機(jī)430、掃描儀450、蜂窩照 相電話460以及數(shù)碼相機(jī)470??蛻舳?10以及膝上型計(jì)算機(jī)420通常包括網(wǎng)絡(luò)上的任意如下 節(jié)點(diǎn),該節(jié)點(diǎn)包括計(jì)算能力以及包括用于跨網(wǎng)絡(luò)440進(jìn)行通信的機(jī) 制??蛻舳?10以及膝上型計(jì)算機(jī)420通??砂ㄈ魏晤愋偷挠?jì)算 機(jī)系統(tǒng),包括但不限于,基于微處理器的計(jì)算機(jī)系統(tǒng)、大型機(jī)計(jì)算 機(jī)、數(shù)字信號(hào)處理器、便攜計(jì)算設(shè)備、個(gè)人組織器、設(shè)備控制器以 及應(yīng)用設(shè)備中的計(jì)算引擎。打印機(jī)430通常可以包括任何類型的打印機(jī),包括但不限于, 個(gè)人打印機(jī)、網(wǎng)絡(luò)打印機(jī)以及多功能打印機(jī),所述多功能打印機(jī)可 以包括復(fù)印機(jī)、掃描儀以及傳真機(jī)。掃描儀450通常可以包括任何類型的數(shù)字掃描儀,包括但不限 于,單獨(dú)的掃描儀以及多功能掃描儀,所述多功能掃描儀可以包括 復(fù)印才幾、打印機(jī)以及傳真才幾。諸如打印機(jī)430、掃描儀450、蜂窩照相電話460以及數(shù)碼相枳i 470的設(shè)備能夠捕捉文檔的圖像,或者創(chuàng)建可以包括文本的圖像。這 些設(shè)備的每個(gè)能夠?qū)D像傳送至客戶端410或者膝上型計(jì)算機(jī)420。 在本發(fā)明的一個(gè)實(shí)施例中,使用在此描述的去除處理,客戶端410 或者膝上型計(jì)算機(jī)420兩者都能夠去除在成像處理期間出現(xiàn)的噪聲偽像。噪聲去除系統(tǒng)圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的噪聲去除系統(tǒng)500。噪聲 去除系統(tǒng)500包括斑點(diǎn)識(shí)別器502、斑點(diǎn)分析器504、噪聲去除器506、 噪聲恢復(fù)器508、 OCR系統(tǒng)510和存儲(chǔ)器520。存儲(chǔ)器520包括文檔 存儲(chǔ)器522 (其存儲(chǔ)圖像文件的副本)、噪聲存儲(chǔ)器524、統(tǒng)計(jì)存儲(chǔ) 器526以及系統(tǒng)設(shè)置528。斑點(diǎn)識(shí)別器502用以識(shí)別成像文檔內(nèi)的斑點(diǎn)。 一旦識(shí)別出斑點(diǎn), 則斑點(diǎn)分析器504分析所述斑點(diǎn)以確定噪聲閾值。斑點(diǎn)分析器504 基于多個(gè)因素來(lái)確定噪聲閾值,包括但不限于斑點(diǎn)數(shù)、斑點(diǎn)的分 布、在不同區(qū)域中的斑點(diǎn)的密度、在不同區(qū)域中各種尺寸的斑點(diǎn)的 密度、斑點(diǎn)的位置、斑點(diǎn)的排列以及斑點(diǎn)的顏色。 一旦完成斑點(diǎn)分 析,則將所得到的統(tǒng)計(jì)信息存儲(chǔ)在統(tǒng)計(jì)存儲(chǔ)器526中。繼而,可以 使用統(tǒng)計(jì)信息來(lái)進(jìn)一步優(yōu)化系統(tǒng)設(shè)置;優(yōu)化噪聲閾值;以及優(yōu)化 噪聲去除處理用于成像文檔的其他區(qū)域以及其他成像文檔?;谟砂唿c(diǎn)分析器504所確定的噪聲閾值,噪聲去除器506可 以去除任何被認(rèn)為是噪聲偽像的斑點(diǎn)。將已去除斑點(diǎn)存儲(chǔ)在噪聲存 儲(chǔ)器524中,以便在調(diào)整了噪聲閾值,使得需要恢復(fù)某些已去除斑 點(diǎn)的情況下凌用。如果出現(xiàn)此情況,則噪聲恢復(fù)器508恢復(fù)已去除 斑點(diǎn)的某些或者全部。系統(tǒng)可以通過考慮斑點(diǎn)的尺寸或者斑點(diǎn)的位 置來(lái)確定將要恢復(fù)哪些斑點(diǎn)。在已經(jīng)完成初始噪聲去除處理之后,OCR系統(tǒng)510執(zhí)行OCR處 理。在此OCR處理期間,通過精確調(diào)整噪聲閾值來(lái)進(jìn)一步優(yōu)化噪聲 去除,如在下文中更詳細(xì)地描述。系統(tǒng)設(shè)置528包含用于噪聲去除處理的系統(tǒng)設(shè)置。在本發(fā)明的 一個(gè)實(shí)施例中,這些設(shè)置包括但不限于將要分析的信息的描述; 噪聲去除處理的質(zhì)量值;定義何時(shí)終止噪聲去除處理的指示符;指 示是否將任何信息傳承至下 一 噪聲去除任務(wù)的標(biāo)志;用于關(guān)鍵字符的標(biāo)識(shí)符;以及確定是否對(duì)文件、頁(yè)面或者頁(yè)面區(qū)域執(zhí)行處理的指
示符。注意,噪聲去除處理的質(zhì)量與噪聲去除處理的速度反向相關(guān)。 另外,噪聲去除處理的質(zhì)量直接相關(guān)于對(duì)噪聲去除處理可用的存儲(chǔ) 器的數(shù)量。
OCR系統(tǒng)
圖6示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的光學(xué)字符識(shí)別(OCR) 系統(tǒng)600。 OCR系統(tǒng)600包括文本查找器602、文本分析器604 以及噪聲閾值校準(zhǔn)器606。文本查找器602識(shí)別成像文檔內(nèi)的文本區(qū)
在此不做進(jìn)一步的描述。
一旦已經(jīng)識(shí)別了文本區(qū)域,則文本分析器604分析文本區(qū)域以 便確定文本的尺寸以及識(shí)別文本內(nèi)的關(guān)鍵字符。
然后,由文本分析器604來(lái)分析關(guān)鍵字符以確定其尺寸(例如, 以像素?cái)?shù)的形式)。如上所述,關(guān)鍵字符是用以區(qū)分字符和噪聲的 小字符(或者字符的部分)。關(guān)鍵字符隨著字體的變化而變化,但 是這些關(guān)鍵字符通常包括句號(hào)、i-點(diǎn)、逗號(hào)、省略號(hào)以及小于該字體 的其他字符的其他字符(或者字符的部分)。從文本分析器604所 明確的信息(包括例如噪聲閾值)存儲(chǔ)在統(tǒng)計(jì)存儲(chǔ)器526中。在后 續(xù)的迭代或者用于其他噪聲去除任務(wù)期間,可使用此信息。如上所 述,文本分析器604的輸出用以優(yōu)化噪聲閾值。
噪聲閾值校準(zhǔn)器606調(diào)整噪聲閾值。如果確定噪聲閾值已改變 得超出了系統(tǒng)設(shè)置528中所指定的容限,則執(zhí)行附加的噪聲去除操 作。此附加的噪聲去除操作可以包括,如果噪聲閾值已經(jīng)降低則恢 復(fù)某些或者全部先前已去除斑點(diǎn)。
噪聲去除處理
圖7呈現(xiàn)了示出根據(jù)本發(fā)明的 一 個(gè)實(shí)施例的噪聲去除處理的流 程圖。處理由識(shí)別圖像中的斑點(diǎn)(步驟702)開始。接著,系統(tǒng)分析斑點(diǎn)(步驟704)以及將所得到的信息存儲(chǔ)在統(tǒng)計(jì)存儲(chǔ)器526中。此 所得到的信息可以包括平均斑點(diǎn)尺寸、斑點(diǎn)密度信息、斑點(diǎn)顏色 以及用以設(shè)置噪聲去除閾值的任何其他信息。
使用步驟704的結(jié)果,系統(tǒng)確定噪聲閾值(步驟706 )。在本發(fā) 明的 一個(gè)實(shí)施例中,噪聲閾值是圖像中的關(guān)鍵字符的平均斑點(diǎn)尺寸 的一個(gè)分?jǐn)?shù)。噪聲閾值在給定頁(yè)面的不同分塊上可以有所變化。例 如,在一個(gè)實(shí)施例中,如果頁(yè)面的上部33%具有15像素的平均關(guān)鍵 字符斑點(diǎn)尺寸,則可以將頁(yè)面的上部33%的噪聲閾值設(shè)置為5像素。 然而,如果頁(yè)面的下部66%具有45像素的平均關(guān)鍵字符斑點(diǎn)尺寸, 則可以將頁(yè)面的下部66%的噪聲閾值設(shè)置為15像素??梢允褂冒唿c(diǎn) 尺寸以外的其他因素來(lái)確定噪聲閾值。例如,如果系統(tǒng)設(shè)置528指 示圖像是嚴(yán)格單色的,但是在成像處理期間在文檔中引入了紅色偽 像,則系統(tǒng)可以將該紅色偽像識(shí)別為噪聲并且將其從圖像中去除。
在已經(jīng)建立噪聲閾值之后,系統(tǒng)去除包含少于噪聲閾值的像素 的所有斑點(diǎn)(步驟708 )。最后,系統(tǒng)啟動(dòng)OCR處理(步驟710)。
OCR處理
先前的部分描述了可以調(diào)整以便與用戶需要相匹配的快速而靈 活的噪聲去除處理。在本發(fā)明的一個(gè)實(shí)施例中,處理在步驟712處完成。
在本發(fā)明的 一 個(gè)實(shí)施例中,在O C R處理期間優(yōu)化噪聲去除處理。 此優(yōu)化過程產(chǎn)生比先前所描述的實(shí)施例更高質(zhì)量的結(jié)果。
圖8呈現(xiàn)了示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的OCR處理的流程 圖,該OCR處理包括對(duì)噪聲去除處理的優(yōu)化。在此操作期間,系統(tǒng) 首先識(shí)別成像文檔內(nèi)的文本區(qū)域(步驟802 )。注意,在一個(gè)實(shí)施例 中,在此步驟以及OCR的所有后續(xù)步驟中,通常忽略作為圖片或者 圖像一部分的文本。
一旦識(shí)別了文本區(qū)域,則分析文本區(qū)域(步驟804)。此分析可 以包括例如估計(jì)文本尺寸、識(shí)別關(guān)鍵字符、以及識(shí)別用于文本的字體。接著,系統(tǒng)根據(jù)所述分析結(jié)果來(lái)重新評(píng)估用于圖像的噪聲閾
值(806 )。
然后,系統(tǒng)確定噪聲閾值是否已經(jīng)變化(步驟808 )。如果沒有 變化,則系統(tǒng)完成OCR處理(步驟820 )。如果噪聲閾值已經(jīng)變化, 則系統(tǒng)確定新的噪聲閾值是否小于先前的噪聲閾值(步驟810)。如 果小于,則恢復(fù)大于新噪聲閾值但小于初始噪聲閾值的先前已去除斑點(diǎn)。
在本發(fā)明的一個(gè)實(shí)施例中,先前指定的"容限水平"還用以確 定是否將要恢復(fù)已去除斑點(diǎn)。例如,給定兩個(gè)像素的容限水平,如 果舊的噪聲閾值是十二個(gè)像素而新的噪聲閾值是八個(gè)像素,則不需 要恢復(fù)九個(gè)像素的斑點(diǎn)??梢酝ㄟ^系統(tǒng)設(shè)置528來(lái)指示容限水平。
在已經(jīng)恢復(fù)已去除斑點(diǎn)(或者如果新的噪聲閾值不低于步驟810 中的先前的噪聲閾值)之后,則系統(tǒng)使用新的噪聲閾值來(lái)重復(fù)噪聲 去除處理(步驟814)。
接著,系統(tǒng)確定新的噪聲閾值是否為滿意的(步驟816)??梢?基于以下因素來(lái)進(jìn)行此確定是否已經(jīng)去除任何斑點(diǎn);已經(jīng)去除了 多少斑點(diǎn);已經(jīng)對(duì)噪聲閾值進(jìn)行了多少次調(diào)整;或者沿哪個(gè)方向來(lái) 調(diào)整噪聲閾值。如果新的噪聲閾值是滿意的,則系統(tǒng)完成OCR處理 (步驟820)。另一方面,如果新的噪聲閾值不是滿意的,則通過返 回步驟802來(lái)重復(fù)噪聲去除處理。
在本發(fā)明的 一 個(gè)實(shí)施例中,在返回步驟802之前系統(tǒng)通過調(diào)整 系統(tǒng)設(shè)置528來(lái)優(yōu)化噪聲去除處理。這可以包括調(diào)整以下內(nèi)容將 要分析的信息;噪聲去除處理的質(zhì)量;何時(shí)終止噪聲去除處理;是 否將任何信息傳承至下一噪聲去除任務(wù);哪些字符是關(guān)鍵字符;以 及是否在文檔、頁(yè)面、或者頁(yè)面區(qū)域上執(zhí)行處理。
已經(jīng)呈現(xiàn)的本發(fā)明的上述描述僅僅出于示意和描述的目的。上 述描述并非旨在于窮盡本發(fā)明或者將本發(fā)明限制于所公開的形式。 相應(yīng)地,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),許多修改和變型都是顯而易見 的。另外,上述公開并非旨在于限制本發(fā)明。通過所附權(quán)利要求書來(lái)限定本發(fā)明的范圍。
權(quán)利要求
1.一種用于從圖像中去除噪聲的方法,包括接收所述圖像;識(shí)別所述圖像中的斑點(diǎn),其中斑點(diǎn)是可能表示所述圖像中的字符或者字符一部分的鄰近像素的集合;分析所述斑點(diǎn)以確定噪聲閾值,其中小于所述噪聲閾值的斑點(diǎn)很可能是噪聲;以及從所述圖像去除小于所述噪聲閾值的斑點(diǎn)。
2. 根據(jù)權(quán)利要求1所述的方法,其中確定所述噪聲閾值包括 識(shí)別所述圖像中的文本區(qū)域;識(shí)別所述文本區(qū)域內(nèi)的關(guān)鍵字符;計(jì)算所述識(shí)別的關(guān)鍵字符的平均尺寸;以及將所述噪聲閾值計(jì)算為所述平均關(guān)鍵字符尺寸的 一 個(gè)分?jǐn)?shù)。
3. 根據(jù)權(quán)利要求2所述的方法,其中如果所述確定的噪聲闊值 不同于先前的噪聲閾值,則重復(fù)用于從所述圖像去除噪聲的所述方 法。
4. 根據(jù)權(quán)利要求3所述的方法,其中如果所確定的噪聲閾值從 所述先前的噪聲閾值有所降低,則所述方法進(jìn)一步包括恢復(fù)小于所 述先前噪聲闞值而大于所確定的噪聲閾值的先前已去除斑點(diǎn)。
5. 根據(jù)權(quán)利要求1所述的方法,其中在分析所述斑點(diǎn)之前,所 述方法進(jìn)一步包括通過從所述圖像中去除低于初始噪聲閾值的斑點(diǎn) 來(lái)執(zhí)行初始噪聲去除操作。
6. 根據(jù)權(quán)利要求1所述的方法,其中分析所述斑點(diǎn)包括分析以 下的一個(gè)或者多個(gè)所述斑點(diǎn)的尺寸分布; 斑點(diǎn)數(shù);所述斑點(diǎn)的位置;在所述圖像內(nèi)的或者圖像區(qū)域內(nèi)的斑點(diǎn)密度;以及斑點(diǎn)顏色。
7. 根據(jù)權(quán)利要求1所述的方法,其中針對(duì)多個(gè)所識(shí)別的文本區(qū) 域的每個(gè)來(lái)獨(dú)立地確定噪聲閾值。
8. —種存儲(chǔ)指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)由計(jì)算機(jī)執(zhí)行所述 指令時(shí),致使所述計(jì)算機(jī)執(zhí)行用于從圖像中去除噪聲的方法,所述 方法包4舌接收所述圖像;識(shí)別所述圖像中的斑點(diǎn),其中斑點(diǎn)是可能表示所述圖像中的字符 或者字符一部分的鄰近像素的集合;分析所述斑點(diǎn)以確定噪聲閾值,其中小于所述噪聲閾值的斑點(diǎn)很可能是噪聲;以及從所述圖像去除小于所述噪聲閾值的斑點(diǎn)。
9. 根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中確定所述 噪聲閾值包括識(shí)別所述圖像中的文本區(qū)域;識(shí)別所述文本區(qū)域內(nèi)的關(guān)鍵字符;計(jì)算所述識(shí)別的關(guān)鍵字符的平均尺寸;以及將所述噪聲閾值計(jì)算為所述平均關(guān)鍵字符尺寸的一個(gè)分?jǐn)?shù)。
10. 根據(jù)權(quán)利要求9所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中如果所迷 確定的噪聲閾值不同于先前的噪聲閾值,則重復(fù)用于從所述圖像去 除噪聲的所述方法。
11. 根據(jù)權(quán)利要求IO所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中如果所 確定的噪聲閾值從所述先前的噪聲閾值有所降低,則所述方法進(jìn)一 步包括恢復(fù)小于所述先前噪聲閾值而大于所述確定的噪聲閾值的先 前已去除斑點(diǎn)。
12. 根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中在分析所 述斑點(diǎn)之前,所述方法進(jìn)一步包括通過從所述圖像中去除低于初始 噪聲閾值的斑點(diǎn)來(lái)執(zhí)行初始噪聲去除操作。
13. 根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中分析所述斑點(diǎn)包括分析以下的一個(gè)或者多個(gè) 所述斑點(diǎn)的尺寸分布; 斑點(diǎn)數(shù);所述斑點(diǎn)的位置;在所述圖像內(nèi)的或者圖像區(qū)域內(nèi)的斑點(diǎn)密度;以及 斑點(diǎn)顏色。
14. 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中針對(duì)多個(gè) 所識(shí)別的文本區(qū)域的每個(gè)來(lái)獨(dú)立地確定噪聲閾值。
15. —種用于從圖像中去除噪聲的裝置,包括 斑點(diǎn)識(shí)別機(jī)制,配置以識(shí)別所述圖像中的斑點(diǎn),其中斑點(diǎn)是可能表示所述圖像中的字符或者字符一部分的鄰近像素的集合;閾值確定機(jī)制,配置以分析所述斑點(diǎn)來(lái)確定噪聲閾值,其中小于所述噪聲閾值的斑點(diǎn)很可能是噪聲;以及斑點(diǎn)去除機(jī)制,配置以從所述圖像去除小于所述噪聲閾值的斑點(diǎn)。
16. 根據(jù)權(quán)利要求15所述的裝置,其中所述閾值確定機(jī)制配置以識(shí)別所述圖像中的文本區(qū)域;識(shí)別所述文本區(qū)域內(nèi)的關(guān)鍵字符;計(jì)算所述識(shí)別的關(guān)鍵字符的平均尺寸;以及將所述噪聲閾值計(jì)算為所述平均關(guān)鍵字符尺寸的一個(gè)分?jǐn)?shù)。
17. 根據(jù)權(quán)利要求16所述的裝置,其中所述裝置配置以便如果 所述確定的噪聲閾值不同于先前的噪聲閾值,則重復(fù)所述噪聲去除 處理。
18. 根據(jù)權(quán)利要求17所述的裝置,進(jìn)一步包括斑點(diǎn)恢復(fù)機(jī)制, 其中如果所確定的噪聲閾值從所述先前的噪聲閾值有所降低,則所 述斑點(diǎn)恢復(fù)機(jī)制進(jìn)一步配置以恢復(fù)小于所述先前噪聲閾值而大于所 述確定的噪聲閾值的先前已去除斑點(diǎn)。
19. 根據(jù)權(quán)利要求15所述的裝置,進(jìn)一步包括初始噪聲去除機(jī)制,配置以通過從所述圖像去除低于初始噪聲閾值的斑點(diǎn)以執(zhí)行初 始噪聲去除操作。
20. 根據(jù)權(quán)利要求15所述的裝置,其中當(dāng)分析所述斑點(diǎn)時(shí),所 述閾值確定機(jī)制配置以分析以下的 一 個(gè)或者多個(gè)所述斑點(diǎn)的尺寸分布; 斑點(diǎn)數(shù);所述斑點(diǎn)的位置;在所述圖像內(nèi)的或者圖像區(qū)域內(nèi)的斑點(diǎn)密度;以及 斑點(diǎn)顏色。
21. 根據(jù)權(quán)利要求15所述的裝置,其中所述閾值確定機(jī)制配置 以針對(duì)多個(gè)已識(shí)別文本區(qū)域的每個(gè)來(lái)獨(dú)立地確定噪聲閾值。
全文摘要
本發(fā)明的一個(gè)實(shí)施例提供了一種從圖像中去除噪聲的系統(tǒng)。在操作期間,系統(tǒng)首先識(shí)別圖像中的斑點(diǎn),其中斑點(diǎn)是可能表示圖像中的字符或者字符一部分的鄰近像素的集合。繼而,系統(tǒng)分析斑點(diǎn)以動(dòng)態(tài)地確定用于斑點(diǎn)的“噪聲閾值”。然后,系統(tǒng)從圖像去除低于噪聲閾值的斑點(diǎn)。
文檔編號(hào)G06T5/00GK101322154SQ200680045042
公開日2008年12月10日 申請(qǐng)日期2006年11月28日 優(yōu)先權(quán)日2005年11月30日
發(fā)明者D·G·尼科爾森 申請(qǐng)人:奧多比公司