亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

處理掃描數(shù)據(jù)的系統(tǒng)和方法

文檔序號:7636488閱讀:295來源:國知局
專利名稱:處理掃描數(shù)據(jù)的系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于改進(jìn)由數(shù)據(jù)采集裝置獲得的數(shù)據(jù)質(zhì)量的系統(tǒng)和方法。用 戶可以位于該數(shù)據(jù)采集裝置本地或者遠(yuǎn)端。
背景技術(shù)
用于模擬數(shù)據(jù)的數(shù)據(jù)采集裝置將模擬數(shù)據(jù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)。 一個典型的 例子是掃描裝置。其將印在一張紙上的圖像作為輸入,而輸出這個物理圖像 的數(shù)字表示。由該采集裝置獲得的質(zhì)量強(qiáng)烈依賴于采用適合給定模擬數(shù)據(jù)細(xì) 節(jié)的設(shè)置來使用該裝置。例如,掃描儀上用來獲得日落的高質(zhì)量掃描圖像的 設(shè)置不同于用來掃描在夏天白天拍攝的照片的設(shè)置。為模擬數(shù)據(jù)的給定細(xì)節(jié) 找到更好或最佳的設(shè)置是耗費時間的過程,經(jīng)常需要使用不同的采集裝置多 次獲得模擬數(shù)據(jù)。當(dāng)數(shù)字?jǐn)?shù)據(jù)的接收器和數(shù)據(jù)采集裝置處于不同的位置時, 這就變得非常不切實際而且效率低。下面的例子說明現(xiàn)有技術(shù)的效率低。傳真的接收者對接收到的傳真的質(zhì) 量不滿意。為了獲得更好質(zhì)量的傳真,該接收器只有,例如使用電話,通知 位于該傳真源位置的一個人而要求使用不同的設(shè)置發(fā)送傳真。而且,給定的臨時模擬數(shù)據(jù),在一個窄的時間幀內(nèi),使用物理方法重新 取得模擬數(shù)據(jù)來確定改進(jìn)的采集設(shè)置是不可能的或是不可行的。在目前遠(yuǎn)程數(shù)據(jù)釆集應(yīng)用中,模擬數(shù)據(jù)需要轉(zhuǎn)換為數(shù)字的來使用,例如, 掃描裝置或數(shù)字復(fù)制機(jī)器。然后,通過網(wǎng)絡(luò)將數(shù)字化的數(shù)據(jù)傳給遠(yuǎn)程的接收 器?,F(xiàn)有的遠(yuǎn)程數(shù)字采集應(yīng)用的方法不能使遠(yuǎn)程接收器利用對數(shù)據(jù)采集裝置 的遠(yuǎn)程控制來獲取數(shù)據(jù)
發(fā)明內(nèi)容
為了提高質(zhì)量的目的,實施例包括數(shù)據(jù)的虛擬二次采集的方法。在一個 實施例中,用于提高質(zhì)量的虛擬二次采集可用于掃描設(shè)備,以及其它數(shù)據(jù)采 集設(shè)備,例如數(shù)字復(fù)印機(jī)、傳真機(jī)、多功能外圍設(shè)備、紅外線相機(jī)、聲學(xué)相 機(jī)、數(shù)碼相機(jī)、具有內(nèi)置數(shù)碼相機(jī)的移動電話等等。虛擬二次采集可用于任 何模擬或數(shù)字源,包括聲音、用于監(jiān)控設(shè)備的聲學(xué)測量、溫度、視頻等等。用于模擬數(shù)據(jù)的采集設(shè)備的輸入流可以是離散的或連續(xù)的。另外,該數(shù) 據(jù)流可以是時間或空間的一個函數(shù)。不考慮這些形態(tài),結(jié)果數(shù)據(jù)包含在一個 離散單元的有序集合中。該集合的順序包含該輸入流的時間或空間方向信息。 在連續(xù)的輸入流的情況下,該采集裝置通過將該連續(xù)的輸入流分割成多個文 件而產(chǎn)生多個離散單元。例如, 一個視頻鏡頭的輸入是連續(xù)的,并且由該鏡 頭拍攝的象幀組成的有序集合給出該結(jié)果數(shù)據(jù),每個象幀是前述離散單元的 一個例子。輸入掃描設(shè)備的一組紙張就是離散輸入流的一個例子,并且該離 散數(shù)據(jù)是由該紙張確定的。一個實施例是用于增強(qiáng)數(shù)字?jǐn)?shù)據(jù)的有效的方法和系統(tǒng),該數(shù)據(jù)由用于模 擬數(shù)據(jù)的采集設(shè)備獲得。使用該模擬數(shù)據(jù)的虛擬二次采集而獲得增強(qiáng)。該虛 擬二次采集的方法在一個緩存中存儲由該采集設(shè)備獲得的原始數(shù)據(jù)。該數(shù)據(jù) 處理器從該緩存訪問該原始數(shù)據(jù),允許該數(shù)據(jù)處理器重新處理該原始數(shù)據(jù)而 無需利用該采集設(shè)備物理地二次采集該數(shù)據(jù)。一個實施例在緩存中存儲盡可能多的輸入數(shù)據(jù)單元,在給定緩存大小的 情況下。在特定的實施例中,用于輸入數(shù)據(jù)的新的存儲空間通過刪除駐留緩 存最長的數(shù)據(jù)單元而產(chǎn)生。另外,在其它實施例中,對數(shù)據(jù)單元賦以優(yōu)先權(quán), 而具有較低優(yōu)先權(quán)的數(shù)據(jù)單元會在具有較高優(yōu)先權(quán)的數(shù)據(jù)單元之前被新的數(shù) 據(jù)單元覆蓋。一個實施例具有虛擬二次采集通過該采集設(shè)備獲得的最新或次新使用的數(shù)據(jù)單元的能力。或者,用戶可以通過一個選4奪^U勾虛擬地重新獲取存儲在緩存中的原始數(shù)據(jù)或原始數(shù)據(jù)的分段。虛擬的二次采集的方法補(bǔ)償了物理地 二次釆集該模擬數(shù)據(jù)所消耗的不必要的時間和勞動。進(jìn)而,在不可能進(jìn)行物 理二次采集的情況下,例如時間依賴型輸入流的情況,應(yīng)用該虛擬二次采集 是非常有價值的。 虛擬二次采集的額外的應(yīng)用是當(dāng)該采集設(shè)備的采集率對于輸出通信系統(tǒng) 來說過高,并且是作為默認(rèn)方式,則傳輸壓縮的低分辨率數(shù)據(jù)。使用虛擬二 次采集,數(shù)據(jù)的接收器可以有選擇地訪問和重新處理該原始的高分辨率數(shù)據(jù) 而不受傳輸帶寬的限制。 '另外,這里提供了一個使用虛擬二次采集以有效地確定改進(jìn)的或最佳的 采集設(shè)備設(shè)置的方法和系統(tǒng)的實施例。該改進(jìn)的或最佳的設(shè)置可以實時和非 實時交互的方式得到,由系統(tǒng)本身自動得到,或者使用它們的組合方式得到, 這依賴于具體的實施例。而且,該方法和系統(tǒng)方便了數(shù)字采集設(shè)備的控制, 通過警示用戶在該輸入流中潛在低質(zhì)量數(shù)字?jǐn)?shù)據(jù)或改變,這也許是用戶感興值的,例如在使用或要求采集大量的模擬數(shù)據(jù)的運用中。另外,在一個實施例中呈現(xiàn)了一種組合遠(yuǎn)程部署的虛擬二次采集的方法, 提供了在大量的各種商業(yè)過程中獲得巨大的有效收益的潛力,例如安全監(jiān)控 應(yīng)用。例如,使用視頻系統(tǒng)監(jiān)視一棟建筑,并且由于可用帶寬的緣故,低分 辨率數(shù)據(jù)傳輸至一個中心位置。通過分析該數(shù)據(jù),該系統(tǒng)檢測可能對監(jiān)視該 系統(tǒng)的人有用的事件,并啟動使用虛擬二次采集向該用戶傳輸高分辨率數(shù)據(jù)。通過默認(rèn)地傳輸處理后的數(shù)據(jù),而不是未壓縮的原始數(shù)據(jù), 一個實施例 的遠(yuǎn)程應(yīng)用可有效使用存儲器和網(wǎng)絡(luò),降低或最小化對存儲器以及網(wǎng)絡(luò)的硬 件使用或要求。此外,這里呈現(xiàn)的方法和系統(tǒng)的例子允許多個用戶共享使用 一個或多個 模擬采集設(shè)備。每個用戶可使用不同的處理器設(shè)置處理相同的原始數(shù)據(jù),使 得每個單獨的用戶可以根據(jù)他或她個人的喜好和需要處理該原始數(shù)據(jù)。最后,該方法和系統(tǒng)的 一 個實施例可以獨立地應(yīng)用于獲取的離散數(shù)據(jù)單 元的分段,也就是,用戶可以選取獲取的數(shù)據(jù)單元的分段并不同地處理選取 的分段。例如,給定一個掃描的圖像, 顯示圖像和文本,用戶可以將獲取的 數(shù)據(jù)分為兩個區(qū)域, 一個包含該圖像而另一個是文本,并且可以虛擬地使用 最適合或較適合所選區(qū)域的設(shè)置來重新獲取該區(qū)域。如上所述,此處呈現(xiàn)的實施例的方法和系統(tǒng),能夠通過使用可能的一個或多個分析引擎,自動確定改進(jìn)的或最佳的處理器設(shè)置。例如, 一個第一分析引擎(引擎l)采用原始數(shù)據(jù)作為輸入,而一個第二分析引擎(引擎2)使
用處理后的數(shù)據(jù)作為輸入。該第二分析引擎使用 一個步長確定處理后數(shù)據(jù)的 質(zhì)量。其可以隨機(jī)地或者依據(jù)該步長所確定的該處理后數(shù)據(jù)的質(zhì)量來選擇新 的處理器設(shè)置。該原始數(shù)據(jù)使用該新的設(shè)置被重新處理。這個處理一直持續(xù) 直至收斂,也就是,該步長無法檢測處理后數(shù)據(jù)的質(zhì)量的任何改進(jìn)。該第一 分析引擎執(zhí)行的功能是,但不限于,頁面邊界檢測、背景平滑、滲透檢測、 色彩檢測、以及方向檢測等等。頁面邊界檢測對于有效頁面傾斜校正是有用的。在一個實施例中,該頁 面邊界檢測相對于各種背景檢測該頁面,并且因此允許對于白色背景掃描儀 和黑色背景掃描儀進(jìn)行頁面傾斜校正和剪切。一個背景平滑方法的實施例處理降低圖像背景內(nèi)顏色數(shù)量的需要和要 求,以改進(jìn)圖像的外觀,以及降低該圖像壓縮后的大小。該方法的一個例子 如下工作。集聚在圖像中發(fā)現(xiàn)的所有或部分顏色,并且選擇那些包含足夠多 像素可認(rèn)為是背景的顏色。然后,融合這些背景,并且該圖像內(nèi)屬于背景簇 的所有或部分像素在該簇內(nèi)用平均顏色替換。一個滲透檢測的實施例檢測在掃描文檔的非空白面的滲透,以便在這些 頁面上執(zhí)行進(jìn)一步的圖像處理。這個算法的一個實施例在正面和背面掃描圖 像內(nèi)使用頁面邊界檢測以近似地匹配兩側(cè)的等同物。然后,該算法使用已有 的顏色或灰度內(nèi)容調(diào)整該匹配。這個額外的步驟是有用的,因為正面和背面 鏡頭的光學(xué)和傾斜稍有不同。如果剩余(未解釋)內(nèi)容低于特定的密度標(biāo)準(zhǔn), 該頁面就認(rèn)為是空白的。在一個實施例中,顏色檢測處理在一個掃描圖像內(nèi)檢測色彩內(nèi)容的需要 或需求,以及分辨前景和背景色彩的需要或要求。這個算法的一個實施例提 供了一種機(jī)制,以清除背景顏色,如果它是文檔中的主色或最主要的顏色。 該算法的一個實施例檢查在該掃描圖像中的像素,并確定它們是彩色像素還 是背景像素。這個確定使用像素的飽和度和亮度等級。在一個實施例中,方向檢測自動確定怎樣直角旋轉(zhuǎn)一個文本頁以便于瀏 覽。該算法的 一個實施例從該頁面內(nèi)黑色的連接成分中選擇可能的單獨的字 符,并且通過一個訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)確定它們各自的方向。該算法使用以投 票數(shù)為結(jié)果的方向決定該頁面的哪個頁面最好或較好。在一個實施例中,虛擬二次采集被作為軟件執(zhí)行并獨立于采集設(shè)備。采 集設(shè)備的用戶可以通過改變處理器的設(shè)置,以交互式地增強(qiáng)獲取的模擬數(shù)據(jù) 的數(shù)字顯示的質(zhì)量??赡艿恼{(diào)整包括,但不限于,亮度、對比度、反差、腐 蝕、方向、片段、色彩呈現(xiàn)、飽和度、分辨率、扭曲角度、失序檢測、放大、 斑點去除、以及傾斜角度。該實施例是有價值的,例如與采集設(shè)備相連,這 些設(shè)備由于它們受限的硬件能力,以大量的各種模擬數(shù)據(jù)作為輸入時通常不 能產(chǎn)生穩(wěn)定的高質(zhì)量的數(shù)字?jǐn)?shù)據(jù)。在這些情況下,該實施例是一個低成本的、 用于增強(qiáng)采集設(shè)備的能力和可用性的方法。此外, 一個實施例允許采集設(shè)備的用戶根據(jù)其個人的偏好和需要獲取數(shù) 字?jǐn)?shù)據(jù)。在一個實施例中的另一個優(yōu)點是虛擬二次采集獨立于采集設(shè)備。虛擬二 次采集使用的算法的發(fā)展步伐通常比采集設(shè)備的硬件的改進(jìn)要快得多。用戶 可以通過筒單地升級虛擬二次采集軟件而很容易地使用算法的改進(jìn)。這個特 征是有價值的,例如對于昂貴的高端掃描儀,可以減少或最小化掃描儀的損耗。在另一個實施例中,上述實施例被應(yīng)用于遠(yuǎn)程部署,并因此提供對一個 或多個數(shù)字?jǐn)?shù)據(jù)的遠(yuǎn)程接收器進(jìn)行虛擬二次采集的能力。執(zhí)行的工具可以是 軟件,固件,硬件,或軟件、固件、或硬件的任意組合。一個實施的例子是使用傳真服務(wù)機(jī)。數(shù)據(jù)以高清晰度模擬形式提交,存 儲在傳真通信服務(wù)器的數(shù)據(jù)緩存,通過使用默認(rèn)設(shè)置和屬性獲得的二進(jìn)制數(shù) 據(jù)發(fā)送到它們各自的目的地。通過一個在傳真服務(wù)機(jī)上執(zhí)行的回叫協(xié)議,該 傳真的接收器可以從存儲在傳真服務(wù)器的圖像中選取一個具體的圖像或者一個圖像的縮小區(qū)域,并指定用于該選取圖像的處理器設(shè)置和屬性。選定的圖 像或圖像的縮小區(qū)域才艮據(jù)具體的設(shè)置被重新處理并且傳送到該接收器。圖像集合存儲在傳真服務(wù)器緩存中。當(dāng)緩存存滿或者當(dāng)圖像被用戶全部 處理,圖像可以被刪除,被傳送來的圖像替代,存儲在數(shù)據(jù)庫,或者它們的 任意組合。這個實施例使傳真的接收器能夠增強(qiáng)在其桌面或應(yīng)用程序中直接 接收的傳真的質(zhì)量,在圖像質(zhì)量不夠的情況下,提供過時的傳真的重發(fā)。另外,前述的回叫協(xié)議允許接收器向發(fā)送器警示不可逆的潛在的問題, 如空白頁。最終,當(dāng)發(fā)送該傳真時,發(fā)送器不必猜測改進(jìn)的或最佳的設(shè)置。
在另一個實施例中,虛擬二次釆集通過一個分析引擎被增強(qiáng),其以該采 集設(shè)備的原始數(shù)據(jù)作為輸入。該分析引擎自動確定用于采集設(shè)備的改進(jìn)的或 接近最佳的設(shè)置。另外,它還自動監(jiān)測由采集設(shè)備獲得的數(shù)字?jǐn)?shù)據(jù)的質(zhì)量, 并在所述質(zhì)量低于預(yù)定的門檻時警示用戶。用戶可按照他或她的偏好調(diào)整該 門檻。另外,用戶可以覆蓋由該分析引擎確定的采集設(shè)備設(shè)置,以及當(dāng)必需 或者需要時交互式地手動調(diào)整這些設(shè)置。在一個實施例中,所述交互式的調(diào)整可以非實時的方式進(jìn)行,并且因此, 不會中斷輸入數(shù)據(jù)流。這個實施例是有用的,例如,對于使用或要求大量模 擬數(shù)據(jù)的采集的運用。其允許近乎自動的數(shù)據(jù)采集并仍能確保高質(zhì)量的結(jié)果 數(shù)字?jǐn)?shù)據(jù)。典型的例子是使用掃描設(shè)備電子化歸檔大量紙件文檔的復(fù)印機(jī)室 或設(shè)備。在一個實施例中,通過一個分析引擎增強(qiáng)的虛擬二次采集可以由軟件, 固件,硬件,或軟件、固件、或硬件的任意組合來執(zhí)行。相比軟件執(zhí)行,硬 件執(zhí)行在速度方面具有優(yōu)勢,并且允許快速高效地處理大量數(shù)據(jù)。在另一個實施例中,由分析引擎增強(qiáng)的虛擬二次采集被遠(yuǎn)程配置。遠(yuǎn)程 配置的、由分析引擎增強(qiáng)的虛擬二次采集可以由軟件,固件,硬件,或軟件、 固件、或硬件的任意組合來執(zhí)行。在另一個實施例中,虛擬二次采集通過一個第一分析引擎和一個第二分 析引擎增強(qiáng)。該第二分析引擎分析以特定的數(shù)據(jù)處理器設(shè)置從第一分析引擎 獲得的處理后的數(shù)字?jǐn)?shù)據(jù)。利用這個信息,該第二分析引擎估算一組新的數(shù) 據(jù)處理器設(shè)置,并且使用該新的設(shè)置虛擬地重新獲得原始數(shù)據(jù)。在一個實施例中,這個過程被不斷重復(fù),直到充分改進(jìn)的設(shè)置或最佳的 設(shè)置被自動確定。由該第 一和第二分析31擎增強(qiáng)的虛擬二次采集可以由軟件, 固件,硬件,或軟件、固件、或硬件的任意組合來4丸行。在另一個實施例中,由該第一和第二分析引擎增強(qiáng)的虛擬二次采集被遠(yuǎn) 程配置。遠(yuǎn)程配置的、由該第一和第二分析引擎增強(qiáng)的虛擬二次采集可以由 軟件,固件,硬件,或軟件、固件、或硬件的任何組合來執(zhí)行。在一個實施例中, 一個數(shù)據(jù)處理系統(tǒng)包括來自數(shù)據(jù)采集裝置的原始的或 標(biāo)準(zhǔn)化的數(shù)據(jù),其中該原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)存儲在計算機(jī)可訪問存儲介質(zhì) 中,且一個第一采集控制器與所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行通信。該第一 采集控制器被配置成分析所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù),以確定它們是否在第 一組參數(shù)內(nèi)。如果該原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)不在該第一組參數(shù)內(nèi),該第一采 集控制器產(chǎn)生第一組處理器設(shè)置。該數(shù)據(jù)處理系統(tǒng)還包括一個與該第一采集 控制器通信的處理器,其中該處理器被配置成使用所述第一組處理器設(shè)置處 理所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù),以及一個與所述處理器通信的第二采集控制 器。該第二圖像采集控制器被配置成分析所述處理后的數(shù)據(jù)的至少一部分, 以確定該處理后的數(shù)據(jù)是否在第二組參數(shù)內(nèi)。如果該處理后的數(shù)據(jù)不在所述 第二組參數(shù)內(nèi),該第二采集控制器產(chǎn)生第二組處理器設(shè)置,處理器使用該第 二組處理器設(shè)置重新處理所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)。另 一個實施例中, 一種數(shù)據(jù)處理方法包i舌將來自 一個數(shù)據(jù)采集裝置的原 始的或標(biāo)準(zhǔn)化的數(shù)據(jù)存儲于計算機(jī)可訪問存儲介質(zhì)上,以及使用一個第一分 析引擎分析所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)的至少一部分,以確定所述原始的或 標(biāo)準(zhǔn)化的數(shù)據(jù)是否在第一組參數(shù)內(nèi)。如果所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)不在第 一組參數(shù)內(nèi),則該方法包括使用所述第 一分析引擎產(chǎn)生第 一組處理器設(shè)置, 使用該第一組處理器設(shè)置處理所述原始的或標(biāo)準(zhǔn)化的數(shù)據(jù),以及使用一個第 二分析引擎分析所述處理后的數(shù)據(jù)的至少一個部分,以確定所述處理后的數(shù) 據(jù)是否在第二組參數(shù)內(nèi)。如果該處理后的數(shù)據(jù)不在第二組參數(shù)內(nèi),則該方法 進(jìn)一步包括使用所述第二分析引擎產(chǎn)生第二組處理器設(shè)置,以重新處理所述 原始的或標(biāo)準(zhǔn)化的數(shù)據(jù)。在又一個實施例中, 一個數(shù)據(jù)處理系統(tǒng)包括一個存儲裝置,用于存儲來 自 一個數(shù)據(jù)采集裝置的原始數(shù)據(jù), 一個與該原始數(shù)據(jù)通信的第一分析裝置, 用于分析所述原始數(shù)據(jù)的至少一部分,以確定所述原始數(shù)據(jù)是否在第一組參 數(shù)內(nèi),如果否,則所述第一分析裝置產(chǎn)生第一組處理器設(shè)置。該數(shù)據(jù)處理系 統(tǒng)還包括一個與所述第一分析裝置通信的處理裝置,用于使用所述第一組處 理器設(shè)置處理所述原始數(shù)據(jù),和一個與所述處理裝置通信的第二分析裝置, 用于分析所述處理后的數(shù)據(jù)的至少一部分,以確定所述處理后的數(shù)據(jù)是否在 第二組參數(shù)內(nèi),以及如果否,則所述第二分析裝置產(chǎn)生第二組處理器設(shè)置, 所述處理裝置使用該第二組處理器設(shè)置重新處理所述原始數(shù)據(jù)。在另一個實施例中, 一個文檔處理系統(tǒng)包括來自一個數(shù)據(jù)采集裝置的文 檔數(shù)據(jù),其中該文檔數(shù)據(jù)存儲在計算機(jī)可訪問存儲介質(zhì)中,以及一個與該文 檔數(shù)據(jù)通信的第一采集控制器。該第一采集控制器配置成分析所述文檔數(shù)據(jù) 的至少一部分,以確定該文檔數(shù)據(jù)是否在第一組參數(shù)內(nèi)。如果該文檔數(shù)據(jù)不 在第一組參數(shù)內(nèi),則第一采集控制器產(chǎn)生第一組處理器設(shè)置。該文檔處理系 統(tǒng)還包括一個與該第一采集控制器通信的處理器,其中該處理器配置成使用 所述第一組處理器設(shè)置處理所述文檔數(shù)據(jù),和一個與該處理器通信的第二采 集控制器。該第二采集控制器配置成分析所述處理后的文檔數(shù)據(jù)的至少一部 分,以確定所述處理后的文檔數(shù)據(jù)是否在第二組參數(shù)內(nèi)。如果所述處理后的 文檔數(shù)據(jù)不在第二組參數(shù)內(nèi),則第二采集控制器產(chǎn)生第二組處理器設(shè)置,所 述處理器使用該第二組處理器設(shè)置重新處理所述文檔數(shù)據(jù)。在一個實施例中, 一種文檔處理方法包括在計算機(jī)可訪問存儲介質(zhì)上存 儲來自 一個數(shù)據(jù)采集裝置的文檔數(shù)據(jù),以及使用 一個第一分析引擎分析所述 文檔數(shù)據(jù)的至少一部分,以確定所述文檔數(shù)據(jù)是否在第一組參數(shù)內(nèi)。如果所 述文檔數(shù)據(jù)不在第 一組參數(shù)內(nèi),則該方法進(jìn)一步包括使用該第 一分析《I擎產(chǎn) 生第一組處理器設(shè)置,使用所述第一組處理器設(shè)置處理所述文檔數(shù)據(jù),以及 使用一個第二分析引擎分析處理后的文檔數(shù)據(jù)的至少一個部分,以確定所述 處理后的文檔數(shù)據(jù)是否在第二組參數(shù)內(nèi)。如果所述處理后的文檔數(shù)據(jù)不在第 二組參數(shù)內(nèi),則該方法進(jìn)一步包括使用所述第二分析引擎產(chǎn)生第二組處理器 設(shè)置以重新處理所述文檔數(shù)據(jù)。在另一個實施例中, 一個文檔處理系統(tǒng)包括一個存儲裝置,用于存儲來 自 一個數(shù)據(jù)采集裝置的文檔數(shù)據(jù), 一個與該文檔數(shù)據(jù)通信的第一分析裝置, 用于分析所述文檔數(shù)據(jù)的至少一部分,以確定該文檔數(shù)據(jù)是否在第一組參數(shù) 內(nèi),以及如果否,則該第一分析裝置產(chǎn)生第一組處理器設(shè)置。該文檔處理系 統(tǒng)還包括一個與該第一分析裝置通信的處理裝置,用于使用所述第一組處理 器設(shè)置處理所述文檔數(shù)據(jù), 一個與該處理裝置通信的第二分析裝置,用于分 析處理后的文檔數(shù)據(jù)的至少 一部分,以確定所述處理后的文檔數(shù)據(jù)是否在第 二組參數(shù)內(nèi),以及如果否,則該第二分析裝置產(chǎn)生第二組處理器參數(shù),該處 理裝置使用該第二組處理器參數(shù)重新處理該文檔數(shù)據(jù)。在另一個實施例中, 一個文檔處理系統(tǒng)包括一個隨機(jī)訪問緩存,其接收 來自掃描儀的文檔,其中該文檔在該隨機(jī)訪問緩存內(nèi)存儲為多個帶并且以可 隨機(jī)訪問的形式存儲。該文檔處理系統(tǒng)還包括一個與該隨機(jī)訪問緩存通信的
處理器,其中該處理器配置成從該隨機(jī)訪問緩存獲取文檔,該處理器具有處 理器控制設(shè)置,用于處理所述文檔,以及一個與該處理器互連的采集控制器。 該采集控制器配置成分析處理后的文檔,以確定何時對所述文檔內(nèi)的至少一 個帶使用不同的處理器控制設(shè)置以及在什么位置隨機(jī)地訪問存儲在所述隨機(jī) 訪問緩存中的至少一個帶,以使用所述不同的處理器控制設(shè)置重新處理該帶。在另 一個實施例中, 一種文檔處理方法包括將來自掃描儀的文檔在一個 隨機(jī)訪問緩存中存儲為多個帶并以可隨機(jī)訪問的方式存儲,從該隨機(jī)訪問緩 存中獲得所述文檔,以及使用處理器控制設(shè)置處理所述文檔。該方法還包括 使用 一個分析? 1擎分析所述處理后的文檔以確定何時對該文檔內(nèi)的至少 一個 帶使用不同的處理器控制設(shè)置,以及隨機(jī)地訪問存儲在所述隨機(jī)訪問緩存中 的至少一個帶以使用所述不同的處理器控制設(shè)置重新處理該帶。在一個實施例中, 一個文檔處理系統(tǒng)包括一個存儲裝置,用于將從掃描 儀接收的文檔在該存儲裝置內(nèi)存儲為多個帶并以可隨機(jī)訪問的方式存儲,以 及一個處理裝置,用于從該存儲裝置獲取所述文檔,并以與所述處理裝置相 關(guān)的處理器控制設(shè)置來處理所述文檔。該文檔處理系統(tǒng)還包括一個分析裝置, 用來分析該處理后的文檔以確定何時對所述文檔內(nèi)的至少一個帶使用不同的 處理器控制設(shè)置,以及一個訪問裝置,用于隨機(jī)地訪問存儲在該隨機(jī)訪問緩 存中的至少一個帶以使用所述不同的處理器控制設(shè)置重新處理該帶。為了概述本發(fā)明,描述了本發(fā)明的特定的方面,優(yōu)點和新穎的特征???以理解的是并不是所有的這些優(yōu)點都必需在任何一個本發(fā)明的特定實施例中 實現(xiàn)。因此,本發(fā)明可以表達(dá)或?qū)嵤閷崿F(xiàn)或最優(yōu)化此處所教導(dǎo)的一個優(yōu)點 或者一組優(yōu)點,而不必實現(xiàn)所教導(dǎo)或暗示的其它優(yōu)點。


參考附圖,實現(xiàn)本發(fā)明的各種特征的一個常規(guī)架構(gòu)將被描述。這些附圖 和相關(guān)的描述用來說明本發(fā)明的實施例而不是限制本發(fā)明的范圍。所有附圖 中,重復(fù)使用標(biāo)號以表明與標(biāo)示部件之間的對應(yīng)。另外,每個標(biāo)號的第一個 數(shù)字表明該部件第 一次出現(xiàn)在的附圖編號。圖1是數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施例的框圖。圖2是遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施例的框圖。
圖3是一個具有分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施例的框圖。圖4是一個具有分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的硬件執(zhí)行的實施例的框圖。圖5是遠(yuǎn)程部署的具有分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施例的框圖。圖6是遠(yuǎn)程部署的具有分析引擎的數(shù)據(jù)釆集和二次掃描系統(tǒng)的硬件執(zhí)行 的實施例的框圖。圖7是具有第一和第二分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施 例的框圖。圖8是具有第一和第二分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的硬件執(zhí)行 的實施例的框圖。圖9是遠(yuǎn)程部署的具有第一和第二分析引擎的數(shù)據(jù)采集和二次掃描系統(tǒng)的一個實施例的框圖。圖10是遠(yuǎn)程部署的具有第一和第二分析引擎的數(shù)據(jù)采集和二次掃描系 統(tǒng)的硬件執(zhí)行的實施例的框圖。圖11是包括多個采集裝置和多個用戶的數(shù)據(jù)采集和二次掃描系統(tǒng)的一 個實施例的框圖。
具體實施方式
圖1是數(shù)據(jù)采集和二次掃描系統(tǒng)150的一個實施例的框圖。該數(shù)據(jù)采集 和二次掃描系統(tǒng)150包括一個數(shù)據(jù)采集裝置100,其包括一個數(shù)據(jù)捕獲裝置 101, 一個標(biāo)準(zhǔn)化處理器102和一個通信裝置103。數(shù)據(jù)捕獲裝置101的例子 包括,但不限于,掃描器、照相機(jī)、錄像機(jī)、紅外照相機(jī)、聲學(xué)照相機(jī)、數(shù) 碼照相機(jī)、傳真機(jī)、任何能夠捕獲圖像的裝置、聲音傳感器、任何具有聲音 傳感器的裝置等等。數(shù)據(jù)捕獲裝置101可以為非實時裝置,例如掃描儀,或 者數(shù)據(jù)采集裝置101為實時裝置,例如照相機(jī)和錄像機(jī)。該數(shù)據(jù)釆集和二次掃描系統(tǒng)150還包括一個用戶系統(tǒng)110,其包括一個 與所述通信裝置103通信的通信裝置104, 一個隨枳/沐問凄t據(jù)緩存105, —個 數(shù)據(jù)處理器106, 一個用戶接口 107,以及一個數(shù)據(jù)顯示器108。在一個實施 例中,該隨機(jī)訪問數(shù)據(jù)緩存將數(shù)據(jù)存儲在至少一個分段、區(qū)段、帶、圖像條、 數(shù)據(jù)條等等,并且是以可隨機(jī)訪問的方式。該數(shù)據(jù)采集和二次掃描系統(tǒng)150還包括一個應(yīng)用/存儲裝置109。該應(yīng)用 /存儲裝置109的例子包括,但不限于,計算機(jī)處理器,程序邏輯,控制電路, 通用單芯片或多芯片微處理器,數(shù)字信號處理器,嵌入式微處理器,微控制 器等等。數(shù)據(jù)存儲器的例子包括易失性存儲器和非易失性存儲器,硬盤驅(qū)動 器,DVD存儲器,CD ROM存儲器,光學(xué)和磁光存儲器,可移動或者非可移動 快速存儲裝置,或其它存儲裝置。模擬數(shù)據(jù)呈現(xiàn)在采集裝置100。模擬捕獲裝置1G1測量該模擬數(shù)據(jù)。標(biāo) 準(zhǔn)化處理器102將測量的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的數(shù)據(jù)。其校正和補(bǔ)償已知的由 傳感器測量模擬數(shù)據(jù)而51入的錯誤和偏差,以產(chǎn)生標(biāo)準(zhǔn)化數(shù)據(jù)。該標(biāo)準(zhǔn)化的原始數(shù)據(jù),以后稱為原始數(shù)據(jù),經(jīng)過一個使用通信裝置103 和104的快速連接被傳輸?shù)接脩粝到y(tǒng)110,并且存儲在該隨機(jī)訪問數(shù)據(jù)緩存 105中。該原始凄t據(jù)以帶、圖^象條、數(shù)據(jù)條等存儲在該隨機(jī)訪問緩存105中。 在一個實施例中,該隨機(jī)訪問數(shù)據(jù)緩存分成65K字節(jié)的帶。除了該原始數(shù)據(jù),該原始數(shù)據(jù)的附屬數(shù)據(jù),或每個帶的元數(shù)據(jù),也被存 儲在該緩存105中。這些元數(shù)據(jù)包括,但不限于,標(biāo)識該數(shù)據(jù)和在緩存中位 置的標(biāo)記,采集的時間和日期標(biāo)記,序列號,數(shù)據(jù)帶的起點,數(shù)據(jù)帶的終點, 高度,寬度,指向下一個帶的指針,等等。在一些實施例中,標(biāo)記標(biāo)識原始 數(shù)據(jù)的分段或區(qū)段。該數(shù)據(jù)處理器106使用默認(rèn)數(shù)據(jù)處理設(shè)置處理該原始數(shù)據(jù)。利用該數(shù)據(jù)處理器106處理該原始數(shù)據(jù)的順序自動地確定或者交互式地 確定。在一個自動的實施例中,最先存儲于緩存105中的當(dāng)前或較當(dāng)前的數(shù) 據(jù)被處理。在一個交互式的實施例中,用戶使用數(shù)據(jù)標(biāo)記或元數(shù)據(jù)識別特定的原始 數(shù)據(jù)帶或分段進(jìn)行處理。這些帶在緩存105中是可以隨機(jī)訪問的。這允許非 實時的虛擬二次采集。處理后的數(shù)據(jù)連同它們的元數(shù)據(jù)一起顯示在數(shù)據(jù)顯示器108上。該默認(rèn) 數(shù)據(jù)處理設(shè)置可通過用戶接口 107調(diào)整。設(shè)置的改變引起該數(shù)據(jù)處理器106 使用改變的設(shè)置重新處理所選取的存儲在隨機(jī)訪問緩存105中的數(shù)據(jù),并且 在數(shù)據(jù)顯示器1G8上顯示重新處理后的數(shù)據(jù)。通過交互式地重新調(diào)整處理設(shè) 置,這些數(shù)據(jù)會一直被處理直到滿足用戶的喜好。除了控制數(shù)據(jù)處理器106,用戶接口 107還控制隨機(jī)訪問數(shù)據(jù)緩存105。 通過該用戶接口 107,用戶可以訪問原始數(shù)據(jù)的分段,區(qū)段,帶,圖像條, 或數(shù)據(jù)條,以及為非實時交互式處理選取特定的原始數(shù)據(jù)。用戶可以將處理后的數(shù)據(jù)傳輸?shù)綉?yīng)用/儲存裝置109,以進(jìn)一步處理和存儲。圖1所描述的數(shù)據(jù)采集和二次掃描系統(tǒng)150支持多用戶使用。該數(shù)據(jù)采 集裝置100可被多個用戶訪問。在一個實施例中,該用戶系統(tǒng)110還包括一 個計算機(jī)(未示)。在一個實施例中,該用戶系統(tǒng)100 (至少一部分)在計算 機(jī)上由軟件執(zhí)行。圖2為遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)250的一個實施例的框圖。 該數(shù)據(jù)采集和二次掃描系統(tǒng)250包括凄t據(jù)采集裝置100, —個存儲和處理系 統(tǒng)212, 一個用戶系統(tǒng)210,以及采集/存儲裝置109。該存儲和處理系統(tǒng)212包括通信裝置103,隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù) 處理器106,和一個通信裝置203。該用戶系統(tǒng)210包括一個通信裝置204,用戶接口 107和數(shù)據(jù)顯示器108。來自采集裝置100的原始數(shù)據(jù)通過一個使用通信裝置103和104的快速 連接而被傳輸?shù)酱鎯吞幚硐到y(tǒng)212。該原始數(shù)據(jù)和元數(shù)據(jù)存儲在該隨機(jī)訪 問數(shù)據(jù)緩存105中。該數(shù)據(jù)處理器106使用默認(rèn)數(shù)據(jù)處理器設(shè)置處理該原始 數(shù)據(jù)。用戶系統(tǒng)210通過一個使用通信裝置203和204的通信媒介216與存儲 和處理系統(tǒng)212通信?,F(xiàn)在來關(guān)注通信媒介216,如圖2所示,在一個實施例中,該通信媒介為互聯(lián)網(wǎng)---個計算機(jī)全球網(wǎng)絡(luò)。在另一個實施例中,通信媒介216可以是任何通信系統(tǒng),包括,舉例來說,專用通信線路,電話網(wǎng)絡(luò),無線數(shù)據(jù)傳 輸系統(tǒng),紅外數(shù)據(jù)傳輸系統(tǒng),雙向電纜系統(tǒng),用戶化計算機(jī)網(wǎng)絡(luò),交互式公 用網(wǎng)絡(luò),等等。處理后的數(shù)據(jù)與它們的元數(shù)據(jù)一起顯示在該數(shù)據(jù)顯示器108上??梢酝?過該用戶接口 107調(diào)整該默認(rèn)數(shù)據(jù)處理器設(shè)置。改變該設(shè)置會引起該數(shù)據(jù)處
理器106使用改變的設(shè)置重新處理所選取的存儲在該隨機(jī)訪問數(shù)據(jù)緩存105 中的原始數(shù)據(jù)。通過交互式地重新調(diào)整處理器設(shè)置,該數(shù)據(jù)被一直處理直到 滿足用戶的偏好。用戶可以將處理后的數(shù)據(jù)傳輸?shù)皆搼?yīng)用/存儲裝置109,以進(jìn)一步處理和存儲。數(shù)據(jù)采集和二次掃描系統(tǒng)25G與數(shù)據(jù)采集和二次掃描系統(tǒng)150類似,只 是用戶系統(tǒng)210相對于數(shù)據(jù)采集裝置100以及存儲和處理系統(tǒng)212是遠(yuǎn)程部 署。在遠(yuǎn)程使用的系統(tǒng)250中,數(shù)據(jù)緩存105與數(shù)據(jù)采集裝置IOO位于同地。 用戶系統(tǒng)210不必使用一個快速連接與數(shù)據(jù)采集裝置100連接以便確保該實 施例的有效使用。該數(shù)據(jù)采集和二次掃描系統(tǒng)250 (至少一部分)由軟件、 固件、或者軟件和固件的任意組合執(zhí)行。圖3是數(shù)據(jù)采集和二次掃描系統(tǒng)350的一個實施例的框圖,包括一個分 析引擎。該數(shù)據(jù)采集和二次掃描系統(tǒng)350包括數(shù)據(jù)采集裝置100, 一個用戶 系統(tǒng)310,和應(yīng)用/存儲裝置109。該用戶系統(tǒng)310包括通信裝置104,隨機(jī) 訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106,用戶接口 107,數(shù)據(jù)顯示器108,和一 個分析引擎314。模擬數(shù)據(jù)呈現(xiàn)在采集裝置1QQ。模擬采集裝置1Q1測量該模擬數(shù)據(jù)。該 標(biāo)準(zhǔn)化處理器102將測量得到的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的原始數(shù)據(jù)。該原始數(shù)據(jù) 通過使用通信裝置103和104的一個快速連接傳輸給用戶系統(tǒng)310。在用戶 系統(tǒng)310,原始數(shù)據(jù)存儲在隨機(jī)訪問數(shù)據(jù)緩存105中。選取的原始數(shù)據(jù)通過分析引擎314進(jìn)行分析。在一個實施例中,該分析 引擎314是一個采集控制器314。選取機(jī)制可以是如前面的實施例所描述的 自動的或者交互式的。由該分析引擎314所執(zhí)行的分析為所選的原始數(shù)據(jù)的 產(chǎn)生新的數(shù)據(jù)處理器設(shè)置。分析的例子包括,但不限于,頁面分界檢測,條 紋檢測,頁面邊界檢測,空白頁檢測,將RGB色彩表示法轉(zhuǎn)換為YCbCr色彩 表示法,色調(diào)測量,飽和度測量,亮度測量,產(chǎn)生灰度色標(biāo)強(qiáng)度柱狀圖,產(chǎn) 生色彩柱狀圖,幾何分析,色彩檢測,亮度和色彩等級的伽馬檢測,以及文 本定向等等。這些設(shè)置被傳送到數(shù)據(jù)處理器106,然后原始數(shù)據(jù)以這些新的設(shè)置被處 理。處理后的數(shù)據(jù)顯示在該數(shù)據(jù)顯示器108上。數(shù)據(jù)處理器設(shè)置可以使用用
戶接口 107交互式地調(diào)整。除了確定數(shù)據(jù)處理器設(shè)置,分析引擎314還自動 檢測那些有可能導(dǎo)致低質(zhì)量處理數(shù)據(jù)的原始數(shù)據(jù)并且在用戶通過用戶系統(tǒng) 310選取這些數(shù)據(jù)時給予警告。用戶可通過用戶接口 107訪問相應(yīng)的俘獲條 件(例如,用戶定義的參數(shù)指定質(zhì)量門檻,如亮度范圍,對比度反問,缺角, 空白頁等等)。用戶通過該用戶接口 107可以控制獲取數(shù)據(jù)的質(zhì)量。用戶系統(tǒng)310可將處理后的數(shù)據(jù)傳輸?shù)綉?yīng)用/存儲裝置109,以進(jìn)一步處 理和存儲。另外,用戶可以通過用戶接口 107訪問存儲在該隨機(jī)訪問數(shù)據(jù)緩 存105中、需要由數(shù)據(jù)處理器106處理的原始數(shù)據(jù)的分段或區(qū)段。數(shù)據(jù)采集和二次掃描系統(tǒng)350允許對特定的原始數(shù)據(jù)進(jìn)行非實時交互式 處理。數(shù)據(jù)采集和二次掃描系統(tǒng)350也支持多用戶使用。數(shù)據(jù)采集裝置100 可以被多個用戶系統(tǒng)310訪問,每一個數(shù)據(jù)處理器106都具有唯一的處理器 設(shè)置。在一個實施例中,數(shù)據(jù)采集和二次掃描系統(tǒng)350還包括一個計算機(jī)(未 示)。在一個實施例中,該數(shù)據(jù)采集和二次掃描系統(tǒng)350 (至少一部分)被計 算機(jī)上的軟件執(zhí)行。圖4為數(shù)據(jù)采集和二次掃描系統(tǒng)450的一個實施例的框圖,包括數(shù)據(jù)采 集裝置IOO, 一個用戶系統(tǒng)410,以及分析引擎314。該數(shù)據(jù)采集和二次掃描 系統(tǒng)450以硬件執(zhí)行圖3所示的數(shù)據(jù)采集和二次掃描系統(tǒng)350。隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106和分析引擎314在數(shù)據(jù)釆集裝 置1GG上執(zhí)行。該數(shù)據(jù)采集裝置10Q還包括一個數(shù)據(jù)捕獲裝置101,標(biāo)準(zhǔn)化 處理器102,和通信裝置103。用戶系統(tǒng)包括通信裝置104,用戶接口 107, 和數(shù)據(jù)顯示器108。圖5是遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)550的一個實施例的框圖, 包括分析引擎314。該數(shù)據(jù)采集和二次掃描系統(tǒng)550包括數(shù)據(jù)采集裝置100, 一個存儲和處理系統(tǒng)512, 一個用戶系統(tǒng)510,以及采集/存儲裝置109。該存儲和處理系統(tǒng)512包括通信裝置104,隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù) 處理器106,分析引擎314,和一個通信裝置503。用戶系統(tǒng)510包括一個通信裝置504,用戶接口 107和數(shù)據(jù)顯示器108。來自采集裝置100的原始數(shù)據(jù)通過使用通信裝置103和104的一個快速 連接被傳送到存儲和處理系統(tǒng)512。原始數(shù)據(jù)和元數(shù)據(jù)被存儲于該緩存105 中。數(shù)據(jù)處理器106使用默認(rèn)數(shù)據(jù)處理器設(shè)置處理該原始數(shù)據(jù)。 所選取的原始數(shù)據(jù)通過分析引擎314被分析。該分析引擎314所執(zhí)行的 分析為選取的原始數(shù)據(jù)產(chǎn)生新的數(shù)據(jù)處理設(shè)置。這些設(shè)置被傳送到該數(shù)據(jù)處 理器106,然后原始數(shù)據(jù)使用這些新的設(shè)置被處理。用戶系統(tǒng)510通過使用通信裝置503和504的通信i某介216與存儲和處 理系統(tǒng)512通信。處理后的數(shù)據(jù)顯示在數(shù)據(jù)顯示器108上??梢允褂糜脩艚?口 107交互式地調(diào)整該數(shù)據(jù)處理器設(shè)置。通過用戶系統(tǒng)510,用戶可以將處理后的數(shù)據(jù)傳送到應(yīng)用/存儲裝置109, 以進(jìn)一步處理和存儲。另外,用戶可以通過該用戶接口 107訪問存儲在隨機(jī) 訪問數(shù)據(jù)緩存中、需要由該數(shù)據(jù)處理器106處理的原始數(shù)據(jù)的分段或區(qū)段。數(shù)據(jù)采集和二次掃描系統(tǒng)550允許非實時交互式處理特定的原始數(shù)據(jù)。 該數(shù)據(jù)采集和二次掃描系統(tǒng)550類似于數(shù)據(jù)采集和二次掃描系統(tǒng)350,只是 該用戶系統(tǒng)510位于數(shù)據(jù)采集裝置100以及存儲和處理系統(tǒng)512的遠(yuǎn)程。在 該遠(yuǎn)程部署的系統(tǒng)550中,數(shù)據(jù)緩存105和分析引擎314位于該數(shù)據(jù)采集裝 置100的本地。該數(shù)據(jù)采集和二次掃描系統(tǒng)550也支持多用戶使用。該數(shù)據(jù)釆集裝置100 可以被多個用戶系統(tǒng)510訪問,每一個數(shù)據(jù)處理器106都具有唯一的處理器 設(shè)置。該數(shù)據(jù)采集和二次掃描系統(tǒng)550 (至少一部分)由軟件、固件、或者 軟件和固件的組合執(zhí)行。圖6是遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)650的硬件執(zhí)行實施例的框 圖,包括分析引擎314。該數(shù)據(jù)采集和二次掃描系統(tǒng)650以遠(yuǎn)程部署執(zhí)行圖4 所示的凄t據(jù)采集和二次掃描系統(tǒng)450。該數(shù)據(jù)采集和二次掃描系統(tǒng)650包括 數(shù)據(jù)采集裝置IOO, —個用戶系統(tǒng)610,以及應(yīng)用/存儲裝置109。隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106和分析引擎314直接在該數(shù)據(jù) 采集裝置100以硬件執(zhí)行。該數(shù)據(jù)采集裝置100還包括數(shù)據(jù)捕獲裝置101, 標(biāo)準(zhǔn)化處理器,和通信裝置103。該用戶系統(tǒng)610包括用戶接口 107,數(shù)據(jù)顯 示器108,和一個通信裝置604。該用戶系統(tǒng)610通過使用通信裝置103和604的通信i某介216與該數(shù)據(jù) 采集裝置1G0通信。圖7是數(shù)據(jù)采集和二次掃描系統(tǒng)750的一個實施例的框圖,具有一個第 一分析引擎714和一個第二分析引擎718。該數(shù)據(jù)采集和二次掃描系統(tǒng)750 包括數(shù)據(jù)采集裝置100和一個用戶系統(tǒng)710。該凝:據(jù)采集裝置100包括數(shù)據(jù) 捕獲裝置101,標(biāo)準(zhǔn)化處理器102,和通信裝置103。該用戶系統(tǒng)710包括通 信裝置104,隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106,用戶接口 107,和數(shù) 據(jù)顯示器108。該用戶系統(tǒng)710還包括第一分析引擎714和第二分析引擎718。 在一個實施例中,該第一和第二分析引擎714、 718分別為第一和第二采集控 制器714、 718。模擬數(shù)據(jù)呈現(xiàn)在采集裝置1GG。數(shù)據(jù)捕獲裝置101測量該模擬數(shù)據(jù)。標(biāo) 準(zhǔn)化處理器102將測量得到的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的原始數(shù)據(jù)。該原始數(shù)據(jù)通 過使用通信裝置103和104的一個快速連接被傳遞到該用戶系統(tǒng)710。在用戶系統(tǒng)710,該原始數(shù)據(jù)被存儲在緩存105中。該原始數(shù)據(jù)以帶、 圖像條、數(shù)據(jù)條等存儲在隨機(jī)訪問數(shù)據(jù)緩存105中。在一個實施例中,該隨 機(jī)訪問數(shù)據(jù)緩存分為64K字節(jié)的帶。除了該原始數(shù)據(jù),該原始數(shù)據(jù)的附屬數(shù)據(jù),或每個帶的元數(shù)據(jù),也存儲 在緩存105中。這些元數(shù)據(jù)包括但不限于,標(biāo)識該數(shù)據(jù)和在緩存中位置的標(biāo) 記,采集的時間和日期標(biāo)記,序列號,數(shù)據(jù)帶的起點,數(shù)據(jù)帶的終點,高度, 寬度,指向下一個帶的指針,等等。在一些實施例中,所述標(biāo)記標(biāo)識原始數(shù) 據(jù)的分段或區(qū)段。選取的原始數(shù)據(jù)由所述第一分析引擎714進(jìn)行分析。選取機(jī)制可以是如 前面的實施例所述的自動的或者交互式的。由該第一分析引擎714執(zhí)行的分 析為選取的原始數(shù)據(jù)的產(chǎn)生改進(jìn)的或接近最佳的數(shù)據(jù)處理器設(shè)置。在一個實 施例中,該第一分析引擎714執(zhí)行幾何處理,例如,文檔定位,背景補(bǔ)償, 色彩補(bǔ)償,文本提取,文本/背景分離,頁面分界檢測,條紋檢測,頁面邊界 檢測,空白頁檢測,由RGB色彩表示法向YCbCr色彩表示法的轉(zhuǎn)換,色調(diào)測 量,飽和度測量,亮度測量,產(chǎn)生灰度色標(biāo)強(qiáng)度柱狀圖,產(chǎn)生色彩柱狀圖, 色彩檢測,亮度和色彩等級的伽馬檢測,等等。這些設(shè)置被傳送給數(shù)據(jù)處理器106,然后使用這些設(shè)置處理該原始數(shù)據(jù)。 處理后的數(shù)據(jù)被傳送至該第二分析引擎718。在一個實施例中,處理器 106傳送該處理后的數(shù)據(jù)至該第二分析引擎718以進(jìn)行分析。在另一個實施 例中,處理器106傳送該處理后的數(shù)據(jù)至該第一分析引擎714,然后該第一 分析引擎714傳送該處理后的數(shù)據(jù)至該第二分析引擎718以進(jìn)行分析。
在該第二分析引擎718,該處理后的數(shù)據(jù)被分析,然后改進(jìn)的數(shù)據(jù)處理 器設(shè)置被確定。該第二分析引擎718將該處理后的數(shù)據(jù)與一個預(yù)定的標(biāo)準(zhǔn)進(jìn) 行對比。根據(jù)由該標(biāo)準(zhǔn)確定的處理后數(shù)據(jù)的質(zhì)量,該第二分析引擎718選取 新的處理器設(shè)置。在一個實施例中,該第二分析引擎執(zhí)行特征或質(zhì)量處理,例如,識別低 光學(xué)特性識別區(qū)域,非線性伽馬,高背景噪聲,特征色彩失真等等。在一個 實施例中,該第二分析引擎(至少一部分)替代在數(shù)據(jù)顯示器108上的用戶 數(shù)據(jù)復(fù)查以及通過該用戶接口 107的用戶校正處理器設(shè)置。這些新的設(shè)置傳遞至數(shù)據(jù)處理器106,然后這些原始數(shù)據(jù)以這些新的設(shè) 置被重新處理。在一個實施例中,該第二分析引擎718將包含該原始數(shù)據(jù)在 該隨機(jī)訪問緩存105中位置的元數(shù)據(jù)和該新的處理器設(shè)置發(fā)送至處理器106。 該處理器106使用該新的設(shè)置處理該數(shù)據(jù)。在另一個實施例中,該第二分析引擎718將與該數(shù)據(jù)有關(guān)的元數(shù)據(jù)和新 的處理器設(shè)置發(fā)送至該第一分析引擎714。該第一分析引擎714接收包含該 原始數(shù)據(jù)在該隨機(jī)訪問緩存105中位置的元數(shù)據(jù)和該新的處理器設(shè)置,并將 包含該原始數(shù)據(jù)在該隨機(jī)訪問緩存105中位置的元數(shù)據(jù)和該新的處理器設(shè)置 發(fā)送至處理器106。該處理器使用新的處理器設(shè)置處理該原始數(shù)據(jù)。在又一個實施例中,該第二分析引擎718將與該數(shù)據(jù)有關(guān)的元數(shù)據(jù)發(fā)送 至該第一分析引擎714。該第一分析引擎714接收包含該原始數(shù)據(jù)在該隨機(jī) 訪問緩存105中位置的元數(shù)據(jù)和該新的處理器設(shè)置,并使用這些新的處理器 設(shè)置處理該原始數(shù)據(jù)的帶。處理后的數(shù)據(jù)發(fā)送至該第二分析引擎718以進(jìn)行分析。在一個實施例中, 該處理器106發(fā)送該處理后的數(shù)據(jù)至該第二分析引擎718以進(jìn)行分析。在另 一個實施例中,該第一分析引擎714將該處理后的凄t據(jù)發(fā)送至該第二分析引 擎718以進(jìn)行分析。使用修正的數(shù)據(jù)處理器設(shè)置重新處理原始數(shù)據(jù)的步驟和分析處理后的數(shù) 據(jù)并確定修正的數(shù)據(jù)處理器設(shè)置的步驟不斷重復(fù)直到收斂,即,直到所述標(biāo) 準(zhǔn)檢測不到處理后數(shù)據(jù)在質(zhì)量方面的任何改進(jìn)。這產(chǎn)生改進(jìn)的或最佳的處理 器設(shè)置。
例如, 一個掃描儀以600點每英寸(dpi)的分辨率掃描一個文檔。該文 檔包括各種字體大小的正文。該原始數(shù)據(jù),連同與每個原始數(shù)據(jù)的帶相關(guān)的 元數(shù)據(jù)一起,以帶的形式存儲在該隨即訪問數(shù)據(jù)緩存105中。為了節(jié)省處理時間和用戶存儲空間,該第一分析引擎714發(fā)送該處理器 106的設(shè)置,以在200dpi的分辨率處理該凝:據(jù),例如,連同如上所述的其他 可能的幾何處理設(shè)置一起發(fā)送。該處理器106使用來自該第一分析引擎714的設(shè)置處理該原始數(shù)據(jù)。處 理后的數(shù)據(jù)和相關(guān)的元數(shù)據(jù)被傳送至該第二分析引擎718。該第二分析引擎718使用一個預(yù)定的標(biāo)準(zhǔn)分析該處理后的數(shù)據(jù)。例如, 該第二分析引擎718確定該處理后數(shù)據(jù)的一個帶不可識別,可能是因為該正 t的大小對于200dpi的分辨率來說太小而不能識別。該第二分析引擎718將 與該無法識別的數(shù)據(jù)的帶相關(guān)的元數(shù)據(jù)連同新的處理器設(shè)置發(fā)送至該處理器 106,以在400dpi的分辨率處理該數(shù)據(jù)。該處理器106接收包含該原始數(shù)據(jù)在該隨機(jī)訪問緩存105中位置的元數(shù) 據(jù)和該新的處理器設(shè)置,并以400dpi處理該原始數(shù)據(jù)的帶。該處理器106將 處理后的數(shù)據(jù)帶及其相關(guān)的元數(shù)據(jù)發(fā)送至該第二分析引擎718以進(jìn)行分析。該第二分析引擎718確定處理后的數(shù)據(jù)帶是否符合預(yù)定的標(biāo)準(zhǔn)。如果否, 該第二分析引擎718將與該帶相關(guān)的元數(shù)據(jù)連同新的處理器設(shè)置發(fā)送至處理 器106以處理該原始數(shù)據(jù)的帶。例如,該第二分析引擎718確定該帶中的文 本即使在400dpi的分辨率也無法識別,并將與該帶相關(guān)的元數(shù)據(jù)連同新的處 理器設(shè)置發(fā)送至該處理器106,以在600dpi的分辨率處理器原始數(shù)據(jù)的帶。分析數(shù)據(jù)和用新的處理器設(shè)置重新處理原始數(shù)據(jù)的過程一直持續(xù),直到 該第二分析引擎718確定處理后的數(shù)據(jù)符合預(yù)定的標(biāo)準(zhǔn)。處理該原始數(shù)據(jù)的 帶的部分的處理參數(shù)可以被改變而無需重新處理所有的原始數(shù)據(jù)。在一個實 施例中,重新處理部分捕獲的數(shù)據(jù)節(jié)省了處理時間和數(shù)據(jù)存儲空間。通過這些步驟獲得的處理后的數(shù)據(jù)顯示在該數(shù)據(jù)顯示器108上。該數(shù)據(jù)處理器設(shè)置可以使用該用戶接口 107交互式地調(diào)整。除了確定數(shù)據(jù)處理器的設(shè)置,該第一分析引擎714和第二分析引擎718 還自動檢測有可能導(dǎo)致低質(zhì)量處理數(shù)據(jù)的原始數(shù)據(jù)。如前所述,用戶可以通 過該用戶接口 107訪問相應(yīng)的俘獲條件,以使用戶能夠有效地控制所獲取的 數(shù)據(jù)的質(zhì)量。
另外,用戶可以通過該用戶接口 107訪問存儲在該隨機(jī)訪問數(shù)據(jù)緩存105 中的、需要處理器106處理的原始數(shù)據(jù)的分段或區(qū)段。該數(shù)據(jù)采集和二次掃描系統(tǒng)750也允許特定原始lt據(jù)的非實時交互式處 理。用戶可以發(fā)送處理后的數(shù)據(jù)到應(yīng)用/存儲裝置109,以進(jìn)一步處理和存儲。 該數(shù)據(jù)采集和二次掃描系統(tǒng)750支持多用戶使用。該采集裝置100可被多個 用戶系統(tǒng)750訪問,每個數(shù)據(jù)處理器都具有唯一的處理器設(shè)置。在一個實施 例中,該數(shù)據(jù)采集和二次掃描系統(tǒng)750還包括一個計算機(jī)(未示)。在一個實 施例中,該數(shù)據(jù)采集和二次掃描系統(tǒng)750 (至少一部分)由該計算機(jī)上的軟 件執(zhí)行。圖8是婆:據(jù)采集和二次掃描系統(tǒng)850的一個實施例的框圖,包括第一分 析引擎714和第二分析引擎718。該數(shù)據(jù)采集和二次掃描系統(tǒng)"0以硬件執(zhí) 行圖7所示的數(shù)據(jù)采集和二次掃描系統(tǒng)750。該數(shù)據(jù)采集和二次掃描系統(tǒng)850包括數(shù)據(jù)采集裝置100, 一個用戶系統(tǒng) 810,和應(yīng)用/存儲裝置109。該隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106,第 一分析引擎714和第二分析引擎718在數(shù)據(jù)采集裝置IOO被執(zhí)行。該數(shù)據(jù)采 集裝置IOO還包括數(shù)據(jù)采集裝置101,標(biāo)準(zhǔn)化處理器102,和通信裝置103。 該用戶系統(tǒng)810包括通信裝置104,用戶接口 107和數(shù)據(jù)顯示器108。圖9是遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)950的一個實施例的框圖, 包括第一分析引擎714和第二分析引擎718。該數(shù)據(jù)采集和二次掃描系統(tǒng)"0 包括數(shù)據(jù)采集裝置IOO, —個存儲和處理系統(tǒng)912, 一個用戶系統(tǒng)910,以及 采集/存儲裝置109。該數(shù)據(jù)采集裝置包括數(shù)據(jù)捕獲裝置101,標(biāo)準(zhǔn)化處理器,和通信裝置103。該存儲和處理系統(tǒng)912包括通信裝置104,隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù) 處理器106,第一分析引擎714,第二分析引擎718,以及一個通信裝置903。該用戶系統(tǒng)910包括一個通信裝置904,用戶接口 107,以及數(shù)據(jù)顯示器108。來自該采集裝置100的原始凄t據(jù)通過使用通信裝置103和104的一個快 速連接被傳遞至該存儲和處理系統(tǒng)912。該原始數(shù)據(jù)和元數(shù)據(jù)存儲在該緩存 105。數(shù)據(jù)處理器106使用默認(rèn)數(shù)據(jù)處理器設(shè)置處理該原始數(shù)據(jù)。 在數(shù)據(jù)存儲和處理系統(tǒng)912,原始數(shù)據(jù)被存儲于該數(shù)據(jù)緩存105中。選 取的數(shù)據(jù)由該第一分析引擎714分析。該選取機(jī)制可以是前述實施例中所描 述的自動的或者交互式的。由該第一分析引擎714執(zhí)行的分析產(chǎn)生給定的選 取數(shù)據(jù)的改進(jìn)的或者接近最佳的數(shù)據(jù)處理器設(shè)置。這些設(shè)置被傳送到數(shù)據(jù)處 理器106,然后原始數(shù)據(jù)使用這些給定的設(shè)置被處理。處理后的數(shù)據(jù)被傳送至該第二分析引擎718。在第二分析引擎718,分析 該處理后的數(shù)據(jù),然后改進(jìn)的數(shù)據(jù)處理器設(shè)置被確定。該第二分析引擎718 使用一個標(biāo)準(zhǔn)確定處理后的數(shù)據(jù)的質(zhì)量。根據(jù)由該標(biāo)準(zhǔn)確定的處理后數(shù)據(jù)的 質(zhì)量,第二分析引擎718選擇新的處理器設(shè)置。這些改進(jìn)的設(shè)置被傳送該數(shù) 據(jù)處理器106,然后原始數(shù)據(jù)被重新處理。使用修正的數(shù)據(jù)處理器設(shè)置重新的步驟不斷重復(fù)直到收斂,即,直到該標(biāo)準(zhǔn)不能^^測到處理后數(shù)據(jù)在質(zhì)量上 的任何改進(jìn),如前所述。這產(chǎn)生了改進(jìn)或最佳的處理器設(shè)置。該用戶系統(tǒng)910通過一個使用通信裝置903和904的通信媒介216與該 存儲和處理系統(tǒng)912通信。該處理后的數(shù)據(jù)顯示在數(shù)據(jù)顯示器108上。該數(shù) 據(jù)處理器設(shè)置可以使用該用戶接口 107交互式地調(diào)整。通過該用戶系統(tǒng)910,用戶可以將該處理后的數(shù)據(jù)傳送至該應(yīng)用/存儲 109,以進(jìn)一步處理和存儲。另外,用戶可以,通過該用戶接口 107,訪問存 儲在該隨機(jī)訪問數(shù)據(jù)緩存105中的、需要由數(shù)據(jù)處理器106處理的原始數(shù)據(jù) 的分段或區(qū)段。該數(shù)據(jù)采集和二次掃描系統(tǒng)950允許特定原始數(shù)據(jù)的非實時交互式處 理。該邀:據(jù)采集和二次掃描系統(tǒng)950與所述數(shù)據(jù)采集和二次掃描系統(tǒng)750類 似,只是用戶系統(tǒng)910位于該數(shù)據(jù)采集裝置100以及該存儲和處理系統(tǒng)912 的遠(yuǎn)程。在遠(yuǎn)程部署的系統(tǒng)950中,該數(shù)據(jù)緩存105,數(shù)據(jù)處理器106,第一 分析引擎714,和第二分析引擎718位于該數(shù)據(jù)采集裝置100的本地。該數(shù)據(jù)采集和二次掃描系統(tǒng)950也支持多用戶使用。該數(shù)據(jù)采集裝置100 可被多個用戶系統(tǒng)910訪問,每個數(shù)據(jù)處理器106都具有唯一的處理器設(shè)置。 該數(shù)據(jù)采集和二次掃描系統(tǒng)950 (至少一部分)由軟件、固件、或者軟件和 固件的組合來執(zhí)行。 圖IO是由硬件執(zhí)行的、遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)1050的實 施例的框圖,包括第一分析引擎714和第二分析引擎718。該數(shù)據(jù)采集和二 次掃描系統(tǒng)1050執(zhí)行圖8所示的、遠(yuǎn)程部署的數(shù)據(jù)采集和二次掃描系統(tǒng)850。 該數(shù)據(jù)釆集和二次掃描系統(tǒng)1050包括數(shù)據(jù)采集裝置100, —個用戶系統(tǒng)1010, 以及應(yīng)用/存儲裝置109。隨機(jī)訪問數(shù)據(jù)緩存105,數(shù)據(jù)處理器106,第一分析引擎714,和第二分 析引擎718在該采集裝置100由硬件執(zhí)行。該數(shù)據(jù)采集裝置100還包括數(shù)據(jù) 捕獲裝置IOI,標(biāo)準(zhǔn)化處理器1Q2,和通信裝置103。該用戶系統(tǒng)1010包括用戶接口 107,數(shù)據(jù)顯示器108,和一個通信裝置 1004。該用戶系統(tǒng)1010通過一個使用通信裝置103和1004的通信媒介216 與該數(shù)據(jù)采集裝置100通信。圖11為數(shù)據(jù)采集和二次掃描系統(tǒng)1150的一個實施例的框圖,包括多個 數(shù)據(jù)采集裝置IOO和多個用戶系統(tǒng)1110。所述多個用戶系統(tǒng)1110位于所述 多個數(shù)據(jù)采集裝置100的遠(yuǎn)程。該數(shù)據(jù)采集裝置1Q0包括數(shù)據(jù)捕獲裝置1G1,標(biāo)準(zhǔn)化處理器102,通信裝 置103,隨機(jī)訪問數(shù)據(jù)緩存105,以及數(shù)據(jù)處理器106。在一個實施例中,該 數(shù)據(jù)處理器106是低處理能力引擎。該用戶系統(tǒng)1110包括用戶接口 107,數(shù)據(jù)顯示器108, 一個通信裝置1104, 和一個分析引擎1114。在一個實施例中,該分析引擎1114是高性能分析處 理器。模擬數(shù)據(jù)呈現(xiàn)在該釆集裝置100。該模擬數(shù)據(jù)捕獲裝置101測量該模擬 數(shù)據(jù)。該標(biāo)準(zhǔn)化處理器102將測量的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的原始數(shù)據(jù)。該數(shù)據(jù) 處理器106用于該數(shù)據(jù)的轉(zhuǎn)換。轉(zhuǎn)換后的數(shù)據(jù)存儲在該隨機(jī)訪問數(shù)據(jù)緩存105 中。數(shù)據(jù)處理的例子包括,但不限于,文檔定位,背景補(bǔ)償,色彩補(bǔ)償,文 本提取,文本/背景提取,起點,相關(guān)性,斑點去除,等等。在實時廣播推進(jìn)模式下或者應(yīng)至少一個用戶系統(tǒng)iiio的請求工作,選取 的緩存數(shù)據(jù)由數(shù)據(jù)處理器106測量和壓縮。該通信裝置105通過一個使用通 信裝置103的通信媒介216將所述測量和壓縮的數(shù)據(jù),以及相關(guān)的標(biāo)記或元 數(shù)據(jù)發(fā)送至該用戶系統(tǒng)1110。
在一個實施例中,該標(biāo)記數(shù)據(jù)包括該采集裝置的地址和該數(shù)據(jù)在該緩存 105中的位置。在一個實施例中,該元數(shù)據(jù)包括,但不限于,標(biāo)識該數(shù)據(jù)及 其在該緩存中位置的標(biāo)記,采集的時間和日期標(biāo)記,序列號,數(shù)據(jù)帶的起點, 數(shù)據(jù)帶的終點,高度,寬度,指向下一個帶的指針,等等。該標(biāo)記數(shù)據(jù)嵌入在該通信媒介216的通信網(wǎng)絡(luò)協(xié)議中。該用戶系統(tǒng)1110通過該通信媒介216和通信裝置1104接收數(shù)據(jù)。該數(shù) 據(jù)由分析引擎1114分析。如果該分析檢測到一些相關(guān)數(shù)據(jù)區(qū)域的檢測結(jié)果特 征是在用戶確定的邊界之外,該分析引擎1114通過發(fā)送與該數(shù)據(jù)相關(guān)的標(biāo)記 以及該數(shù)據(jù)范圍內(nèi)有關(guān)系的區(qū)域的位置而啟動該用戶接口 107。該用戶接口 107可以自動的或者手動才喿作。該用戶接口 107使用該標(biāo)記 內(nèi)容和區(qū)域位置向該相應(yīng)的數(shù)據(jù)采集裝置100請求帶有新的處理設(shè)置的一個 新的數(shù)據(jù)集。該數(shù)據(jù)處理器106使用該新的設(shè)置重新處理選取的數(shù)據(jù),然后 采集裝置100重新傳輸該重新處理后的數(shù)據(jù)至該用戶系統(tǒng)1110。這個虛擬的 二次掃描操作是一個交互式的過程,其使用不同的設(shè)置或窗口。在上述交互式處理的過程中,該多個采集裝置IOO持續(xù)向該多個用戶系 統(tǒng)1110實時傳送該數(shù)據(jù)。在一個實施例,該用戶,通過該數(shù)據(jù)顯示器108, 可以顯示任何收到的數(shù)據(jù)。在一個實施例,接收數(shù)據(jù)的任何部分可由該應(yīng)用/ 存儲裝置109存儲。在一個實施例中,該用戶系統(tǒng)1110可在該一個或多個與該選取的教:據(jù)相 關(guān)的數(shù)據(jù)采集裝置100的數(shù)據(jù)緩沖105鎖定選取的數(shù)據(jù)。當(dāng)該用戶系統(tǒng)1110 在需要的分辨率接收該選取的數(shù)據(jù)時,該用戶系統(tǒng)1110解鎖該數(shù)據(jù)。在一個 實施例中,該用戶系統(tǒng)1110具有一個授權(quán)級別以鎖定數(shù)據(jù)。在該數(shù)據(jù)緩存 105中的非鎖定數(shù)據(jù)以先入先出的方式被覆蓋。示范性實施例這部分的示范性實施例包括虛擬二次掃描流程,4企測定向方法,檢測滲 透方法,色彩檢測方法,背景平滑方法,和檢測掃描頁面分界的方法。示范性虛擬二次掃描(VRS)流程在一個實施例中,如果用戶選4奪使用VRC處理來掃描圖像,該VRS處理 初始化該掃描儀以獲取一個原始的(未處理的)主圖像。如果用戶選擇黑白 掃描,則該主圖像具有灰度色標(biāo),此外,該主圖像具有用戶指定的灰度色標(biāo) 或色彩。VRS處理還使用預(yù)先定義的掃描儀特異性設(shè)置初始化該掃描儀。這些設(shè) 置幫助該VRS處理提高其性能。例如,這些設(shè)置中的一個是執(zhí)行過掃描,即, 掃描超過要求的尺寸,這樣VRS可以執(zhí)行一個好的抗扭斜操作。掃描儀按照該特異性設(shè)置掃描一個圖像,然后該原始圖像從該掃描儀傳 輸至該VRS緩存。該VRS軟件執(zhí)行一個或多個圖像處理算法。在一個實施例中, 一個分析 引擎包括該VRS。 一個算法確定在掃描的原始圖像中的實際頁面邊界。在一 個實施例中,該掃描的圖像包含由于過掃描導(dǎo)致的掃描儀引入的背景。為多 個背景確定該頁面邊界,如黑色、白色、灰色、等等。類似條紋檢測的技術(shù) 被用于,例如,由臟的掃描儀鏡頭/燈、滾軸等引入的線紋。其他技術(shù),如頁 面邊界陰影檢測,被用來確定頁面的邊界。另 一個圖像處理算法確定掃描的頁面是否為空白。當(dāng)進(jìn)行雙面掃描時, 頁面可能包含從該頁面另 一側(cè)滲透過來的色彩。如果該算法確定該頁面沒有 內(nèi)容,該頁面可以根據(jù)用戶設(shè)置被刪除。另一個圖像處理算法將頁面內(nèi)容從RGB色彩表示法轉(zhuǎn)換為YCbCr (亮度, 色調(diào)和飽和度格式)。這允許在頁面的色調(diào)和飽和度方面的許多色彩相關(guān)操 作,因此,導(dǎo)致速度的改進(jìn)。如果該掃描儀以黑白方式掃描,這一步就不執(zhí) 行。另 一個圖形處理算法分析該圖像??赡艿姆治鍪菆?zhí)行亮度分析并且提取 該灰度色標(biāo)強(qiáng)度信息形成柱狀圖,提取色彩信息形成色彩柱狀徒,在頁面上 執(zhí)行幾何分析,等等。另 一個圖像處理算法基于前面的分析檢測文檔是否具有色彩。如果沒有 色彩內(nèi)容,該算法將該掃描儀設(shè)置設(shè)為指示該文檔是黑白文檔。如果文檔具 有背景色彩并且該背景色彩是占優(yōu)勢的色彩,該算法將該掃描儀設(shè)置設(shè)為指 示該文檔是彩色文檔。另外,如果該文檔包含色彩內(nèi)容,用戶可以調(diào)整該掃 描儀設(shè)置以重新產(chǎn)生色彩或不重新產(chǎn)生色彩,根據(jù)該彩色內(nèi)容是否與特定文 檔內(nèi)容有關(guān),或者是否是該文檔的主要特征,如在黃色紙上的文檔。
另一個圖像處理算法執(zhí)行在圖像上的伽馬校正以調(diào)整亮度和色彩等級。 一個進(jìn)一步的圖像處理算法基于前述的分析執(zhí)行在頁面圖像上的抗扭斜 和剪切。另一個圖像處理算法檢測圖像上的文本方向,并且如果需要,直角旋轉(zhuǎn) 該圖像。另一個圖像處理算法執(zhí)行其它操作,例如,條形碼檢測,線條過濾,斑 點去除,使用背書字串注釋,等等。一個進(jìn)一步的圖像處理算法通過檢測背景色彩并將它們?nèi)诤显谝黄饋韴?zhí)行背景平滑。如果該圖像有問題,不能自動地校正,該圖像處理軟件向用戶顯示處理 后的圖像和設(shè)置。用戶然后確定圖像的設(shè)置。當(dāng)用戶改變這些設(shè)置后,該圖 像處理軟件使用用戶指定的設(shè)置執(zhí)行一個或多個上面討論的圖像處理算法并 且向用戶顯示處理后的圖像。當(dāng)用戶接受該圖像,該圖像處理軟件使用由用 戶選擇的最終設(shè)置重新處理該原始圖像。在另 一個實施例中, 一個第二分析51擎執(zhí)行額外的分析以確定該處理后 的圖像是否符合預(yù)定的要求。如果該圖像不不符合預(yù)定的要求,該第二分析 引擎確定新的設(shè)置并使用該新的設(shè)置重新處理該原始圖像。這個過程不斷重 復(fù)直到該圖像符合該要求。當(dāng)該圖像處理完成時,該圖像處理軟件將該圖像發(fā)送給該應(yīng)用程序。示范性4金測方向在一個實施例中,該;險測方向算法自動檢測怎樣直角旋轉(zhuǎn)文本頁面以觀 看。該算法從該頁面內(nèi)的黑色相連成分中選擇可能的單獨的字符。該算法然 后通過使用訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)確定該單獨字符的方向。該算法4吏用該神經(jīng)網(wǎng) 絡(luò)的方向結(jié)果來確定更好的頁面方向。該算法在頁面圖像內(nèi)找到相連成分。由于這些成分中的部分可能包含圖 形元素,該算法使用許多約束條件以濾去該頁面圖像內(nèi)的非字符。這些約束 條件的例子是超過預(yù)定門檻的像素的數(shù)目;寬度和高度都足夠大;高度與 寬度的比沒有超過一個預(yù)定的門檻;相連成分中黑色像素的數(shù)目與它的邊界 框區(qū)域的比不是太大或者太?。贿@些成分的大小不接近該頁面的大??;以及
從白色轉(zhuǎn)換為黑色和在水平或垂直方向沿橫過該字符的一條線轉(zhuǎn)回的數(shù)目不 太大。通過這個測試的一些部分可能包含粘合的字符,破碎字符的碎片,等等。 在一個實施例中,假設(shè)合理的圖形質(zhì)量,具有統(tǒng)計學(xué)意義的多數(shù)包含單獨的 字符。該算法按比例地縮放每一個組分以適合一個20 x 20像素的灰度色標(biāo)正 方形。該算法然后在灰度色標(biāo)正方形的周圍增加2個像素白色空白,并將所 得到的24 x 24的圖像發(fā)送至一個訓(xùn)練過的前饋神經(jīng)網(wǎng)絡(luò)以用于方向檢測。在一個實施例中,該算法中使用的神經(jīng)網(wǎng)絡(luò)具有預(yù)處理層,其將該576 個輸入轉(zhuǎn)換為144個特征。這些特征分別穿過兩個180個和80個節(jié)點的隱藏 層。該神經(jīng)網(wǎng)絡(luò)的結(jié)果為四個輸出,以"上","下","左","右"方向指明 可信度。這個使用伽泊小波(Garbo Wavelets)的具有其相當(dāng)獨特的預(yù)處理 的神經(jīng)網(wǎng)絡(luò)已在下文中^皮描述"a Subspace Projection Approach to Feature Extraction: The Two-Dimensional Gabor Transform for Character Recognition", Neural Networks, 7( 8 ), 1295-1301, 1994,牙口"Neural Network Positioning and Classification of Handwritten Characters", Neural Networks, 9(4), 685-693, 1996。該神經(jīng)網(wǎng)路的訓(xùn)練不是運行時算法的一 部分,而是使用從一般商業(yè)化字體縮放的字符離線執(zhí)行,這些商業(yè)化字體例 如Arial, Times Roman, Courier等等。接著,該算法決定是否接受該具有最高可信度等級的方向。該算法基于 可信度決定超出預(yù)定門檻的比率。為了增加或最大化精度,在一個實施例中,該頁面分析使用在其中發(fā)現(xiàn) 的組分。典型地,對于大多數(shù)文本頁面,組分的小百分比足夠做出可信的決 定。為了在精度和速度之間取得一個合理的權(quán)衡,該頁面被分為多組條帶。 每一組中的條帶分散在頁面上以擬隨機(jī)的選取組分。在一個實施例中,如果 在第一組中的較好連接的組分的數(shù)量超過預(yù)定的數(shù)量,并且得票數(shù)可信地確 定獲勝的方向,則算法返回該結(jié)果。反之,下一組條帶被處理,然后再下一 組……,直到符合結(jié)束的條件,或者直到頁面上所有或預(yù)定百分率的成分都 被;險查到。
由于字體的大小和分辨率變得更小,識別字符形狀變得更加困難。為了 該算法很好的執(zhí)行,在一個實施例中,二進(jìn)制字符的高度超過16像素。該算法可表現(xiàn)出字符的適度降低,直到8個像素的高度。在一個實施例中,該算法可假設(shè)頁面上的大多數(shù)連接的組分是單獨的字付。該算法的實施例已經(jīng)使用拉丁字母訓(xùn)練。由于在拉丁字母和西里爾字母 之間,以及在拉丁字母和希臘字母之間,有許多共同的形狀,該算法也可以 較好地執(zhí)行西里爾和拉丁字母。該算法可以為不同字符集進(jìn)行特定的訓(xùn)練。示范性檢測滲透^r測滲透算法的一個實施例自動檢測在掃描文檔側(cè)面的滲透,以在這些 頁面上執(zhí)行進(jìn)一步的圖像處理。在一個實施例中,該算法在正面和背面掃描 圖像內(nèi)使用頁面邊界檢測以大致地匹配側(cè)面等同物。然后,該算法使用已有 的彩色或灰度內(nèi)容對圖像進(jìn)行微調(diào)。這個額外的步驟可以使用是因為正面和 背面照相機(jī)稍微不同的光學(xué)和傾斜。如果剩余的(未解釋的)內(nèi)容低于預(yù)定 的密度標(biāo)準(zhǔn),該算法確定該頁面是空白的。在一個實施例中,該算法相對于該掃描儀的背景^^測該頁面的每個面。 接著,該算法在該頁面的兩面運行單獨的空白頁檢測,以確定是否該頁面的 一個或兩個面為空白,不管是否可能有滲透。如果一個或兩個面是空白,則 該算法結(jié)束。如果一個或兩個面不是空白,該算法確定該頁面的兩個面的主背景。接 著,該算法選擇具有更多內(nèi)容的一面作為正面。隨后,該算法使用頁面相應(yīng) 的矩形將背面映射到正面。色彩與該背景顯著不同的深像素在兩面被標(biāo)記出來,以形成模糊圖像。 該算法一塊接著一塊的局部分析該模糊圖像,以確定相對于粗糙圖像的局部 漂移。接著,該算法使用最小均方近似法完成背面到正面的映射。該算法在 正面深色內(nèi)容預(yù)定的距離內(nèi)取消該背面的內(nèi)容,然后該算法將剩余圖像發(fā)送 至該空白頁檢測步驟。 示范性色彩檢測色彩檢測算法的一個實施例檢測在掃描圖像中的彩色內(nèi)容,以及分辨前 景色彩和背景色彩。該算法消除該背景色彩,如果它是文檔中最主要的色彩。 該算法檢查該掃描圖像中的像素,以及確定該像素是否為彩色像素和是否該 像素是背景像素。該確定使用像素的飽和度和亮度等級。在一個實施例中,該算法將圖像從RGB表示法轉(zhuǎn)換為YCbCr (光亮度和 色度)表示法。該算法根據(jù)像素的飽和度組分以確定飽和度等級。飽和度提 供一個像素的色彩總量的尺度。飽和度越高,色彩越鮮艷。這個值越低,則 像素包含的色彩就越少。飽和度表示為0到182之間的一個數(shù)值,其由用于 計算飽和度的數(shù)學(xué)公式得出。在一個實施例中, 一個用戶可調(diào)整的色彩門搵 值被用于確定一個像素是否是彩色像素。如果該飽和度的值大于該門榲值, 則該像素就是彩色的,否則就不是。當(dāng)掃描儀掃描一個文檔時,該算法確定像素是否是一個背景像素,該文 檔和/或該掃描儀的白色或黑色背景可以表現(xiàn)為低飽和度的淺或深色。對于大 多數(shù)圖像,背景像素的數(shù)量在整個區(qū)域中占有一個大的百分比。為了消除圖 像的白色和/或黑色背景部分的影響,該色彩檢測算法使用一個白色背景門 檻, 一個黑色背景門檻,和一個背景飽和度門檻以確定背景像素的成員資格。 在一個實施例中,如果該像素的亮度高于該白色背景門檻或者低于該黑色背 景門檻,且像素的飽和度低于該背景飽和度門檻,那么該像素被歸類為一個 背景像素。否則,該像素就是非背景像素。該算法分析該非背景像素,通過基于像素的飽和度值建立的柱狀圖來確 定各種色彩內(nèi)容。 一個掃描儀可能會由于燈光或鏡頭而向掃描的圖像中引入 一些色彩。例如, 一個臟的鏡頭會增加色彩斑點。如果一個像素的色彩飽和 度值低于一個預(yù)定的門檻,該算法確定該像素沒有顏色。否則,該像素被認(rèn) 為具有有效的顏色。如果該文檔包含任何有效顏色,該文檔就被認(rèn)為是一個 彩色文檔。示范性背景平滑一個背景平滑算法的實施例降低了圖像背景中的色彩數(shù)目,以提高圖像 的外觀,以及減少壓縮后該圖像的大小。 該算法把在該圖像中找到的顏色集成簇并且將包含足夠像素的顏色作為 背景。該算法確定該背景簇的共同出現(xiàn)以確定兩個或多個簇是否實際上代表一 個單一的背景。這些類型的背景是通過抖動或者使用微點產(chǎn)生的,人眼將它 們感知為背景內(nèi)的平均色彩。當(dāng)該掃描儀以高分辨率掃描該圖像時,可以看 到每個像素的單獨的顏色。該算法合并共同出現(xiàn)的簇并為這些簇計算一個平 均的顏色。然后,該算法確定背景是否具有稍微暗一些或亮一些的、相鄰的顏色簇。 通常,當(dāng)掃描時,例如,紙張經(jīng)過該傳送器時會由于滾軸和加在該紙張上的 力而彎曲,從而在該圖像中產(chǎn)生陰影和高亮區(qū)。這些陰影和高亮區(qū)可以被感 知為不同的簇,并且它們可以與該主背景融合。通過搜索該圖像,該算法一個像素接著一個像素地修改該圖像,并確定 像素的色彩是否屬于這些背景簇中的一個。如果該像素屬于一個背景簇,該 算法將該像素顏色變?yōu)樵摯氐钠骄?。示范?險測和掃描頁面邊界檢測掃描頁面邊界的算法自動地在掃描的圖像內(nèi)檢測頁面邊界。通常, 在工業(yè)上使用的頁面傾斜檢測算法僅對黑色背景掃描可以可靠地工作,在黑 色背景掃描中該掃描儀的非常深的背景與典型的白色頁面之間的對比不容易 丟失。在一個實施例中,這個算法檢測相對于任何背景的頁面,因此,甚至 對于白色背景掃描儀也執(zhí)行頁面傾斜校正和剪切。由于在掃描儀背景和頁面背景之間可能存在非常小的色彩或灰度等級的 差別,檢測頁面邊界點無法單獨依賴該差別。由此,該算法計算和對比集中 在分析像素居中位置的小窗口中的統(tǒng)計量。該算法將這些統(tǒng)計量與集中在掃 描圖像角的統(tǒng)計量的范圍進(jìn)行對比,其中,該算法需要該掃描儀的背景。該算法計算在掃描圖像四個角的統(tǒng)計量。如果這些角中的一部分不一致, 當(dāng)頁面內(nèi)容靠近該角時可能發(fā)生這種情況,該算法不考慮這些不 一致的角。如果這些角中的一些與其它角顯著不同,則該算法選擇占多數(shù)的相似的 角。如果只能在相等數(shù)量的看似合理的對象中選擇,該算法對比該掃描圖像 內(nèi)部背景的角,以去掉過剪切頁面的背景。
為了限定角,該算法合計掃描儀背景的統(tǒng)計量用于以后使用。 該算法掃描圖像的行和欄,以顯著區(qū)別于那些掃描儀背景的統(tǒng)計學(xué)特性尋找第 一個和最后一個像素。預(yù)定的門搵確定該像素居中的窗口與該掃描儀背景范圍的偏差的重要性。檢測到的第 一和最后的非背景像素可用于確定候選邊緣點。多個限制被用于濾去離群值。例如,如果搜索頁面的左邊界,該候選邊緣點上面或下面具有最接近的鄰居,通過連接不同片斷形成的角度偏離垂直線在45度以內(nèi),并且互相接近。候選邊緣點使用最小均方近似法的一個變量進(jìn)行分析,以找 到表示該頁面主要矩形的最直的線。根據(jù)支持該矩形的邊緣點與該邊緣點最 大可能數(shù)目的比值,該算法為找到的矩形分配一個可信的標(biāo)準(zhǔn),這可以基于 頁面的大小,分辨率等等。在該算法確定傾斜的角度之后,該算法檢查在該頁面主要矩形范圍之外 的單獨的邊緣點是否具有其鄰居的足夠的支持,以指示一個突出,或者存在 的與假設(shè)的頁面矩形形狀的其它偏差。被認(rèn)為有意義的邊緣點用于確定剪切線。在雙面掃描的情況下,該算法使頁面圖像的正面和背面的傾斜角度一致。 如果正面檢測到的傾斜角度與背面的傾斜角度不同,很可能是其中一個錯了 。 在這種情況下,該算法使用與更高可信度相關(guān)的角度并重新計算另一面的剪 切線。類似地,如果正面和背面的剪切線明顯不同,該算法使頁面圖像正面和 背面之間的剪切線一致。該算法考慮該頁面主矩形與其剪切線之間的差異以 確定和去除由于掃描儀偽像產(chǎn)生的延長。在一個實施例中,頁面邊界檢測算法假設(shè)掃描儀的背景是一致的,在掃 描寬度上的單獨的傳感器之間的亮度變化不大,并且?guī)缀鯖]有無效或者校準(zhǔn) 差的傳感器而導(dǎo)致條紋。盡管描述了本發(fā)明特定的實施例,這些實施例僅用舉例的方式表述,并 且不限制本發(fā)明的范圍。相反,此處所描述的新的方法和系統(tǒng)可以多種其它形式實現(xiàn);進(jìn)而,對于此處描述的方法和系統(tǒng)的刪節(jié),置換和改變并不背離 本發(fā)明的精神。所附權(quán)利要求和它們的等同物涵蓋本發(fā)明范圍和精神內(nèi)的形 式及纟務(wù)改。
權(quán)利要求
1、一種計算機(jī)執(zhí)行的數(shù)據(jù)處理方法,其特征在于包括將來自數(shù)據(jù)捕獲裝置的原始或標(biāo)準(zhǔn)化數(shù)據(jù)存儲于計算機(jī)可訪問存儲介質(zhì)上;使用一個第一分析引擎分析所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)中的至少一部分,以確定該原始數(shù)據(jù)是否在第一組參數(shù)內(nèi),以及如果否,則使用所述第一分析引擎產(chǎn)生第一組處理器設(shè)置;使用所述第一組處理器設(shè)置處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù);以及使用一個第二分析引擎分析所述處理后的數(shù)據(jù)的至少一個部分以確定所述處理后的數(shù)據(jù)是否在第二組參數(shù)內(nèi),以及如果否,則使用所述第二分析引擎產(chǎn)生第二組處理器設(shè)置以重新處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于還包括使用所述第二組處理 器設(shè)置重新處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于還包括重復(fù)以下步驟 使用所述第二分析引擎分析所述處理后的數(shù)據(jù)的至少一部分,以確定所述處理后的數(shù)據(jù)是否在所述第二組參數(shù)內(nèi);使用所述第二分析?I擎產(chǎn)生所述第二組處理器設(shè)置,以重新處理所述原 始數(shù)據(jù);以及使用所述第二組處理器設(shè)置重新處理所述原始數(shù)據(jù),直到處理后的數(shù)據(jù) 在所述第二組參數(shù)內(nèi)。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)捕獲裝置是掃描 儀,照相機(jī),紅外照相機(jī),聲學(xué)照相機(jī),數(shù)碼照相機(jī),錄像機(jī),聲音傳感器 或傳真機(jī)。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,處理包括采用至少一種圖 像處理算法。
6、 根據(jù)權(quán)利要求1所述的方法,其特征在于,處理包括采用至少一種數(shù) 據(jù)處理算法。
7、 根據(jù)權(quán)利要求1所述的方法,其特征在于,處理包括應(yīng)用檢測方向算 法,檢測滲透算法,色彩檢測算法,背景平滑算法和檢測掃描頁面邊界算法 中的至少一種。
8、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一組參數(shù)與原始或 標(biāo)準(zhǔn)化數(shù)據(jù)的分析相關(guān)。
9、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二組參數(shù)與處理后 數(shù)據(jù)的分析相關(guān)。
10、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二組參數(shù)與關(guān)于 目標(biāo)數(shù)據(jù)的處理后數(shù)據(jù)的分析相關(guān)。
11、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二組參數(shù)是一個 預(yù)定的標(biāo)準(zhǔn)。
12、 一個數(shù)據(jù)處理系統(tǒng),其特征在于包括來自數(shù)據(jù)捕獲裝置的原始或標(biāo)準(zhǔn)化數(shù)據(jù),其中所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)存 儲于計算機(jī)可訪問存儲介質(zhì)中;一個與所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)通信的第一采集控制器,該第一采集控制 器配置為分析所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)的至少一部分以確定所述原始或標(biāo)準(zhǔn)化 數(shù)據(jù)是否在第一組參數(shù)內(nèi),以及如果否,則所述第一采集控制器產(chǎn)生第一組 處理器設(shè)置;一個與所述第一采集控制器通信的處理器,其中該處理器配置為使用所 述第一組處理器設(shè)置處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù);和一個與所述處理器通信的第二采集控制器,該第二采集控制器配置為分 析所述處理后的數(shù)據(jù)的至少一部分以確定所述處理后的數(shù)據(jù)是否在第二組參 數(shù)內(nèi),以及如果否,則所述第二采集控制器產(chǎn)生第二組處理器設(shè)置,所述處 理器使用所述第二組處理器設(shè)置重新處理所述原始數(shù)據(jù)。
13、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,所述數(shù)據(jù)采集 裝置是掃描儀,照相機(jī),紅外照相機(jī),聲學(xué)照相機(jī),數(shù)碼照相機(jī),錄像機(jī), 溫度傳感器,聲音傳感器,或傳真機(jī)。
14、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,處理包括應(yīng)用 至少一種圖像處理算法。
15、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,處理包括應(yīng)用 至少一種數(shù)據(jù)處理算法。
16、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,處理包括應(yīng)用 檢測方向算法,檢測滲透算法,色彩檢測算法,背景平滑算法,以及檢測掃 描頁面邊界算法中的至少一種。
17、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,所述第一組參 數(shù)與處理后的lt據(jù)的分析相關(guān)。
18、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,所述第一組參 數(shù)與關(guān)于目標(biāo)數(shù)據(jù)的處理后數(shù)據(jù)的分析相關(guān)。
19、 根據(jù)權(quán)利要求12所述的數(shù)據(jù)處理系統(tǒng),其特征在于,所述第二組參 數(shù)與定性分析相關(guān)。
20、 一個文檔處理系統(tǒng),其特征在于包括來自 一個數(shù)據(jù)捕獲裝置的文檔數(shù)據(jù),其中該文檔數(shù)據(jù)存儲于計算機(jī)可訪 問存儲介質(zhì)中;一個與所述文檔數(shù)據(jù)通信的第一采集控制器,該第一采集控制器配置為 分析所述文檔數(shù)據(jù)的至少一部分以確定該文檔數(shù)據(jù)是否在第一組參數(shù)內(nèi),以 及如果否,則該第 一采集控制器產(chǎn)生第 一組處理器設(shè)置;一個與所述第一采集控制器通信的處理器,其中該處理器配置為使用所 述第一組處理器設(shè)置處理所述文檔數(shù)據(jù);和一個與所述處理器通信的第二采集控制器,該第二采集控制器配置為分 析所述處理后的文檔數(shù)據(jù)的至少 一部分以確定所述處理后的文檔數(shù)據(jù)是否在 第二組參數(shù)內(nèi),以及如果否,則所述第二采集控制器產(chǎn)生第二組處理器設(shè)置, 所述處理器使用該第二組處理器設(shè)置重新處理所述文檔數(shù)據(jù)。
21、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述數(shù)據(jù)采集 裝置是掃描儀,照相機(jī),紅外照相機(jī),聲學(xué)照相機(jī),數(shù)碼照相機(jī),錄像機(jī), 聲音傳感器或傳真機(jī)。
22、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,處理包括采用 至少一種圖像處理算法。
23、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,處理包括應(yīng)用 檢測方向算法,檢測滲透算法,色彩檢測算法,背景平滑算法和檢測掃描頁 面邊界算法中的至少一種。
24、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第一組參 數(shù)與幾何分析相關(guān)。
25、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參數(shù)與定性分析相關(guān)。
26、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參 數(shù)與關(guān)于光學(xué)特性識別的定性分析相關(guān)。
27、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參 數(shù)與關(guān)于分類的定性分析相關(guān)。
28、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參 數(shù)與關(guān)于文本分類的定性分析相關(guān)。
29、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參 數(shù)與關(guān)于圖像分類的定性分析相關(guān)。
30、 根據(jù)權(quán)利要求20所述的文檔處理系統(tǒng),其特征在于,所述第二組參數(shù)與關(guān)于形式識別的定性分析相關(guān)。
全文摘要
本發(fā)明公開了一種有效的方法和系統(tǒng),用于提升模擬數(shù)據(jù)的數(shù)字采集裝置。該方法和系統(tǒng)帶來的提升對于本地和遠(yuǎn)程部署的用戶都是可用的。通過使用虛擬二次采集,能夠有效實現(xiàn)所獲得數(shù)碼數(shù)據(jù)質(zhì)量的提升。如果由采集裝置獲得的數(shù)字?jǐn)?shù)據(jù)的質(zhì)量不夠,該虛擬二次采集的方法能夠補(bǔ)償不必要的模擬數(shù)據(jù)的物理二次采集。該方法和系統(tǒng)包括將來自數(shù)據(jù)捕獲裝置的原始或標(biāo)準(zhǔn)化數(shù)據(jù)存儲于計算機(jī)可訪問存儲介質(zhì)上;使用一個第一分析引擎分析所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)中的至少一部分,以確定該原始數(shù)據(jù)是否在第一組參數(shù)內(nèi),以及如果否,則使用所述第一分析引擎產(chǎn)生第一組處理器設(shè)置;使用所述第一組處理器設(shè)置處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù);以及使用一個第二分析引擎分析所述處理后的數(shù)據(jù)的至少一個部分以確定所述處理后的數(shù)據(jù)是否在第二組參數(shù)內(nèi),以及如果否,則使用所述第二分析引擎產(chǎn)生第二組處理器設(shè)置以重新處理所述原始或標(biāo)準(zhǔn)化數(shù)據(jù)。
文檔編號H04N1/40GK101151882SQ200680009118
公開日2008年3月26日 申請日期2006年3月1日 優(yōu)先權(quán)日2005年3月24日
發(fā)明者喬爾·S·費克特, 哈里·S·阿舒爾, 毛里蒂烏斯·A·R·施米特勒, 羅伯特·A·泰勒, 羅蘭·G·博雷 申請人:柯法克斯影像產(chǎn)品公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1