專利名稱::用于在圖像信號中捕獲文檔的交互式用戶接口的制作方法
技術(shù)領(lǐng)域:
:本公開通常涉及數(shù)字設(shè)備,并且特別涉及具有成像子系統(tǒng)的數(shù)字設(shè)備。
背景技術(shù):
:具有成像子系統(tǒng)的數(shù)字設(shè)備,例如智能電話、數(shù)字相機和便攜式數(shù)據(jù)掃描終端,可以被用于捕獲具有一個或多個特征的表示的圖像幀。具有數(shù)目增加的像素的較高密度圖像傳感器陣列的可用性,在提供某種優(yōu)點的同時,可能還面臨挑戰(zhàn)。在具有增加數(shù)目的像素的圖像傳感器陣列的情況下,利用這種終端捕獲的圖像數(shù)據(jù)的幀具有增加數(shù)目的像素值。雖然更大數(shù)目的像素值通常允許捕獲具有較高分辨率的幀,但是較高分辨率能夠?qū)е略黾拥奶幚硌舆t。圖像傳感器陣列可用于單色的和彩色種類;相對于單色,彩色圖像傳感器陣列還提供了增加的數(shù)據(jù)。以上討論僅僅被提供用于通常的背景信息,并不意欲用作幫助確定所要求主題的范圍。
發(fā)明內(nèi)容公開了用于交互式用戶接口的設(shè)備、方法和軟件,用于捕獲具有特征表示的圖像數(shù)據(jù)的幀。在示例性實施例中,設(shè)備包括成像子系統(tǒng)、一個或多個存儲器元件、以及一個或多個處理器。成像子系統(tǒng)能夠提供表示在所述成像子系統(tǒng)上入射的光的圖像數(shù)據(jù)。一個或多個存儲器元件包括操作時能夠存儲圖像數(shù)據(jù)的輸入幀的至少第一存儲器元件。一個或多個處理器可以被使能用來執(zhí)行各種步驟。一個步驟可以包括從第一存儲器元件接收圖像數(shù)據(jù)。另一個步驟可以包括試圖識別在圖像數(shù)據(jù)中定義候選四邊形形式的線性特征。另一個步驟可以包括提供用于引導(dǎo)用戶改變該設(shè)備的定位以增強用于識別在圖像數(shù)據(jù)中定義候選四邊形形式的線性特征的能力的用戶可感知暗示。提供本
發(fā)明內(nèi)容以簡化的形式引入了概念的選擇,并且這在以下具體實施方式中還進一步描述。本
發(fā)明內(nèi)容不是旨在識別所要求主題的關(guān)鍵特征或必要特征,也不是旨在用來幫助確定所要求主題的范圍。所要求主題并不限于解決
背景技術(shù):
中提到的任意或全部缺點的實施方式。通過參考以下描述的附圖,這里所描述的特征可以更好地被理解。附圖無需按比例縮放,而是通常重點放在說明本發(fā)明的原則。在附圖中,相同的附圖標記被用來表示全部各種視圖中的相似部件。圖I描述了根據(jù)示例性實施例的系統(tǒng)的簡化的、混合的透視圖和圖解視圖,該系統(tǒng)包括具有成像子系統(tǒng)的數(shù)字設(shè)備。圖2描述了根據(jù)示例性實施例的具有成像子系統(tǒng)的數(shù)字設(shè)備的示意性框圖。圖3描述了根據(jù)示例性實施例的方法的流程圖。圖4-8描述了根據(jù)各種示例性實施例的用于檢測和捕獲文檔的處理圖像幀的各個方面的簡化視圖。圖9描述了根據(jù)示例性實施例的具有從圖像信號捕獲的文檔的圖形再現(xiàn)的圖形用戶接口應(yīng)用窗口。圖10描述了根據(jù)示例性實施例的關(guān)于處理圖像幀的方面的圖。圖11描述了根據(jù)示例性實施例的處理圖像幀的方面的視圖。圖12描述了根據(jù)各種示例性實施例的圖形用戶接口應(yīng)用窗口。圖13-16描述了根據(jù)各種示例性實施例的圖形用戶接口應(yīng)用圖標。圖17和18描述了根據(jù)各種示例性實施例的圖形用戶接口應(yīng)用窗口。這些附圖無需按比例縮放,而是通常重點放在說明各種實施例的原則。在附圖中,相同的附圖標記被用來表示全部各種視圖中的相似部件。具體實施例方式圖I描述了根據(jù)示例性實施例的系統(tǒng)5000,用于在圖像信號中捕獲文檔110,該系統(tǒng)包括移動設(shè)備1000,在此以透視圖描述。圖I和2提供了示例性的設(shè)備和系統(tǒng),其可以被用來執(zhí)行文檔捕獲方法,而圖3描述了文檔捕獲方法200的示例性實施例。如圖I和2所示的,在這個示例性實施例中,移動設(shè)備100可以包括具有成像視場1240的成像子系統(tǒng)400,該成像視場可以被投射的照明場1260包圍,并且其可以引導(dǎo)到目標文檔110上。在各種實施例中,移動設(shè)備1000和/或系統(tǒng)5000可以示例性地被使能以在圖像信號中捕獲文檔110,如在后續(xù)附圖和后面說明中進一步概述的。在圖I的示例性實施例中,移動設(shè)備1000被描述為手持型移動計算機,并且在各種實施例中,還可以采取智能電話、移動電話、圖形輸入板(tablet)或筆記本計算機、膝上型計算機、電子書閱讀器、標記掃描終端或具有成像子系統(tǒng)的任意寬范圍的其它類型的數(shù)字設(shè)備的形式。在圖I的示例性實施例中,移動設(shè)備1000包括用戶接口元件,包括布置在手持外殼1014上的觸發(fā)器1220、顯示器1222、指示機構(gòu)(pointermechanism)1224、以及鍵盤1226。鍵盤1225上的兩個按鍵被指定為掃描鍵1227和輸入鍵1228,盡管可以任意選擇哪些鍵被用于這些功能,以及它們被布置在移動設(shè)備1000上的何處,并且可以與圖I中的示例性描述不同。系統(tǒng)5000可以操作時用來執(zhí)行多個動作,其可以包括以下例子,它們可以表征一個示例性實施例5I)預(yù)覽幀可以被顯示在移動設(shè)備1000的顯示器1222上,示出成像子系統(tǒng)400或相機查看的內(nèi)容,實時更新或盡可能接近實時地可實行。預(yù)覽幀可以具有比圖像傳感器陣列1033的分辨率較低的分辨率。2)預(yù)覽幀可以被處理來定位文檔。3)如果文檔已經(jīng)被定位,它的輪廓可以在預(yù)覽圖像中用四邊形邊界表示,其顏色被用來向操作者給出信息——紅色邊界可以指示文檔已經(jīng)被識別但是所得到的圖像不是最佳的,綠色邊界可以指示文檔已經(jīng)被識別并且所得到的圖像是最佳的。4)作為文檔識別過程的一部分,文檔的距離可以被計算,并且這個距離可以被用來設(shè)置透鏡組件250的焦點,該透鏡組件包括成像透鏡或者相機透鏡240。例如,系統(tǒng)5000可以是可操作地以便透鏡組件250的最佳焦點設(shè)置的平面響應(yīng)于到目標的距離,如根據(jù)這里提出的距離檢測方法所確定的。5)同樣,作為文檔識別過程的一部分,分析輸入預(yù)覽幀速率。幀速率根據(jù)曝光時間變化,其依次根據(jù)環(huán)境光等級而變化。因此,如果幀速率降至(dropbelow)某個閾值之下,那么相機的照明子系統(tǒng)800(例如,LED燈)能夠自動地被激發(fā)。6)在非最佳圖像的情況下,可以在預(yù)覽圖像中向操作者給出另外視覺信息,來幫助它們提高圖像質(zhì)量——這可以采用圖形“暗示”的形式,或者關(guān)于例如如何移動移動設(shè)備1000的事情給出明確指令的引導(dǎo)指示來完成。7)這些暗示可能示出例如直線箭頭指示哪個方向來對移動設(shè)備1000進行移動,曲線箭頭指示哪個方向旋轉(zhuǎn)移動設(shè)備1000,放大透視圖所畫的箭頭指示移動設(shè)備1000要更加接近或者更加遠離文檔來移動,另外加上其它圖形圖像指示文檔部分地在陰影中,或者移動設(shè)備1000沒有被足夠拿穩(wěn)之類的事情。8)暗示的顏色將循環(huán)以便提高它們在亮或者黑暗背景中的可見性,并且它們還可以栩栩如生。9)當幀已經(jīng)被確定為最佳時,操作者可以通過按鍵或者通過某一其它動作向移動設(shè)備1000發(fā)信號通知靜止的圖像要被捕獲和保存。10)—旦該圖像已經(jīng)被捕獲,可以核查針對銳度來檢測該圖像。系統(tǒng)5000在一個實施例中能夠是可操作的,以便僅僅當它足夠尖銳時,將向操作者提供可聽見和/或可視的指示被捕獲的幀已經(jīng)被保存。11)該幀可以被適當?shù)夭们?縮放/旋轉(zhuǎn),以便只保留文檔本身的圖像。該過程將創(chuàng)建分辨率足夠填滿移動計算機的顯示屏的文檔圖像,并且該文檔在圖象中將是垂直的,而不必考慮其原始定向。12)被處理的幀可以顯示在移動設(shè)備1000的顯示器1222上用于最后操作者核準。13)一旦圖像已經(jīng)被顯示,裁切/縮放/旋轉(zhuǎn)過程可以重復(fù)“在背景中”,這次生成適于保存的較大圖像。14)一旦這個第二次變換過程完成,操作者可以給出他們對文檔圖像的核準,這可以通過按壓鍵盤1226上的按鍵或者通過某種其它動作來給出。15)系統(tǒng)5000是可操作以便如果被核準,則文檔的圖像接著將被保存在移動設(shè)備1000的存儲器中,例如儲存存儲器1084,其可以是例如通過閃存或硬盤驅(qū)動存儲器提供,且文檔捕獲過程可能接著就完成。系統(tǒng)5000是可操作的以便如果操作者指示該文檔沒有被保存,那么該文檔捕獲過程將立即再次開始。在各種實施例中,可以采用各種不同的順序執(zhí)行任意或者全部這些動作。在本公開中,這些動作的示例性方面還在其它地方被進一步詳細描述。在各種示例性實施例中,系統(tǒng)5000可以是可操作的以便具有流式預(yù)覽圖像1111的預(yù)覽窗口1101可以被顯示在數(shù)字設(shè)備1000的顯示器1222上,如圖I所示。流式預(yù)覽圖像1111可以示出被相機或者成像子系統(tǒng)400成像的圖像幀的降低分辨率的實時預(yù)覽。預(yù)覽圖像1111可以在促進成功文檔捕獲中用作各種有用的目的。例如,示例性文檔捕獲處理實施方式可以允許用戶查看流式文檔圖像110B,示出了文檔110如何正被移動設(shè)備1000成像,以及示出目標文檔110何時相對平滑、亮度適中,以及包括在成像子系統(tǒng)400的視場1240中。示例性文檔捕獲處理實施方式還可以提供了一種文檔簡檔型下拉菜單1141,允許用戶選擇具有特定大小和縱橫比的文檔簡檔類型。在各種實施例中,顯示器1222可以合并觸摸板用于導(dǎo)航以及虛擬致動器選擇,在該情況下移動設(shè)備1000的用戶接口可以由顯示器1222提供。移動設(shè)備1000的用戶接口元件還可以通過將移動設(shè)備1000配置為可操作通過解碼編程條碼符號而再編程來提供。在另一個實施例中,移動設(shè)備可以沒有顯示器,并且可以采取槍風(fēng)格形式因素。在各種實施例中,移動設(shè)備1000可以自己構(gòu)成在圖像彳目號中捕犾文檔110的系統(tǒng),以及在各種實施例中,結(jié)合一個或多個外部服務(wù)器2000、3000(框圖中所示)的移動設(shè)備1000(該外部服務(wù)器可以通過網(wǎng)絡(luò)2500連接)可以一起用作在圖像信號中捕獲文檔110的系統(tǒng)。在此說明中,系統(tǒng)5000可以被描述為被使能或者配置用于各種特征、特性或功能;并且在各種實施例中,這可能涉及單獨的移動設(shè)備1000,或者與被使能或者配置用于各種特征、特性或功能的系統(tǒng)5000的其它元件通信或者合作的移動設(shè)備。圖I的各種元件將在下面進一步描述。圖2描述了根據(jù)與圖I的示例性實施例一致的示例性實施例的具有成像子系統(tǒng)400的移動設(shè)備1000的示意性框圖。移動設(shè)備1000包括成像子系統(tǒng)400、一個或多個存儲器元件1085以及處理器。成像子系統(tǒng)400能夠提供表示在其上入射的光的圖像數(shù)據(jù)。一個或多個存儲器元件1085包括至少第一存儲器元件,示例性地例如RAM1080,其可操作能夠至少臨時或者瞬時存儲圖像數(shù)據(jù)的輸入幀,同時其它存儲器元件可以被用在各種實施例中。處理器1060可以與可執(zhí)行指令通信連接,用于使能處理器1060執(zhí)行各種步驟。根據(jù)示例性方法200,那些步驟示例性地在圖3中示出,并且在那些步驟中涉及的圖像處理的某些方面在圖4-6中示例性地示出。圖2的其它參考元件沒有被介紹,并且在圖3-6被進一步描述之后,圖2的各種元件將被進一步描述。根據(jù)各種示例性實施例,在各種示例性方法中,系統(tǒng)5000可以利用可以包括多個階段的示例性文檔檢測和定位過程在圖像信號中捕獲文檔110,這些在這里簡單介紹,并且在以下進一步詳細描述。每一個不同的文檔類型可以具有保存諸如其邊緣長度、目標顏色平衡等等之類參數(shù)的簡檔,并且這些參數(shù)連同固定參數(shù)組可以被用于控制該過程。在示例性實施例中如下呈現(xiàn)不同的步驟。首先,圖像數(shù)據(jù)的幀可以經(jīng)由抓幀器從DirectShow預(yù)覽流獲得,或者用作抓幀器的空渲染器,例如,以及再采樣為較小尺寸,被稱為縮略圖。接著,輸入循環(huán),其使用不同的標準來檢測邊緣,并選擇給出最佳結(jié)果的那一個。對于循環(huán)的每次反復(fù),可以沿著垂直和水平軸搜索縮略圖用于表示文檔邊緣的亮度和/或顏色的變化。在示例性實施例中,注冊了高達兩種變化用于每個水平和垂直通道。邊緣部分可以建在連續(xù)變化之外,并且接著可能屬于相同邊緣的部分可以被分組在一起。當沿著每個軸注冊了僅僅兩種變化時,最多有四組,這應(yīng)該對應(yīng)于文檔的四邊緣。直線方程可以適于四邊緣組,并且然后求解聯(lián)立方程對,給出四個角點。這些點接著從2D轉(zhuǎn)變?yōu)?D,給出三維空間中的原始文檔的角點。該文檔維度接著可以被核查。此后,該文檔的位置在給定的時間段可以被平滑,來去除方案中的某些不穩(wěn)定。該文檔接著可以被核查過多的陰影,并且其位置和方向可以被用來確定可視性暗示,這些暗示可以被提供給操作者,顯示怎樣移動移動設(shè)備1000,來提高圖像質(zhì)量。最后,一旦操作者可以開始最后的文檔捕獲,將在顯示之前為了銳度核查所得到的圖像。根據(jù)這個示例性實施例,一旦它被顯示,可以執(zhí)行其它的處理將它轉(zhuǎn)換為矩形,降低漸暈、校正任意顏色不平衡、并使其尖銳。例如,根據(jù)不例性實施例,圖3不出了一種操作移動設(shè)備1000的方法200,其用于識別圖像信號中的文檔。例如,處理器1060可以與可執(zhí)行指令通信連接,該可執(zhí)行指令使得處理器1060能夠執(zhí)行方法200的步驟。如圖3的示例性實施例中所示,方法200包括步驟201,用于從第一存儲器元件(示例性地例如RAM1080)接收輸入幀。這之后是步驟203,用于基于輸入幀生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中降低分辨率的幀中的像素組合了來自輸入幀中的兩個或多個像素的信息。步驟205包括試圖識別轉(zhuǎn)變對,其包括在降低分辨率的幀中的臨近像素對,具有在超過像素轉(zhuǎn)變閾值的像素之間的差值。如果這種轉(zhuǎn)變對被識別,那么可以執(zhí)行步驟207,用于試圖識別在降低分辨率的幀中的兩個或多個識別的轉(zhuǎn)變對之間的一個或多個線性特征。如果這種線性特征被識別,接著步驟209,用于提供在降低分辨率的幀中的一個或多個識別的線性特征的指示。這種線性特征可以表示數(shù)字設(shè)備1000讀取的圖像信號中的矩形文檔110的圖像的邊緣,并且可以用來在圖像信號中定位或者隔離矩形文檔110的圖像。該圖像信號可以通過移動設(shè)備1000的成像子系統(tǒng)400生成,并且可以包括在成像子系統(tǒng)400的視場1240中的全部或部分目標文檔110的圖像。文檔110的圖像可以不是矩形,即使該目標文檔110是矩形的,由于在移動設(shè)備1000和文檔110之間的透視角度的效果,例如傾斜的,并且這里公開的各個步驟可以被用來補償或者校正這種傾斜。在移動設(shè)備1000和方法200的各種示例性實施例中,用于檢測和捕獲文檔的技術(shù)典型地可以能夠以小于40ms每幀在實時320X240視頻流圖像信號中定位文檔,如示例性實施例,盡管大于和小于這個值的其它時段可應(yīng)用于不同的實施例。目標文檔110可以包括文檔、包、其它類型基底或任何具有在其上可說明特征的基本上矩形形式,例如寫入或者容易受例如解碼或編譯影響的其它標記形式。圖4-8圖形描述了根據(jù)與圖3的示例性方法200—致的示例性實施例的用于檢測或識別特征的過程的方面,例如可以表示文檔邊緣的像素轉(zhuǎn)變對和線性特征,以便在移動設(shè)備1000成像的數(shù)據(jù)301的幀中識別和捕獲文檔110的圖像。圖4-8在以下進一步描述。在各種實施例中,圖像信號處理驅(qū)動器或者應(yīng)用程序可以結(jié)合在移動設(shè)備1000中。圖像信號處理驅(qū)動器可以把從圖像傳感器陣列1033加載圖像數(shù)據(jù)幀的過程指引到緩沖存儲器元件,例如RAM1080以對于處理器1060可用。這是在步驟201中準備的,用于從第一存儲器元件例如RAM1080接收輸入幀。在示例性實施例中,移動設(shè)備1000可以結(jié)合RedmondWashington的微軟公司的DirectShow媒體管理軟件的版本。在各種其它實施例中,移動設(shè)備1000可以結(jié)合另外視頻驅(qū)動器或其它圖像信號驅(qū)動器。在示例性實施例中,步驟203可以涉及通過抓幀器或空渲染器從DirectShow預(yù)覽流獲得的圖像數(shù)據(jù)幀,且再采樣為較小尺寸,被稱為縮略圖。在這個示例性實施例中,縮略圖是基于來自預(yù)覽流的圖像數(shù)據(jù)的輸入幀的降低分辨率的幀,縮略圖包括比輸入幀更少的像素。在各種示例性實施例中,生成降低分辨率的幀還可以包括將輸入幀分割為像素組,并且對于每個像素組,平均像素組中的像素的一個或多個屬性,并生成具有像素組的平均屬性的平均像素。縮略圖中的每個像素可以因此從輸入幀中的兩個或多個像素組合信息。作為示例性實例,初始輸入幀可以在四個像素組中劃分為2X2排列,并且那些2X2像素組的每一個可以被平均或者另外根據(jù)亮度、顏色或者二者,被組合成為單獨表示的像素來代替原始像素組。像素組的其它大小或者用于降低初始圖像幀中的像素計數(shù)或數(shù)據(jù)數(shù)量的方法,例如組合九個像素組為3X3排列,或其它分組,也可以被用于不同的實施例。文檔捕獲過程的各種實施例可以利用在輸入幀中的基本上全部像素組,并應(yīng)用用于在縮略圖中生成基本上全部像素的方法而執(zhí)行,其中該過程可能包括小錯誤和偏差,這可能影響實質(zhì)上不會充分改變該過程的多個像素中的一個。例如,根據(jù)各種示例性實施例,小錯誤可能由有缺陷的成像陣列像素、輻射影響、小隨機下載錯誤、或可能干擾相對少量像素的其它小影響而產(chǎn)生,而不是實質(zhì)上影響被處理的輸入幀中的每組像素的過程,以在降低分辨率的幀中生成每個像素,可以理解,“每個”的含義是“基本上每個”,而不是“絕對的每一個”。在查找期間,移動設(shè)備1000可以在顯示器1222上顯示預(yù)覽流幀。系統(tǒng)5000可以是可操作的以便當預(yù)覽流幀正在被生成和顯示時,系統(tǒng)5000可以緩沖較高分辨率幀(例如,1600X1200、1280X1024),從其中能夠?qū)С鲱A(yù)覽流幀。響應(yīng)于例如通過啟動鍵盤1225的掃描鍵1227被激活來保存幀或圖像(例如,文檔表示)的命令,相應(yīng)于用于質(zhì)量檢測處理的較低分辨率的幀的緩沖的較高分辨率的幀可以被處理來保存。在一個實例中,較高分辨率的幀可以具有與圖像傳感器陣列1033的像素計數(shù)相等的像素計數(shù)(例如,1600X1200),或者相似的較高分辨率(例如,1280X1024)。瞬時地或者另外臨時地緩沖圖像數(shù)據(jù)幀的任意步驟可以被理解為包括存儲圖像數(shù)據(jù)幀。此外,預(yù)覽流可以已經(jīng)是由移動設(shè)備1000成像的全分辨率成像數(shù)據(jù)的降低分辨率的版本,以便在這個示例性實施例中,成像驅(qū)動器生成第一降低分辨率的圖像幀或幀系列,同時文檔識別應(yīng)用程序可以生成第二級幀,其具有與來自成像驅(qū)動器的第一輪降低分辨率的圖像幀進一步降低的分辨率。在各種其它實施例中,各種其它過程可以在生成降低分辨率的幀或(多個幀)中涉及,其可能僅僅涉及來自全分辨率輸入幀的分辨率降低的單個步驟,或者任意數(shù)量和方式的分辨率降低步驟。例如,在一個示例性實施例中,移動設(shè)備1000可以具有將高分辨率單色成像器與相對較低分辨率彩色圖像合并在同一個成像芯片上的成像器,例如640X480像素陣列視頻圖形陣列(VGA)彩色成像器,如示例性實例。在這個示例性實例中,彩色成像器可以被用于流動預(yù)覽顯示,同時例如高分辨率成像器可以被用于最后的文檔捕獲。盡管縮略圖具有降低的分辨率以及與較高分辨率幀相比降低數(shù)量的數(shù)據(jù)(其基于較高分辨幀),但是這使得能夠降低處理器在執(zhí)行識別和捕獲文檔圖像中涉及的后續(xù)步驟時的處理負擔(dān)和持續(xù)時間,例如識別像素轉(zhuǎn)變對和線性特征的步驟。作為示例性實例,在用于文檔特征檢測的圖像處理之前,降低分辨率的預(yù)覽流圖像幀可以被進一步降低。例如,在示例性實施例中,640X480VGA彩色成像器的輸入可以在分辨率上被降低至四分之一以生成原始預(yù)覽圖像,原始成像器信號中的每組2X2像素被平均或者另外組合來生成原始預(yù)覽圖像中的單個像素。這個原始預(yù)覽圖像可以示例性地是320X240R5G6B5,但是可以在2秒內(nèi)降低分辨率,在檢測過程開始之前,示例性地被重新采樣并且轉(zhuǎn)換為160X120R8G8B8。這樣的處理可以提供各種優(yōu)點,例如可以更快為邊緣查找這個較小尺寸的3字節(jié)每像素圖像。同樣,這樣的處理可以從文檔中移除可能誤認為邊緣的某些精細的細節(jié)。各種其它示例性實施例可以僅僅包括分辨率降低的一個步驟,和/或可以使用降低分辨率的其它方法,來生成快速的邊緣檢測幀。例如,在一個示例性實施例中,移動設(shè)備1000可以能夠生成降低分辨率線性特征檢測縮略圖幀,并在這些降低分辨率線性特征檢測縮略圖幀上執(zhí)行線性特征檢測和文檔捕獲過程的全補充,例如,以大約每秒7到10幀的幀速率。高于以及低于這個的其它降低分辨率線性特征檢測幀速率可以用于其它實施例中。在基于圖像數(shù)據(jù)的輸入幀創(chuàng)建縮略圖之后,線性特征識別步驟可以在循環(huán)中被執(zhí)行。這在圖3中示出,其中在一個或多個查找特征被識別之前,識別步驟205和207可以繼續(xù)迭代循環(huán)。每個特征查找的數(shù)量和執(zhí)行查找特征的循環(huán)數(shù)量在不同實施例中可以是不同的。在各種實施例中,可以使用不同標準檢測邊緣,并且可以選擇給出最佳結(jié)果的那個標準。例如,識別像素轉(zhuǎn)變的步驟可以涉及針對在臨近像素之間的亮度和/或顏色的變化(其能夠表示文檔邊緣)在水平和垂直方向上沿著掃描線在循環(huán)中迭代地搜索縮略圖。換句話說,沿著每個掃描線的像素的每個臨近像素對可以被評估以評估這對中的兩個像素是否足夠不同,在絕對項或者相對于縮略圖中的其它臨近像素對,它們在表示文檔邊緣上具有某一可能性。這在圖4中示例性描述,其描述了相應(yīng)于從圖像傳感器陣列1033的部分或全部像素幀獲得的圖像數(shù)據(jù)的幀的圖像幀301。為了清楚,在圖4中僅僅示出了一些示例性的水平掃描線311和垂直掃描線313。在示例性實施例中,不超過2個候選像素轉(zhuǎn)變對可以被注冊用于每個水平掃描線311和每個垂直掃描線313。圖4還描繪了用于表示沿水平掃描線311的識別的水平像素轉(zhuǎn)變對321的白圈,以及用于表示沿垂直掃描線313的識別的垂直像素轉(zhuǎn)變對323的黑圈。如上所述,雖然降低分辨率的幀可以被用于快速檢測和識別特征,例如像素轉(zhuǎn)變對和線性特征,在各個實施例中表示成像的文檔,但是較高分辨率的幀,例如分辨率等于圖像傳感器陣列1033的分辨率,或者其它更高的分辨率的幀可以被處理用于檢測指示的特征,在各種實施例中,其中處理能量足夠用于對較高分辨率的快速特征檢測。圖5-8描述了在識別的像素轉(zhuǎn)變對上建立以識別線性特征(例如,邊緣段、對準的邊緣段組以及可能定義文檔圖像的角的邊緣段組的交叉)并且然后識別和補償透視傾斜以將3D空間中2D文檔的圖像映射為文檔的標準2D圖像的另外方面。如下提供這些方面的簡要概述。表示文檔以及可能被檢測為檢測和識別文檔圖像的過程的一部分的各種特征(例如,像素轉(zhuǎn)變對、邊緣段、對齊的邊緣段組和邊緣段組角交叉)可以共同被稱為文檔表示特征或者表示特征,例如,它們表示文檔的潛在特征,例如文檔的邊緣。在各種示例性實施例中,表示文檔的任意這些特征,以及被識別的文檔片段、部分識別的文檔、或者識別的文檔,可以共同地被認為是在降低分辨率幀中的識別的線性特征。如圖5描述的,可能是邊緣段的候選線性特征可以從連續(xù)的像素轉(zhuǎn)變對中被識別,并且接著對齊的并且示出屬于相同邊緣的可能性的邊緣段可以被分組在一起。在這個示例性實施例中,由于僅僅有兩個像素轉(zhuǎn)變對沿著每個掃描線或軸注冊,因此最大有四個對齊的邊緣段組,其應(yīng)該對應(yīng)于文檔的四個邊緣。如圖6所示,直線等式可以適合于四邊緣組,接著被求解為聯(lián)立方程的對,給出四個角點。這些點接著可以從2D轉(zhuǎn)換為3D,給出在3維空間中的原始文檔的角點,這將參考圖7-8在下面進一步描述。例如,然后,文檔維度通過將其在像素上的外觀大小與成像器透鏡組件250相關(guān),在計算其物理大小后,可以被核查。此后,文檔的位置可以在給定時段上被平滑,以移除解決方案中的某一不穩(wěn)定性。可以針對過多的陰影核查該文檔,并且它的位置和方向可以被用來確定用戶暗示,示例性地以在提高定位上給出暗示的圖形圖標的形式,這可以向操作者給出以顯示如何移動移動設(shè)備1000以增強圖像質(zhì)量。最后,一旦操作者啟動最后文檔捕獲,可以在顯示之前針對銳度核查所得到的圖像。一旦它被顯示,可以執(zhí)行進一步的處理將所得到的圖像轉(zhuǎn)換為矩形,降低漸暈,校正任何顏色不平衡,并使其尖銳。在一個實施例中,可以允許操作者保存圖像(例如,文檔表示)。這些特征在下面進一步被描述。在各種實施例中,指示特征檢測過程可以使用用于檢測文檔指示特征的各種算法的一種或多種。如以上參考圖4所示,一種示例性的算法實施例可以涉及沿水平線311和垂直線313通過縮略圖掃描,并查找包括正好兩個重要像素轉(zhuǎn)變的那些。另一個示例性算法實施例可以涉及在每個方向查找第一重要像素轉(zhuǎn)變,從四個邊緣的每一個的中心開始,并朝著縮略圖的中心運作。在各種示例性實施例中,超過像素轉(zhuǎn)變閾值的像素轉(zhuǎn)變對可以被認作是絕對項中重要的,例如如果在像素的三色值和其臨近的三色值之間的絕對差值的和大于特定值。例如,每個像素可以用R8G8B8格式編碼24位的顏色數(shù)據(jù),以便每個像素的每個紅色、綠色和藍色強度可以在O到255的范圍內(nèi),并且閾值可以是三色成分的每一個的至少64差值,如示例性的實例,或者三色成分的每一個的至少128差值的組,如另一個示例性的實例。在其它示例性實施例中,每個顏色成分的其它強度閾值,或者低于或者高于或者在這個范圍內(nèi),還可以被用于像素轉(zhuǎn)變閾值。在另一個示例性實施例中,顏色成分強度可以被相乘,且臨近像素的顏色成分的乘積之間的差值可以被評估用于重要的像素轉(zhuǎn)變。在其它示例性實施例中,像素轉(zhuǎn)變對可以被認為是相對項中重要的,例如通過沿每個軸或掃描線選擇具有最大差值的兩個像素轉(zhuǎn)變對。在各種實施例中,可以使用結(jié)合絕對和相對標準的評估。在各種實施例中,這里描述的兩種算法都可以使用某些不同的轉(zhuǎn)變值來查看哪一個給出了最佳的最終結(jié)果。在查找指示特征的每次嘗試后,指示性特征檢測過程可以繼續(xù)進行來查看還有多遠。如果任一核查失敗,那么將嘗試下個轉(zhuǎn)變值和/或邊緣檢測算法。該過程可以繼續(xù)直到已經(jīng)獲得了全部滿意的結(jié)果,或者當兩個算法都已經(jīng)使用全部可應(yīng)用的轉(zhuǎn)變值。實際上,可以有即使有邊緣也沒有發(fā)現(xiàn)邊緣的不同數(shù)量的掃描線,即使沒有實際邊緣也發(fā)現(xiàn)“邊緣”的線,以及發(fā)現(xiàn)水平和垂直邊緣的線。由于光亮和其它條件沿著被成像的文檔的每個邊緣而變化,因此指示性特征檢測11過程在目標文檔的某些部分比其它部分執(zhí)行得更好。因此,發(fā)現(xiàn)邊緣已經(jīng)被分解為若干段不是罕見的事,每一個都包括連續(xù)的或者對齊的像素轉(zhuǎn)變點??梢酝ㄟ^將具有它們的每個水平和垂直線的第一和第二像素轉(zhuǎn)變對與來自先前掃描線(如果有)的像素轉(zhuǎn)變對進行比較,建立邊緣段的列表,來查看它們是否大致類似,并且在相同方向上移動。如果它們是,那么這些點可以被加入到當前邊緣段,否則開始新的段??梢钥紤]給定的錯誤余量,例如允許每段中的單獨離群值,例如,以便不分解包括單獨錯誤識別值的邊緣段。在這個過程的最后,可以丟棄小于特定最小數(shù)量點的段,保留應(yīng)該包括四個邊緣的每一個的四個段集合。在示例性實施例中,可以使用最小平方方法,將直線等式適合四個集合的每一個中的每段。每個集合可以接著被單獨核查,并且可以成對測試所述段,查看它們是否可能屬于相同邊緣。為此,可以使用它們的兩個等式通過在合適的情況下在對應(yīng)于縮略圖的寬度或高度的范圍上對在多個位置上的線之間的距離平方求和來獲得兩個線之差的度量。如果這種度量小于指定值,該段可以被合并。在這個過程的最后,具有小于指定最小數(shù)量點的合并段可以被丟棄,并且在每個集合(如果有)中的最大保留合并段被選擇——當水平邊緣正被查找時,這將消除例如對應(yīng)于垂直邊緣的段。最小平方方法可以再被使用將直線適于四個邊緣。圖5示出了來自從圖4描繪的掃描線產(chǎn)生的至少近似對齊邊緣段431(每個邊緣段示為粗線段)(其被分組在一起并且被擴展表示合并的段線433)的單個線的可能結(jié)果。邊緣段431的每一個可以從垂直像素轉(zhuǎn)變對323的臨近或連續(xù)集合中被聚集,垂直像素轉(zhuǎn)變對323可以跨越縮略圖301從垂直掃描線313生成。邊緣段435還可以從垂直掃描線313生成的垂直像素轉(zhuǎn)變對323的連續(xù)集合中被聚集,但是在這個示例性實施例中,掃描線的一個特定方位生成的邊緣段可以被用來填充邊緣段組的一個方位,作為誤差約束技術(shù)。至少大體對齊的邊緣段431可以被合并,同時沒有對齊的邊緣段435可以被丟棄,因為它沒有與其它的垂直掃描生成的段對齊,并且與合并段431相比,它在垂直掃描中檢測的像素轉(zhuǎn)變對的數(shù)量方面是數(shù)據(jù)缺乏的(由于它更接近垂直,并且比垂直掃描線具有更多的平行組件,以及較低的垂直掃描分辨率,同時合并段431更接近水平,且每個具有比垂直掃描線更多的垂直組件,以及較高的垂直掃描分辨率)。相似的,可以進行水平掃描以僅僅檢測更接近于垂直的,并且讀取比垂直更高的水平掃描的分辨率的段組,并且相似的,被檢測為大大強于與直角段對齊。單獨的段可能包括不準確性,但是合并段傾向于產(chǎn)生更多準確的組合結(jié)果,如圖5的合并段線433示例性示出的。在其它示例性實施例中,來自垂直和水平掃描的信息可以被用來檢測和特征化形成目標文檔的四個邊緣的任意部分的任意邊緣段。用于檢測、特征化和合并像素轉(zhuǎn)變對和/或邊緣段的充分處理可以產(chǎn)生四個合并段線433、437、443、447,并且邊緣方程可以被確定來特征化四個合并段線的每一個。在各種實施例中,在已經(jīng)獲得四邊緣方程后,邊緣方程可以接著成對檢查,以核查它們相對角度至少是接近的,例如在90°的預(yù)期余量內(nèi)。在各種實施例中,這種核查可以是近似的,且角度可以在稍后更加精確地被重新計算。這個目的是為了確保邊緣建立過程導(dǎo)致能夠表示2D矩形形式的邊緣的圖像部分,如3D空間中成像的。如圖6所示,如果核查成功,則方程可以成對求解為聯(lián)立方程,給出交叉合并段線433、437、443和447的四對的每一個的四個交叉定義的四個角點451、453、455和457。這些角的解的有效性可以接著被測試高度精確性。角從應(yīng)該是二維文檔的二維圖像導(dǎo)出,但是文檔存在于三維空間(簡稱三空間),并且已經(jīng)沿著x、y或者z軸旋轉(zhuǎn)。沿著z軸的某個旋轉(zhuǎn)量并不是個問題,因為它沒有影響整個的形狀幾何,它僅僅降低最大可能文檔圖像大小。然而,任何X和/或y軸旋轉(zhuǎn)將朝向目標文檔的相機視線改變?yōu)閮A斜的透視圖,并且將相機的矩形視圖改變?yōu)榫哂袧撛谒膫€不同側(cè)邊長度和角的角度的非矩形四邊形。在各種示例性實施例中,可以更加嚴格地進行2空間角的角度核查,或在這個點上計算側(cè)邊的縱橫比,但是這樣做限制了能夠容許的傾斜的量,并且還可能允許通過無效的角的解。圖7和8描述了成像這樣一種傾斜的透視四邊形和解釋來自它的矩形文檔的表示的方面。圖7描述了在圖像幀601中成像文檔的這種傾斜的透視視圖四邊形611的示例性實例,其中四邊形611通過四個邊緣631、633、635和637以及通過上述的特征檢測過程識別的四個角點651、653、655和657定義。四邊形611可以代表矩形,其是下部看的并且稍微向中心的左傾,但是它還可能是它可以代表不同矩形的無效角的解,如圖8中無效的解線邊界711所示。如果非常嚴格的有效被應(yīng)用于2空間角度和邊長,則解釋傾斜圖像的范圍將被太嚴格限制,并且四邊形611將被拒絕,由于它與矩形太不相同。識別矩形文檔的處理因此可以允許明顯的背離90度的候選四邊形的四個角的每一個的角度的誤差,和/或明顯的背離相等的四邊形的每對對邊的長度,盡管在它們角度上距離90度的超額偏差,或者在所述對對邊的長度上還是使得候選四邊形不合格。實際上,無需不合格而允許多么明顯的這些偏差在各個實施例中可能是不同的,并且例如在一個實施例中是可調(diào)節(jié)的。在示例性實施例中,為了確定二維空間角是否代表了三維空間中所需大小和形狀的扁平矩形,角坐標可以在進行任意其它確認之前從二維空間轉(zhuǎn)換為三維空間。在通常的情況下,問題是處于約束中的,并且可能有無窮多的解答,包括在任意平面和相機頂點定義的無窮四邊錐之間的全部可能的交叉,這些四個邊緣的每一個通過頂點以及四個識別的角點651、653、655和657的每一個。在一個不例性實施例中,這種轉(zhuǎn)變可以利用非線性編程技術(shù)實現(xiàn),利用各種假設(shè)來執(zhí)行。在這個例子中,可以使用以下三種假設(shè)I、三維空間坐標真的代表矩形,因此每個三維空間的角的角度為90°。2、矩形的中心是在固定位置。這意味著除了四個自由變量(每個角的z坐標),還可以需要少量值,例如僅僅需要三個或者僅僅需要兩個,并且例如可以計算保留的一個或兩個。與第一假定一起,這避免了無窮多的解答,并且還防止了為零的所有z坐標的退化解。3、角的z坐標是類似的一換句話說,矩形相對于相機不是非常傾斜。在這個示例性實施例中,這種假定提供一組合理的開始值給非線性解決者,以便更快找到解答。矩形到相機的距離可以根據(jù)外形尺寸來估計,且可以用作每個角的初始z坐標。在這個示例性實施例中,利用首次假定,可以構(gòu)建方程,其變量是三個自由角的三維空間z坐標,其結(jié)果代表了四個角的角度距離90°還有多遠,并且利用其它兩種假定,這個方程可以利用非線性編程而求解(從減少角度誤差的意義上說)。作為這個示例性實施例的方程的例子可以按照如下構(gòu)建,利用傳統(tǒng)的代數(shù)符號,單獨一個羅馬字母表示的三維空間中的點,單獨一個粗斜體字母表示的二維空間的點,示出線的終點的字母對的線,以及具有音調(diào)號Γ)的單獨一個字母的角度。首先,在這個示例性實施例中,基于每個點的假定的Z坐標,利用簡單的透視變換,角的-二維空間X和y坐標被轉(zhuǎn)變?yōu)槿S空間Ax=sAxAzAy==sAyAzBx=sBxBzBy==sByBzCx=sCxCzCy==sCyCzDx=sDxDzDy==sDyDz其中S是將二:維四邊形的大小與相機的角度視場相比得到的縮放因數(shù)。在僅僅具有三個自由變量的情況下,點B、C和D的z坐標可以在求解處理期間自由變化,但是點A的z坐標是由以上第二假定限制的,并且總是等于4Rz-Bz-Cz_Dz,其中Rz是矩形中間到相機的估計距離。接著每個邊和每個對角的長度的平方可以被如下計算SAB==(Ax-Bx)2+(Ay-By)2+(Az-Bz)2SBC==(Bx-Cx)2+(By-Cy)2+(Bz-Cz)2SCD==(Cx-Dx)2+(Cy-Dy)2+(Cz-Dz)2SDA==(Dx-Ax)2+(Dy-Ay)2+(Dz-Az)2SAC==(Ax-Cx)2+(Ay-Cy)2+(Az-Cz)2SBD==(Bx-Dx)2+(By-Dy)2+(Bz-Dz)2現(xiàn)在,隨著4個角的角度更接近90°而降低的誤差值可以被導(dǎo)出Ae==SDA+SAB-SBDBe==SAB+SBC-SACCε==SBC+SCD-SBDDe==SCD+SDA-SAC如果任何角是90°,那么通過Pythagoras定理,相應(yīng)的誤差值會是零。然而,如果角度不是90°,那么余弦規(guī)則指出該誤差值,例如,對于角A,將等于Ac=2.DA.AB.cosA隨著:^趨于90°,其將趨于零。由于DA和AB趨于零,該誤差值也將趨于零,隨著它們的相應(yīng)的z坐標趨于零,其將依次趨于零。然而,因為應(yīng)用到角的限制,例如因為在當前例子中定義Az的方式,它不會和其他z坐標一樣同時為零,在這個例子中。這防止了退化解Az=Bz=Cz=Dz=O。最后,四個誤差值可以組合為單獨一個值,解決者能夠?qū)で笞钚』?。需要一種方法,其將防止抵償負誤差的正誤差,因此單獨誤差的平方可以求和Totalε=A2e+B2e+C]+D2e在這個示例性實施例中,盡管會稍微快速地將誤差的絕對值求和,而不是它們的平方,但這么做會給方程曲面引入中斷,這可能降低求解的精確度。用于以上示例性實施例的求解方法是迭代的,其通過以小德耳塔值重復(fù)改變?nèi)齻€自由變量和查看這些變化是否提高結(jié)果,來尋求最小化上述方程的結(jié)果。對于每次迭代,它可以計算總的誤差,在一個實施例中,高達27次——這是因為它將使用每個自由變量本身,利用增加的德耳塔,以及減少的德耳塔(它可能進行小于27次計算,因為它將不重復(fù)在前次迭代中已經(jīng)進行的計算)。如果給定的變化集合沒有提高結(jié)果,系統(tǒng)5000可以確定當前14結(jié)果必須是接近本地最小值,并且因此減少下次迭代的德耳塔。當?shù)露_到指定的最小值,或者達到最小德耳塔值之前,迭代的數(shù)目達到了指定的限制,該求解處理可以終止。在這個示意性實例中,這通常發(fā)生得很快,因為方程表面是連續(xù)的和相對平滑的。在這個示例性實施例中,原始角求解的有效性接著能夠通過在三維空間角上的兩次簡單核查被確定。首先,三維空間角度可以被核查為足夠接近90°,接著矩形邊的縱橫比可以被核查為足夠接近預(yù)期值。這些測試能夠比二維空間四邊形上相應(yīng)的核查更加嚴格,例如,在示例性實施方式中,三維空間角度可以被核查在90°±0.25°范圍中,縱橫比在預(yù)期值的2%以內(nèi)。在這個示例性實施例中,測試可以進行得甚至更加嚴格,沒有相對接近優(yōu)選平面的文檔可能被拒絕。在這個例子中,如果滿足兩種測試,則處理可以繼續(xù)。邊緣檢測處理的各種實施例因此可以包括測量識別的線性特征之間的角度,評估所測量的角度是否在大約90度的受限的斜角之內(nèi),如果是,識別線性特征的交叉點為被識別的角點。在各種示意性實施例中,傾斜值可以被認為等于角度誤差或者角度中的誤差值,表示2D90度角度的3D成像的傾斜效果。結(jié)果的平滑在這個示例性實施例中由文檔檢測處理返回的結(jié)果值是原始圖像中的2D角位置、3D文檔距離、相機軸的偏移和旋轉(zhuǎn)角度、縱橫比與預(yù)期值的差值、以及陰影量。在這個示例性實施例中,因為在單個邊緣求解中的小變化會對最終的三維空間求解產(chǎn)生巨大的差值,因此這些結(jié)果可以通過計算移動均值在指定時期平滑。在這個示意性實施例中,如果該值突然以高于指定量發(fā)生改變,那么新的結(jié)果可以臨時忽略,并且返回原先那個,除非所有四個角都已經(jīng)變化,在這個情況下,移動均值可以被重置,因為它可能假設(shè)相機(或文檔)快速移動到新位置。圖像陰影檢測還可以執(zhí)行圖像質(zhì)量的其它檢查,例如圖像陰影檢查和相機移動檢查。文檔上的陰影可以嚴重影響它的可讀性,所以圖像還可以針對額外的陰影被檢查。在這個示例性實施例中,例如可以通過將組中的縮略圖像素顏色求和,將值的合成列表以升序從最黑組到最亮組排序,形成近似表示原始圖像亮度值的柱狀圖,以及在柱狀圖中檢查百分比值-這可以支持在陰影和文檔內(nèi)在的對比特征之間的可靠分析-來執(zhí)行例如陰影檢測。例如,在示例性實施例中,通過將10X10組中的縮略圖像素顏色值求和,可以執(zhí)行陰影檢測。值的合成列表然后可以升序排序,以便首先是最黑的組,最后是最亮的組,形成近似表示原始圖像亮度值的柱狀圖。然后可以檢查第10和第90百分比值。在這個示意性實施例中,這是因為具有陰影的圖像通常在最低值和最高值之間表示與沒有陰影的圖像相比明顯更大的差值,但是兩端的盡頭可能需要被忽略。圖10用圖801示出了這個點,其示出了從陰影和沒有陰影的相同的示例性目標文檔獲得的值。在圖801,線811代表大約第10個百分點,線813代表大約第90個百分點,并且標記點示出陰影圖像的值的較高比率。在這個示例性實施例中,陰影百分比可以計算為100-(第10個百分值X100)/(第90個百分值)這個值可以接著被檢查小于文檔配置文件中的最大值。這個最大值需要根據(jù)文檔類型設(shè)置,因為具有大面積不同顏色和/或陰影的文檔將顯露出這種方法,在相同的光照條件下,具有比更統(tǒng)一的文檔更大的陰影百分比。在這個示例性實施例中,如果陰影檢查失敗了,可以在設(shè)備屏幕上顯示圖形操作者暗示圖標,來通知操作者。相機移動檢查還可以進行圖像質(zhì)量的其它檢查,例如相機移動檢查。在示例性實施例中,可以執(zhí)行這種檢查,當已知移動設(shè)備1000在移動時,防止用戶試圖捕獲靜止圖像。在示例性實施例中,可以執(zhí)行相機移動檢查,當已知移動設(shè)備1000在移動時,防止用戶試圖捕獲靜止圖像。在示例性實施例中,移動檢查可以例如比較來自當前預(yù)覽圖像和前一預(yù)覽圖像的像素塊的組,并且對像素組的全部紅、綠或藍值中的任一種進行變化已經(jīng)改變得超過指定量作為相機的過度移動的指示??梢圆扇「鞣N步驟來防止這些因素,例如陰影,或者妨礙文檔圖像捕獲的相機移動,包括自動步驟和/或操作者暗示。移動檢查可以例如比較來自當前預(yù)覽圖像和前一預(yù)覽圖像的4X4像素的64組。如果像素組的全部紅色、綠色或藍色值的任一種已經(jīng)變化地超過指定量,那么可以在顯示器1222上示出圖標。在各種示例性實施例中,系統(tǒng)5000可以操作以便具有流預(yù)覽圖像的預(yù)覽窗口可以在數(shù)字設(shè)備的顯示器上示出,如圖I、17和18所示。系統(tǒng)5000可以操作以便移動設(shè)備1000可以在顯示器1222上顯示流預(yù)覽圖像1111,其中流預(yù)覽圖像1111示出了相機正在查看的低分辨率的實時預(yù)覽。預(yù)覽圖像1111可以為在提高成功文檔捕獲中的各種有用的目的服務(wù)。例如,示例性文檔捕獲處理的執(zhí)行可以識別多個不同標準和/或非標準文檔簡檔類型,具有相關(guān)的文檔縱橫比和大小。預(yù)覽窗口1101可以示出特定文檔配置文件類型的表示。例如,示例性文檔捕獲處理的執(zhí)行可以預(yù)先選擇文檔簡檔類型。在另一個示例性實施方式中,文檔簡檔類型可以在屏幕頂部顯示,如果不是要求的那一個,那么文檔簡檔類型下拉菜單1141可以被打開,可以選擇在菜單上列出的若干可用簡檔中的一個,如圖11所示。列出的菜單選項可以組合文檔簡檔類型和定向,例如A5風(fēng)景,A4風(fēng)景,A5人像,A4人像等,如圖11所示。不同的簡檔可以被存儲用于各種標準的文檔類型,每一個可以具有例如縱橫比、邊緣長度、目標顏色平衡等相關(guān)參數(shù)的簡檔。例如這些的標準參數(shù)可以結(jié)合一組固定參數(shù)一起使用來控制處理。例如,系統(tǒng)5000還可以是可操作的以便該簡檔可以經(jīng)由鍵盤1226、通過按壓鍵盤1226的輸入鍵1228打開文檔簡檔類型下拉菜單1141、利用下箭頭和/或上箭頭來高亮顯示所需簡檔、以及接著再次按壓輸入鍵1228來選擇它來進行選擇。在這個示例性實施例中,新的簡檔或者具有定向的簡檔的組合還可以很簡單的被加入或者是現(xiàn)有的被修改的簡檔。圖像簡檔上的額外信息可以在以下配置文件小節(jié)中提供。操作者暗示利用選擇的正確簡檔,操作者可以將移動設(shè)備1000的成像系統(tǒng)400或者相機定位到文檔110。在這點,在這個示例性實施例中,如果候選文檔方案已經(jīng)通過了全部測試,那么可以表示它可能代表有效文檔。然而,在示例性實施例中,系統(tǒng)5000可以是可操作的以便在允許靜止圖像捕獲和保存(例如捕獲和保存文件表示)之前可以進行最后的一組檢查。在這個示例性實施例中,這些檢查保證了文檔滿足質(zhì)量成像的某個標準,例如文檔沒有擴展超出如透鏡組件250組合圖像傳感陣列1033所定義的終端或相機的視場、文檔采取了視場的某個最小量、以及文檔沒有傾斜使得在圖像轉(zhuǎn)化處理期間有場深問題或者圖像降級。參考圖12-17中的一個或多個描述和討論操作者暗示的各個方面。系統(tǒng)5000可以是可操作的以便預(yù)覽窗口可以提供操作者暗示或者指導(dǎo)指示,其可以采用圖形操作者暗示圖標和/或其它用戶感知指示、圖形或其它的形式,以在定位移動設(shè)備1000和/或文檔110從而提高捕獲文檔110的高分辨率圖像的成像質(zhì)量中向用戶提供操作引導(dǎo)。各種不同的操作者暗示圖標可以用來指導(dǎo)用戶采用多個類型的動作來改善文檔捕獲的成像質(zhì)量。在各種實施例中,操作者暗示可以采取任何用戶可感知形式,示例性包括聲音或音頻輸出、觸覺輸出或任意類型的圖形或其它視覺輸出,并且可以包括輸出的任意組合。在示例性實施例中,系統(tǒng)5000可以是可操作的以便預(yù)覽窗口可以示出在文檔110處指出的具有成像子系統(tǒng)400的三個中的一個沒有邊界的文檔(即,其表示)、具有紅色邊界的文檔,或者具有綠色邊界的文檔,來指示不同狀態(tài)。在這個示例性實施方式中,系統(tǒng)5000可以是可操作的以便如果整個文檔是可見的且沒有邊界的,程序不能檢測文檔的存在。例如,這可能是因為文檔距離太遠了,光照條件差(例如,文檔部分地在強太陽光下),背景正“轉(zhuǎn)移”識別處理或者部分文檔延伸在相機的視場以外。在這個示例性實施例中,系統(tǒng)5000可以是可操作的以便如果這些檢查中的任何一個失敗了,可以在顯示器1222上渲染操作者暗示圖標,示出操作者如何移動終端來解決成像質(zhì)量標準失敗。圖12示出了在應(yīng)用窗口1101中預(yù)覽圖像1111中渲染的操作者暗示圖標1121的示例性的例子,作為操作者暗示圖標的示例性例子。質(zhì)量成像標準的失敗可以在特定時段上聚集,以便操作者不以快速變化的指令來呈現(xiàn)。例如,利用操作者暗示圖標,用戶可以例如被提示來確保文檔上的光照是合理均勻的,以試著更接近文檔進行移動,或者將文檔放置在更加統(tǒng)一的背景中。系統(tǒng)5000可以是可操作的以便一旦文檔被檢測,它將示出重疊邊界。例如,紅色邊界表示文檔已經(jīng)被檢測了,但是將生成的圖像可能由于某些原因中的一個而不是最佳的。在這種情況下,操作者暗示圖標可以在屏幕上顯示為關(guān)于如何改進圖像的一種視覺指令,例如,左邊下方的屏幕截圖告訴操作者移動終端更接近于文檔。系統(tǒng)5000可以是可操作的以便如果服從指令,那么邊界可以變?yōu)榫G色,表示掃描鍵1228可以被按壓來捕獲文檔。在這個示例性實施例中,文檔沒有必須針對邊界對整或居中變?yōu)榫G色,因為最后捕獲的圖像將自動按需裁剪/縮放/旋轉(zhuǎn)。這在圖17中示出。系統(tǒng)5000可以是可操作的以便呈現(xiàn)紅色邊界時顯示的圖標顏色將循環(huán),從而對于明亮和黑暗的背景都是可視的,并且它還可能是動畫的。它可能包括圖13-16中示出的任意圖標,其中每個圖標作為用戶暗示圖標。圖13示出了直線指示符圖標,向用戶提示在八個所示方向的任意一個方向平移移動移動設(shè)備1000。如圖13所示,這些直線指示符可以從具有八個不同方位的任意一個的箭頭選擇,包括向上、斜向左上、向左、斜向左下、向下、斜向右下、向右和斜向右上。這些僅僅是示例性的例子,暗示圖標可以提供任意方向上的點,并且精確地在移動設(shè)備1000應(yīng)該被移動的方向上的點。暗示圖標的圖形格式還可以采取任意各種形式;另一個示例性的例子是在所需方向上移動的移動設(shè)備1000的動畫圖像。圖14示出了用戶暗示圖標,向用戶提示在所指示的方向上旋轉(zhuǎn)移動設(shè)備1000。圖14的圖標構(gòu)成了顯示在監(jiān)視器上的曲線指示符,表示旋轉(zhuǎn)設(shè)備的方向。圖15示出了用戶暗示圖標,提示用戶更接近目標文檔或者遠離目標文檔來移動移動設(shè)備1000。圖15的圖標作為監(jiān)視器上顯示的距離指示符,指示更接近目標或者更遠離目標重新定位設(shè)備的方向。圖16示出了用戶暗示圖標1601,指示文檔部分在陰影中,并且應(yīng)該被移動到光照更加均勻的地方。圖標1601作為在監(jiān)視器上顯示的部分陰影指示符,指示明顯的部分陰影模糊了候選四邊形形狀。圖16還示出了用戶暗示圖標1602,指示文檔的圖像因為相機移動是不清楚的。圖標1602作為監(jiān)視器上顯示的額外移動指示符,表示成像系統(tǒng)和/或候選四邊形形式的至少一個正在顯示出額外的移動,干擾了識別定義候選四邊形形式的線性特征的能力。系統(tǒng)5000可以是可操作的以便用戶暗示圖標1602僅僅在掃描鍵1227已經(jīng)被按壓來捕獲文檔圖像之后使用,并且指示該圖像沒有足夠尖銳,因此終端應(yīng)該被拿得更穩(wěn)一些,并嘗試再次捕-M-犾。作為示例性例子,如果文檔非常接近視場的左手邊,左頂角超出了視圖,那么可以示出曲線指示符用戶暗示圖標1401,如圖14所示,告訴操作者去順時針旋轉(zhuǎn)設(shè)備。然而,在這個示例性實施例中,如果在這之后不久,左底角超出了視圖,那么替代告知操作者逆時針旋轉(zhuǎn)示出的設(shè)備的用戶暗示圖標,可替代示出直線指示符用戶暗示圖標1307,圖標1307如圖13中一樣告知他們將該設(shè)備移到左邊。在一個示例性實施例中,系統(tǒng)5000不需要可操作的來顯示掃描按鈕1227,并且相反可以是可操作的以便文檔的較高質(zhì)量較高分辨率靜止圖像響應(yīng)于確定對應(yīng)于較高分辨率幀(通常被緩存)的較低分辨率幀是可接受的質(zhì)量而被保存,無需同樣響應(yīng)于激活掃描按鈕1227的處理。在系統(tǒng)5000是可操作的以便用于確定幀質(zhì)量被處理的相應(yīng)于較低分辨率幀的較高分辨率幀已經(jīng)被緩沖,被緩沖的較高分辨率幀可以被保存,或者可以被處理用來保存響應(yīng)于激活按鈕1227的圖像,指示移動設(shè)備1000應(yīng)該被拿得更穩(wěn)一些的圖標可以不被顯示(當前手移動不會影響之前捕獲的幀的移動)。系統(tǒng)5000可以是可操作的以便有出現(xiàn)在這個屏幕上的兩個其它圖標一當閃光燈打開時,小的“光球”圖標可以被顯示在靠近屏幕的左下方,并且當正在寫入診斷時,正如以下在配置文件部分中進一步描述的,在這個示例性實施例中,小的“扳手”圖標可以被顯示靠近屏幕的右下方。在這個示例性實施例中,系統(tǒng)5000可以是可操作的以便一旦全部成像質(zhì)量標準都滿足了,操作者可以被提示來捕獲并保存靜止圖像(例如,文檔表示,該表示可以包括在圖像數(shù)據(jù)的幀中)。在一個實施例中,系統(tǒng)5000可以是可操作的以便當成像質(zhì)量檢查被滿足時,移動設(shè)備1000可以自動成像并保存文檔110的高分辨率拷貝,或者提示用戶輸入來成像并保存文檔110的高分辨率拷貝,例如通過激活在移動設(shè)備1000上的掃描按鈕1227,如圖17所示。系統(tǒng)5000可以是可操作的以便當掃描按鈕1227被激活時,掃描按鈕1227的激活導(dǎo)致在按鈕激活之后捕獲的幀或圖像被保存或者被處理為保存。在各種示例性實施例中,被捕獲并且經(jīng)受處理為保存的圖像數(shù)據(jù)的幀可以具有比針對質(zhì)量檢測經(jīng)受處理的幀更高的分辨率(例如,可以具有例如1600X1200或者1280X1024的分辨率)。系統(tǒng)5000還可以是可操作的以便當掃描按鈕1227被激勵時,如這里所述的,相應(yīng)于針對質(zhì)量檢測經(jīng)受處理的較低分辨率幀的緩沖過的較高分辨率幀,被保存或者被處理為保存特征圖像,例如文檔。在各種示例性實施例中,被緩沖的較高分辨率的幀可以具有與圖像傳感器陣列的分辨率相等的分辨率或者另一相對較高的分辨率,例如1600X1200或者1280X1024。在各種示例性實施例中,幀或圖像的保存,例如文檔表示,可以包括將幀寫入到長期存儲存儲器,例如存儲器1084,它可以是例如閃存或者硬盤驅(qū)動器。系統(tǒng)5000還可以是可操作的以便幀或圖像的保存(例如,文檔表示),無需響應(yīng)于通過確定可接受的質(zhì)量完成所述質(zhì)量檢查激勵掃描按鈕1227,并且還無需響應(yīng)于激勵掃描按鈕1227而發(fā)生。在各種示例性實施例中,用于保存而處理的圖像數(shù)據(jù)可以是在完成質(zhì)量檢查后或者在質(zhì)量檢查完成之前捕獲的幀的圖像數(shù)據(jù)(如相應(yīng)于用于質(zhì)量檢查而處理的幀的緩沖過的幀被處理用于保存一樣)。預(yù)保存處理在各種示例性實施例中,這是在文檔圖像可以被保存之前進行的最后處理,并且在各種示例性實施例中,可以包括一個或兩個階段。在示例性實施例中,第一階段可以包括同時執(zhí)行的三個或四個獨立功能。首先,這個處理階段可以包括從被捕獲圖片中提取文檔圖像,并利用2X2雙線性內(nèi)插對它進行變換,使其成為矩形的和垂直的。第二,該處理階段可以包括降低通過相機透鏡和光照子系統(tǒng)800產(chǎn)生的漸暈。第三,這個處理階段可以包括利用在前面步驟中收集的信息,校正圖像亮度和顏色平衡,以便其符合圖像簡檔中保存的目標值。第四,如果要求灰度級圖像,每個像素顏色值可以被設(shè)置為單獨顏色值的均值。在這個示例性實施例中,第二處理階段可以由文檔簡檔中的標記控制,并且利用卷積濾波可選地使圖像銳化。在這個示例性實施例中,顏色平衡校正可以通過從RGB到HSV或者其它某些類似的顏色空間并且再次轉(zhuǎn)換回來的顏色空間轉(zhuǎn)換來執(zhí)行。然而,這種處理可能比某些應(yīng)用或者情況下花費更多時間,因此在其它示例性實施例中可以采用低計算密度(但是因此可能準確性低)的方法。兩種簡單方法中任一種可以用于不同的示例性實施例中,其中一個涉及將平均源值和目標值之間的差值增加到每一個像素,另一個涉及將每個像素除以平均源值,并將它乘以目標值。當差值很大時,第一種方法工作得更好,但是可能不能很好地保存圖像對比度。第二種方法可以更好得保存圖像對比度,但是當差值很小時才可以工作得很好。各種示例性實施例可以使用兩種方法的結(jié)果的平均值,以與每個顏色的值中的差值的大小成比例地加權(quán),其可以在各種示例性實施例中在校正顏色溫度差值時工作得相當好。圖像銳度檢查在示例性實施例中,當在顯示靜止圖像的屏幕大小版本之前靜止圖像已經(jīng)被選擇用于捕獲時,可以針對銳度檢查它。僅僅通過查看預(yù)覽屏幕大小版本來查看圖像有多么尖銳是很困難的,并且這個圖像銳度檢查可以對此補償。銳度檢查可以示例性采樣像素的鄰近對的隨機集合,并返回表示為像素顏色值的平均總和的百分比的像素顏色值中的絕對差值的平均值。這樣工作是因為模糊的圖像在亮度上從一個像素到下一個像素與尖銳圖像相比具有更小的變化。如圖18所示,在這個示例性實施例中,銳度檢查可以單獨進行,例如,圖像的五個不同部分一每個象限加上中間部分一一旦圖像超過文檔邊緣,忽略最外面的區(qū)域。這種處理帶來各種優(yōu)點。首先,如果當靜止圖像被捕獲時相機正在被旋轉(zhuǎn),移動模糊的效果在整個文檔上不同。第二,文檔在不同部分可以具有不同的等級細節(jié)。例如,如果文檔的特定象限大體上是白色的,那么在銳度測試上通常不會有好的成績。如果這樣,針對那個象限可以降低最小的銳度值,或者通過將文檔簡檔中的那個象限的銳度值設(shè)置為零來完全跳過測試。在示例性實施例中,一旦捕獲了足夠尖銳的靜止圖片,文檔的屏幕大小圖像可以從其中提取和進行變換,以便其是矩形的和垂直的。例如,圖I示出了具有如可由文檔捕獲處理而捕獲的候選文檔110的預(yù)覽圖像1211;圖9示出了候選文檔110,其已經(jīng)從預(yù)覽圖像1211中提取和變換,使其成為獨自所顯示的矩形的和垂直的、且被變換的、矩形的和垂直的候選文檔110B。在這個處理期間,可以收集顏色信息,其將被用來校正預(yù)保存處理期間的圖像。在這個示例性實施例中,圖像可以顯示在顯示器1222上,并且可以在文檔圖像能夠被保存之前最后預(yù)保存處理步驟之后。在各種示例性實施例中,這個最后的預(yù)保存處理可以示例性涉及任意或全部以下步驟從被捕獲的圖片中提取文檔圖像,利用2X2雙線性內(nèi)插將它進行變換,以便使其成為矩形的和垂直的,降低相機透鏡和LED閃光燈產(chǎn)生的漸暈,利用前面步驟中收集的信息校正圖像亮度和顏色平衡,以便其符合圖像簡檔中保存的目標值,將圖像轉(zhuǎn)換灰度級,例如利用3X3卷積濾波器對圖像進行銳化,和/或校正顏色平衡。圖像文件保存一旦預(yù)保存處理完成了,操作者可以在各種示例性實施例中被提示或允許來保存文檔圖像,例如通過按壓輸入鍵1228。在其它示例性實施例中,系統(tǒng)5000還可以是可操作的以便文檔圖像的保存響應(yīng)于所述預(yù)保存處理完成來進行,而不是輸入鍵1228的輸入,即無需進一步響應(yīng)于輸入鍵1228的激活來保存。如示例性實例,保存可以利用微軟公司的ImagingFactory組件來執(zhí)行。在各種示例性實施例中,保存圖像可以包括將圖像寫入存儲存儲器1084,它可以是例如所選擇的圖像文件格式中的閃存或者硬盤驅(qū)動器。系統(tǒng)5000可以是可操作的以便一旦文檔圖像已經(jīng)被成功捕獲,可以顯示被捕獲的文檔的預(yù)覽。系統(tǒng)5000可以是可操作的以便可以利用可用屏幕區(qū)域的最大量來顯示預(yù)覽,因此較高文檔將利用白色的左右邊界來顯示,更寬文檔將利用白色頂部和底部邊界來顯示。這是在圖9中示例性示出的。系統(tǒng)5000可以是可操作的以便幾秒鐘之后,提示出現(xiàn)在如上所述的圖像下方。在示例性實施例中,系統(tǒng)5000可以是可操作的以便按壓輸入按鈕1228將該文檔保存到具有文件名DocYYYYMMDDHHMMSS.ext的\IPSM\文檔捕獲,其中ext表示所選文件類型,選自從jpg、png或bmp文件類型。在一個實施例中,系統(tǒng)5000可以是可操作的以便如果替代地按壓掃描按鈕1227,文檔將不被保存。在兩種情況下,預(yù)覽窗口將接著被再次顯示,以便如果需要的話可以執(zhí)行另一個捕獲。被保存的圖像可以針對光學(xué)效應(yīng),例如漸暈和顏色平衡被校正,因此通常將具有比預(yù)覽更高的質(zhì)量。這是在圖9中示例性示出的。在示例性實施例中,為了退出程序,用戶可以輕擊菜單欄的退出按鈕,或者當顯示預(yù)覽窗口時按壓右邊的菜單按鈕。在一個示例性實施例中,系統(tǒng)5000可以是可操作的以便系統(tǒng)5000可以通過菜單選擇,并且還通過基于XML的配置文件來配置。系統(tǒng)5000可以是可操作的以便隨后的菜單選擇可以通過輕擊顯示器1222上顯示的菜單欄的選項或者通過按壓鍵盤1226的指定菜單按鈕可用,菜單選擇的每一個具有顯示在顯示器1222上的相應(yīng)的激活按鈕。系統(tǒng)5000可以是可操作的以便任意以下涉及的菜單選項可以通過選擇顯示在顯示器1222上的顯示菜單選項來有效。閃光燈在捕獲處理期間的閃光燈狀態(tài),“關(guān)閉”、“自動”或“打開”。當文檔簡檔被選擇時初始化這個菜單選項,但可以隨后變化。文件類型文檔圖像將被保存的格式,“低質(zhì)量JPEG”、“中質(zhì)量JPEG”、“高質(zhì)量JPEG”、“PNG”或“BMP”。當文檔簡檔被選擇時初始化這個菜單選項,但可以隨后變化。智能聚焦如果這個選項啟用,則根據(jù)從終端1000到文檔的估計距離來將設(shè)定透鏡焦點。如果這個選項禁用,替代地,相機將使用自動聚焦模式。自動聚焦通常保留啟用,因為它將降低捕獲圖像花費的時間。寫診斷如果這個選項啟用,則程序?qū)懭朐\斷文件,包括有關(guān)文檔識別處理的技20術(shù)信息。如果文檔簡檔已經(jīng)建立,其似乎不能識別預(yù)期文檔,則啟用這個選項,接著嘗試捕獲文檔圖像,將生成名為DocumentCapture.log的終端1000的終端1000根文件夾(根目錄)中的文件,其可以用于執(zhí)行診斷測試。在不同的示例性實施例中,可以利用軟件開發(fā)工具包的合適編輯器來編輯XML文件,其可以是隨移動設(shè)備1000—起出售的,在網(wǎng)站提供下載的,或者以其它方式可獲得。配置文件配置文件可以包括各種部分,每一部分可以包括定義文檔參數(shù)的鍵,如以下示例性實施例描述的。在這個示例性實施例中第一部分通常被稱為“默認”一這本身并不定義文檔類型,但是設(shè)置用于全部文檔類型的默認值。在默認之后的每個部分定義文檔類型,并且在這個示例性實施例中,可以包括至少文檔寬度和高度的鍵。它還可以包括其它鍵來覆蓋默認部分中的那些內(nèi)容。系統(tǒng)5000可以是可操作的以便相應(yīng)于在顯示器1222上顯示的那些之間的菜單選項可以有效。系統(tǒng)5000可以是可操作的以便以下選項中的任意一個可以通過選擇在顯示器1222上顯示的合適的菜單選項來有效。對于當前示例性實施例,可用鍵和它們的值為寬度以mm計的文檔寬度,范圍70到450。這個值必須是精確的,除非文檔可能沒有被識別。高度以mm計的文檔高度,范圍70到450。這個值必須是精確的,除非文檔可能沒有被識別。公差以千分之一個百分點計的文檔縱橫比公差,范圍O到100,默認20(即,2.0%)。縱橫比被定義為文檔寬度除以高度。如果測量值不同于理論值相差大于這個百分比,那么文檔圖像將被拒絕。如果文檔寬度或者高度變化非常明顯,則增加這個默認值。例如,如果兩個A5文檔被打印在A4紙上,那么通過折疊或者撕開這張紙來產(chǎn)生單獨文檔。然而,這不可能精確的完成,將帶來文檔高度的變化,因此縱橫比公差可能需要被增加。顏色模式文檔的顏色模式,“彩色”或“灰度級”。查看在“文件類型”鍵的說明中有關(guān)文件大小的信息。注意,顏色平衡校正仍將對灰度級文檔執(zhí)行,因為圖像總是被捕獲有顏色。目標R、目標G、目標B文檔的顏色平衡校正一目標平均像素紅色、綠色和藍色,范圍O到255,默認220。如果文檔不是大體是白色的,那么這些值就需要被改變,否則它的顏色不能被正確再現(xiàn)。為了確定目標值應(yīng)該是多少,利用自然光捕獲文檔圖像,并等待“按壓ENT來保存……”提示來出現(xiàn)?,F(xiàn)在按壓C鍵,并且推薦的目標均值紅色、綠色和藍色值將被顯示。如果由于合成圖像不夠尖銳,文檔不能重復(fù)捕獲,則這可能是由于顏色平衡校正刪除了太多文檔細節(jié),因此在再次嘗試之前,將全部最小文檔圖像銳度值設(shè)置為0,在目標顏色值被設(shè)置后,恢復(fù)銳度值。如果具有不同顏色的文檔需要利用相同的簡檔來捕獲,可以通過設(shè)置全部三個目標值為O來禁用顏色平衡校正。閃光燈捕獲處理期間的閃光燈模式,“關(guān)閉”、“自動”或者“打開”。默認設(shè)置“自動”適于多數(shù)情況。然而,如果文檔太亮了,最好設(shè)置閃光燈模式為“關(guān)閉”。如果文檔總是在暗光條件下成像,那么設(shè)置閃光燈模式為“打開”將稍微加速捕獲處理。亮度不用閃光燈的亮度調(diào)整,-2.0,-1.5,-1.0,-0.5、0、0.5、I.O、I.5或2.O之一。默認值O通常是合適的,除非文檔包括大面積的黑顏色,在該情況中負向調(diào)整可以防止文本在較亮面積的“沖掉”。F亮度利用閃光燈的亮度調(diào)整,-2.O、-I.5、-I.O、-O.5,0,0.5、I.O、I.5或2.O之一。默認值O通常適于大文檔,但是對于較小文檔(A5或更小)可能需要負向調(diào)整,停止由于關(guān)閉閃光燈LED帶來的圖像過度曝光。TL銳度、TR銳度、BL銳度、BR銳度、CS銳度對于文檔的左上、右上、左下和右下象限和中間區(qū)域的最小文檔圖像銳度要求,范圍O到100。在捕獲靜止圖像后,首先檢查銳度。如圖18的圖表所示,在文檔的五個區(qū)域執(zhí)行該檢查。如圖18所示,四個象限沒有完全擴展到文檔圖像邊緣,如果圖像稍微超出了實際的文檔區(qū)域,并且中間區(qū)域與其它四個區(qū)域重疊。默認值20通常適用,除非文檔在這些區(qū)域中的一個中包括非常小的細節(jié)(例如,大多是空白的),在該情況中應(yīng)該減少相應(yīng)銳度值。如果銳度值為0,那么相應(yīng)的區(qū)域?qū)偸峭ㄟ^檢查。陰影最大文檔圖像陰影量百分比,范圍O到100。默認值50通常是適用的,除非文檔具有被誤認為陰影的大面積黑色區(qū)域,在這種情況下,該值應(yīng)該被增加。如果陰影值為0,文檔將總是通過檢查。銳化文檔圖像銳化濾波器,“禁用”或“啟用”。默認值“啟用”通常適于包括大部分是文本和/或?qū)嵭膱D形的文檔,但是其中文檔包括中間色區(qū)域(通過利用改變大小和間隔的非常小的點來模擬連續(xù)色調(diào)的打印技術(shù)),例如陰影部分或正確成像的照片,禁用濾波器實際上可以提高圖像質(zhì)量。即使銳化濾波器被啟用,注意,圖像仍必須滿足指定的最小銳化標準,之后應(yīng)用濾波器以便被接受。分辨率k個像素中的文檔圖像分辨率,范圍300到2048,默認1024(S卩,I兆像素)。這可以根據(jù)所要求的圖像分辨率來變化,圖像像素寬度和高度根據(jù)文檔的縱橫比從這個圖來計算。注意,盡管由于分辨率從其默認值增加到其最大值,合成圖像可能變得不那么尖銳,并且因此最小文檔銳化值可能需要被降低。文件類型文檔圖像將被保存的格式,“低質(zhì)量JPEG”、“中等質(zhì)量JPEG”、“高質(zhì)量JPEG”、“PNG”或“BMP”。JPEG文件是最小且最快被保存的。PNG文件比BMP文件要小,但是保存花費時間比BMP要長,特別是對于彩色圖像。JPEG文件格式被設(shè)計用于保存全部顏色圖像,因此灰度級JPEG不會比等同顏色更小。然而灰度級BMP和PNG文件比它們的顏色等同小很多,并且將更快地保存。成像設(shè)備硬件返回圖2,在具有圖像傳感器的示例性移動設(shè)備1000上提供更多細節(jié),作為支持這里所述的操作的典型硬件平臺。移動設(shè)備1000可以包括透鏡組件250,其可以適于將位于目標襯底上的視場1240中的文檔110的圖像聚焦于圖像傳感器陣列1033。移動設(shè)備1000和圖像傳感器陣列1033的視場1240可以通過透鏡組件250結(jié)合圖像傳感器陣列1033來定義。圖像傳感器1032可以包括多個像素圖像傳感器陣列1033,其具有行列像素排列的像素,與列電路1034和行電路1035相關(guān)聯(lián)。與圖像傳感器1032相關(guān)聯(lián)的可以是放大器電路1036(放大器),以及模數(shù)轉(zhuǎn)換器1037,其將從圖像傳感器陣列1033讀出的模擬信號形式的圖像信息轉(zhuǎn)換為數(shù)字信號形式的圖像信息。圖像傳感器1032還可以具有相關(guān)聯(lián)的定時控制電路1038,用于控制例如圖像傳感器1032的曝光期,增益被施加到放大器1036上。在這個示例性實施例中,指出的電路組件1032、1036、1037和1038可以打包為公共圖像傳感器集成電路1040。在各種實施例中,圖像傳感器集成電路1040可以結(jié)合比指出數(shù)量的元件少的元件。在一個示例性實施例中,圖像傳感器集成電路1040可以由例如從MICRON技術(shù)公司獲得的MT9V022(752X480像素陣列)或MT9V023(752X480像素陣列)圖像傳感器集成電路提供。在一個示例性實施例中,圖像傳感器集成電路1040可以由從AREC0NTVISI0N獲得的AV21052兆像素顏色(1600X1200像素陣列)提供。在一個示例性實例中,圖像傳感器集成電路1040可以由從MICRON技術(shù)公司獲得的MTD001C12STC2兆像素顏色(1600X1200像素陣列)提供。在一個示例性實例中,圖像傳感器集成電路1040可以結(jié)合Bayer模式濾波器,以便在圖像傳感器陣列的紅色像素位置處定義紅色像素,在綠色像素位置處定義綠色像素,以及在藍色像素位置處定義藍色像素。利用這種結(jié)合了Bayer模式的圖像傳感器陣列提供的幀能夠包括在紅色像素位置上的紅色像素值,在綠色像素位置上的綠色像素值,以及在藍色像素位置上的藍色像素值。在結(jié)合Bayer模式圖像傳感器陣列的示例性實施例中,將幀經(jīng)受進一步處理之前的處理器1060可以利用開發(fā)圖像數(shù)據(jù)的單色幀的綠色像素值在綠色像素位置中間的幀像素位置內(nèi)插像素值。在另一個示例性實施例中,將幀經(jīng)受進一步處理之前的處理器1060可以利用開發(fā)圖像數(shù)據(jù)的單色幀的紅色像素值在紅色像素位置中間內(nèi)插像素值。在另一個示例性實施例中,將幀經(jīng)受進一步處理之前的處理器1060可以利用藍色像素值在藍色像素位置中間內(nèi)插像素值。在操作移動設(shè)備1000的過程中,圖像信號可以從圖像傳感器1032讀出,轉(zhuǎn)換,并存儲到系統(tǒng)存儲器,例如RAM1080。在各種實施例中,移動設(shè)備1000可以包括一個或多個存儲器元件1085,其可以示例性包括RAM1080,非易失性存儲器例如EPROM1082,存儲器存儲設(shè)備1084,以及各種其它類型的存儲器元件的任意一種。在示例性實施例中,存儲器存儲設(shè)備1084可以示例性是或者包括閃存、硬盤驅(qū)動器、任意類型的RAM、EPROM、EEPROM、DVD-ROM、CD-ROM或其它類型的ROM、光盤、磁盤、磁盒、磁帶、或者任意其它類型的易失性或非易失性或者可移動或非可移動存儲器或數(shù)據(jù)存儲器元件。在各種示例性實施例中,移動設(shè)備1000可以包括處理器1060,適于讀出存儲在存儲器1080中的圖像數(shù)據(jù),并將這種圖像數(shù)據(jù)經(jīng)受各種圖像處理算法。例如,根據(jù)各種實施例,一個或多個處理器1060可以示例性是或者包括中央處理單元(CPU)、復(fù)雜可編程邏輯設(shè)備(CPLD)、特定用途集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA),或任意類型的能夠處理邏輯操作的電路。在各種實施例中,移動設(shè)備1000可以包括提供總線仲裁的系統(tǒng)總線1500,其可以包括使用任意的各種結(jié)構(gòu)的任意各種總線結(jié)構(gòu),例如存儲器總線或者存儲器控制器,外圍總線,或者本地總線。在各種實施例中,例如,這可以包括外圍元件互連(PCI)或者夾層總線,工業(yè)標準結(jié)構(gòu)(ISA)總線,增強工業(yè)標準結(jié)構(gòu)(EISA)總線,微通道結(jié)構(gòu)(MCA)總線,視頻電子標準協(xié)會(VESA)總線,或其它總線結(jié)構(gòu)。在各種實施例中,移動設(shè)備1000可以包括直接存儲器存取單元(DMA)1070,用于將已經(jīng)經(jīng)受轉(zhuǎn)換的從圖像傳感器1032讀出的圖像信息路由到RAM1080。在圖像傳感器1032和RAM1080之間提供有效數(shù)據(jù)傳送的系統(tǒng)總線結(jié)構(gòu)和/或直接存儲器存取元件的其它實施例可以包括在各種實施例中。在本公開的示例性計算系統(tǒng)中的服務(wù)器2000、服務(wù)器3000或其它計算元件可以類似地包括任意各種一個或多個處理器、一個或多個存儲器元件、一個或多個系統(tǒng)總線或者其它數(shù)據(jù)通信元件,和其它元件。在不同實施例中,系統(tǒng)5000的存儲器可以包括任意移動設(shè)備1000、服務(wù)器2000、服務(wù)器3000或計算和/或網(wǎng)絡(luò)環(huán)境中的其它元件的存儲器。在各種實施例中,移動設(shè)備1000可以包括照明子系統(tǒng)800,用于目標區(qū)域的照明和照明模式1260的投射。例如,照明子系統(tǒng)800可以示例性包括一個或多個LED閃光燈、一個或多個持續(xù)LED燈、一個或多個氙閃光管、或其它照明元件。在各種實施例中,示例性移動設(shè)備還可以缺少照明子系統(tǒng)800。在圖I和2所示的實施例中,例如,照明模式1260可以投射到大約是但是比視場1240定義的區(qū)域大的區(qū)域上,但是還可以投射在比視場1240定義的區(qū)域小的區(qū)域。在各種實施例中,照明子系統(tǒng)800還可以包括照明透鏡組件300,如圖2的實施例中所示。除了或者代替照明透鏡組件300,照明子系統(tǒng)800可以包括可替代的光成型光學(xué)裝置,例如一個或多個擴散器、反射鏡和棱境。在使用中,移動設(shè)備1000可以以這樣的方式通過操作者針對包括承載可解碼標記120的文檔110的目標區(qū)域定向,即將照明模式1260投射到可解碼標記120上的方式。可解碼標記120可以包括任意類型的字符、符號、或其它易于被解碼的視覺可檢測特征。這可以包括通過任意各種光學(xué)字符識別(OCR)技術(shù)解碼的字符和/或數(shù)字,或者一維或二維條碼符號,如示例性實施例。參考移動設(shè)備1000的另外方面,透鏡組件250可以使用電能輸入單元1202控制。在一個實施例中,電能輸入單元1202可以操作為受控的電壓源,并且在另一個實施例中,作為受控的電流源。照明模式光源組件500可以利用光源控制電路1206控制。光源控制電路1206可以發(fā)送信號到照明模式光源組件500,例如通過照明模式光源組件500改變照明輸出的等級。移動設(shè)備1000的某些元件,例如圖像傳感器集成電路1040(和圖像傳感器陣列1033)、成像透鏡240、和照明子系統(tǒng)800可以打包成成像模塊400,其可以結(jié)合在手持外殼1014中。在另一個示例性實施例中,移動設(shè)備可以沒有照明子系統(tǒng)。在這個示例性實施例中,移動設(shè)備1000可以包括多個外圍設(shè)備,示例性包括觸發(fā)器1220,其可以用于使用于激活幀讀出和/或某種解碼處理的觸發(fā)信號有效。移動設(shè)備1000可以被適配以便激活觸發(fā)器1220激活觸發(fā)信號,并開始解碼嘗試。特別的,移動設(shè)備1000可以是可操作的以便響應(yīng)于激活觸發(fā)信號,可以采用從圖像傳感器陣列1033讀出圖像信息的方式捕獲連續(xù)的幀(典型的模擬信號的形式),并接著在轉(zhuǎn)換后將圖像信息存儲到存儲器1080(其可以在給定時間緩沖一個或多個連續(xù)的幀)。處理器1060可以是可操作的使一個或多個連續(xù)的幀經(jīng)受解碼嘗試。在另一個示例性實施例中,移動設(shè)備1000可以缺少解碼功能。在一個示例性實施例中,包括透鏡組件250和圖像傳感器集成電路1040的成像組件900的元件可以在移動設(shè)備1000中復(fù)制,每個復(fù)制的成像組件900可以結(jié)合在手持外殼1014中,每個可以采取圖2所示的成像組件900的方式與系統(tǒng)總線1500和處理器1060連接。在這個示例性實施例中,成像組件900的一個可以被優(yōu)化用來解碼可解碼標記,并且其它的成像組件900可以被優(yōu)化用來捕獲和保存圖像數(shù)據(jù)幀和圖像數(shù)據(jù)幀中的特征表示。在不例性實施例中,為了試圖解碼條碼符號,例如一維條碼符號,系統(tǒng)5000的處理器(例如,移動設(shè)備1000的處理器1060)可以處理對應(yīng)于像素位置行的幀的圖像數(shù)據(jù)(例如,行、列或像素位置的對角集合),來確定黑色和亮色單元的空間模式,且可以將每個確定的亮色和黑色單元模式通過查找表轉(zhuǎn)換為字符或者字符串。在這個示例性實施例中,在可解碼標記表示是二維條碼符號的情況下,解碼嘗試可以包括步驟利用特征檢測算法定位探測器模式,根據(jù)與探測器模式的預(yù)定關(guān)系定位與探測器模式相交的矩形行,確定沿著矩形行的黑色和亮色單元的模式,以及通過查找表將每個亮色模式轉(zhuǎn)換為字符或者字符串O移動設(shè)備1000可以包括各種接口電路,用于將各種外圍設(shè)備耦合到系統(tǒng)地址/數(shù)據(jù)總線(系統(tǒng)總線)1500,用于與同樣耦合到系統(tǒng)總線1500的處理器1060通信。移動通信1000可以包括接口電路1028,用于將圖像傳感器定時和控制電路1038耦合到系統(tǒng)總線1500;接口電路1102,用于將電能輸入電源1202耦合到系統(tǒng)總線1500;接口電路1106,用于將照明光源組控制電路1206耦合到系統(tǒng)總線1500;以及接口電路1120,用于將觸發(fā)器1220耦合到系統(tǒng)總線1500。移動設(shè)備1000還可以包括耦合到系統(tǒng)總線1500并通過接口1122與處理器1060通信的顯示器1222;還包括通過連接到系統(tǒng)總線1500的接口1124與處理器1060通信的指示機構(gòu)1224。移動設(shè)備1000還可以包括耦合到系統(tǒng)總線1500的鍵盤1226。鍵盤1226可以通過連接到系統(tǒng)總線1500的接口1126與處理器1060通信。移動設(shè)備1000還可以包括通過接口1108與系統(tǒng)總線1500耦合的范圍檢測器單元1208。移動設(shè)備1000可以用稱為幀速率的速率捕獲圖像數(shù)據(jù)的幀。典型的幀速率是60幀每秒(FPS),其被轉(zhuǎn)換為16.6ms的幀時間(幀時期)。另一種典型的幀速率是30幀每秒(FPS),其被轉(zhuǎn)換為每幀33.3ms的幀時間(幀時期)。移動設(shè)備1000的幀速率可以通過降低幀圖片大小來增加(以及幀時間減少)。示例性實施例可以使用AV2105圖像傳感器集成電路,其中最大分辨率圖片大小(1600X1200)可以被選擇,這可能產(chǎn)生24FPS的幀速率。HDTV窗口圖片大小(1280X1024)的選擇可能產(chǎn)生32FPS的幀速率。利用MT9D001C12STC圖像傳感器集成電路,最大分辨率圖片大小(1600X1200)可以被選擇,其可能產(chǎn)生20FPS的幀速率。SXGA窗口圖片大小的選擇可能產(chǎn)生28FPS的幀速率。在一個示例性實施例中的移動設(shè)備1000的示例性物理形式視圖在圖I中示出。觸發(fā)器1220、顯示器1222、指示機構(gòu)1224和鍵盤1226可以布置在圖I所示的手持外殼1014的公共面。在一個實施例中的顯示器1222、指示機構(gòu)1224和鍵盤1226可以被認為是移動設(shè)備1000的用戶接口或用戶輸入/輸出元件。在一個實施例中的顯示器1222可以結(jié)合觸摸板,用于導(dǎo)航和虛擬激勵器選擇,在該情況中移動設(shè)備1000的用戶接口可以由顯示器1222提供。移動設(shè)備1000的用戶接口還可以通過配置移動設(shè)備1000是可操作的以通過解碼編程條碼符號被再編程來提供。移動設(shè)備1000的手持外殼1014可以在另一個實施例中缺少顯示器,且采取槍風(fēng)格形式因素。這里描述的圖像處理步驟可以分布在移動設(shè)備1000、服務(wù)器2000和/或3000,且一個實施例完全可以通過移動設(shè)備1000來執(zhí)行。在這種實施例中,系統(tǒng)5000可以被認為由移動設(shè)備1000提供。這里所述的示例性設(shè)備、系統(tǒng)、裝置或方法的小例子如下Al、一種設(shè)備,包括成像子系統(tǒng),能夠提供表示入射在所述成像子系統(tǒng)上的光的圖像數(shù)據(jù);一個或多個存儲器元件,包括至少個緩沖存儲器元件,可操作地啟用以臨時存儲圖像數(shù)據(jù);以及一個或多個處理器,被啟用來從一個或多個存儲器元件中的至少第一存儲器元件接收圖像數(shù)據(jù);嘗試在圖形數(shù)據(jù)中識別定義候選四邊形形狀的線性特征;以及經(jīng)由一個或多個輸出組件提供用戶可感知暗示,用于指導(dǎo)用戶改變設(shè)備的定位,以增強在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征的能力。A2、如Al的設(shè)備,其中一個或多個輸出組件包括預(yù)覽監(jiān)視器,啟用來顯示基于圖像數(shù)據(jù)的預(yù)覽圖像,其中一個或多個處理器進一步啟用來提供用戶可感知暗示作為顯示在預(yù)覽圖像上的暗示圖標。A3、如A2的設(shè)備,其中一個或多個處理器還啟用成使得暗示圖標包括在監(jiān)視器上對應(yīng)于被識別的線性特征的蹤跡。A4、如A3的設(shè)備,其中一個或多個處理器進一步啟用成使得監(jiān)視器上對應(yīng)于被識別的線性特征的蹤跡從第一顏色變?yōu)榈诙伾?,以表示對由被識別的線性特征定義的候選四邊形形狀的成功識別。A5、如A4的設(shè)備,其中一個或多個存儲器元件還包括第二存儲器元件,其中一個或多個處理器還被啟用來向用戶提示,以指示對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像是否應(yīng)該被存儲在第二存儲器元件中,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率;以及如果用戶這么指示,那么將對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像存儲在第二存儲器元件中。A6、如A4的設(shè)備,其中一個或多個存儲器元件還包括第二存儲器元件,其中一個或多個處理器還啟用來通過將對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像存儲在第二存儲器元件中,來響應(yīng)候選四邊形形狀的成功識別,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率。A7、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的直線指示符,其指示對設(shè)備的平移再定位的方向。AS、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的距離指示符,指示將設(shè)備再定位更接近或者遠離目標的方向。A9、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的指示符,其指示旋轉(zhuǎn)設(shè)備的方向。A10、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的過度移動指示符,其指示成像系統(tǒng)和/或候選四邊形形式的至少一個顯示干擾識別定義候選四邊形形狀的線性特征能力的過度移動。All、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的部分陰影指示符,其指示明顯的部分陰影模糊了候選四邊形形狀。A12、如A2的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括基于圖像數(shù)據(jù)的輸入幀,生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中在降低分辨率的幀中的像素組合了來自輸入幀中的兩個或多個像素的信息;在監(jiān)視器上顯示降低分辨率的幀作為預(yù)覽圖像;以及嘗試在降低分辨率的幀中識別定義候選四邊形形狀的線性特征。A13、如A12的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括嘗試識別過渡對,包括在具有像素之間的差值超出了像素過渡閾值的降低分辨率的幀中的相鄰像素對,其;嘗試在兩個或多個被識別的過渡對之間降低分辨率的幀中識別一個或多個線性特征;以及提供降低分辨率的幀的一個或多個被識別的線性特征的指示。A14、如A13的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括將連續(xù)被識別的像素過渡連接到被識別的行段中,識別相互大致成一行的行段的集合,以及將被識別的成一行的行段的集合合并到被識別的線性特征中;測量被識別的線性特征之間的角度;評估被測量的角度是否在大約90度的限制傾斜值中,如果是,則將線性特征的交叉點識別為被識別的角點;評估具有四個角點的四個線性特征是否被識別,如果未被識別,則在預(yù)覽監(jiān)視器上提供暗示圖標,以指導(dǎo)用戶改變設(shè)備的定位,從而增強識別具有四個角點的四個線性特征的能力。A15、一種利用一個或多個處理器執(zhí)行的方法,包括從成像組件接收圖像數(shù)據(jù)幀;利用至少一個處理器,基于輸入幀生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中,在降低分辨率的幀中的多個像素的每一個像素組合了來自輸入幀中的兩個或多個像素的信息;利用至少一個處理器,嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征;以及利用至少一個處理器,確定圖形操作者暗示圖標,用來指導(dǎo)用戶改變成像設(shè)備的定位,以增強在隨后的圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征的能力;以及通過輸出組件提供圖形操作者暗示圖標。A16、如A15的方法,其中,該方法還包括在預(yù)覽監(jiān)視器上提供降低分辨率的幀的圖像和圖形操作者指導(dǎo)圖標,且圖形操作者指導(dǎo)圖標是從以下選擇指示對成像組件的平移再定位的方向的直線指示符;指示設(shè)備向前或向后再定位的方向的距離指示符;指示旋轉(zhuǎn)設(shè)備的方向的曲線指示符;指示圖像數(shù)據(jù)展示過度運動的過度運動指示符;以及指示明顯部分陰影模糊了候選四邊形形狀的部分陰影指示符。A17、一種包括能夠使能一個或多個計算組件的可執(zhí)行指令的計算機可讀存儲介質(zhì),包括一個或多個存儲器,用于接收圖像數(shù)據(jù)的第一幀;嘗試在圖像數(shù)據(jù)的第一幀中識別定義候選四邊形形狀的線性特征;以及提供用戶可感知暗示,用于指導(dǎo)用戶改變設(shè)備的定位,來增強在隨后的圖像數(shù)據(jù)幀中識別定義候選四邊形形狀的線性特征的能力。A18、如A17的計算機可讀存儲介質(zhì),其中可執(zhí)行指令還能夠使能一個或多個計算CN102592123A組件用于存儲多個用于用戶可感知暗示的圖形圖標;評估圖像數(shù)據(jù)是非優(yōu)化的一個或多個原因;選擇一個或多個圖形圖標,用于解決圖像數(shù)據(jù)是非優(yōu)化的一個或多個被評估的原因;以及在預(yù)覽監(jiān)視器上顯示個或多個選擇的圖形圖標,還顯示候選四邊形形狀。A19、如A18的計算機可讀存儲介質(zhì),其中可執(zhí)行指令還能夠使能一個或個多計算組件從以下選擇指示對成像組件的平移再定位的方向的直線指示符圖形圖標;指示設(shè)備向前或向后再定位的方向的距離指示符圖形圖標;指示旋轉(zhuǎn)設(shè)備的方向的曲線指示符圖形圖標;指示圖像數(shù)據(jù)展示過度運動的過度運動指示符圖形圖標;以及指示明顯部分陰影模糊了候選四邊形形狀的部分陰影指示符圖形圖標。盡管已經(jīng)參考多個特定實施例描述了本發(fā)明,應(yīng)該理解,本發(fā)明的真實精神和范圍應(yīng)該僅僅針對本說明書支持的權(quán)利要求來確定。此外,盡管在這里的多種情況下,其中系統(tǒng)和裝置和方法被描述為具有某些數(shù)量的組件,應(yīng)該理解,這樣的系統(tǒng)、裝置和方法可以采用比所述某些數(shù)量的組件更少或更多來實現(xiàn)。同樣,雖然已經(jīng)描述了多個特定實施例,應(yīng)該理解,已經(jīng)描述的關(guān)于每個特定實施例的特征和方面可以用于每個保留的特定描述的實施例。28權(quán)利要求1.一種設(shè)備,包括成像子系統(tǒng),能夠提供代表入射在所述成像子系統(tǒng)上的光的圖像數(shù)據(jù);一個或多個存儲器元件,包括至少一個緩沖存儲器元件,可操作地被啟用來臨時存儲圖像數(shù)據(jù);以及一個或多個處理器,被啟用于從一個或多個存儲器元件中的至少第一存儲器元件接收圖像數(shù)據(jù);嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征;以及經(jīng)由一個或多個輸出組件提供用戶可感知暗示,用于指導(dǎo)用戶改變設(shè)備的定位,以增強在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征的能力。2.如權(quán)利要求I的設(shè)備,其中一個或多個輸出組件包括預(yù)覽監(jiān)視器,其被啟用于顯示基于圖像數(shù)據(jù)的預(yù)覽圖像,其中一個或多個處理器進一步啟用于提供用戶可感知暗示作為顯示在預(yù)覽圖像上的暗示圖標。3.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括監(jiān)視器上對應(yīng)于被識別的線性特征的蹤跡。4.如權(quán)利要求3的設(shè)備,其中一個或多個處理器進一步啟用成使得監(jiān)視器上對應(yīng)于被識別的線性特征的蹤跡從第一顏色變?yōu)榈诙伾?,以表示對由被識別的線性特征定義的候選四邊形形狀的成功識別。5.如權(quán)利要求4的設(shè)備,其中一個或多個存儲器元件還包括第二存儲器元件,其中一個或多個處理器進一步啟用于向用戶提示,以指示對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像是否應(yīng)該被存儲在第二存儲器元件中,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率;以及如果用戶這么指示,那么將對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像存儲在第二存儲器元件中。6.如權(quán)利要求4的設(shè)備,其中一個或多個存儲器元件還包括第二存儲器元件,其中一個或多個處理器進一步啟用于通過將對應(yīng)于被識別的候選四邊形形狀的高分辨率圖像存儲在第二存儲器元件中,來響應(yīng)候選四邊形形狀的成功識別,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率。7.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的直線指示符,其指示對設(shè)備的平移再定位的方向。8.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的距離指示符,其指示將設(shè)備再定位接近或者遠離目標的方向。9.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的指示符,其指示旋轉(zhuǎn)設(shè)備的方向。10.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得暗示圖標包括在監(jiān)視器上顯示的過度移動指示符,其指示成像系統(tǒng)和/或候選四邊形形狀的至少一個顯示干擾了識別定義候選四邊形形狀的線性特征能力的過度移動。11.如權(quán)利要求2的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括基于圖像數(shù)據(jù)的輸入幀,生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中在降低分辨率的幀中的像素組合了來自輸入幀中的兩個或多個像素的信息;在監(jiān)視器上顯示降低分辨率的幀作為預(yù)覽圖像;以及嘗試在降低分辨率的幀中識別定義候選四邊形形狀的線性特征。12.如權(quán)利要求11的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括嘗試識別過渡對,包括在具有像素之間的差值超出了像素轉(zhuǎn)換閾值的降低分辨率的幀中的相鄰像素對;嘗試在兩個或多個被識別的過渡對之間降低分辨率的幀中識別一個或多個線性特征;以及提供降低分辨率的幀的一個或多個被識別的線性特征的指示。13.如權(quán)利要求12的設(shè)備,其中一個或多個處理器進一步啟用成使得嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征包括將連續(xù)被識別的像素過渡連接到被識別的行段中,識別相互大致成一行的行段的集合,以及將被識別的成一行的行段的集合合并到被識別的線性特征中;測量被識別的線性特征之間的角度;評估被測量的角度是否在大約90度的限制傾斜值中,如果是,則將線性特征的交叉點識別作為被識別的角點;評估具有四個角點的四個線性特征是否能夠被識別,如果它們未被識別,則在預(yù)覽監(jiān)視器上提供暗示圖標,用于指導(dǎo)用戶改變設(shè)備的定位,以增強識別具有四個角點的四個線性特征的能力。14.一種利用一個或多個處理器執(zhí)行的方法,包括從成像組件接收圖像數(shù)據(jù)幀;利用至少一個處理器,基于輸入巾貞生成降低分辨率的巾貞,該降低分辨率的巾貞包括比輸入幀更少的像素,其中,在降低分辨率的幀中的多個像素的每一個像素組合了來自輸入幀中的兩個或多個像素的信息;利用至少一個處理器,嘗試在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征;以及利用至少一個處理器,確定圖形操作者暗示圖標,用于指導(dǎo)用戶改變成像設(shè)備的定位,以增強在隨后的圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征的能力;以及通過輸出組件提供圖形操作者暗示圖標。15.如權(quán)利要求14的方法,其中,該方法還包括在預(yù)覽監(jiān)視器上提供降低分辨率的幀的圖像和圖形操作者指導(dǎo)圖標,且圖形操作者指導(dǎo)圖標是從以下選擇指示對成像組件的平移再定位的方向的直線指示符;指示設(shè)備向前或向后再定位的方向的距離指示符;指示旋轉(zhuǎn)設(shè)備的方向的曲線指示符;指示圖像數(shù)據(jù)展示過度運動的過度運動指示符;以及指示明顯部分陰影模糊了候選四邊形形狀的部分陰影指示符。全文摘要涉及用于在圖像信號中捕獲文檔的交互式用戶接口。公開用于交互式用戶接口的設(shè)備、方法和軟件,捕獲具有特征表示的圖像數(shù)據(jù)幀。在實施例中,設(shè)備包括成像子系統(tǒng)、一個或多個存儲器元件、以及一個或多個處理器。該成像子系統(tǒng)能夠提供代表入射在所述成像子系統(tǒng)上的光的圖像數(shù)據(jù)。該一個或多個存儲器元件包括至少一個存儲器元件,可操作地能夠存儲圖像數(shù)據(jù)的輸入幀。一個或多個處理器被啟用來執(zhí)行各種步驟。一個步驟包括從第一存儲器元件接收圖像數(shù)據(jù)。另一個步驟包括嘗試在圖形數(shù)據(jù)中識別定義候選四邊形形狀的線性特征。另一個步驟包括提供用戶可感知暗示,用于指導(dǎo)用戶改變設(shè)備的定位,以增強在圖像數(shù)據(jù)中識別定義候選四邊形形狀的線性特征的能力。文檔編號G06K9/22GK102592123SQ20111029417公開日2012年7月18日申請日期2011年5月20日優(yōu)先權(quán)日2010年5月21日發(fā)明者E·奧斯丁,P·E·肖維林申請人:手持產(chǎn)品公司