亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在預(yù)覽模式中進(jìn)行圖像捕捉參數(shù)調(diào)整的制作方法

文檔序號(hào):12288113閱讀:232來源:國知局
在預(yù)覽模式中進(jìn)行圖像捕捉參數(shù)調(diào)整的制作方法與工藝

本申請(qǐng)案主張來自2014年6月9日申請(qǐng)的題目為“在預(yù)覽模式中的圖像捕捉參數(shù)調(diào)整”的美國申請(qǐng)案第14/300,023號(hào)的優(yōu)先權(quán),所述申請(qǐng)案的內(nèi)容被以引用的方式全部并入。

技術(shù)領(lǐng)域

本發(fā)明大體涉及在電子裝置中捕捉圖像,且更具體地說,涉及在電子裝置的預(yù)覽模式中調(diào)整圖像捕捉參數(shù)。



背景技術(shù):

例如相機(jī)、智能電話、平板計(jì)算機(jī)等的現(xiàn)代電子裝置通常裝備有圖像傳感器(例如,相機(jī)模塊)。圖像傳感器用以捕捉用于在電子裝置中存儲(chǔ)和/或顯示的各種場景的相片。在相片已被捕捉和存儲(chǔ)后,此類電子裝置中的圖像處理功能可允許用戶根據(jù)他或她的偏好來增強(qiáng)或改善相片。舉例來說,一些電子裝置可允許用戶查看相片和從例如自動(dòng)增強(qiáng)、裁剪、旋轉(zhuǎn)、紅眼減少等的多種功能當(dāng)中選擇所要的編輯功能。

裝備有圖像傳感器的常規(guī)電子裝置通常用以捕捉多種類型的場景和目標(biāo)的相片。舉例來說,此類電子裝置可用以對(duì)包含文本對(duì)象(例如,文檔)或具有文本和非文本對(duì)象(例如,花、墻壁、門、光源等)的標(biāo)牌的場景拍照。然而,由于場景包含非文本對(duì)象,所以此類電子裝置的圖像傳感器可能不能夠捕捉針對(duì)場景中的文本對(duì)象優(yōu)化的相片。

此外,常規(guī)電子裝置可被配置以聚焦于場景的預(yù)定部分,例如,場景的中心部分,而非包含所要的文本對(duì)象的部分。因此,捕捉到的場景的相片中的文本對(duì)象可能不具有足夠的圖像質(zhì)量。一些電子裝置也可允許用戶手動(dòng)指定場景的所要的部分聚焦于顯示屏上。然而,在拿著電子裝置時(shí)手動(dòng)選擇場景的所要的部分可能對(duì)用戶并不非常方便。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供用于基于包含至少一個(gè)文本對(duì)象的場景的預(yù)覽圖像調(diào)整用于圖像傳感器的至少一個(gè)圖像捕捉參數(shù)以捕捉包含所述至少一個(gè)文本對(duì)象的圖像的方法和設(shè)備。

根據(jù)本發(fā)明的一個(gè)方面,揭示一種用于在預(yù)覽模式中調(diào)整至少一個(gè)圖像捕捉參數(shù)的方法(其由電子裝置執(zhí)行)。所述方法可包含基于一組圖像捕捉參數(shù),捕捉包含至少一個(gè)文本對(duì)象的場景的預(yù)覽圖像。所述方法也可識(shí)別所述預(yù)覽圖像中的多個(gè)文本區(qū)域。從所述多個(gè)文本區(qū)域,可選擇目標(biāo)焦點(diǎn)區(qū)域?;谒瞿繕?biāo)焦點(diǎn)區(qū)域,可調(diào)整所述至少一個(gè)圖像捕捉參數(shù)。本發(fā)明還描述涉及此方法的設(shè)備、裝置、系統(tǒng)、裝置組合和計(jì)算機(jī)可讀媒體。

根據(jù)本發(fā)明的另一方面,揭示一種用于在預(yù)覽模式調(diào)整至少一個(gè)圖像捕捉參數(shù)的電子裝置。所述電子裝置可包含:圖像傳感器,其被配置以基于一組圖像捕捉參數(shù)捕捉包含至少一個(gè)文本對(duì)象的場景的預(yù)覽圖像;和文本區(qū)域檢測單元,其被配置以識(shí)別所述預(yù)覽圖像中的多個(gè)文本區(qū)域。所述電子裝置還可包含目標(biāo)焦點(diǎn)區(qū)域檢測單元,其被配置以從所述多個(gè)文本區(qū)域選擇目標(biāo)焦點(diǎn)區(qū)域。所述電子裝置中的圖像傳感器控制單元可被配置以基于所述目標(biāo)焦點(diǎn)區(qū)域調(diào)整所述至少一個(gè)圖像捕捉參數(shù)。

附圖說明

當(dāng)結(jié)合附圖理解時(shí),參考以下詳細(xì)描述將理解本發(fā)明的發(fā)明性方面的實(shí)施例。

圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以在預(yù)覽模式中操作以顯示包含多個(gè)文本對(duì)象的場景的預(yù)覽圖像以用于調(diào)整至少一個(gè)圖像捕捉參數(shù)的電子裝置。

圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以基于包含多個(gè)文本區(qū)域的場景的預(yù)覽圖像調(diào)整至少一個(gè)圖像捕捉參數(shù)的電子裝置的框圖。

圖3說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以存儲(chǔ)多個(gè)相機(jī)模式以用于響應(yīng)于模式選擇輸入將圖像傳感器設(shè)定到所述相機(jī)模式中的一個(gè)的存儲(chǔ)單元的框圖。

圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以識(shí)別預(yù)覽圖像中的多個(gè)文本區(qū)域的文本區(qū)域檢測單元的框圖。

圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于通過在預(yù)覽模式中調(diào)整用于圖像傳感器的至少一個(gè)圖像捕捉參數(shù)來捕捉場景的圖像的方法的流程圖。

圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于在處于比預(yù)覽圖像高的分辨率下的場景的另一預(yù)覽圖像中的多個(gè)候選文本區(qū)域識(shí)別場景的預(yù)覽圖像中的多個(gè)文本區(qū)域的方法的流程圖。

圖7為根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置的顯示屏上顯示的多個(gè)文本對(duì)象的場景的預(yù)覽圖像。

圖8為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于在預(yù)覽模式中的場景的多個(gè)預(yù)覽圖像調(diào)整用于圖像傳感器的焦點(diǎn)參數(shù)的方法的流程圖。

圖9說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置的顯示屏上顯示的多個(gè)車輛的場景的預(yù)覽圖像。

圖10說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置的顯示屏上顯示的光源和文檔的一部分的室內(nèi)場景的預(yù)覽圖像。

圖11為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域的亮度值調(diào)整用于圖像傳感器的曝光參數(shù)的方法的流程圖。

圖12說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的可實(shí)施用于在預(yù)覽模式中調(diào)整至少一個(gè)圖像捕捉參數(shù)的方法和設(shè)備的示范性電子裝置的框圖。

具體實(shí)施方式

現(xiàn)在將對(duì)各種實(shí)施例詳細(xì)進(jìn)行參考,在附圖中說明所述實(shí)施例的實(shí)例。在以下詳細(xì)描述中,闡述眾多具體細(xì)節(jié)以便提供對(duì)本發(fā)明的透徹理解。然而,對(duì)所屬領(lǐng)域的一般技術(shù)人員將顯而易見的是,可在無這些具體細(xì)節(jié)的情況下實(shí)踐本標(biāo)的物。在其它情況下,尚未詳細(xì)描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會(huì)不必要地混淆各種實(shí)施例的方面。

圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以在預(yù)覽模式中操作以顯示包含多個(gè)文本對(duì)象140、150和160的場景100的預(yù)覽圖像180以用于調(diào)整至少一個(gè)圖像捕捉參數(shù)的電子裝置120。如所展示,用戶110可操作裝備有圖像傳感器130的電子裝置120以捕捉包含多個(gè)文本對(duì)象140、150和160的場景100的圖像。如本文所使用,術(shù)語“捕捉(capture或capturing)”可指將場景的光學(xué)圖像轉(zhuǎn)換成數(shù)據(jù)或信號(hào)且將數(shù)據(jù)或信號(hào)存儲(chǔ)在存儲(chǔ)單元中,且可包含在預(yù)覽模式(例如,實(shí)時(shí)預(yù)覽模式)中臨時(shí)存儲(chǔ)數(shù)據(jù)或信號(hào)。文本對(duì)象140可為街道標(biāo)牌,包含街道名稱“第一大街”,而文本對(duì)象150和160可分別為“禁止停車”和“禁止”標(biāo)牌。雖然將文本對(duì)象140、150和160說明為標(biāo)牌,但其可為包含、顯示或展示文本(例如,一或多個(gè)字符)的任一目標(biāo)。另外,文本對(duì)象140、150和160還可包含一或多個(gè)文本區(qū)域,其中的每一個(gè)可包含類似大小、色彩、圖案或類似者的文本或字符。如本文中所說明,電子裝置120可為裝備有圖像捕捉和處理能力的任一合適裝置,例如,數(shù)碼相機(jī)(例如,DSLR相機(jī))、智能電話、可佩帶計(jì)算機(jī)(例如,智能眼鏡、智能表等)、個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、游戲裝置等。

裝備有圖像傳感器130的電子裝置120可在預(yù)覽模式中操作以為用戶110捕捉和顯示一或多個(gè)預(yù)覽圖像。舉例來說,用戶110可拍攝包含具有街道名稱“第一大街”的文本對(duì)象140的場景100的照片以輔助導(dǎo)覽街道或用于文本辨識(shí)。根據(jù)一個(gè)實(shí)施例,電子裝置120可被配置以在用于捕捉圖像中的文本的預(yù)覽模式前或期間設(shè)定到文本模式。在文本模式中,可將多個(gè)圖像捕捉參數(shù)設(shè)定到適合于捕捉圖像中的文本的一組預(yù)定初始值。舉例來說,用于圖像傳感器130的一組圖像捕捉參數(shù)可包含焦點(diǎn)參數(shù)、曝光參數(shù)、白平衡參數(shù)、對(duì)比度增強(qiáng)參數(shù)、變焦參數(shù)、對(duì)光的敏感度參數(shù)等。

在拍攝照片前,用戶110可在預(yù)覽模式中操作電子裝置120以查看場景100的預(yù)覽圖像180。從預(yù)覽圖像180,電子裝置120可分別識(shí)別文本對(duì)象140、150和160中的多個(gè)文本區(qū)域142、152和162,且選擇文本區(qū)域142、152和162中的一個(gè)作為目標(biāo)焦點(diǎn)區(qū)域。在一個(gè)實(shí)施例中,電子裝置120可確定文本區(qū)域142、152和162中的每一個(gè)的大小和選擇具有最大文本大小的文本區(qū)域作為目標(biāo)焦點(diǎn)區(qū)域。舉例來說,在圖1的預(yù)覽圖像180中,對(duì)應(yīng)于文本對(duì)象140中的文本“第一大街”的文本區(qū)域142大于文本區(qū)域152和162。因此,電子裝置120可將文本區(qū)域142識(shí)別為目標(biāo)焦點(diǎn)區(qū)域。

在識(shí)別包含文本“第一大街”的目標(biāo)焦點(diǎn)區(qū)域142后,電子裝置120可確定指示目標(biāo)焦點(diǎn)區(qū)域142的圖像質(zhì)量的一或多個(gè)值,例如,清晰度值、亮度值、對(duì)比度值、飽和度值和類似者。基于用于目標(biāo)焦點(diǎn)區(qū)域142的圖像質(zhì)量的值,電子裝置120可確定被優(yōu)化以或適合于捕捉具有文本“第一AVENU”的目標(biāo)焦點(diǎn)區(qū)域142的至少一個(gè)圖像捕捉參數(shù)值,和將至少一個(gè)圖像捕捉參數(shù)調(diào)整到相關(guān)聯(lián)的參數(shù)值。在一個(gè)實(shí)施例中,可將至少一個(gè)圖像捕捉參數(shù)中的焦點(diǎn)參數(shù)調(diào)整到被調(diào)適以或適合于產(chǎn)生用于目標(biāo)焦點(diǎn)區(qū)域142的預(yù)定清晰度等級(jí)的值。另外或替代地,可將至少一個(gè)圖像捕捉參數(shù)中的曝光參數(shù)調(diào)整到用于產(chǎn)生目標(biāo)焦點(diǎn)區(qū)域142的預(yù)定亮度等級(jí)的曝光值(例如,光圈、時(shí)間和類似者)。

圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以基于包含至少一個(gè)文本對(duì)象的場景的預(yù)覽圖像調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)的電子裝置120的較詳細(xì)框圖。電子裝置120可包含I/O單元210、圖像傳感器130、存儲(chǔ)單元220、通信單元230和處理器240。處理器240可包含文本區(qū)域檢測單元242、目標(biāo)焦點(diǎn)區(qū)域檢測單元244、圖像傳感器控制單元246和文本辨識(shí)單元248。

I/O單元210可被配置以接收來自用戶110的命令和/或輸出用于用戶110的信息。舉例來說,I/O單元210可接收來自用戶110的命令或輸入以選擇相機(jī)模式中的一個(gè)(例如,自動(dòng)對(duì)焦模式、文本模式、夜間模式、縱向模式等)?;谶x定相機(jī)模式,圖像傳感器130可在預(yù)覽模式中操作以捕捉場景的一或多個(gè)預(yù)覽圖像。在預(yù)覽模式中,可將捕捉的預(yù)覽圖像臨時(shí)存儲(chǔ)在存儲(chǔ)單元220中,且在I/O單元210上顯示。圖像傳感器130可為能夠捕捉或感測場景或目標(biāo)的圖像的任一裝置,例如,相機(jī)或相機(jī)模塊。

當(dāng)在選定相機(jī)模式中操作時(shí),I/O單元210可從用戶110接收用于捕捉場景的圖像的命令或輸入。響應(yīng)于命令或輸入,場景的圖像可由圖像傳感器130捕捉和存儲(chǔ)在存儲(chǔ)單元220中和/或在I/O單元210上顯示。如本文中所說明,I/O單元210可為能夠接收命令和/或輸出信息的任一合適裝置,且包含觸摸屏、撥號(hào)盤、按鈕、小鍵盤、觸摸板、顯示屏或類似者。

存儲(chǔ)單元220可被配置以臨時(shí)存儲(chǔ)在預(yù)覽模式期間捕捉的預(yù)覽圖像。舉例來說,存儲(chǔ)單元220可存儲(chǔ)用于預(yù)覽圖像中的每一個(gè)的數(shù)據(jù),包含圖像數(shù)據(jù)和圖像的大小(例如,寬度和高度)。在此情況下,圖像數(shù)據(jù)可包含像素信息,例如,像素的數(shù)目和用于像素的色彩值。預(yù)覽圖像可由處理器240存取以調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)值。

存儲(chǔ)單元220可存儲(chǔ)可用于識(shí)別預(yù)覽圖像中的一或多個(gè)文本區(qū)域的分類器數(shù)據(jù)庫。在一個(gè)實(shí)施例中,分類器數(shù)據(jù)庫可包含用于預(yù)定數(shù)目個(gè)語言(例如,英語、法語和類似者)中的每一個(gè)的概率模型,其可用以確定給定文本與所述語言相關(guān)聯(lián)的概率。存儲(chǔ)單元220也可存儲(chǔ)可用于辨識(shí)與所述語言相關(guān)聯(lián)的多個(gè)字符的字符信息數(shù)據(jù)庫。對(duì)于語言中的每一個(gè),字符信息數(shù)據(jù)庫可包含在所述語言中使用的多個(gè)字符的圖案或幾何數(shù)據(jù)、表示所述語言中的多個(gè)字符的標(biāo)志符號(hào)的圖像和/或與所述語言中的每一個(gè)別標(biāo)志符號(hào)相關(guān)聯(lián)的至少一個(gè)特征。另外,存儲(chǔ)單元220可存儲(chǔ)語言的詞典數(shù)據(jù)庫,用于在辨識(shí)文本區(qū)域中的一或多個(gè)單詞過程中使用。舉例來說,詞典數(shù)據(jù)庫可包含映射到語言的多個(gè)單詞。

在一些實(shí)施例中,存儲(chǔ)單元220可存儲(chǔ)用于可包含預(yù)定大小的一或多個(gè)文本區(qū)域的多個(gè)參照物(例如,牌照、價(jià)格標(biāo)簽等)的大小信息。舉例來說,參照物中的每一個(gè)的大小信息可包含文本區(qū)域中的每一個(gè)或文本區(qū)域中的一或多個(gè)字符的大小。存儲(chǔ)單元220可使用任何合適的存儲(chǔ)裝置或存儲(chǔ)器裝置來實(shí)施,例如,RAM(隨機(jī)存取存儲(chǔ)器)、ROM(只讀存儲(chǔ)器)、EEPROM(電可擦除可編程只讀存儲(chǔ)器)、快閃存儲(chǔ)器或SSD(固態(tài)驅(qū)動(dòng)器)。

處理器240可存取存儲(chǔ)單元220中包含一或多個(gè)文本對(duì)象的場景的一或多個(gè)預(yù)覽圖像以確定用于圖像傳感器130的一或多個(gè)圖像捕捉參數(shù)值。處理器240可接著調(diào)整用于圖像傳感器130的一或多個(gè)圖像捕捉參數(shù)以確定一或多個(gè)圖像捕捉參數(shù)值。配置有一或多個(gè)經(jīng)調(diào)整的圖像捕捉參數(shù),圖像傳感器130可接著自動(dòng)或響應(yīng)于來自用戶110的輸入捕捉場景的圖像。舉例來說,可在調(diào)整圖像捕捉參數(shù)后即刻或后自動(dòng)或當(dāng)用戶110鍵入命令以通過按壓快門按鈕或啟動(dòng)用于圖像傳感器130的圖像捕捉功能來拍攝場景的照片時(shí)手動(dòng)捕捉圖像。

處理器240中的文本區(qū)域檢測單元242可被配置以從存儲(chǔ)單元220接收?qǐng)鼍暗囊换蚨鄠€(gè)預(yù)覽圖像和檢測預(yù)覽圖像中的每一個(gè)中的一或多個(gè)文本區(qū)域。在此過程中,可使用斑點(diǎn)聚集方法、基于邊緣的方法、基于連接的組件的方法、基于紋理的方法或類似者,基于任一合適的文本候選提取方案來在預(yù)覽圖像中檢測一或多個(gè)候選文本區(qū)域。在檢測到候選文本區(qū)域后,文本區(qū)域檢測單元242可從預(yù)覽圖像中的候選文本區(qū)域中的每一個(gè)提取一組特征??山又趤碜源鎯?chǔ)單元220的分類器數(shù)據(jù)庫針對(duì)所述一組特征產(chǎn)生分類評(píng)分?;谂c候選文本區(qū)域相關(guān)聯(lián)的分類評(píng)分,文本區(qū)域檢測單元242可識(shí)別預(yù)覽圖像中的一或多個(gè)文本區(qū)域。可將識(shí)別的文本區(qū)域和相關(guān)聯(lián)的分類評(píng)分提供到目標(biāo)焦點(diǎn)區(qū)域檢測單元244供從文本區(qū)域選擇目標(biāo)焦點(diǎn)區(qū)域。

根據(jù)一個(gè)實(shí)施例,在檢測到預(yù)覽圖像中的候選文本區(qū)域后,文本區(qū)域檢測單元242可存取按較高分辨率捕捉的場景的另一預(yù)覽圖像,且從較高分辨率圖像獲得對(duì)應(yīng)于檢測到的候選文本區(qū)域的候選文本區(qū)域。在此情況下,圖像傳感器130可被配置以基于多個(gè)圖像分辨率捕捉場景的多個(gè)預(yù)覽圖像。舉例來說,第一預(yù)覽圖像可按預(yù)定分辨率(例如,320×240)捕捉且臨時(shí)存儲(chǔ)在存儲(chǔ)單元220中。另外,場景的第二預(yù)覽圖像還可按比預(yù)覽圖像高的分辨率(例如,1280×720)捕捉且臨時(shí)存儲(chǔ)在存儲(chǔ)單元220中。在一些實(shí)施例中,兩個(gè)分辨率的預(yù)覽圖像可存儲(chǔ)在緩沖存儲(chǔ)器(其可為存儲(chǔ)單元220中的區(qū)域或?qū)S脠D像緩沖器)中,用于由處理器240存取。

文本區(qū)域檢測單元242可接著存取第一預(yù)覽圖像以識(shí)別第一預(yù)覽圖像中的一或多個(gè)候選文本區(qū)域和檢測候選文本區(qū)域中的每一個(gè)的位置(例如,像素坐標(biāo))。文本區(qū)域檢測單元242也可存取第二預(yù)覽圖像和確定第二預(yù)覽圖像中映射到檢測到的候選文本區(qū)域在第一預(yù)覽圖像中的位置的對(duì)應(yīng)的候選文本區(qū)域。文本區(qū)域檢測單元242可接著從第二預(yù)覽圖像中的候選文本區(qū)域中的每一個(gè)提取一組特征,和產(chǎn)生用于所述一組特征的分類評(píng)分以用于在識(shí)別第一預(yù)覽圖像中的多個(gè)文本區(qū)域過程中使用。通過使用來自較高分辨率圖像的候選文本區(qū)域,可更準(zhǔn)確地檢測具有較低分辨率的第一預(yù)覽圖像中的文本區(qū)域。

在替代性實(shí)施例中,文本區(qū)域檢測單元242可基于文本辨識(shí)結(jié)果識(shí)別來自候選文本區(qū)域的文本區(qū)域。舉例來說,文本區(qū)域檢測單元242可將預(yù)覽圖像中的一或多個(gè)候選文本區(qū)域提供到文本辨識(shí)單元248,文本辨識(shí)單元248可對(duì)候選文本區(qū)域執(zhí)行文本辨識(shí)。文本辨識(shí)單元248可接著將針對(duì)候選文本區(qū)域的文本辨識(shí)的結(jié)果提供到文本區(qū)域檢測單元242。基于文本辨識(shí)結(jié)果,文本區(qū)域檢測單元242可將一或多個(gè)候選文本區(qū)域識(shí)別為一或多個(gè)文本區(qū)域。舉例來說,如果結(jié)果指示候選文本區(qū)域中的文本被辨識(shí),那么可將候選文本區(qū)域識(shí)別為文本區(qū)域。

處理器240中的目標(biāo)焦點(diǎn)區(qū)域檢測單元244可被配置以從文本區(qū)域檢測單元242接收預(yù)覽圖像的經(jīng)識(shí)別的文本區(qū)域和相關(guān)聯(lián)的分類評(píng)分,且從文本區(qū)域選擇目標(biāo)焦點(diǎn)區(qū)域。在一個(gè)實(shí)施例中,可將具有最大分類評(píng)分(其可指示為預(yù)定語言中的文本的最大可能性)的文本區(qū)域選擇為目標(biāo)焦點(diǎn)區(qū)域。在另一實(shí)施例中,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可通過確定文本區(qū)域中的每一個(gè)的大小來選擇目標(biāo)焦點(diǎn)區(qū)域。在此情況下,可將具有最大大小的文本區(qū)域選擇為目標(biāo)焦點(diǎn)區(qū)域。

在一些實(shí)施例中,在選擇了場景的預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域后,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可將關(guān)于預(yù)覽圖像的目標(biāo)焦點(diǎn)區(qū)域的信息臨時(shí)存儲(chǔ)在存儲(chǔ)單元220中。目標(biāo)焦點(diǎn)區(qū)域信息可包含預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域的位置和大小、目標(biāo)焦點(diǎn)區(qū)域中的像素的色彩值等。目標(biāo)焦點(diǎn)區(qū)域檢測單元244可從文本區(qū)域檢測單元242接收在場景的一或多個(gè)后續(xù)預(yù)覽圖像中識(shí)別的多個(gè)文本區(qū)域。通過存取存儲(chǔ)單元220中的目標(biāo)焦點(diǎn)區(qū)域信息,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可接著基于任一合適的目標(biāo)運(yùn)動(dòng)分析方案(例如,最大似然估計(jì)器方法、擴(kuò)展的卡爾曼濾波器方法、規(guī)則化的粒子過濾器方法等)從后續(xù)預(yù)覽圖像中的每一個(gè)中的文本區(qū)域選擇目標(biāo)焦點(diǎn)區(qū)域。因此,當(dāng)圖像傳感器130在文本模式(其可由用戶110選擇)中操作時(shí),可追蹤場景的預(yù)覽圖像中的每一個(gè)中的目標(biāo)焦點(diǎn)區(qū)域。目標(biāo)焦點(diǎn)區(qū)域檢測單元244可接著將場景的預(yù)覽圖像中的每一個(gè)中的目標(biāo)焦點(diǎn)區(qū)域提供到圖像傳感器控制單元246。

處理器240中的圖像傳感器控制單元246可被配置以接收用于預(yù)覽圖像的選定目標(biāo)焦點(diǎn)區(qū)域,且基于目標(biāo)焦點(diǎn)區(qū)域調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)。在一個(gè)實(shí)施例中,圖像傳感器控制單元246可基于目標(biāo)焦點(diǎn)區(qū)域的亮度值調(diào)整用于圖像傳感器130的曝光參數(shù)。舉例來說,可確定目標(biāo)焦點(diǎn)區(qū)域的亮度值與預(yù)定亮度值之間的差。在此情況下,預(yù)定亮度值可為被優(yōu)化以或適合于捕捉參考文本區(qū)域(例如,樣本文本區(qū)域)中的文本(例如,字符)的值??山又鴮⒂糜趫D像傳感器130的曝光參數(shù)調(diào)整到減小或消除目標(biāo)焦點(diǎn)區(qū)域的亮度值與預(yù)定亮度值之間的差的曝光值。

在一些實(shí)施例中,圖像傳感器控制單元246可配置圖像傳感器130以基于多個(gè)候選焦點(diǎn)參數(shù)值在預(yù)覽模式中依序捕捉和存儲(chǔ)場景的多個(gè)預(yù)覽圖像。在此預(yù)覽模式中,捕捉的預(yù)覽圖像中的每一個(gè)可包含一或多個(gè)文本區(qū)域,在由文本區(qū)域檢測單元242和目標(biāo)焦點(diǎn)區(qū)域檢測單元244處理后,可將一或多個(gè)文本區(qū)域中的一個(gè)選擇為目標(biāo)焦點(diǎn)區(qū)域。圖像傳感器控制單元246可接收預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域且確定用于目標(biāo)焦點(diǎn)區(qū)域中的每一個(gè)的清晰度值。在目標(biāo)焦點(diǎn)區(qū)域當(dāng)中,圖像傳感器控制單元246可識(shí)別具有最高清晰度值的目標(biāo)焦點(diǎn)區(qū)域,且選擇與識(shí)別的目標(biāo)焦點(diǎn)區(qū)域相關(guān)聯(lián)的候選焦點(diǎn)參數(shù)值。圖像傳感器控制單元246可接著將用于圖像傳感器130的焦點(diǎn)參數(shù)調(diào)整到選定候選者焦點(diǎn)參數(shù)值供在捕捉文本模式中的場景的圖像過程中使用。

根據(jù)另一實(shí)施例,圖像傳感器控制單元246可通過確定目標(biāo)焦點(diǎn)區(qū)域是否與具有已知大小信息的參照物相關(guān)聯(lián)來調(diào)整焦點(diǎn)參數(shù)。在此情況下,如果將目標(biāo)焦點(diǎn)區(qū)域確定為與存儲(chǔ)在存儲(chǔ)單元220中的參照物中的一個(gè)相關(guān)聯(lián),那么圖像傳感器控制單元246可確定目標(biāo)焦點(diǎn)區(qū)域的大小或預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域中的一或多個(gè)字符的大小。給定預(yù)覽圖像的焦距,可基于參照物的大小信息和目標(biāo)焦點(diǎn)區(qū)域的大小或目標(biāo)焦點(diǎn)區(qū)域中的字符的大小計(jì)算焦點(diǎn)參數(shù)的值。圖像傳感器控制單元246可接著將用于圖像傳感器130的焦點(diǎn)參數(shù)調(diào)整到焦點(diǎn)參數(shù)值。另外或替代地,圖像傳感器控制單元246可將白平衡參數(shù)、對(duì)比度增強(qiáng)參數(shù)、變焦參數(shù)或?qū)獾拿舾卸葏?shù)調(diào)整到被優(yōu)化以或適合于在預(yù)覽模式中捕捉目標(biāo)焦點(diǎn)區(qū)域的參數(shù)值。

在調(diào)整了一或多個(gè)圖像捕捉參數(shù)后,圖像傳感器130可自動(dòng)地或響應(yīng)于來自用戶110的輸入而捕捉至少包含目標(biāo)焦點(diǎn)區(qū)域的場景的圖像且將所述圖像存儲(chǔ)于存儲(chǔ)單元220中。文本辨識(shí)單元248可接收所捕捉圖像,且基于來自存儲(chǔ)單元220的字符信息數(shù)據(jù)庫或詞典數(shù)據(jù)庫對(duì)所捕捉圖像中的目標(biāo)焦點(diǎn)區(qū)域執(zhí)行文本辨識(shí)。在一個(gè)實(shí)施例中,可通過疊加用于圖像中的目標(biāo)焦點(diǎn)區(qū)域的經(jīng)辨識(shí)文本來將所捕捉圖像顯示于I/O單元210上。另外或替代地,可將經(jīng)辨識(shí)文本轉(zhuǎn)譯成一或多個(gè)其它語言用于在I/O單元210上顯示??蓪⒔?jīng)辨識(shí)或轉(zhuǎn)譯的文本存儲(chǔ)在存儲(chǔ)單元220中或經(jīng)由通信單元230傳輸?shù)搅硪浑娮友b置。

雖然以上描述將一個(gè)目標(biāo)焦點(diǎn)區(qū)域用于調(diào)整用于圖像傳感器130的至少一個(gè)圖像參數(shù),但應(yīng)了解,圖像傳感器控制單元246可基于多個(gè)目標(biāo)焦點(diǎn)區(qū)域調(diào)整至少一個(gè)圖像捕捉參數(shù)。根據(jù)一個(gè)實(shí)施例,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可從可接收自文本區(qū)域檢測單元242的文本區(qū)域選擇多個(gè)目標(biāo)焦點(diǎn)區(qū)域。在一個(gè)實(shí)例中,可從接收的文本區(qū)域選擇分別具有第一最大分類評(píng)分和第二最大分類評(píng)分的兩個(gè)文本區(qū)域作為目標(biāo)焦點(diǎn)區(qū)域。在另一實(shí)例中,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可從接收的文本區(qū)域選擇分別具有第一最大大小和第二最大大小的文本區(qū)域作為目標(biāo)焦點(diǎn)區(qū)域。可將選定文本區(qū)域提供到圖像傳感器控制單元246,和用于調(diào)整至少一個(gè)圖像捕捉參數(shù)。舉例來說,圖像傳感器控制單元246可通過確定目標(biāo)焦點(diǎn)區(qū)域的多個(gè)亮度值的算術(shù)平均值來調(diào)整用于圖像傳感器130的曝光參數(shù)。另外或替代地,可調(diào)整用于圖像傳感器130的焦點(diǎn)參數(shù)使得增大目標(biāo)焦點(diǎn)區(qū)域的多個(gè)清晰度值的算術(shù)平均值。

圖3為根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以存儲(chǔ)多個(gè)相機(jī)模式以用于在模式選擇輸入中將圖像傳感器130設(shè)定到相機(jī)模式中的一個(gè)的存儲(chǔ)單元220的較詳細(xì)框圖。在一個(gè)實(shí)施例中,I/O單元210可接收來自用戶110的命令或輸入以選擇存儲(chǔ)在存儲(chǔ)單元220中的相機(jī)模式中的一個(gè),例如,自動(dòng)對(duì)焦模式310、文本模式320、夜間模式330、縱向模式340等。相機(jī)模式中的每一個(gè)可特性在于被優(yōu)化以或適合于根據(jù)相機(jī)模式捕捉圖像的一組圖像捕捉參數(shù)值。當(dāng)文本模式由用戶110選擇時(shí),I/O單元210可將選定文本模式提供到處理器240中的圖像傳感器控制單元246。

處理器240中的圖像傳感器控制單元246可接著從存儲(chǔ)單元220存取與文本模式相關(guān)聯(lián)的一組圖像捕捉參數(shù)值,且用所述圖像捕捉參數(shù)值配置圖像傳感器130?;谟糜谖谋灸J降膱D像捕捉參數(shù)值,圖像傳感器130可在預(yù)覽模式中操作以捕捉場景的一或多個(gè)預(yù)覽圖像,所述場景可包含至少一個(gè)文本對(duì)象,例如,標(biāo)牌或文檔。在預(yù)覽模式中,場景的一或多個(gè)預(yù)覽圖像可被捕捉和為用戶110顯示于I/O單元210上。預(yù)覽圖像中的每一個(gè)可包含用于場景中的至少一個(gè)文本對(duì)象的一或多個(gè)文本區(qū)域,且接著被處理用于調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)。

圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的被配置以識(shí)別預(yù)覽圖像中的多個(gè)文本區(qū)域的文本區(qū)域檢測單元242的較詳細(xì)框圖。文本區(qū)域檢測單元242可包含候選文本區(qū)域檢測單元410、特征提取單元420、分類評(píng)分確定單元430和文本區(qū)域識(shí)別單元440。為了識(shí)別所述文本區(qū)域中的多個(gè),文本區(qū)域檢測單元242可分別與存儲(chǔ)單元220和文本辨識(shí)單元248通信。

在文本區(qū)域檢測單元242中,候選文本區(qū)域檢測單元410可被配置以接收一或多個(gè)預(yù)覽圖像且檢測預(yù)覽圖像中的一或多個(gè)候選文本區(qū)域。在一個(gè)實(shí)施例中,可通過確定在候選文本區(qū)域中具有一或多個(gè)類似性質(zhì)(例如,大小、色彩、圖案和類似者)的一或多個(gè)斑點(diǎn)來檢測預(yù)覽圖像中的候選文本區(qū)域。在確定預(yù)覽圖像中的斑點(diǎn)后,候選文本區(qū)域檢測單元410可在斑點(diǎn)聚集操作中聚集所述斑點(diǎn)。舉例來說,可將具有相同色彩且位置接近的多個(gè)斑點(diǎn)聚集到斑點(diǎn)群集內(nèi)。也可針對(duì)偏斜校正斑點(diǎn)群集中的每一個(gè),和將其過濾以去除偽影。此外,可將有色彩的斑點(diǎn)群集轉(zhuǎn)換成呈灰階的斑點(diǎn)群集。在另一實(shí)施例中,可基于任一其它合適的文本候選提取方案(例如,基于邊緣的方法、基于連接的組件的方法、基于紋理的方法或類似者)在預(yù)覽圖像中檢測一或多個(gè)候選文本區(qū)域。在預(yù)覽圖像中檢測到的候選文本區(qū)域可接著提供到文本區(qū)域檢測單元242中的特征提取單元420和/或處理器240中的文本辨識(shí)單元248。

特征提取單元420可被配置以從候選文本區(qū)域檢測單元410接收候選文本區(qū)域和從候選文本區(qū)域中的每一個(gè)提取一或多個(gè)特征。可通過使用任何合適的特征提取技術(shù)(例如,邊緣檢測技術(shù)、尺度不變特征變換技術(shù)、模板匹配技術(shù)、霍夫變換技術(shù)等)從候選文本區(qū)域提取特征。在一個(gè)實(shí)施例中,可將從候選文本區(qū)域提取的一或多個(gè)特征表示為特征向量。從候選文本區(qū)域提取的特征可接著提供到文本區(qū)域檢測單元242中的分類評(píng)分確定單元430。

分類評(píng)分確定單元430可被配置以從特征提取單元420接收用于候選文本區(qū)域中的每一個(gè)的一或多個(gè)特征,且針對(duì)預(yù)定語言產(chǎn)生分類評(píng)分。從存儲(chǔ)單元220,可存取與多種語言(例如,英語、法語、德語和類似者)相關(guān)聯(lián)的分類器模型數(shù)據(jù)庫460,以用于識(shí)別候選文本區(qū)域是否包含與預(yù)定語言相關(guān)聯(lián)的文本(例如,字符)。分類器模型數(shù)據(jù)庫460可包含與多種語言相關(guān)聯(lián)的多個(gè)概率模型。可使用例如SVM(支持向量機(jī))、神經(jīng)網(wǎng)絡(luò)、MQDF(修正的二次判別函數(shù))等的任一合適分類方法產(chǎn)生概率模型。舉例來說,針對(duì)語言的概率模型可由用于對(duì)應(yīng)于所述語言的特征的概率分布函數(shù)(例如,多變量高斯分布)表示。

在一個(gè)實(shí)施例中,分類評(píng)分確定單元430可基于用于相關(guān)聯(lián)的候選文本區(qū)域的經(jīng)提取特征和用于預(yù)定語言的概率模型產(chǎn)生針對(duì)候選文本區(qū)域中的每一個(gè)的分類評(píng)分。舉例來說,如果通過用戶110的輸入或命令將用于識(shí)別文本區(qū)域的語言預(yù)確定為英語,那么可基于英語的概率模型產(chǎn)生針對(duì)候選文本區(qū)域的分類評(píng)分。針對(duì)候選文本區(qū)域的分類評(píng)分可指示候選文本區(qū)域的一或多個(gè)特征與用于英語的概率模型相關(guān)聯(lián)的概率。在另一實(shí)施例中,分類評(píng)分確定單元430可基于用于候選文本區(qū)域中的每一個(gè)的一或多個(gè)特征確定針對(duì)多個(gè)概率模型的多個(gè)分類評(píng)分以識(shí)別候選文本區(qū)域是否包含與針對(duì)概率模型的語言中的每一個(gè)相關(guān)聯(lián)的文本??山又鴮⑨槍?duì)候選文本區(qū)域的分類評(píng)分提供到文本區(qū)域檢測單元242中的文本區(qū)域識(shí)別單元440。

根據(jù)一些實(shí)施例,文本區(qū)域識(shí)別單元440可被配置以基于從分類評(píng)分確定單元430接收的分類評(píng)分識(shí)別來自候選文本區(qū)域的一或多個(gè)文本區(qū)域。舉例來說,可通過確定針對(duì)候選文本區(qū)域的分類評(píng)分超過預(yù)定閾值評(píng)分來將候選文本區(qū)域識(shí)別為文本區(qū)域。替代地,如果接受到針對(duì)候選文本區(qū)域中的每一個(gè)的與多種語言相關(guān)聯(lián)的分類評(píng)分,那么文本區(qū)域識(shí)別單元440可從分類評(píng)分選擇最大分類評(píng)分且確定最大分類評(píng)分高于預(yù)定閾值評(píng)分。

在一些其它實(shí)施例中,文本區(qū)域識(shí)別單元440也可基于從文本辨識(shí)單元248接收的文本辨識(shí)結(jié)果識(shí)別來自候選文本區(qū)域的一或多個(gè)文本區(qū)域。文本辨識(shí)單元248可從候選文本區(qū)域檢測單元410接收多個(gè)候選文本區(qū)域,且通過存取存儲(chǔ)單元220中的字符信息數(shù)據(jù)庫450或詞典數(shù)據(jù)庫470對(duì)候選文本區(qū)域中的每一個(gè)執(zhí)行文本辨識(shí)。文本辨識(shí)單元248可接著將用于候選文本區(qū)域的文本辨識(shí)的結(jié)果提供到文本區(qū)域識(shí)別單元440供識(shí)別文本區(qū)域。

可使用例如矩陣匹配、特征匹配等的任何合適字符辨識(shí)方案基于用于預(yù)定數(shù)目個(gè)語言的字符信息數(shù)據(jù)庫450來辨識(shí)候選文本區(qū)域中的每一個(gè)中的一或多個(gè)字符。在一些實(shí)施例中,文本辨識(shí)單元248可剖析候選文本區(qū)域中的每一個(gè)中的文本以確定候選文本區(qū)域的文本中的字符信息。字符信息可包含語言中的一或多個(gè)字符的圖案或幾何數(shù)據(jù)、表示語言中的一或多個(gè)字符的標(biāo)志符號(hào)的圖像和/或用于與語言中的個(gè)別標(biāo)志符號(hào)相關(guān)聯(lián)的一或多個(gè)字符的至少一個(gè)特征。

在候選文本區(qū)域中的每一個(gè)中,文本辨識(shí)單元248可通過比較從候選文本區(qū)域中的文本識(shí)別的字符信息與相關(guān)聯(lián)于語言的字符信息數(shù)據(jù)庫450來辨認(rèn)一或多個(gè)字符。舉例來說,文本辨識(shí)單元248可識(shí)別候選文本區(qū)域中的圖案或符號(hào),且將所述圖案或符號(hào)與來自字符信息數(shù)據(jù)庫450的多個(gè)字符的圖案或幾何數(shù)據(jù)比較。在此情況下,如果將一或多個(gè)識(shí)別的圖案或符號(hào)與用于語言中的指定字符的圖案或幾何數(shù)據(jù)之間的類似性確定為超過預(yù)定閾值,那么可將所述圖案或符號(hào)辨識(shí)為指定字符。如果候選文本區(qū)域中的字符被辨識(shí),那么可將用于候選文本區(qū)域的文本辨識(shí)結(jié)果提供到文本區(qū)域識(shí)別單元440供識(shí)別文本區(qū)域。

當(dāng)對(duì)候選文本區(qū)域中的每一個(gè)執(zhí)行文本辨識(shí)時(shí),文本辨識(shí)單元248也可存取存儲(chǔ)在存儲(chǔ)單元220中的詞典數(shù)據(jù)庫470。文本辨識(shí)單元248可針對(duì)從候選文本區(qū)域中的一或多個(gè)辨識(shí)的字符檢測到的單詞搜索詞典數(shù)據(jù)庫470。如果在詞典數(shù)據(jù)庫470中發(fā)現(xiàn)單詞,那么文本辨識(shí)單元248可確定候選文本區(qū)域包含與所述語言相關(guān)聯(lián)的文本。在此情況下,文本辨識(shí)單元248可將在候選文本區(qū)域中辨識(shí)文本的結(jié)果提供到文本區(qū)域識(shí)別單元440供識(shí)別文本區(qū)域。識(shí)別的文本區(qū)域可接著被提供到目標(biāo)焦點(diǎn)區(qū)域檢測單元244。

圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于通過在預(yù)覽模式中調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)來捕捉場景的圖像的方法的流程圖500。一開始,在510,圖像傳感器130可基于一組圖像捕捉參數(shù)捕捉包含至少一個(gè)文本對(duì)象的場景的預(yù)覽圖像且將預(yù)覽圖像提供到處理器240。在520,處理器240中的文本區(qū)域檢測單元242可接收預(yù)覽圖像且檢測預(yù)覽圖像中的多個(gè)候選文本區(qū)域。

在530,文本區(qū)域檢測單元242可識(shí)別來自多個(gè)候選文本區(qū)域的多個(gè)文本區(qū)域。在此過程中,可通過提取用于相關(guān)聯(lián)的文本區(qū)域的一組特征來產(chǎn)生針對(duì)文本區(qū)域中的每一個(gè)的分類評(píng)分。在540,處理器240中的目標(biāo)焦點(diǎn)區(qū)域檢測單元244可從多個(gè)文本區(qū)域選擇目標(biāo)焦點(diǎn)區(qū)域。在550,基于目標(biāo)焦點(diǎn)區(qū)域,處理器240中的圖像傳感器控制單元246可調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)。根據(jù)如調(diào)整的至少一個(gè)圖像捕捉參數(shù),在560,圖像傳感器130可捕捉包含至少一個(gè)文本對(duì)象的圖像。

圖6為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于在于比預(yù)覽圖像高的分辨率下捕捉的場景的另一預(yù)覽圖像中的多個(gè)候選文本區(qū)域識(shí)別在場景的預(yù)覽圖像中的多個(gè)文本區(qū)域的詳細(xì)方法530的流程圖。在610,文本區(qū)域檢測單元242可在識(shí)別預(yù)覽圖像中的多個(gè)候選文本區(qū)域時(shí)確定所述多個(gè)候選文本區(qū)域的位置。舉例來說,候選文本區(qū)域中的每一個(gè)的位置可指示預(yù)覽圖像中的像素坐標(biāo)。

在620,文本區(qū)域檢測單元242可存取另一預(yù)覽圖像且獲得另一預(yù)覽圖像中映射到預(yù)覽圖像中的候選文本區(qū)域的位置的對(duì)應(yīng)的候選文本區(qū)域。在630,從另一預(yù)覽圖像中的候選文本區(qū)域中的每一個(gè),文本區(qū)域檢測單元242可提取一或多個(gè)特征且產(chǎn)生針對(duì)所述特征的分類評(píng)分?;谂c候選文本區(qū)域相關(guān)聯(lián)的分類評(píng)分,在640,可識(shí)別預(yù)覽圖像中的多個(gè)文本區(qū)域。

圖7為根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置120的顯示屏125上顯示的多個(gè)文本對(duì)象(例如,放在桌子710上的書本720、橡皮730和多個(gè)鉛筆740)的室內(nèi)場景的預(yù)覽圖像700。在預(yù)覽圖像700中,書本720包含包含“作者姓名”的文本的文本區(qū)域722、包含“書名”的文本的文本區(qū)域724和包含“任選標(biāo)語或其它文本”的文本的文本區(qū)域726。預(yù)覽圖像700還展示橡皮730中包含“橡皮”的文本的文本區(qū)域732。

根據(jù)一些實(shí)施例,I/O單元210可在預(yù)覽模式期間接收來自用戶110的輸入以用于從多個(gè)相機(jī)模式選擇文本模式。電子裝置120中的文本區(qū)域檢測單元242可接著通過產(chǎn)生針對(duì)文本區(qū)域722、724、726和732中的每一個(gè)的分類評(píng)分(如參看以上圖2和4詳細(xì)地描述)來在文本模式中識(shí)別文本區(qū)域722、724、726和732??蓪⒆R(shí)別的文本區(qū)域722、724、726和732和產(chǎn)生的分類評(píng)分提供到電子裝置120中的目標(biāo)焦點(diǎn)區(qū)域檢測單元244以用于在預(yù)覽圖像700選擇目標(biāo)焦點(diǎn)區(qū)域。

目標(biāo)焦點(diǎn)區(qū)域檢測單元244可基于相關(guān)聯(lián)的分類評(píng)分從識(shí)別的文本區(qū)域722、724、726和732選擇目標(biāo)焦點(diǎn)區(qū)域。在一個(gè)實(shí)施例中,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可從文本區(qū)域722、724、726和732將具有最大分類評(píng)分的文本區(qū)域選擇為目標(biāo)焦點(diǎn)區(qū)域。舉例來說,在圖7的預(yù)覽圖像700中,如果用于文本“橡皮”的文本區(qū)域732具有文本區(qū)域722、724、726和732當(dāng)中的最大分類評(píng)分,那么可將橡皮730中的文本區(qū)域732選擇為目標(biāo)對(duì)象用于在調(diào)整用于圖像傳感器130的至少一個(gè)圖像捕捉參數(shù)過程中使用。在一些實(shí)施例中,僅當(dāng)針對(duì)文本區(qū)域的最大分類評(píng)分大于閾值分類評(píng)分時(shí),才可將具有最大分類評(píng)分的文本區(qū)域選擇為目標(biāo)焦點(diǎn)區(qū)域。

目標(biāo)焦點(diǎn)區(qū)域檢測單元244可通過確定文本區(qū)域722、724、726和732中的每一個(gè)的大小來選擇目標(biāo)焦點(diǎn)區(qū)域。在一個(gè)實(shí)施例中,具有最大大小的文本區(qū)域可選自文本區(qū)域722、724、726和732,作為目標(biāo)焦點(diǎn)區(qū)域。如圖7中所展示,書本720中用于文本“書名”的文本區(qū)域724具有文本區(qū)域722、724和726當(dāng)中的最大大小,且被選擇為預(yù)覽圖像700中的目標(biāo)焦點(diǎn)區(qū)域。接著可將選定目標(biāo)焦點(diǎn)區(qū)域724提供到處理器240中的圖像傳感器控制單元246。

圖8為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于預(yù)覽模式中的場景的多個(gè)預(yù)覽圖像調(diào)整用于圖像傳感器130的焦點(diǎn)參數(shù)的詳細(xì)方法550的流程圖。一開始,在810,圖像傳感器130可基于多個(gè)候選焦點(diǎn)參數(shù)捕捉包含目標(biāo)焦點(diǎn)區(qū)域的多個(gè)預(yù)覽圖像。在捕捉到預(yù)覽圖像后,多個(gè)文本區(qū)域可由處理器240中的文本區(qū)域檢測單元242從捕捉的預(yù)覽圖像中的每一個(gè)識(shí)別,且目標(biāo)焦點(diǎn)區(qū)域可由處理器240中的目標(biāo)焦點(diǎn)區(qū)域檢測單元244在識(shí)別的文本區(qū)域當(dāng)中選擇,如詳細(xì)地參看以上圖2和7所描述。在一個(gè)實(shí)施例中,目標(biāo)焦點(diǎn)區(qū)域檢測單元244可接收?qǐng)鼍暗念A(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域,且使用任一合適的目標(biāo)運(yùn)動(dòng)分析方案(例如,最大似然估計(jì)器方法、擴(kuò)展的卡爾曼濾波器方法、規(guī)則化的粒子過濾器方法等)追蹤場景的后續(xù)預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域。

在820,圖像傳感器控制單元246可確定預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域的多個(gè)清晰度值。在830,在候選焦點(diǎn)參數(shù)當(dāng)中,可選擇與最高清晰度值相關(guān)聯(lián)的候選焦點(diǎn)參數(shù)。在840,圖像傳感器控制單元246可接著將用于圖像傳感器130的焦點(diǎn)參數(shù)調(diào)整到選定候選者焦點(diǎn)參數(shù)。

圖9說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置120的顯示屏125上顯示的多個(gè)車輛910和920的場景的預(yù)覽圖像900。可在預(yù)覽模式期間基于用于圖像傳感器130的預(yù)定焦距來捕捉預(yù)覽圖像900,其中圖像傳感器130可被配置以在如由用戶110選擇的文本模式中操作。在預(yù)覽圖像900中,展示車輛910和920分別具有牌照930(具有文本“XYZ ABCD”)和牌照940(具有文本“UVW EFGH”)。在此情況下,電子裝置120中的文本區(qū)域檢測單元242可分別檢測牌照930和940中的多個(gè)文本區(qū)域950和960。由于文本區(qū)域950在大小上比文本區(qū)域960大,所以電子裝置120中的目標(biāo)焦點(diǎn)區(qū)域檢測單元244可將文本區(qū)域950識(shí)別為預(yù)覽圖像900中的目標(biāo)焦點(diǎn)區(qū)域。目標(biāo)焦點(diǎn)區(qū)域檢測單元244也可通過確定文本區(qū)域950的文本大小大于文本區(qū)域960的文本大小而將文本區(qū)域950識(shí)別為目標(biāo)焦點(diǎn)區(qū)域。

電子裝置120中的圖像傳感器控制單元246可接收目標(biāo)焦點(diǎn)區(qū)域950且確定目標(biāo)焦點(diǎn)區(qū)域950是否與參照物相關(guān)聯(lián)。舉例來說,圖像傳感器控制單元246可將目標(biāo)焦點(diǎn)區(qū)域950與存儲(chǔ)在電子裝置120的存儲(chǔ)單元220中的多個(gè)參照物(例如,牌照、價(jià)格標(biāo)簽等)比較。接著可將目標(biāo)焦點(diǎn)區(qū)域950確定為牌照,且可從存儲(chǔ)單元220檢索用于牌照的大小信息。在一個(gè)實(shí)施例中,用于牌照的大小信息可包含牌照大小和用于牌照中的多個(gè)字符的一或多個(gè)大小中的至少一個(gè)。

如果將目標(biāo)焦點(diǎn)區(qū)域950確定為牌照,那么圖像傳感器控制單元246可檢測目標(biāo)焦點(diǎn)區(qū)域950的大小或目標(biāo)焦點(diǎn)區(qū)域950中的字符“XYZ ABCD”中的每一個(gè)的大小。圖像傳感器控制單元246可接著基于與預(yù)覽圖像900相關(guān)聯(lián)的預(yù)定焦距、參考牌照的大小信息和目標(biāo)焦點(diǎn)區(qū)域950的大小或目標(biāo)焦點(diǎn)區(qū)域950中的字符的大小來計(jì)算焦點(diǎn)參數(shù)的值。接著可將用于圖像傳感器130的焦點(diǎn)參數(shù)調(diào)整到焦點(diǎn)參數(shù)值。由于基于目標(biāo)焦點(diǎn)區(qū)域950的文本的實(shí)際大小確定焦點(diǎn)參數(shù)值,因此使用此參數(shù)值可被優(yōu)化以或適合于在捕捉圖像過程中的目標(biāo)焦點(diǎn)區(qū)域950。

在一個(gè)實(shí)施例中,可基于參考牌照的實(shí)際文本大小、目標(biāo)焦點(diǎn)區(qū)域950中的字符的檢測到的大小與預(yù)覽圖像900的焦距的幾何關(guān)系確定焦點(diǎn)參數(shù)值。舉例來說,此關(guān)系可由如下的矩陣等式定義:

其中x和y為目標(biāo)焦點(diǎn)區(qū)域的x和y坐標(biāo)空間中的字符的檢測到的大小,f為預(yù)覽圖像的焦距,X和Y為在參照物的x和y坐標(biāo)空間中的實(shí)際文本大小,且Z為焦點(diǎn)參數(shù)。

圖10說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的包含如在電子裝置120的顯示屏125上顯示的光源1010和文檔1020的一部分的室內(nèi)場景的預(yù)覽圖像1000。當(dāng)在多個(gè)相機(jī)模式當(dāng)中選擇文本模式時(shí),電子裝置120可捕捉預(yù)覽圖像1000且將其在顯示屏125上為用戶110顯示。在預(yù)覽圖像1000中,光源1010位于天花板1005中且發(fā)射光。預(yù)覽圖像1000還展示包含多個(gè)文本區(qū)域1030和1040的文檔1020的部分。文本區(qū)域1030包含“論文題目”的文本,且文本區(qū)域1040包含“作者”的文本。

當(dāng)捕捉到預(yù)覽圖像1000時(shí),電子裝置120的文本區(qū)域檢測單元242可檢測預(yù)覽圖像1000中的文本區(qū)域1030和1040。目標(biāo)焦點(diǎn)區(qū)域檢測單元244可比較文本區(qū)域1030與1040中的字符的大小,且選擇具有較大字符大小的文本區(qū)域1030作為目標(biāo)焦點(diǎn)區(qū)域。接送可將目標(biāo)焦點(diǎn)區(qū)域1030提供到電子裝置120中的圖像傳感器控制單元246。

在接收到目標(biāo)焦點(diǎn)區(qū)域1030后,圖像傳感器控制單元246可確定目標(biāo)焦點(diǎn)區(qū)域1030的亮度值。在一個(gè)實(shí)施例中,可基于目標(biāo)焦點(diǎn)區(qū)域1030中的多個(gè)像素的色彩值來計(jì)算亮度值。舉例來說,圖像傳感器控制單元246可通過平均化目標(biāo)焦點(diǎn)區(qū)域1030中的多個(gè)像素的多個(gè)亮度值來確定目標(biāo)焦點(diǎn)區(qū)域1030的亮度值。在此情況下,可將亮度值計(jì)算為每個(gè)像素的色彩值(例如,紅、綠和藍(lán)值)的算術(shù)平均值。

當(dāng)確定目標(biāo)焦點(diǎn)區(qū)域1030的亮度值時(shí),圖像傳感器控制單元246可計(jì)算目標(biāo)焦點(diǎn)區(qū)域1030的亮度值與預(yù)定亮度值之間的差??蓮拇鎯?chǔ)單元220中存取的預(yù)定亮度值為被優(yōu)化以或適合于捕捉文檔中的文本的亮度值。圖像傳感器控制單元246可接著將用于圖像傳感器130的曝光參數(shù)調(diào)整到減小或消除目標(biāo)焦點(diǎn)區(qū)域1030的亮度值與預(yù)定亮度值之間的差的曝光參數(shù)值。

在說明的預(yù)覽圖像1000中,文檔1020位于電子裝置120附近使得光源1010從文檔1020后且上方的位置發(fā)射光。因此,目標(biāo)焦點(diǎn)區(qū)域1030的亮度值可比預(yù)覽圖像1000中的其它區(qū)域低,且因此顯得比其它區(qū)域暗。在此情況下,圖像傳感器控制單元246可確定曝光參數(shù)值(例如,曝光時(shí)間、光圈等),所述曝光參數(shù)值被調(diào)適以將目標(biāo)焦點(diǎn)區(qū)域1030的亮度值增大目標(biāo)焦點(diǎn)區(qū)域1030的亮度值與預(yù)定亮度值之間的差。接著可將用于圖像傳感器130的曝光參數(shù)調(diào)整到確定曝光參數(shù)值且提供到圖像傳感器130以用于在捕捉文檔1020的圖像過程中使用。

圖11為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于預(yù)覽圖像中的目標(biāo)焦點(diǎn)區(qū)域的亮度值調(diào)整用于圖像傳感器130的曝光參數(shù)的詳細(xì)方法550的流程圖。在1110,圖像傳感器控制單元246可確定目標(biāo)焦點(diǎn)區(qū)域的亮度值,目標(biāo)焦點(diǎn)區(qū)域可選自預(yù)覽圖像中的多個(gè)文本區(qū)域。包含目標(biāo)焦點(diǎn)區(qū)域的預(yù)覽圖像可基于包含曝光參數(shù)的一組圖像捕捉參數(shù)在文本模式中捕捉。

在1120,從存儲(chǔ)單元220,圖像傳感器控制單元246可獲得參考文本區(qū)域的預(yù)定亮度值,所述預(yù)定亮度值可指示被優(yōu)化以或適合于捕捉文本對(duì)象中的文本的亮度值。在1130,可確定目標(biāo)焦點(diǎn)區(qū)域的亮度值與預(yù)定亮度值之間的差。在1140,圖像傳感器控制單元246可接著基于目標(biāo)焦點(diǎn)區(qū)域的亮度值與預(yù)定亮度值之間的差調(diào)整用于圖像傳感器130的曝光參數(shù)。

圖12為根據(jù)本發(fā)明的一個(gè)實(shí)施例的可實(shí)施用于在預(yù)覽狀態(tài)中調(diào)整至少一個(gè)圖像捕捉參數(shù)的方法和設(shè)備的示范性電子裝置1200的框圖??筛鶕?jù)參看圖1到11描述的以上實(shí)施例在電子裝置中實(shí)施電子裝置1200的配置。電子裝置1200可為蜂窩式電話、智能電話、平板計(jì)算機(jī)、膝上型計(jì)算機(jī)、終端、手持機(jī)、個(gè)人數(shù)字助理(PDA)、無線調(diào)制解調(diào)器、無繩電話等。無線通信系統(tǒng)可為分碼多重存取(CDMA)系統(tǒng)、用于移動(dòng)通信的廣播系統(tǒng)(GSM)系統(tǒng)、寬帶CDMA(WCDMA)系統(tǒng)、長期演進(jìn)(LTE)系統(tǒng)、高級(jí)LTE系統(tǒng)等。另外,電子裝置1200可直接與另一移動(dòng)裝置通信,例如,使用Wi-Fi Direct或藍(lán)牙。

電子裝置1200能夠經(jīng)由接收路徑和發(fā)射路徑提供雙向通信。在接收路徑上,基站發(fā)射的信號(hào)被天線1212接收且提供到接收器(RCVR)1214。接收器1214調(diào)節(jié)且數(shù)字化所接收的信號(hào)且將樣本(例如,經(jīng)調(diào)節(jié)且經(jīng)數(shù)字化的數(shù)字信號(hào))提供到數(shù)字區(qū)段以用于進(jìn)一步處理。在發(fā)射路徑上,發(fā)射器(TMTR)1216從數(shù)字區(qū)段1210接收待發(fā)射的數(shù)據(jù),處理并調(diào)節(jié)所述數(shù)據(jù),且生成經(jīng)調(diào)制信號(hào),所述經(jīng)調(diào)制信號(hào)經(jīng)由天線1212發(fā)射到基站。接收器1214和發(fā)射器1216可為可支持CDMA、GSM、LTE、高級(jí)LTE等的收發(fā)器的部分。

數(shù)字區(qū)段1210包含各種處理、接口和存儲(chǔ)器單元,例如,調(diào)制解調(diào)器處理器1222、精簡指令集計(jì)算機(jī)/數(shù)字信號(hào)處理器(RISC/DSP)1224、控制器/處理器1226、內(nèi)部存儲(chǔ)器1228、一般化音頻/視頻編碼器1232、一般化音頻解碼器1234、圖形/顯示處理器1236和外部總線接口(EBI)1238。調(diào)制解調(diào)器處理器1222可執(zhí)行供數(shù)據(jù)發(fā)射和接收的處理,例如,編碼、調(diào)制、解調(diào)和解碼。RISC/DSP 1224可執(zhí)行針對(duì)電子裝置1200的一般和專業(yè)化處理。控制器/處理器1226可執(zhí)行數(shù)字區(qū)段1210內(nèi)的各種處理和接口單元的操作。內(nèi)部存儲(chǔ)器1228可將用于各種單元的數(shù)據(jù)和/或指令存儲(chǔ)在數(shù)字區(qū)段1210內(nèi)。

一般化音頻/視頻編碼器1232可執(zhí)行對(duì)來自音頻/視頻源1242、麥克風(fēng)1244、圖像傳感器1246等的輸入信號(hào)的編碼。一般化音頻解碼器1234可執(zhí)行對(duì)經(jīng)譯碼音頻數(shù)據(jù)的解碼且可將輸出信號(hào)提供到揚(yáng)聲器/耳機(jī)1248。圖形/顯示處理器1236可執(zhí)行對(duì)可呈現(xiàn)給顯示單元1250的圖形、視頻、圖像和文本的處理。EBI 1238可促進(jìn)數(shù)字區(qū)段1210與主存儲(chǔ)器1252之間的數(shù)據(jù)傳送。

數(shù)字區(qū)段1210可用一或多個(gè)處理器、DSP、微處理器、RISC等來實(shí)施。數(shù)字區(qū)段1210還可制造于一或多個(gè)專用集成電路(ASIC)和/或某一其它類型的集成電路(IC)上。

一般來說,本文中描述的任一裝置可表示各種類型裝置,例如,無線電話、蜂窩式電話、膝上型計(jì)算機(jī)、無線多媒體裝置、無線通信個(gè)人計(jì)算機(jī)(PC)、卡、PDA、外部或內(nèi)置調(diào)制解調(diào)器、通過無線頻道通信的裝置等。裝置可具有各種名稱,例如,接入終端(AT)、存取單元、訂戶單元、移動(dòng)臺(tái)、移動(dòng)裝置、移動(dòng)單元、移動(dòng)電話、移動(dòng)、遠(yuǎn)程站、遠(yuǎn)程終端、遠(yuǎn)程單元、用戶裝置、用戶裝備、手持式裝置等。本文中描述的任一裝置可具有用于存儲(chǔ)指令和數(shù)據(jù)的存儲(chǔ)器,以及硬件、軟件、固件或其組合。

本文中描述的技術(shù)可通過各種裝置來實(shí)施。舉例來說,這些技術(shù)可以硬件、固件、軟件或其組合來實(shí)施。所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊、電路和算法步驟可以實(shí)施為電子硬件、計(jì)算機(jī)軟件或兩者的組合。為清楚地說明硬件與軟件的此可互換性,上文已大體上關(guān)于其功能性描述了各種說明性組件、塊、模塊、電路和步驟。此功能性是實(shí)施為硬件還是軟件取決于特定應(yīng)用和強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束。熟練的技術(shù)人員可針對(duì)每一特定應(yīng)用以變化方式實(shí)施所描述的功能性,但此類實(shí)施決策不應(yīng)被解釋為引起偏離本發(fā)明的范圍。

對(duì)于硬件實(shí)施方案,用以執(zhí)行所述技術(shù)的處理單元可實(shí)施在以下各者內(nèi):一或多個(gè)ASIC、DSP、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計(jì)以執(zhí)行本文中所描述的功能的其它電子單元、計(jì)算機(jī)或其組合。

因此,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊和電路可以用通用處理器、DSP、ASIC、FPGA或經(jīng)設(shè)計(jì)以執(zhí)行本文所述的功能的其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件或其任何組合來實(shí)施或執(zhí)行。通用處理器可以是微處理器,但在替代方案中,處理器可以是任何常規(guī)處理器、控制器、微控制器或狀態(tài)機(jī)。處理器還可實(shí)施為計(jì)算裝置的組合,例如,DSP與微處理器的組合、多個(gè)微處理器、一或多個(gè)微處理器結(jié)合DSP核心或任何其它此類配置。

如果以軟件實(shí)施,那么可將功能作為一或多個(gè)指令或代碼存儲(chǔ)在計(jì)算機(jī)可讀媒體上或經(jīng)由計(jì)算機(jī)可讀媒體傳輸。計(jì)算機(jī)可讀媒體包含計(jì)算機(jī)存儲(chǔ)媒體和通信媒體兩者,所述通信媒體包含促進(jìn)將計(jì)算機(jī)程序從一處傳送到另一處的任何媒體。存儲(chǔ)媒體可以是可由計(jì)算機(jī)存取的任何可用媒體。通過實(shí)例且不受限制,此類計(jì)算機(jī)可讀媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置,或可用以攜載或存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)形式的所要程序代碼且可由計(jì)算機(jī)存取的任何其它媒體。此外,任何連接都恰當(dāng)?shù)胤Q為計(jì)算機(jī)可讀媒體。舉例來說,如果使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電和微波的無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源發(fā)射軟件,那么同軸電纜、光纖電纜、雙絞線、DSL或例如紅外線、無線電及微波的無線技術(shù)包含于媒體的定義中。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上各項(xiàng)的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)。

提供本發(fā)明的前述描述以使所屬領(lǐng)域的技術(shù)人員能夠制造或使用本發(fā)明。所屬領(lǐng)域的技術(shù)人員將易于顯而易見對(duì)本發(fā)明的各種修改,且在不脫離本發(fā)明的精神或范圍的情況下,將本文中定義的一般原理應(yīng)用于其它變化。因此,本發(fā)明并不希望限于本文中所描述的實(shí)例,而應(yīng)符合與本文中所揭示的原理和新穎特征相一致的最廣泛范圍。

盡管稱示范性實(shí)施方案利用在一或多個(gè)獨(dú)立計(jì)算機(jī)系統(tǒng)的情況下的目前揭示的標(biāo)的物的方面,但所述標(biāo)的物不受如此限制,而是相反地,可結(jié)合任何計(jì)算環(huán)境(例如,網(wǎng)絡(luò)或分散式計(jì)算環(huán)境)來實(shí)施。此外,目前揭示的標(biāo)的物的方面可以在多個(gè)處理芯片或裝置中或跨多個(gè)處理芯片或裝置實(shí)施,且可類似地跨多個(gè)裝置實(shí)現(xiàn)存儲(chǔ)。此類裝置可包含PC、網(wǎng)絡(luò)服務(wù)器和手持式裝置。

盡管已經(jīng)以具體針對(duì)結(jié)構(gòu)特征和/或方法動(dòng)作的語言來描述標(biāo)的物,但應(yīng)理解,所附權(quán)利要求書中定義的標(biāo)的物未必限于上文所描述的具體特征或動(dòng)作。相反地,揭示以上描述的具體特征和動(dòng)作作為實(shí)施權(quán)利要求的實(shí)例形式。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1