使用預(yù)捕獲圖像運(yùn)動(dòng)的場(chǎng)景分割的制作方法
【專利摘要】描述了系統(tǒng)、設(shè)備和方法,包括:使用在預(yù)捕獲圖像中出現(xiàn)的目標(biāo)運(yùn)動(dòng)來(lái)執(zhí)行場(chǎng)景的3D重建??梢允褂弥T如圖像分割和/或目標(biāo)識(shí)別之類的圖像處理技術(shù),在預(yù)捕獲圖像中對(duì)目標(biāo)進(jìn)行分割和跟蹤。隨后可以使用圖像處理結(jié)果自動(dòng)地對(duì)后續(xù)捕獲的圖像進(jìn)行標(biāo)記。此外,還可以使用該圖像處理結(jié)果,在圖像捕獲之前,對(duì)成像設(shè)備的調(diào)焦裝置進(jìn)行交互式控制。
【專利說(shuō)明】使用預(yù)捕獲圖像運(yùn)動(dòng)的場(chǎng)景分割
【背景技術(shù)】
[0001]圖像分割是用于將靜止圖像中的場(chǎng)景里的目標(biāo)彼此分離以及將目標(biāo)與背景進(jìn)行分離的處理,其對(duì)于包括自動(dòng)圖像標(biāo)記、基于內(nèi)容的圖像檢索、目標(biāo)識(shí)別等等的很多應(yīng)用來(lái)說(shuō)都很重要。
[0002]在圖像分割時(shí)通常使用兩種方法。在二維(2D)方法中,可以使用典型的彩色照相機(jī)來(lái)捕獲三維(3D)場(chǎng)景的2D靜止圖像,隨后可以主要基于該靜止圖像中的顏色信息來(lái)執(zhí)行圖像分割。但是,由于在捕獲2D圖像之后,場(chǎng)景信息的某些方面(例如,該場(chǎng)景中的各個(gè)目標(biāo)的深度)丟失,并且由于場(chǎng)景中的不同目標(biāo)和/或背景可能具有類似的顏色,因此這種基于顏色的2D圖像分割存在不適定問(wèn)題(ill-posed problem),并往往不能得到足夠好的分辨質(zhì)量。.[0003]在3D方法中,立體相機(jī)對(duì)或者彩色深度照相機(jī)(例如,結(jié)構(gòu)光相機(jī)或者飛行時(shí)間相機(jī))可以用于不僅捕獲顏色,而且還獲得深度信息。隨后,可以在使用顏色信息或者不使用顏色信息的情況下,基于該深度信息來(lái)執(zhí)行圖像分割。與基于顏色的方法相比,這些基于深度的方法通常更加可靠,這是由于它們使用場(chǎng)景中潛在的幾何信息。不幸的是,基于深度的圖像分割通常需要特殊的硬件,例如,配備有深度感測(cè)技術(shù)的經(jīng)校準(zhǔn)和同步的照相機(jī)對(duì)或照相機(jī),因此基于深度的圖像分割不適用于普通的(不具備深度感測(cè)能力的)消費(fèi)級(jí)照相機(jī),例如,裝備有照相機(jī)的移動(dòng)設(shè)備。
【專利附圖】
【附圖說(shuō)明】
[0004]在附圖中,通過(guò)示例的方式,而不是通過(guò)限制的方式描繪了本申請(qǐng)所描述的內(nèi)容。為了說(shuō)明的簡(jiǎn)化和清楚起見(jiàn),在附圖中描述的元素沒(méi)有按比例進(jìn)行描繪。例如,為了清楚說(shuō)明起見(jiàn),可以相對(duì)于其它元素,對(duì)一些元素的尺寸進(jìn)行擴(kuò)大。此外,在認(rèn)為適當(dāng)時(shí),在附圖之中重復(fù)一些附圖標(biāo)記以指示相應(yīng)的或者類似的元素。在附圖中:
[0005]圖1是一種示例系統(tǒng)的示意圖;
[0006]圖2是描繪一種示例性自動(dòng)圖像標(biāo)記處理的流程圖;
[0007]圖3和圖4是示例性預(yù)捕獲圖像方案的示意圖;
[0008]圖5是描繪一種示例性目標(biāo)跟蹤處理的流程圖;
[0009]圖6是描繪一種示例性交互式聚焦控制處理的流程圖;
[0010]圖7是一種示例性交互式聚焦控制方案的示意圖;
[0011 ] 圖8是一種不例性系統(tǒng)的不意圖;
[0012]圖9描繪了一種示例性設(shè)備,其根據(jù)本申請(qǐng)的至少一些實(shí)現(xiàn)來(lái)布置。
【具體實(shí)施方式】
[0013]現(xiàn)在參照附圖來(lái)描述一個(gè)或多個(gè)實(shí)施例或者實(shí)現(xiàn)方式。雖然討論了特定的配置和方案,但應(yīng)當(dāng)理解的是,這僅僅只是用于示例性目的。本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,在不脫離本發(fā)明的精神和保護(hù)范圍的基礎(chǔ)上,可以使用其它配置和方案。對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是,本申請(qǐng)所描述的技術(shù)和/或方案還可以用于不同于本申請(qǐng)所描述的多種其它系統(tǒng)和應(yīng)用。
[0014]雖然下面的描述闡述了可以在諸如片上系統(tǒng)(SoC)體系結(jié)構(gòu)之類的體系結(jié)構(gòu)中出現(xiàn)的各種實(shí)現(xiàn),但本申請(qǐng)所描述的技術(shù)和/或方案的實(shí)現(xiàn)并不限于特定的體系結(jié)構(gòu)和/或計(jì)算系統(tǒng),其可以通過(guò)用于類似目的的任何體系結(jié)構(gòu)和/或計(jì)算系統(tǒng)來(lái)實(shí)現(xiàn)。例如,使用諸如多個(gè)集成電路(IC)芯片和/或封裝的各種體系結(jié)構(gòu),和/或諸如機(jī)頂盒、智能電話等等之類的各種計(jì)算設(shè)備和/或消費(fèi)電子(CE)設(shè)備,可以實(shí)現(xiàn)本申請(qǐng)所描述的技術(shù)和/或方案。此外,雖然下面的描述闡述了諸如系統(tǒng)組件的邏輯實(shí)現(xiàn)、類型和相互關(guān)系、邏輯劃分/綜合選項(xiàng)等等之類的眾多特定細(xì)節(jié),但本發(fā)明的技術(shù)方案可以在不使用這些特定細(xì)節(jié)的情況下實(shí)現(xiàn)。在其它實(shí)例中,為了不對(duì)本申請(qǐng)所公開(kāi)的內(nèi)容造成混淆,沒(méi)有詳細(xì)地顯示諸如控制結(jié)構(gòu)和完整的軟件指令序列之類的一些內(nèi)容。
[0015]本申請(qǐng)所公開(kāi)的內(nèi)容可以用硬件、固件、軟件或者其任意組合來(lái)實(shí)現(xiàn)。此外,本申請(qǐng)所公開(kāi)的內(nèi)容還可以實(shí)現(xiàn)成在機(jī)器可讀介質(zhì)上存儲(chǔ)的指令,其可以由一個(gè)或多個(gè)處理器讀取和執(zhí)行。機(jī)器可讀介質(zhì)可以包括用于存儲(chǔ)或發(fā)送具有能由機(jī)器(例如,計(jì)算設(shè)備)讀取的形式的信息的任何介質(zhì)和/或機(jī)制。例如,機(jī)器可讀介質(zhì)可以包括:只讀存儲(chǔ)器(ROM);隨機(jī)存取存儲(chǔ)器(RAM);磁盤(pán)存儲(chǔ)介質(zhì);光存儲(chǔ)介質(zhì);閃存設(shè)備;電、光、聲或者其它形式的傳播信號(hào)(例如,載波波形、紅外信號(hào)、數(shù)字信號(hào)等)等等。
[0016]說(shuō)明書(shū)中提到的“一種實(shí)現(xiàn)”、“一個(gè)實(shí)現(xiàn)”、“一種示例性實(shí)現(xiàn)”等等,指示所描述的實(shí)現(xiàn)可以包括具體特征、結(jié)構(gòu)或者特性,但并不需要每一種實(shí)現(xiàn)都包括該特定特征、結(jié)構(gòu)或特性。此外,這種短語(yǔ)并不是必須地指代相同的實(shí)現(xiàn)。此外,當(dāng)結(jié)合一種實(shí)現(xiàn)來(lái)描述特定的特征、結(jié)構(gòu)或特性時(shí),結(jié)合其它實(shí)現(xiàn)(無(wú)論本申請(qǐng)是否對(duì)其進(jìn)行了明確描述)實(shí)施這種特征、結(jié)構(gòu)或特性,也在本領(lǐng)域普通技術(shù)人員的知識(shí)范圍之內(nèi)。
[0017]圖1描繪了根據(jù)本發(fā)明的一種示例性系統(tǒng)100。在各種實(shí)現(xiàn)中,系統(tǒng)100可以包括成像設(shè)備102 (例如,具備視頻能力的照相機(jī)),成像設(shè)備102配置為以三維(3D)場(chǎng)景105的一系列二維(2D)圖像的形式來(lái)生成預(yù)捕獲圖像107,其中當(dāng)成像設(shè)備102相對(duì)于場(chǎng)景105運(yùn)動(dòng)(例如,如圖所示的圓形移動(dòng))的同時(shí),獲得場(chǎng)景105的圖像107。如本申請(qǐng)所使用的,術(shù)語(yǔ)“預(yù)捕獲圖像”可以指代:在用戶操作設(shè)備102上的快門(mén)裝置(沒(méi)有示出)以專門(mén)捕獲一幅或多幅圖像(例如,靜止或者視頻圖像)之前,成像設(shè)備102所獲得的圖像。
[0018]根據(jù)本發(fā)明,成像設(shè)備102的用戶可以使設(shè)備102瞄準(zhǔn)場(chǎng)景105,并且在用戶觸發(fā)設(shè)備102上的快門(mén)裝置之前,就可以獲得預(yù)捕獲圖像107,并對(duì)其進(jìn)行如下面更詳細(xì)描述的各種類型的圖像處理。例如,在設(shè)備102的用戶完全地按下快門(mén)裝置或者啟動(dòng)對(duì)一幅或多幅圖像的捕獲之前,該用戶可以部分地按下快門(mén)裝置或者將設(shè)備102設(shè)置在預(yù)定的成像模式。隨后,用戶可以相對(duì)于3D場(chǎng)景105移動(dòng)成像設(shè)備102,使得預(yù)捕獲圖像107可以包括相對(duì)于場(chǎng)景107的不同透視。在各種實(shí)現(xiàn)中,設(shè)備102的快門(mén)裝置可以是硬件裝置、軟件裝置、或者其任意組合。例如,用戶界面(如設(shè)備102所提供的圖形用戶界面(GUI))可以允許用戶啟動(dòng)使用設(shè)備102來(lái)獲得預(yù)捕獲圖像107的成像模式。在一些實(shí)現(xiàn)中,一種成像模式應(yīng)用可以使用GUI,來(lái)提示用戶在獲得預(yù)捕獲圖像107時(shí)相對(duì)于場(chǎng)景105對(duì)設(shè)備102進(jìn)行移動(dòng)。
[0019]根據(jù)本發(fā)明,系統(tǒng)100還包括圖像處理模塊108,圖像處理模塊108可以接收預(yù)捕獲圖像107,對(duì)這些預(yù)捕獲圖像執(zhí)行圖像分割,如下面所更詳細(xì)描述的。圖像處理模塊108還可以接收當(dāng)用戶觸發(fā)成像設(shè)備102的快門(mén)時(shí)所生成的一個(gè)或多個(gè)捕獲的圖像。隨后,圖像處理模塊108可以使用從該預(yù)捕獲圖像的圖像分割獲得的目標(biāo)信息,對(duì)該捕獲的圖像執(zhí)行目標(biāo)識(shí)別。
[0020]在各種實(shí)現(xiàn)中,圖像處理模塊108包括圖像分割模塊110、圖像標(biāo)記模塊112、聚焦控制模塊114和數(shù)據(jù)庫(kù)116。根據(jù)本發(fā)明,圖像分割模塊110可以進(jìn)行對(duì)預(yù)捕獲圖像107的圖像分割處理,以提取來(lái)自該場(chǎng)景的深度信息,并對(duì)預(yù)捕獲圖像107中的一個(gè)或多個(gè)目標(biāo)(例如,人物)進(jìn)行分割。隨后,圖像分割模塊110可以使用目標(biāo)跟蹤算法,來(lái)跟蹤預(yù)捕獲圖像107中的這些目標(biāo),如下面所更加詳細(xì)解釋的。
[0021]為了對(duì)目標(biāo)進(jìn)行分割,圖像分割模塊110可以使用已知的圖像分割技術(shù)來(lái)定位預(yù)捕獲圖像107中的目標(biāo)。為此,圖像分割模塊110可以將每一幅預(yù)捕獲圖像分割成多個(gè)區(qū)域(分塊),其中每一個(gè)分塊中的像素具有類似的特性或者屬性(例如,顏色、亮度或者紋理)。隨后,可以使用所識(shí)別的分塊在預(yù)捕獲圖像幀之間的運(yùn)動(dòng),來(lái)執(zhí)行場(chǎng)景105的3D重建。當(dāng)進(jìn)行圖像分割時(shí),模塊110可以使用各種已知技術(shù),諸如聚類分析、基于壓縮、基于直方圖、邊緣檢測(cè)、區(qū)域生長(zhǎng)、分隔和融合、圖形劃分、基于模型、多尺度和/或神經(jīng)網(wǎng)絡(luò)技術(shù)等等(例如,參見(jiàn) Newcombe 和 Davison 在 IEEE Conference on Computer Vision andPattern Recognition(2010)中發(fā)表的“Live Dense Reconstruction with a SingleMoving Camera,,)。
[0022]圖像分割模塊110還可以使用諸如光流技術(shù)之類的運(yùn)動(dòng)估計(jì)技術(shù),來(lái)跟蹤分割的目標(biāo),并在預(yù)捕獲圖像107中執(zhí)行3D重建(例如,參見(jiàn)Brooks等人在InternationalWorkshop on Image Analysis and Information Fusion, Adelaide (1997)的第 35 至 42頁(yè)中發(fā)表的 “3D reconstruction from optical flow generated by an uncalibratedcamera undergoing unknown motion”)。此外,當(dāng)進(jìn)行目標(biāo)跟蹤時(shí),模塊110可以使用根據(jù)本發(fā)明的目標(biāo)跟蹤算法,如下面所更詳細(xì)描述的。
[0023]在執(zhí)行圖像分割之后,圖像分割模塊110可以生成目標(biāo)信息,并向圖像標(biāo)記模塊112、聚焦控制模塊114和/或數(shù)據(jù)庫(kù)116提供該信息。例如,圖像分割模塊110所提供的目標(biāo)信息可以包括目標(biāo)結(jié)果,例如但不限于與所分割的目標(biāo)相對(duì)應(yīng)的目標(biāo)掩模(objectmask)。
[0024]在各種實(shí)現(xiàn)中,圖像標(biāo)記模塊112可以從圖像分割模塊110和/或數(shù)據(jù)庫(kù)116接收目標(biāo)結(jié)果,并且如下面所更詳細(xì)解釋的,圖像標(biāo)記模塊112可以使用這些目標(biāo)結(jié)果,對(duì)在場(chǎng)景105的所捕獲圖像中出現(xiàn)的目標(biāo)進(jìn)行自動(dòng)標(biāo)記或者打標(biāo)簽。在各種實(shí)現(xiàn)中,圖像標(biāo)記模塊112可以使用目標(biāo)元數(shù)據(jù)來(lái)標(biāo)記捕獲的圖像,例如,將一個(gè)目標(biāo)標(biāo)記成一個(gè)特定的人物或者項(xiàng)目。為此,模塊112可以使用已知的目標(biāo)識(shí)別技術(shù)(例如,參見(jiàn)Viola和Jones在IEEE Conference on Computer Vision and Pattern Recognition(2001)中發(fā)表的“RapidObject Detection using a Boosted Cascade of Simple Features”)和 / 或已知的面部識(shí)別技術(shù)(例如,參見(jiàn)V.Blanz, T.Vetter在2003年9月出版的IEEE Transactions onPattern Analysis and Machine Intelligence, Vol.25, N0.9 的第 1063 至 1074 頁(yè)中發(fā)表的“Face Recognition Based on Fitting a3D Morphable Model”),來(lái)識(shí)別在所捕獲的圖像中出現(xiàn)的一個(gè)或多個(gè)人物和/或項(xiàng)目。在各種實(shí)現(xiàn)中,模塊112可以使用的已知面部識(shí)別技術(shù)包括主成分分析(PCA)、獨(dú)立成分分析(ICA)、3D形變模型(如上所引用的)、線性判別分析(LDA)、彈性束圖匹配(EBGM)、隱藏馬爾克夫模型(HMM)和神經(jīng)激勵(lì)的動(dòng)態(tài)鏈接匹配,僅僅舉一些非限制性示例。隨后,圖像標(biāo)記模塊112可以將相應(yīng)的目標(biāo)元數(shù)據(jù)與捕獲的一幅或多幅圖像相關(guān)聯(lián)的存儲(chǔ)在數(shù)據(jù)庫(kù)116中。
[0025]在各種實(shí)現(xiàn)中,聚焦控制模塊114還可以從圖像分割模塊110和/或數(shù)據(jù)庫(kù)116接收目標(biāo)信息。如下面所更詳細(xì)解釋的,聚焦控制模塊114可以使用該目標(biāo)信息,來(lái)提供成像設(shè)備102的調(diào)焦裝置的交互式控制。例如,成像設(shè)備102所提供的GUI可以允許用戶啟動(dòng)交互式調(diào)焦應(yīng)用,該應(yīng)用使用聚焦控制模塊114,并且允許用戶交互式地控制成像設(shè)備102的調(diào)焦裝置,如下面所更詳細(xì)解釋的。
[0026]數(shù)據(jù)庫(kù)116可以是任何類型的所組織的數(shù)據(jù)集合,其包括但不限于:目標(biāo)信息、圖像元數(shù)據(jù)和/或相關(guān)聯(lián)的圖像等等。例如,數(shù)據(jù)庫(kù)116可以是任何類型的所組織的數(shù)據(jù)集合,并且可以指代邏輯數(shù)據(jù)庫(kù),也可以指代計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)設(shè)備中的數(shù)據(jù)內(nèi)容的物理數(shù)據(jù)庫(kù)(例如,存儲(chǔ)在存儲(chǔ)器中、存儲(chǔ)在硬盤(pán)中等等)。在一些實(shí)現(xiàn)中,數(shù)據(jù)庫(kù)116可以包括數(shù)據(jù)庫(kù)管理系統(tǒng)(沒(méi)有示出)。在一些實(shí)現(xiàn)中,數(shù)據(jù)庫(kù)116可以由一個(gè)或多個(gè)存儲(chǔ)器設(shè)備(例如,隨機(jī)存取存儲(chǔ)器(RAM)等等)來(lái)提供,文件和/或存儲(chǔ)器管理系統(tǒng)(沒(méi)有示出)可以向圖像分割模塊110、圖像標(biāo)記模塊112和聚焦控制模塊114提供對(duì)數(shù)據(jù)庫(kù)116的訪問(wèn),以便于從數(shù)據(jù)庫(kù)116讀取和/或向數(shù)據(jù)庫(kù)116寫(xiě)入數(shù)據(jù)(例如,目標(biāo)掩模)。
[0027]在各種實(shí)現(xiàn)中,成像設(shè)備102可以是任何類型的設(shè)備(例如,具備視頻能力的智能電話等等),能夠向圖像處理模塊108提供數(shù)字形式的預(yù)捕獲圖像107。此外,預(yù)捕獲圖像107可以具有任何分辨率和/或?qū)捀弑?。例如,不是以全分辨率?lái)存儲(chǔ)和處理預(yù)捕獲圖像107,而是在圖像處理之前,可以將每一個(gè)預(yù)捕獲圖像縮小到更低分辨率格式,如本申請(qǐng)所描述的。
[0028]此外,雖然圖1將圖像處理模塊108描述成與成像設(shè)備102相分離,但本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,圖像處理模塊108可以是成像設(shè)備102的一個(gè)部件,但本發(fā)明在該方面并不受限。例如,在各種實(shí)現(xiàn)中,圖像處理模塊108可以物理地遠(yuǎn)離成像設(shè)備102。例如,雖然為了清楚說(shuō)明起見(jiàn),在圖1中沒(méi)有描述,但局域網(wǎng)(LAN)和/或廣域網(wǎng)(WAN)可以將圖像處理模塊108與成像設(shè)備102通信地連接。
[0029]此外,在各種實(shí)現(xiàn)中,可以通過(guò)硬件、固件和/或軟件的任意組合來(lái)提供圖像處理模塊108。例如,可以至少部分地通過(guò)在一個(gè)或多個(gè)處理器核上執(zhí)行的軟件,來(lái)提供圖像處理模塊108,其中所述一個(gè)或多個(gè)處理器核可以在成像設(shè)備102之內(nèi),也可以遠(yuǎn)離于成像設(shè)備102 (例如,分布在遠(yuǎn)離成像設(shè)備102的一個(gè)或多個(gè)服務(wù)器系統(tǒng)之中等等)。此外,圖像處理模塊108還可以包括為了清楚說(shuō)明起見(jiàn)而沒(méi)有在圖1中描述的各種其它組件。例如,圖像處理模塊108還可以包括各種通信和/或數(shù)據(jù)總線、互連、接口模塊等等。
[0030]自動(dòng)圖像標(biāo)記
[0031]在各種實(shí)現(xiàn)中,根據(jù)本發(fā)明的成像設(shè)備可以使用目標(biāo)信息,對(duì)捕獲的圖像進(jìn)行自動(dòng)標(biāo)記。當(dāng)已經(jīng)使用預(yù)捕獲圖像對(duì)在捕獲的圖像中出現(xiàn)的諸如人物之類的目標(biāo)進(jìn)行了分割時(shí),可以基于目標(biāo)識(shí)別和/或面部識(shí)別技術(shù)在所捕獲的圖像中將目標(biāo)標(biāo)記出來(lái)。隨后,可以使用這種標(biāo)記結(jié)果,來(lái)利用指示該目標(biāo)標(biāo)記的元數(shù)據(jù)(例如,人物A、人物B、汽車(chē)等等)對(duì)該圖像自動(dòng)地進(jìn)行標(biāo)記。[0032]圖2根據(jù)本發(fā)明的各種實(shí)現(xiàn),描繪了用于自動(dòng)圖像標(biāo)記的示例性處理200的流程圖。處理200可以包括一個(gè)或多個(gè)操作、功能或者動(dòng)作,如圖2的方框202、204、208、210、212和214中的一個(gè)或多個(gè)所描繪的。作為非限制性的示例,本申請(qǐng)中將參照?qǐng)D1的示例系統(tǒng)100的圖像處理模塊108來(lái)描述處理200。
[0033]處理200可以開(kāi)始于方框202,在方框202處,可以接收預(yù)捕獲圖像。在方框204處,可以使用預(yù)捕獲圖像中的目標(biāo)之間的相對(duì)運(yùn)動(dòng),對(duì)這些目標(biāo)進(jìn)行分割和跟蹤。例如,在方框202處可以由圖像處理模塊108接收預(yù)捕獲圖像107,并且圖像處理模塊108可以使用圖像分割模塊110,利用上面所指出的已知技術(shù)來(lái)執(zhí)行方框204的操作。
[0034]圖3描繪了當(dāng)關(guān)于場(chǎng)景105進(jìn)行大致的圓形運(yùn)動(dòng)300時(shí),成像設(shè)備102 (例如,配備有照相機(jī)的移動(dòng)設(shè)備)可以獲得的示例性的預(yù)捕獲圖像302、304、306和308。如先前所描述的,在各種實(shí)現(xiàn)中,GUI (沒(méi)有示出)可以提示設(shè)備102的用戶進(jìn)行運(yùn)動(dòng)300。如先前所描述的,本發(fā)明并不限于本申請(qǐng)所描述的特定運(yùn)動(dòng)(例如,圓形運(yùn)動(dòng)300),本發(fā)明預(yù)期足以獲得具有相對(duì)目標(biāo)運(yùn)動(dòng)的預(yù)捕獲圖像的任何類型、軌跡或者范圍的運(yùn)動(dòng)。例如,可以使用近似卵形、圓形、橢圓和/或線性的運(yùn)動(dòng),僅僅舉出一些非限制性示例。因此,在一些實(shí)現(xiàn)中,在按下快門(mén)裝置之前,用戶可以通過(guò)在保持設(shè)備102指向場(chǎng)景105的同時(shí),將成像設(shè)備102逐漸地向上和向下或者向左和向右移動(dòng),來(lái)獲得預(yù)捕獲圖像107。
[0035]如上所述,圖像分割模塊110可以使用已知圖像分割技術(shù)(例如,光流技術(shù))來(lái)執(zhí)行方框204的操作。例如,在各種實(shí)現(xiàn)中,圖像分割模塊110可以使用光流技術(shù),通過(guò)確定在每一個(gè)體素位置處在時(shí)間(t)和(t+&t)獲得的兩個(gè)圖像幀之間的運(yùn)動(dòng),利用瞬時(shí)圖像速度或者離散圖像位移來(lái)執(zhí)行預(yù)捕獲圖像中的運(yùn)動(dòng)估計(jì)。為此,僅僅舉出一些非限制性示例,圖像分割模塊HO可以使用相位相關(guān)技術(shù)、基于塊的技術(shù)、差分技術(shù)或者離散優(yōu)化技術(shù),來(lái)識(shí)別用于描述預(yù)捕獲圖像中的相對(duì)目標(biāo)運(yùn)動(dòng)的運(yùn)動(dòng)向量。在一些實(shí)現(xiàn)中,可以使用滑動(dòng)窗將目標(biāo)跟蹤應(yīng)用于每η個(gè)預(yù)捕獲圖像幀,以便在時(shí)間上傳播分割結(jié)果。
[0036]例如,圖4描繪了示例性預(yù)捕獲圖像306和308,在執(zhí)行方框204的操作時(shí),圖像分害I]模塊110可以對(duì)這些預(yù)捕獲圖像中出現(xiàn)的目標(biāo)進(jìn)行分割和跟蹤。例如,圖像分割模塊110可以對(duì)目標(biāo)402、404和406進(jìn)行分割,隨后跟蹤預(yù)捕獲圖像中的這些目標(biāo)的運(yùn)動(dòng)。此外,作為在方框204處執(zhí)行圖像分割的結(jié)果,圖像分割模塊110可以生成與各個(gè)分割的目標(biāo)相對(duì)應(yīng)的目標(biāo)掩模。例如,在圖4的示例中,圖像分割模塊110可以針對(duì)分割的目標(biāo)402、404和406中的每一個(gè),生成單獨(dú)的目標(biāo)掩模。
[0037]在各種實(shí)現(xiàn)中,模塊202和204的實(shí)現(xiàn)可以至少部分地同時(shí)發(fā)生,圖像分割模塊110可以繼續(xù)對(duì)預(yù)捕獲圖像中的目標(biāo)進(jìn)行分割和跟蹤,直到確定成像設(shè)備的用戶已操作了快門(mén)裝置來(lái)捕獲圖像為止(方框208)。例如,圖5描繪了當(dāng)執(zhí)行處理200的方框204的操作時(shí),可以使用的根據(jù)本發(fā)明的示例性目標(biāo)跟蹤處理500。處理500可以包括如圖5的方框502、504、506、508、510、512、514、516、518和520中的一個(gè)或多個(gè)所描繪的一個(gè)或多個(gè)操作、功能或者動(dòng)作。作為非限制性的示例,本申請(qǐng)中將參照?qǐng)D1的示例系統(tǒng)100的圖像處理模塊108來(lái)描述處理500。
[0038]處理500可以開(kāi)始于方框502,在方框502處,可以對(duì)于第一數(shù)量(N個(gè))的預(yù)捕獲圖像執(zhí)行圖像分割,以對(duì)目標(biāo)進(jìn)行分割并生成相應(yīng)的目標(biāo)結(jié)果。在各種實(shí)現(xiàn)中,數(shù)量N的范圍可以是從一到大于一的任意整數(shù),但本發(fā)明并不限于在方框502處處理的預(yù)捕獲圖像的具體數(shù)量。隨后,可以向分割的目標(biāo)分配初始置信度值,并且可以將這些目標(biāo)結(jié)果存儲(chǔ)成目標(biāo)歷史(方框504)。例如,圖像分割模塊110可以對(duì)預(yù)捕獲圖像107中的一個(gè)或多個(gè)執(zhí)行方框502和504的操作,其導(dǎo)致目標(biāo)掩模的生成,以及這些目標(biāo)掩模在目標(biāo)歷史中的存儲(chǔ)。
[0039]在方框506,可以對(duì)于下一個(gè)預(yù)捕獲圖像幀執(zhí)行圖像分割,將針對(duì)該下一個(gè)預(yù)捕獲圖像所獲得的新的目標(biāo)結(jié)果與從先前N個(gè)預(yù)捕獲圖像獲得的目標(biāo)歷史進(jìn)行比較。在各種實(shí)現(xiàn)中,方框506可以涉及:將與新目標(biāo)結(jié)果中所包含的目標(biāo)相關(guān)聯(lián)的目標(biāo)掩模,和與目標(biāo)歷史中的目標(biāo)相關(guān)聯(lián)的目標(biāo)掩模進(jìn)行比較。如果這兩個(gè)目標(biāo)掩模實(shí)質(zhì)上類似,則可以將相應(yīng)的目標(biāo)視作為相同的目標(biāo)。相反,如果兩個(gè)目標(biāo)掩模實(shí)質(zhì)上不類似,則可以將相應(yīng)的目標(biāo)視作為不同的目標(biāo)。
[0040]在方框508,判斷目標(biāo)歷史中的目標(biāo)是否也出現(xiàn)在新目標(biāo)結(jié)果中。如果目標(biāo)歷史中的目標(biāo)確實(shí)在新目標(biāo)結(jié)果中出現(xiàn)(例如,目標(biāo)掩模實(shí)質(zhì)上與新目標(biāo)結(jié)果中的目標(biāo)掩模相匹配),那么可以增加該目標(biāo)的置信度值(方框510)。但是,如果目標(biāo)歷史中的目標(biāo)沒(méi)有在新目標(biāo)結(jié)果中出現(xiàn)(例如,目標(biāo)掩模實(shí)質(zhì)上與新目標(biāo)結(jié)果中的目標(biāo)掩模不匹配),那么可以減少該目標(biāo)的置信度值(方框512)。如果結(jié)果是目標(biāo)置信度值變得太低(例如,如果在方框512處,目標(biāo)的置信度值下降到低于最小置信度值),那么可以在方框514處,從目標(biāo)歷史中刪除相應(yīng)的目標(biāo)(例如,可以從目標(biāo)歷史中刪除相應(yīng)的目標(biāo)掩模)。
[0041]處理500可以在方框516處繼續(xù),在方框516處,判斷在目標(biāo)歷史中是否存在需要與新目標(biāo)結(jié)果進(jìn)行比較的另外目標(biāo)。如果存在另外的目標(biāo),則處理500可以循環(huán)返回到方框508,可以針對(duì)目標(biāo)歷史中的另一個(gè)目標(biāo)執(zhí)行方框508-514的操作。處理500可以繼續(xù)循環(huán)通過(guò)方框508-516,直到已將目標(biāo)歷史中的所有目標(biāo)與通過(guò)方框506所獲得的新目標(biāo)結(jié)果進(jìn)行了比較為止。
[0042]在方框518處,判斷新目標(biāo)結(jié)果中是否有任何目標(biāo)沒(méi)有在目標(biāo)歷史中出現(xiàn)。如果方框518的結(jié)果是否定的(即,新目標(biāo)結(jié)果不包含未處于目標(biāo)歷史中的目標(biāo)),那么處理500可以循環(huán)返回到方框506,對(duì)下一個(gè)預(yù)捕獲圖像執(zhí)行圖像分割。但是,如果方框518的結(jié)果是肯定的(即,新目標(biāo)結(jié)果包含未處于目標(biāo)歷史中的一個(gè)或多個(gè)目標(biāo)),那么處理500可以轉(zhuǎn)到方框520,在方框520處,可以向任何新目標(biāo)分配初始的置信度值,并將新目標(biāo)添加到目標(biāo)歷史中。隨后,處理500可以循環(huán)返回到方框506,對(duì)下一個(gè)預(yù)捕獲圖像執(zhí)行圖像分割。處理500可以繼續(xù)以這種方式進(jìn)行,直到其確定已經(jīng)觸發(fā)了快門(mén)裝置(處理200的模塊208)為止。
[0043]返回到圖2的討論,當(dāng)在方框208處確定已觸發(fā)了快門(mén)裝置之后,處理200可以繼續(xù)到方框210,在方框210處,捕獲和存儲(chǔ)圖像和相應(yīng)的目標(biāo)掩模。例如,響應(yīng)于成像設(shè)備102的快門(mén)裝置的按下或觸發(fā),圖像處理模塊108可以捕獲圖像,并將該圖像存儲(chǔ)在數(shù)據(jù)庫(kù)116中。此外,圖像分割模塊110可以將目標(biāo)結(jié)果(例如,從目標(biāo)歷史獲得的目標(biāo)掩模(處理500))與所存儲(chǔ)的圖像相關(guān)聯(lián)地存儲(chǔ)在數(shù)據(jù)庫(kù)116中。
[0044]在方框212處,可以使用目標(biāo)掩模對(duì)所捕獲的圖像執(zhí)行目標(biāo)識(shí)別和/或面部識(shí)別,并且對(duì)識(shí)別的目標(biāo)進(jìn)行標(biāo)記。在各種實(shí)現(xiàn)中,圖像標(biāo)記模塊112可以利用上文所提到的已知的目標(biāo)和/或面部識(shí)別技術(shù),至少部分地使用在方框210處存儲(chǔ)的目標(biāo)掩模,來(lái)識(shí)別和標(biāo)記在所捕獲的圖像中出現(xiàn)的目標(biāo)。在方框214處,隨后可以使用目標(biāo)識(shí)別和/或面部識(shí)別結(jié)果,自動(dòng)地對(duì)捕獲的圖像進(jìn)行標(biāo)記,并且可以在數(shù)據(jù)庫(kù)116中將所獲得的圖像標(biāo)簽存儲(chǔ)成元數(shù)據(jù)。
[0045]作為處理200的結(jié)果,可以基于相關(guān)聯(lián)的元數(shù)據(jù)對(duì)捕獲的圖像做進(jìn)一步的處理。例如,在捕獲的圖像的后續(xù)觀看期間,用戶可以基于圖像標(biāo)簽來(lái)搜索圖像或者視頻。此外,用戶還可以選擇圖像中的任何目標(biāo)或者人物,并且基于與該圖像相關(guān)聯(lián)的目標(biāo)掩模,系統(tǒng)可以確定已選擇了哪個(gè)目標(biāo)或者人物。隨后,可以使用該目標(biāo)或者人物的標(biāo)簽,來(lái)向用戶提供信息,或者來(lái)搜索也包括該特定目標(biāo)或者人物的相關(guān)圖像或者視頻。
[0046]交互式聚焦控制
[0047]在各種實(shí)現(xiàn)中,根據(jù)本發(fā)明的成像設(shè)備可以使用目標(biāo)信息,來(lái)提供成像設(shè)備的調(diào)焦裝置的交互式控制。例如,基于預(yù)捕獲圖像分割結(jié)果,成像設(shè)備知道一場(chǎng)景中的分割的目標(biāo),并且知道哪些目標(biāo)處于該設(shè)備的聚焦區(qū)域之中。隨后,成像設(shè)備可以向用戶給出關(guān)于該設(shè)備正在聚焦于哪個(gè)目標(biāo)的視覺(jué)反饋。在各種實(shí)現(xiàn)中,可以以突出顯示聚焦目標(biāo)的方式或者其它指示聚焦目標(biāo)的方式,來(lái)顯示在該設(shè)備的顯示器或者取景器上所提供的圖像。例如,可以使聚焦的目標(biāo)顯示的清晰,使在取景器和/或聚焦區(qū)域中出現(xiàn)的其它目標(biāo)和背景變得模糊。用此方式,用戶可以判斷其成像設(shè)備是否正在聚焦于他/她旨在針對(duì)的目標(biāo)。如果照相機(jī)聚焦于錯(cuò)誤的目標(biāo),則用戶可以通過(guò)使用例如觸摸屏控制選擇取景器上的另一個(gè)目標(biāo),來(lái)交互式地對(duì)其進(jìn)行糾正,相應(yīng)地可以使得成像設(shè)備調(diào)整其對(duì)焦。
[0048]圖6根據(jù)本發(fā)明的各個(gè)實(shí)現(xiàn),描繪了用于交互式聚焦控制的示例性處理600的流程圖。處理600可以包括如圖6的方框602、604、608、610、612、614、616、618和620中的一個(gè)或多個(gè)所描繪的一個(gè)或多個(gè)操作、功能或者動(dòng)作。作為非限制性的示例,本申請(qǐng)中將參照?qǐng)D1的示例系統(tǒng)100的圖像處理模塊108來(lái)描述處理600。
[0049]處理600可以開(kāi)始于方框602,在方框602處,可以接收預(yù)捕獲圖像。在方框604處,可以使用預(yù)捕獲圖像中的目標(biāo)之間的相對(duì)運(yùn)動(dòng),來(lái)分割和跟蹤這些目標(biāo)。例如,圖像處理模塊108可以在方框602處接收預(yù)捕獲圖像107,模塊108可以使用圖像分割模塊110來(lái)執(zhí)行方框604的操作,如先前參照處理200的方框204所描述的。
[0050]在方框608處,可以將成像設(shè)備的焦點(diǎn)設(shè)置在該設(shè)備的聚焦區(qū)域中的一個(gè)目標(biāo)上。在各種實(shí)現(xiàn)中,聚焦控制模塊114可以使用從圖像分割模塊110或者數(shù)據(jù)庫(kù)116獲得的諸如目標(biāo)掩模之類的目標(biāo)信息,來(lái)將成像設(shè)備102的調(diào)焦裝置設(shè)置在設(shè)備102的聚焦區(qū)域(沒(méi)有示出)中出現(xiàn)的特定分割目標(biāo)上。在各種實(shí)現(xiàn)中,成像設(shè)備可以從在該設(shè)備的聚焦區(qū)域中出現(xiàn)的目標(biāo)之中,選擇最適當(dāng)?shù)哪繕?biāo)進(jìn)行聚焦。例如,如果與人物以及汽車(chē)相對(duì)應(yīng)的目標(biāo)均位于聚焦區(qū)域之中,那么成像設(shè)備可以將人物作為最可能恰當(dāng)?shù)哪繕?biāo)進(jìn)行聚焦。
[0051]在各種實(shí)現(xiàn)中,成像設(shè)備取景器可以顯示一場(chǎng)景的最新預(yù)捕獲圖像,以及當(dāng)前正在對(duì)該場(chǎng)景中的哪個(gè)目標(biāo)進(jìn)行聚焦的指示。例如,圖7根據(jù)本發(fā)明,描繪了用于交互式聚焦控制的示例方案700。在方案700中,成像設(shè)備702 (在該示例中,配備有照相機(jī)的移動(dòng)通信設(shè)備(例如,智能電話))包括觸摸屏取景器顯示器704。在該示例中,在與處理600的方框608相對(duì)應(yīng)的初始實(shí)例706中,在顯示器704中示出的場(chǎng)景包括與三個(gè)不同的人物相對(duì)應(yīng)的三個(gè)目標(biāo)708、710和712。
[0052]例如,在方框608處,成像設(shè)備702可以自動(dòng)地設(shè)置其調(diào)焦裝置,以聚焦于目標(biāo)710。隨后,在方框610處,成像設(shè)備可以使聚焦的目標(biāo),相對(duì)于在取景器顯示器中出現(xiàn)的其它目標(biāo)和/或背景,進(jìn)行突出顯示或者用其它方式進(jìn)行區(qū)分。例如,如圖7中所示,在實(shí)例706,成像設(shè)備702可以清晰地顯示目標(biāo)710,而模糊地顯示目標(biāo)708和712。當(dāng)然,也可以使用其它方案來(lái)對(duì)聚焦目標(biāo)進(jìn)行突出顯示,上述說(shuō)明只是一個(gè)非限制性示例。例如,在各種實(shí)現(xiàn)中,被聚焦的目標(biāo)可以被呈現(xiàn)為具有疊加在該圖像之上的相應(yīng)的目標(biāo)掩模,其中以彩色或者明亮的輪廓等等方式來(lái)描述該目標(biāo)掩模的呈現(xiàn)。
[0053]在方框612處,判斷該成像設(shè)備的目標(biāo)聚焦是否發(fā)生了改變。例如,在各種實(shí)現(xiàn)中,成像設(shè)備的用戶可以確定其更喜歡另一個(gè)目標(biāo)作為聚焦目標(biāo),而不是在方框608處成像設(shè)備所自動(dòng)選擇的目標(biāo)。例如,根據(jù)本發(fā)明,在方框608處成像設(shè)備自動(dòng)地選擇目標(biāo)進(jìn)行聚焦之后,成像設(shè)備可以繼續(xù)獲得新的預(yù)捕獲圖像,直到該設(shè)備的快門(mén)裝置被按下為止。因此,可以關(guān)于新獲得的預(yù)捕獲圖像連續(xù)地進(jìn)行分割和跟蹤(方框604),同時(shí)對(duì)聚焦的目標(biāo)也進(jìn)行跟蹤,使得在方框612處,用戶可以在任何時(shí)間交互式地選擇不同的目標(biāo)進(jìn)行聚焦。
[0054]當(dāng)在方框612處確定目標(biāo)聚焦已發(fā)生改變時(shí),處理600可以循環(huán)返回到方框608處。例如,如圖7中所示,在第二實(shí)例714,在方框612處,用戶可以交互式地選擇不同的目標(biāo)(在該示例中,目標(biāo)708)進(jìn)行聚焦。在一些實(shí)現(xiàn)中,用戶可以使用光標(biāo)(如圖所示)或者手指觸摸或者其它GUI特征,來(lái)選擇不同的目標(biāo)進(jìn)行聚焦。在選擇了不同的目標(biāo)進(jìn)行聚焦之后,成像設(shè)備隨后可以將該成像設(shè)備重新設(shè)置為聚焦于所選定的目標(biāo)(方框608),并在方框610處,相對(duì)于其它目標(biāo),對(duì)該目標(biāo)進(jìn)行突出顯示。例如,在實(shí)例714中,清晰地顯示目標(biāo)708,而模糊地顯示目標(biāo)710和712。只要用戶繼續(xù)選擇不同的目標(biāo)進(jìn)行聚焦,但還沒(méi)有按下設(shè)備的快門(mén)裝置,處理600就可以繼續(xù)循環(huán)通過(guò)方框608-612。例如,在第三實(shí)例716處,在方框612處,用戶可以交互式地選擇另一個(gè)目標(biāo)(在該示例中,目標(biāo)712)進(jìn)行聚焦,在方框610的相應(yīng)迭代中,可以清晰地顯示目標(biāo)712,而模糊地顯示目標(biāo)708和712,等等。
[0055]隨后,處理600可以進(jìn)行到方框614處,在方框614處,可以判斷是否觸發(fā)了成像設(shè)備的快門(mén)裝置。如果成像設(shè)備的快門(mén)裝置還沒(méi)有被觸發(fā),那么處理600可以循環(huán)返回通過(guò)方框604-612,如上所述。另一方面,如果成像設(shè)備的快門(mén)裝置已被觸發(fā),那么處理600可以轉(zhuǎn)到方框616 (捕獲和存儲(chǔ)圖像和目標(biāo)掩模)、方框618 (使用目標(biāo)掩模來(lái)執(zhí)行目標(biāo)識(shí)別和/或面部識(shí)別,并且標(biāo)記目標(biāo))和方框620(使用目標(biāo)識(shí)別和/或面部識(shí)別結(jié)果來(lái)標(biāo)記圖像,并存儲(chǔ)成與所存儲(chǔ)的圖像相關(guān)聯(lián)的元數(shù)據(jù)),如上面參照處理200的相應(yīng)部分(即,分別為方框210、212和214)所描述的。
[0056]雖然如圖2、圖5和圖6所描繪的示例性處理200、500和600的實(shí)現(xiàn)可以包括以所描繪的順序來(lái)示出的所有方框的執(zhí)行,但本發(fā)明在該方面并不受限制,在各個(gè)示例中,處理200、500和600的實(shí)現(xiàn)可以包括僅執(zhí)行所示出的一部分方框的操作,和/或以與所描繪的不相同的順序來(lái)執(zhí)行。
[0057]此外,圖2、圖5和圖6的方框中的任何一個(gè)或多個(gè),可以是響應(yīng)于一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品所提供的指令來(lái)執(zhí)行的。這些程序產(chǎn)品可以包括提供指令的信號(hào)承載介質(zhì),其中當(dāng)這些指令被例如處理器執(zhí)行時(shí),可以提供本申請(qǐng)所描述的功能。這些計(jì)算機(jī)程序產(chǎn)品可以用任何形式的計(jì)算機(jī)可讀介質(zhì)來(lái)提供。因此,例如,包括一個(gè)或多個(gè)處理器內(nèi)核的處理器,可以響應(yīng)于計(jì)算機(jī)可讀介質(zhì)向該處理器傳送的指令,執(zhí)行圖2、圖5和圖6中所示出的方框里的一個(gè)或多個(gè)操作。
[0058]如本申請(qǐng)所描述的任何實(shí)現(xiàn)里所使用的,術(shù)語(yǔ)“模塊”指代配置為提供本申請(qǐng)所描述的功能的軟件、固件和/或硬件的任意組合。軟件可以實(shí)現(xiàn)成軟件包、代碼和/或指令集或者指令,如本申請(qǐng)所描述的任何實(shí)現(xiàn)里所使用的,例如,“硬件”可以包括下面各項(xiàng)中的一個(gè)或者任意組合:硬件連接電路、可編程電路、狀態(tài)機(jī)電路和/或存儲(chǔ)由可編程電路執(zhí)行的指令的固件??梢詫⑦@些模塊統(tǒng)一地或者單獨(dú)地實(shí)現(xiàn)成形成大型系統(tǒng)(例如,集成電路(1C)、片上系統(tǒng)(SoC)等等)的一部分的電路。
[0059]圖8根據(jù)本發(fā)明,描繪了一種示例系統(tǒng)800。在各個(gè)實(shí)現(xiàn)中,系統(tǒng)800可以是媒體系統(tǒng),但系統(tǒng)800并不限于該上下文。例如,系統(tǒng)800可以并入到個(gè)人計(jì)算機(jī)(PC)、膝上型計(jì)算機(jī)、超級(jí)本計(jì)算機(jī)、平板計(jì)算機(jī)、觸摸板計(jì)算機(jī)、便攜式計(jì)算機(jī)、手持計(jì)算機(jī)、掌上計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、蜂窩電話、組合蜂窩電話/PDA、電視、智能設(shè)備(例如,智能電話、智能平板或者智能電視)、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID)、消息設(shè)備、數(shù)據(jù)通信設(shè)備、照相機(jī)(例如,傻瓜相機(jī)、超級(jí)變焦相機(jī)、數(shù)碼單反(DSLR)相機(jī))等等。
[0060]在各種實(shí)現(xiàn)中,系統(tǒng)800包括耦接到顯示器820的平臺(tái)802。平臺(tái)802可以從諸如內(nèi)容服務(wù)設(shè)備830或內(nèi)容傳送設(shè)備840或者其它類似內(nèi)容源之類的內(nèi)容設(shè)備接收內(nèi)容。可以使用包括一個(gè)或多個(gè)導(dǎo)航特征的導(dǎo)航控制器850,來(lái)與例如平臺(tái)802和/或顯示器820進(jìn)行交互。下面將更詳細(xì)地描述這些組件中的每一個(gè)。
[0061]在各種實(shí)現(xiàn)中,平臺(tái)802可以包括芯片集805、處理器810、存儲(chǔ)器812、存貯設(shè)備814、圖形子系統(tǒng)815、應(yīng)用816和/或無(wú)線裝置818的任意組合。芯片集805可以提供處理器810、存儲(chǔ)器812、存貯設(shè)備814、圖形子系統(tǒng)815、應(yīng)用816和/或無(wú)線裝置818之間的相互通信。例如,芯片集805可以包括能夠提供與存貯設(shè)備814的相互通信的存貯適配器(沒(méi)有示出)。
[0062]處理器810可以實(shí)現(xiàn)成復(fù)雜指令集計(jì)算機(jī)(CISC)或者精簡(jiǎn)指令集計(jì)算機(jī)(RISC)處理器、x86指令集兼容處理器、多核或者任何其它微處理器或中央處理單元(CPU)。在各種實(shí)現(xiàn)中,處理器810可以是雙核處理器、雙核移動(dòng)處理器等等。
[0063]存儲(chǔ)器812可以實(shí)現(xiàn)成易失性存儲(chǔ)器件,例如,但不限于:隨機(jī)存取存儲(chǔ)器(RAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)或者靜態(tài)RAM (SRAM)。
[0064]存貯設(shè)備814可以實(shí)現(xiàn)成非易失性存儲(chǔ)設(shè)備,例如,但不限于:磁盤(pán)驅(qū)動(dòng)器、光盤(pán)驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、內(nèi)部存貯設(shè)備、附著存貯設(shè)備、閃存、電池供電的SDRAM(同步DRAM)和/或網(wǎng)絡(luò)可訪問(wèn)存貯設(shè)備。在各種實(shí)現(xiàn)中,存貯設(shè)備814可以包括:例如,當(dāng)包括多個(gè)硬盤(pán)驅(qū)動(dòng)器時(shí),增加存貯性能,以增強(qiáng)有價(jià)值數(shù)字媒體的保護(hù)的技術(shù)。
[0065]圖形子系統(tǒng)815可以執(zhí)行諸如靜態(tài)圖像或者視頻之類的圖像的處理以用于顯示。例如,圖形子系統(tǒng)815可以是圖形處理單元(GPU)或者視覺(jué)處理單元(VPU)??梢允褂媚M或者數(shù)字接口來(lái)通信地連接圖形子系統(tǒng)815和顯示器820。例如,該接口可以是高清晰度多媒體接口、顯示端口、無(wú)線HDMI和/或無(wú)線HD兼容技術(shù)中的任何一種。圖形子系統(tǒng)815可以集成到處理器810或芯片集805中。在一些實(shí)現(xiàn)中,圖形子系統(tǒng)815可以是通信地連接到芯片集805的單卡。
[0066]本申請(qǐng)所描述的圖形和/或視頻處理技術(shù)可以用各種硬件體系結(jié)構(gòu)來(lái)實(shí)現(xiàn)。例如,圖形和/或視頻功能可以集成在一個(gè)芯片集之中。替代地,可以使用分立的圖形和/或視頻處理器。作為另一種實(shí)現(xiàn),圖形和/或視頻功能可以由包括多核處理器的通用處理器來(lái)提供。在另外的實(shí)施例中,可以將這些功能實(shí)現(xiàn)在消費(fèi)電子設(shè)備中。
[0067]無(wú)線裝置818可以包括能夠使用各種適當(dāng)?shù)臒o(wú)線通信技術(shù)來(lái)發(fā)送和接收信號(hào)的一個(gè)或多個(gè)無(wú)線裝置。這些技術(shù)可以涉及一個(gè)或多個(gè)無(wú)線網(wǎng)絡(luò)之間的通信。示例性無(wú)線網(wǎng)絡(luò)包括(但不限于)無(wú)線局域網(wǎng)(WLAN)、無(wú)線個(gè)域網(wǎng)(WPAN)、無(wú)線城域網(wǎng)(WMAN)、蜂窩網(wǎng)絡(luò)和衛(wèi)星網(wǎng)絡(luò)。在這些網(wǎng)絡(luò)之間的通信中,無(wú)線裝置818可以根據(jù)任何版本的一個(gè)或多個(gè)可適用標(biāo)準(zhǔn)進(jìn)行操作。
[0068]在各種實(shí)現(xiàn)中,顯示器820可以包括任何電視類型監(jiān)視器或顯示器。例如,顯示器820可以包括計(jì)算機(jī)顯示屏、觸摸屏顯示器、視頻監(jiān)視器、類似電視的設(shè)備和/或電視。顯示器820可以是數(shù)字和/或模擬的。在各種實(shí)現(xiàn)中,顯示器820可以是全息顯示器。此外,顯示器820可以是能接收視覺(jué)投影的透明接口。這種投影可以傳送各種形式的信息、圖像和/或目標(biāo)。例如,這種投影可以是移動(dòng)增強(qiáng)現(xiàn)實(shí)(MAR)應(yīng)用的視覺(jué)覆蓋。在一個(gè)或多個(gè)軟件應(yīng)用816的控制之下,平臺(tái)802可以在顯示器820上顯示用戶界面822。
[0069]在各種實(shí)現(xiàn)中,內(nèi)容服務(wù)設(shè)備830可以由任何國(guó)家的、國(guó)際的和/或獨(dú)立的服務(wù)持有,因此可由平臺(tái)802通過(guò)互聯(lián)網(wǎng)訪問(wèn),例如。內(nèi)容服務(wù)設(shè)備830可以連接到平臺(tái)802和/或顯示器820。平臺(tái)802和/或內(nèi)容服務(wù)設(shè)備830可以連接到網(wǎng)絡(luò)860,以便傳輸(例如,發(fā)送和/或接收)去往和來(lái)自網(wǎng)絡(luò)860的媒體信息。此外,內(nèi)容傳送設(shè)備840還可以連接到平臺(tái)802和/或顯示器820。
[0070]在各種實(shí)現(xiàn)中,內(nèi)容服務(wù)設(shè)備830可以包括有線電視盒、個(gè)人計(jì)算機(jī)、網(wǎng)絡(luò)、電話、具備互聯(lián)網(wǎng)能力的設(shè)備或者能夠傳送數(shù)字信息和/或內(nèi)容的裝置、以及能夠通過(guò)網(wǎng)絡(luò)860或者直接地在內(nèi)容提供商和平臺(tái)802和/或顯示器820之間單向或者雙向傳輸內(nèi)容的任何其它類似的設(shè)備。應(yīng)當(dāng)理解的是,可以通過(guò)網(wǎng)絡(luò)860,單向和/或雙向地傳輸去往和來(lái)自系統(tǒng)800中的組件和內(nèi)容提供商中的任何一個(gè)的內(nèi)容。內(nèi)容的示例可以包括任何媒體信息,例如其包括視頻、音樂(lè)、醫(yī)療和游戲信息等等。
[0071]內(nèi)容服務(wù)設(shè)備830可以接收諸如有線電視節(jié)目(其包括媒體信息、數(shù)字信息和/或其它內(nèi)容)之類的內(nèi)容。內(nèi)容提供商的示例可以包括:任何有線或衛(wèi)星電視或者無(wú)線或互聯(lián)網(wǎng)內(nèi)容提供商。所提供的示例并不意味著以任何方式來(lái)限制根據(jù)本發(fā)明的實(shí)現(xiàn)。
[0072]在各種實(shí)現(xiàn)中,平臺(tái)802可以從具有一個(gè)或多個(gè)導(dǎo)航特征的導(dǎo)航控制器850接收控制信號(hào)。例如,控制器850的這些導(dǎo)航特征可以用于與用戶界面822進(jìn)行交互。在一些實(shí)施例中,導(dǎo)航控制器850可以是指向設(shè)備,其可以是允許用戶向計(jì)算機(jī)輸入空間(例如,連續(xù)和多個(gè)維度的)數(shù)據(jù)的計(jì)算機(jī)硬件組件(具體而言,人體接口設(shè)備)。諸如圖形用戶界面(GUI)之類的很多系統(tǒng)、電視和監(jiān)視器允許用戶使用物理手勢(shì)來(lái)控制和提供用于計(jì)算機(jī)或電視的數(shù)據(jù)。
[0073]可以通過(guò)移動(dòng)指針、光標(biāo)、對(duì)焦環(huán)或者在顯示器(例如,顯示器820)上顯示的其它視覺(jué)指示符,在該顯示器上復(fù)制控制器850的導(dǎo)航特征的移動(dòng)。例如,在軟件應(yīng)用816的控制之下,位于導(dǎo)航控制器850上的導(dǎo)航特征可以映射到在用戶界面822上顯示的虛擬導(dǎo)航特征。在一些實(shí)施例中,控制器850可以不是單獨(dú)的組件,而可以集成到平臺(tái)802和/或顯示器820中。但是,本發(fā)明并不限于本申請(qǐng)所示出和描述的這些元素或者上下文。
[0074]在各種實(shí)現(xiàn)中,驅(qū)動(dòng)器(沒(méi)有示出)可以包括:用于在初始啟動(dòng)之后(例如,當(dāng)啟用時(shí)),使用戶能夠通過(guò)觸摸一個(gè)按鈕像電視那樣瞬時(shí)地打開(kāi)和關(guān)閉平臺(tái)802的技術(shù)。程序邏輯可以使得即使當(dāng)平臺(tái)802 “關(guān)閉”時(shí),平臺(tái)802也能將內(nèi)容流式傳送到媒體適配器或者其它內(nèi)容服務(wù)設(shè)備830或者內(nèi)容傳送設(shè)備840。此外,例如,芯片集805可以包括針對(duì)5.1環(huán)繞聲音頻和/或高清晰度7.1環(huán)繞聲音頻的硬件和/或軟件支持。驅(qū)動(dòng)器可以包括用于集成圖形平臺(tái)的圖形驅(qū)動(dòng)器。在一些實(shí)施例中,圖形驅(qū)動(dòng)器可以包括快速外圍組件互連(PCI)圖形卡。
[0075]在各種實(shí)現(xiàn)中,可以將系統(tǒng)800中所示出的組件里的任何一個(gè)或多個(gè)集成在一起。例如,可以將平臺(tái)802和內(nèi)容服務(wù)設(shè)備830集成在一起,或者可以將平臺(tái)802和內(nèi)容傳送設(shè)備840集成在一起,或者可以將平臺(tái)802、內(nèi)容服務(wù)設(shè)備830和內(nèi)容傳送設(shè)備840集成在一起。在各種實(shí)施例中,平臺(tái)802和顯示器820可以是一個(gè)集成單元。例如,可以將顯示器820和內(nèi)容服務(wù)設(shè)備830集成在一起,或者將顯示器820和內(nèi)容傳送設(shè)備840集成在一起。這些示例并不意味著對(duì)本發(fā)明進(jìn)行限制。
[0076]在各種實(shí)施例中,可以將系統(tǒng)800實(shí)現(xiàn)成無(wú)線系統(tǒng)、有線系統(tǒng)或者二者的組合、或者非聯(lián)網(wǎng)的系統(tǒng)。當(dāng)實(shí)現(xiàn)成無(wú)線系統(tǒng)時(shí),系統(tǒng)800可以包括適合于通過(guò)諸如一付或多付天線、發(fā)射機(jī)、接收機(jī)、收發(fā)機(jī)、放大器、過(guò)濾器、控制邏輯等等之類的無(wú)線共享介質(zhì)進(jìn)行通信的組件和接口。無(wú)線共享介質(zhì)的示例可以包括無(wú)線頻譜的一部分,例如,RF頻譜等等。當(dāng)實(shí)現(xiàn)成有線系統(tǒng)時(shí),系統(tǒng)800可以包括適合于通過(guò)諸如輸入/輸出(I/O)適配器、用于連接I/O適配器與相應(yīng)的有線通信介質(zhì)的物理連接器、網(wǎng)絡(luò)接口卡(NIC)、盤(pán)控制器、視頻控制器、音頻控制器等等之類的有線通信介質(zhì)進(jìn)行通信的組件和接口。有線通信介質(zhì)的示例可以包括電線、電纜、金屬導(dǎo)線、印刷電路板(PCB)、背板、交換矩陣、半導(dǎo)體材料、雙絞線、同軸電纜、光纖光纜等等。
[0077]平臺(tái)802可以建立用于傳輸信息的一個(gè)或多個(gè)邏輯或物理信道。該信息可以包括媒體信息和控制信息。媒體信息可以指代表示用于用戶的內(nèi)容的任何數(shù)據(jù)。例如,內(nèi)容的示例可以包括:來(lái)自于語(yǔ)音會(huì)話、視頻會(huì)議、流媒體視頻、電子郵件(“email”)消息、語(yǔ)音郵件消息、字母數(shù)字符號(hào)、圖形、圖像、視頻、文本等等的數(shù)據(jù)。例如,來(lái)自于語(yǔ)音會(huì)話的數(shù)據(jù)可以是語(yǔ)音信息、靜默時(shí)段、背景噪聲、舒適噪聲、音調(diào)等等??刂菩畔⒖梢灾复?表示用于自動(dòng)系統(tǒng)的命令、指令或控制字的任何數(shù)據(jù)。例如,可以使用控制信息將媒體信息路由通過(guò)系統(tǒng),或者指示一個(gè)節(jié)點(diǎn)以預(yù)定的方式來(lái)處理該媒體信息。但是,這些實(shí)施例并不限于在圖8中所示出或描述的元素或上下文。
[0078]如上所述,系統(tǒng)800可以用多種物理形式或者形狀因子來(lái)實(shí)現(xiàn)。圖9描繪了可以實(shí)現(xiàn)系統(tǒng)800的小型形狀因子設(shè)備900的實(shí)現(xiàn)。在一些實(shí)施例中,例如,設(shè)備900可以實(shí)現(xiàn)成具有無(wú)線能力或者不具有無(wú)線能力的移動(dòng)計(jì)算設(shè)備。移動(dòng)計(jì)算設(shè)備可以指代具有處理系統(tǒng)和移動(dòng)功率源或電源(例如,一個(gè)或多個(gè)電池)的任何設(shè)備。
[0079]如上所述,移動(dòng)計(jì)算設(shè)備的示例可以包括個(gè)人計(jì)算機(jī)(PC)、膝上型計(jì)算機(jī)、超級(jí)本計(jì)算機(jī)、平板計(jì)算機(jī)、觸摸板計(jì)算機(jī)、便攜式計(jì)算機(jī)、手持計(jì)算機(jī)、掌上計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、蜂窩電話、組合蜂窩電話/PDA、電視、智能設(shè)備(例如,智能電話、智能平板或者智能電視)、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID)、消息設(shè)備、數(shù)據(jù)通信設(shè)備、照相機(jī)(例如,傻瓜相機(jī)、超級(jí)變焦相機(jī)、數(shù)碼單反(DSLR)相機(jī))等等。
[0080]此外,移動(dòng)計(jì)算設(shè)備的示例還可以包括被布置為由人體穿戴的計(jì)算機(jī),例如,腕表計(jì)算機(jī)、手指計(jì)算機(jī)、環(huán)計(jì)算機(jī)、眼鏡計(jì)算機(jī)、腰帶扣計(jì)算機(jī)、臂帶計(jì)算機(jī)、鞋計(jì)算機(jī)、衣服計(jì)算機(jī)和其它可穿戴計(jì)算機(jī)。在各種實(shí)施例中,例如,移動(dòng)計(jì)算設(shè)備可以實(shí)現(xiàn)成能夠執(zhí)行計(jì)算機(jī)應(yīng)用、以及語(yǔ)音通信和/或數(shù)據(jù)通信的智能電話。雖然通過(guò)示例的方式,在將移動(dòng)計(jì)算設(shè)備實(shí)現(xiàn)成智能電話的基礎(chǔ)上描述了一些實(shí)施例,但應(yīng)當(dāng)理解的是,也可以使用其它無(wú)線移動(dòng)計(jì)算設(shè)備來(lái)實(shí)現(xiàn)其它實(shí)施例。這些實(shí)施例在本上下文中并不受限。
[0081]如圖9中所示,設(shè)備900可以包括殼體902、顯示器904、輸入/輸出(I/O)設(shè)備906和天線908。此外,設(shè)備900還可以包括導(dǎo)航特征912。顯示器904可以包括任何適當(dāng)?shù)娘@示單元,以便顯示適合于移動(dòng)計(jì)算設(shè)備的信息。I/O設(shè)備906可以包括用于向移動(dòng)計(jì)算設(shè)備輸入信息的任何適當(dāng)?shù)腎/O設(shè)備。I/O設(shè)備906的示例可以包括:字母數(shù)字鍵盤(pán)、數(shù)字鍵盤(pán)、觸摸板、輸入鍵、按鍵、開(kāi)關(guān)、蹺板開(kāi)關(guān)、麥克風(fēng)、揚(yáng)聲器、語(yǔ)音識(shí)別設(shè)備和軟件等等。此夕卜,還可以通過(guò)麥克風(fēng)(沒(méi)有示出)的方式,將信息輸入到設(shè)備900中。語(yǔ)音識(shí)別設(shè)備(沒(méi)有示出)可以對(duì)該信息進(jìn)行數(shù)字化。這些實(shí)施例在本上下文中并不受限制。
[0082]各種實(shí)施例可以使用硬件元件、軟件元件或者二者的組合來(lái)實(shí)現(xiàn)。硬件元件的示例可以包括處理器、微處理器、電路、電路元件(例如,晶體管、電阻、電容、電感等等)、集成電路、專用集成電路(ASIC)、可編程邏輯器件(PLD)、數(shù)字信號(hào)處理器(DSP)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、邏輯門(mén)、寄存器、半導(dǎo)體器件、芯片、微芯片、芯片集等等。軟件的示例可以包括軟件組件、程序、應(yīng)用、計(jì)算機(jī)程序、應(yīng)用程序、系統(tǒng)程序、機(jī)器程序、操作系統(tǒng)軟件、中間件、固件、軟件模塊、例行程序、子例行程序、函數(shù)、方法、過(guò)程、軟件界面、應(yīng)用程序接口(API)、指令集、計(jì)算代碼、計(jì)算機(jī)代碼、代碼段、計(jì)算機(jī)代碼段、字、值、符號(hào)或者其任意組合。判斷一個(gè)實(shí)施例是使用硬件元件和/或軟件元件來(lái)實(shí)現(xiàn),可以根據(jù)任意數(shù)量的因素而變化,例如,期望的計(jì)算速率、功率電平、熱容忍度、處理循環(huán)預(yù)算、輸入數(shù)據(jù)速率、輸出數(shù)據(jù)速率、存儲(chǔ)器資源、數(shù)據(jù)總線速度和其它設(shè)計(jì)方案或者性能約束。
[0083]至少一個(gè)實(shí)施例的一個(gè)或多個(gè)方面可以通過(guò)在機(jī)器可讀介質(zhì)上存儲(chǔ)的表示性指令來(lái)實(shí)現(xiàn),這些指令表示處理器中的各種邏輯,當(dāng)機(jī)器讀取這些指令時(shí),使得該機(jī)器生成用于執(zhí)行本申請(qǐng)所描述的技術(shù)的邏輯。這些表示(其稱為“IP核”)可以存儲(chǔ)在有形的機(jī)器可讀介質(zhì)上,并提供給各個(gè)客戶或者制造工廠,以便裝載到實(shí)際制造該邏輯或者處理器的制造機(jī)器中。
[0084]雖然參照各種實(shí)現(xiàn)描述了本申請(qǐng)所闡述的某些特征,但該描述并不旨在以限制性的含義來(lái)解釋。因此,對(duì)于本申請(qǐng)所涉及領(lǐng)域普通技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的本申請(qǐng)所描述實(shí)現(xiàn)的各種修改以及其它實(shí)現(xiàn),應(yīng)該認(rèn)為落入本發(fā)明的實(shí)質(zhì)和保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: 接收?qǐng)鼍暗亩鄠€(gè)預(yù)捕獲圖像,所述預(yù)捕獲圖像已由成像設(shè)備生成,所述預(yù)捕獲圖像呈現(xiàn)目標(biāo)運(yùn)動(dòng);以及 基于所述目標(biāo)運(yùn)動(dòng)來(lái)執(zhí)行圖像分割,直到所述成像設(shè)備的快門(mén)裝置被觸發(fā)以捕獲所述場(chǎng)景的圖像為止。
2.根據(jù)權(quán)利要求1所述的方法,還包括: 使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記在所捕獲的圖像中出現(xiàn)的目標(biāo)。
3.根據(jù)權(quán)利要求2所述的方法,其中,執(zhí)行圖像分割包括:生成與在所述多個(gè)預(yù)捕獲圖像中識(shí)別的目標(biāo)相對(duì)應(yīng)的目標(biāo)掩模,并且其中,使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記目標(biāo)包括: 存儲(chǔ)所述圖像和所述目標(biāo)掩模; 使用所述目標(biāo)掩模在所述圖像上執(zhí)行目標(biāo)識(shí)別;以及 使用所述目標(biāo)識(shí)別的結(jié)果來(lái)標(biāo)記在所述圖像中出現(xiàn)的目標(biāo)。
4.根據(jù)權(quán)利要求3所述的方法,其中,標(biāo)記在所述圖像中出現(xiàn)的目標(biāo)包括:存儲(chǔ)與所述圖像相關(guān)聯(lián)的元數(shù)據(jù) 。
5.根據(jù)權(quán)利要求1所述的方法,還包括: 使用所述圖像分割的結(jié)果來(lái)交互式地控制所述成像設(shè)備的調(diào)焦裝置。
6.根據(jù)權(quán)利要求5所述的方法,其中,執(zhí)行圖像分割包括:對(duì)所述場(chǎng)景中的多個(gè)目標(biāo)進(jìn)行分割和跟蹤,并且其中,使用所述圖像分割的結(jié)果來(lái)交互式地控制所述調(diào)焦裝置包括: 設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第一目標(biāo);以及 重新設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第二目標(biāo)。
7.根據(jù)權(quán)利要求6所述的方法,其中,重新設(shè)置所述調(diào)焦裝置以聚焦于所述第二目標(biāo)包括:響應(yīng)于用戶輸入來(lái)重新設(shè)置所述調(diào)焦裝置。
8.根據(jù)權(quán)利要求6所述的方法,其中,設(shè)置所述調(diào)焦裝置以聚焦于所述第一目標(biāo)包括:相對(duì)于所述場(chǎng)景中的所述多個(gè)目標(biāo)中的其它目標(biāo)突出顯示所述第一目標(biāo)。
9.根據(jù)權(quán)利要求8所述的方法,其中,相對(duì)于所述其它目標(biāo)突出顯示所述第一目標(biāo)包括:清晰地顯示所述第一目標(biāo),而模糊地顯示所述其它目標(biāo)。
10.根據(jù)權(quán)利要求1所述的方法,其中,執(zhí)行圖像分割包括通過(guò)下面的操作來(lái)分割和跟蹤所述場(chǎng)景中的目標(biāo): 對(duì)所述多個(gè)預(yù)捕獲圖像中的至少第一圖像執(zhí)行圖像分割,以生成第一多個(gè)目標(biāo)結(jié)果; 存儲(chǔ)所述第一多個(gè)目標(biāo)結(jié)果; 對(duì)所述多個(gè)預(yù)捕獲圖像中的第二圖像執(zhí)行圖像分割,以生成第二多個(gè)目標(biāo)結(jié)果;以及 將所述第二多個(gè)目標(biāo)結(jié)果與所述第一多個(gè)目標(biāo)結(jié)果進(jìn)行比較。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述第一多個(gè)目標(biāo)結(jié)果包括第一多個(gè)識(shí)別的目標(biāo),其中,所述第二多個(gè)目標(biāo)結(jié)果包括第二多個(gè)識(shí)別的目標(biāo),并且其中,將所述第二多個(gè)目標(biāo)結(jié)果與所述第一多個(gè)目標(biāo)結(jié)果進(jìn)行比較包括: 對(duì)所述第一多個(gè)識(shí)別的目標(biāo)中的包括在所述第二多個(gè)識(shí)別的目標(biāo)里的每一個(gè)目標(biāo)的置信度值進(jìn)行增加;以及 對(duì)所述第一多個(gè)識(shí)別的目標(biāo)中的不包括在所述第二多個(gè)識(shí)別的目標(biāo)里的每一個(gè)目標(biāo)的置信度值進(jìn)行減小。
12.一種包括計(jì)算機(jī)程序產(chǎn)品的制品,所述計(jì)算機(jī)程序產(chǎn)品中存儲(chǔ)有指令,當(dāng)所述指令被執(zhí)行時(shí)產(chǎn)生下面的操作: 接收?qǐng)鼍暗亩鄠€(gè)預(yù)捕獲圖像,所述預(yù)捕獲圖像已由成像設(shè)備生成,所述預(yù)捕獲圖像呈現(xiàn)目標(biāo)運(yùn)動(dòng);以及 基于所述目標(biāo)運(yùn)動(dòng)來(lái)執(zhí)行圖像分割,直到所述成像設(shè)備的快門(mén)裝置被觸發(fā)以捕獲所述場(chǎng)景的圖像為止。
13.根據(jù)權(quán)利要求12所述的制品,其中,所述計(jì)算機(jī)程序產(chǎn)品中還存儲(chǔ)有當(dāng)被執(zhí)行時(shí)產(chǎn)生下面操作的指令: 使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記在所捕獲的圖像中出現(xiàn)的目標(biāo)。
14.根據(jù)權(quán)利要求13所述的制品,其中,執(zhí)行圖像分割包括:生成與在所述多個(gè)預(yù)捕獲圖像中識(shí)別的目標(biāo)相對(duì)應(yīng)的目標(biāo)掩模,并且其中,使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記目標(biāo)包括: 存儲(chǔ)所述圖像和所述目標(biāo)掩模; 使用所述目標(biāo)掩 模在所述圖像上執(zhí)行目標(biāo)識(shí)別;以及 使用所述目標(biāo)識(shí)別的結(jié)果來(lái)標(biāo)記在所述圖像中出現(xiàn)的目標(biāo)。
15.根據(jù)權(quán)利要求14所述的制品,其中,標(biāo)記在所述圖像中出現(xiàn)的目標(biāo)包括:存儲(chǔ)與所述圖像相關(guān)聯(lián)的元數(shù)據(jù)。
16.根據(jù)權(quán)利要求12所述的制品,其中,所述計(jì)算機(jī)程序產(chǎn)品中還存儲(chǔ)有當(dāng)被執(zhí)行時(shí)產(chǎn)生下面操作的指令: 使用所述圖像分割的結(jié)果來(lái)交互式地控制所述成像設(shè)備的調(diào)焦裝置。
17.根據(jù)權(quán)利要求16所述的制品,其中,執(zhí)行圖像分割包括:對(duì)所述場(chǎng)景中的多個(gè)目標(biāo)進(jìn)行分割和跟蹤,并且其中,使用所述圖像分割的結(jié)果來(lái)交互式地控制所述調(diào)焦裝置包括: 設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第一目標(biāo);以及 重新設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第二目標(biāo)。
18.根據(jù)權(quán)利要求17所述的制品,其中,重新設(shè)置所述調(diào)焦裝置以聚焦于所述第二目標(biāo)包括:響應(yīng)于用戶輸入來(lái)重新設(shè)置所述調(diào)焦裝置。
19.根據(jù)權(quán)利要求17所述的制品,其中,設(shè)置所述調(diào)焦裝置以聚焦于所述第一目標(biāo)包括:相對(duì)于所述場(chǎng)景中的所述多個(gè)目標(biāo)里的其它目標(biāo)突出顯示所述第一目標(biāo)。
20.根據(jù)權(quán)利要求19所述的制品,其中,相對(duì)于所述其它目標(biāo)突出顯示所述第一目標(biāo)包括:清晰地顯示所述第一目標(biāo),而模糊地顯示其它目標(biāo)。
21.根據(jù)權(quán)利要求12所述的制品,其中,執(zhí)行圖像分割包括通過(guò)下面的操作來(lái)分割和跟蹤所述場(chǎng)景中的目標(biāo): 對(duì)所述多個(gè)預(yù)捕獲圖像中的至少第一圖像執(zhí)行圖像分割,以生成第一多個(gè)目標(biāo)結(jié)果; 存儲(chǔ)所述第一多個(gè)目標(biāo)結(jié)果; 對(duì)所述多個(gè)預(yù)捕獲圖像中的第二圖像執(zhí)行圖像分割,以生成第二多個(gè)目標(biāo)結(jié)果;以及 將所述第二多個(gè)目標(biāo)結(jié)果與所述第一多個(gè)目標(biāo)結(jié)果進(jìn)行比較。
22.根據(jù)權(quán)利要求21所述的制品,其中,所述第一多個(gè)目標(biāo)結(jié)果包括第一多個(gè)識(shí)別的目標(biāo),其中,所述第二多個(gè)目標(biāo)結(jié)果包括第二多個(gè)識(shí)別的目標(biāo),并且其中,將所述第二多個(gè)目標(biāo)結(jié)果與所述第一多個(gè)目標(biāo)結(jié)果進(jìn)行比較包括: 對(duì)所述第一多個(gè)識(shí)別的目標(biāo)中的包括在所述第二多個(gè)識(shí)別的目標(biāo)里的每一個(gè)目標(biāo)的置信度值進(jìn)行增加;以及 對(duì)所述第一多個(gè)識(shí)別的目標(biāo)中的不包括在所述第二多個(gè)識(shí)別的目標(biāo)里的每一個(gè)目標(biāo)的置信度值進(jìn)行減小。
23.—種設(shè)備,包括: 處理器,其配置為: 接收與場(chǎng)景的多個(gè)預(yù)捕獲圖像相對(duì)應(yīng)的數(shù)據(jù),所述預(yù)捕獲圖像已由成像設(shè)備生成,所述預(yù)捕獲圖像呈現(xiàn)目標(biāo)運(yùn)動(dòng);以及 基于所述目標(biāo)運(yùn)動(dòng)來(lái)執(zhí)行圖像分割,直到所述成像設(shè)備的快門(mén)裝置被觸發(fā)以捕獲所述場(chǎng)景的圖像為止。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中,所述處理器配置為: 使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記在所捕獲的圖像中出現(xiàn)的目標(biāo)。
25.根據(jù)權(quán)利要求23所述的設(shè)備,其中,所述處理器配置為: 使用所述圖像分割的 結(jié)果來(lái)交互式地控制所述成像設(shè)備的調(diào)焦裝置。
26.根據(jù)權(quán)利要求25所述的設(shè)備,其中,執(zhí)行圖像分割包括:對(duì)所述場(chǎng)景中的多個(gè)目標(biāo)進(jìn)行分割和跟蹤,并且其中,使用所述圖像分割的結(jié)果來(lái)交互式地控制所述調(diào)焦裝置包括: 設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第一目標(biāo);以及 重新設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第二目標(biāo)。
27.—種系統(tǒng),包括: 成像設(shè)備,用于獲得場(chǎng)景的多個(gè)預(yù)捕獲圖像,所述預(yù)捕獲圖像呈現(xiàn)目標(biāo)運(yùn)動(dòng);以及圖像處理模塊,用于接收所述多個(gè)預(yù)捕獲圖像,并基于所述目標(biāo)運(yùn)動(dòng)來(lái)執(zhí)行圖像分割,直到所述成像設(shè)備的快門(mén)裝置被觸發(fā)以捕獲所述場(chǎng)景的圖像為止。
28.根據(jù)權(quán)利要求27所述的系統(tǒng),其中,所述圖像處理模塊配置為: 使用所述圖像分割的結(jié)果來(lái)識(shí)別和自動(dòng)地標(biāo)記在所捕獲的圖像中出現(xiàn)的目標(biāo)。
29.根據(jù)權(quán)利要求27所述的系統(tǒng),其中,所述圖像處理模塊配置為: 使用所述圖像分割的結(jié)果來(lái)交互式地控制所述成像設(shè)備的調(diào)焦裝置。
30.根據(jù)權(quán)利要求29所述的系統(tǒng),其中,執(zhí)行圖像分割包括:對(duì)所述場(chǎng)景中的多個(gè)目標(biāo)進(jìn)行分割和跟蹤,并且其中,使用所述圖像分割的結(jié)果來(lái)交互式地控制所述調(diào)焦裝置包括: 設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第一目標(biāo);以及 重新設(shè)置所述調(diào)焦裝置以聚焦于所述多個(gè)目標(biāo)中的第二目標(biāo)。
【文檔編號(hào)】H04N13/02GK103988503SQ201180075431
【公開(kāi)日】2014年8月13日 申請(qǐng)日期:2011年12月12日 優(yōu)先權(quán)日:2011年12月12日
【發(fā)明者】W·孫, K·德?tīng)柵了箍? H·豪斯科爾 申請(qǐng)人:英特爾公司