專利名稱:單視場深度估算方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明有關(guān)單視場(mono-View)深度(d印th)估算,特別是關(guān)于一種用于單視場 深度估算的地模型(ground model)。
背景技術(shù):
當(dāng)三維物體藉由照相機或攝影機而投影映射至二維影像平面時,由于此種投射是 非唯一的多對一轉(zhuǎn)換,因此會失去立體深度資訊。換句話說,無法藉由投射后的影像點來決 定其深度。為了得到一個完整重現(xiàn)或近似的立體表現(xiàn),必須恢復(fù)或產(chǎn)生這些立體深度資訊。在單視場(mono-view或monoscopic)深度估算中,可藉由其空間域或頻域而得 到深度。本說明書中所稱的“單視場”是指左、右眼對于一場景會得到相同的透視觀。傳 統(tǒng)單視場深度估算方法之一是藉由物體運動程度來擷取深度,因此稱為“自運動獲取深度 (d印th-from-motion)”方法。其中,具較高運動程度的物體被賦予較小(較近)深度,反之 亦是。另一種傳統(tǒng)單視場深度估算方法則是對失焦區(qū)域(例如背景)賦予較大(較遠(yuǎn))深 度,因此稱為“自聚焦提示獲取深度(d印th-from-focus-cue)”方法。還有一種傳統(tǒng)單視場 深度估算方法是偵測消失線的交叉點(或消失點),并對消失點附近的點賦予較大(較遠(yuǎn)) 深度,反之亦是。由于自單視場的空間域_頻域所獲取的資訊極為有限,而上述傳統(tǒng)方法卻無法解 決現(xiàn)實視訊/影像的所有問題,因此亟需提出一種新穎的深度估算方法,用以處理各種的 單視場視訊/影像。
發(fā)明內(nèi)容
鑒于上述,本發(fā)明的目的之一在于提出一種適用于單視場深度估算方法或系統(tǒng)的 地模型,其可以在深廣度區(qū)域(cbpth diffusion region)出現(xiàn)的場合中處理各種場景以提 供正確且多樣的深度資訊。本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實現(xiàn)的。依據(jù)本發(fā)明提 出的一種單視場(mono-view)深度估算方法,其包括以下步驟將二維影像分割為多個物 件;在該多個物件中偵測出深廣度區(qū)域(DDR),其具有一水平面;分派深度給該深廣度區(qū)域 (DDR);以及分派深度給該深廣度區(qū)域(DDR)的連接物件。本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進一步實現(xiàn)。前述的單視場深度估算方法,其中所述的深廣度區(qū)域(DDR)為地面、海洋或地板。前述的單視場深度估算方法,其中所述的深廣度區(qū)域(DDR)的深度分派采用單調(diào) (monotonic)分派方式,從下往上依次遞增。前述的單視場深度估算方法,其中所述的連接物件的深度分派是根據(jù)該深廣度區(qū) 域(DDR)與該連接物件的連接處的深度。前述的單視場深度估算方法,其中所述的連接物件的深度同于該連接處的深度。前述的單視場深度估算方法,其還包含一步驟,用以將三維物體投影映射至二維影像平面。前述的單視場深度估算方法,其還包含一步驟,用以儲存或顯示該深廣度區(qū)域 (DDR)與該連接物件的深度。本發(fā)明的目的及解決其技術(shù)問題還采用以下技術(shù)方案來實現(xiàn)。依據(jù)本發(fā)明提出的 一種單視場(mono-view)深度估算系統(tǒng),其包含一分割單元,用以將二維影像分割為多個 物件;一深廣度區(qū)域(DDR)偵測單元,用以在該多個物件中偵測出深廣度區(qū)域(DDR),該深 廣度區(qū)域(DDR)具有一水平面;以及一深廣度區(qū)域(DDR)分派單元,用以分派深度給該深廣 度區(qū)域(DDR),及分派深度給該深廣度區(qū)域(DDR)的連接物件。本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進一步實 現(xiàn)。前述的單視場深度估算系統(tǒng),其中所述的深廣度區(qū)域(DDR)為地面、海洋或地板。前述的單視場深度估算系統(tǒng),其中所述的深廣度區(qū)域(DDR)的深度分派采用單調(diào) (monotonic)分派方式,從下往上依次遞增。前述的單視場深度估算系統(tǒng),其中所述的連接物件的深度分派是根據(jù)該深廣度區(qū) 域(DDR)與該連接物件的連接處的深度。前述的單視場深度估算系統(tǒng),其中所述的連接物件的深度同于該連接處的深度。前述的單視場深度估算系統(tǒng),其還包含一輸入裝置,用以將三維物體投影映射至
二維影像平面。前述的單視場深度估算系統(tǒng),其還包含一輸出裝置,用以儲存或顯示該深廣度區(qū) 域(DDR)與該連接物件的深度。本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點和有益效果。由以上可知,為達(dá)到上述目 的,根據(jù)本發(fā)明實施例,首先,將二維影像分割為多個物件。接著,在這些物件中偵測出深廣 度區(qū)域(DDR),例如地面或地板。深廣度區(qū)域(DDR)具有一水平面。分派深度給深廣度區(qū) 域(DDR),例如,以單調(diào)(monotonic)分派方式,從下往上依次遞增。分派深度給深廣度區(qū)域 (DDR)的連接物件,其是根據(jù)深廣度區(qū)域(DDR)與連接物件的連接處的深度來作分派。例 如,以深廣度區(qū)域(DDR)的連接處的深度分派給連接物件。借由上述技術(shù)方案,本發(fā)明單視場深度估算方法及系統(tǒng)至少具有下列優(yōu)點及有益 效果本發(fā)明提出適用于單視場(mono-view)深度估算方法及系統(tǒng)的地模型,其可以在深 廣度區(qū)域(DDR)出現(xiàn)的場合中處理各種場景以提供正確且多樣的深度資訊。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點能夠 更明顯易懂,以下特舉較佳實施例,并配合附圖,詳細(xì)說明如下。
圖1是本發(fā)明實施例中以地模型(ground model)為基礎(chǔ)的單視場(mono-view) 深度估算方法的步驟流程圖。圖2是本發(fā)明實施例的單視場深度估算系統(tǒng)的方塊圖。圖3是一影像的深廣度區(qū)域(DDR)的示意圖。100 單視場深度估算方法11-18 單視場深度估算方法的步 驟
200 單視場深度估算系統(tǒng)20 輸入裝置22 分割單元24 深廣度區(qū)域(DDR)偵測單元26 深廣度區(qū)域及連接物件的分派單元28 輸出裝置30 打高爾夫者32 地面(深廣度區(qū)域)
具體實施例方式為更進一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合 附圖及較佳實施例,對依據(jù)本發(fā)明提出的單視場深度估算方法及系統(tǒng)其具體實施方式
、步 驟、結(jié)構(gòu)、特征及其功效進行詳細(xì)說明。請參閱圖1、2所示,分別是本發(fā)明實施例中以地模型(ground model)為基礎(chǔ)的單 視場(mono-view)深度估算方法100的步驟流程圖及本發(fā)明實施例的單視場深度估算系統(tǒng) 200的方塊圖。于步驟11,輸入裝置20提供或接收一或多張二維(平面)輸入影像,用以作為進 行本實施例的影像/視訊處理之用。輸入裝置20可以是一種光電裝置,用以將三維物體投 影映射至二維影像平面。在本實施例中,輸入裝置20可以是照相機,用以取像得到二維影 像;或者可以是攝影機,用以取得多幅影像。在另一實施例中,輸入裝置20可以是前置處理 裝置,用以進行一或多個影像處理工作,例如影像強化、影像復(fù)原、影像分析、影像壓縮或影 像合成。再者,輸入裝置20可更包含一儲存裝置(例如半導(dǎo)體存儲裝置或硬盤),用以儲存 經(jīng)前置處理裝置所處理的影像。如前所述,當(dāng)三維物體投影映射至二維影像平面時,會失去 立體深度資訊,因此,以下將詳述本發(fā)明實施例的單視場深度估算系統(tǒng)200的其他方塊是 如何用來處理輸入裝置20所提供的二維影像。接下來,于步驟12,以分割(segmentation)單元22將輸入影像/視訊分隔為多個 區(qū)域、物件(objects)或片段。在本實施例中,“單元”一詞是用以指稱一電路、一段程序或 其組合。分割的目的是用以改變影像的表現(xiàn)型態(tài),以利后續(xù)步驟進行深度的分派。位于同 一區(qū)域的像素具有類似的特征,例如顏色、強度(intensity)或紋理(texture),而位于相 鄰區(qū)域的像素則具有不同的特征。步驟12的執(zhí)行可以采用傳統(tǒng)或?qū)戆l(fā)展的分割技術(shù)。于步驟13,以深廣度區(qū)域(cbpth diffusion region,DDR)偵測單元24來偵測出 深廣度區(qū)域(DDR)。根據(jù)本實施例所提出的地模型,深廣度區(qū)域(DDR)可以指的是地、海洋、 地板或其他水平面(horizontal plane)。當(dāng)一水平面具有相同的分割特征且具有相當(dāng)?shù)拿?積時,即可能被偵測為深廣度區(qū)域(DDR)。圖3所例示的影像中,打高爾夫者30站立于地面 (或草地)32。在例示的影像中,經(jīng)前一步驟12的分割后,可得到地面32及打高爾夫者30 兩個物件,其中的地面32即為一深廣度區(qū)域。當(dāng)深廣度區(qū)域(DDR)被識別出來后(步驟14),即以深廣度區(qū)域分派單元26來分派深度給深廣度區(qū)域(DDR)(步驟15)。深廣度區(qū)域(例如例子中的地面32)的深度分派可 以采用單調(diào)(monotonic)分派方式,從下往上依次遞增,其可以表示如下DepthDDR (y)個當(dāng) y 各或者DepthDDR = k/y
其中,k為常數(shù)。在其他實施例中,深廣度區(qū)域的深度分派可以從下往上采用非單調(diào) (non-monotonic)分派方式,例如 DepthDDR = k/(y2)。再者,與深廣度區(qū)域(DDR)連接的物件的深度分派,則可由深廣度區(qū)域分派單元 26根據(jù)連接處的深廣度區(qū)域深度來進行分派。以圖3影像為例,打高爾夫者30以腳連接于 (或站立于)深廣度區(qū)域。因此,將深廣度區(qū)域(DDR)位于連接處(亦即,ytlbj)的深度分派 給打高爾夫者30。深度的分派可以表示如下DepthObj = D 印 thDDR(yobJ)一般來說,當(dāng)一物件藉由一連接點而停留(或站立)于深廣度區(qū)域(DDR)時,則將 深廣度區(qū)域(DDR)位于該連接(結(jié)合)點的深度分派給該整個物件。如果在步驟14中沒有識別出深廣度區(qū)域(DDR),或者并無物件與深廣度區(qū)域 (DDR)相連接,則整個(或部分)影像可根據(jù)傳統(tǒng)(或?qū)戆l(fā)展之)深度分派方法來進行深 度分派。在圖1的流程中,對于非深廣度區(qū)域(non-DDR)影像,以步驟16偵測出其前景和 背景,并接著分別分派深度給前景及背景(步驟17)。一般來說,前景的深度小于背景的深 度。最后,步驟15所獲得的深度資訊可單獨或者與步驟17所獲得深度資訊加以合并(步 驟18),因而得到最終深度地圖(cbpth map)。輸出裝置28從深廣度區(qū)域分派單元26接收立體深度資訊,以提供輸出影像。在 一實施例中,輸出裝置28可以為顯示裝置,用以顯示或供觀看所接收的深度資訊。在另一 實施例中,輸出裝置28可以為儲存裝置,例如半導(dǎo)體存儲裝置或硬盤,用以儲存所接收的 深度資訊。再者,輸出裝置28也可更包含一后置處理裝置,用以進行一或多種影像處理,例 如影像強化、影像復(fù)原、影像分析、影像壓縮或影像合成。根據(jù)上述實施例所提出適用于單視場(mono-view)深度估算方法及系統(tǒng)的地模 型,其可以在深廣度區(qū)域(DDR)出現(xiàn)的場合中處理各種場景以提供正確且多樣的深度資訊。以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖 然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人 員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾 為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對 以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
一種單視場深度估算方法,其特征在于其包括以下步驟將二維影像分割為多個物件;在該多個物件中偵測出深廣度區(qū)域,其具有一水平面;分派深度給該深廣度區(qū)域;以及分派深度給該深廣度區(qū)域的連接物件。
2.根據(jù)權(quán)利要求1所述的單視場深度估算方法,其特征在于其中所述的深廣度區(qū)域為 地面、海洋或地板。
3.根據(jù)權(quán)利要求1所述的單視場深度估算方法,其特征在于其中所述的深廣度區(qū)域的 深度分派采用單調(diào)分派方式,從下往上依次遞增。
4.根據(jù)權(quán)利要求1所述的單視場深度估算方法,其特征在于其中所述的連接物件的深 度分派是根據(jù)該深廣度區(qū)域與該連接物件的連接處的深度。
5.根據(jù)權(quán)利要求4所述的單視場深度估算方法,其特征在于其中所述的連接物件的深 度同于該連接處的深度。
6.根據(jù)權(quán)利要求1所述的單視場深度估算方法,其特征在于其還包含一步驟,用以將 三維物體投影映射至二維影像平面。
7.根據(jù)權(quán)利要求1所述的單視場深度估算方法,其特征在于其還包含一步驟,用以儲 存或顯示該深廣度區(qū)域與該連接物件的深度。
8.一種單視場深度估算系統(tǒng),其特征在于其包含一分割單元,用以將二維影像分割為多個物件;一深廣度區(qū)域偵測單元,用以在該多個物件中偵測出深廣度區(qū)域,該深廣度區(qū)域具有 一水平面;以及一深廣度區(qū)域分派單元,用以分派深度給該深廣度區(qū)域,及分派深度給該深廣度區(qū)域 的連接物件。
9.根據(jù)權(quán)利要求8所述的單視場深度估算系統(tǒng),其特征在于其中所述的深廣度區(qū)域為 地面、海洋或地板。
10.根據(jù)權(quán)利要求8所述的單視場深度估算系統(tǒng),其特征在于其中所述的深廣度區(qū)域 的深度分派采用單調(diào)分派方式,從下往上依次遞增。
11.根據(jù)權(quán)利要求8所述的單視場深度估算系統(tǒng),其特征在于其中所述的連接物件的 深度分派是根據(jù)該深廣度區(qū)域與該連接物件的連接處的深度。
12.根據(jù)權(quán)利要求11所述的單視場深度估算系統(tǒng),其特征在于其中所述的連接物件的 深度同于該連接處的深度。
13.根據(jù)權(quán)利要求8所述的單視場深度估算系統(tǒng),其特征在于其還包含一輸入裝置,用 以將三維物體投影映射至二維影像平面。
14.根據(jù)權(quán)利要求8所述的單視場深度估算系統(tǒng),其特征在于其還包含一輸出裝置,用 以儲存或顯示該深廣度區(qū)域與該連接物件的深度。
全文摘要
本發(fā)明是有關(guān)于一種單視場(mono-view)深度估算方法及系統(tǒng)。首先,將二維影像分割為多個物件。接著,在這些物件中偵測出深廣度區(qū)域(DDR),例如地面或地板。深廣度區(qū)域(DDR)具有一水平面。分派深度給深廣度區(qū)域(DDR),且分派深度給深廣度區(qū)域(DDR)的連接物件。
文檔編號G06T7/00GK101833758SQ200910126078
公開日2010年9月15日 申請日期2009年3月9日 優(yōu)先權(quán)日2009年3月9日
發(fā)明者李國君, 王明俊, 黃鈴琇 申請人:奇景光電股份有限公司;財團法人成大研究發(fā)展基金會