專(zhuān)利名稱(chēng):深度映像計(jì)算的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算數(shù)字圖像深度映像的方法。本發(fā)明還涉及一種壓縮數(shù)字圖像信息的方法,一種用于數(shù)字圖像信息的解碼器和編碼器。
當(dāng)在分段期間藉助于帶符號(hào)的距離變換來(lái)確定段的方式,以籽晶點(diǎn)的形式產(chǎn)生規(guī)定段的特性數(shù)據(jù)時(shí),依據(jù)本發(fā)明的方法是特別有利的。因此,為了獲得有關(guān)的特性數(shù)據(jù)不需要附加的計(jì)算。籽晶點(diǎn)本身包含足夠的信息,以致用相當(dāng)少的計(jì)算資源就能產(chǎn)生圖像分段。對(duì)于一個(gè)圖像來(lái)說(shuō)籽晶點(diǎn)所需的存儲(chǔ)空間或帶寬是相當(dāng)少的,尤其是當(dāng)籽晶點(diǎn)被規(guī)為由網(wǎng)格點(diǎn),和用于網(wǎng)格點(diǎn)的上/下和左/右指示器組成的邊線位置時(shí)。利用由籽晶點(diǎn)產(chǎn)生的每段時(shí),必須包括深度信息,這些信息仍然只需要小的存儲(chǔ)器或帶寬。
本發(fā)明特別有利的詳情闡明在從屬的權(quán)利要求中,從以下的描述展現(xiàn)本發(fā)明的其它的目的、制作、修改、效果和細(xì)節(jié),在描述中參考附圖。
依據(jù)本發(fā)明,圖像處理包括將圖像劃分成段(分段)。以下描述一種有效的將圖像分成段的方法,稱(chēng)為準(zhǔn)-分段。
在以下的準(zhǔn)-分段的例子中,將使用把數(shù)字圖像分段成分離的區(qū)域。數(shù)字圖像由圖像的像素組成。在圖像中被形成的段用邊界或邊界線分界;在一個(gè)段的邊界內(nèi)的像素屬于該段,因而確定邊界導(dǎo)致確定段。
為了獲得邊界或至少邊界的片斷,數(shù)字圖像被處理以便使用一種分析圖像特點(diǎn)的邊線檢測(cè)過(guò)程找出圖像中的邊線。被檢出的邊線是由圖像的特點(diǎn)產(chǎn)生的,因此具有高的概率成為圖像物體之間的邊界。由邊線檢測(cè)過(guò)程檢出的邊線被用作要確定的段之間的邊界片斷。這些直接由圖像信息得出的邊界片斷被稱(chēng)為硬邊界片斷或高概率邊界片斷。
在
圖1中,用邊線檢測(cè)方法在圖像中檢出的硬邊界片斷用圖像10表示,它具有與數(shù)字圖像相同的尺寸。三個(gè)硬邊界片斷已被檢出,分別是邊界片斷a,b和c。注意,邊界片斷b是入射在邊界片斷a上;這種形貌被稱(chēng)為分枝。
在本領(lǐng)域中邊線檢測(cè)方法本來(lái)就是眾所周知的。在本例中用高反差的邊界確定硬邊界片斷,它是圖像要素之間一個(gè)邊界的良好標(biāo)記??梢允褂脠D像要素之間邊界片斷的其他準(zhǔn)則,例如,顏色、亮度,或紋理。
硬邊界片斷a,b,c將一個(gè)段的部分劃界;然而這些段的邊界并不是完整的。必須確定邊界的其他部分。由到最接近的硬邊界部分的距離來(lái)確定其他的邊界部分。為了獲得其他的邊界部分,邊界片斷a,b和c的邊被限定并被唯一地打上標(biāo)記。如圖2中所示,邊界部分b具有第一邊IV和第二邊V,邊界部分c因而具有第一邊VI和第二邊VII。邊界部分a具有第一邊III;邊界部分a的其他邊被邊界部分b在邊界b與邊界部分a相交的位置上劃分成兩部分,各個(gè)部分是邊界部分a的邊I和II。
為了獲得其他的邊界,邊I-VII被從它們始發(fā)的邊界片斷向外的方向擴(kuò)展,各自的擴(kuò)展方向在圖3中用箭頭I’-VII’表示。最好,擴(kuò)展的方向基本上垂直于上述的陣面。許多擴(kuò)展的陣面,分別用Ia/b/c-VIIa/b/c標(biāo)記,已被表示在圖3中,其中后綴a標(biāo)記靠近原始邊線的陣面,后綴b和c分別標(biāo)記進(jìn)一步從原始的邊界片斷順序的陣面。事實(shí)上每個(gè)陣面是具有與最接近的邊界片斷相同距離的點(diǎn)的軌跡。擴(kuò)展陣面與相鄰的擴(kuò)展陣面相遇處,形成邊界片斷,如圖4中陰影線所示。這些邊界片斷被稱(chēng)為軟邊界片斷,因?yàn)樗鼈儾⒉恢苯訌膱D像的信息導(dǎo)出。軟邊界部分基本上與硬邊界部分的末端部分鄰接。然而,當(dāng)硬邊界部分延伸到圖像的邊線時(shí),可能發(fā)生非鄰接的軟邊界部分。軟邊界是一個(gè)段的邊界的一部分的概率低于以上提到的硬邊界的情形。在陣面全部擴(kuò)展到圖像的邊線以后,各段被限定,如圖4中用大寫(xiě)字母A-E所示。軟邊界用它們劃分的兩個(gè)段來(lái)標(biāo)記。作為結(jié)果,全部的圖像已被劃分成段A-E,其中每段至少部分地用硬邊界,并進(jìn)一步用軟邊界或圖像邊線來(lái)分界。然后,可以對(duì)邏輯上組成單一段的被過(guò)分段的區(qū)域查看所獲得的分段。在本例中,段B1-B2和C1-C2之間的邊界是多余的,它是作為由邊界a和b的分枝引起的過(guò)分段的結(jié)果。在檢測(cè)到這樣的過(guò)分段以后,段B1-B2和C1-C2可被合并。
因此,圖像像素可被唯一地分配給由按以上所解釋的方式建立的硬和軟邊界部分分界的段。注意,這些段是由共同使用一個(gè)硬邊界片斷的相同的最接近的邊的像素組組成。
用這種方法獲得的分段被稱(chēng)為準(zhǔn)分段,其中段邊界的某些部分未被太嚴(yán)格規(guī)定,具有較低的確信度(以上所描述的軟邊界部分)。這種準(zhǔn)分段有優(yōu)點(diǎn),它導(dǎo)致這樣的分段結(jié)果,在可以容易確定分段的地方,邊界部分是準(zhǔn)確的,在較難確定的地方,邊界部分是不太準(zhǔn)確的。這導(dǎo)致大大降低計(jì)算成本和增加計(jì)算速度。這些準(zhǔn)段可以,例如,使用在后繼圖像段的匹配中。
以下將描述準(zhǔn)分段的實(shí)施方法。在本例中要分段的數(shù)字圖像是帶有分辨率NxM的像素(x,y)的一個(gè)離散的圖像IM(x,y),其中N和M是整數(shù)。一個(gè)帶有分辨率NxM的像素(x,y)的二進(jìn)制圖形被定義;如由此往后要描述的那樣,二進(jìn)制圖形被用于確定圖像IM的段。也定義了一個(gè)陣列d(x,y),被稱(chēng)為距離陣列,它的規(guī)模是NxM,和一個(gè)被稱(chēng)為項(xiàng)緩沖器的陣列b(x,y),規(guī)模也是NxM。在距離陣列d(x,y)中,對(duì)于每個(gè)像素存儲(chǔ)到最接近籽晶(以下要定義)的距離;以下將解釋對(duì)這個(gè)距離的確定。在項(xiàng)緩沖器陣列b(x,y)中,對(duì)每個(gè)像素(x,y)存儲(chǔ)最接近的籽晶或邊界片斷的本體;以下將解釋對(duì)最接近的籽晶或邊界的確定。
首先,用一個(gè)邊線檢測(cè)器處理數(shù)字圖像IM,確定被良好定義的邊界;這個(gè)步驟類(lèi)似于以前提到的對(duì)硬邊界片斷的檢測(cè)。舉例來(lái)說(shuō),如由E.C.Hildreth在“The detection of intensity changes bycomputer and biological vision systems”published in 1983 incomputer vision,graphics and Image processing,pag.221-27,中所描述的那樣,在本實(shí)施方案中使用已知的Marr-Hildreth方法。Marr-Hildreth算法使用Laplacian of Gaussian(LOG)算子的零交叉來(lái)檢測(cè)邊界片斷。
Marr-Hildreth方法檢測(cè)離散圖像IM的兩個(gè)像素之間LOG的零交叉,如在第一實(shí)施方案中那樣,它們被考慮為在硬邊界片斷上的點(diǎn)。在圖6中示出圖像矩陣的一部分,用網(wǎng)格的相交點(diǎn)表明像素的位置。線305指明用星號(hào)(*)310表示的零交叉,它們是藉助于LOG算子檢出的。用LOG零交叉檢測(cè)在圖像中找到的硬邊界大部分是像素間位置中被延伸的鄰接序列。隨著位于兩個(gè)像素之間的每次零交叉,在交叉的任一側(cè)上將兩個(gè)像素籽晶相關(guān)聯(lián);邊界305在兩個(gè)籽晶像素之間通過(guò)。在本實(shí)施方案中,籽晶由籽晶像素組成,其中籽晶像素是最接近硬邊界部分的圖像的像素。籽晶形成數(shù)字圖像像素陣列內(nèi)邊界部分的近似值;因?yàn)樽丫Х舷袼仃嚵校S后的計(jì)算可以比較容易進(jìn)行??梢允褂酶鶕?jù)找到的硬邊界部分確定籽晶的其他方法。在圖6中用圓圈320和黑點(diǎn)330表示與邊界310相對(duì)的籽晶像素對(duì)。
籽晶像素全被沿著檢出的硬邊界305定義,產(chǎn)生兩個(gè)像素寬的雙鏈。每個(gè)沿著邊界一側(cè)的籽晶像素鏈(也就是,每個(gè)單像素寬的半個(gè)雙鏈)被認(rèn)為是一個(gè)籽晶,并相應(yīng)地用一個(gè)唯一的標(biāo)識(shí)符表示。因?yàn)樵诒纠杏策吔缡峭ㄟ^(guò)LOG算子的零交叉確定的,LOG的值在邊界的一側(cè)上是正的,在另一側(cè)上是負(fù)的。依據(jù)本發(fā)明利用LOG算子的符號(hào)可以實(shí)現(xiàn)對(duì)邊界不同側(cè)的識(shí)別。這是有利的,因?yàn)長(zhǎng)OG算子已經(jīng)在過(guò)程中被算出。因?yàn)槭褂肔OG算子,也可以把分段方法稱(chēng)為帶符號(hào)的距離變換。
作為L(zhǎng)OG-基的邊線檢測(cè)結(jié)果,籽晶像素基本上形成鏈;然而,籽晶可以是任意形狀的邊線像素群集,特別是籽晶具有大于單像素的寬度。
在項(xiàng)緩沖器b(x,y)中,與一個(gè)籽晶點(diǎn)的位置對(duì)應(yīng)的值被給予唯一的籽晶標(biāo)識(shí)符的值,起初,并不是籽晶點(diǎn)的所有其他的像素在項(xiàng)緩沖器b(x,y)中沒(méi)有籽晶標(biāo)識(shí)符數(shù),而被給予一個(gè)并不對(duì)應(yīng)于籽晶標(biāo)識(shí)符數(shù)的值。
對(duì)于圖像IM(x,y)中被找到是一個(gè)籽晶像素的每個(gè)像素,在二進(jìn)制圖像I中具有相應(yīng)坐標(biāo)(x,y)的像素被給予值1,在圖像I中所有其他的像素被給予值0。
藉助于,例如LOG濾波圖像中值的線性內(nèi)插,可以完成對(duì)于實(shí)際零交叉點(diǎn)310和各對(duì)籽晶像素320,330之間的子-像素距離的估值。如圖6中所示,對(duì)于最右側(cè)的像素對(duì),各自的距離為d1和d2,其中d1+d2=1,對(duì)于像素距離的網(wǎng)格尺寸是單位距離1。d1和d2各自的值被分配給各自的籽晶像素的d(x,y)。通過(guò)將與所用的距離系統(tǒng)內(nèi)對(duì)應(yīng)于無(wú)窮大的距離分配給不在籽晶上的像素位置將距離陣列d進(jìn)一步初始化。
距離變換對(duì)于每個(gè)像素(x,y)給出到最接近的籽晶點(diǎn)的最短距離d(x,y)??梢允褂萌魏芜m當(dāng)?shù)膶?duì)距離的定義,如歐幾里德(Euclidean),“city block”或“Manhattan”距離。計(jì)算對(duì)于每個(gè)像素到最接近的籽晶點(diǎn)的距離的方法在本領(lǐng)域中是眾所周知的,可以使用任何適當(dāng)?shù)姆椒▽?shí)施本發(fā)明。例如,一種由G.Borgefors在“Distance transforms in arbitrary dimemsions”,Published inComputer vision,graphics and Image processing,pag.27321-345中所描述的算法可用于計(jì)算距離變換,特別是所公開(kāi)的用于兩維的情況的方法。
這種算法是基于兩次通過(guò)圖像I(x,y)中所有的像素,得到指明對(duì)最接近的籽晶的距離的d(x,y)值。如以前提到的那樣對(duì)d(x,y)值初始化。在第一次通過(guò)時(shí),從圖像I的左上方到右下方,值d(x,y)被設(shè)置為等于它本身的最小值和每個(gè)它的鄰居值加上到達(dá)該鄰居值的距離。在第二次通過(guò)時(shí),像素被從圖像I的右下方到左上方進(jìn)行掃描時(shí)遵循相同的步驟。在這兩次通過(guò)以后,所有的d(x,y)具有它們的正確值,代表到最接近的籽晶點(diǎn)最近的距離。
在兩次通過(guò)期間,d(x,y)距離陣列被充滿正確值時(shí),項(xiàng)緩沖器b(x,y)被對(duì)每個(gè)像素(x,y)最接近的籽晶的識(shí)別標(biāo)志所更新。在距離變換以后,對(duì)于每個(gè)像素(x,y),項(xiàng)緩沖器b(x,y)具有與最接近的籽晶有關(guān)的值。這導(dǎo)致數(shù)字圖像被分段;由具有相同值b(x,y)的像素(x,y)組成段。
在第二例子中,在距離變換算法中被進(jìn)一步計(jì)算的距離是非整數(shù)值,如是一個(gè)實(shí)數(shù),這是由于對(duì)d(x,y)的初始值線性內(nèi)插的緣故。當(dāng)對(duì)于一個(gè)像素(x,y)比較代表到兩個(gè)不同籽晶最短距離的實(shí)際取值的d(x,y)值時(shí),兩個(gè)距離不同的機(jī)會(huì)是非常大的。這使每個(gè)像素的唯一識(shí)別標(biāo)志能夠?qū)儆谝粋€(gè)單一段。如果用整數(shù)值測(cè)量距離,對(duì)于具有對(duì)兩個(gè)籽晶相同距離的許多像素中每一個(gè)必須進(jìn)行隨意的選擇,這將導(dǎo)致增加邊界的參差性(因而降低精確度),但對(duì)計(jì)算能力要求較低。
圖7中示出依據(jù)本發(fā)明的一種對(duì)數(shù)字圖像編碼的方法的流程圖。
處理數(shù)字圖像M的第一步驟是使用,例如,以上描述過(guò)的準(zhǔn)分段方法對(duì)圖像分段100。簡(jiǎn)單地說(shuō),按照準(zhǔn)分段的要求,掃視圖像的奇異性,特別是發(fā)光度邊線。在所找到的邊線周?chē)南袼乇挥糜诖_定組成籽晶的籽晶點(diǎn)。籽晶被擴(kuò)展形成段。如上所示,這種分段的結(jié)果是分配圖像中每個(gè)像素一個(gè)段,因此一段就是一組像素。這些結(jié)果是圖像內(nèi)籽晶的位置,和一個(gè)填好的項(xiàng)緩沖器b。
在后繼的步驟200中,確定每段的深度值和項(xiàng)緩沖器中每個(gè)像素,得到深度映像dm。確定深度值本身在技術(shù)上是已知的,依據(jù)本發(fā)明可以使用任何適當(dāng)?shù)姆椒ā?br>
在步驟300中,對(duì)于該圖像所確定的關(guān)于深度值的信息被壓縮。這是根據(jù)從分段和深度分析得到的信息,通過(guò)組成數(shù)字圖像的深度重建信息來(lái)完成的。根據(jù)重建信息可以重建圖像的深度映像。
為了實(shí)現(xiàn)這點(diǎn),只有段310的邊線位置以及由段產(chǎn)生的段的深度值數(shù)據(jù)320被包括在重建信息中。接收機(jī)可以使用這種重建信息。利用上述的分段方法,從所提供的邊線開(kāi)始再生數(shù)字圖像的深度映像。要指出的是在準(zhǔn)分段中需要大部分計(jì)算資源的步驟是確定奇異性。一旦奇異性已知,可以利用相當(dāng)少的計(jì)算資源完成組成段。
邊線信息可被編碼如下。圖8中示出圖像的一部分網(wǎng)格。由兩條邊線e1,e2分離的三個(gè)段D1,D2和D3的部分被示出。為了存儲(chǔ)邊線信息,一個(gè)邊線位置需要。
·邊線所歸屬的網(wǎng)格點(diǎn)(x,y)的坐標(biāo),·在網(wǎng)格點(diǎn)(x,y)的上側(cè)上穿過(guò)網(wǎng)格的邊線存在與否的信息,·在網(wǎng)格點(diǎn)(x,y)的右側(cè)上穿過(guò)網(wǎng)格的邊線存在與否的信息,和·所產(chǎn)生的段的深度值。
對(duì)于圖8的情況,邊線分別在網(wǎng)格點(diǎn)(x,y)的上側(cè)和右側(cè)上穿過(guò),相應(yīng)地用符號(hào)+表示。為了確定項(xiàng)緩沖器,并不需要在網(wǎng)格點(diǎn)(以上所示的d1和d2)之間邊線上零交叉的精確位置。因此可以用二進(jìn)制或布爾(Boolean)參數(shù)充分地表示存在信息。
另一種方案是,可以利用在分段過(guò)程中找到的有關(guān)籽晶的信息對(duì)邊線信息編碼。在這種情況下要發(fā)送的數(shù)據(jù)包括·籽晶像素坐標(biāo),·各自的籽晶數(shù),和·一張將深度值歸屬于籽晶數(shù)的表。
籽晶像素坐標(biāo)數(shù)大體上是邊線位置數(shù)的兩倍;因此通過(guò)籽晶像素坐標(biāo)發(fā)送邊線信息需要較大量的數(shù)據(jù)傳輸。段的重建稍微快些,因?yàn)椴恍枰亟ㄗ丫c(diǎn)。
然而,在圖7中用虛線所示的下個(gè)步驟400中,數(shù)字圖像與重建信息一起發(fā)送到接收機(jī)。取決于所使用的傳輸協(xié)議,可以利用一種如MPEG中所提供的并行通信信道傳送重建信息。另一種方案是,重建信息可以存儲(chǔ)在數(shù)據(jù)載體上,如數(shù)字通用盤(pán)(DVD),CD和CD-ROM,作為步驟500用虛線示于圖7中,最好利用一種適當(dāng)?shù)拇鎯?chǔ)方法,如MPEG,與數(shù)字圖像信息一起存儲(chǔ)。在步驟300中所確定的數(shù)據(jù)被順序地輸出,作為步驟400和500用虛線示于圖7中。
依據(jù)本發(fā)明提供一種用于壓縮數(shù)字圖像信息的編碼設(shè)備600,如圖12中所示。設(shè)備600包括一個(gè)輸入部分610,用于接收由像素組成的數(shù)字圖像,一個(gè)處理單元620,用于根據(jù)數(shù)字圖像中的奇異性,通過(guò)將數(shù)字圖像的每個(gè)像素分配到段對(duì)數(shù)字圖像進(jìn)行分段,和用于確定圖像中每段的深度值數(shù)據(jù),和一個(gè)輸出裝置630,用于輸出數(shù)字圖像的深度重建信息,包括所述的特性數(shù)據(jù)和深度值數(shù)據(jù)。最好對(duì)處理單元620提供用于實(shí)施上述編碼方法中步驟100,200,300的計(jì)算機(jī)程序。然而本發(fā)明并不限于這種實(shí)施方案??梢圆捎闷渌膶?shí)施方法,例如,利用專(zhuān)用硬件,如一種芯片。
圖14中示出一種依據(jù)本發(fā)明的發(fā)射機(jī)950,提供一種如上所述的編碼器600。發(fā)射機(jī)被進(jìn)一步提供一個(gè)輸入部分955,用于接收?qǐng)D像信息,和一個(gè)輸出部分965,在本例中作為發(fā)送設(shè)備實(shí)施。發(fā)送設(shè)備965被適配成產(chǎn)生輸出信號(hào),例如數(shù)字位流信號(hào)或適合于廣播的信號(hào)。所產(chǎn)生的信號(hào)代表數(shù)字圖像并包括用于數(shù)字圖像的特性數(shù)據(jù),和用于對(duì)數(shù)字圖像分段的深度值數(shù)據(jù)。
由上述方法產(chǎn)生的,從數(shù)據(jù)載體發(fā)送或讀出的信息被接收機(jī)處理,如圖9中流程圖所示。接收機(jī)接收(步驟700)圖像信息IM和重建信息rec-inf,重建信息是由特性信息和深度值組成。利用重建信息rec-inf,圖像信息中每個(gè)圖像的分段被重建,通過(guò)利用包含在重建信息中的深度值數(shù)據(jù)dd組成(步驟800)圖像的深度映像。然后可以使用深度映像顯示圖像信息,如作為步驟850用虛線所示。
對(duì)依據(jù)以上提到的步驟100,200,300編碼的信息編碼的方法包括接收數(shù)字圖像數(shù)據(jù),接收用于數(shù)字圖像各段的特性數(shù)據(jù)和深度值數(shù)據(jù)。如前所示,特性數(shù)據(jù)構(gòu)成尋找分段的基礎(chǔ)。示出兩個(gè)例子,第一例子包括邊線信息形式的特性數(shù)據(jù),第二例子包括籽晶信息形式的特性數(shù)據(jù)。依據(jù)以上提到的分段方法,利用邊線或籽晶,可以計(jì)算圖像的分段和相應(yīng)的項(xiàng)緩沖器。因此,通過(guò)將利用接收到的信息提供的深度信息與項(xiàng)緩沖器匹配可以建立深度映像。這樣得到深度映像,其中對(duì)每個(gè)像素提供一個(gè)深度值。從奇異點(diǎn),如邊線或籽晶,開(kāi)始組成段是一種相當(dāng)容易的操作,它并不需要大的計(jì)算資源。
依據(jù)本發(fā)明提供一種用于計(jì)算由像素組成的數(shù)字圖像深度映像的解碼器設(shè)備900,如圖13中所示。解碼器900包括一個(gè)輸入部分930,用于接收數(shù)字圖像數(shù)據(jù),用于所述的數(shù)字圖像的特性數(shù)據(jù),和用于所述的數(shù)字圖像中各段的深度值數(shù)據(jù),處理部分920,用于利用所述的特性數(shù)據(jù),通過(guò)將所述的數(shù)字圖像中每個(gè)像素分配一個(gè)段,把接收到的數(shù)字圖像分成段,和用于通過(guò)將接收到的各個(gè)像素所分配的段的深度值數(shù)據(jù)分配給每個(gè)像素建立深度映像,和一個(gè)輸出部分910,用于輸出所述的深度映像。最好對(duì)處理單元920提供用于實(shí)施上述編碼方法中步驟700,800,850的計(jì)算機(jī)程序。
圖10中示出一臺(tái)電視機(jī)950,有一個(gè)解碼器900,解碼器900的輸出部分被連到用于電視顯示955的顯示驅(qū)動(dòng)器單元960。圖11中示出一臺(tái)電視機(jī)980,有一個(gè)電視顯示器955和顯示驅(qū)動(dòng)器單元960。電視機(jī)被連到一個(gè)解碼器900,它被作為一個(gè)機(jī)頂盒實(shí)施,包含上述的重建信息的視頻信號(hào)可以直接送到電視機(jī)950,此后解碼器900處理此信息,所以驅(qū)動(dòng)器960可以在顯示器955上顯示圖像。相應(yīng)地,包含上述的重建信息的視頻信號(hào)可以送到圖11中所示的機(jī)頂盒,此后解碼器900處理此信息,并將它送到電視機(jī)980,以致驅(qū)動(dòng)器960可以在顯示器955上顯示圖像。
上述的依據(jù)本發(fā)明的解碼和編碼方法的步驟,可以由在計(jì)算機(jī)系統(tǒng)上執(zhí)行的程序代碼部分實(shí)施。因此本發(fā)明在計(jì)算機(jī)系統(tǒng)上實(shí)施編碼和/或解碼步驟時(shí)還涉及帶有代碼部分的計(jì)算機(jī)程序。這樣一種程序可用任何適當(dāng)?shù)姆绞酱鎯?chǔ),例如在存儲(chǔ)器中或信息載體上,如CD-ROM或軟盤(pán)980,如圖15中所示。
應(yīng)該指出,以上提到的實(shí)施方案用作說(shuō)明而不是限制本發(fā)明,本領(lǐng)域的技術(shù)人員將能夠設(shè)計(jì)許多替代的實(shí)施方案而不偏離所附的權(quán)利要求的范圍。在權(quán)利要求中,在括號(hào)之間放置的任何參考符號(hào)不應(yīng)該被解釋成對(duì)權(quán)利要求的限制。詞“包括”并不排斥存在權(quán)利要求中所列舉之外的其他部件或步驟。本發(fā)明可以藉助于包含幾個(gè)不同部件的硬件來(lái)實(shí)現(xiàn),也可藉助于被適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉幾個(gè)裝置的一種設(shè)備的權(quán)利要求中,這些裝置中的一些可以用一種并且是相同的硬件項(xiàng)來(lái)實(shí)施。在互不相同的從屬的權(quán)利要求中列舉的某些措施并不表示這些措施的組合不可能被有效地使用。
權(quán)利要求
1.用于計(jì)算由像素組成的數(shù)字圖像(IM,M)深度映像的方法,包括接收數(shù)字圖像數(shù)據(jù),其特征在于接收用于所述的數(shù)字圖像(IM,M)的特性數(shù)據(jù)(rec-inf),接收用于所述的數(shù)字圖像(IM,M)中各段的深度值數(shù)據(jù)(dd),根據(jù)所述的特性數(shù)據(jù)(rec-inf),通過(guò)將所述的數(shù)字圖像(IM,M)中每個(gè)像素分配到一個(gè)段,把所述的數(shù)字圖像(M,IM)分成段,從所述的接收到的深度值數(shù)據(jù)(dd)分配相應(yīng)的深度值數(shù)據(jù)給每段,和通過(guò)將與各個(gè)像素所分配的段對(duì)應(yīng)的深度值數(shù)據(jù)(dd)分配給每個(gè)像素構(gòu)成深度映像(dm)。
2.依據(jù)權(quán)利要求1的方法,還包括藉助于帶符號(hào)的距離變換將所述的數(shù)字圖像(IM,M)分段。
3.依據(jù)權(quán)利要求2的方法,其中藉助于帶符號(hào)的距離變換將所述的數(shù)字圖像(IM,M)分段還包括確定與所述的特性數(shù)據(jù)有關(guān)的籽晶。將找到的籽晶擴(kuò)展,用以填充一個(gè)項(xiàng)緩沖器(b),和通過(guò)將相應(yīng)的接收到的深度值數(shù)據(jù)(dd)歸屬到項(xiàng)緩沖器(b)構(gòu)成深度映像。
4.依據(jù)權(quán)利要求2的方法,基中藉助于帶符號(hào)的距離變換將所述的數(shù)字圖像(IM,M)分段還包括擴(kuò)展籽晶和包括在所述的特性數(shù)據(jù)中的籽晶數(shù),用以填充一個(gè)項(xiàng)緩沖器(b),和通過(guò)將相應(yīng)的接收到的深度值數(shù)據(jù)(dd)歸屬到項(xiàng)緩沖器(b)中的籽晶數(shù)構(gòu)成深度映像(dm)。
5.一種用于壓縮數(shù)字圖像信息的方法包括確定在由像素組成的數(shù)字圖像(IM,M)中的奇異性,其特征在于根據(jù)所述的被確定的奇異性,通過(guò)將所述的數(shù)字圖像(IM,M)中每個(gè)像素分配到一個(gè)段,將數(shù)字圖像(IM,M)分段,確定所述的圖像(IM,M)中每段的深度值數(shù)據(jù)(dd),確定用于所述的數(shù)字圖像(IM,M)的特性數(shù)據(jù),和組成用于所述的數(shù)字圖像(IM,M)的深度重建信息(rec-inf),包括所述的特性數(shù)據(jù)和深度值數(shù)據(jù)(dd)。
6.依據(jù)權(quán)利要求5的方法,還包括藉助于帶符號(hào)的距離變換將所述的數(shù)字圖像(IM,M)分段。
7.依據(jù)權(quán)利要求6的方法,其中藉助于帶符號(hào)的距離變換將所述的數(shù)字圖像(IM,M)分段還包括尋找與所述的特性數(shù)據(jù)有關(guān)的籽晶,擴(kuò)展找到的籽晶用以填充一個(gè)項(xiàng)緩沖器(b),和通過(guò)將相應(yīng)的深度值數(shù)據(jù)歸屬到項(xiàng)緩沖器(b),構(gòu)成深度映像(dm)。
8.依據(jù)權(quán)利要求5-7中任一項(xiàng)的方法,還包括確定邊線作為所述的數(shù)字圖像中的特性,確定邊線位置作為特性數(shù)據(jù)包括-一個(gè)網(wǎng)格點(diǎn),-一個(gè)與所述的網(wǎng)格點(diǎn)有關(guān)的上/下指示器,和-一個(gè)與所述的網(wǎng)格點(diǎn)有關(guān)的左/或指示器。
9.依據(jù)權(quán)利要求8的方法,其中一種布爾(Boolean)參數(shù)被用于各自的上/下指示器和左/右指示器。
10.依據(jù)權(quán)利要求7的方法,還包括確定籽晶點(diǎn)作為所述的數(shù)字圖像中的特性,確定籽晶作為特性數(shù)據(jù)包括-籽晶像素坐標(biāo),-有關(guān)的籽晶數(shù),-與所述的籽晶數(shù)有關(guān)的深度值數(shù)據(jù)。
11.依據(jù)權(quán)利要求5的方法,還包括發(fā)送所述的數(shù)字圖像和所述的深度重建信息(rec-inf)到接收機(jī)。
12.依據(jù)權(quán)利要求5的方法,還包括將所述的數(shù)字圖像(IM,M)和所述的深度重建信息(rec-inf)存儲(chǔ)在數(shù)據(jù)載體(980)上。
13.一種用于對(duì)由像素組成的數(shù)字圖像(IM,M)計(jì)算深度映像(dm)的解碼器設(shè)備,包括一個(gè)輸入部分(610),用于接收數(shù)字圖像數(shù)據(jù),所述的數(shù)字圖像(IM,M)的特性數(shù)據(jù),和所述的數(shù)字圖像(IM,M)中各段的深度值數(shù)據(jù)(dd),處理部分(620),用于利用所述的特性數(shù)據(jù),通過(guò)將所述的數(shù)字圖像(IM,M)中每個(gè)像素分配到一個(gè)段,將接收到的數(shù)字圖像(IM,M)分段,和用于將與各個(gè)像素所分配的段對(duì)應(yīng)的接收到的深度值數(shù)據(jù)(dd)分配到每個(gè)像素構(gòu)成深度映像(dm),和一個(gè)輸出部分(630),用于輸出所述的深度映像(dm)。
14.用于對(duì)數(shù)字圖像信息進(jìn)行壓縮的編碼器設(shè)備包括一個(gè)輸入部分(610),用于接收由像素組成的數(shù)字圖像(IM,M),一個(gè)處理單元(620),用于根據(jù)在所述的數(shù)字圖像(IM,M)中的特性,通過(guò)將所述的數(shù)字圖像(IM,M)中每個(gè)像素分配到一個(gè)段將數(shù)字圖像(IM,M)分段,和用于對(duì)所述的圖像(IM,M)中每段確定深度值數(shù)據(jù)(dd),和一個(gè)輸出裝置(630),用于輸出所述的數(shù)字圖像(IM,M)的深度重建信息(rec-inf),包括所述的特性數(shù)據(jù)和深度值數(shù)據(jù)(dd)。
15.一臺(tái)帶有顯示器(955),顯示驅(qū)動(dòng)器(960),和按照權(quán)利要求13的解碼器的電視機(jī)。
16.一種帶有依據(jù)權(quán)利要求14的編碼器(600),一個(gè)發(fā)送設(shè)備(965)的發(fā)射機(jī)。
17.一種代表數(shù)字圖像的數(shù)字信號(hào),包括用于所述的數(shù)字圖像(IM,M)的特性數(shù)據(jù),和用于所述的數(shù)字圖像(IM,M)中各段的深度值數(shù)據(jù)。
18.一種已存儲(chǔ)如權(quán)利要求17的信號(hào)的數(shù)據(jù)載體。
19.包括在計(jì)算機(jī)系統(tǒng)上實(shí)施權(quán)利要求1的步驟時(shí)執(zhí)行的代碼部分的計(jì)算機(jī)程序。
20.包括在計(jì)算機(jī)系統(tǒng)上實(shí)施權(quán)利要求5的步驟時(shí)執(zhí)行的代碼部分的計(jì)算機(jī)程序。
全文摘要
計(jì)算由像素組成的數(shù)字圖像(IM)深度映像的方法,具有以下步驟,接收數(shù)字圖像數(shù)據(jù)(700),接收數(shù)字圖像(IM)的特性數(shù)據(jù)(rec-inf),接收用于數(shù)字圖像(IM)各段的深度值數(shù)據(jù)(dd),根據(jù)特性數(shù)據(jù)(rec-inf)通過(guò)將數(shù)字圖像(IM)中每個(gè)像素分配到一個(gè)段將數(shù)字圖像(IM)分段,從接收到的深度值數(shù)據(jù)(dd)將相應(yīng)的深度值數(shù)據(jù)分配給每段。通過(guò)各個(gè)像素所分配的段相應(yīng)的深度值數(shù)據(jù)(dd)分配給每段構(gòu)成深度映像(800)。
文檔編號(hào)H04N7/26GK1463415SQ02801807
公開(kāi)日2003年12月24日 申請(qǐng)日期2002年5月21日 優(yōu)先權(quán)日2001年5月23日
發(fā)明者P·維林斯基, F·E·埃恩斯特 申請(qǐng)人:皇家菲利浦電子有限公司