顯示對象在三維場景中的顯示方法及設(shè)備的制作方法
【專利摘要】本發(fā)明涉及用于確定要連同三維(3D)場景一起顯示的顯示對象(303)的顯示位置(x,y,z)的方法(100),所述方法(100、300)包含:提供(101、305)包含在所述3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面(201)的顯示距離(znear);以及根據(jù)在所述3D場景中的所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(znear)來提供(103、307)所述顯示位置(x,y,z),其中包含所述顯示對象(303)的顯示距離(zbox)。
【專利說明】顯示對象在三維場景中的顯示方法及設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及3D多媒體領(lǐng)域,包括立體3D和多視角3D視頻及靜止圖像。確切地說,本發(fā)明涉及用于在3D座標(biāo)系中操控定時(shí)文字和定時(shí)圖形的平面位置的信令信息。
【背景技術(shù)】
[0002]目前,可用的媒體文件格式標(biāo)準(zhǔn)包括ISO基媒體文件格式(IS0/IEC14496-12)、MPEG-4文件格式(IS0/IEC14496-14,也被稱為MP4格式)、AVC文件格式(ISO/IEC14496-15)、3GPP文件格式(3GPP TS26.244,也被稱為3GP格式),以及DVB文件格式。其中,ISO文件格式是基礎(chǔ),其可衍生出所有上述文件格式(ISO文件格式本身除外)。因此,這些文件格式(包括ISO文件格式本身)也被稱作ISO文件格式家族。
[0003]圖8圖示了根據(jù)ISO基媒體文件格式的簡化文件結(jié)構(gòu)800。ISO基媒體文件格式中的基本構(gòu)建模塊被稱為“框(box)”。每個(gè)框具有各自的標(biāo)題欄(header)和負(fù)荷。該標(biāo)題欄指示所屬框的類型,并以字節(jié)數(shù)來指示所屬框的大小。單個(gè)框也可在其內(nèi)包含其他框,并且,在ISO文件格式中,規(guī)定了在某種類型的單個(gè)框內(nèi)所允許出現(xiàn)的框類型。另外,規(guī)定每個(gè)文件必須擁有某些類型的框,而其他類型的框則是任選的。而且,對于一些框類型,允許在單個(gè)文件中出現(xiàn)一個(gè)以上的此類框。由此可知,ISO基媒體文件格式規(guī)定了框的層次結(jié)構(gòu)。
[0004]根據(jù)ISO文件格式家族,文件800由分別包含在獨(dú)立的框,即媒體數(shù)據(jù)(mdat)框801和電影(moov)框803中的媒體數(shù)據(jù)和元數(shù)據(jù)組成。若想使文件800具有可操作性,則必須使其具有這兩種框801、803。電影框803可含有一個(gè)或多個(gè)軌跡805、807,并且每個(gè)軌跡駐留在一個(gè)單個(gè)軌跡框中。所謂軌跡可為以下類型之一:媒體、提示、時(shí)間元數(shù)據(jù)。媒體軌跡指代根據(jù)某一媒體壓縮格式,或根據(jù)ISO基媒體文件格式對該媒體壓縮格式的封裝而格式化的樣本。提示軌跡指代提示樣本,該等提示樣本含有作業(yè)程序書指令,用于構(gòu)建可通過所指示的通信協(xié)議進(jìn)行傳輸?shù)臄?shù)據(jù)包。這些作業(yè)程序書指令可含有構(gòu)建包頭部的指導(dǎo),還包括構(gòu)建數(shù)據(jù)包負(fù)荷的指導(dǎo)。在數(shù)據(jù)包負(fù)荷構(gòu)建中,可能引用駐留在其他軌跡或項(xiàng)目中的數(shù)據(jù),即,在數(shù)據(jù)包構(gòu)建過程期間通過索引來指示需要將特定軌跡或項(xiàng)目中的哪些數(shù)據(jù)復(fù)制到正在構(gòu)建的數(shù)據(jù)包。定時(shí)元數(shù)據(jù)軌跡指代用來描述所涉及的媒體及/或提示樣本的樣本。通常,會選擇一個(gè)媒體軌跡(例如,視頻軌跡805或音頻軌跡807)來展示一種媒體類型。軌跡的樣本與樣本標(biāo)號暗中關(guān)聯(lián),每個(gè)樣本標(biāo)號會按照所指示的樣本解碼次序而比前一個(gè)樣本標(biāo)號遞增I。
[0005]注意到,對于在單個(gè)文件800中包含展示,ISO基媒體文件格式并不加以限制,而且此類展示可包含在多個(gè)文件中。單個(gè)文件800還包含用于整體展示的元數(shù)據(jù)803。該文件800也可包含全部媒體數(shù)據(jù)801,而媒體數(shù)據(jù)801自身即為展示。對于其他文件而言(如果使用的話),并不需要將其格式化為ISO基媒體文件格式,也不需要使用其來包含媒體數(shù)據(jù),這些其他文件還可含有尚未使用的媒體數(shù)據(jù)或其他信息。ISO基媒體文件格式僅關(guān)注展示文件的結(jié)構(gòu)。媒體數(shù)據(jù)文件的格式僅受ISO基媒體文件格式或其衍生格式的約束,這是因?yàn)槊襟w文件中的媒體數(shù)據(jù)的格式化須遵守ISO基媒體文件格式或其衍生格式的規(guī)定。
[0006]3GPP SA4(第三代移動通信標(biāo)準(zhǔn)化伙伴項(xiàng)目規(guī)范制定工作組,服務(wù)及系統(tǒng)方面:編解碼器)已致力于對3GPP服務(wù)的定時(shí)文字及定時(shí)圖形進(jìn)行研發(fā),研發(fā)成果包括定時(shí)文字的技術(shù)規(guī)格TS26.245以及定時(shí)圖形的技術(shù)規(guī)格TS26.430。圖9圖示了在二維(2D)座標(biāo)系中由3GPP定時(shí)文字定義的文字呈現(xiàn)位置及組成的實(shí)例圖示。定時(shí)文字及定時(shí)圖形這兩種格式允許實(shí)現(xiàn)在多媒體場景中文字903及圖形相對于視頻元件905的布置,視頻元件905顯示在顯示區(qū)域907中。3GPP定時(shí)文字及定時(shí)圖形構(gòu)建于所顯示的視頻905的頂部,并且與視頻905的左上角911相關(guān)聯(lián)。區(qū)域903的界定是通過提供左上角911的座標(biāo)(tx,ty)913以及該區(qū)域903的寬度/高度915、917來實(shí)現(xiàn)。除非被文字樣本中的“tbox”覆蓋,在其他情況下默認(rèn)地將文字框901設(shè)置在區(qū)域903中。然后將框值定義為相對于區(qū)域903的頂部位置和左側(cè)位置的相對值919、921。
[0007]可使用超文本傳輸協(xié)議(HTTP,RFC2616)將定時(shí)文字及定時(shí)圖形作為文件格式的一部分來下載,或者可通過實(shí)時(shí)傳輸協(xié)議(RTP,RFC3550)來對定時(shí)文字及定時(shí)圖形進(jìn)行流式傳輸。
[0008]在技術(shù)規(guī)范3GPP TS26.245中規(guī)定了用于存儲定時(shí)文字的3GP文件擴(kuò)展名,在標(biāo)準(zhǔn)RFC4396中規(guī)定了 RTP負(fù)荷格式。
[0009]可以下列兩種方式中的一者來實(shí)現(xiàn)定時(shí)圖形:基于可縮放矢量圖形(SVG)的定時(shí)圖形,和簡單定時(shí)圖形模式。在基于SVG的定時(shí)圖形中,布局及定時(shí)由SVG場景來控制。為了傳輸及存儲,定時(shí)圖形再次使用了動態(tài)交互式多媒體場景(DIMS,3GPP TS26.142)、RTP負(fù)荷格式及3GP文件格式擴(kuò)展名。這些定時(shí)圖形還再次使用了會話描述協(xié)議(SDP)語法以及針對DIMS定義的媒體類型參數(shù)。在簡單定時(shí)圖形模式中,定義了二值表示格式,以便實(shí)現(xiàn)圖形元件的簡單嵌入。定時(shí)圖形是通過使用定時(shí)文字RTP負(fù)荷格式(RFC4396)及在3GPPTS26.430中規(guī)定的3GP文件格式擴(kuò)展名來以簡單形式傳輸?shù)摹?br>
[0010]深度感知是指感知三維(3D)世界及對象的距離的視覺能力。立體3D視頻指代一種技術(shù),該技術(shù)通過將兩個(gè)偏移的場景圖像分別獨(dú)立地呈現(xiàn)給觀看者的左眼和右眼,來建立對于場景深度的錯(cuò)覺。立體3D視頻通過用兩臺獨(dú)立的相機(jī)對場景進(jìn)行拍攝來傳達(dá)場景的3D感知效果,這樣就造成了場景中的對象被投影到左圖像及右圖像中的不同位置。
[0011]通過用兩臺以上的獨(dú)立相機(jī)對場景進(jìn)行拍攝,就建立了多視角3D視頻。由于所拍攝的左右圖像的所選角度不同,可呈現(xiàn)出不同的場景透視角度(視角)。多視角3D視頻允許觀看者以交互的方式來對觀看角度進(jìn)行控制??蓪⒍嘁暯?D視頻看做從不同的透視角度來表示同一場景的數(shù)個(gè)立體3D視頻的多重效果。
[0012]將對象或像素從左視角到右視角的位移稱為像差(disparity)。該像差與所呈現(xiàn)的視頻場景的感知深度成反比例。
[0013]可以按幀兼容方式來編碼立體3D視頻。在編碼器側(cè),將立體左右圖像空間封裝成單個(gè)幀,并對這些單個(gè)幀進(jìn)行編碼。由解碼器生成的輸出幀將含有立體左右圖像的構(gòu)成幀。在通常的操作模式中,各個(gè)視角的原始幀與封裝后的單個(gè)幀具有相同的空間分辨率。在這種情況中,編碼器于封裝操作之前對兩個(gè)視角的立體視頻進(jìn)行降采樣??臻g封裝可以使用并排格式、層層疊放格式、交織格式或棋盤格式。在編碼器側(cè)通過恰當(dāng)?shù)男帕钚畔碇甘舅褂玫膸庋b格式。例如,在H.264/AVC視頻編碼的情況中,利用作為立體3D視頻位元流的一部分的補(bǔ)充強(qiáng)化信息(SEI)消息來發(fā)出關(guān)于巾貞封裝的信號。在解碼器側(cè)以常規(guī)方式對幀進(jìn)行解碼,從解碼器的輸出幀中對該兩個(gè)構(gòu)成幀進(jìn)行解封裝,進(jìn)行升采樣以逆轉(zhuǎn)編碼器側(cè)的降采樣過程,并最終在3D顯示器上顯示該等構(gòu)成幀。在大多數(shù)商用部署中,僅應(yīng)用了并排的幀封裝排列或?qū)訉盈B放的幀封裝排列。
[0014]可通過使用多視角視頻編碼技術(shù)來編碼多視角3D視頻,此類編碼技術(shù)的一個(gè)實(shí)例是H.264/MVC,其被作為對H.264/AVC標(biāo)準(zhǔn)的擴(kuò)展而標(biāo)準(zhǔn)化。多視角視頻含有大量的視角間統(tǒng)計(jì)相關(guān)性,這是因?yàn)楦鱾€(gè)相機(jī)是從不同的觀看角度來拍攝同一場景的。對于某一相機(jī)的幀而言,既可通過時(shí)間相關(guān)幀來進(jìn)行預(yù)測,也可通過鄰近相機(jī)的幀來進(jìn)行預(yù)測。多視角視頻編碼應(yīng)用了組合的時(shí)間預(yù)測及視角間預(yù)測,而此正是高效編碼的關(guān)鍵。
[0015]也可將立體3D視頻看做僅有一個(gè)3D視角的多視角3D視頻。因此,立體3D視頻也能使用多視角編碼技術(shù)來進(jìn)行編碼。
[0016]隨著在3GPP中引入對于立體3D視頻的支持,定時(shí)文字和定時(shí)圖形的布置顯得更有挑戰(zhàn)性。根據(jù)目前的3GPP規(guī)范,定時(shí)文字框或定時(shí)圖形框?qū)⒈徊贾迷诹Ⅲw3D視頻的兩個(gè)視角上的相同位置中。此意味著像差為零,因而觀看對象將被布置在屏幕上。然而,簡單地將文字元件或圖形元件疊放在立體3D視頻上并不能產(chǎn)生令人滿意的結(jié)果,這是因?yàn)橛锌赡芤騻鬟_(dá)相互矛盾的深度暗示而使觀看者感到混淆。例如,被布置在圖像平面上的定時(shí)文字框(即,像差為O)會由于負(fù)的像差將場景中的觀看對象不良地渲染,而對于觀看者而言,觀看對象本應(yīng)顯現(xiàn)在屏幕前方,結(jié)果破壞了立體3D視頻場景的組成。
[0017]藍(lán)光技術(shù)能提供深度控制技術(shù),為避免在立體3D視頻、定時(shí)文字與定時(shí)圖形之間的干擾而引入藍(lán)光技術(shù)。在藍(lán)光技術(shù)規(guī)范中定義了針對立體3D視頻中的各種定時(shí)文字及定時(shí)圖形格式的兩種展示類型。它們分別是a)單一平面加偏移展示類型以及b)立體展示類型。
[0018]圖1Oa圖示了由藍(lán)光技術(shù)定義的單一平面加偏移展示類型的平面疊放模型的實(shí)例圖示,其中3D顯示表面1001構(gòu)成該單一平面,而3D副標(biāo)題框1003a及3D選單框1005a為平面框(flat box),并且其相對于3D顯示器1001的位置1007與1009由所謂“偏移值”
來界定,此偏移值與像差相關(guān)。
[0019]在由藍(lán)光技術(shù)界定的單一平面加偏移展示類型中,用戶可看到距屏幕1001距離為1007和1009的平面對象1003a、1005a,距離1007和1009可由作為信號發(fā)出的偏移值來界定。在期望文字框1003a中的文字出現(xiàn)在屏幕1001與用戶之間的情況中,被偏移值向右移位的文字框疊放在立體3D視頻的左視角上,并且被偏移值向左移位的文字框疊放在立體3D視頻的右視角上。偏移元數(shù)據(jù)是在H.264/MVC附屬(即第二)視角視頻流的每個(gè)畫面群組(GOP)的第一個(gè)畫面的補(bǔ)充強(qiáng)化信息(SEI)中被傳輸。偏移元數(shù)據(jù)包括多個(gè)偏移序列,并且每種圖形類型通過偏移序列id而與該等偏移序列中的一者建立關(guān)聯(lián)。
[0020]在由藍(lán)光技術(shù)定義的立體表示類型中,定時(shí)圖形含有兩個(gè)預(yù)先定義的獨(dú)立框,該兩個(gè)預(yù)先定義的獨(dú)立框?qū)?yīng)于立體3D視頻的兩個(gè)視角。其中一個(gè)獨(dú)立框被疊放在立體3D視頻的左視角上,而另一個(gè)獨(dú)立框被疊放在立體3D視頻的右視角上。結(jié)果,用戶可以看到定位在所呈現(xiàn)的場景中定位的3D對象。另外,圖形框的距離由作為信號發(fā)出的偏移值來界定。
[0021]在藍(lán)光技術(shù)解決方案中,文字框或圖形框的位置由作為信號發(fā)出的偏移值來界定,而不管所使用的展示類型如何。圖1Ob圖示了由藍(lán)光技術(shù)界定的立體展示類型的平面疊放模型的實(shí)例圖示,其中3D視頻屏幕1001構(gòu)成該單一平面,而3D副標(biāo)題框1003b及3D選單框1005b為3D框,并且其相對于3D視頻屏幕1001的位置1007和1009由作為信號發(fā)出的偏移值來界定。
【發(fā)明內(nèi)容】
[0022]本發(fā)明及其實(shí)施方案的目的旨在提供一種用于在三維(3D)場景中提供顯示對象(例如定時(shí)文字或定時(shí)圖形)的顯示位置的較靈活的概念方法。
[0023]本發(fā)明及其實(shí)施方案的進(jìn)一步目的旨在提供一種用于提供顯示對象(例如,定時(shí)文字或定時(shí)圖形)的顯示位置的概念方法,該方法完全不依賴或至少較少依賴于顯示3D場景的目標(biāo)器件的顯示器特性(屏幕大小、分辨率等),并且/或者完全不依賴或至少較少依賴于觀看條件,例如觀看距離(即在觀看者與顯示屏幕之間的距離)。
[0024]本發(fā)明及其實(shí)施方案的進(jìn)一步目的還包括提供一種通過將深度納入考量來恰當(dāng)?shù)夭贾蔑@示對象,例如定時(shí)文字框或定時(shí)圖形框的概念方法。
[0025]上述所有目的或其中之一將通過獨(dú)立權(quán)利要求中的特征來達(dá)成。進(jìn)一步實(shí)施形態(tài)可從從屬權(quán)利要求、說明書和附圖中清楚地了解。
[0026]本發(fā)明基于以下發(fā)現(xiàn):通過基于Z值,即相距顯示表面的距離來提供定時(shí)文字或定時(shí)圖形框的位置,可基于硬件特性及用戶觀看距離來計(jì)算準(zhǔn)確的像差,進(jìn)而擺脫對于目標(biāo)器件及觀看條件的依賴。
[0027]也可使用允許無需像差計(jì)算來基于Z值建立立體3D視頻的第二視角或多視角3D視頻的任何視角的技術(shù)。因而,定時(shí)文字及定時(shí)圖形框具有相距顯示表面的固定位置,而與硬件特性及觀看條件無關(guān)。
[0028]該3D視頻概念方法還通過將不同的位置信息,即所謂Z值指派給該等框的不同區(qū)域來在定時(shí)文字框及定時(shí)圖形框的定位過程中提供更多自由。因而,定時(shí)文字框及定時(shí)圖形框并不限于平行地定位在顯示表面上。
[0029]由于使用了位置信息,可將定時(shí)文字框及定時(shí)圖形框通過變換操作映射到兩個(gè)以上的視角中。因而,可將此處所述的概念方法應(yīng)用到具有兩個(gè)以上視角的3D場景(例如,多視角3D視頻),因此該概念方法并不限于僅有兩個(gè)視角的3D場景,例如,立體3D視頻。
[0030]可使用信令來維持顯示對象(例如,定時(shí)文字及定時(shí)圖形平面)的預(yù)定義深度,而不管顯示硬件的特性及觀看條件如何。
[0031]為了詳細(xì)描述本發(fā)明,將使用以下術(shù)語、縮寫和符號:
[0032]2D: 二維。
[0033]3D:三維。
[0034]AVC:高級視頻編碼,其定義了 AVC文件格式。
[0035]MPEG-4:運(yùn)動圖像專家組標(biāo)準(zhǔn)4,其定義了一種用于對音頻及視覺(AV)數(shù)字?jǐn)?shù)據(jù)進(jìn)行壓縮的方法,也被稱作MP4格式。
[0036]3GPP:第三代移動通信標(biāo)準(zhǔn)化伙伴項(xiàng)目,其定義了 3GPP文件格式,也被稱作3GP文件格式。
[0037]DVB:數(shù)字視頻廣播,其定義了 DVB文件格式。[0038]ISO:國際標(biāo)準(zhǔn)化組織。該ISO文件格式規(guī)定了一種框?qū)哟谓Y(jié)構(gòu)。
[0039]mdat:媒體數(shù)據(jù),其描述視頻或音頻文件的一個(gè)或多個(gè)軌跡。
[0040]moov:電影,視頻或音頻文件的視頻及/或音頻中貞。
[0041]定時(shí)文字:其指代與音頻及視頻等的其他媒體同步的文字媒體的展示。定時(shí)文字的典型應(yīng)用包括外語電影的實(shí)時(shí)字幕、用于幫助聽力有障礙的人群的文字說明、滾動新聞或用于電視演說的讀詞提示機(jī)。在MPEG-4第17部分一定時(shí)文字中規(guī)定了對于MPEG-4電影及手機(jī)媒體的定時(shí)文字,并且RFC3839及3GPP26.245規(guī)定了該定時(shí)文字的MME類型(即互聯(lián)網(wǎng)媒體類型)。
[0042]定時(shí)圖形:其指代與音頻及視頻等的其他媒體同步的圖形媒體的展示。定時(shí)圖形由 3GPP TS26.430 規(guī)定。
[0043]HTTP:超文本傳輸協(xié)議,由RFC2616定義。
[0044]RTP:實(shí)時(shí)傳輸協(xié)議,由RFC3550定義。
[0045]SVG:可縮放矢量圖形,一種用于實(shí)現(xiàn)定時(shí)圖形的方法。
[0046]DIMS:動態(tài)交互式多媒體場景,由3GPP TS26.142定義,為一種用來傳輸及存儲定時(shí)圖形的協(xié)議。
[0047]SDP:會話描述協(xié)議,由RFC4566定義,為一種被定時(shí)圖形使用的格式,用來描述流媒體的初始化參數(shù)。
[0048]SE1:補(bǔ)充強(qiáng)化信息,為一種用來發(fā)出關(guān)于巾貞封裝的信號的協(xié)議。
[0049]GOP:畫面群組,視頻流的多個(gè)畫面。
[0050]術(shù)語“可顯示(的)對象”用來指代已包含在三維場景中的二維(2D)或三維(3D)對象,以區(qū)別于在該3D場景中被添加或被一起顯示的額外“顯示對象”。術(shù)語“可顯示(的)”還指示,已存在的可顯示對象中的一者或多者在與“顯示對象” 一起顯示時(shí)可部分地或全部地被該顯示對象覆蓋。
[0051]根據(jù)第一方面,本發(fā)明涉及一種用于確定要在三維(3D)場景中顯示或連同3D場景一起顯示的顯示對象的顯示位置的方法,該方法包含:提供包含在3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面的顯示距離;以及根據(jù)在該3D場景中的所述一個(gè)或多個(gè)可顯示對象的顯示距離來提供包含該顯示對象的顯示距離的顯示位置。
[0052]在根據(jù)第一方面的方法的第一可能實(shí)施形態(tài)中,該顯示對象為圖形對象,確切地說為至少一個(gè)定時(shí)圖形框或一個(gè)定時(shí)文字框。
[0053]在根據(jù)第一方面的方法的第二可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的第一實(shí)施形態(tài)的方法的第二可能實(shí)施形態(tài)中,顯示平面為由顯示3D場景的器件的顯示表面所確定的平面。
[0054]在根據(jù)第一方面的方法的第三可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第三可能實(shí)施形態(tài)中,提供所述一個(gè)或多個(gè)可顯示對象的顯示距離的步驟包含確定深度圖并根據(jù)該深度圖來計(jì)算顯示距離(znear)。
[0055]在根據(jù)第一方面的方法的第四可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第四可能實(shí)施形態(tài)中,提供顯示位置的步驟包含:提供顯示對象的顯示距離,以使得所感知的顯示對象在連同3D場景一起顯示時(shí),較之于3D場景中的任何其他可顯示對象,能同等地接近或更接近觀看者。[0056]在根據(jù)第一方面的方法的第五可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第五可能實(shí)施形態(tài)中,提供顯示對象的顯示位置的步驟包含:將該顯示對象的顯示位置的顯示距離確定為,較之于在3D場景中的多個(gè)可顯示對象中距離觀看者的可顯示對象的顯示距離,與之相等或比其更大。
[0057]將該顯示對象的顯示位置的顯示距離確定為某個(gè)差值,確切地說,是百分比差,該差值是指在3D場景中的多個(gè)可顯示對象中距離觀看者最遠(yuǎn)的可顯示對象的顯示距離與在該3D場景中的該等可顯示對象中距離觀看者最近的可顯示對象的顯示距離之間的差值;或
[0058]將該顯示對象的顯示位置的顯示距離確定為該顯示對象的至少一個(gè)邊角顯示位置,該邊角顯示位置大于或等于某個(gè)顯示距離,確切地說,大于或等于在3D場景中的多個(gè)可顯示對象中距離觀看者最近的可顯示對象的顯示距離。
[0059]在根據(jù)第一方面的方法的第六可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第六可能實(shí)施形態(tài)中,提供顯示位置的步驟包含:提供該顯示對象的顯示距離,以使得該顯示對象的顯示距離(Zbox)等于或大于定位在顯示平面中與該顯示對象相同側(cè)上的任何其他可顯示對象的顯示距離。
[0060]在根據(jù)第一方面的方法的第七可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第七可能實(shí)施形態(tài)中,該方法包含將該顯示對象的顯示位置連同該顯示對象通過通信網(wǎng)絡(luò)一起傳輸。
[0061]在根據(jù)第一方面的方法的第八可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第八可能實(shí)施形態(tài)中,該方法包含將該顯示對象的顯示位置連同該顯示對象一起存儲。
[0062]在根據(jù)第一方面的方法的第九可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的第九可能實(shí)施形態(tài)中,針對某個(gè)3D場景來確定該顯示對象的顯示位置,并且針對另一個(gè)3D場景來確定該顯示對象的另一個(gè)顯示位置。
[0063]在根據(jù)第一方面的方法的第十可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的第十可能實(shí)施形態(tài)中,該3D場景為3D靜止圖像,可顯示對象為圖像對象,顯示對象為圖形框或文字框。
[0064]在根據(jù)第一方面的方法的第十一可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的第一至第九實(shí)施形態(tài)中任一者的第十一可能實(shí)施形態(tài)中,3D場景為3D視頻圖像,可顯示對象為視頻對象,顯示對象為定時(shí)圖形框或定時(shí)文字框,其中該3D視頻圖像為包含在3D視頻序列中的多個(gè)3D視頻圖像中之一者。
[0065]在根據(jù)第一方面的方法的第十二可能實(shí)施形態(tài)中,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法的第十二可能實(shí)施形態(tài)中,顯示對象及/或可顯示對象為2D或3D對象。
[0066]根據(jù)第二方面,本發(fā)明涉及一種用于在三維(3D)場景中顯示顯示對象或連同3D場景一起顯示顯示對象的方法,該3D場景包含一個(gè)或多個(gè)可顯示對象,該方法包含:接收該3D場景;接收該顯示對象的顯示位置,該顯示位置包含該顯示對象相對于顯示平面的顯示距離(zbox);以及在顯示該3D場景時(shí)在所接收的顯示位置處顯示該顯示對象。
[0067]根據(jù)第三方面,本發(fā)明涉及一種用于確定要在三維(3D)場景中顯示或連同該3D場景一起顯示的顯示對象的顯示位置的設(shè)備,該設(shè)備包含處理器,該處理器用于提供包含在該3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面的顯示距離;以及
[0068]根據(jù)在該3D場景中的所述一個(gè)或多個(gè)可顯示對象的顯示距離來提供包含該顯示對象的顯示距離的該顯示位置。
[0069]在根據(jù)第三方面的設(shè)備的第一可能實(shí)施形態(tài)中,該處理器包含:第一提供器,用于提供一個(gè)或多個(gè)可顯示對象相對于該顯示平面的顯示距離;以及第二提供器,用于根據(jù)在該3D場景中的所述一個(gè)或多個(gè)可顯示對象的顯示距離來提供該顯示對象的顯示位置。
[0070]根據(jù)第四方面,本發(fā)明涉及一種用于在三維(3D)場景中顯示顯示對象或連同該3D場景一起顯示該顯示對象的設(shè)備,該3D場景包含一個(gè)或多個(gè)可顯示對象,該設(shè)備包含:接口,用于接收包含所述一個(gè)或多個(gè)可顯示對象的該3D場景,用于接收該顯示對象,并且用于接收該顯示對象的顯示位置,包含該顯示對象相對于顯示平面的顯示距離;以及顯示器,用于在顯示包含所述一個(gè)或多個(gè)可顯示對象的3D場景時(shí)在所接收的顯示位置處顯示該顯示對象。
[0071]根據(jù)第五方面,本發(fā)明涉及一種具有程序代碼計(jì)算機(jī)程序,所述程序代碼用于在計(jì)算機(jī)上執(zhí)行時(shí)執(zhí)行根據(jù)第一方面的方法,或者說根據(jù)第一方面的前述實(shí)施形態(tài)中任一者的方法,或者說根據(jù)第二方面的方法。
[0072]本文描述的方法可實(shí)施為數(shù)字信號處理器(DSP)、微控制器或任何其他邊處理器中的軟件或?qū)嵤閷S眉呻娐?ASIC)內(nèi)的硬件電路。
[0073]本發(fā)明可在數(shù)字電子電路中或在計(jì)算機(jī)硬件、固件、軟件中或在其組合中實(shí)施。
【專利附圖】
【附圖說明】
[0074]本發(fā)明的其他實(shí)施例將圍繞以下附圖進(jìn)行描述,其中:
[0075]圖1圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中確定顯示對象的顯示位置的方法的不意圖;
[0076]圖2圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中確定顯示對象的顯示位置的平面疊放模型的示意圖;
[0077]圖3圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中確定顯示對象的顯示位置的方法的不意圖;
[0078]圖4圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中顯示顯示對象的方法的示意圖;
[0079]圖5圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中顯示顯示對象的方法的示意圖;
[0080]圖6圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中確定顯示對象的顯示位置的設(shè)備的方框圖;
[0081]圖7圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中顯示顯示對象的設(shè)備的方框圖;
[0082]圖8圖示根據(jù)ISO基媒體文件格式的ISO文件的簡化結(jié)構(gòu)的方框圖;
[0083]圖9圖示在2D座標(biāo)系中由3GPP定時(shí)文字定義的文字呈現(xiàn)位置及組成的示意圖;
[0084]圖1Oa圖示由藍(lán)光技術(shù)定義的單一平面加偏移展示類型的平面疊放模型的示意圖;以及
[0085]圖1Ob圖示由藍(lán)光技術(shù)定義的立體展示類型的平面疊放模型的另一個(gè)示意圖?!揪唧w實(shí)施方式】
[0086]在描述本發(fā)明實(shí)施例的細(xì)節(jié)之前,將圍繞現(xiàn)有技術(shù)來描述進(jìn)一步的發(fā)現(xiàn),以便更好地理解本發(fā)明。如之前提到,將觀看對象或像素從左視角到右視角的位移稱為像差(disparity)。該像差與所呈現(xiàn)的視頻場景中的感知深度成比例,其被作為信號發(fā)出并被用來建立3D印象。
[0087]但是,觀看者所感知到的深度還取決于顯示器特性(屏幕大小、像素密度)、觀看距離(在觀看者與顯示圖像的屏幕之間的距離)以及觀看者的先天條件(如觀看者的瞳孔間距離)。在觀看者所感知到的深度、像差與顯示器特性(即顯示器大小及顯示分辨率)之間的關(guān)系可如下計(jì)算:
[0088]DV/1/SD*d-1
(1)
[0089]其中D為所感知的3D深度,V為觀看距離,I為觀看者的瞳孔間距離,sD為屏幕的(水平維度中的)顯示像素間距,而d為像差。
[0090]從方程式(I)中可看出,在藍(lán)光技術(shù)解決方案中,最終所感知的深度(即3D對象相距3D顯示器1001的距離1007、1009)并不僅僅取決于偏移值(其等于像差值的一半),還和顯示器1001的特性(屏幕大小及分辨率)以及觀看距離有關(guān)。但是,在藍(lán)光技術(shù)解決方案中提供的偏移值必須在尚未完全知曉目標(biāo)器件和觀看條件的情況下提前設(shè)置。正因?yàn)榇耍兄疃入S不同器件而變化,這是因?yàn)槠湟蕾囉谟^看條件。另外,藍(lán)光技術(shù)解決方案限制了將文字框1003b或圖形框1005b定位為平行于屏幕1001的2D表面的定位過程的自由。結(jié)果,使得不可能將圖形或文字加入立體3D視頻中。最終,藍(lán)光技術(shù)解決方案受限于立體3D視頻,并且不能解決在多視角3D視頻中如何布置文字框或圖形框的問題。
[0091]圖1圖示根據(jù)某實(shí)施形態(tài)的用于確定在3D場景中的顯示對象的顯示位置的方法100的示意圖。方法100用于根據(jù)在3D場景中的一個(gè)或多個(gè)可顯示對象來確定要與該3D場景一起顯示的顯示對象的顯示位置x,y,z。方法100包含:提供(101)在3D場景中的所述一個(gè)或多個(gè)可顯示對象相對于顯示平面的顯示距離;以及根據(jù)在該3D場景中的所述一個(gè)或多個(gè)可顯示對象的顯示距離來提供(103)包含該顯示對象的顯示距離的顯示位置
X,y, z。
[0092]該顯示位置是指三維座標(biāo)系中的位置,其中X表示X軸上的位置,y表示I軸上的位置,而Z表示z軸上的位置。將圍繞圖2來解釋可能的座標(biāo)系。該顯示對象及該等可顯示對象是指要在器件的顯示表面上顯示的對象。該顯示器件可為,例如含對應(yīng)顯示器或屏幕的具有3D顯示能力的電視機(jī)或監(jiān)視器,或是3D移動終端,或是含對應(yīng)顯示器或屏幕的任何其他便攜式器件。
[0093]該顯示對象可為圖形對象。在靜止圖像的實(shí)施方案中,該3D場景可為3D靜止圖像,該等可顯示對象可為2D或3D圖像對象,該顯示對象可為2D或3D圖形框,或是2D或3D文字框。在視頻的實(shí)施方案中,該3D場景可為3D視頻圖像,該等可顯示對象可為2D或3D視頻對象,該顯示對象可為2D或3D定時(shí)圖形框,或是定時(shí)文字框。
[0094]定時(shí)文字指代與音頻及視頻等的其他媒體同步的文字媒體的展示。定時(shí)文字的典型應(yīng)用包括外語電影的實(shí)時(shí)字幕、用于幫助聽力有障礙的人群的文字說明、滾動新聞或用于電視演說的讀詞提示機(jī)。在MPEG-4第17部分一定時(shí)文字中規(guī)定了對于MPEG-4電影及手機(jī)媒體的定時(shí)文字,并且RFC3839及3GPP26.245規(guī)定了該定時(shí)文字的MME類型(即互聯(lián)網(wǎng)媒體類型)。
[0095]定時(shí)圖形指代與音頻及視頻等的其他媒體同步的圖形媒體的展示。定時(shí)圖形由3GPP TS26.430規(guī)定。該視頻對象為在電影中展示的觀看對象,例如人物,或是物件,諸如汽車、花朵、房屋、球或其他。該視頻對象處于移動狀態(tài)中,或是具有固定位置。該3D視頻序列包含多個(gè)視頻對象。該3D場景可包含一個(gè)或多個(gè)視頻對象、定時(shí)文字對象、定時(shí)圖形對象或該等對象的組合。
[0096]該顯示平面為顯示顯示對象的參考平面,例如,屏幕、監(jiān)視器、工業(yè)顯示屏或任何其他種類的顯示器。該顯示距離為該顯示對象相對于座標(biāo)系的z軸距該顯示平面的距離。由于顯示對象具有相距顯示平面的距離,所以能給觀看者帶來3D效果。在實(shí)施形態(tài)中,座標(biāo)系的原點(diǎn)位于顯不器表面的左上角。
[0097]圖2圖示根據(jù)某實(shí)施形態(tài)的用于在三維座標(biāo)系中確定顯示對象的顯示位置的平面疊放模型200的示意圖。
[0098]可顯示對象或該顯示對象的顯示位置是在三維座標(biāo)系中定義的,其中X表示X軸上的位置,y表示I軸上的位置,而z表示z軸上的位置,如圖2所示。該顯示平面是由X軸及I軸定義的,其構(gòu)成了用于定義可顯示對象或顯示對象在Z方向中的顯示距離的參考平面。該顯示平面可被界定為對應(yīng)于顯示3D場景的器件的物理顯示表面,或?qū)?yīng)于與顯示3D場景的器件的物理顯示表面平行的任何其他平面。
[0099]在圖2中所示的座標(biāo)系中,座標(biāo)系的原點(diǎn)處于顯示表面的左上角。X軸平行于顯示表面,其方向朝向顯示表面的右上角。y軸平行于顯示表面,其方向朝向顯示表面的左下角。Z軸垂直于顯示表面,其方向朝向觀看者,即正Z軸的方向,也就是說,Z值為零的可顯示對象或顯示對象定位在顯示平面上,Z值大于零的可顯示對象或顯示對象定位在或顯示在顯示平面前方,并且對于觀看者而言,Z值越大,則所感知到的可顯示對象或顯示對象越接近于觀看者。Z值小于零(即負(fù)Z值)的可顯示對象或顯示對象定位在或顯示在顯示平面后方,并且對于觀看者而言,Z值越小,所感知到的可顯示對象或顯示對象越遠(yuǎn)離于觀看者。
[0100]圖2中的平面疊放模型200在視頻平面201上疊放圖形平面205 (例如定時(shí)圖形框)及文字平面203 (例如定時(shí)文字框)。
[0101]在其中布置文字元件或圖形元件的定時(shí)文字框203或定時(shí)圖形框205被準(zhǔn)確地定位在3D場景中。
[0102]盡管圖2涉及含視頻平面的3D視頻實(shí)施方案,但是也可將相同的平面疊放模型200應(yīng)用到3D靜止圖像,參考數(shù)字201接下來仍指代圖像平面,但總體上也可指代任何種類的3D場景。參考數(shù)字201接下來將指代任何顯示平面。
[0103]圖2中示出的座標(biāo)系僅為其中一種可能的座標(biāo)系,也可以使用其他座標(biāo)系來實(shí)施本發(fā)明的實(shí)施例,確切地說,這些其他座標(biāo)系是指原點(diǎn)定義不同,并且正值方向不同的其他笛卡爾座標(biāo)系。
[0104]圖3圖示根據(jù)某實(shí)施形態(tài)的用于在三維場景中確定顯示對象的顯示位置的方法300的示意圖。圖3示例性地圖示了用于在3D視頻圖像或3D視頻場景中確定定時(shí)文字及/或定時(shí)圖形對象的顯示位置的方法300的示意圖。[0105]方法300用于確定在包含多個(gè)可顯示對象的3D場景301中要顯示的顯示對象303 (例如,定時(shí)文字對象或定時(shí)圖形對象)的顯示位置x,y,z。方法300包含:提供3D場景(例如3D視頻301),并提供定時(shí)文字及/或定時(shí)圖形對象303。方法300進(jìn)一步包含:確定(305)該3D場景(例如,3D視頻301)的深度信息,在針對定時(shí)文字及/或定時(shí)圖形的3D座標(biāo)系中設(shè)置(307)定時(shí)文字及/或定時(shí)圖形對象303的位置,并產(chǎn)生對應(yīng)的信令數(shù)據(jù)。方法300進(jìn)一步包含:存儲及/或傳輸(309) 3D場景外加定時(shí)文字及/或定時(shí)圖形的位置,連同定時(shí)文字及/或定時(shí)圖形自身。
[0106]盡管圖3涉及以3D視頻作為3D場景并以定時(shí)文字及/或定時(shí)圖形對象作為顯示對象的3D視頻實(shí)施方案,也可將相同的方法應(yīng)用到3D靜止圖像,參考數(shù)字301此時(shí)將指代3D靜止圖像,參考數(shù)字303此時(shí)將指代文字及/或圖形對象,步驟305將指代確定3D靜止圖像的深度信息,步驟307將指代在3D座標(biāo)系中設(shè)置文字及/或圖形對象303的位置,而步驟309將指代存儲及/或傳輸3D靜止圖像外加文字及/或圖形的位置,連同文字及/或圖形自身。
[0107]換言之,圖3描繪了特定的視頻實(shí)施方案,但是也可將相同的方法應(yīng)用到更廣泛的3D場景中,參考數(shù)字301此時(shí)將指代3D場景,參考數(shù)字303此時(shí)將指代顯示對象,步驟305將指代確定3D場景的深度信息,步驟307將指代在3D座標(biāo)系中設(shè)置顯示對象303的位置,步驟309將指代存儲及/或傳輸該3D場景外加顯示對象的位置,連同顯示對象自身。
[0108]確定(305) 3D場景(例如3D視頻301)的深度信息的步驟可對應(yīng)于圍繞圖1描述的提供(101) —個(gè)或多個(gè)可顯示對象相對于顯示平面的顯示距離的步驟。
[0109]在3D座標(biāo)系中針對定時(shí)文字及/或定時(shí)圖形設(shè)置位置(307)深度并產(chǎn)生信令數(shù)據(jù)的步驟可對應(yīng)于圍繞圖1描述的根據(jù)在3D場景中的所述一個(gè)或多個(gè)可顯示對象的顯示距離來提供(103)顯示對象的顯示位置x,y,z的步驟。
[0110]在第一實(shí)施形態(tài)中,根據(jù)步驟307作出的定時(shí)文字及定時(shí)圖形的3D布置如下。提取或估計(jì)Zn,其為最接近3D場景的觀看者的可顯示對象的顯示位置的顯示距離。Zbra是定時(shí)文字對象或定時(shí)圖形對象(或統(tǒng)稱為顯示對象)的顯示位置在z維度中的顯示距離,較之于3D場景(例如,3D視頻301)中的最接近觀看者的可顯示對象,將Zbra設(shè)置為比其更接近觀看者,即zb0x>Znear。Zbox及Znffitt為如圖2所示的座標(biāo)系的Z軸座標(biāo)。
[0111]在第一實(shí)施形態(tài)的實(shí)施例中,將如下確定ζη.:
[0112]首先找到在3D視頻的左視角及右視角中的相同特征,該過程被稱作對應(yīng)(correspondence)。此步驟的輸出為視差圖,其中該等視差為在左視角與右視角中的相同特征的圖像平面上的X座標(biāo)之間的差。X1-X-其中X1和&分別為該特征在左視角與右視角中的X座標(biāo)的位置。通過使用用于拍攝3D視頻的相機(jī)的幾何排列信息來將視差圖轉(zhuǎn)化成距離,即深度圖?;蛘?,若已知產(chǎn)生3D視頻的目標(biāo)屏幕大小及觀看距離,則可通過使用上述方程式⑴來計(jì)算深度圖。Zn_值提取自深度圖數(shù)據(jù)。Zn為如圖2所示座標(biāo)系的z軸座標(biāo),X1與&為X軸座標(biāo)。
[0113]在第一實(shí)施形態(tài)的實(shí)施例中,3D視頻的文件格式含有關(guān)于在空間中相鄰的視角之間的最大視差的信息。在IS0/IEC14496-15的信息技術(shù)——音頻及視覺對象的編碼——第15部分:“高級視頻編碼(AVC)文件格式”(2010年6月)中,對含有此類信息的框(“vwdi”)進(jìn)行了說明。使用作為信號發(fā)出的視差來提取在給定場景中的最大深度。[0114]在第二實(shí)施形態(tài)中,根據(jù)步驟307的定時(shí)文字對象或定時(shí)圖形對象(或統(tǒng)稱為顯示對象)的3D布置如下:提取或估計(jì)Znem,其為最接近3D場景(例如3D視頻301)的觀看者的可顯示對象的顯示位置的顯示距離。提取或估計(jì)Zfm,其為最遠(yuǎn)離3D場景(例如3D視頻301)的觀看者的可顯示對象的顯示位置的顯示距離。Zbra是定時(shí)文字對象或定時(shí)圖形對象(或統(tǒng)稱為顯示對象)的顯示位置在z維度中的顯示距離,其由Zperant來表示,Zperant為3D場景(例如,3D視頻301)的距離差Zfm-Znem的百分比。Znem、Zbox及Zfm為如圖2所示的座標(biāo)系的z軸座標(biāo)。
[0115]在第三實(shí)施形態(tài)中,根據(jù)步驟307的定時(shí)文字對象及定時(shí)圖形對象(或統(tǒng)稱為顯
(寸象)的 3D 布直如下:*Ρ 框的母丨角(Zeorner—top—left、Zeorner—top—right、Zeorner—bottom—left、Zeorner—bottomjight)指派獨(dú)立的Z值,其中對于每個(gè)邊角而言,ΖΜ?.>Ζη_,其中僅對給定邊角的區(qū)域
估計(jì) Znear0 ^corner_top_leftΛ ^corner_top_right Λ ^corner_bottom_left ^corner_bottom_right
為如圖2所示的座標(biāo)
系的z軸座標(biāo)。
[0116]在第三實(shí)施形態(tài)的實(shí)施例中,通過規(guī)定新的類3DRecord和新的文字類型框“3dtt”,將作為定時(shí)文字對象或顯示對象的實(shí)施方案的定時(shí)文字框的Zco而值按照3GPP文件格式作為信號發(fā)出,新的類3DReCOrd和新的文字類型框“3dtt”如下:
[0117]
【權(quán)利要求】
1.一種用于確定要連同三維(3D)場景一起顯示的顯示對象(303)的顯示位置(x, y, z)的方法(100、300),所述方法(100,300)包含: 提供(101、305)包含在所述3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面(201)的顯示距離(znear);以及 根據(jù)在所述3D場景中的所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(znear)來提供(103,307)所述顯示位置(x,y,z),其中包含所述顯示對象(303)的顯示距離(zbox)。
2.根據(jù)權(quán)利要求1所述的方法(100、300),其中所述顯示對象(303)為圖形對象,或者 其中所述3D場景為3D靜止圖像,所述可顯示對象為圖像對象,所述顯示對象(303)為圖形框或文字框,或者 其中所述3D場景為3D視頻圖像,所述可顯示對象為視頻對象,所述顯示對象為定時(shí)圖形框或定時(shí)文字框,并且 其中所述顯示對象及/或所述可顯示對象為2D或3D對象。
3.根據(jù)權(quán)利要求1或2所述的方法(100、300),其中所述顯示平面(201)為由用于顯示所述3D場景的器件的顯示表面所確定的平面。
4.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中提供(101、305)所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(znear)的步驟包含確定深度圖并通過所述深度圖計(jì)算所述顯示距離(znear)。
5.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中提供(103、307)所述顯示位置的步驟包含: 提供所述顯示對象(303)的所述顯示距離(zbox),以使得所感知的所述顯示對象在連同所述3D場景一起顯示時(shí),較之于所述3D場景中的任何其他可顯示對象,能同等地接近或更接近觀看者。
6.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中提供(103、307)所述顯示位置的步驟包含: 提供所述顯示對象(303)的所述顯示距離(zbox),以使得所述顯示對象的所述顯示距離(zbox)等于或大于定位在所述顯示平面中與所述顯示對象相同側(cè)上的任何其他可顯示對象的所述顯示距離。
7.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中提供(103、307)所述顯示對象(303)的所述顯示位置(X,y, z)的步驟包含: 將所述顯示對象的所述顯示位置的所述顯示距離(zbox)確定為等于或大于某個(gè)特定的可顯示對象的顯示距離(znear),所述特定的可顯示對象是指在所述3D場景中的所述多個(gè)可顯示對象中距離最接近觀看者的那一個(gè);或 將所述顯示對象的所述顯示位置(x,y,z)的所述顯示距離確定為差,確切地說是百分比差,所述差是指在所述3D場景中的所述多個(gè)可顯示對象中距離觀看者最遠(yuǎn)的可顯示對象(301)的顯示距離(z)與在所述3D場景中的所述可顯示對象中距離觀看者最近的另一個(gè)可顯示對象之間的差;或 將所述顯示對象的所述顯示位置(x,y,z)的所述顯示距離確定為所述顯示對象(303)的至少一個(gè)邊角顯示位置,所述邊角顯示位置大于或等于所述顯示距離(z),確切地說,大于或等于在所述3D場景中的所述多個(gè)可顯示對象中距離觀看者最近的所述可顯示對象(301)的所述顯示距離(z)。
8.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中所述方法包含確定所述顯示對象的所述顯示位置,以使得所述顯示對象顯示在包含在所述3D場景中的某個(gè)可顯示對象的前方, 其中提供(101、305)包含在所述3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面(201)的所述顯示距離(znear)的步驟包含: 提供(101、305)所述某個(gè)可顯示對象的所述顯示距離;并且 其中根據(jù)在所述3D場景中的所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(znear)來提供(103、307)包含所述顯示對象(303)的所述顯示距離(zbox)的所述顯示位置(x,y, z)的步驟包含: 根據(jù)所述某個(gè)可顯示對象的所述顯示距離(znear)來提供(103、307)所述顯示對象(303)的所述顯示距離(zbox)。
9.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其包含: 將所述顯示對象(303)的所述顯示位置(x,y,z)連同所述顯示對象(303) —起通過通信網(wǎng)絡(luò)傳輸,或?qū)⑺鲲@示對象(303)的所述顯示位置(x,y,z)連同所述顯示對象(303)一起存儲。
10.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的方法(100、300),其中針對某個(gè)3D場景來確定所述顯示對象(303)的所述顯示位置(x,y,z),并且其中針對另一個(gè)3D場景來確定所述顯示對象(303)的另一個(gè)顯示位置。
11.用于將顯示對象連同包含一個(gè)或多個(gè)可顯示對象的三維(3D)場景來一起顯示的方法(400、500),所述方法包含: 接收(401,501)所述3D場景(301); 接收(403、503)所述顯示對象(303)的顯示位置(x,y, z),包含所述顯示對象(303)相對于顯示平面的顯示距離(zbox);以及 在顯示(509)所述3D場景時(shí)在所述所接收的顯示位置(x,y,z)處顯示(405、507)所述顯示對象(303)。
12.一種用于確定要連同三維(3D)場景一起顯示的顯示對象(303)的顯示位置(x, y, z)的設(shè)備(600),所述設(shè)備(600)包含處理器(601),所述處理器(601)用于: 提供(603)包含在所述3D場景中的一個(gè)或多個(gè)可顯示對象相對于顯示平面(201)的顯示距離(znear);以及 根據(jù)在所述3D場景中的所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(znear)來提供(605)所述顯示位置(x,y,z),其中包含所述顯示對象(303)的顯示距離(zbox)。
13.根據(jù)權(quán)利要求12所述的設(shè)備(600),其中所述處理器(601)包含用于提供(603)—個(gè)或多個(gè)可顯示對象相對于所述顯示平面(201)的所述顯示距離(z)的第一提供器,以及用于根據(jù)在所述3D場景中的所述一個(gè)或多個(gè)可顯示對象的所述顯示距離(z)來提供(605)所述顯示對象(303)的所述顯示位置(x,y,z)的第二提供器。
14.一種用于將顯示對象(303)連同包含一個(gè)或多個(gè)可顯示對象的三維(3D)場景來一起顯示的設(shè)備(700),所述設(shè)備(700)包含: 接口(701),用于接收包含所述一個(gè)或多個(gè)可顯示對象的所述3D場景,用于接收所述顯示對象(303),并且用于接收所述顯示對象(303)的顯示位置(x,y,z),其中包含所述顯示對象(303)相對于顯示平面的顯示距離(zbox);及 顯示器(703),用于在顯示包含所述一個(gè)或多個(gè)可顯示對象的所述3D場景時(shí)在所接收的顯示位置U,y, z)處顯示所述顯示對象(303)。
15.一種具有程 序代碼的計(jì)算機(jī)程序,其中程序代碼用于在計(jì)算機(jī)上執(zhí)行時(shí)執(zhí)行根據(jù)權(quán)利要求1至10中任一項(xiàng)權(quán)利要求所述的方法(100、300)及/或根據(jù)權(quán)利要求11所述的方法(400、500)。
【文檔編號】H04N13/00GK103931177SQ201280053273
【公開日】2014年7月16日 申請日期:2012年4月10日 優(yōu)先權(quán)日:2012年4月10日
【發(fā)明者】愛默德·鮑阿齊齊, 基奧萬尼·科達(dá)拉, 盧卡斯·康德拉德 申請人:華為技術(shù)有限公司