圖像制作中與圖像制作相關的改進的制作方法
【技術領域】
[0001]本發(fā)明涉及制作與人類視覺系統(tǒng)感知場景的方式相對應的場景圖像。
【背景技術】
[0002]傳統(tǒng)圖像創(chuàng)作技術(比如使用靜止或運動相機或計算機動畫的技術)一般不足以捕獲和表示人類視覺體驗的完整范圍和性質。理由有很多,其中包括圖像通常基于線性透視的幾何結構,其將三維空間以對于人類觀看者來講不自然的方式投影到二維平面上。自達芬奇以來,藝術家們就已經知道當視場的外圍區(qū)域被投影到二維表面上時,線性透視會產生過度的失真。結果,傳統(tǒng)的線性透視圖像趨于呈現(xiàn)出世界的被剪切的受限視圖,所述視圖通常采用矩形的形式,并由此排除了完整視場的許多內容,其中包括外圍視場。這些被排除的內容包括觀看者的身體的部分或與觀看者接近的對象,這些內容在自然視覺中是可見的。所得到的圖像通常被呈現(xiàn)為平的對象,即,如打印在紙上或顯示在平的屏幕上一樣,這與圖像中的空間標記不相符并且由此減少對深度的感知。與真實生活相比,感興趣的對象在所創(chuàng)建的圖像中通常會看起來更小一些,這是因為線性透視中所使用的投影方法以及缺乏對感知對象尺寸的關注心理效果(其趨于放大感興趣的對象)的考慮所導致的。此外,這種創(chuàng)建的圖像一般不記錄或表示人類視覺的增強空間視覺體驗的其他特性,比如雙重視覺導致的雙目深度信息或“生理復視”。此外,傳統(tǒng)成像系統(tǒng)不能記錄人類視覺的其它特性,比如增強的邊緣對比度、視場的外圍和非注視部分中的對象的相對模糊性、感知空間的主觀曲率、在極度外圍處的視覺逐漸衰減和變暗、對象的明顯尺寸與注視點相比的改變、從第一視角看到的觀看者身體的圖像等。本發(fā)明將這些效果組合在一起,以產生對人類視覺的綜合仿真。
[0003]該概念作為表示整個人類視場的工具的一個好處是:由于場景的外圍區(qū)域與實際人類視覺相比在尺寸和強調方面變小,避免了過寬的圖像格式,比如由全景攝影所產生的格式。還避免了過度失真的圖像,比如由魚眼鏡頭(其經常會減小感興趣的對象的尺寸)或由廣角鏡頭(其擴展了外圍區(qū)域)產生的圖像。相反地,更加注意對應于中心視覺的并且最容易受到觀看者關注的圖像部分,使其看起來更大,從而模仿人類視覺系統(tǒng)感知場景的方式。
[0004]該概念的另一好處在于,其使得對應于注視點的圖像區(qū)域以及關注區(qū)域與傳統(tǒng)線性透視圖像相比更具有顯著性。對于諸如廣告的應用來講,這還能夠使得觀看者關注圖像中的廣告商所希望強調的區(qū)域或對象。
[0005]另一好處在于,通過應用這里所述的方法,得到的圖像可以與通過傳統(tǒng)線性透視或其他方法產生的圖像相比具有更加實質的增強深度錯覺,并且可在圖像幀中包括更加寬的視場,而不會減少場景中感興趣、或關注的圖像的相對尺寸。
[0006]與其它“凹型”成像系統(tǒng)一樣,由于對應于視場外圍的圖像區(qū)域中的信息具有更高的壓縮和更低的分辨率,還有可能實現(xiàn)對數(shù)據(jù)存儲和傳輸?shù)墓?jié)約。
[0007]本發(fā)明的中的方法的另一好處在于,將以可感知的準確度從第一視角呈現(xiàn)觀看者身體的視圖,從而加強使用該方法來傳遞第一視角的圖像的有效性。
[0008]已經存在了解決以上一些問題的多種已知方案。其中包括使用廣角鏡頭,比如魚眼鏡頭,其捕獲非常大的視角,但在圖像的邊緣處產生過度的光學失真。雖然可以通過合適的軟件處理來修正這種失真,但這并不是完美的解決方案,這是因為得到的圖像仍然根據(jù)線性透視來進行投影并且缺乏如上所述與真實人類視覺相關聯(lián)的多種特性。
[0009]另一技術將多個圖像拼接在一起,以捕獲非常寬的全景視場,但其缺點在于,使用這種非常寬的圖片格式會受到實際限制。此外,這種全景攝影還缺少如上所述與真實人類視覺相關聯(lián)的幾何結構和其它特性。
[0010]其它成像技術(比如Quicktime VR 和 Condit1n One(http://www.condit1none.com))使得觀看者能夠通過在虛擬空間滾動、按照觀看者的指引從多個角度觀看場景來查看更寬的視場,但這些方法仍然受到上文所提及的不足的限制。
[0011]在一些形式的計算機動畫(比如用于視頻游戲引擎)中,已經嘗試通過將來自觀看者的視點的人身體的一部分包括在內,來仿真觀看者的視點,但這些視圖一般是根據(jù)傳統(tǒng)線性透視呈現(xiàn)的,并且受限于處于所示視場中心的有限矩形觀看區(qū)域。結果,它們排除了在自然視覺中常見的身體(比如鼻子或肩膀)部分。在商業(yè)成像中也已經進行了一些嘗試,其中通過選擇性地對圖像的外部邊緣進行模糊處理來對外圍視場的相對模糊性進行仿真,但這些技術仍然不能彌補以上所述的所有其它不足。
[0012]一些基于鏡頭和基于計算機的系統(tǒng)在捕獲寬視場的同時還以更大的尺寸或分辨率示出了感興趣的區(qū)域,從而對人類視覺的外圍和凹型區(qū)域的特定屬性進行仿真。例如,凹型和廣角凹型鏡頭系統(tǒng)被設計為在捕獲寬視場的同時改善數(shù)據(jù)壓縮以及增強圖像的中心區(qū)域(例如W02008/077132)。然而,這種系統(tǒng)一般依靠捕獲(經由相機和鏡頭)場景的單視二維線性透視視圖,而不產生如本發(fā)明所指出的對應于人類所看見的完整視場的幾何結構的三維世界的投影。它們也不會彌補圖像內的移動注視點的效果或圖像內的關注地點或范圍的改變。廣角凹型圖像通常是圓形的,而不是橢圓形的,它們不包括自然視覺的其它特性,比如復視(有意模糊化在焦點對象之前和之后的圖像)、由不同深度平面的注視改變所導致的對象的明顯尺寸改變、注視對象的增強邊緣對比度、以及本發(fā)明中所指出的其它方法。
[0013]其他方法使用多相機布置來在聚焦于所表示的視場內的區(qū)域上的更多細節(jié)的同時捕獲寬視場(例如US 2004/0061787)。來自相機的圖像被拼接在一起,并被卷曲以形成廣角凹型輸出圖像以供觀看。這種系統(tǒng)還聲稱避免了由相機的彎曲陣列導致的與傳統(tǒng)線性透視投影相關聯(lián)的過度失真。它們還意欲在對應于人類中央凹的圖像區(qū)域處提供更高級別的敏銳度。然而,它們不能記錄或表示人類視覺的幾何結構或特性,比如由于三維深度的改變、關注(而不只是注視)區(qū)域的增加的顯著性、雙視差異和外圍模糊性等導致的圖像修改。
[0014]用于增強對應于眼的中央凹區(qū)域的圖像區(qū)域的其它方法包括“數(shù)字縮放”,其中被注視的圖像區(qū)域相對于對應于圖像的外圍的區(qū)域被放大或增強(例如US 2009/0245600)。然而,這種方法依靠捕獲(經由相機和鏡頭)二維線性透視圖像,而不表示根據(jù)自然人類視覺所感知的幾何結構的整個三維視場。通過這些方法得到的圖像通常是矩形的,而不是橢圓,并且不表示人類視覺的附加特性,比如復視、視場中的主觀曲率、局部關注的效果等。
[0015]生成凹型圖像的其它方法(例如EP2362641、US7965314和GB2400259)同樣基于線性透視的幾何結構,并且缺乏捕獲和表示人類視覺的關鍵特性的能力。
[0016]多個世紀以來,已知通過窺視孔或孔徑觀看平的圖片會增強深度錯覺。已經設計了屏幕觀看設備,以通過使用將基本屏幕的一部分模糊化的幀覆蓋平的屏幕來增強三維深度體驗(參見WO 2010094269、US 6144417)。然而,幀中孔徑的形狀一般是矩形而不是橢圓。此外,本發(fā)明中所教導的對橢圓幀的使用是作為呈現(xiàn)系統(tǒng)的集成組件實現(xiàn)的,其將結合本發(fā)明中規(guī)定的圖像和顯示支撐使用,而不是作為將與任意其它圖像一起使用的單機設備。
[0017]對三維空間進行成像的當前形式趨于依賴于線性透視的規(guī)則,這些規(guī)則基于光的行為以及用來捕獲它的設備(比如鏡頭和感光板)的光學屬性。然而,設備的這種規(guī)則不能考慮已知影響我們如何感知世界的人類視覺系統(tǒng)的多個特性,比如人眼的結構、使用雙眼觀看的后果、關注和記憶的生理效果等。本發(fā)明是根據(jù)以下認識導出的:需要一種用于制作與通過當前可用成像技術制作的圖像相比更接近于人類視覺的實際體驗的圖像的處理。
【發(fā)明內容】
[0018]根據(jù)本發(fā)明的第一方面,提供了一種制作場景的圖像的方法,所述場景的圖像總體上對應于由人類大腦經由人眼感知的圖像,所述方法包括以任何合適順序排列的以下步驟:
[0019]捕獲、記錄、生成或表示包括整個視場或其中一部分的場景,其中當人類觀看者從給定“視點”(VP)注視場景中的給定區(qū)域(比如人眼的凹型視場或一些其它注視點)時,所述整個視場或其中一部分對于所述人類觀看者是可見的;
[0020]逐漸地向著場景的注視點的區(qū)域放大圖像;以及
[0021]逐漸地壓縮場景的對應于外圍視場的區(qū)域,從而產生總體上與呈現(xiàn)給人類感知者的場景相對應的場景的修改圖像。
[0022]本發(fā)明的第二方面還包括按照任何順序排列的以下步驟:
[0023]如果需要,在適當?shù)剡x擇性地在圖像中包括模仿自然人類視覺的附加特性,包括雙重圖像、增強的對比度、非矩形圖像格式、選擇性模糊性和外圍。
[0024]根據(jù)本發(fā)明的第三方面,提供了一種制作圖像的方法,其中在表面上或通過介質顯示輸