專利名稱:一種全景視頻的展示與交互系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及全景視頻展示于交互技術(shù)領(lǐng)域,特別是涉及一種能夠?qū)崿F(xiàn)360°旋轉(zhuǎn)操作功能的全景視頻的展示與交互系統(tǒng)及方法。
背景技術(shù):
視頻(Video)泛指將一系列靜態(tài)影像以電信號方式加以捕捉,紀(jì)錄,處理,儲存,傳送,與重現(xiàn)的各種技術(shù)。連續(xù)的圖像變化每秒超過24幀(frame)畫面以上時,根據(jù)視覺暫留原理,人眼無法辨別單幅的靜態(tài)畫面;看上去是平滑連續(xù)的視覺效果,這樣連續(xù)的畫面叫做視頻。視頻技術(shù)最早是為了電視系統(tǒng)而發(fā)展,但現(xiàn)在已經(jīng)發(fā)展為各種不同的格式以利消費者將視頻記錄下來。網(wǎng)絡(luò)技術(shù)的發(fā)達也促使視頻的紀(jì)錄片段以流媒體的形式存在于因特網(wǎng)之上并可被電腦接收與播放。隨著科技的快速發(fā)展,人們對視頻的要求也是越來越高,這不僅體現(xiàn)在對視頻的質(zhì)量方面,更多的體現(xiàn)在視頻的覆蓋范圍上,即視頻所包含的信息量上。 全景視頻作為一種新的視頻領(lǐng)域,它是一個擁有360°視場角的球形視頻(也可是圓柱型或其它形狀的非平面視頻),將整個空間的信息都包羅在視頻當(dāng)中。如果站在球的外面看,全景視頻呈現(xiàn)出來的是一種水晶球一樣的效果;如果站在球的里面看,就好像處在現(xiàn)實空間中一樣。通過對球形視頻的旋轉(zhuǎn),實現(xiàn)了 360°的空間想看哪里就看哪里,打破了傳統(tǒng)視頻對視場角的限制,可以完全沉浸在視頻所展現(xiàn)的環(huán)境當(dāng)中。全景視頻的每一幀都是一幅全景圖,它與普通視頻的區(qū)別就是該視頻包括了更多的信息。同傳統(tǒng)視頻不同,全景視頻是一種可交互的視頻,因此需要相應(yīng)的人機交互方式與之進行交互。又因為全景視頻是一種全新的概念,所以沒有現(xiàn)成的系統(tǒng)或方法來為之提供友好的交互。目前可使用的方法主要是依賴傳統(tǒng)的鍵盤、鼠標(biāo)來實現(xiàn)使用者與全景視頻的交互。由于全景視頻具有無法比擬的真實現(xiàn)場再現(xiàn)能力,同時具有沉浸式體驗的屬性,因此可以讓使用者參與到視頻所講述的故事中來?,F(xiàn)有的全景視頻交互方式主要有兩種一、通過鼠標(biāo)或者是鍵盤來實現(xiàn)全景視頻的人機交互;二、利用單一平面標(biāo)識來實現(xiàn)全景視頻的人機交互。但是通過實踐發(fā)現(xiàn),上述兩種方式的全景視頻人機交互存在如下的缺陷
一、由于鼠標(biāo)或者是鍵盤的數(shù)據(jù)線長度有限,因此其可移動的范圍較小,這些部件一般僅限于在操作系統(tǒng)的附近位置移動,因此操作使用極不方便,給操作者帶來極大的空間限制;
二、由于單一平面標(biāo)識的可監(jiān)控范圍僅為負(fù)90度到正90度的范圍,而當(dāng)上述標(biāo)識點超出負(fù)90度到正90度的范圍時,比如平面標(biāo)識背對圖像采集設(shè)備,視頻處理設(shè)備將無法搜索到上述標(biāo)識的信息,因此就無法實現(xiàn)對全景視頻的交互。
發(fā)明內(nèi)容
綜上所述,本發(fā)明的第一發(fā)明目的是克服在傳統(tǒng)全景視頻展示與交互的過程中,單一平面標(biāo)識的可監(jiān)控范圍僅限于負(fù)90度到正90度的缺陷,采用一個至少具有兩個標(biāo)識來實現(xiàn)對全景視頻的360°旋轉(zhuǎn)操作控制;本發(fā)明的第二發(fā)明目的是克服傳統(tǒng)鼠標(biāo)或者是鍵盤在實現(xiàn)人機交互過程中使用不方便的缺陷,采用一種可移動的控制設(shè)備實現(xiàn)全景視頻的自由展示與交互過程。本發(fā)明為解決公知技術(shù)中存在的技術(shù)問題所采取的技術(shù)方案是一種全景視頻的展示與交互方法,包括如下步驟選取一個至少具有兩個面的參考物,在所述參考物的每個面上設(shè)置一個標(biāo)識;將全景視頻作為紋理渲染到3D幾何模型上;在所述標(biāo)識與所述3D幾何模型之間建立映射關(guān)系;采集所述參考物的信息,提取所述標(biāo)識的信息,并利用所述映射關(guān)系實現(xiàn)所述參 考物與所述3D幾何模型之間的展示與交互。進一步所述每個標(biāo)識由位置探測標(biāo)識和信息編碼標(biāo)識組成;更進一步所述位置探測標(biāo)識為矩形、正方形、或者是正多邊形。進一步所述參考物為正六面體。進一步所述映射關(guān)系為線性關(guān)系。進一步所述映射關(guān)系為非線性關(guān)系。一種全景視頻的展示與交互系統(tǒng),包括全景視頻播放設(shè)備、與所述全景視頻播放設(shè)備連接的視頻處理裝置、與所述視頻處理設(shè)備連接的數(shù)據(jù)存儲設(shè)備;以及與所述視頻處理設(shè)備連接的控制設(shè)備;所述控制設(shè)備包括參考物和圖像采集設(shè)備;其中所述參考物不少于兩個面,且每個面上設(shè)置至少一個標(biāo)識。進一步所述參考物為正六面體。進一步所述每個標(biāo)識由位置探測標(biāo)識和信息編碼標(biāo)識組成。進一步所述位置探測標(biāo)識為“ 口”字結(jié)構(gòu)。本發(fā)明具有的優(yōu)點和積極效果是一、本發(fā)明通過采用一個至少具有兩個標(biāo)識的參考物替代傳統(tǒng)的鼠標(biāo)或者是鍵盤或者是單一平面標(biāo)識實現(xiàn)對全景視頻的展示與交互過程,將單個標(biāo)識的可監(jiān)控范圍僅限于負(fù)90度到正90度的范圍擴展到了 O度到360度的無縫連接范圍,克服了傳統(tǒng)的鼠標(biāo)或者是鍵盤或者是單一平面標(biāo)識在實現(xiàn)對全景視頻的展示與交互過程存在盲區(qū)的缺陷;二、本發(fā)明通過采用一個至少具有兩個標(biāo)識的參考物替代傳統(tǒng)的鼠標(biāo)或者是鍵盤實現(xiàn)對全景視頻的展示與交互過程,克服了傳統(tǒng)鼠標(biāo)或者是鍵盤容易受到位置空間的限制,具有使用方便、靈活的特點,同時具有操作更加自由的優(yōu)點。
圖I是本發(fā)明一種全景視頻的展示與交互方法的第一具體實施例流程圖;圖2是本發(fā)明一種全景視頻的展示與交互方法的第二具體實施例流程圖;圖3是本發(fā)明一種全景視頻的展示與交互方法的第三具體實施例流程圖;圖4是本發(fā)明一種全景視頻的展示與交互方法中使用到的一個標(biāo)識示意圖,主要用于顯示單個標(biāo)識的信息;圖5是本發(fā)明一種全景視頻的展示與交互系統(tǒng)的結(jié)構(gòu)原理圖;圖6是本發(fā)明一種全景視頻的展示與交互系統(tǒng)的一個參考物示意圖,主要用于顯示參考物每個面的標(biāo)識信息。其中1、標(biāo)識;1_1、位置探測標(biāo)識;1_2、信息編碼標(biāo)識;2、參考物;3、圖像采集設(shè)備;4、數(shù)據(jù)存儲設(shè)備;5、視頻處理設(shè)備;6、全景視頻播放設(shè)備。
具體實施例方式為能進一步了解本發(fā)明的發(fā)明內(nèi)容、特點及功效,茲例舉以下實施例,并配合附圖詳細說明如下請參閱圖1,一種全景視頻的展示與交互方法的第一具體實施例,包括如下步驟步驟101、選取一個至少具有兩個面的參考物2,在參考物2的每個面上設(shè)置一個標(biāo)識I ;步驟102、使用多相機采用同步拍攝方式采集全景數(shù)據(jù),然后對這些原始全景數(shù)據(jù)進行校正、拼接融合、視頻壓縮編碼處理,生成全景視頻;步驟103、將全景視頻作為紋理渲染到3D幾何模型(3D幾何模型一般選取球體、圓柱體或者是其他立體模型)上,暫存于視頻處理設(shè)備5中,以備步驟105使用;步驟104、在標(biāo)識I與上述3D幾何模型之間建立映射關(guān)系;步驟105、利用圖像采集設(shè)備3采集步驟101中參考物的信息,將采集到的參考物圖像導(dǎo)入視頻處理設(shè)備5,利用視頻處理設(shè)備5提取上述標(biāo)識I的坐標(biāo)、姿態(tài)信息,并利用步驟104所建立的映射關(guān)系實現(xiàn)參考物I與上述全景視頻之間的展示與交互。請參閱圖2、圖4,一種全景視頻的展示與交互方法的第二具體實施例,包括如下步驟步驟201、選取一個正六面體的參考物2,在參考物2的每個面上設(shè)置一個標(biāo)識I ;在這里,如圖4所示,標(biāo)識I由位置探測標(biāo)識1-1和信息編碼標(biāo)識1-2組成,其中位置探測標(biāo)識1-1為一個具有一定寬度的黑色方塊,呈現(xiàn)“ 口 ”字結(jié)構(gòu),信息編碼標(biāo)識1-2為一個特定的圖案、數(shù)值、、字母或者是漢字,在本具體實施例中,信息編碼標(biāo)識1-2為一個大寫的字母“A”;步驟202、使用多相機同步拍攝方式采集全景數(shù)據(jù),后對這些原始全景數(shù)據(jù)進行校正、拼接融合、視頻壓縮編碼處理,生成全景視頻;步驟203、將全景視頻作為紋理渲染到3D幾何模型上,暫存于視頻處理設(shè)備5中,以備步驟205使用;步驟204、在標(biāo)識I與上述3D幾何模型之間建立線性映射關(guān)系;進一步在本具體實施例中,所采用的線性映射關(guān)系可以通過下面函數(shù)方程表述
權(quán)利要求
1.一種全景視頻的展示與交互方法,其特征在于包括如下步驟 選取一個至少具有兩個面的參考物,在所述參考物的每個面上設(shè)置一個標(biāo)識; 將全景視頻作為紋理渲染到3D幾何模型上; 在所述標(biāo)識與所述3D幾何模型之間建立映射關(guān)系; 采集所述參考物的信息,提取所述標(biāo)識的信息,并利用所述映射關(guān)系實現(xiàn)所述參考物與所述3D幾何模型之間的展示與交互。
2.根據(jù)權(quán)利要求I所述的全景視頻的展示與交互方法,其特征在于所述每個標(biāo)識由位置探測標(biāo)識和信息編碼標(biāo)識組成。
3.根據(jù)權(quán)利要求2所述的全景視頻的展示與交互方法,其特征在于所述位置探測標(biāo)識為矩形、正方形、或者是正多邊形。
4.根據(jù)權(quán)利要求I所述的全景視頻的展示與交互方法,其特征在于所述參考物為正六面體。
5.根據(jù)權(quán)利要求I所述的全景視頻的展示與交互方法,其特征在于所述映射關(guān)系為線性關(guān)系。
6.根據(jù)權(quán)利要求I所述的全景視頻的展示與交互方法,其特征在于所述映射關(guān)系為非線性關(guān)系。
7.—種全景視頻的展示與交互系統(tǒng),包括全景視頻播放設(shè)備、與所述全景視頻播放設(shè)備連接的視頻處理裝置、與所述視頻處理設(shè)備連接的數(shù)據(jù)存儲設(shè)備;以及與所述視頻處理設(shè)備連接的控制設(shè)備;其特征在于所述控制設(shè)備包括參考物和圖像采集設(shè)備;其中所述參考物不少于兩個面,且每個面上設(shè)置至少一個標(biāo)識。
8.根據(jù)權(quán)利要求7所述的全景視頻的展示與交互系統(tǒng),其特征在于所述參考物為正六面體。
9.根據(jù)權(quán)利要求7所述的全景視頻的展示與交互系統(tǒng),其特征在于所述每個標(biāo)識由位置探測標(biāo)識和信息編碼標(biāo)識組成。
10.根據(jù)權(quán)利要求9所述的全景視頻的展示與交互系統(tǒng),其特征在于所述位置探測標(biāo)識為“ 口”字結(jié)構(gòu)。
全文摘要
本發(fā)明公開了一種全景視頻的展示與交互系統(tǒng)及方法,涉及全景視頻展示與交互技術(shù)領(lǐng)域;其方法包括如下步驟選取一個至少具有兩個面的參考物,在所述參考物的每個面上設(shè)置一個標(biāo)識;將全景視頻作為紋理渲染到3D幾何模型上;在所述標(biāo)識與所述3D 幾何模型之間建立映射關(guān)系;采集所述參考物的信息,提取所述標(biāo)識的信息,并利用所述映射關(guān)系實現(xiàn)所述參考物與所述3D幾何模型之間的展示與交互。本發(fā)明通過采用多個標(biāo)識代替?zhèn)鹘y(tǒng)的鼠標(biāo)、鍵盤或者是單一平面標(biāo)識實現(xiàn)對全景視頻的展示與交互,克服了傳統(tǒng)單一標(biāo)識在全景視頻的展示與交互過程中存在盲區(qū)的缺陷,可以使操作者得到更好的沉浸式體驗效果;同時具有操作靈活、方便、自由的特點。
文檔編號G06T15/00GK102945563SQ20121036594
公開日2013年2月27日 申請日期2012年9月26日 優(yōu)先權(quán)日2012年9月26日
發(fā)明者郭曉冬, 李鵬, 陳遇, 李建宇, 段文興 申請人:天津游奕科技有限公司