專利名稱:一種視頻控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻控制技術(shù)領(lǐng)域,尤其涉及一種視頻控制方法。
背景技術(shù):
隨著多媒體編碼、計(jì)算機(jī)多媒體處理和網(wǎng)絡(luò)傳輸技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)正逐漸成為一個(gè)巨大的視頻倉庫,人們?cè)絹碓蕉嗟厍嗖A于通過互聯(lián)網(wǎng)實(shí)時(shí)查詢、欣賞豐富多彩的視頻信息。此外,人們也經(jīng)常通過其他能夠存儲(chǔ)和播放視頻的設(shè)備,如電視機(jī)、車載設(shè)備、手機(jī)、MP4等欣賞相關(guān)視頻。人們?cè)谛蕾p視頻,獲得信息的同時(shí),也對(duì)視頻提出了更多的需求。即,人們希望能夠在海量的視頻數(shù)據(jù)中快速地找到自己所需要的視頻片段,而不是象目前這樣,只能按照視頻標(biāo)題搜索,用戶再從搜索出的視頻列表中進(jìn)行選擇并觀看,在觀看過程中進(jìn)一步尋找所關(guān)心的片段。此外,即使同一段視頻,不同的人在觀看時(shí),關(guān)注視頻中的對(duì)象以及欲獲得該對(duì)象相關(guān)信息的敏感程度也通常各不相同。如果用戶能夠在欣賞視頻的過程中與視頻進(jìn)行交互,在欣賞視頻的同時(shí),可以進(jìn)一步獲得感興趣的相關(guān)對(duì)象的信息,并可以滿足不同用戶的需求,則具有重大意義。然而,現(xiàn)有技術(shù)中,視頻信息是一個(gè)統(tǒng)一的整體。傳統(tǒng)的視頻控制技術(shù),只能通過快進(jìn)或快退等順序的方法人工查找,因而非常繁瑣耗時(shí),顯然已無法滿足當(dāng)前用戶對(duì)視頻搜索的需求。在與視頻進(jìn)行交互方面,現(xiàn)有技術(shù)尚無法做到讓用戶對(duì)視頻中的相關(guān)對(duì)象進(jìn)行控制,更不能獲取該對(duì)象的進(jìn)一步相關(guān)信息。用戶在觀看視頻時(shí)處于一種被動(dòng)接收的狀態(tài),由于不能與視頻交互,因此抑制了用戶的主觀能動(dòng)性,使用戶對(duì)視頻信息幾乎是盲聽盲看,獲得有價(jià)值信息的效率較低、效果較差。要實(shí)現(xiàn)基于內(nèi)容的視頻檢索以及對(duì)播放的視頻內(nèi)容進(jìn)行控制,則必須對(duì)視頻內(nèi)容進(jìn)行處理,向原有視頻內(nèi)容中添加便于檢索或可以與用戶進(jìn)行互動(dòng)的相應(yīng)增值信息。該增值信息可以是視頻中某一對(duì)象的相關(guān)知識(shí),也可以是該對(duì)象產(chǎn)品的廣告信息或新聞信息等。專利號(hào)CN200710123453. 3,提供了向流媒體中加入廣告信息的方法,并提出了利用廣告描述文件來控制視頻中播放廣告的方法,當(dāng)然該方法也適用于控制播放其他內(nèi)容,但是其并沒有對(duì)具體的描述文件進(jìn)行詳細(xì)介紹。MPEG-7雖然提供了多媒體內(nèi)容描述接口,但是MPEG-7本質(zhì)上其特定的元數(shù)據(jù)面向特定應(yīng)用,無法適應(yīng)普遍應(yīng)用背景。目前網(wǎng)絡(luò)視頻數(shù)量眾多,終端用戶訪問網(wǎng)絡(luò)、觀看視頻的平臺(tái)各異,因此,考慮平臺(tái)無關(guān)性,需要對(duì)增值了相關(guān)信息的視頻文件,以統(tǒng)一的格式對(duì)視頻中的原有資源以及可以進(jìn)行控制的資源進(jìn)行描述,并能夠在網(wǎng)頁加載視頻文件時(shí), 對(duì)已描述的資源文件進(jìn)行解析,進(jìn)而打開相應(yīng)增值信息。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)缺乏對(duì)視頻資源描述以及對(duì)視頻內(nèi)部對(duì)象進(jìn)行控制的不足,本發(fā)明提供一種視頻控制方法,按照XML的語法格式,以統(tǒng)一的方式對(duì)增值了相關(guān)信息的視頻資源進(jìn)行描述,并能夠在播放該視頻時(shí)對(duì)相應(yīng)描述資源進(jìn)行解析。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是 本發(fā)明提供了一種視頻控制方法,包括以下步驟1)參照MPEG-7標(biāo)準(zhǔn),擴(kuò)展其對(duì)視頻對(duì)象的描述方案;2)定義XML視頻資源描述文件格式;3)處理視頻文件,創(chuàng)建和視頻內(nèi)容對(duì)應(yīng)的XML視頻描述文件;4)響應(yīng)網(wǎng)頁中的視頻,解析對(duì)應(yīng)的XML視頻描述文件;5)控制視頻內(nèi)部資源和/或視頻外部資源,實(shí)現(xiàn)與視頻交互。所述步驟1)中擴(kuò)展的視頻對(duì)象包括以下部分(1)視頻流,是指通過網(wǎng)絡(luò)傳輸,下載到本地機(jī)器緩沖區(qū)中的視頻數(shù)據(jù)流,本發(fā)明中描述的視頻流與MPEG-7標(biāo)準(zhǔn)中描述的視頻概念不同,視頻流是對(duì)視頻概念進(jìn)一步的結(jié)構(gòu)劃分,即終端用戶看到的視頻可以看作是由一個(gè)或多個(gè)視頻流構(gòu)成的;(2)節(jié)目,是指視頻流中有邏輯聯(lián)系的幀的集合,本發(fā)明中描述的節(jié)目與MPEG-7 中描述的場(chǎng)景不同,視頻流中可能含有多個(gè)節(jié)目,每個(gè)節(jié)目都是由一組相互關(guān)聯(lián)的幀組合而成。(3)幀,是視頻中的基本單元,與MPEG-7中的幀概念等同;(4)層,是在幀之上添加的內(nèi)容,用于描述幀的一些相關(guān)特性,引入層的概念后便能夠增強(qiáng)對(duì)幀內(nèi)對(duì)象進(jìn)行控制和描述的能力。步驟1)中所述視頻流、節(jié)目、幀和層,其共同的屬性為時(shí)間;所述幀中還包含多個(gè)目標(biāo)對(duì)象,這些對(duì)象可以是靜止的也可以是運(yùn)動(dòng)的,與 MPEG-7中描述的對(duì)象概念相同;所述層中還包括本發(fā)明添加的一些對(duì)象,這些對(duì)象不是原視頻中所有的,是本發(fā)明為更好地描述視頻內(nèi)容和更合理地控制視頻內(nèi)部對(duì)象而添加的;所述對(duì)象還包括像素點(diǎn)、輪廓和塊;所述像素點(diǎn)是指視頻幀里面的某一個(gè)點(diǎn),用坐標(biāo)描述該像素點(diǎn)的位置信息;所述輪廓是指視頻幀中某一對(duì)象的輪廓,該輪廓是指能將對(duì)象全部元素包括進(jìn)去的最小區(qū)域,而非對(duì)象具體而細(xì)致的邊界區(qū)域,本發(fā)明中的輪廓形狀為矩形或橢圓形,當(dāng)然也可以是其他形狀;所述塊是指輪廓里面包含的某一個(gè)封閉區(qū)域;所述像素點(diǎn)、輪廓和塊還包括相應(yīng)的屬性信息和事件信息,本發(fā)明中僅對(duì)輪廓的屬性信息和事件信息進(jìn)行論述,像素點(diǎn)和塊的屬性信息及事件信息與輪廓的屬性信息和事件信息幾乎等同,在此不再贅述;所述輪廓屬性信息包括安全性、優(yōu)先級(jí)、透明性、形態(tài)、對(duì)象位置、對(duì)象運(yùn)動(dòng)矢量;所述輪廓事件信息是指對(duì)象觸發(fā)的方法;所述輪廓屬性信息的安全性是指信息傳輸過程中的安全保護(hù)措施;所述輪廓屬性信息的優(yōu)先級(jí)是指當(dāng)層中添加對(duì)象重疊覆蓋時(shí),為了區(qū)分不同對(duì)象的重要程度,以便于描述和控制相應(yīng)對(duì)象而為各對(duì)象賦予的優(yōu)先等級(jí);所述輪廓屬性信息的透明性是指設(shè)置層中重疊覆蓋的對(duì)象透明;
所述輪廓屬性信息的形態(tài)是指層中某一對(duì)象輪廓的形態(tài),用戶可通過鼠標(biāo)點(diǎn)擊該輪廓與對(duì)象進(jìn)行互動(dòng);所述輪廓屬性信息的對(duì)象位置是指對(duì)象的中心點(diǎn)或某一特征點(diǎn)的位置;所述輪廓屬性信息的對(duì)象運(yùn)動(dòng)矢量是指用矢量的方式描述對(duì)象的運(yùn)動(dòng)過程;
所述輪廓屬性信息的安全保護(hù)措施是指DRM或CA認(rèn)證;所述輪廓屬性信息的形態(tài)是指橢圓形或矩形;所述輪廓屬性信息的對(duì)象位置可以通過坐標(biāo)的形式來表示;所述輪廓事件信息的對(duì)象觸發(fā)方法還包括對(duì)象的觸發(fā)方式和對(duì)象觸發(fā)后執(zhí)行的功能;所述對(duì)象的觸發(fā)方式還包括鼠標(biāo)點(diǎn)擊時(shí)觸發(fā)事件、鼠標(biāo)移至對(duì)象所在輪廓區(qū)域時(shí)觸發(fā)事件和自動(dòng)觸發(fā)事件;所述對(duì)象觸發(fā)后執(zhí)行的功能是指觸發(fā)后鏈接到某一 URL地址,以某一種形式打開或執(zhí)行相應(yīng)的鏈接資源以及對(duì)鏈接資源進(jìn)行分類;所述對(duì)象觸發(fā)后打開或執(zhí)行相應(yīng)資源的形式包括圖片、視頻或音頻等;所述對(duì)象觸發(fā)后對(duì)鏈接資源進(jìn)行分類是指描述對(duì)象的關(guān)鍵字分類,包括藝術(shù)、體育、汽車、商場(chǎng)等。所述步驟2)XML視頻資源描述文件格式包括以下內(nèi)容(1)定義XML視頻資源描述文件文檔名稱;(2)定義視頻原有資源信息元素;(3)定義視頻控制資源信息元素;所述視頻資源描述文件文檔名稱是指XML文檔的類型,位于XML聲明字段之后,標(biāo)識(shí)該XML文檔的功能是用于對(duì)視頻資源進(jìn)行描述;所述視頻原有資源信息元素包括視頻ID、視頻資源地址、視頻文件類型、視頻下方滾動(dòng)字幕、視頻下方滾動(dòng)字幕超鏈接、視頻名稱、視頻簡(jiǎn)介、確定視頻是否懸浮、視頻等級(jí)分類、視頻作者、主要演員、視頻編輯者、視頻導(dǎo)演、字幕信息、版權(quán)、上傳時(shí)間、視頻信息關(guān)鍵字集合、視頻信息關(guān)鍵字;所述視頻ID是指為便于對(duì)視頻的處理以及在視頻播放過程中對(duì)其內(nèi)部對(duì)象進(jìn)行控制,而為某一特定視頻分配的唯一 ID,一個(gè)視頻資源描述文件XML文檔中有且只有一個(gè)視頻ID ;所述視頻資源地址是指視頻資源在網(wǎng)絡(luò)或設(shè)備中的存儲(chǔ)位置,每一個(gè)視頻ID唯一對(duì)應(yīng)一個(gè)視頻資源地址,該地址可以是一個(gè)網(wǎng)絡(luò)URL地址,也可以是設(shè)備中的一個(gè)物理存儲(chǔ)地址;所述視頻類型是指播放觀看的視頻文件的格式類型,該格式可以有很多種,比如擴(kuò)展名為.打^.肌1、.《1^、.1^8等視頻文件,本發(fā)明專利所給的實(shí)施例是基于?1狀11文件, 但本發(fā)明的適用范圍不局限于Flash文件,可以支持其他格式的視頻文件;所述視頻下方滾動(dòng)字幕是指在原有視頻下方添加的字幕信息,使其在視頻播放過程中與視頻內(nèi)容在同一窗口中顯示,并以滾動(dòng)的形式循環(huán)出現(xiàn),以引起觀看視頻者注意,便于對(duì)其感興趣的觀看者點(diǎn)擊該滾動(dòng)字幕,查看或鏈接相應(yīng)廣告信息或其他相關(guān)信息;所述滾動(dòng)字幕超鏈接是指滾動(dòng)字幕信息所定向的資源在網(wǎng)絡(luò)或設(shè)備中的存儲(chǔ)位置,該地址可以是一個(gè)網(wǎng)絡(luò)URL地址,也可以是設(shè)備中的一個(gè)物理存儲(chǔ)地址;所述視頻名稱是指描述當(dāng)前播放的視頻的名稱; 所述視頻簡(jiǎn)介是指對(duì)當(dāng)前視頻內(nèi)容的簡(jiǎn)單介紹,即該段視頻內(nèi)容的一個(gè)摘要信息;所述確定視頻是否懸浮是指判斷當(dāng)前視頻是懸浮于網(wǎng)頁中,還是嵌入到當(dāng)前網(wǎng)頁中;所述視頻等級(jí)分類是指按照電影以及其他視頻的審查條例,按照制定的標(biāo)準(zhǔn),對(duì)視頻的相關(guān)內(nèi)容給予的等級(jí)劃分,該等級(jí)劃分方法通常與各國家和地區(qū)的政策及文化等不同而有所差異;所述視頻作者是指當(dāng)前視頻的相關(guān)作者,通常是指該視頻的制作者或者上傳者;所述主要演員是指當(dāng)前視頻中的主要演員信息;所述視頻編輯者是指對(duì)上傳的原始視頻,根據(jù)需要,按照一定的要求而對(duì)其進(jìn)行再次編輯的工作人員,此視頻編輯者可以是原始視頻制作者或上傳者,也可以是其他人員;所述視頻導(dǎo)演是指當(dāng)前視頻的導(dǎo)演信息;所述字幕是指當(dāng)前視頻內(nèi)容在播放過程中,為了更方便地讓觀看者對(duì)其內(nèi)容進(jìn)行理解,而給出的相應(yīng)字幕信息;所述版權(quán)是指當(dāng)前視頻的版權(quán)信息;所述上傳時(shí)間是指當(dāng)前視頻的上傳時(shí)間信息;所述視頻信息關(guān)鍵字集合是指用于描述視頻信息的關(guān)鍵字集合,該關(guān)鍵字集合中的關(guān)鍵字通常包括對(duì)視頻中主要演員、關(guān)鍵幀、視頻內(nèi)容等進(jìn)行描述;所述視頻信息關(guān)鍵字是指用于描述視頻信息的關(guān)鍵字,同一視頻可以用多個(gè)關(guān)鍵字對(duì)其進(jìn)行描述;所述視頻控制資源信息元素包括視頻內(nèi)部對(duì)象、視頻內(nèi)部對(duì)象信息、視頻內(nèi)部對(duì)象ID、對(duì)象第一幀縮略圖位置、廣告資源組合、廣告位具體位置、廣告資源、廣告資源URL、 全屏廣告URL、全屏廣告超鏈接地址、打開全屏廣告超鏈接地址的方式、視頻中某一對(duì)象出現(xiàn)的時(shí)長、視頻中某一對(duì)象出現(xiàn)的開始時(shí)間、視頻中某一對(duì)象出現(xiàn)的結(jié)束時(shí)間、視頻內(nèi)部對(duì)象關(guān)鍵字集合、視頻內(nèi)部對(duì)象關(guān)鍵字、位置點(diǎn)集合、位置點(diǎn)、時(shí)間、左上角橫坐標(biāo)、左上角縱坐標(biāo)、右下角橫坐標(biāo)、右下角縱坐標(biāo);所述視頻內(nèi)部對(duì)象是指視頻中的對(duì)象,該對(duì)象可以是視頻中活動(dòng)的對(duì)象,也可以是靜止的對(duì)象,可以存在于某一特定幀中,也可以存在于連續(xù)的或不連續(xù)的幀中;所述視頻內(nèi)部對(duì)象信息是指描述視頻對(duì)象的相關(guān)信息,該描述信息存在于添加的層中,而非原始視頻中,需要對(duì)原始視頻進(jìn)行編輯,是額外添加的描述相關(guān)對(duì)象的信息;所述視頻內(nèi)部對(duì)象ID是指用來唯一地標(biāo)識(shí)視頻中的具體對(duì)象,以便于通過該對(duì)象ID來辨識(shí)該對(duì)象,進(jìn)而對(duì)其進(jìn)行查詢或相應(yīng)控制;所述對(duì)象第一幀縮略圖位置是指描述某一對(duì)象在視頻中出現(xiàn)的第一幀的縮略圖的URL,該位置可以是一個(gè)網(wǎng)絡(luò)地址,也可以是設(shè)備中的某個(gè)存儲(chǔ)地址,通過訪問該地址,調(diào)用幀的縮略圖;所述廣告資源組合是指一個(gè)對(duì)象所對(duì)應(yīng)的一個(gè)廣告資源組合,通常一個(gè)對(duì)象對(duì)應(yīng)的廣告資源組合可以有一種或幾種,在具體實(shí)施時(shí)可以根據(jù)需要進(jìn)行選擇,但最終一個(gè)對(duì)象只能對(duì)應(yīng)一個(gè)廣告資源組合;所述廣告位具體位置是指描述對(duì)象對(duì)應(yīng)的廣告位的具體出現(xiàn)位置屬于哪一種,一個(gè)對(duì)象可以有一種或幾種廣告位形式,用戶可以根據(jù)投放廣告的需要來定制其中的一種或幾種形式同時(shí)存在;所述廣告資源是指每一個(gè)廣告位所對(duì)應(yīng)的廣告資源,即該廣告位下投放的廣告內(nèi)容的來源,通常一個(gè)廣告位對(duì)應(yīng)一個(gè)廣告資源;所述廣告資源URL是指描述廣告位中廣告資源的URL,該URL可以是一個(gè)網(wǎng)絡(luò)地址,也可以是設(shè)備中的某個(gè)存儲(chǔ)地址;所述全屏廣告URL是指視頻全屏廣告位對(duì)應(yīng)的廣告資源的URL,該URL可以是一個(gè)網(wǎng)絡(luò)地址,也可以是設(shè)備中的某個(gè)存儲(chǔ)地址;所述全屏廣告超鏈接地址是指描述視頻中全屏廣告對(duì)應(yīng)的超鏈接地址,該地址可以是一個(gè)網(wǎng)絡(luò)地址,也可以是設(shè)備中的某個(gè)存儲(chǔ)地址;所述打開全屏廣告超鏈接地址的方式是指描述打開全屏廣告超鏈接地址的方式, 打開方式包括在視頻外廣告位打開超鏈接和在新窗口打開超鏈接等;所述視頻中某一對(duì)象的廣告時(shí)長是指當(dāng)視頻中某一對(duì)象出現(xiàn)時(shí),同時(shí)播放該對(duì)象相應(yīng)的廣告信息,廣告的時(shí)長通常從該對(duì)象出現(xiàn)時(shí)起至下一對(duì)象出現(xiàn)時(shí)止;所述視頻中某一對(duì)象出現(xiàn)的開始時(shí)間是指某一對(duì)象所在的第一幀的播放時(shí)間;所述視頻中某一對(duì)象出現(xiàn)的結(jié)束時(shí)間是指某一對(duì)象所在幀的結(jié)束時(shí)間,該所在幀是指對(duì)象所在的最后一幀;所述視頻內(nèi)部對(duì)象關(guān)鍵字集合是指描述視頻對(duì)象的關(guān)鍵字集合,一個(gè)視頻中一個(gè)對(duì)象對(duì)應(yīng)一個(gè)關(guān)鍵字集合,該關(guān)鍵字集合是通過對(duì)原始視頻進(jìn)行編輯,在層中添加的信息;所述視頻內(nèi)部對(duì)象關(guān)鍵字是指描述某一對(duì)象的關(guān)鍵字,該關(guān)鍵字可以有多個(gè),便于通過關(guān)鍵字對(duì)視頻中的對(duì)象進(jìn)行查詢和控制;所述位置點(diǎn)集合是指對(duì)某一對(duì)象運(yùn)動(dòng)過程中關(guān)鍵位置點(diǎn)集合的描述,通常是指一個(gè)視頻中對(duì)象運(yùn)動(dòng)的關(guān)鍵時(shí)間以及關(guān)鍵區(qū)域的集合;所述位置點(diǎn)是指對(duì)象運(yùn)動(dòng)過程中某一關(guān)鍵位置點(diǎn)描述,通常是指一個(gè)視頻中對(duì)象運(yùn)動(dòng)的關(guān)鍵時(shí)間以及關(guān)鍵區(qū)域;所述時(shí)間是指對(duì)象運(yùn)動(dòng)過程中的某一關(guān)鍵時(shí)間點(diǎn);所述左上角橫坐標(biāo)是指描述對(duì)象所在區(qū)域左上角的關(guān)鍵點(diǎn)橫坐標(biāo);所述左上角縱坐標(biāo)是指描述對(duì)象所在區(qū)域左上角的關(guān)鍵點(diǎn)縱坐標(biāo);所述右下角橫坐標(biāo)是指描述對(duì)象所在區(qū)域右下角的關(guān)鍵點(diǎn)橫坐標(biāo);所述右下角縱坐標(biāo)是指描述對(duì)象所在區(qū)域右下角的關(guān)鍵點(diǎn)縱坐標(biāo)。 所述步驟3)處理視頻文件,創(chuàng)建和視頻內(nèi)容對(duì)應(yīng)的XML視頻描述文件是指對(duì)某一 Flash文件或其他視頻文件進(jìn)行編輯處理,按照步驟2)定義的XML視頻描述文件格式的要求,通過提取數(shù)據(jù)庫字段,生成XML文件,創(chuàng)建與Flash或其他視頻內(nèi)容相對(duì)應(yīng)的XML視頻描述文件,實(shí)現(xiàn)對(duì)視頻內(nèi)部資源和/或視頻外部資源進(jìn)行控制;所述通過提取數(shù)據(jù)庫字段,生成XML文件的方法,包括檢索數(shù)據(jù)庫,查找相應(yīng)記錄信息,從檢索到的記錄中,提取相應(yīng)字段信息,所述字段信息即為XML文件中的字段信息,生成XML文件;所述視頻內(nèi)部資源是指視頻播放器播放窗口內(nèi)的所有媒體資源;所述視頻外部資源是指 視頻播放器播放窗口外的所有資源;所述實(shí)現(xiàn)對(duì)視頻內(nèi)部資源的控制是指在視頻播放器播放的視頻窗口內(nèi)添加、創(chuàng)建、刪除媒體資源;所述媒體資源包括文字、圖片、Flash和視頻;所述視頻播放器包括IPTV、車載設(shè)備、手機(jī)和PC機(jī)中的流媒體播放器;所述實(shí)現(xiàn)對(duì)視頻外部資源進(jìn)行控制是指通過解析XML視頻資源描述文件,控制本地資源和/或網(wǎng)絡(luò)資源;所述控制本地資源包括打開本地存儲(chǔ)設(shè)備中存儲(chǔ)的圖片、Flash、視頻、音頻和文本文檔;所述控制網(wǎng)絡(luò)資源包括根據(jù)網(wǎng)絡(luò)地址URL,打開網(wǎng)絡(luò)中的圖片、Flash、視頻、音頻和文本文檔。所述步驟4)響應(yīng)網(wǎng)頁中的視頻,解析對(duì)應(yīng)的XML視頻描述文件是指當(dāng)網(wǎng)頁中加載并播放經(jīng)過處理的某一 Flash文件或其他視頻文件時(shí),該視頻在播放過程中可以對(duì)步驟3) 中創(chuàng)建的與該視頻內(nèi)容息息相關(guān)的XML視頻描述文件進(jìn)行解析,網(wǎng)頁中的播放器需要具有解析XML視頻描述文件的功能,而非常規(guī)視頻播放器。所述步驟5)控制視頻內(nèi)部資源和/或視頻外部資源,實(shí)現(xiàn)與視頻交互包括對(duì)視頻播放器所播放的視頻窗口內(nèi)的視頻對(duì)象進(jìn)行控制、在視頻窗口內(nèi)部打開圖片、視頻、音頻等媒體文件,還包括對(duì)視頻窗口以外的資源,即打開本地或網(wǎng)絡(luò)上的圖片、視頻、音頻、文本文檔等。一種基于XML的視頻控制系統(tǒng),其特征在于,包括以下設(shè)備及子系統(tǒng)視頻播放設(shè)備、視頻服務(wù)器、視頻處理子系統(tǒng)、XML文件子系統(tǒng)和網(wǎng)絡(luò)資源子系統(tǒng);所述視頻播放設(shè)備包括播放流媒體文件的IPTV電視機(jī)、車載設(shè)備、手機(jī)、手持PDA 和PC機(jī);所述視頻服務(wù)器是指提供視頻資源的網(wǎng)站;所述視頻播放設(shè)備可以訪問視頻服務(wù)器,下載播放視頻,解析XML文件子系統(tǒng)發(fā)送的與當(dāng)前視頻對(duì)應(yīng)的XML文件,并根據(jù)解析XML文件的內(nèi)容,調(diào)用網(wǎng)絡(luò)資源子系統(tǒng)中與該視頻相關(guān)的廣告信息或其他相應(yīng)增值信息;所述視頻處理子系統(tǒng)可以對(duì)視頻服務(wù)器中的視頻進(jìn)行編輯處理,生成描述該視頻內(nèi)容的XML文件,并將該XML文件傳給XML文件子系統(tǒng),同時(shí)將編輯過的視頻傳回視頻服務(wù)器;所述XML文件子系統(tǒng)與視頻編輯子系統(tǒng)進(jìn)行通信,存儲(chǔ)編輯處理過的視頻所對(duì)應(yīng)的XML文件,并對(duì)XML文件進(jìn)行加密;所述網(wǎng)絡(luò)資源子系統(tǒng)是指包含與編輯處理過的視頻相關(guān)的廣告信息和其他相應(yīng)增值信息,視頻播放設(shè)備在播放視頻時(shí)可以調(diào)用網(wǎng)絡(luò)資源子系統(tǒng)中的廣告信息和其他相應(yīng)增值信息,實(shí)現(xiàn)與觀看視頻的用戶進(jìn)行互動(dòng)。
本發(fā)明的有益效果主要包括(1)本發(fā)明參照MPEG-7標(biāo)準(zhǔn),對(duì)視頻對(duì)象描述進(jìn)行了擴(kuò)展,豐富了視頻資源描述信息,使現(xiàn)有的視頻資源信息得到了進(jìn)一步的增值,并增強(qiáng)了現(xiàn)有視頻文件在播放過程中與用戶的互動(dòng)功能; (2)本發(fā)明采用XML統(tǒng)一了視頻資源描述文件的格式,規(guī)范了視頻資源內(nèi)容的描述,且使其具有與平臺(tái)無關(guān)的特性,使基于XML的視頻資源描述文件應(yīng)用性更強(qiáng)、更廣;(3)本發(fā)明提供了一種基于XML的視頻控制方法及其系統(tǒng),使用戶可以在觀看視頻過程中與視頻內(nèi)部的相應(yīng)對(duì)象進(jìn)行互動(dòng),既增強(qiáng)了視頻的娛樂性,又使用戶獲得了更多有價(jià)值的信息,同時(shí)也為廣告業(yè)務(wù)以及其他增值應(yīng)用提供了技術(shù)支撐,具有極大的商業(yè)價(jià)值。
圖1是本發(fā)明中系統(tǒng)架構(gòu)圖;圖2是本發(fā)明中技術(shù)方案流程示意圖;圖3是本發(fā)明中對(duì)MPEG-7視頻描述方案擴(kuò)展部分示意圖。
具體實(shí)施例方式請(qǐng)將申請(qǐng)文件中的“用戶終端”、“終端用戶”統(tǒng)一說法下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。本發(fā)明的基本構(gòu)思為根據(jù)對(duì)視頻內(nèi)容檢索以及對(duì)視頻內(nèi)部對(duì)象進(jìn)行控制的需求,首先對(duì)MPEG-7的標(biāo)準(zhǔn)進(jìn)行分析,擴(kuò)展視頻對(duì)象描述方案,然后采用XML文檔,對(duì)視頻及其相應(yīng)資源按照統(tǒng)一的格式進(jìn)行描述,規(guī)范描述視頻對(duì)象的格式,便于對(duì)編輯處理后的視頻內(nèi)容以XML文件格式進(jìn)行描述存儲(chǔ),當(dāng)網(wǎng)頁中加載并播放處理過的視頻文件時(shí),可以對(duì)該XML視頻描述文件進(jìn)行解析,并利用相應(yīng)腳本語言,如JaVMCript、VBkript、Perl等,與視頻間進(jìn)行通信,以響應(yīng)用戶的相應(yīng)操作,實(shí)現(xiàn)對(duì)視頻中對(duì)象的控制。圖1是本發(fā)明的系統(tǒng)架構(gòu)圖,其中視頻服務(wù)器是指互聯(lián)網(wǎng)中提供視頻的網(wǎng)站,如美國的^uToBe網(wǎng),中國的土豆網(wǎng)、優(yōu)酷網(wǎng)等,視頻處理子系統(tǒng)是指能夠?qū)ι鲜鲆曨l網(wǎng)站中的視頻以及其他視頻進(jìn)行編輯處理并能夠添加相應(yīng)增值服務(wù)功能的視頻處理系統(tǒng)。視頻處理子系統(tǒng)與視頻網(wǎng)站通過110進(jìn)行互操作,視頻處理子系統(tǒng)可以對(duì)視頻網(wǎng)站中的視頻進(jìn)行編輯處理,添加相應(yīng)廣告信息或其他增值信息,同時(shí)為每一個(gè)處理過的視頻分配唯一的ID, 并通過160和170與XML文件子系統(tǒng)進(jìn)行通信,將生成的XML視頻描述文件傳給XML文件子系統(tǒng),當(dāng)用戶通過120訪問視頻網(wǎng)站,選中某一視頻時(shí),視頻網(wǎng)站則通過130將該視頻下載到用戶的本地緩沖區(qū)中,終端用戶瀏覽器中的視頻播放器在播放該視頻時(shí),會(huì)根據(jù)視頻 ID通過140訪問XML文件子系統(tǒng),XML文件子系統(tǒng)經(jīng)過審核驗(yàn)證后,通過150將該視頻ID 對(duì)應(yīng)的XML視頻描述文件傳遞給終端用戶,終端用戶的視頻播放器解析XML視頻描述文件, 并通過180和190與網(wǎng)絡(luò)資源子系統(tǒng)進(jìn)行通信,調(diào)用網(wǎng)絡(luò)資源子系統(tǒng)提供的廣告信息或其他增值信息,實(shí)現(xiàn)在用戶觀看視頻的過程中與用戶進(jìn)行互動(dòng)的功能。本發(fā)明的重點(diǎn)是基于XML的視頻控制方法,圖2是本發(fā)明的技術(shù)方案流程示意圖。 其中,擴(kuò)展視頻描述方案210是指對(duì)MPEG-7視頻描述方案進(jìn)行擴(kuò)展,其擴(kuò)展部分見圖3所不。對(duì)MPEG-7的視頻描述方案擴(kuò)展后,本發(fā)明采用XML對(duì)視頻的相關(guān)資源進(jìn)行描述, 即步驟220,提供了一種以統(tǒng)一的格式描述視頻資源且與平臺(tái)無關(guān)的方法。本發(fā)明是可擴(kuò)展的,提供了使任何接收計(jì)算機(jī)能夠讀取該通用、統(tǒng)一格式化的XML文件。該XML視頻資源描述文件見表1所示。圖1中處理視頻文件230對(duì)視頻文件進(jìn)行處理,即打開視頻文件,記錄下視頻中具體對(duì)象的描述信息,該描述信息至少包括具體對(duì)象的關(guān)鍵字信息、對(duì)象的開始播放和結(jié)束信息、對(duì)象在幀中的位置信息、區(qū)域信息等等,并為每一個(gè)處理過的視頻文件分配唯一的視頻ID ;圖1中創(chuàng)建XML視頻描述文件240是指將編輯處理過的視頻文件內(nèi)容,按照XML 視頻描述文件的格式要求進(jìn)行相應(yīng)地描述,并為每一個(gè)視頻創(chuàng)建唯一一個(gè)XML視頻描述文件,即一個(gè)視頻ID對(duì)應(yīng)一個(gè)XML視頻描述文件;圖1網(wǎng)頁中加載并播放處理過的視頻250是指編輯者將某一視頻進(jìn)行編輯處理后上傳或交付給某一視頻網(wǎng)站,當(dāng)用戶瀏覽某一視頻網(wǎng)站,通過對(duì)視頻內(nèi)容進(jìn)行搜索后,可找到與搜索內(nèi)容相關(guān)的視頻,當(dāng)用戶點(diǎn)擊某視頻,在一網(wǎng)頁中打開該視頻時(shí),網(wǎng)頁中便會(huì)加載并播放之前處理過的某一視頻文件;圖1中檢測(cè)到XML視頻描述文件260是指當(dāng)網(wǎng)頁中加載并播放處理過的視頻文件后,在播放該視頻的過程中,嵌入有解析XML文件功能的視頻播放器會(huì)根據(jù)該視頻ID對(duì)相應(yīng)資源信息進(jìn)行檢測(cè),如果檢測(cè)到有相關(guān)XML視頻描述文件信息,則播放器將對(duì)該XML視頻描述文件進(jìn)行解析,如果沒有檢測(cè)到,則播放器繼續(xù)播放當(dāng)前視頻流;圖1中解析XML視頻描述文件270是指嵌入有解析XML文件功能的視頻播放器在播放視頻過程中,檢測(cè)到XML視頻描述文件后,對(duì)XML視頻描述文件中的相關(guān)信息進(jìn)行解析,實(shí)現(xiàn)XML視頻描述文件中相應(yīng)的視頻描述功能,將此功能在播放視頻的過程中實(shí)時(shí)地展現(xiàn)給用戶,以便用戶與視頻進(jìn)行交互;圖1中實(shí)現(xiàn)與用戶交互功能280是指嵌入有解析XML文件功能的視頻播放器對(duì) XML視頻描述文件進(jìn)行解析后,為了更加友好地與用戶之間進(jìn)行互操作,通常通過某一網(wǎng)頁腳本語言,如JavaScript,VBScript, Perl等在網(wǎng)頁和視頻播放器之間進(jìn)行通信,響應(yīng)用戶的鼠標(biāo)或鍵盤激發(fā)的事件,實(shí)現(xiàn)與用戶間的互動(dòng),以滿足用戶查看視頻內(nèi)部相關(guān)對(duì)象的廣告信息或其他增值信息。圖3為本發(fā)明對(duì)MPEG-7視頻描述方案的擴(kuò)展部分,其中實(shí)線框表示MPEG-7原有描述,虛線框?yàn)楸景l(fā)明的擴(kuò)展。為了能夠?qū)Χ嗝襟w進(jìn)行更好的描述,本發(fā)明首先將多媒體 310抽象為流320,即將用戶終端看到的視頻看作是由多源的視頻流構(gòu)成的。例如,某一終端用戶的有線電視可以收看56個(gè)頻道,傳統(tǒng)的多媒體描述方案是將這56個(gè)頻道做為一個(gè)整體進(jìn)行描述,本發(fā)明提出的視頻流可以將56個(gè)頻道看成是56個(gè)視頻流在同一通信線路內(nèi)傳輸,因此,引入視頻流的概念則具有層次性,在后續(xù)的一些高級(jí)操作中便可以分層來處理。圖3中節(jié)目330則可以理解為某一視頻流中有邏輯聯(lián)系的幀的集合,該視頻流中可能含有多個(gè)節(jié)目,每個(gè)節(jié)目都是由一組相互關(guān)聯(lián)的幀組合而成。圖3中幀340即是視頻中的幀,這一概念與MPEG-7中的幀的概念等同;
圖3中層350是在幀之上添加的內(nèi)容,用于描述幀的一些相關(guān)特性,引入層的概念后便能夠增強(qiáng)對(duì)幀內(nèi)對(duì)象進(jìn)行控制和描述的能力;圖3中對(duì)象351既可以指原視頻中的對(duì)象,這些對(duì)象可以是靜止的,也可以是運(yùn)動(dòng)的,與MPEG-7中描述的對(duì)象概念相同;也可以指本發(fā)明添加的一些對(duì)象,這些對(duì)象不是原視頻中所有的,是本發(fā)明為更好地描述視頻內(nèi)容和更合理地控制視頻內(nèi)部對(duì)象而添加的;圖3中對(duì)象351還包含一些屬性信息和事件信息,本發(fā)明即是通過對(duì)對(duì)象的屬性信息和事件信息進(jìn)行操作,以實(shí)現(xiàn)對(duì)視頻內(nèi)部對(duì)象進(jìn)行控制的功能。表1為本發(fā)明提出的XMl視頻資源描述文件,可以根據(jù)表1中的說明,對(duì)相應(yīng)的視頻資源進(jìn)行描述。表IXML視頻資源描述文件
權(quán)利要求
1.一種視頻控制方法,其特征在于包括以下步驟1)創(chuàng)建基于XML的視頻資源描述文件;2)基于所述XML視頻資源描述文件,對(duì)視頻內(nèi)部資源和/或視頻外部資源進(jìn)行控制; 其中,所述視頻內(nèi)部資源是指視頻播放器播放窗口內(nèi)的所有媒體資源;所述視頻外部資源是指視頻播放器播放窗口外的所有資源。
2.如權(quán)利要求1所述的一種基于XML的視頻控制方法,其特征在于在所述步驟1)中, 創(chuàng)建基于XML的視頻資源描述文件包含以下內(nèi)容(1)擴(kuò)展MPEG-7標(biāo)準(zhǔn)中對(duì)視頻對(duì)象的描述方案,主要包括視頻流、節(jié)目、幀、層、對(duì)象;所述對(duì)象還包括像素點(diǎn)、輪廓和塊; 所述輪廓還包括屬性信息和事件信息;(2)XML聲明字段,該XML聲明字段將描述視頻資源的數(shù)據(jù)結(jié)構(gòu)定義為XML文件,包括字段的標(biāo)識(shí)符。
3.如權(quán)利要求1所述的一種基于XML的視頻控制方法,其特征在于在所述步驟2)中, 基于XML視頻資源描述文件,對(duì)視頻內(nèi)部資源的控制是指在視頻播放器播放的視頻窗口內(nèi)添加、創(chuàng)建、刪除媒體資源;所述媒體資源包括文字、圖片、Flash和視頻;所述視頻播放器包括IPTV、車載設(shè)備、手機(jī)和PC機(jī)中的流媒體播放器。
4.如權(quán)利要求1所述的一種基于XML的視頻控制方法,其特征在于在所述步驟2)中, 基于XML視頻資源描述文件,對(duì)視頻外部資源進(jìn)行控制是指通過解析XML視頻資源描述文件,控制本地資源和/或網(wǎng)絡(luò)資源。
5.如權(quán)利要求1或4所述的一種基于XML的視頻控制方法,其特征在于在所述步驟 2)中,所述控制本地資源包括打開本地存儲(chǔ)設(shè)備中存儲(chǔ)的圖片、Flash、視頻、音頻和文本文檔;所述控制網(wǎng)絡(luò)資源包括根據(jù)網(wǎng)絡(luò)地址URL,打開網(wǎng)絡(luò)中的圖片、Flash、視頻、音頻和文本文檔。
全文摘要
一種視頻控制方法,包括1)創(chuàng)建基于XML的視頻資源描述文件;2)基于所述XML視頻資源描述文件,對(duì)視頻內(nèi)部資源和/或視頻外部資源進(jìn)行控制;其中,視頻內(nèi)部資源是指視頻播放器播放窗口內(nèi)的所有媒體資源;視頻外部資源是指視頻播放器播放窗口外的所有資源。
文檔編號(hào)G06F17/30GK102314433SQ20101021513
公開日2012年1月11日 申請(qǐng)日期2010年6月30日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者孟智平 申請(qǐng)人:上海視加信息科技有限公司