專利名稱:一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻的地理定位的系統(tǒng),特別是涉及一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng)。
背景技術(shù):
隨著GPS的普及和Web 2. 0技術(shù)的應(yīng)用,帶GPS標(biāo)簽的網(wǎng)絡(luò)視頻開始獲得人們越來越多的關(guān)注。利用這些帶GPS的網(wǎng)絡(luò)視頻,服務(wù)商可以構(gòu)建的各種新穎而實(shí)用的網(wǎng)絡(luò)應(yīng)用例如基于地理位置的網(wǎng)絡(luò)視頻的推薦與檢索,基于網(wǎng)絡(luò)視頻地理位置的廣告發(fā)布等。但是經(jīng)過統(tǒng)計發(fā)現(xiàn),目前帶GPS標(biāo)簽的網(wǎng)絡(luò)視頻的數(shù)量非常少,僅僅有2. 5%的網(wǎng)絡(luò)視頻是帶有GPS標(biāo)注的。因此,如何對大規(guī)模的網(wǎng)絡(luò)視頻數(shù)據(jù)進(jìn)行快速有效地理定位成為亟待解決的問題。目前的網(wǎng)絡(luò)視頻的地理定位處于剛剛起步階段,而目前為數(shù)不多的工作也主要是利用視頻本身的地理線索來推測視頻的地理位置如果一個視頻標(biāo)有地名的文本標(biāo)簽,那么這個視頻很容易定位到這個地點(diǎn)。或者一個視頻在視覺內(nèi)容上反映了一些耳熟能詳?shù)慕ㄖ驁鼍?,那么這個視頻也可以定位到一個特定的區(qū)域。但是對于本身沒有明確地理線索的視頻來說,如何確定他們的地理位置呢?因此,研究有效的網(wǎng)絡(luò)視頻地理定位方法,不僅能定位那些本身具有地理線索的視頻而且能夠定位那些本身沒有明確地理線索的視頻具有重要意義。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明的目的是針對沒有GPS標(biāo)簽的網(wǎng)絡(luò)視頻,提供一種不僅能定位那些本身具有地理線索的視頻而且能夠定位那些本身沒有明確地理線索的視頻的網(wǎng)絡(luò)視頻地理定位方法;同時對定位結(jié)果進(jìn)行有效展示,使用戶能夠方便的瀏覽視頻的地
理位置。為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,包括步驟100,將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū);步驟200,輸入待定位的視頻,獲取視頻的網(wǎng)格;步驟300,建立所述視頻的相似度矩陣W ;步驟400,利用步驟300的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);步驟500,標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況,其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟100中網(wǎng)格將全球進(jìn)行相等面積的劃分。
所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟200還包括步驟210,待定位的視頻V,通過應(yīng)用程序獲取個帶GPS標(biāo)注的相關(guān)視頻和相同作者的視頻L,其中V代表為標(biāo)記的視頻數(shù)據(jù),L代表已標(biāo)記的視頻數(shù)據(jù),C ^0;步驟220,將L中的所有視頻數(shù)據(jù)根據(jù)其GPS標(biāo)注獲取相應(yīng)網(wǎng)格號,L個視頻數(shù)據(jù)位于C個不同的網(wǎng)格中,C表示L個視頻分屬于不同網(wǎng)絡(luò)的網(wǎng)絡(luò)數(shù)量。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟300還包括步驟310,得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,融合視覺與文本信息計算其相似度,建立視頻(1+) X (1+1)相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟301還包括步驟311,將視頻的標(biāo)簽利用波特詞根還原法詞根化以后,為每個視頻建立其文本特征向量;步驟312,執(zhí)行步驟311中所述的特征向量利用余弦距離計算出視頻的文本相似度 TIJ ;步驟313,將視頻抽取關(guān)鍵幀后,抽取每幀的尺度特征不變轉(zhuǎn)換描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息;步驟314,將步驟313中所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度,兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度VIJ ;步驟315,將步驟312與步驟314中所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融合;步驟316,將視頻數(shù)據(jù)V與視頻數(shù)據(jù)L中的所有視頻按照步驟311到步驟315中的方法計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟400還包括步驟410,根據(jù)步驟300中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率矩陣P,其
^Pu =Pd^ J) = -^-^Lk-Ow.步驟420,對于個帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,建立IXC的標(biāo)簽分布矩陣My矩陣Ml的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況,如果一個視頻分布在區(qū)域i,那么這一行在第i項為1,其余為0 ;步驟430,針對個已標(biāo)注視頻和一個未標(biāo)注視頻建立(1+1) XC的標(biāo)簽分布矩陣 F,F(xiàn)的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同,對于未標(biāo)注數(shù)據(jù)Fu的分布來說, 它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C,而對于已標(biāo)記的數(shù)據(jù)來說,&的初始化跟Ml —致;步驟440,根據(jù)步驟410中的視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽F — PF ;步驟450,為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將Fl與ML保持一致;步驟460,迭代運(yùn)行步驟440與步驟450,直至Fu收斂;步驟470,將視頻數(shù)據(jù)V定位到Fu最大分布值所在的區(qū)塊中。本發(fā)明公開還一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,包括
生成網(wǎng)格模塊,用于將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū);獲取視頻模塊,用于輸入待定位的視頻,獲取視頻的網(wǎng)格;建立矩陣模塊,用于建立所述視頻的相似度矩陣W ;相似度模塊,用于將建立矩陣模塊的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);定位模塊,用于標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況,其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述獲取視頻模塊還包括視頻輸入模塊,用于待定位的視頻V,通過應(yīng)用程序獲取個帶GPS標(biāo)注的相關(guān)視頻和相同作者的視頻L,其中V代表為標(biāo)記的視頻數(shù)據(jù),L代表已標(biāo)記的視頻數(shù)據(jù),[^0;生成網(wǎng)格號模塊,用于將L中的所有視頻數(shù)據(jù)根據(jù)其GPS標(biāo)注獲取相應(yīng)網(wǎng)格號,L 個視頻數(shù)據(jù)位于C個不同的網(wǎng)格中,C表示L個視頻分屬于不同網(wǎng)格的網(wǎng)格數(shù)量。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述建立矩陣模塊還包括矩陣模塊,用于得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻 L,融合視覺與文本信息計算其相似度,建立視頻(1+1) X (1+1)相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述矩陣模塊還包括特征向量模塊,用于將視頻的標(biāo)簽利用波特詞根還原法詞根化以后,為每個視頻建立其文本特征向量;執(zhí)行特征向量模塊中所述的特征向量利用余弦距離計算出視頻的文本相似度TIJ ;將視頻抽取關(guān)鍵幀后,抽取每幀的尺度特征不變轉(zhuǎn)換描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息;所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度,兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度 VIJ ;所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融合;將視頻數(shù)據(jù)V與視頻數(shù)據(jù)L中的所有視頻計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述定位模塊還包括定位建立模塊,根據(jù)建立矩陣模塊中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率
Wij
矩陣P,其中& 4力=2^ .對于ι個帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,建立1 X C的標(biāo)簽分布矩陣Ml,矩陣Ml的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況,如果一個視頻分布在區(qū)域i,那么這一行在第i項為1,其余為0 ;針對1 個已標(biāo)注視頻和一個未標(biāo)注視頻建立(1+1) XC的標(biāo)簽分布矩陣F,F(xiàn)的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同,對于未標(biāo)注數(shù)據(jù)Fu的分布來說,它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C,而對于已標(biāo)記的數(shù)據(jù)來說,&的初始化跟禮一致;根據(jù)所述視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽F — PF ;為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將&與Ml保持一致;迭代運(yùn)行上述算法,直至Fu收斂;將視頻數(shù)據(jù)V定位到Fu最大分布值所在的區(qū)塊中。本發(fā)明的優(yōu)點(diǎn)在于本發(fā)明的方法通過獲取一個視頻的帶GPS標(biāo)簽的相關(guān)視頻和同作者視頻作為定位資源,可以大大提高視頻地理定位的精度。本發(fā)明提出的基于這些社會關(guān)系的視頻地理定位方法,不僅能定位那些具有明確地理線索的視頻,也能定位那些沒有明確地理線索的視頻。本發(fā)明的方法采用了高效的標(biāo)簽傳播算法和精簡有效的在線社會資源,使得我們的方法能高效的完成視頻的在線地理定位任務(wù)。本發(fā)明的方法以動態(tài)的形式將視頻的定位地點(diǎn)在地圖上進(jìn)行展示。提高了用戶體驗(yàn)。
圖1為本發(fā)明的基于社會信息的網(wǎng)絡(luò)視頻在線地理定位方法的流程圖;圖2A為本發(fā)明的基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng)的首頁;圖2B為本發(fā)明的基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng)的定位結(jié)果展示圖;圖3為本發(fā)明的基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng)示意圖。
具體實(shí)施例方式下面給出本發(fā)明的具體實(shí)施方式
,結(jié)合附圖對本發(fā)明做出進(jìn)一步的描述。一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),用來自動確定一個視頻的拍攝地點(diǎn)。該方法包括以下步驟1)將全球等面積的劃分成網(wǎng)格,網(wǎng)格每個區(qū)塊對應(yīng)一個地區(qū)。2)對一個待定位的視頻V(V表示一個待地理定位的網(wǎng)絡(luò)視頻),通過^uTube APK目前因?yàn)閥outube提供這種接口,所以可以定位youtube視頻。如果其他站點(diǎn)也提供類似接口,那么它們的視頻也可以定位。)獲取它的 個帶GPS標(biāo)注的相關(guān)視頻與同作者視頻集L。3)對步驟1)得到的網(wǎng)格,將L中的所有視頻根據(jù)其GPS標(biāo)注獲取它們的網(wǎng)格號, L個視頻位于C個不同的網(wǎng)格中。此時將V視為未標(biāo)記數(shù)據(jù),將L視為已標(biāo)記數(shù)據(jù)。4)對步驟2)得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與同作者視頻集L, 融合視覺與文本信息計算它們相似度,建立視頻(1+1) X (1+1)相似度矩陣W(w是一個維度為(1+1) X (1+1)的相似度矩陣)。5)對步驟4)得到的視頻相似度矩陣;我們利用標(biāo)簽傳播算法將已標(biāo)記數(shù)據(jù)的標(biāo)簽根據(jù)相似度聯(lián)系傳播給未標(biāo)記數(shù)據(jù)。6)對步驟幻中的標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在各個區(qū)塊上的分布情況,其中具有最大分布值的區(qū)塊被選為視頻V的定位區(qū)塊。所述的一個網(wǎng)絡(luò)視頻的在線地理定位系統(tǒng),其特征在于,所述的步驟4)中,融合視覺與文本信息計算視頻的相似度實(shí)現(xiàn)步驟包括4-1)、將視頻的Tag(標(biāo)簽)利用Porter (波特)詞根還原法詞根化以后,為每個視頻建立其文本特征向量;4-2)、步驟4-1)中所述的特征向量利用余弦距離計算出視頻的文本相似度TIJ。4-3)、將視頻抽取關(guān)鍵幀后,抽取每幀的SIFT (尺度特征不變轉(zhuǎn)換)描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息。4-4)、將步驟4-3)中所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度,兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度VIJ。4-5)、將步驟4- 與步驟4-4)中所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融
口 O4-6)、將視頻V與視頻集L中的所有視頻按照步驟4-1)到步驟4_5)中的方法計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。所述的一個網(wǎng)絡(luò)視頻的在線地理定位系統(tǒng),其特征在于,所述的步驟5)中,利用標(biāo)簽傳播算法將已標(biāo)記數(shù)據(jù)的標(biāo)簽根據(jù)相似度聯(lián)系傳播給未標(biāo)記數(shù)據(jù)的實(shí)現(xiàn)步驟包括5-1)、根據(jù)步驟4)中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率矩陣P,其中
PiJ=PH^ J) = ^-Lk-Ow5-2)、針對步驟3中得到的IL在步驟二中已有定義,表示對一個待定位的視頻,通過^uTube API獲取它的個帶GPS標(biāo)注的相關(guān)視頻與同作者視頻集L個帶GPS標(biāo)注的相關(guān)視頻與同作者視頻集L,建立1 XC的標(biāo)簽分布矩陣Mp矩陣Ml的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況如果一個視頻分布在區(qū)域i,那么這一行在第i項為1,其余為0。5-3)、針對1個已標(biāo)注視頻和1個未標(biāo)注視頻建立(1+1) X C的標(biāo)簽分布矩陣F,F(xiàn) 的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同。對于未標(biāo)注數(shù)據(jù)Fu的分布來說,它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C。而對于已標(biāo)記的數(shù)據(jù)來說,&的初始化跟禮一致。5-4)、現(xiàn)在就可以根據(jù)5-1)中的視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽F — PF5-5)、為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將Fl與ML保持一致。5-6)、不斷迭代運(yùn)行5-4)與5_5),直至Fu收斂。5-7)、將視頻V定位到Fu最大分布值所在的區(qū)塊中去。下面結(jié)合附圖對本發(fā)明的方法做進(jìn)一步的說明。如圖1所示。本發(fā)明的網(wǎng)絡(luò)視頻的在線地理定位系統(tǒng)包括以下步驟步驟0、準(zhǔn)備工作將全球等面積的劃分成網(wǎng)格,網(wǎng)格每個區(qū)塊對應(yīng)一個地區(qū)。方法米用開源工具 Geodesic Di screte Global Grid Systems (http: //webpages. sou, edu/ sahrk/dgg/)將全球劃分為等面積網(wǎng)格,每一個網(wǎng)格賦予一個網(wǎng)格號。步驟1、如圖2(a)所示,用戶可以輸入一個^uTube視頻的URL或者在首頁選擇一個^uTube的觀看次數(shù)最多的視頻來觸底視頻的地理定位。在獲得了一個視頻V定位請求以后。本系統(tǒng)通過^uTube API在線獲取待定位視頻V的1個帶GPS標(biāo)注的相關(guān)視頻與同作者視頻集L。方法通過^uTube API開放的服務(wù),對于一個視頻V,我們通過API獲取其帶地理標(biāo)注的同作者視頻相關(guān)視頻。步驟2、將L中的所有視頻根據(jù)其GPS標(biāo)注獲取它們的網(wǎng)格號,L個視頻位于C個不同的網(wǎng)格中。步驟3、融合視覺和文本特征,建立視頻的相似度矩陣W。(上文步驟4已經(jīng)詳細(xì)說明了矩陣的計算方法)
步驟4、將V視為將V視為未標(biāo)記數(shù)據(jù),將L視為已標(biāo)記數(shù)據(jù)。利用標(biāo)簽傳播算法獲得V的網(wǎng)格標(biāo)簽來實(shí)現(xiàn)定位。步驟5、如圖2B所示,將步驟4得到預(yù)測的地理區(qū)塊顯示在地圖上。圖2在線視頻地理定位系統(tǒng)。圖2A系統(tǒng)的首頁提供兩種視頻地理定位入口,用戶可以輸入一個YouTube視頻的URL,或者點(diǎn)擊下方的YouTube每日觀看次數(shù)最多的視頻來定位一個視頻;圖2B視頻定位的結(jié)果頁面,紅色的區(qū)域表示預(yù)測的視頻的地理位置,如果這個視頻是已經(jīng)帶有GPS標(biāo)注的,那么會有一個綠色的小球表示他的原始位置。這個視頻周圍的相關(guān)視頻也會在地圖下方展示。如圖3所示一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,包括生成網(wǎng)格模塊,用于將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū);獲取視頻模塊,用于輸入待定位的視頻,獲取視頻的網(wǎng)格;建立矩陣模塊,用于建立所述視頻的相似度矩陣W ;相似度模塊,用于將建立矩陣模塊的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);定位模塊,用于標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況,其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述獲取視頻模塊還包括視頻輸入模塊,用于待定位的視頻V,通過應(yīng)用程序獲取個帶GPS標(biāo)注的相關(guān)視頻和相同作者的視頻L,其中V代表為標(biāo)記的視頻數(shù)據(jù),L代表已標(biāo)記的視頻數(shù)據(jù),[^0;生成網(wǎng)格號模塊,用于將L中的所有視頻數(shù)據(jù)根據(jù)其GPS標(biāo)注獲取相應(yīng)網(wǎng)格號,L 個視頻數(shù)據(jù)位于C個不同的網(wǎng)格中,C表示L個視頻分屬于不同網(wǎng)格的網(wǎng)格數(shù)量。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述建立矩陣模塊還包括矩陣模塊,用于得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻 L,融合視覺與文本信息計算其相似度,建立視頻(1+1) X (1+1)相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述矩陣模塊還包括特征向量模塊,用于將視頻的標(biāo)簽利用波特詞根還原法詞根化以后,為每個視頻建立其文本特征向量;執(zhí)行特征向量模塊中所述的特征向量利用余弦距離計算出視頻的文本相似度TIJ ;將視頻抽取關(guān)鍵幀后,抽取每幀的尺度特征不變轉(zhuǎn)換描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息;所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度,兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度 VIJ ;所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融合;將視頻數(shù)據(jù)V與視頻數(shù)據(jù)L中的所有視頻計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述定位模塊還包括定位建立模塊,根據(jù)建立矩陣模塊中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率
Wij
矩陣P,其中—Λ = .對于ι個帶GPS標(biāo)注的相關(guān)視頻與相
同作者視頻L,建立1 X C的標(biāo)簽分布矩陣My矩陣M^的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況,如果一個視頻分布在區(qū)域i,那么這一行在第i項為1,其余為0 ;針對1 個已標(biāo)注視頻和一個未標(biāo)注視頻建立(1+1) XC的標(biāo)簽分布矩陣F,F(xiàn)的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同,對于未標(biāo)注數(shù)據(jù)Fu的分布來說,它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C,而對于已標(biāo)記的數(shù)據(jù)來說,&的初始化跟禮一致;根據(jù)所述視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽F — PF ;為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將&與Ml保持一致;迭代運(yùn)行上述算法,直至Fu收斂;將視頻數(shù)據(jù)V定位到Fu最大分布值所在的區(qū)塊中。本領(lǐng)域的技術(shù)人員在不脫離權(quán)利要求書確定的本發(fā)明的精神和范圍的條件下,還可以對以上內(nèi)容進(jìn)行各種各樣的修改。因此本發(fā)明的范圍并不僅限于以上的說明,而是由權(quán)利要求書的范圍來確定的。
權(quán)利要求
1.一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,包括 步驟100,將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū); 步驟200,輸入待定位的視頻,獲取視頻的網(wǎng)格;步驟300,建立所述視頻的相似度矩陣W ;步驟400,利用步驟300的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);步驟500,標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況, 其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟100中網(wǎng)格將全球進(jìn)行相等面積的劃分。
3.如權(quán)利要求1所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟200還包括步驟210,待定位的視頻V,通過應(yīng)用程序獲取個帶GPS標(biāo)注的相關(guān)視頻和相同作者的視頻L,其中V代表為標(biāo)記的視頻數(shù)據(jù),L代表已標(biāo)記的視頻數(shù)據(jù),[^0;步驟220,將L中的所有視頻數(shù)據(jù)根據(jù)其GPS標(biāo)注獲取相應(yīng)網(wǎng)格號,L個視頻數(shù)據(jù)位于 C個不同的網(wǎng)格中,C表示L個視頻分屬于不同網(wǎng)絡(luò)的網(wǎng)絡(luò)數(shù)量。
4.如權(quán)利要求3所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟300還包括步驟310,得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,融合視覺與文本信息計算其相似度,建立視頻(1+1) X (1+1)相似度矩陣W。
5.如權(quán)利要求4所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟301還包括步驟311,將視頻的標(biāo)簽利用波特詞根還原法詞根化以后,為每個視頻建立其文本特征向量;步驟312,執(zhí)行步驟311中所述的特征向量利用余弦距離計算出視頻的文本相似度TIJ ;步驟313,將視頻抽取關(guān)鍵幀后,抽取每幀的尺度特征不變轉(zhuǎn)換描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息;步驟314,將步驟313中所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度, 兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度VIJ ;步驟315,將步驟312與步驟314中所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融合;步驟316,將視頻數(shù)據(jù)V與視頻數(shù)據(jù)L中的所有視頻按照步驟311到步驟315中的方法計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。
6.如權(quán)利要求3所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述步驟400還包括步驟410,根據(jù)步驟300中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率矩陣P,其中PiJ=Pa^j)=2^k=0W'k · ,步驟420,對于個帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,建立1 XC的標(biāo)簽分布矩陣禮,矩陣禮的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況,如果一個視頻分布在區(qū)域i, 那么這一行在第i項為1,其余為0 ;步驟430,針對個已標(biāo)注視頻和一個未標(biāo)注視頻建立(1+1) XC的標(biāo)簽分布矩陣F,F(xiàn) 的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同,對于未標(biāo)注數(shù)據(jù)FuW分布來說,它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C,而對于已標(biāo)記的數(shù)據(jù)來說,&的初始化跟Ml —致;步驟440,根據(jù)步驟410中的視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽F — PF ; 步驟450,為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將&與Ml保持一致; 步驟460,迭代運(yùn)行步驟440與步驟450,直至Fu收斂; 步驟470,將視頻數(shù)據(jù)V定位到Fu最大分布值所在的區(qū)塊中。
7.一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,包括生成網(wǎng)格模塊,用于將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū); 獲取視頻模塊,用于輸入待定位的視頻,獲取視頻的網(wǎng)格; 建立矩陣模塊,用于建立所述視頻的相似度矩陣W ;相似度模塊,用于將建立矩陣模塊的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);定位模塊,用于標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況,其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。
8.如權(quán)利要求7所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述獲取視頻模塊還包括視頻輸入模塊,用于待定位的視頻V,通過應(yīng)用程序獲取個帶GPS標(biāo)注的相關(guān)視頻和相同作者的視頻L,其中V代表為標(biāo)記的視頻數(shù)據(jù),L代表已標(biāo)記的視頻數(shù)據(jù),[^0;生成網(wǎng)格號模塊,用于將L中的所有視頻數(shù)據(jù)根據(jù)其GPS標(biāo)注獲取相應(yīng)網(wǎng)格號,L個視頻數(shù)據(jù)位于C個不同的網(wǎng)格中,C表示L個視頻分屬于不同網(wǎng)格的網(wǎng)格數(shù)量。
9.如權(quán)利要求8所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述建立矩陣模塊還包括矩陣模塊,用于得到的待定位的視頻V與帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,融合視覺與文本信息計算其相似度,建立視頻(1+1) X (1+1)相似度矩陣W。
10.如權(quán)利要求9所述的網(wǎng)絡(luò)視頻在線地理定位系統(tǒng),其特征在于,所述矩陣模塊還包括特征向量模塊,用于將視頻的標(biāo)簽利用波特詞根還原法詞根化以后,為每個視頻建立其文本特征向量;執(zhí)行特征向量模塊中所述的特征向量利用余弦距離計算出視頻的文本相似度TIJ ;將視頻抽取關(guān)鍵幀后,抽取每幀的尺度特征不變轉(zhuǎn)換描述子并利用視覺關(guān)鍵詞技術(shù)形成視覺特征向量來表示該幀的視覺信息;所述的特征向量利用余弦距離計算出視頻幀間的視覺相似度,兩個視頻的最大幀間相似度被認(rèn)定為是視頻間的視覺相似度VIJ ;所述的視頻的文本相似度與視覺相似度進(jìn)行后融合,得到了視頻的相似度度量WIJ = 0. 6TIJ+0. 4VIJ將文本相似度與視覺相似度加權(quán)融合;將視頻數(shù)據(jù)V與視頻數(shù)據(jù)L中的所有視頻計算相似度以后,形成了(1+1) X (1+1)視頻相似度矩陣W。
11.如權(quán)利要求8所述的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,所述定位模塊還包括定位建立模塊,根據(jù)建立矩陣模塊中得到的視頻相似度矩陣W,建立視頻轉(zhuǎn)移概率矩陣WijP,其中4=Ρ(;、Λ = 2^ .對于1個帶GPS標(biāo)注的相關(guān)視頻與相同作者視頻L,建立IXC的標(biāo)簽分布矩陣My矩陣Ml的每一行表示一個已標(biāo)注視頻的區(qū)域分布情況,如果一個視頻分布在區(qū)域i,那么這一行在第i項為1,其余為0 ;針對1個已標(biāo)注視頻和一個未標(biāo)注視頻建立(1+1) XC的標(biāo)簽分布矩陣F,F(xiàn)的初始化根據(jù)已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的不同而不同, 對于未標(biāo)注數(shù)據(jù)Fu的分布來說,它是平均分布的C個區(qū)塊的,每個區(qū)塊的概率為1/C,而對于已標(biāo)記的數(shù)據(jù)來說,F(xiàn)l的初始化跟Ml 一致;根據(jù)所述視頻轉(zhuǎn)移概率矩陣P來傳播標(biāo)簽 F — PF ;為了避免已標(biāo)記數(shù)據(jù)的標(biāo)簽流失,將&與Ml保持一致;迭代運(yùn)行上述算法,直至Fu 收斂;將視頻數(shù)據(jù)V定位到Fu最大分布值所在的區(qū)塊中。
全文摘要
本發(fā)明公開了一種基于社會信息的網(wǎng)絡(luò)視頻在線地理定位方法,其特征在于,包括步驟100,將全球地區(qū)劃分成網(wǎng)格,使網(wǎng)格的每一個區(qū)塊對應(yīng)一個地區(qū);步驟200,輸入待定位的視頻,獲取視頻的網(wǎng)格;步驟300,建立所述視頻的相似度矩陣W;步驟400,利用步驟300的視頻相似度矩陣,通過標(biāo)簽傳播算法將已標(biāo)記視頻數(shù)據(jù)的標(biāo)簽根據(jù)相似度,聯(lián)系傳播給未標(biāo)記的視頻數(shù)據(jù);步驟500,標(biāo)簽傳播算法收斂后,得到了待定位的視頻V在每個地理區(qū)塊的分布情況,其中具有最大分布值的地理區(qū)塊為待定位的視頻V的地理區(qū)塊,同時顯示預(yù)測的地理區(qū)塊。
文檔編號G06F17/30GK102522045SQ20111043232
公開日2012年6月27日 申請日期2011年12月21日 優(yōu)先權(quán)日2011年12月21日
發(fā)明者夏添, 宋一丞, 張勇東, 曹娟, 李錦濤 申請人:中國科學(xué)院計算技術(shù)研究所