本發(fā)明涉及視頻播放領(lǐng)域,特別是一種基于語(yǔ)義內(nèi)容的視頻快進(jìn)/快退速度自適應(yīng)調(diào)整方法。
背景技術(shù):用戶(hù)在觀看視頻時(shí),都會(huì)遇到需要快速跳過(guò)不感興趣部分的情況,因此在視頻播放軟件或互聯(lián)網(wǎng)上的視頻播放功能通常會(huì)提供給用戶(hù)快進(jìn)與快退的功能,而且用戶(hù)還可以自己設(shè)置快進(jìn)或快退的速度。然而,如今的快進(jìn)快退功能需要用戶(hù)設(shè)置快進(jìn)快退的速度,但由于用戶(hù)無(wú)法準(zhǔn)確地預(yù)知哪一部分內(nèi)容更精彩,用戶(hù)往往會(huì)因?yàn)樵O(shè)置過(guò)快的快進(jìn)速度導(dǎo)致跳過(guò)了其感興趣部分的內(nèi)容,或者因?yàn)樵O(shè)置過(guò)慢的速度導(dǎo)致其無(wú)法以最短的時(shí)間跳過(guò)其不感興趣的部分。這將最終導(dǎo)致用戶(hù)無(wú)法快速而準(zhǔn)確定位視頻感興趣部分內(nèi)容,浪費(fèi)用戶(hù)的大量時(shí)間,降低了用戶(hù)體驗(yàn)。因此如今的視頻快進(jìn)快退方法還需要改進(jìn)。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種基于語(yǔ)義內(nèi)容的視頻快進(jìn)/快退速度自適應(yīng)調(diào)整方法,通過(guò)視頻語(yǔ)義內(nèi)容及各個(gè)鏡頭的上下文自適應(yīng)地調(diào)整視頻快進(jìn)或快退速率,幫助用戶(hù)快速的跳過(guò)不感興趣內(nèi)容,不會(huì)因?yàn)樗俣冗^(guò)快而錯(cuò)失感興趣內(nèi)容,為用戶(hù)提供了方便。為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種基于語(yǔ)義內(nèi)容的視頻快進(jìn)/快退速度自適應(yīng)調(diào)整方法,其特征在于,按照如下步驟實(shí)現(xiàn):S1:以輸入的視頻數(shù)據(jù)中的鏡頭為單位提取輸入視頻數(shù)據(jù)中每個(gè)鏡頭的鏡頭語(yǔ)義;根據(jù)每個(gè)鏡頭的鏡頭語(yǔ)義對(duì)鏡頭語(yǔ)義之間的鏡頭語(yǔ)義上下文進(jìn)行分析,將由每個(gè)鏡頭對(duì)應(yīng)的鏡頭語(yǔ)義組成的語(yǔ)義序列拓展為上下文標(biāo)簽樹(shù),用以表征鏡頭之間的鏡頭語(yǔ)義上下文;S2:根據(jù)每個(gè)鏡頭的鏡頭語(yǔ)義分別設(shè)定每個(gè)鏡頭的初始權(quán)重,并根據(jù)所述上下文標(biāo)簽樹(shù)對(duì)每個(gè)鏡頭的鏡頭權(quán)重進(jìn)行調(diào)整;S3:設(shè)置待進(jìn)行快進(jìn)或快退播放的視頻的初始快進(jìn)或快退速率V;當(dāng)用戶(hù)選擇快進(jìn)或快退時(shí),根據(jù)每個(gè)鏡頭的權(quán)重調(diào)整該鏡頭的快進(jìn)或快退速率Vcurr。進(jìn)一步的,在所述步驟S1中,還包括如下步驟:S11:對(duì)輸入的n個(gè)訓(xùn)練視頻片段videoj進(jìn)行鏡頭分割,得到訓(xùn)練視頻片段videoj的鏡頭,以鏡頭為單位人工標(biāo)注每個(gè)鏡頭的鏡頭語(yǔ)義,其中,j∈{1,...,n};對(duì)標(biāo)注后的鏡頭語(yǔ)義進(jìn)行分類(lèi),并為每類(lèi)鏡頭語(yǔ)義構(gòu)造鏡頭語(yǔ)義訓(xùn)練集以訓(xùn)練分類(lèi)器,得到鏡頭語(yǔ)義分析器;輸入由t個(gè)鏡頭組成的待進(jìn)行快進(jìn)或快退播放視頻片段video',利用鏡頭語(yǔ)義分析器獲取該待進(jìn)行快進(jìn)或快退播放視頻片段video'中每個(gè)鏡頭的鏡頭語(yǔ)義,用鏡頭語(yǔ)義標(biāo)簽li分別表示每個(gè)鏡頭語(yǔ)義,將該待進(jìn)行快進(jìn)或快退播放視頻片段video'中每個(gè)鏡頭的鏡頭語(yǔ)義按照時(shí)序關(guān)系排列得到鏡頭語(yǔ)義序列wu',且wu'={l1,...,lt},其中l(wèi)i∈L,L為鏡頭語(yǔ)義標(biāo)簽集,其中每一個(gè)元素表示一種鏡頭語(yǔ)義,i為所述鏡頭語(yǔ)義標(biāo)簽li的序列號(hào);S12:將所述鏡頭語(yǔ)義序列wu'拓展為上下文標(biāo)簽樹(shù)LT;所述上下文標(biāo)簽樹(shù)LT的每個(gè)葉節(jié)點(diǎn)為鏡頭語(yǔ)義標(biāo)簽l,l∈L;所述上下文標(biāo)簽樹(shù)LT的每個(gè)非葉節(jié)點(diǎn)為上下文標(biāo)簽,表示每個(gè)非葉節(jié)點(diǎn)對(duì)應(yīng)的葉節(jié)點(diǎn)之間的上下文;所述上下文標(biāo)簽包括:視頻上下文標(biāo)簽video、場(chǎng)景上下文標(biāo)簽scene和普通上下文標(biāo)簽nl,且nl∈NL,NL為普通上下文標(biāo)簽集;所述視頻上下文標(biāo)簽video表示的上下文內(nèi)容為“該上下文標(biāo)簽下的葉節(jié)點(diǎn)共同表達(dá)一個(gè)視頻的語(yǔ)義內(nèi)容”,所述場(chǎng)景上下文標(biāo)簽scene表示的上下文內(nèi)容為“該上下文標(biāo)簽下的葉節(jié)點(diǎn)共同表達(dá)同一個(gè)視頻場(chǎng)景的語(yǔ)義內(nèi)容”;且在所述上下文標(biāo)簽樹(shù)LT中,所述視頻上下文標(biāo)簽video為根節(jié)點(diǎn),所述視頻上下文標(biāo)簽video為的子節(jié)點(diǎn)為所述場(chǎng)景上下文標(biāo)簽scene,所述場(chǎng)景上下文標(biāo)簽scene的子節(jié)點(diǎn)為普通上下文標(biāo)簽或鏡頭語(yǔ)義標(biāo)簽,普通上下文標(biāo)簽nl的子節(jié)點(diǎn)為普通上下文標(biāo)簽或鏡頭語(yǔ)義標(biāo)簽。進(jìn)一步的,在所述步驟S11中,采用用SVM多分類(lèi)器作為分類(lèi)模型,并利用鏡頭語(yǔ)義訓(xùn)練集訓(xùn)練SVM多分類(lèi)器,訓(xùn)練完成后得到所述鏡頭語(yǔ)義分析器。進(jìn)一步的,在所述步驟S12中,按照如下步驟將所述鏡頭語(yǔ)義序列wu'拓展為所述上下文標(biāo)簽樹(shù)LT:S121:根據(jù)所述鏡頭語(yǔ)義序列wu'中每一個(gè)鏡頭語(yǔ)義標(biāo)簽li依次生成一個(gè)葉節(jié)點(diǎn),從左到右生成初始標(biāo)簽節(jié)點(diǎn)序列Curr={c1,...,ct},其中ci=li,ci為初始標(biāo)簽節(jié)點(diǎn)序列Curr中第i標(biāo)簽節(jié)點(diǎn);S122:從左到右遍歷該標(biāo)簽節(jié)點(diǎn)序列Curr,對(duì)于其子序列{ck,...ck+m},若符合上下文標(biāo)簽生成規(guī)則p∈P,即存在描述ck,...,ck+m所形成上下文的上下文標(biāo)簽cp,則以該子序列中每一個(gè)標(biāo)簽節(jié)點(diǎn)為子節(jié)點(diǎn),并以標(biāo)簽cp生成的新標(biāo)簽結(jié)點(diǎn)為父節(jié)點(diǎn),以所述標(biāo)簽cp取代所述簽節(jié)點(diǎn)序列Curr序列中原子序列{ck,...ck+m},其中,P為上下文生成規(guī)則集,上下文標(biāo)簽...