專利名稱:基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)視頻應(yīng)用領(lǐng)域,更具體地說,本發(fā)明涉及一種基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法。
背景技術(shù):
視頻標(biāo)簽是指用于描述視頻特征的短語?,F(xiàn)有視頻標(biāo)簽技術(shù)都是針對整個(gè)視頻進(jìn)行描述,無法對視頻精彩片段進(jìn)行描述。此外,現(xiàn)有視頻標(biāo)簽技術(shù)還存在描述不夠精確,導(dǎo)致基于現(xiàn)有視頻標(biāo)簽技術(shù)的廣告推送不夠精準(zhǔn)、廣告內(nèi)容和視頻內(nèi)容不相關(guān)、投放效果差的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是提供一種基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法,其能通過熱點(diǎn)提高視頻描述準(zhǔn)確度,進(jìn)而提高基于熱點(diǎn)的廣告推送效果。本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的一種基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法,包括以下步驟獲取視頻的視頻標(biāo)簽,視頻標(biāo)簽包括視頻的時(shí)間點(diǎn)和標(biāo)簽內(nèi)容,對視頻標(biāo)簽的標(biāo)簽內(nèi)容進(jìn)行中文分詞,過濾分詞結(jié)果,以保留名詞、動詞作為視頻標(biāo)簽所在時(shí)間點(diǎn)的特征描述詞,計(jì)算特征描述詞在視頻標(biāo)簽中的重要程度值,根據(jù)重要程度值對特征描述詞進(jìn)行排序,并取K個(gè)最重要的特征描述詞作為時(shí)間點(diǎn)的熱點(diǎn)備用詞,對熱點(diǎn)備用詞進(jìn)行統(tǒng)計(jì)建模,以生成視頻熱點(diǎn)信息。計(jì)算特征描述詞在視頻標(biāo)簽中的重要程度值的步驟包括計(jì)算特征描述詞的詞
頻值,具體計(jì)算公式為7^;其中Hi, j為特征描述詞i在視頻標(biāo)簽j中出現(xiàn)的次數(shù),
M為視頻標(biāo)簽j的特征描述詞總數(shù),計(jì)算特征描述詞的逆向文件頻率值,具體計(jì)算公式為
權(quán)利要求
1.一種基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法,包括以下步驟獲取視頻的視頻標(biāo)簽,所述視頻標(biāo)簽包括所述視頻的時(shí)間點(diǎn)和標(biāo)簽內(nèi)容;對所述視頻標(biāo)簽的標(biāo)簽內(nèi)容進(jìn)行中文分詞,過濾分詞結(jié)果,以保留名詞、動詞作為所述視頻標(biāo)簽所在時(shí)間點(diǎn)的特征描述詞;計(jì)算所述特征描述詞在所述視頻標(biāo)簽中的重要程度值;根據(jù)所述重要程度值對所述特征描述詞進(jìn)行排序,并取K個(gè)最重要的特征描述詞作為所述時(shí)間點(diǎn)的熱點(diǎn)備用詞;對所述熱點(diǎn)備用詞進(jìn)行統(tǒng)計(jì)建模,以生成視頻熱點(diǎn)信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算所述特征描述詞在所述視頻標(biāo)簽中的重要程度值的步驟包括n..計(jì)算所述特征描述詞的詞頻值,具體計(jì)算公式為Wu =#,其中nM為特征描述詞i在視頻標(biāo)簽j中出現(xiàn)的次數(shù),M為視頻標(biāo)簽j的特征描述詞總數(shù);計(jì)算所述特征描述詞的IdI逆向文件頻率值,具體計(jì)算公式為=1°§ ;. \ ι,其中IDI為視頻標(biāo)簽的總數(shù),I U Ii e dj} I為包含特征描述詞i的視頻標(biāo)簽總數(shù);根據(jù)以下公式計(jì)算特征描述詞的重要程度值=特征描述詞的詞頻值*特征描述詞的逆向文件頻率值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述熱點(diǎn)備用詞進(jìn)行統(tǒng)計(jì)建模,以生成視頻熱點(diǎn)信息的步驟包括取出所述視頻中存在所述熱點(diǎn)備用詞的所有時(shí)間點(diǎn);從所述所有時(shí)間點(diǎn)中選擇點(diǎn)擊次數(shù)最多的N個(gè)時(shí)間點(diǎn)作為臨時(shí)熱點(diǎn);將所述臨時(shí)熱點(diǎn)前后10秒內(nèi)的所有熱點(diǎn)備用詞存入所述臨時(shí)熱點(diǎn)中,以生成所述視頻熱點(diǎn)信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算所述特征描述詞在所述視頻標(biāo)簽中的重要程度值的步驟是采用TF-IDF算法。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述K的取值等于5。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述N的取值等于所述視頻的長度/300
全文摘要
本發(fā)明公開了一種基于視頻標(biāo)簽獲取視頻熱點(diǎn)信息的方法,包括以下步驟獲取視頻的視頻標(biāo)簽,視頻標(biāo)簽包括視頻的時(shí)間點(diǎn)和標(biāo)簽內(nèi)容,對視頻標(biāo)簽的標(biāo)簽內(nèi)容進(jìn)行中文分詞,過濾分詞結(jié)果,以保留名詞、動詞作為視頻標(biāo)簽所在時(shí)間點(diǎn)的特征描述詞,計(jì)算特征描述詞在視頻標(biāo)簽中的重要程度值,根據(jù)重要程度值對特征描述詞進(jìn)行排序,并取K個(gè)最重要的特征描述詞作為時(shí)間點(diǎn)的熱點(diǎn)備用詞,對熱點(diǎn)備用詞進(jìn)行統(tǒng)計(jì)建模,以生成視頻熱點(diǎn)信息。本發(fā)明能通過熱點(diǎn)提高視頻描述準(zhǔn)確度,進(jìn)而提高基于熱點(diǎn)的廣告推送效果。
文檔編號G06F17/30GK102567467SQ20111039651
公開日2012年7月11日 申請日期2011年12月2日 優(yōu)先權(quán)日2011年12月2日
發(fā)明者廖小飛, 曲鑫, 金海 , 陸楓 申請人:華中科技大學(xué)