視頻彈幕過濾方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻技術(shù)領(lǐng)域,特別是涉及一種視頻彈幕過濾方法及裝置。
【背景技術(shù)】
[0002]彈幕是指當(dāng)用戶觀看視頻的時候,其它用戶的各種評論會從屏幕上方緩緩滾動過去。一些熱門視頻很多時候整個視頻窗口都會被評論字幕所覆蓋,而且隨著同一時間內(nèi)評論數(shù)量的增加,彈幕滾動的速度會越來越快,這將影響用戶正常觀看視頻。另一方面,彈幕文本內(nèi)容中可能一部分是用戶喜歡的,還有一部分評論內(nèi)容可能與用戶的觀點不同,是用戶不喜歡的。這種情況下,用戶就想要過濾掉他不喜歡的彈幕內(nèi)容。
[0003]現(xiàn)有的過濾視頻彈幕的方法,用戶可以在客戶端設(shè)置關(guān)鍵詞,然后采用正則匹配的方式來達到過濾的目的。使用這種方法,首先需要用戶在客戶端進行配置,然后基于用戶配置根據(jù)正則表達式查找,根據(jù)彈幕文本和用戶設(shè)置的關(guān)鍵詞的匹配度進行視頻彈幕的過濾。
[0004]現(xiàn)有的過濾視頻彈幕的方法只能將與關(guān)鍵詞匹配的視頻彈幕過濾掉,不能將與關(guān)鍵詞語義相近的視頻彈幕過濾掉。如果用戶希望將與關(guān)鍵詞語義相近的視頻彈幕過濾掉,還需要再次設(shè)置與關(guān)鍵詞語義相近的關(guān)鍵詞。可見,現(xiàn)有技術(shù)的過濾視頻彈幕的方法,用戶操作比較繁瑣,視頻彈幕過濾的效率不夠高。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例的目的在于提供一種視頻彈幕過濾方法及裝置,以簡化用戶操作,提高視頻彈幕過濾的效率。具體技術(shù)方案如下:
[0006]第一方面,本發(fā)明提供了一種視頻彈幕過濾方法,應(yīng)用于服務(wù)器,所述方法包括:
[0007]獲取待推送的當(dāng)前視頻彈幕文本和目標(biāo)用戶;
[0008]判斷每個目標(biāo)用戶是否設(shè)置有過濾條件;所述過濾條件為:服務(wù)器預(yù)先響應(yīng)于用戶對至少一個已推送視頻彈幕執(zhí)行的點擊操作,采用預(yù)設(shè)語義分析方法對所述每個被用戶執(zhí)行點擊操作的已推送視頻彈幕文本進行語義分析,確定的至少一個用于過濾的語義框架;
[0009]當(dāng)目標(biāo)用戶設(shè)置有過濾條件時,采用所述預(yù)設(shè)語義分析方法對所述待推送的當(dāng)前視頻彈幕的文本進行語義分析,確定當(dāng)前視頻彈幕文本的語義框架;
[0010]根據(jù)當(dāng)前視頻彈幕文本的語義框架和至少一個用于過濾的語義框架,計算所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架的語義相似度;
[0011]基于所述語義相似度,確定是否對該目標(biāo)用戶過濾所述當(dāng)前視頻彈幕。
[0012]進一步地,所述采用所述預(yù)設(shè)語義分析方法對所述待推送的當(dāng)前視頻彈幕的文本進行語義分析,確定當(dāng)前視頻彈幕文本的語義框架包括:
[0013]對所述當(dāng)前視頻彈幕文本進行分詞和詞性標(biāo)注處理;
[0014]根據(jù)所述處理結(jié)果,確定所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型;
[0015]基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,提取所述當(dāng)前視頻彈幕文本的屬性信息,生成所述當(dāng)前視頻彈幕文本的語義框架。
[0016]進一步地,所述屬性信息包括以下至少一項:領(lǐng)域信息、情景信息和背景信息;
[0017]所述基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,提取所述當(dāng)前視頻彈幕文本的屬性信息,生成所述當(dāng)前視頻彈幕文本的語義框架,包括:
[0018]計算所述當(dāng)前視頻彈幕文本與預(yù)設(shè)的各領(lǐng)域信息的特征的匹配度,將該匹配度大于第一閾值且最高時對應(yīng)的領(lǐng)域信息確定為所述當(dāng)前視頻彈幕文本的領(lǐng)域信息;
[0019]基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,獲得與該句法結(jié)構(gòu)和句子類型相匹配的句子主干內(nèi)容,作為所述當(dāng)前視頻彈幕文本的情景信息;
[0020]計算所述當(dāng)前視頻彈幕文本與預(yù)設(shè)的各背景信息的特征的匹配度,將該匹配度大于第二閾值且最高時對應(yīng)的背景信息確定為所述當(dāng)前視頻彈幕文本的背景信息。
[0021]進一步地,所述基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,提取所述當(dāng)前視頻彈幕文本的屬性信息還包括:
[0022]判斷所述當(dāng)前視頻彈幕文本是否有語義塊分離情況;
[0023]若是,則對分離的語義塊進行重排處理,并基于重排后的當(dāng)前視頻彈幕文本提取其屬性信息。
[0024]進一步地,所述對所述當(dāng)前視頻彈幕文本進行分詞和詞性標(biāo)注處理之后還包括:
[0025]根據(jù)預(yù)設(shè)的易引起歧義的數(shù)據(jù)字典,對所述分詞結(jié)果進行消除歧義處理。
[0026]進一步地,所述根據(jù)當(dāng)前視頻彈幕文本的語義框架和至少一個用于過濾的語義框架,計算所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架的語義相似度包括:
[0027]計算所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架中各對應(yīng)屬性信息的屬性相似度;
[0028]將各屬性相似度乘以預(yù)設(shè)調(diào)節(jié)因子后線性疊加,得到所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架的語義相似度。
[0029]進一步地,在計算所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架的語義相似度之前,根據(jù)所述屬性信息的數(shù)量確定各屬性相似度的調(diào)節(jié)因子的取值。
[0030]進一步地,所述基于所述語義相似度,確定是否對該目標(biāo)用戶過濾所述當(dāng)前視頻彈蒂包括:
[0031]判斷所述各語義相似度中是否有至少一個大于預(yù)設(shè)閾值;
[0032]若是,則對該目標(biāo)用戶過濾所述當(dāng)前視頻彈幕;
[0033]否則,向該目標(biāo)用戶推送所述當(dāng)前視頻彈幕。
[0034]第二方面,本發(fā)明提供了一種視頻彈幕過濾裝置,應(yīng)用于服務(wù)器,所述裝置包括:
[0035]獲取模塊,用于獲取待推送的當(dāng)前視頻彈幕文本和目標(biāo)用戶;
[0036]判斷模塊,用于判斷每個目標(biāo)用戶是否設(shè)置有過濾條件;所述過濾條件為:服務(wù)器預(yù)先響應(yīng)于用戶對至少一個已推送視頻彈幕執(zhí)行的點擊操作,采用預(yù)設(shè)語義分析裝置對所述每個被用戶執(zhí)行點擊操作的已推送視頻彈幕文本進行語義分析,確定的至少一個用于過濾的語義框架;
[0037]分析模塊,用于當(dāng)目標(biāo)用戶設(shè)置有過濾條件時,采用所述預(yù)設(shè)語義分析裝置對所述待推送的當(dāng)前視頻彈幕的文本進行語義分析,確定當(dāng)前視頻彈幕文本的語義框架;
[0038]計算模塊,用于根據(jù)當(dāng)前視頻彈幕文本的語義框架和至少一個用于過濾的語義框架,計算所述當(dāng)前視頻彈幕文本的語義框架和每個所述用于過濾的語義框架的語義相似度;
[0039]確定模塊,用于基于所述語義相似度,確定是否對該目標(biāo)用戶過濾所述當(dāng)前視頻彈幕。
[0040]進一步地,所述分析模塊包括:
[0041]執(zhí)行子模塊,用于對所述當(dāng)前視頻彈幕文本進行分詞和詞性標(biāo)注處理;
[0042]確定子模塊,用于根據(jù)所述處理結(jié)果,確定所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型;
[0043]提取子模塊,用于基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,提取所述第一視頻彈幕文本的屬性信息,生成所述當(dāng)前彈幕文本的語義框架。
[0044]進一步地,所述屬性信息包括以下至少一項:領(lǐng)域信息、情景信息和背景信息;
[0045]所述提取子模塊,包括:領(lǐng)域信息提取子模塊、情景信息提取子模塊和背景信息提取子模塊;
[0046]所述領(lǐng)域信息提取子模塊,用于計算所述當(dāng)前視頻彈幕文本與預(yù)設(shè)的各領(lǐng)域信息的特征的匹配度,將該匹配度大于第一閾值且最高時對應(yīng)的領(lǐng)域信息確定為所述當(dāng)前視頻彈幕文本的領(lǐng)域信息;
[0047]所述情景信息提取子模塊,用于基于所述當(dāng)前視頻彈幕文本的句法結(jié)構(gòu)和句子類型,獲得與該句法結(jié)構(gòu)和句子類型相匹配的句子主干內(nèi)容,作為所述當(dāng)前視頻彈幕文本的情景?目息;
[0048]所述背景信息提取子模塊,用于計算所述當(dāng)前視頻彈幕文本與預(yù)設(shè)的各背景信息的特征的匹配度,將該匹配度大于第二閾值且最高時對應(yīng)的背景信息確定為所述當(dāng)前視頻彈幕文本的背景信息。
[0049]進一步地,所述提取子模塊還用于:
[0050]判斷所述當(dāng)前視頻彈幕文本是否有語義塊分離情況;
[0051]若是,則對分離的語義塊進行重排處理,并基于重排后的當(dāng)前視頻彈幕文本提取其屬性信息。
[0052]進一步地,所述分析模塊還包括:
[0