本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種確定多媒體資源的標(biāo)題的方法及裝置。
背景技術(shù):
在互聯(lián)網(wǎng)時(shí)代,尤其是移動互聯(lián)網(wǎng)時(shí)代,如何為用戶提供及時(shí)且有價(jià)值的信息是眾多互聯(lián)網(wǎng)公司研究的熱點(diǎn)。例如,用戶在瀏覽視頻網(wǎng)站時(shí),視頻標(biāo)題是吸引用戶觀看視頻的一個重要因素,因此,視頻網(wǎng)站往往有大量的運(yùn)營人員對視頻標(biāo)題進(jìn)行編輯。視頻上傳者也可以對視頻標(biāo)題進(jìn)行編輯,以達(dá)到吸引用戶觀看的目的。
目前,視頻等多媒體資源的標(biāo)題的編輯依賴于網(wǎng)站的運(yùn)營人員和上傳者,耗費(fèi)大量的人力資源,且網(wǎng)站的運(yùn)營人員和上傳者所編輯的多媒體資源的標(biāo)題是針對大眾喜好的,不能滿足單個用戶的個性化需求。
技術(shù)實(shí)現(xiàn)要素:
技術(shù)問題
有鑒于此,本發(fā)明要解決的技術(shù)問題是,現(xiàn)有的確定多媒體資源的標(biāo)題的方式耗費(fèi)大量的人力資源,且不能滿足用戶的個性化需求。
解決方案
為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一實(shí)施例,提供了一種確定多媒體資源的標(biāo)題的方法,包括:
采集目標(biāo)用戶的用戶行為數(shù)據(jù),并根據(jù)所述用戶行為數(shù)據(jù)生成第一多媒體資源列表;
對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到所述目標(biāo)用戶對應(yīng)的第一成分列表;
對待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到所述原標(biāo)題對應(yīng)的第二成分列表;
將所述第二成分列表中的各個成分與所述第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表;
根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,將所述第二成分列表中的各個成分與所述第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,包括:
計(jì)算所述第二成分列表中的各個成分與所述第一成分列表中的各個成分的相似度;
在所述第二成分列表中的一成分與所述第一成分列表中的一成分的相似度大于第一預(yù)設(shè)值的情況下,將所述第二成分列表中的一成分替換為所述第一成分列表中的一成分;
根據(jù)所有替換的成分得到更新后的第二成分列表。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,計(jì)算所述第二成分列表中的各個成分與所述第一成分列表中的各個成分的相似度,包括:
確定所述第二成分列表中的各個成分對應(yīng)的向量;
分別計(jì)算所述第二成分列表中的各個成分對應(yīng)的向量與所述第一成分列表中的各個成分對應(yīng)的向量的相似度。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,分別計(jì)算所述第二成分列表中的各個成分對應(yīng)的向量與所述第一成分列表中的各個成分對應(yīng)的向量的相似度,包括:
采用式1計(jì)算所述第二成分列表中的第l個成分對應(yīng)的向量與所述第一成分列表中的第m個成分對應(yīng)的向量的相似度
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題,包括:
計(jì)算所述更新后的第二成分列表的得分;
在所述更新后的第二成分列表的得分大于第二預(yù)設(shè)值的情況下,根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,計(jì)算所述更新后的第二成分列表的得分,包括:
根據(jù)所述更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算所述更新后的第二成分列表的得分。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,根據(jù)所述更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算所述更新后的第二成分列表的得分,包括:
采用式2計(jì)算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的個數(shù),wj表示所述更新后的第二成分列表中的第j個成分,wj-i表示所述更新后的第二成分列表中的第j-i個成分,p(wjwj-i)表示所述第j個成分與所述第j-i個成分在所述指定樣本集合中共同出現(xiàn)的概率,p(wj-i)表示所述第j-i個成分在所述指定樣本集合中出現(xiàn)的概率。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,在計(jì)算所述更新后的第二成分列表的得分之后,所述方法還包括:
在所述更新后的第二成分列表的得分小于或等于所述第二預(yù)設(shè)值的情況下,保留所述待推薦多媒體資源的原標(biāo)題。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到所述目標(biāo)用戶對應(yīng)的第一成分列表,包括:
對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到與所述目標(biāo)用戶相關(guān)的成分;
將與所述目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)大于第三預(yù)設(shè)值的成分作為所述目標(biāo)用戶對應(yīng)的成分;
根據(jù)所述目標(biāo)用戶對應(yīng)的成分生成所述目標(biāo)用戶對應(yīng)的第一成分列表。
對于上述方法,在一種可能的實(shí)現(xiàn)方式中,采集目標(biāo)用戶的用戶行為數(shù)據(jù),根據(jù)所述用戶行為數(shù)據(jù)生成第一多媒體資源列表,包括:
采集指定時(shí)間段內(nèi)的所述目標(biāo)用戶的所有用戶行為數(shù)據(jù);
從所采集的用戶行為數(shù)據(jù)中篩選出有效的用戶行為數(shù)據(jù);
按照所述有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間對所述有效的用戶行為數(shù)據(jù)進(jìn)行排序,得到所述第一多媒體資源列表。
為了解決上述技術(shù)問題,根據(jù)本發(fā)明的另一實(shí)施例,提供了一種確定多媒體資源的標(biāo)題的裝置,包括:
采集模塊,用于采集目標(biāo)用戶的用戶行為數(shù)據(jù),并根據(jù)所述用戶行為數(shù)據(jù)生成第一多媒體資源列表;
第一解析模塊,用于對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到所述目標(biāo)用戶對應(yīng)的第一成分列表;
第二解析模塊,用于對待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到所述原標(biāo)題對應(yīng)的第二成分列表;
比較模塊,用于將所述第二成分列表中的各個成分與所述第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表;
確定模塊,用于根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述比較模塊包括:
相似度計(jì)算子模塊,用于計(jì)算所述第二成分列表中的各個成分與所述第一成分列表中的各個成分的相似度;
替換子模塊,用于在所述第二成分列表中的一成分與所述第一成分列表中的一成分的相似度大于第一預(yù)設(shè)值的情況下,將所述第二成分列表中的一成分替換為所述第一成分列表中的一成分;
更新子模塊,用于根據(jù)所有替換的成分得到更新后的第二成分列表。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述相似度計(jì)算子模塊包括:
向量確定單元,用于確定所述第二成分列表中的各個成分對應(yīng)的向量;
相似度計(jì)算單元,用于分別計(jì)算所述第二成分列表中的各個成分對應(yīng)的向量與所述第一成分列表中的各個成分對應(yīng)的向量的相似度。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述相似度計(jì)算單元用于:
采用式1計(jì)算所述第二成分列表中的第l個成分對應(yīng)的向量與所述第一成分列表中的第m個成分對應(yīng)的向量的相似度
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述確定模塊包括:
得分計(jì)算子模塊,用于計(jì)算所述更新后的第二成分列表的得分;
確定子模塊,用于在所述更新后的第二成分列表的得分大于第二預(yù)設(shè)值的情況下,根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述得分計(jì)算子模塊用于:
根據(jù)所述更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算所述更新后的第二成分列表的得分。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述得分計(jì)算子模塊用于:
采用式2計(jì)算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的個數(shù),wj表示所述更新后的第二成分列表中的第j個成分,wj-i表示所述更新后的第二成分列表中的第j-i個成分,p(wjwj-i)表示所述第j個成分與所述第j-i個成分在所述指定樣本集合中共同出現(xiàn)的概率,p(wj-i)表示所述第j-i個成分在所述指定樣本集合中出現(xiàn)的概率。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
保留模塊,用于在所述更新后的第二成分列表的得分小于或等于所述第二預(yù)設(shè)值的情況下,保留所述待推薦多媒體資源的原標(biāo)題。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述第一解析模塊包括:
解析子模塊,用于對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到與所述目標(biāo)用戶相關(guān)的成分;
成分確定子模塊,用于將與所述目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)大于第三預(yù)設(shè)值的成分作為所述目標(biāo)用戶對應(yīng)的成分;
第一成分列表生成子模塊,用于根據(jù)所述目標(biāo)用戶對應(yīng)的成分生成所述目標(biāo)用戶對應(yīng)的第一成分列表。
對于上述裝置,在一種可能的實(shí)現(xiàn)方式中,所述采集模塊包括:
采集子模塊,用于采集指定時(shí)間段內(nèi)的所述目標(biāo)用戶的所有用戶行為數(shù)據(jù);
篩選子模塊,用于從所采集的用戶行為數(shù)據(jù)中篩選出有效的用戶行為數(shù)據(jù);
排序子模塊,用于按照所述有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間對所述有效的用戶行為數(shù)據(jù)進(jìn)行排序,得到所述第一多媒體資源列表。
有益效果
通過將待推薦多媒體資源的原標(biāo)題對應(yīng)的第二成分列表中的各個成分與目標(biāo)用戶對應(yīng)的第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,從而確定待推薦多媒體資源的新標(biāo)題,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的標(biāo)題的方法及裝置能夠針對目標(biāo)用戶確定個性化的標(biāo)題,能夠更好地吸引用戶,從而能夠提高所推薦的多媒體資源被點(diǎn)擊的概率。
根據(jù)下面參考附圖對示例性實(shí)施例的詳細(xì)說明,本發(fā)明的其它特征及方面將變得清楚。
附圖說明
包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本發(fā)明的示例性實(shí)施例、特征和方面,并且用于解釋本發(fā)明的原理。
圖1示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法的實(shí)現(xiàn)流程圖;
圖2示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S104的一示例性的實(shí)現(xiàn)流程圖;
圖3示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S301的一示例性的實(shí)現(xiàn)流程圖;
圖4示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S105的一示例性的實(shí)現(xiàn)流程圖;
圖5示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S102的一示例性的實(shí)現(xiàn)流程圖;
圖6示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖;
圖7示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的標(biāo)題的裝置的結(jié)構(gòu)框圖;
圖8示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的標(biāo)題的裝置的結(jié)構(gòu)框圖的一示例性的實(shí)現(xiàn)流程圖;
圖9示出了本發(fā)明的另一個實(shí)施例的一種確定多媒體資源的標(biāo)題的設(shè)備的結(jié)構(gòu)框圖。
具體實(shí)施方式
以下將參考附圖詳細(xì)說明本發(fā)明的各種示例性實(shí)施例、特征和方面。附圖中相同的附圖標(biāo)記表示功能相同或相似的元件。盡管在附圖中示出了實(shí)施例的各種方面,但是除非特別指出,不必按比例繪制附圖。
在這里專用的詞“示例性”意為“用作例子、實(shí)施例或說明性”。這里作為“示例性”所說明的任何實(shí)施例不必解釋為優(yōu)于或好于其它實(shí)施例。
另外,為了更好的說明本發(fā)明,在下文的具體實(shí)施方式中給出了眾多的具體細(xì)節(jié)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,沒有某些具體細(xì)節(jié),本發(fā)明同樣可以實(shí)施。在一些實(shí)例中,對于本領(lǐng)域技術(shù)人員熟知的方法、手段、元件和電路未作詳細(xì)描述,以便于凸顯本發(fā)明的主旨。
實(shí)施例1
圖1示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法的實(shí)現(xiàn)流程圖。該實(shí)施例的執(zhí)行主體可以為服務(wù)器,也可以為其他確定多媒體資源的標(biāo)題的裝置,在此不作限定。如圖1所示,該方法主要包括:
在步驟S101中,采集目標(biāo)用戶的用戶行為數(shù)據(jù),并根據(jù)用戶行為數(shù)據(jù)生成第一多媒體資源列表。
其中,多媒體可以是多種媒體的綜合,例如可以包括文字、聲音和圖像等多種媒體形式。例如,多媒體資源可以為視頻,在此不作限定。目標(biāo)用戶的用戶行為數(shù)據(jù)可以包括但不限于以下至少一項(xiàng):目標(biāo)用戶觀看多媒體資源的數(shù)據(jù)、目標(biāo)用戶評論多媒體資源的數(shù)據(jù)、目標(biāo)用戶訂閱多媒體資源的數(shù)據(jù)和目標(biāo)用戶頂踩多媒體資源的數(shù)據(jù)。在本實(shí)施例中,可以根據(jù)目標(biāo)用戶的用戶行為數(shù)據(jù)對應(yīng)的多媒體資源生成第一多媒體資源列表。例如,目標(biāo)用戶對應(yīng)的第一多媒體資源列表可以表示為LU={v1,v2,…,vn}。
在步驟S102中,對第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到目標(biāo)用戶對應(yīng)的第一成分列表。
作為本實(shí)施例的一個示例,可以采用NER(Named Entity Recognition,命名實(shí)體識別)技術(shù)對第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,以得到目標(biāo)用戶對應(yīng)的第一成分列表。
在步驟S103中,對待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到原標(biāo)題對應(yīng)的第二成分列表。
作為本實(shí)施例的一個示例,可以分別對待推薦多媒體資源列表中的各個待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到各個原標(biāo)題對應(yīng)的第二成分列表。例如,可以采用NER技術(shù)對待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到原標(biāo)題對應(yīng)的第二成分列表。
在步驟S104中,將第二成分列表中的各個成分與第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表。
作為本實(shí)施例的一個示例,可以分別將第二成分列表中的各個成分與第一成分列表中的各個成分進(jìn)行比較,以采用第一成分列表中的成分替換第二成分列表中的成分。
在步驟S105中,根據(jù)更新后的第二成分列表確定待推薦多媒體資源的新標(biāo)題。
例如,待推薦多媒體資源的原標(biāo)題為“烏龜啃一只睡覺的小貓咪的腳趾頭”,新標(biāo)題為“烏龜啃一只睡覺的喵星人的腳趾頭!”。
本實(shí)施例通過將待推薦多媒體資源的原標(biāo)題對應(yīng)的第二成分列表中的各個成分與目標(biāo)用戶對應(yīng)的第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,從而確定待推薦多媒體資源的新標(biāo)題,能夠針對目標(biāo)用戶確定個性化的標(biāo)題,能夠更好地吸引用戶,從而能夠提高所推薦的多媒體資源被點(diǎn)擊的概率;無需人工修改多媒體資源的標(biāo)題,大大節(jié)省了人力成本。
圖2示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S104的一示例性的實(shí)現(xiàn)流程圖。如圖2所示,將第二成分列表中的各個成分與第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,包括:
在步驟S201中,計(jì)算第二成分列表中的各個成分與第一成分列表中的各個成分的相似度。
例如,可以通過計(jì)算成分對應(yīng)的向量之間的相似度來確定成分之間的相似度。本領(lǐng)域技術(shù)人員應(yīng)理解,也可以通過成分的其他參量來衡量成分之間的相似度,在此不作限定。
在步驟S202中,在第二成分列表中的一成分與第一成分列表中的一成分的相似度大于第一預(yù)設(shè)值的情況下,將第二成分列表中的一成分替換為第一成分列表中的一成分。
例如,第一預(yù)設(shè)值可以為0.9。例如,第二成分列表中的一成分為“小貓咪”,第一成分列表中的一成分為“喵星人”,“小貓咪”與“喵星人”的相似度為0.95,則可以將第二成分列表中的“小貓咪”替換為第一成分列表中的“喵星人”。
在本示例中,在第二成分列表中的一成分與第一成分列表中的一成分的相似度大于第一預(yù)設(shè)值的情況下,才將第二成分列表中的一成分替換為第一成分列表中的一成分,由此能夠保證語義的一致性。
在步驟S203中,根據(jù)所有替換的成分得到更新后的第二成分列表。
圖3示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S201的一示例性的實(shí)現(xiàn)流程圖。如圖3所示,計(jì)算第二成分列表中的各個成分與第一成分列表中的各個成分的相似度,包括:
在步驟S301中,確定第二成分列表中的各個成分對應(yīng)的向量。
作為本實(shí)施例的一個示例,可以采用word2vec確定第二成分列表中的各個成分對應(yīng)的向量以及第一成分列表中的各個成分對應(yīng)的向量。
在步驟S302中,分別計(jì)算第二成分列表中的各個成分對應(yīng)的向量與第一成分列表中的各個成分對應(yīng)的向量的相似度。
例如,可以將兩個成分對應(yīng)的向量之間的余弦距離確定為兩個成分的相似度。
在一種可能的實(shí)現(xiàn)方式中,分別計(jì)算第二成分列表中的各個成分對應(yīng)的向量與第一成分列表中的各個成分對應(yīng)的向量的相似度,包括:采用式1計(jì)算第二成分列表中的第l個成分對應(yīng)的向量與第一成分列表中的第m個成分對應(yīng)的向量的相似度
圖4示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S105的一示例性的實(shí)現(xiàn)流程圖。如圖4所示,根據(jù)更新后的第二成分列表確定待推薦多媒體資源的新標(biāo)題,包括:
在步驟S401中,計(jì)算更新后的第二成分列表的得分。
在步驟S402中,在更新后的第二成分列表的得分大于第二預(yù)設(shè)值的情況下,根據(jù)更新后的第二成分列表確定待推薦多媒體資源的新標(biāo)題。
在該示例中,在更新后的第二成分列表的得分大于第二預(yù)設(shè)值的情況下,根據(jù)更新后的第二成分列表確定待推薦多媒體資源的新標(biāo)題,以保證新標(biāo)題的前后成分之間的語言關(guān)聯(lián)性。其中,第二預(yù)設(shè)值可以依據(jù)本領(lǐng)域技術(shù)人員的經(jīng)驗(yàn)設(shè)定,在此不作限定。
在一種可能的實(shí)現(xiàn)方式中,在計(jì)算更新后的第二成分列表的得分之后,該方法還包括:在更新后的第二成分列表的得分小于或等于第二預(yù)設(shè)值的情況下,保留待推薦多媒體資源的原標(biāo)題。在該實(shí)現(xiàn)方式中,在更新后的第二成分列表的得分小于或等于第二預(yù)設(shè)值的情況下,保留待推薦多媒體資源的原標(biāo)題,以保證標(biāo)題的前后成分之間的語言關(guān)聯(lián)性。
在一種可能的實(shí)現(xiàn)方式中,計(jì)算更新后的第二成分列表的得分,包括:根據(jù)更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算更新后的第二成分列表的得分。
例如,可以根據(jù)待推薦的多媒體資源列表中所有多媒體資源的標(biāo)題確定指定樣本集合,或者可以根據(jù)其他指定的多媒體資源列表中所有多媒體資源的標(biāo)題確定指定樣本集合,在此不作限定。
在一種可能的實(shí)現(xiàn)方式中,根據(jù)更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算更新后的第二成分列表的得分,包括:
采用式2計(jì)算更新后的第二成分列表的得分s;
其中,n表示更新后的第二成分列表中成分的個數(shù),wj表示更新后的第二成分列表中的第j個成分,wj-i表示更新后的第二成分列表中的第j-i個成分,p(wjwj-i)表示第j個成分與第j-i個成分在指定樣本集合中共同出現(xiàn)的概率,p(wj-i)表示第j-i個成分在指定樣本集合中出現(xiàn)的概率。
圖5示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S102的一示例性的實(shí)現(xiàn)流程圖。如圖5所示,對第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到目標(biāo)用戶對應(yīng)的第一成分列表,包括:
在步驟S501中,對第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到與目標(biāo)用戶相關(guān)的成分。
作為本實(shí)施例的一個示例,可以采用NER技術(shù)分別對第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到各個多媒體資源的標(biāo)題對應(yīng)的成分。其中,成分可以包括實(shí)體詞(例如“狗”“火星情報(bào)局”)、情緒詞(例如“好看”“笑死人不償命”)和情緒標(biāo)點(diǎn)(例如“!”)中的一項(xiàng)或多項(xiàng)。其中,實(shí)體詞可以包括人名、地名、機(jī)構(gòu)名和專有名詞中的一項(xiàng)或多項(xiàng)。
在步驟S502中,將與目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)大于第三預(yù)設(shè)值的成分作為目標(biāo)用戶對應(yīng)的成分。
例如,第三預(yù)設(shè)值可以為2。在該示例中,通過設(shè)置第三預(yù)設(shè)值,將與目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)大于第三預(yù)設(shè)值的成分作為目標(biāo)用戶對應(yīng)的成分,并過濾與目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)小于或等于第三預(yù)設(shè)值的成分,由此能夠降低噪聲對目標(biāo)用戶對應(yīng)的成分的影響。
在步驟S503中,根據(jù)目標(biāo)用戶對應(yīng)的成分生成目標(biāo)用戶對應(yīng)的第一成分列表。
例如,目標(biāo)用戶對應(yīng)的第一成分列表可以表示為{NE1,NE2,…,NEn},其中,NE1,NE2,…,NEn表示目標(biāo)用戶對應(yīng)的各個成分。
圖6示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的標(biāo)題的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖。如圖6所示,采集目標(biāo)用戶的用戶行為數(shù)據(jù),根據(jù)用戶行為數(shù)據(jù)生成第一多媒體資源列表,包括:
在步驟S601中,采集指定時(shí)間段內(nèi)的目標(biāo)用戶的所有用戶行為數(shù)據(jù)。
例如,可以采集1個月、3個月或者半年內(nèi)的目標(biāo)用戶的所有用戶行為數(shù)據(jù)。
在步驟S602中,從所采集的用戶行為數(shù)據(jù)中篩選出有效的用戶行為數(shù)據(jù)。
例如,可以將重復(fù)觀看多媒體資源的用戶行為數(shù)據(jù)確定為無效的用戶行為數(shù)據(jù),也可以將觀看多媒體資源的完成比例很小的用戶行為數(shù)據(jù)確定為無效的用戶行為數(shù)據(jù),在此不作限定。
在步驟S603中,按照有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間對有效的用戶行為數(shù)據(jù)進(jìn)行排序,得到第一多媒體資源列表。
其中,有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間可以為該有效的用戶行為數(shù)據(jù)的發(fā)生時(shí)間。按照有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間對有效的用戶行為數(shù)據(jù)進(jìn)行排序可以為:按照有效的用戶行為數(shù)據(jù)由近到遠(yuǎn)的時(shí)間順序?qū)τ行У挠脩粜袨閿?shù)據(jù)進(jìn)行排序。
在一種可能的實(shí)現(xiàn)方式中,可以對待推薦多媒體資源列表進(jìn)行篩選,以使待推薦多媒體資源具備多樣性:待推薦多媒體資源的上傳者信息、待推薦多媒體資源所屬的頻道信息、目標(biāo)用戶觀看多媒體資源的數(shù)據(jù)和目標(biāo)用戶的興趣標(biāo)簽。例如,若待推薦多媒體資源列表中包括四個以上同一上傳者上傳的多媒體資源,則可以保留該上傳者上傳的多媒體資源中點(diǎn)擊量排名前三的多媒體資源作為待推薦多媒體資源。再例如,若待推薦多媒體資源列表中包括四個以上同一二級頻道的多媒體資源,則可以保留該二級頻道的多媒體資源中點(diǎn)擊量排名前三的多媒體資源作為待推薦多媒體資源。例如,綜藝頻道為某一一級頻道,湖南綜藝頻道為該一級頻道下的二級頻道。再例如,若待推薦多媒體資源列表中包括四個以上同一三級興趣標(biāo)簽下的多媒體資源,則可以保留該三級興趣標(biāo)簽下的多媒體資源中點(diǎn)擊量排名前三的多媒體資源作為待推薦多媒體資源。例如,一級興趣標(biāo)簽為娛樂,娛樂明星為該一級興趣標(biāo)簽下的二級興趣標(biāo)簽,Beyond為該二級興趣標(biāo)簽下的三級興趣標(biāo)簽。再例如,若待推薦多媒體資源列表中包括目標(biāo)用戶近期觀看過的多媒體資源,則不將該多媒體資源作為待推薦多媒體資源。
這樣,通過將待推薦多媒體資源的原標(biāo)題對應(yīng)的第二成分列表中的各個成分與目標(biāo)用戶對應(yīng)的第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,從而確定待推薦多媒體資源的新標(biāo)題,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的標(biāo)題的方法能夠針對目標(biāo)用戶確定個性化的標(biāo)題,能夠更好地吸引用戶,從而能夠提高所推薦的多媒體資源被點(diǎn)擊的概率。
實(shí)施例2
圖7示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的標(biāo)題的裝置的結(jié)構(gòu)框圖。圖7所示的裝置可以用于運(yùn)行圖1至圖6所示的確定多媒體資源的標(biāo)題的方法。為了便于說明,在圖7中僅示出了與本實(shí)施例相關(guān)的部分。
如圖7所示,該裝置包括:采集模塊71,用于采集目標(biāo)用戶的用戶行為數(shù)據(jù),并根據(jù)所述用戶行為數(shù)據(jù)生成第一多媒體資源列表;第一解析模塊72,用于對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到所述目標(biāo)用戶對應(yīng)的第一成分列表;第二解析模塊73,用于對待推薦多媒體資源的原標(biāo)題進(jìn)行解析,得到所述原標(biāo)題對應(yīng)的第二成分列表;比較模塊74,用于將所述第二成分列表中的各個成分與所述第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表;確定模塊75,用于根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
圖8示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的標(biāo)題的裝置的結(jié)構(gòu)框圖的一示例性的實(shí)現(xiàn)流程圖。圖8所示的裝置可以用于運(yùn)行圖1至圖6所示的確定多媒體資源的標(biāo)題的方法。為了便于說明,在圖8中僅示出了與本實(shí)施例相關(guān)的部分。圖8中標(biāo)號與圖7相同的組件具有相同的功能,為簡明起見,省略對這些組件的詳細(xì)說明。
在一種可能的實(shí)現(xiàn)方式中,所述比較模塊74包括:相似度計(jì)算子模塊741,用于計(jì)算所述第二成分列表中的各個成分與所述第一成分列表中的各個成分的相似度;替換子模塊742,用于在所述第二成分列表中的一成分與所述第一成分列表中的一成分的相似度大于第一預(yù)設(shè)值的情況下,將所述第二成分列表中的一成分替換為所述第一成分列表中的一成分;更新子模塊743,用于根據(jù)所有替換的成分得到更新后的第二成分列表。
在一種可能的實(shí)現(xiàn)方式中,所述相似度計(jì)算子模塊741包括:向量確定單元,用于確定所述第二成分列表中的各個成分對應(yīng)的向量;相似度計(jì)算單元,用于分別計(jì)算所述第二成分列表中的各個成分對應(yīng)的向量與所述第一成分列表中的各個成分對應(yīng)的向量的相似度。
在一種可能的實(shí)現(xiàn)方式中,所述相似度計(jì)算單元用于:采用式1計(jì)算所述第二成分列表中的第l個成分對應(yīng)的向量與所述第一成分列表中的第m個成分對應(yīng)的向量的相似度
在一種可能的實(shí)現(xiàn)方式中,所述確定模塊75包括:得分計(jì)算子模塊751,用于計(jì)算所述更新后的第二成分列表的得分;確定子模塊752,用于在所述更新后的第二成分列表的得分大于第二預(yù)設(shè)值的情況下,根據(jù)所述更新后的第二成分列表確定所述待推薦多媒體資源的新標(biāo)題。
在一種可能的實(shí)現(xiàn)方式中,所述得分計(jì)算子模塊751用于:根據(jù)所述更新后的第二成分列表中的各個成分在指定樣本集合中出現(xiàn)的概率計(jì)算所述更新后的第二成分列表的得分。
在一種可能的實(shí)現(xiàn)方式中,所述得分計(jì)算子模塊751用于:采用式2計(jì)算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的個數(shù),wj表示所述更新后的第二成分列表中的第j個成分,wj-i表示所述更新后的第二成分列表中的第j-i個成分,p(wjwj-i)表示所述第j個成分與所述第j-i個成分在所述指定樣本集合中共同出現(xiàn)的概率,p(wj-i)表示所述第j-i個成分在所述指定樣本集合中出現(xiàn)的概率。
在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:保留模塊76,用于在所述更新后的第二成分列表的得分小于或等于所述第二預(yù)設(shè)值的情況下,保留所述待推薦多媒體資源的原標(biāo)題。
在一種可能的實(shí)現(xiàn)方式中,所述第一解析模塊72包括:解析子模塊721,用于對所述第一多媒體資源列表中各個多媒體資源的標(biāo)題進(jìn)行解析,得到與所述目標(biāo)用戶相關(guān)的成分;成分確定子模塊722,用于將與所述目標(biāo)用戶相關(guān)的成分中出現(xiàn)次數(shù)大于第三預(yù)設(shè)值的成分作為所述目標(biāo)用戶對應(yīng)的成分;第一成分列表生成子模塊723,用于根據(jù)所述目標(biāo)用戶對應(yīng)的成分生成所述目標(biāo)用戶對應(yīng)的第一成分列表。
在一種可能的實(shí)現(xiàn)方式中,所述采集模塊71包括:采集子模塊711,用于采集指定時(shí)間段內(nèi)的所述目標(biāo)用戶的所有用戶行為數(shù)據(jù);篩選子模塊712,用于從所采集的用戶行為數(shù)據(jù)中篩選出有效的用戶行為數(shù)據(jù);排序子模塊713,用于按照所述有效的用戶行為數(shù)據(jù)對應(yīng)的時(shí)間對所述有效的用戶行為數(shù)據(jù)進(jìn)行排序,得到所述第一多媒體資源列表。
需要說明的是,這樣,通過將待推薦多媒體資源的原標(biāo)題對應(yīng)的第二成分列表中的各個成分與目標(biāo)用戶對應(yīng)的第一成分列表中的各個成分進(jìn)行比較,得到更新后的第二成分列表,從而確定待推薦多媒體資源的新標(biāo)題,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的標(biāo)題的裝置能夠針對目標(biāo)用戶確定個性化的標(biāo)題,能夠更好地吸引用戶,從而能夠提高所推薦的多媒體資源被點(diǎn)擊的概率。
實(shí)施例3
圖9示出了本發(fā)明的另一個實(shí)施例的一種確定多媒體資源的標(biāo)題的設(shè)備的結(jié)構(gòu)框圖。所述確定多媒體資源的標(biāo)題的設(shè)備1100可以是具備計(jì)算能力的主機(jī)服務(wù)器、個人計(jì)算機(jī)PC、或者可攜帶的便攜式計(jì)算機(jī)或終端等。本發(fā)明具體實(shí)施例并不對計(jì)算節(jié)點(diǎn)的具體實(shí)現(xiàn)做限定。
所述確定多媒體資源的標(biāo)題的設(shè)備1100包括處理器(processor)1110、通信接口(Communications Interface)1120、存儲器(memory)1130和總線1140。其中,處理器1110、通信接口1120、以及存儲器1130通過總線1140完成相互間的通信。
通信接口1120用于與網(wǎng)絡(luò)設(shè)備通信,其中網(wǎng)絡(luò)設(shè)備包括例如虛擬機(jī)管理中心、共享存儲等。
處理器1110用于執(zhí)行程序。處理器1110可能是一個中央處理器CPU,或者是專用集成電路ASIC(Application Specific Integrated Circuit),或者是被配置成實(shí)施本發(fā)明實(shí)施例的一個或多個集成電路。
存儲器1130用于存放文件。存儲器1130可能包含高速RAM存儲器,也可能還包括非易失性存儲器(non-volatile memory),例如至少一個磁盤存儲器。存儲器1130也可以是存儲器陣列。存儲器1130還可能被分塊,并且所述塊可按一定的規(guī)則組合成虛擬卷。
在一種可能的實(shí)施方式中,上述程序可為包括計(jì)算機(jī)操作指令的程序代碼。該程序具體可用于:實(shí)現(xiàn)實(shí)施例1中各步驟的操作。
本領(lǐng)域普通技術(shù)人員可以意識到,本文所描述的實(shí)施例中的各示例性單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來實(shí)現(xiàn)。這些功能究竟以硬件還是軟件形式來實(shí)現(xiàn),取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以針對特定的應(yīng)用選擇不同的方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
如果以計(jì)算機(jī)軟件的形式來實(shí)現(xiàn)所述功能并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),則在一定程度上可認(rèn)為本發(fā)明的技術(shù)方案的全部或部分(例如對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分)是以計(jì)算機(jī)軟件產(chǎn)品的形式體現(xiàn)的。該計(jì)算機(jī)軟件產(chǎn)品通常存儲在計(jì)算機(jī)可讀取的非易失性存儲介質(zhì)中,包括若干指令用以使得計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī)、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各實(shí)施例方法的全部或部分步驟。而前述的存儲介質(zhì)包括U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。