亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定多媒體資源的關(guān)鍵詞的權(quán)重的方法及裝置與流程

文檔序號:12177153閱讀:287來源:國知局
確定多媒體資源的關(guān)鍵詞的權(quán)重的方法及裝置與流程

本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種確定多媒體資源的關(guān)鍵詞的權(quán)重的方法及裝置。



背景技術(shù):

在視頻等多媒體資源的智能推薦與檢索等應(yīng)用領(lǐng)域,精準(zhǔn)地確定多媒體資源的關(guān)鍵詞的權(quán)重,從而基于關(guān)鍵詞和相應(yīng)權(quán)重準(zhǔn)確地“刻畫”多媒體資源的特征,對于多媒體資源推薦和檢索的效率及準(zhǔn)確度具有重要意義。以視頻為例,在相關(guān)技術(shù)中,視頻關(guān)鍵詞的權(quán)重計(jì)算主要有三種方法。第一種為基于TF-IDF(Term Frequency-Inverse Document Frequency,詞頻-逆向文件頻率)公式的計(jì)算方法。在該方法中,給定描述視頻的文件信息(如視頻標(biāo)題或者視頻簡介),計(jì)算視頻關(guān)鍵詞的文檔頻率和逆文檔頻率,再利用TF-IDF公式計(jì)算關(guān)鍵詞的權(quán)重。在該方法中,由于視頻上傳者可以自由填寫視頻標(biāo)題和視頻簡介等視頻的文件信息,導(dǎo)致計(jì)算出的視頻關(guān)鍵詞的權(quán)重的準(zhǔn)確性較低。第二種方法為基于視頻-用戶交互矩陣分解的計(jì)算方法。在該方法中,構(gòu)造視頻-用戶交互矩陣,將其進(jìn)行SVD(Singular Value Decomposition,奇異值分解),可得到視頻在隱式特征空間中的表示,從而得到每個(gè)視頻在隱式關(guān)鍵詞上的權(quán)重。該方法由于視頻-用戶交互矩陣維度巨大且通常非常稀疏,導(dǎo)致對于計(jì)算資源消耗較大且計(jì)算結(jié)果的準(zhǔn)確性較低。同時(shí),由于只能得到隱式關(guān)鍵詞的權(quán)重,導(dǎo)致這種方法得到的結(jié)果的可理解性較差。第三種方法為基于視頻圖像特征的計(jì)算方法。在該方法中,識別、提取視頻關(guān)鍵幀,分析關(guān)鍵幀的圖像特征,并基于圖像特征計(jì)算對應(yīng)關(guān)鍵詞的權(quán)重。該方法由于需要識別并分析視頻的關(guān)鍵幀圖像,導(dǎo)致對于計(jì)算資源消耗較大且運(yùn)行效率較低。



技術(shù)實(shí)現(xiàn)要素:

技術(shù)問題

有鑒于此,本發(fā)明要解決的技術(shù)問題是,確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確率較低、對于計(jì)算資源的消耗較大且效率較低。

解決方案

為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一實(shí)施例,提供了一種確定多媒體資源的關(guān)鍵詞的權(quán)重的方法,包括:

根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定所述目標(biāo)用戶對應(yīng)的多媒體資源列表;

對于所述多媒體資源列表中的每個(gè)多媒體資源,根據(jù)所述多媒體資源的各個(gè)關(guān)鍵詞在所述多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定所述各個(gè)關(guān)鍵詞的權(quán)重,其中,所述多媒體資源對應(yīng)的上下文窗口包括在所述多媒體資源列表中與所述多媒體資源相鄰的多個(gè)多媒體資源。

為了解決上述技術(shù)問題,根據(jù)本發(fā)明的另一實(shí)施例,提供了一種確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置,包括:

多媒體資源列表確定模塊,用于根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定所述目標(biāo)用戶對應(yīng)的多媒體資源列表;

權(quán)重確定模塊,用于對于所述多媒體資源列表中的每個(gè)多媒體資源,根據(jù)所述多媒體資源的各個(gè)關(guān)鍵詞在所述多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定所述各個(gè)關(guān)鍵詞的權(quán)重,其中,所述多媒體資源對應(yīng)的上下文窗口包括在所述多媒體資源列表中與所述多媒體資源相鄰的多個(gè)多媒體資源。

有益效果

通過根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法及裝置能夠提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度和效率,降低對于計(jì)算資源的消耗,從而能夠提高多媒體資源的智能推薦與檢索的效果,提高用戶體驗(yàn)。

根據(jù)下面參考附圖對示例性實(shí)施例的詳細(xì)說明,本發(fā)明的其它特征及方面將變得清楚。

附圖說明

包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本發(fā)明的示例性實(shí)施例、特征和方面,并且用于解釋本發(fā)明的原理。

圖1示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的實(shí)現(xiàn)流程圖;

圖2示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法中多媒體資源列表以及各個(gè)多媒體資源對應(yīng)的關(guān)鍵詞的示意圖;

圖3示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的一示例性的實(shí)現(xiàn)流程圖;

圖4示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的另一示例性的實(shí)現(xiàn)流程圖;

圖5示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖;

圖6示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖;

圖7示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置的結(jié)構(gòu)框圖;

圖8示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置的一示例性的結(jié)構(gòu)框圖;

圖9示出了本發(fā)明的另一個(gè)實(shí)施例的一種確定多媒體資源的關(guān)鍵詞的權(quán)重的設(shè)備的結(jié)構(gòu)框圖。

具體實(shí)施方式

以下將參考附圖詳細(xì)說明本發(fā)明的各種示例性實(shí)施例、特征和方面。附圖中相同的附圖標(biāo)記表示功能相同或相似的元件。盡管在附圖中示出了實(shí)施例的各種方面,但是除非特別指出,不必按比例繪制附圖。

在這里專用的詞“示例性”意為“用作例子、實(shí)施例或說明性”。這里作為“示例性”所說明的任何實(shí)施例不必解釋為優(yōu)于或好于其它實(shí)施例。

另外,為了更好的說明本發(fā)明,在下文的具體實(shí)施方式中給出了眾多的具體細(xì)節(jié)。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,沒有某些具體細(xì)節(jié),本發(fā)明同樣可以實(shí)施。在一些實(shí)例中,對于本領(lǐng)域技術(shù)人員熟知的方法、手段、元件和電路未作詳細(xì)描述,以便于凸顯本發(fā)明的主旨。

實(shí)施例1

圖1示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的實(shí)現(xiàn)流程圖。本實(shí)施例的執(zhí)行主體可以為服務(wù)器,在此不作限定。如圖1所示,該方法主要包括:

在步驟S101中,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表。

其中,多媒體可以為多種媒體的綜合,例如可以包括文本、聲音和圖像等多種媒體形式。例如,多媒體資源可以為視頻。

作為本發(fā)明實(shí)施例的一個(gè)示例,可以從最近180天用戶觀看多媒體資源的原始日志數(shù)據(jù)中抽取每個(gè)用戶每天的多媒體資源觀看序列,并可以按照觀看時(shí)間的先后順序進(jìn)行排序,得到各個(gè)用戶對應(yīng)的多媒體資源列表。

在步驟S102中,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,其中,該多媒體資源對應(yīng)的上下文窗口包括在該多媒體資源列表中與該多媒體資源相鄰的多個(gè)多媒體資源。

作為本發(fā)明實(shí)施例的一個(gè)示例,可以根據(jù)各個(gè)多媒體資源的標(biāo)題或內(nèi)容摘要等其他描述文本來確定各個(gè)多媒體資源的關(guān)鍵詞。

圖2示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法中多媒體資源列表以及各個(gè)多媒體資源對應(yīng)的關(guān)鍵詞的示意圖。如圖2所示,該多媒體資源列表包括多媒體資源V1、……、Vi-2、Vi-1、Vi、Vi+1、Vi+2、……、Vn。其中,多媒體資源V1對應(yīng)的關(guān)鍵詞包括T1、T5、T6,多媒體資源Vi-2對應(yīng)的關(guān)鍵詞包括T1、T3,多媒體資源Vi-1對應(yīng)的關(guān)鍵詞包括T1、T2、T4,多媒體資源Vi對應(yīng)的關(guān)鍵詞包括T1、T2、T3,多媒體資源Vi+1對應(yīng)的關(guān)鍵詞包括T1、T3,多媒體資源Vi+2對應(yīng)的關(guān)鍵詞包括T1、T2、T3、T7,多媒體資源Vn對應(yīng)的關(guān)鍵詞包括T8、T9。

作為本發(fā)明實(shí)施例的一個(gè)示例,根據(jù)多媒體資源列表以及預(yù)設(shè)的上下文窗口的長度,可以確定各個(gè)多媒體資源對應(yīng)的上下文窗口。例如,預(yù)設(shè)的上下文窗口的長度為5,則多媒體資源Vi對應(yīng)的上下文窗口包括Vi-2、Vi-1、Vi+1、Vi+2。對于多媒體資源Vi,其關(guān)鍵詞T1在其上下文窗口中出現(xiàn)的次數(shù)為4,其關(guān)鍵詞T2在其上下文窗口中出現(xiàn)的次數(shù)為2,其關(guān)鍵詞T3在其上下文窗口中出現(xiàn)的次數(shù)為3。

多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)反應(yīng)了該關(guān)鍵詞在用戶連續(xù)觀看的多個(gè)多媒體資源中反復(fù)出現(xiàn)的頻率,換言之,如果用戶在短時(shí)間內(nèi)連續(xù)觀看的多個(gè)視頻都包含某一關(guān)鍵詞,則可以認(rèn)為該關(guān)鍵詞表達(dá)了視頻主題,刻畫了用戶興趣,本實(shí)施例提出的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法根據(jù)上述出現(xiàn)次數(shù)來確定關(guān)鍵詞的權(quán)重,使得權(quán)重的確定基于用戶興趣在短時(shí)間內(nèi)的穩(wěn)定性,從而可以適用于視頻內(nèi)容畫像和視頻智能推薦等方面。

通過綜合利用用戶對于多媒體資源的觀看行為數(shù)據(jù)和關(guān)鍵詞的整體分布信息,本發(fā)明實(shí)施例能夠降低多媒體資源上傳者為多媒體資源設(shè)置多個(gè)無關(guān)的熱詞對關(guān)鍵詞權(quán)重確定的準(zhǔn)確度造成的影響,由此能夠提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度,從而能夠提高多媒體資源的智能推薦與檢索的效果,提高用戶體驗(yàn)。

此外,本實(shí)施例無需分析視頻圖像特征,也無需對大規(guī)模的視頻-用戶交互矩陣進(jìn)行矩陣分解,由此能夠降低對于計(jì)算資源的消耗,實(shí)現(xiàn)高效地計(jì)算顯式的多媒體資源的關(guān)鍵詞的權(quán)重。

在一個(gè)種可能的實(shí)現(xiàn)方式中,可以通過如下方式,來根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重:對于多媒體資源的每個(gè)關(guān)鍵詞,若關(guān)鍵詞在多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)越多,則關(guān)鍵詞的權(quán)重越高;若關(guān)鍵詞在多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)越少,則關(guān)鍵詞的權(quán)重越低。通過這樣的方式,本領(lǐng)域技術(shù)人員可根據(jù)需要,采用各種具體手段來根據(jù)上述次數(shù)確定權(quán)重。以下僅出于便于理解的目的,給出一種確定權(quán)重的示例。

在一種可能的實(shí)現(xiàn)方式中,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,包括:采用式1計(jì)算多媒體資源列表中的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重

其中,表示第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞在第i個(gè)多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù),表示第i個(gè)多媒體資源的第k個(gè)關(guān)鍵詞在第i個(gè)多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù),K表示第i個(gè)多媒體資源的關(guān)鍵詞的總個(gè)數(shù),1≤j≤K,1≤k≤K。

例如,對于多媒體資源Vi,其第2個(gè)關(guān)鍵詞T2對于Vi的權(quán)重

圖3示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的一示例性的實(shí)現(xiàn)流程圖。如圖3所示,該方法包括:

在步驟S301中,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表。

在步驟S302中,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,其中,該多媒體資源對應(yīng)的上下文窗口包括在該多媒體資源列表中與該多媒體資源相鄰的多個(gè)多媒體資源。

在步驟S303中,對于該多媒體資源的每個(gè)關(guān)鍵詞,根據(jù)各個(gè)頻道中包含該關(guān)鍵詞的多媒體資源的個(gè)數(shù)計(jì)算該關(guān)鍵詞的頻道分布熵值,該頻道分布熵值表示該關(guān)鍵詞在各個(gè)頻道中分布的集中程度。

作為本發(fā)明實(shí)施例的一個(gè)示例,若該關(guān)鍵詞在各個(gè)頻道中分布的集中程度越低,則該關(guān)鍵詞的頻道分布熵值越高;若該關(guān)鍵詞在各個(gè)頻道中分布的集中程度越高,則該關(guān)鍵詞的頻道分布熵值越低。換言之,該關(guān)鍵詞僅集中出現(xiàn)在少數(shù)頻道中,則認(rèn)為該關(guān)鍵詞在各個(gè)頻道中分布的集中程度較高,從而頻道分布熵值較低;若該關(guān)鍵詞分散分布在各個(gè)頻道中,則認(rèn)為該關(guān)鍵詞在各個(gè)頻道中分布的集中程度較低,從而頻道分布熵值較高。

直觀來說,若某個(gè)關(guān)鍵詞(如“中國”)廣泛分布于不同頻道的多媒體資源(頻道分布熵值高),那么相對于頻道分布更為集中(即頻道分布熵值低)的關(guān)鍵詞(如“三角函數(shù)”)來說,廣泛分布于不同頻道的多媒體資源的關(guān)鍵詞的語義更為分散,可以適當(dāng)降低其權(quán)重;若包含某個(gè)關(guān)鍵詞(如“原創(chuàng)”)的多媒體資源的數(shù)量非常多,那么相對于關(guān)聯(lián)多媒體資源的數(shù)量較少的關(guān)鍵詞(如“汽車?yán)取?來說,關(guān)于多媒體資源的數(shù)量龐大的關(guān)鍵詞的語義表征度較弱,可以適當(dāng)降低其權(quán)重。在本示例中,通過對多媒體資源的關(guān)鍵詞的權(quán)重進(jìn)行優(yōu)化,能夠有效降低歧義詞、頻繁詞的權(quán)重,以突出真正具有表征性的關(guān)鍵詞的權(quán)重,由此進(jìn)一步提高了確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度,從而能夠進(jìn)一步提高多媒體資源的智能推薦與檢索的效果,提高用戶體驗(yàn)。

例如,頻道可以包括搞笑頻道、綜藝頻道和游戲頻道等,在此不作限定。

通過該示例,本領(lǐng)域技術(shù)人員可根據(jù)需要,采用各種具體手段來根據(jù)關(guān)鍵詞在各個(gè)頻道中分布的集中程度確定該關(guān)鍵詞的頻道分布熵值。以下僅出于便于理解的目的,給出一種確定頻道分布熵值的示例。

在一種可能的實(shí)現(xiàn)方式中,對于多媒體資源的每個(gè)關(guān)鍵詞,根據(jù)各個(gè)頻道中包含該關(guān)鍵詞的多媒體資源的個(gè)數(shù)計(jì)算該關(guān)鍵詞的頻道分布熵值,包括:采用式2計(jì)算多媒體資源列表中的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞的頻道分布熵值Hi(j);

其中,

其中,N表示頻道的總個(gè)數(shù),1≤n≤N,1≤m≤N,表示第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞在第n個(gè)頻道的分布比例,表示第n個(gè)頻道中包含第j個(gè)關(guān)鍵詞的多媒體資源的個(gè)數(shù),表示第m個(gè)頻道中包含第j個(gè)關(guān)鍵詞的多媒體資源的個(gè)數(shù)。在該實(shí)現(xiàn)方式中,每個(gè)多媒體資源分別屬于N個(gè)頻道中的任意一個(gè)頻道。

在步驟S304中,根據(jù)該關(guān)鍵詞的頻道分布熵值優(yōu)化該關(guān)鍵詞的權(quán)重。

在一種可能的實(shí)施方式中,根據(jù)該關(guān)鍵詞的頻道分布熵值優(yōu)化該關(guān)鍵詞的權(quán)重可通過如下方式實(shí)現(xiàn):可隨著關(guān)鍵詞的頻道分布熵值升高,降低該關(guān)鍵詞的權(quán)重降低;隨著關(guān)鍵詞的頻道分布熵值降低,提高該關(guān)鍵詞的權(quán)重。通過這種方式,本領(lǐng)域技術(shù)人員可根據(jù)需要,采用各種具體手段來根據(jù)該關(guān)鍵詞的頻道分布熵值優(yōu)化該關(guān)鍵詞的權(quán)重。以下僅出于便于理解的目的,給出一種確定頻道分布熵值的示例。

在一種可能的實(shí)現(xiàn)方式中,根據(jù)該關(guān)鍵詞的頻道分布熵值優(yōu)化該關(guān)鍵詞的權(quán)重,包括:采用式4優(yōu)化第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重;

其中,表示優(yōu)化后的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化前的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重??梢员硎镜趇個(gè)多媒體資源的第j個(gè)關(guān)鍵詞的文檔數(shù),即所有頻道中包含第j個(gè)關(guān)鍵詞的多媒體資源的個(gè)數(shù)。

由式4可知,與Hi(j)負(fù)相關(guān),與負(fù)相關(guān)。

圖4示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法的另一示例性的實(shí)現(xiàn)流程圖。如圖4所示,該方法包括:

在步驟S401中,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表。

在步驟S402中,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在該多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,其中,該多媒體資源對應(yīng)的上下文窗口包括在該多媒體資源列表中與該多媒體資源相鄰的多個(gè)多媒體資源。

在步驟S403中,對于該多媒體資源的每個(gè)關(guān)鍵詞,根據(jù)各個(gè)頻道中包含該關(guān)鍵詞的多媒體資源的個(gè)數(shù)計(jì)算該關(guān)鍵詞的頻道分布熵值。

在步驟S404中,根據(jù)該關(guān)鍵詞的頻道分布熵值優(yōu)化該關(guān)鍵詞的權(quán)重。

在步驟S405中,對優(yōu)化后的權(quán)重進(jìn)行歸一化處理。

在一種可能的實(shí)現(xiàn)方式中,對優(yōu)化后的權(quán)重進(jìn)行歸一化處理,包括:采用式5對優(yōu)化后的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重進(jìn)行歸一化處理;

其中,表示歸一化處理后的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化后的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化后的第i個(gè)多媒體資源的第k個(gè)關(guān)鍵詞對于第i個(gè)多媒體資源的權(quán)重,K表示第i個(gè)多媒體資源的關(guān)鍵詞的總個(gè)數(shù),1≤j≤K,1≤k≤K。

在該示例中,通過對優(yōu)化后的權(quán)重進(jìn)行歸一化處理,使得對于同一個(gè)多媒體資源,其各個(gè)關(guān)鍵詞的權(quán)重之和為1。

圖5示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖。如圖5所示,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,包括:

在步驟S501中,獲取目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)。

例如,可以獲取目標(biāo)用戶最近180天觀看多媒體資源的觀看序列。

在步驟S502中,按照觀看時(shí)間的先后順序?qū)v史數(shù)據(jù)中的各個(gè)多媒體資源進(jìn)行排序。

在步驟S503中,基于排序后的各個(gè)多媒體資源得到目標(biāo)用戶對應(yīng)的多媒體資源列表。

進(jìn)一步地,在一個(gè)示例中,可對排序后的各個(gè)多媒體資源進(jìn)行“清洗”,消除對準(zhǔn)確性和效率產(chǎn)生干擾的多媒體資源后,形成多媒體資源列表。以下給出一些具體的示例,來舉例說明可以如何基于排序后的各個(gè)多媒體資源得到目標(biāo)用戶對應(yīng)的多媒體資源列表。

在一種可能的實(shí)現(xiàn)方式中,基于排序后的各個(gè)多媒體資源得到目標(biāo)用戶對應(yīng)的多媒體資源列表,包括:去除排序后的各個(gè)多媒體資源中播放方式為預(yù)設(shè)方式的多媒體數(shù)據(jù);其中,預(yù)設(shè)方式包括以下至少一項(xiàng):順序連播、隨機(jī)連播、循環(huán)播放和重播。在該實(shí)現(xiàn)方式中,通過去除排序后的各個(gè)多媒體資源中播放方式為預(yù)設(shè)方式的多媒體數(shù)據(jù)來對排序后的多媒體資源進(jìn)行清洗,以提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度。

在一種可能的實(shí)現(xiàn)方式中,基于排序后的各個(gè)多媒體資源得到目標(biāo)用戶對應(yīng)的多媒體資源列表,包括:在排序后的各個(gè)多媒體資源中包括連續(xù)重復(fù)的多媒體資源的情況下,保留連續(xù)重復(fù)的多媒體資源中的一個(gè)多媒體資源。在該實(shí)現(xiàn)方式中,對于排序后的多媒體資源中連續(xù)重復(fù)的多媒體資源,僅保留連續(xù)重復(fù)的多媒體資源中的一個(gè)多媒體資源,由此對排序后的多媒體資源進(jìn)行清洗,以提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度。

在一種可能的實(shí)現(xiàn)方式中,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,還包括:在多媒體資源列表中相鄰的多媒體資源之間的觀看時(shí)間間隔大于預(yù)設(shè)時(shí)長的情況下,在相鄰的多媒體資源之間對多媒體資源列表進(jìn)行切分,得到新的多媒體資源列表。例如,預(yù)設(shè)時(shí)長可以為3小時(shí)。在該實(shí)現(xiàn)方式中,若多媒體資源列表中相鄰的多媒體資源之間的觀看時(shí)間間隔大于預(yù)設(shè)時(shí)長,則在該相鄰的多媒體資源之間對多媒體資源列表進(jìn)行切分,以保證同一多媒體資源列中相鄰的多媒體資源之間的觀看時(shí)間間隔小于或等于預(yù)設(shè)時(shí)長,由此基于用戶興趣在短時(shí)間內(nèi)的穩(wěn)定性進(jìn)行多媒體資源的關(guān)鍵詞的權(quán)重的確定,從而提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度。

在一種可能的實(shí)現(xiàn)方式中,該方法還包括:去除多媒體資源的個(gè)數(shù)不在預(yù)設(shè)區(qū)間內(nèi)的多媒體資源列表。例如,預(yù)設(shè)區(qū)間可以為[2,30],可以去除多媒體資源的個(gè)數(shù)小于2或大于30的多媒體資源列表,以兼顧準(zhǔn)確性和計(jì)算效率。

圖6示出根據(jù)本發(fā)明一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法步驟S101的一示例性的實(shí)現(xiàn)流程圖。如圖6所示,根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,包括:

在步驟S601中,獲取目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)。

在步驟S602中,按照觀看時(shí)間的先后順序?qū)v史數(shù)據(jù)中的各個(gè)多媒體資源進(jìn)行排序。

在步驟S603中,去除排序后的各個(gè)多媒體資源中播放方式為預(yù)設(shè)方式的多媒體數(shù)據(jù);其中,預(yù)設(shè)方式包括以下至少一項(xiàng):順序連播、隨機(jī)連播、循環(huán)播放和重播。

在步驟S604中,在排序后的各個(gè)多媒體資源中包括連續(xù)重復(fù)的多媒體資源的情況下,保留連續(xù)重復(fù)的多媒體資源中的一個(gè)多媒體資源。

在步驟S605中,在多媒體資源列表中相鄰的多媒體資源之間的觀看時(shí)間間隔大于預(yù)設(shè)時(shí)長的情況下,在相鄰的多媒體資源之間對多媒體資源列表進(jìn)行切分,得到新的多媒體資源列表。

在步驟S606中,去除多媒體資源的個(gè)數(shù)不在預(yù)設(shè)區(qū)間內(nèi)的多媒體資源列表。

在該示例中,通過去除排序后的各個(gè)多媒體資源中播放方式為預(yù)設(shè)方式的多媒體數(shù)據(jù)、保留連續(xù)重復(fù)的多媒體資源中的一個(gè)多媒體資源、對多媒體資源列表進(jìn)行切分和去除多媒體資源的個(gè)數(shù)不在預(yù)設(shè)區(qū)間內(nèi)的多媒體資源列表的方式對多媒體資源列表進(jìn)行清洗,以提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度。

這樣,通過根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的方法能夠提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度和效率,降低對于計(jì)算資源的消耗,從而能夠提高多媒體資源的智能推薦與檢索的效果,提高用戶體驗(yàn)。

實(shí)施例2

圖7示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置的結(jié)構(gòu)框圖。如圖7所示,該裝置包括:多媒體資源列表確定模塊71,用于根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定所述目標(biāo)用戶對應(yīng)的多媒體資源列表;權(quán)重確定模塊72,用于對于所述多媒體資源列表中的每個(gè)多媒體資源,根據(jù)所述多媒體資源的各個(gè)關(guān)鍵詞在所述多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定所述各個(gè)關(guān)鍵詞的權(quán)重,其中,所述多媒體資源對應(yīng)的上下文窗口包括在所述多媒體資源列表中與所述多媒體資源相鄰的多個(gè)多媒體資源。

圖8示出根據(jù)本發(fā)明另一實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置的一示例性的結(jié)構(gòu)框圖。圖8中標(biāo)號與圖7相同的組件具有相同的功能,為簡明起見,省略對這些組件的詳細(xì)說明。如圖8所示:

在一種可能的實(shí)現(xiàn)方式中,對于所述多媒體資源的每個(gè)關(guān)鍵詞,若所述關(guān)鍵詞在所述多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)越多,則所述關(guān)鍵詞的權(quán)重越高;若所述關(guān)鍵詞在所述多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)越少,則所述關(guān)鍵詞的權(quán)重越低。

在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:頻道分布熵值計(jì)算模塊73,用于對于所述多媒體資源的每個(gè)關(guān)鍵詞,根據(jù)各個(gè)頻道中包含所述關(guān)鍵詞的多媒體資源的個(gè)數(shù)計(jì)算所述關(guān)鍵詞的頻道分布熵值,所述頻道分布熵值表示所述關(guān)鍵詞在各個(gè)頻道中分布的集中程度;權(quán)重優(yōu)化模塊74,用于根據(jù)所述關(guān)鍵詞的頻道分布熵值優(yōu)化所述關(guān)鍵詞的權(quán)重。

在一種可能的實(shí)現(xiàn)方式中,若所述關(guān)鍵詞在各個(gè)頻道中分布的集中程度越低,則所述關(guān)鍵詞的頻道分布熵值越高;若所述關(guān)鍵詞在各個(gè)頻道中分布的集中程度越高,則所述關(guān)鍵詞的頻道分布熵值越低。

在一種可能的實(shí)現(xiàn)方式中,所述權(quán)重優(yōu)化模塊74用于:隨著關(guān)鍵詞的頻道分布熵值升高,降低所述關(guān)鍵詞的權(quán)重;隨著關(guān)鍵詞的頻道分布熵值降低,提高所述關(guān)鍵詞的權(quán)重。

在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:歸一化模塊75,用于對優(yōu)化后的權(quán)重進(jìn)行歸一化處理。

在一種可能的實(shí)現(xiàn)方式中,所述權(quán)重確定模塊72用于:采用式1計(jì)算所述多媒體資源列表中的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重

其中,表示所述第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞在所述第i個(gè)多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù),表示所述第i個(gè)多媒體資源的第k個(gè)關(guān)鍵詞在所述第i個(gè)多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù),K表示所述第i個(gè)多媒體資源的關(guān)鍵詞的總個(gè)數(shù),1≤j≤K,1≤k≤K。

在一種可能的實(shí)現(xiàn)方式中,所述頻道分布熵值計(jì)算模塊73用于:采用式2計(jì)算所述多媒體資源列表中的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞的頻道分布熵值Hi(j);

其中,

其中,N表示頻道的總個(gè)數(shù),1≤n≤N,1≤m≤N,表示第n個(gè)頻道中包含所述第j個(gè)關(guān)鍵詞的多媒體資源的個(gè)數(shù),表示第m個(gè)頻道中包含所述第j個(gè)關(guān)鍵詞的多媒體資源的個(gè)數(shù)。

在一種可能的實(shí)現(xiàn)方式中,所述權(quán)重優(yōu)化模塊74用于:采用式4優(yōu)化第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重;

其中,表示優(yōu)化后的所述第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化前的所述第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重。

在一種可能的實(shí)現(xiàn)方式中,所述歸一化模塊75用于:采用式5對優(yōu)化后的第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重進(jìn)行歸一化處理;

其中,表示歸一化處理后的所述第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化后的所述第i個(gè)多媒體資源的第j個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重,表示優(yōu)化后的所述第i個(gè)多媒體資源的第k個(gè)關(guān)鍵詞對于所述第i個(gè)多媒體資源的權(quán)重,K表示所述第i個(gè)多媒體資源的關(guān)鍵詞的總個(gè)數(shù),1≤j≤K,1≤k≤K。

在一種可能的實(shí)現(xiàn)方式中,所述多媒體資源列表確定模塊71包括:歷史數(shù)據(jù)獲取子模塊711,用于獲取所述目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù);排序子模塊712,用于按照觀看時(shí)間的先后順序?qū)λ鰵v史數(shù)據(jù)中的各個(gè)多媒體資源進(jìn)行排序;多媒體資源列表確定子模塊713,用于基于排序后的各個(gè)多媒體資源得到所述目標(biāo)用戶對應(yīng)的多媒體資源列表。

在一種可能的實(shí)現(xiàn)方式中,所述多媒體資源列表確定子模塊713包括:去除單元,用于去除所述排序后的各個(gè)多媒體資源中播放方式為預(yù)設(shè)方式的多媒體數(shù)據(jù);其中,所述預(yù)設(shè)方式包括以下至少一項(xiàng):順序連播、隨機(jī)連播、循環(huán)播放和重播。

在一種可能的實(shí)現(xiàn)方式中,所述多媒體資源列表確定子模塊713包括:保留單元,用于在所述排序后的各個(gè)多媒體資源中包括連續(xù)重復(fù)的多媒體資源的情況下,保留連續(xù)重復(fù)的多媒體資源中的一個(gè)多媒體資源。

在一種可能的實(shí)現(xiàn)方式中,所述多媒體資源列表確定模塊71還包括:劃分子模塊714,用于在所述多媒體資源列表中相鄰的多媒體資源之間的觀看時(shí)間間隔大于預(yù)設(shè)時(shí)長的情況下,在所述相鄰的多媒體資源之間對所述多媒體資源列表進(jìn)行切分,得到新的多媒體資源列表。

在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:去除模塊76,用于去除多媒體資源的個(gè)數(shù)不在預(yù)設(shè)區(qū)間內(nèi)的多媒體資源列表。

需要說明的是,這樣,通過根據(jù)目標(biāo)用戶觀看多媒體資源的歷史數(shù)據(jù)確定目標(biāo)用戶對應(yīng)的多媒體資源列表,對于多媒體資源列表中的每個(gè)多媒體資源,根據(jù)多媒體資源的各個(gè)關(guān)鍵詞在多媒體資源對應(yīng)的上下文窗口中出現(xiàn)的次數(shù)確定各個(gè)關(guān)鍵詞的權(quán)重,根據(jù)本發(fā)明實(shí)施例的確定多媒體資源的關(guān)鍵詞的權(quán)重的裝置能夠提高確定多媒體資源的關(guān)鍵詞的權(quán)重的準(zhǔn)確度和效率,降低對于計(jì)算資源的消耗,從而能夠提高多媒體資源的智能推薦與檢索的效果,提高用戶體驗(yàn)。

實(shí)施例3

圖9示出了本發(fā)明的另一個(gè)實(shí)施例的一種確定多媒體資源的關(guān)鍵詞的權(quán)重的設(shè)備的結(jié)構(gòu)框圖。所述確定多媒體資源的關(guān)鍵詞的權(quán)重的設(shè)備1100可以是具備計(jì)算能力的主機(jī)服務(wù)器、個(gè)人計(jì)算機(jī)PC、或者可攜帶的便攜式計(jì)算機(jī)或終端等。本發(fā)明具體實(shí)施例并不對計(jì)算節(jié)點(diǎn)的具體實(shí)現(xiàn)做限定。

所述確定多媒體資源的關(guān)鍵詞的權(quán)重的設(shè)備1100包括處理器(processor)1110、通信接口(Communications Interface)1120、存儲器(memory)1130和總線1140。其中,處理器1110、通信接口1120、以及存儲器1130通過總線1140完成相互間的通信。

通信接口1120用于與網(wǎng)絡(luò)設(shè)備通信,其中網(wǎng)絡(luò)設(shè)備包括例如虛擬機(jī)管理中心、共享存儲等。

處理器1110用于執(zhí)行程序。處理器1110可能是一個(gè)中央處理器CPU,或者是專用集成電路ASIC(Application Specific Integrated Circuit),或者是被配置成實(shí)施本發(fā)明實(shí)施例的一個(gè)或多個(gè)集成電路。

存儲器1130用于存放文件。存儲器1130可能包含高速RAM存儲器,也可能還包括非易失性存儲器(non-volatile memory),例如至少一個(gè)磁盤存儲器。存儲器1130也可以是存儲器陣列。存儲器1130還可能被分塊,并且所述塊可按一定的規(guī)則組合成虛擬卷。

在一種可能的實(shí)施方式中,上述程序可為包括計(jì)算機(jī)操作指令的程序代碼。該程序具體可用于:實(shí)現(xiàn)實(shí)施例1中各步驟的操作。

本領(lǐng)域普通技術(shù)人員可以意識到,本文所描述的實(shí)施例中的各示例性單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來實(shí)現(xiàn)。這些功能究竟以硬件還是軟件形式來實(shí)現(xiàn),取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以針對特定的應(yīng)用選擇不同的方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。

如果以計(jì)算機(jī)軟件的形式來實(shí)現(xiàn)所述功能并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),則在一定程度上可認(rèn)為本發(fā)明的技術(shù)方案的全部或部分(例如對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分)是以計(jì)算機(jī)軟件產(chǎn)品的形式體現(xiàn)的。該計(jì)算機(jī)軟件產(chǎn)品通常存儲在計(jì)算機(jī)可讀取的非易失性存儲介質(zhì)中,包括若干指令用以使得計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各實(shí)施例方法的全部或部分步驟。而前述的存儲介質(zhì)包括U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1