本發(fā)明涉及互聯(lián)網(wǎng)
技術(shù)領(lǐng)域:
,尤其涉及一種多媒體數(shù)據(jù)處理方法以及裝置。
背景技術(shù):
:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各式各樣的應(yīng)用層出不窮,例如,即時通信應(yīng)用、游戲應(yīng)用、多媒體數(shù)據(jù)應(yīng)用等等。以多媒體數(shù)據(jù)應(yīng)用為例,用戶可以通過多媒體數(shù)據(jù)應(yīng)用收聽各式各樣的歌曲,而且也可以通過推測用戶所喜歡的歌曲,以將相應(yīng)歌曲推薦給用戶。目前,推測用戶所喜歡的歌曲的方式可以包括:將用戶所收藏(或下載)的歌曲認(rèn)定為用戶所喜歡的歌曲,因此,可以推測用戶所喜歡的歌曲包括與所收藏(或下載)的歌曲相類似的歌曲,進(jìn)而向用戶推薦這些相類似的歌曲。當(dāng)用戶沒有收藏(或下載)歌曲時,將完整播放完的歌曲認(rèn)定為用戶所喜歡的歌曲,進(jìn)而進(jìn)行相似歌曲的推薦。但是完整播放完的歌曲并不代表是用戶在聽的歌曲(如用戶臨時離開電腦,而電腦中的音樂播放器繼續(xù)播放),進(jìn)而也無法代表是用戶所喜歡的歌曲,所以若直接將完整播放完的歌曲認(rèn)定為用戶所喜歡的歌曲,則無法保證所推薦的歌曲是用戶所喜歡的歌曲,導(dǎo)致推薦效果不佳。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供一種用于多媒體數(shù)據(jù)處理方法以及裝置,可保證所推薦的歌曲是用戶所喜歡的歌曲,以提高推薦效果。本發(fā)明實施例提供了一種多媒體數(shù)據(jù)處理方法,包括:根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理。相應(yīng)地,本發(fā)明實施例還提供了一種多媒體數(shù)據(jù)處理裝置,包括:矩陣生成模塊,用于根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;特征計算模塊,用于基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;推薦模塊,用于當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理。本發(fā)明實施例通過根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,由此可見,隱含特征向量可以準(zhǔn)確表征歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息,且用戶特征向量可以準(zhǔn)確表征一個歷史用戶對多個多媒體數(shù)據(jù)的喜好程度信息,所以通過隱含特征向量和用戶特征向量可以對目標(biāo)用戶實現(xiàn)準(zhǔn)確的個性化推薦,即可保證所推薦的歌曲是目標(biāo)用戶所喜歡的歌曲,以提高推薦效果。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例提供的一種網(wǎng)絡(luò)架構(gòu)的示意圖;圖2是本發(fā)明實施例提供的一種多媒體數(shù)據(jù)處理方法的流程示意圖;圖3是本發(fā)明實施例提供的另一種多媒體數(shù)據(jù)處理方法的流程示意圖;圖4是本發(fā)明實施例提供的一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;圖5是本發(fā)明實施例提供的一種特征計算模塊的結(jié)構(gòu)示意圖;圖6是本發(fā)明實施例提供的一種推薦模塊的結(jié)構(gòu)示意圖;圖7是本發(fā)明實施例提供的一種隱含特征生成單元的結(jié)構(gòu)示意圖;圖8是本發(fā)明實施例提供的一種用戶特征生成單元的結(jié)構(gòu)示意圖;圖9是本發(fā)明實施例提供的另一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。具體實施方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。請參見圖1,是本發(fā)明實施例提供的一種網(wǎng)絡(luò)架構(gòu)的示意圖。所述網(wǎng)絡(luò)架構(gòu)可以包括后臺服務(wù)器和多個客戶端,各個客戶端均可以通過網(wǎng)絡(luò)與所述后臺服務(wù)器連接,所述后臺服務(wù)器可以將各個客戶端分別對應(yīng)的用戶確定為歷史用戶群,所述后臺服務(wù)器還可以收集各個客戶端分別對應(yīng)的操作行為(如某客戶端的聽歌行為,具體包括該客戶端對應(yīng)的用戶所收聽過的歌曲)。因此,所述后臺服務(wù)器可以根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息。當(dāng)某個客戶端向所述后臺服務(wù)器發(fā)送推薦請求時,所述后臺服務(wù)器可以獲取多個與該客戶端對應(yīng)的目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理。請參見圖2,是本發(fā)明實施例提供的一種多媒體數(shù)據(jù)處理方法的流程示意圖,所述方法可以包括:S101,根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;具體的,基于多媒體數(shù)據(jù)應(yīng)用的后臺服務(wù)器可以獲取歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為。所述多媒體數(shù)據(jù)庫可以為音樂庫,每一個多媒體數(shù)據(jù)均可以為音樂庫中的一首歌,因此,所述操作行為可以包括所述歷史用戶群中的各歷史用戶對各個多媒體數(shù)據(jù)的收聽行為,所述收聽行為包括已收聽行為和未收聽行為,并且所述后臺服務(wù)器可以為不同的收聽行為設(shè)置不同的特征值,以生成與所述操作行為相應(yīng)的多媒體數(shù)據(jù)操作行為矩陣。如下表1所示的歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為的特征表:歌曲1歌曲2歌曲3歌曲4…用戶11001…用戶21110…用戶30010…用戶41111…………………表1其中,表1中的特征值“1”表示該用戶收聽過這首歌曲,特征值“0”表示該用戶未收聽過這首歌曲,如用戶1與歌曲1之間的特征值為“1”,則說明用戶1收聽過歌曲1;又如用戶3與歌曲2之間的特征值為“0”,則說明用戶3未收聽過歌曲2。因此,根據(jù)表1中的所有特征值即可生成與所述操作行為相應(yīng)的多媒體數(shù)據(jù)操作行為矩陣,即所述多媒體數(shù)據(jù)操作行為矩陣中的元素Pui可以表示用戶u對歌曲i的收聽行為對應(yīng)的特征值(Pui=1,說明用戶u收聽過歌曲i;Pui=0,說明用戶u未收聽歌曲i)。S102,基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;具體的,所述后臺服務(wù)器可以將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層,即將所述多媒體數(shù)據(jù)操作行為矩陣中的各個收聽行為對應(yīng)的特征值輸入到所述輸入層中;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標(biāo)參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點(diǎn);所述隱藏節(jié)點(diǎn)的數(shù)量可以通過平衡所述后臺服務(wù)器的計算效率和用戶/歌曲的特征描述準(zhǔn)確性,以推測出來(可以根據(jù)經(jīng)驗值推測)。其中,所述輸入層的維度與所述輸出層的維度相同。所述稀疏自編碼器可以根據(jù)所述輸入層中的參數(shù)(即所述多媒體數(shù)據(jù)操作行為矩陣)以及預(yù)設(shè)的用于訓(xùn)練所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)的目標(biāo)函數(shù),對所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)進(jìn)行偏導(dǎo)數(shù)訓(xùn)練;其中,所述目標(biāo)函數(shù)可以為:其中,x是所述多媒體數(shù)據(jù)操作行為矩陣;A是由W1(1)、W2(1)、W3(1)、……、Wk+1(1)組成的矩陣,W1(1)、W2(1)、W3(1)、……、Wk+1(1)分別為K+1個隱藏節(jié)點(diǎn)中的隱藏參數(shù)(如W1(1)表示第一個隱藏節(jié)點(diǎn)的隱藏參數(shù)),且K+1個隱藏節(jié)點(diǎn)中的最后一個隱藏節(jié)點(diǎn)為截距項,該截距項的隱藏參數(shù)為1,通過保留該截距項可以重構(gòu)出所述輸出層。s是由bN1、bN2、bN3、……、bNK組成的矩陣,bN1、bN2、bN3、……、bNK是所述隱藏層到所述輸出層之間的目標(biāo)參數(shù),N為輸入層的維度,本發(fā)明實施例中,已指定了隱藏節(jié)點(diǎn)數(shù)K+1,可對隱藏層稀疏要求放寬,因此將s的1范數(shù)近似為2范數(shù)。其中,由于有些用戶雖然沒有對某些歌曲進(jìn)行收聽行為,但是并不代表這些用戶不喜歡這些歌曲,同樣的,即使有些用戶聽過某些歌曲,也不能直接表示這些用戶喜歡這些歌曲,所以本發(fā)明實施例通過在所述目標(biāo)函數(shù)中的增加了一個用戶興趣因子項C,以提高所訓(xùn)練出來的所述隱藏層中的s矩陣與用戶對歌曲的喜好程度之間的關(guān)聯(lián)關(guān)系;所述用戶興趣因子項C包括所述各歷史用戶分別對所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)的興趣值cui(cui表示用戶u對歌曲i的興趣值);一個興趣值是基于一個歷史用戶對一個多媒體數(shù)據(jù)的操作行為類型、操作次數(shù)以及完整操作率計算得到的。其中,對所述用戶興趣因子項C中的各個興趣值cui的計算公式可以為:cui=1+αlog(1+εrui);其中,當(dāng)用戶u直接收藏/下載歌曲i時,rui=1;當(dāng)用戶u僅僅是收聽過歌曲i時(即沒有收藏/下載操作),rui=[min(nui,5)/5]*fui,其中,nui是指用戶u收聽歌曲i的次數(shù),fui是完整收聽率(即所述完整操作率),fui=完整收聽歌曲i的人數(shù)/所有聽歌人數(shù)(即所述歷史用戶群);當(dāng)用戶u沒有收聽過歌曲i時,cui=0。所述稀疏自編碼器在進(jìn)行偏導(dǎo)數(shù)訓(xùn)練的過程中可以重復(fù)交替執(zhí)行步驟S1和步驟S2;步驟S1為:固定A,對s求導(dǎo),用最小二乘法得到最優(yōu)解;步驟S2為:固定s,對A求導(dǎo),用最小二乘法得到最優(yōu)解。進(jìn)一步的,當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近(即輸出層的參數(shù)與所述輸入層的參數(shù)之間的匹配度達(dá)到預(yù)設(shè)匹配度閾值)時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,此時所述稀疏自編碼器停止執(zhí)行步驟S1和步驟S2,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)組合成隱含特征矩陣,即所述隱含特征矩陣為訓(xùn)練后的矩陣A。為了保證后臺服務(wù)器的工作效率,因此,所述稀疏自編碼器中的隱藏層的維度是要小于所述輸入層的維度,所以所述隱藏層中的隱藏參數(shù)也可以視為所述輸入層中的參數(shù)的壓縮形式,即所述隱含特征矩陣為所述多媒體數(shù)據(jù)操作行為矩陣對應(yīng)的壓縮矩陣;其中,所述隱含特征矩陣包括各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量,例如,可以將所述隱含特征矩陣的第一列特征確定為歌曲1的隱含特征向量,將所述隱含特征矩陣的第二列特征確定為歌曲2的隱含特征向量等等,其中,歌曲1的隱含特征向量可以表征為所述歷史用戶群對歌曲1的喜好程度信息。進(jìn)一步的,由于所述稀疏自編碼器的數(shù)量為一個,所以可以從所述稀疏自編碼器中訓(xùn)練后的目標(biāo)參數(shù)對應(yīng)的參數(shù)矩陣s中提取出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量。所述后臺服務(wù)器計算出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量以及所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量后,可以存儲各個用戶特征向量和各個隱含特征向量,以便于后續(xù)根據(jù)用戶特征向量和隱含特征向量進(jìn)行用戶個性化的歌曲推薦。S103,當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理;具體的,當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,可以檢測目標(biāo)用戶對應(yīng)的個人操作行為信息中是否包含已收藏的多媒體數(shù)據(jù);若檢測為包含已收藏的多媒體數(shù)據(jù),則獲取所述已收藏的多媒體數(shù)據(jù)(即推薦源)對應(yīng)的第一相似多媒體數(shù)據(jù),并將所述第一相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù);若檢測為未包含已收藏的多媒體數(shù)據(jù),則進(jìn)一步判斷所述個人操作行為信息中是否包含已完整操作的多媒體數(shù)據(jù)(即完整收聽的歌曲)。當(dāng)所述目標(biāo)用戶對應(yīng)的個人操作行為信息中包含已完整操作的多媒體數(shù)據(jù)時,將所述目標(biāo)用戶對應(yīng)的用戶特征向量與所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到個性化特征值,并當(dāng)所述個性化特征值大于預(yù)設(shè)特征值閾值時,獲取所述已完整操作的多媒體數(shù)據(jù)(即推薦源)對應(yīng)的第二相似多媒體數(shù)據(jù),并將所述第二相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)??蛇x的,當(dāng)所述目標(biāo)用戶對應(yīng)的個人操作行為信息不包含已完整操作的多媒體數(shù)據(jù)時,獲取多個候選多媒體數(shù)據(jù),并將所述標(biāo)用戶對應(yīng)的用戶特征向量分別與各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到所述各候選多媒體數(shù)據(jù)分別對應(yīng)的個性化特征值;按照各個性化特征值從大到小的順序?qū)λ龆鄠€候選多媒體數(shù)據(jù)進(jìn)行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)。例如,若用戶A的個人操作行為信息不包含已完整收聽的歌曲,且候選歌曲包括歌曲A、歌曲B以及歌曲C,則可以將用戶A的用戶特征向量與歌曲A的隱含特征向量進(jìn)行點(diǎn)乘,得到個性化特征值a;將用戶A的用戶特征向量與歌曲B的隱含特征向量進(jìn)行點(diǎn)乘,得到個性化特征值b;將用戶A的用戶特征向量與歌曲C的隱含特征向量進(jìn)行點(diǎn)乘,得到個性化特征值c;對個性化特征值進(jìn)行排序后,得到b>c>a,若預(yù)設(shè)推薦數(shù)量為2,則可以將個性化特征值b對應(yīng)的歌曲B和個性化特征值c對應(yīng)的歌曲C推薦給用戶A??蛇x的,在計算所述個性化特征值時,還可以參考顯性特征值,即用戶u對歌曲i的個性化特征值=用戶u對歌曲i的顯性特征值+用戶u的用戶特征向量與歌曲i的隱含特征向量的點(diǎn)乘結(jié)果。所述顯示特征值可以根據(jù)歌曲的標(biāo)簽和用戶的標(biāo)簽之間的匹配度計算得到;歌曲的標(biāo)簽可以包括該歌曲對應(yīng)的曲風(fēng)類型、語種類型、節(jié)奏類型等等;用戶的標(biāo)簽可以包括該用戶所喜歡的曲風(fēng)類型、語種類型、節(jié)奏類型等等。通過增加所述顯性特征值,可以使所述個性化特征值能夠更準(zhǔn)確的描述用戶u對歌曲i的喜好程度??蛇x的,當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群不包含所述目標(biāo)用戶時,說明所述目標(biāo)用戶還未在后臺服務(wù)器所提供的多媒體數(shù)據(jù)平臺上收聽過歌曲,則可以按照所述各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量的向量值從大到小的順序?qū)λ龆鄠€候選多媒體數(shù)據(jù)進(jìn)行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)??蛇x的,所述后臺服務(wù)器可以周期性的根據(jù)新的操作行為計算和更新各歷史用戶分別對應(yīng)的用戶特征向量,以及各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量,使得在對目標(biāo)用戶進(jìn)行推薦時,可以保證所獲取到的與所述目標(biāo)用戶相關(guān)的隱含特征向量和用戶特征向量是始終貼合用戶的興趣變化,即可以保證所計算出的個性化特征值的準(zhǔn)確性。其中,所述目標(biāo)用戶每聽一首歌曲,均可更新一次所述目標(biāo)用戶的推薦源,以便于后續(xù)在向所述目標(biāo)用戶推薦歌曲時,可以直接獲取與最近更新的推薦源相似的多媒體數(shù)據(jù),以將相似的多媒體數(shù)據(jù)推薦給用戶,以提高推薦效率;而在客戶端的用戶界面上可以顯示“歌曲B是根據(jù)你試聽的歌曲A推薦”,其中,歌曲A即為推薦源,歌曲B即為與推薦源相似的多媒體數(shù)據(jù)。本發(fā)明實施例通過根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,由此可見,隱含特征向量可以準(zhǔn)確表征歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息,且用戶特征向量可以準(zhǔn)確表征一個歷史用戶對多個多媒體數(shù)據(jù)的喜好程度信息,所以通過隱含特征向量和用戶特征向量可以對目標(biāo)用戶實現(xiàn)準(zhǔn)確的個性化推薦,即可保證所推薦的歌曲是目標(biāo)用戶所喜歡的歌曲,以提高推薦效果。再請參見圖3,是本發(fā)明實施例提供的另一種多媒體數(shù)據(jù)處理方法的流程示意圖,所述方法可以包括:S201,根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;具體的,S201步驟的具體實現(xiàn)方式可以參見上述圖2對應(yīng)實施例中的S101,這里不再進(jìn)行贅述。S202,將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標(biāo)參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點(diǎn);具體的,所述后臺服務(wù)器可以將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層,即將所述多媒體數(shù)據(jù)操作行為矩陣中的各個收聽行為對應(yīng)的特征值輸入到所述輸入層中;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標(biāo)參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點(diǎn);所述隱藏節(jié)點(diǎn)的數(shù)量可以通過平衡所述后臺服務(wù)器的計算效率和用戶/歌曲的特征描述準(zhǔn)確性,以推測出來(可以根據(jù)經(jīng)驗值推測)。其中,所述輸入層的維度與所述輸出層的維度相同。S203,所述稀疏自編碼器根據(jù)所述輸入層中的參數(shù)以及預(yù)設(shè)的用于訓(xùn)練所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)的目標(biāo)函數(shù),對所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)進(jìn)行偏導(dǎo)數(shù)訓(xùn)練;所述稀疏自編碼器可以根據(jù)所述輸入層中的參數(shù)(即所述多媒體數(shù)據(jù)操作行為矩陣)以及預(yù)設(shè)的用于訓(xùn)練所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)的目標(biāo)函數(shù),對所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)進(jìn)行偏導(dǎo)數(shù)訓(xùn)練;其中,所述目標(biāo)函數(shù)可以為:其中,x是所述多媒體數(shù)據(jù)操作行為矩陣;A是由W1(1)、W2(1)、W3(1)、……、Wk+1(1)組成的矩陣,W1(1)、W2(1)、W3(1)、……、Wk+1(1)分別為K+1個隱藏節(jié)點(diǎn)中的隱藏參數(shù)(如W1(1)表示第一個隱藏節(jié)點(diǎn)的隱藏參數(shù)),且K+1個隱藏節(jié)點(diǎn)中的最后一個隱藏節(jié)點(diǎn)為截距項,該截距項的隱藏參數(shù)為1,通過保留該截距項可以重構(gòu)出所述輸出層。s是由bN1、bN2、bN3、……、bNK組成的矩陣,bN1、bN2、bN3、……、bNK是所述隱藏層到所述輸出層之間的目標(biāo)參數(shù),N為輸入層的維度,本發(fā)明實施例中,已指定了隱藏節(jié)點(diǎn)數(shù)K+1,可對隱藏層稀疏要求放寬,因此將s的1范數(shù)近似為2范數(shù)。其中,由于有些用戶雖然沒有對某些歌曲進(jìn)行收聽行為,但是并不代表這些用戶不喜歡這些歌曲,同樣的,即使有些用戶聽過某些歌曲,也不能直接表示這些用戶喜歡這些歌曲,所以本發(fā)明實施例通過在所述目標(biāo)函數(shù)中的增加了一個用戶興趣因子項C,以提高所訓(xùn)練出來的所述隱藏層中的s矩陣與用戶對歌曲的喜好程度之間的關(guān)聯(lián)關(guān)系;所述用戶興趣因子項C包括所述各歷史用戶分別對所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)的興趣值cui(cui表示用戶u對歌曲i的興趣值);一個興趣值是基于一個歷史用戶對一個多媒體數(shù)據(jù)的操作行為類型、操作次數(shù)以及完整操作率計算得到的。其中,對所述用戶興趣因子項C中的各個興趣值cui的計算公式可以為:cui=1+αlog(1+εrui);其中,當(dāng)用戶u直接收藏/下載歌曲i時,rui=1;當(dāng)用戶u僅僅是收聽過歌曲i時(即沒有收藏/下載操作),rui=[min(nui,5)/5]*fui,其中,nui是指用戶u收聽歌曲i的次數(shù),fui是完整收聽率(即所述完整操作率),fui=完整收聽歌曲i的人數(shù)/所有聽歌人數(shù)(即所述歷史用戶群);當(dāng)用戶u沒有收聽過歌曲i時,cui=0。所述稀疏自編碼器在進(jìn)行偏導(dǎo)數(shù)訓(xùn)練的過程中可以重復(fù)交替執(zhí)行步驟S1和步驟S2;步驟S1為:固定A,對s求導(dǎo),用最小二乘法得到最優(yōu)解;步驟S2為:固定s,對A求導(dǎo),用最小二乘法得到最優(yōu)解。S204,當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)確定為目標(biāo)輸入源;具體的,所述后臺服務(wù)器也可以預(yù)設(shè)至少兩個稀疏自編碼器,當(dāng)?shù)谝粋€稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,即第一個稀疏自編碼器完成訓(xùn)練,此時,可以將第一個稀疏自編碼器中滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)確定為目標(biāo)輸入源。S205,根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標(biāo)輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標(biāo)函數(shù)訓(xùn)練所述目標(biāo)輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標(biāo)輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù);具體的,所述后臺服務(wù)器可以進(jìn)一步根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標(biāo)輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標(biāo)函數(shù)訓(xùn)練所述目標(biāo)輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標(biāo)輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù)。其中,第一個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為一階特征參數(shù),第二個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為二階特征參數(shù),以此類推,第n個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為n階特征參數(shù),n值越大,則n階特征參數(shù)可以越精確的描述用戶對多媒體數(shù)據(jù)的喜好程度。其中,所述第一個稀疏自編碼器中的目標(biāo)函數(shù)可以包含所述用戶興趣因子項C,而除了所述第一個稀疏自編碼器以外的其他稀疏自編碼器中的目標(biāo)函數(shù)可以不包含所述用戶興趣因子項C。其中,每個稀疏自編碼器的收斂條件都是相同的,即收斂條件都是為所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近。S206,將所述最后一個稀疏自編碼器訓(xùn)練出的隱藏參數(shù)組合為隱含特征矩陣;S207,當(dāng)所述稀疏自編碼器的數(shù)量為至少兩個時,獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量;具體的,當(dāng)所述稀疏自編碼器的數(shù)量為至少兩個時,可以獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量。例如,歷史用戶A對應(yīng)的個人操作行為信息可以包括用戶A所收聽過的歌曲,被用戶A收聽過的歌曲可以包括歌曲1、歌曲2、歌曲3,則歷史用戶A對應(yīng)的用戶特征向量可以為歌曲1的隱含特征向量、歌曲2的隱含特征向量以及歌曲3的隱含特征向量的平均向量。S208,當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理;其中,S208步驟的具體實現(xiàn)方式可以參見上述圖2對應(yīng)實施例中的S101,這里不再進(jìn)行贅述。本發(fā)明實施例通過根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,由此可見,隱含特征向量可以準(zhǔn)確表征歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息,且用戶特征向量可以準(zhǔn)確表征一個歷史用戶對多個多媒體數(shù)據(jù)的喜好程度信息,所以通過隱含特征向量和用戶特征向量可以對目標(biāo)用戶實現(xiàn)準(zhǔn)確的個性化推薦,即可保證所推薦的歌曲是目標(biāo)用戶所喜歡的歌曲,以提高推薦效果。請參見圖4,是本發(fā)明實施例提供的一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。所述多媒體數(shù)據(jù)處理裝置1可以應(yīng)用于后臺服務(wù)器中,所述多媒體數(shù)據(jù)處理裝置1可以包括:矩陣生成模塊10、特征計算模塊20、推薦模塊30;所述矩陣生成模塊10,用于根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;具體的,所述矩陣生成模塊10可以獲取歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為。所述多媒體數(shù)據(jù)庫可以為音樂庫,每一個多媒體數(shù)據(jù)均可以為音樂庫中的一首歌,因此,所述操作行為可以包括所述歷史用戶群中的各歷史用戶對各個多媒體數(shù)據(jù)的收聽行為,所述收聽行為包括已收聽行為和未收聽行為,所述矩陣生成模塊10可以為不同的收聽行為設(shè)置不同的特征值,以生成與所述操作行為相應(yīng)的多媒體數(shù)據(jù)操作行為矩陣。再以上述圖2對應(yīng)實施例中的表1為例,表1中的特征值“1”表示該用戶收聽過這首歌曲,特征值“0”表示該用戶未收聽過這首歌曲,如用戶1與歌曲1之間的特征值為“1”,則說明用戶1收聽過歌曲1;又如用戶3與歌曲2之間的特征值為“0”,則說明用戶3未收聽過歌曲2。因此,所述矩陣生成模塊10根據(jù)所述表1中的所有特征值即可生成與所述操作行為相應(yīng)的多媒體數(shù)據(jù)操作行為矩陣,即所述多媒體數(shù)據(jù)操作行為矩陣中的元素Pui可以表示用戶u對歌曲i的收聽行為對應(yīng)的特征值(Pui=1,說明用戶u收聽過歌曲i;Pui=0,說明用戶u未收聽歌曲i)。所述特征計算模塊20,用于基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;具體的,請一并參見圖5,是所述特征計算模塊20的結(jié)構(gòu)示意圖,所述特征計算模塊20可以包括:輸入單元201、訓(xùn)練單元202、隱含特征生成單元203、用戶特征生成單元204;所述輸入單元201,用于將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標(biāo)參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點(diǎn);所述訓(xùn)練單元202,用于控制所述稀疏自編碼器根據(jù)所述輸入層中的參數(shù)以及預(yù)設(shè)的用于訓(xùn)練所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)的目標(biāo)函數(shù),對所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)進(jìn)行偏導(dǎo)數(shù)訓(xùn)練;所述隱含特征生成單元203,用于當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)組合成隱含特征矩陣;所述隱含特征矩陣為所述多媒體數(shù)據(jù)操作行為矩陣對應(yīng)的壓縮矩陣,所述隱含特征矩陣包括各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量;所述用戶特征生成單元204,用于根據(jù)訓(xùn)練后的目標(biāo)參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量;其中,當(dāng)所述稀疏自編碼器的數(shù)量為一個時,所計算出來的隱藏參數(shù)為一階特征參數(shù),即所述隱含特征矩陣包括所述一階特征參數(shù)。所述輸入單元201、所述訓(xùn)練單元202、所述隱含特征生成單元203、所述用戶特征生成單元204的具體實現(xiàn)方式可以參見上述圖2對應(yīng)實施例中的S102,這里不再進(jìn)行贅述。所述推薦模塊30,用于當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理;具體的,請一并參見圖6,是所述推薦模塊30的結(jié)構(gòu)示意圖,所述推薦模塊30可以包括:檢測單元301、相似推薦單元302、獲取判斷單元303、點(diǎn)乘運(yùn)算單元304、排序推薦單元305;所述檢測單元301,用于當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,檢測目標(biāo)用戶對應(yīng)的個人操作行為信息中是否包含已收藏的多媒體數(shù)據(jù);所述相似推薦單元302,用于若所述檢測單元301檢測為包含已收藏的多媒體數(shù)據(jù),則獲取所述已收藏的多媒體數(shù)據(jù)對應(yīng)的第一相似多媒體數(shù)據(jù),并將所述第一相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù);所述獲取判斷單元303,用于若所述檢測單元301檢測為未包含已收藏的多媒體數(shù)據(jù),則進(jìn)一步判斷所述個人操作行為信息中是否包含已完整操作的多媒體數(shù)據(jù);所述點(diǎn)乘運(yùn)算單元304,用于當(dāng)所述個人操作行為信息中包含已完整操作的多媒體數(shù)據(jù)時,將所述目標(biāo)用戶對應(yīng)的用戶特征向量與所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到個性化特征值;所述相似推薦單元302,還用于當(dāng)所述個性化特征值大于預(yù)設(shè)特征值閾值時,獲取所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的第二相似多媒體數(shù)據(jù),并將所述第二相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù);所述點(diǎn)乘運(yùn)算單元304,還用于當(dāng)所述個人操作行為信息不包含已完整操作的多媒體數(shù)據(jù)時,獲取多個候選多媒體數(shù)據(jù),將所述標(biāo)用戶對應(yīng)的用戶特征向量分別與各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到所述各候選多媒體數(shù)據(jù)分別對應(yīng)的個性化特征值;所述排序推薦單元305,用于按照各個性化特征值對所述多個候選多媒體數(shù)據(jù)進(jìn)行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù);其中,所述檢測單元301、所述相似推薦單元302、所述獲取判斷單元303、所述點(diǎn)乘運(yùn)算單元304、所述排序推薦單元305的具體實現(xiàn)方式可以參見上述圖2對應(yīng)實施例中的S103,這里不再進(jìn)行贅述??蛇x的,所述推薦模塊30在計算所述個性化特征值時,還可以參考顯性特征值,即用戶u對歌曲i的個性化特征值=用戶u對歌曲i的顯性特征值+用戶u的用戶特征向量與歌曲i的隱含特征向量的點(diǎn)乘結(jié)果。所述顯示特征值可以根據(jù)歌曲的標(biāo)簽和用戶的標(biāo)簽之間的匹配度計算得到;歌曲的標(biāo)簽可以包括該歌曲對應(yīng)的曲風(fēng)類型、語種類型、節(jié)奏類型等等;用戶的標(biāo)簽可以包括該用戶所喜歡的曲風(fēng)類型、語種類型、節(jié)奏類型等等。通過增加所述顯性特征值,可以使所述個性化特征值能夠更準(zhǔn)確的描述用戶u對歌曲i的喜好程度??蛇x的,當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群不包含所述目標(biāo)用戶時,說明所述目標(biāo)用戶還未在后臺服務(wù)器所提供的多媒體數(shù)據(jù)平臺上收聽過歌曲,則所述推薦模塊30可以按照所述各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量的向量值從大到小的順序?qū)λ龆鄠€候選多媒體數(shù)據(jù)進(jìn)行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)??蛇x的,所述特征計算模塊20可以周期性的根據(jù)新的操作行為計算和更新各歷史用戶分別對應(yīng)的用戶特征向量,以及各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量,使得在對目標(biāo)用戶進(jìn)行推薦時,可以保證所獲取到的與所述目標(biāo)用戶相關(guān)的隱含特征向量和用戶特征向量是始終貼合用戶的興趣變化,即可以保證所述推薦模塊30所計算出的個性化特征值的準(zhǔn)確性。其中,所述目標(biāo)用戶每聽一首歌曲,所述推薦模塊30均可更新一次所述目標(biāo)用戶的推薦源,以便于后續(xù)在向所述目標(biāo)用戶推薦歌曲時,所述推薦模塊30可以直接獲取與最近更新的推薦源相似的多媒體數(shù)據(jù),以將相似的多媒體數(shù)據(jù)推薦給用戶,以提高推薦效率;而在客戶端的用戶界面上可以顯示“歌曲B是根據(jù)你試聽的歌曲A推薦”,其中,歌曲A即為推薦源,歌曲B即為與推薦源相似的多媒體數(shù)據(jù)。進(jìn)一步的,請一并參見圖7,是本發(fā)明實施例提供的一種隱含特征生成單元203的結(jié)構(gòu)示意圖,所述隱含特征生成單元203包括:確定子單元2031、深度學(xué)習(xí)子單元2032、組合子單元2033;所述確定子單元2031,用于當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)確定為目標(biāo)輸入源;所述深度學(xué)習(xí)子單元2032,用于根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標(biāo)輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標(biāo)函數(shù)訓(xùn)練所述目標(biāo)輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標(biāo)輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù);所述組合子單元2033,用于將所述最后一個稀疏自編碼器訓(xùn)練出的隱藏參數(shù)組合為隱含特征矩陣;其中,第一個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為一階特征參數(shù),第二個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為二階特征參數(shù),以此類推,第n個稀疏自編碼器所訓(xùn)練出的隱藏參數(shù)可以稱為n階特征參數(shù),n值越大,則n階特征參數(shù)可以越精確的描述用戶對多媒體數(shù)據(jù)的喜好程度。所述確定子單元2031、所述深度學(xué)習(xí)子單元2032、所述組合子單元2033的具體實現(xiàn)方式可以參見上述圖3對應(yīng)實施例中的S204-S206,這里不再進(jìn)行贅述。進(jìn)一步的,再請一并參見圖8,是本發(fā)明實施例提供的一種用戶特征生成單元204的結(jié)構(gòu)示意圖,所述用戶特征生成單元204包括:提取子單元2041、平均計算子單元2042;所述提取子單元2041,用于當(dāng)所述稀疏自編碼器的數(shù)量為一個時,從所述稀疏自編碼器中訓(xùn)練后的目標(biāo)參數(shù)對應(yīng)的參數(shù)矩陣中提取出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量;所述平均計算子單元2042,用于當(dāng)所述稀疏自編碼器的數(shù)量為至少兩個時,獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量;具體的,當(dāng)所述稀疏自編碼器的數(shù)量為至少兩個時,所述平均計算子單元2042可以獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量。例如,歷史用戶A對應(yīng)的個人操作行為信息可以包括用戶A所收聽過的歌曲,被用戶A收聽過的歌曲可以包括歌曲1、歌曲2、歌曲3,則歷史用戶A對應(yīng)的用戶特征向量可以為歌曲1的隱含特征向量、歌曲2的隱含特征向量以及歌曲3的隱含特征向量的平均向量。本發(fā)明實施例通過根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,由此可見,隱含特征向量可以準(zhǔn)確表征歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息,且用戶特征向量可以準(zhǔn)確表征一個歷史用戶對多個多媒體數(shù)據(jù)的喜好程度信息,所以通過隱含特征向量和用戶特征向量可以對目標(biāo)用戶實現(xiàn)準(zhǔn)確的個性化推薦,即可保證所推薦的歌曲是目標(biāo)用戶所喜歡的歌曲,以提高推薦效果。請參見圖9,是本發(fā)明實施例提供的另一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。如圖9所示,所述多媒體數(shù)據(jù)處理裝置1000可以應(yīng)用于后臺服務(wù)器中,所述多媒體數(shù)據(jù)處理裝置1000可以包括:至少一個處理器1001,例如CPU,至少一個網(wǎng)絡(luò)接口1004,用戶接口1003,存儲器1005,至少一個通信總線1002。其中,通信總線1002用于實現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(Display)、鍵盤(Keyboard),可選用戶接口1003還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如WI-FI接口)。存儲器1005可以是高速RAM存儲器,也可以是非不穩(wěn)定的存儲器(non-volatilememory),例如至少一個磁盤存儲器。存儲器1005可選的還可以是至少一個位于遠(yuǎn)離前述處理器1001的存儲裝置。如圖9所示,作為一種計算機(jī)存儲介質(zhì)的存儲器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及設(shè)備控制應(yīng)用程序。在圖9所示的多媒體數(shù)據(jù)處理裝置1000中,網(wǎng)絡(luò)接口1004主要用于連接客戶端,以向客戶端推薦多媒體數(shù)據(jù);而用戶接口1003主要用于為用戶提供輸入的接口,獲取用戶輸出的數(shù)據(jù);而處理器1001可以用于調(diào)用存儲器1005中存儲的設(shè)備控制應(yīng)用程序,以實現(xiàn)根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理。在一個實施例中,所述處理器1001在執(zhí)行基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量時,具體執(zhí)行以下步驟:將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標(biāo)參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點(diǎn);控制所述稀疏自編碼器根據(jù)所述輸入層中的參數(shù)以及預(yù)設(shè)的用于訓(xùn)練所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)的目標(biāo)函數(shù),對所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)進(jìn)行偏導(dǎo)數(shù)訓(xùn)練;當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)組合成隱含特征矩陣;所述隱含特征矩陣為所述多媒體數(shù)據(jù)操作行為矩陣對應(yīng)的壓縮矩陣,所述隱含特征矩陣包括各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量;根據(jù)訓(xùn)練后的目標(biāo)參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量。在一個實施例中,所述處理器1001在執(zhí)行當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)組合成隱含特征矩陣時,具體執(zhí)行以下步驟:當(dāng)所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標(biāo)參數(shù)和所述隱藏節(jié)點(diǎn)的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點(diǎn)的隱藏參數(shù)確定為目標(biāo)輸入源;根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標(biāo)輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標(biāo)函數(shù)訓(xùn)練所述目標(biāo)輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標(biāo)輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù);將所述最后一個稀疏自編碼器訓(xùn)練出的隱藏參數(shù)組合為隱含特征矩陣。在一個實施例中,所述目標(biāo)函數(shù)包括預(yù)設(shè)的用戶興趣因子項,所述用戶興趣因子項包括所述各歷史用戶分別對所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)的興趣值;一個興趣值是基于一個歷史用戶對一個多媒體數(shù)據(jù)的操作行為類型、操作次數(shù)以及完整操作率計算得到的。在一個實施例中,所述處理器1001在執(zhí)行根據(jù)訓(xùn)練后的目標(biāo)參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量時,具體執(zhí)行以下步驟:當(dāng)所述稀疏自編碼器的數(shù)量為一個時,從所述稀疏自編碼器中訓(xùn)練后的目標(biāo)參數(shù)對應(yīng)的參數(shù)矩陣中提取出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量;當(dāng)所述稀疏自編碼器的數(shù)量為至少兩個時,獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量。在一個實施例中,所述處理器1001在執(zhí)行當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,獲取所述目標(biāo)用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標(biāo)用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進(jìn)行推薦處理時,具體執(zhí)行以下步驟:當(dāng)接收到與目標(biāo)用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標(biāo)用戶時,檢測目標(biāo)用戶對應(yīng)的個人操作行為信息中是否包含已收藏的多媒體數(shù)據(jù);若檢測為包含已收藏的多媒體數(shù)據(jù),則獲取所述已收藏的多媒體數(shù)據(jù)對應(yīng)的第一相似多媒體數(shù)據(jù),并將所述第一相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù);若檢測為未包含已收藏的多媒體數(shù)據(jù),則進(jìn)一步判斷所述個人操作行為信息中是否包含已完整操作的多媒體數(shù)據(jù);當(dāng)所述個人操作行為信息中包含已完整操作的多媒體數(shù)據(jù)時,將所述目標(biāo)用戶對應(yīng)的用戶特征向量與所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到個性化特征值;當(dāng)所述個性化特征值大于預(yù)設(shè)特征值閾值時,獲取所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的第二相似多媒體數(shù)據(jù),并將所述第二相似多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)。在一個實施例中,所述處理器1001還執(zhí)行以下步驟:當(dāng)所述個人操作行為信息不包含已完整操作的多媒體數(shù)據(jù)時,獲取多個候選多媒體數(shù)據(jù),將所述標(biāo)用戶對應(yīng)的用戶特征向量分別與各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進(jìn)行點(diǎn)乘運(yùn)算,得到所述各候選多媒體數(shù)據(jù)分別對應(yīng)的個性化特征值;按照各個性化特征值對所述多個候選多媒體數(shù)據(jù)進(jìn)行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標(biāo)用戶的推薦數(shù)據(jù)。本發(fā)明實施例通過根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣,并基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,由此可見,隱含特征向量可以準(zhǔn)確表征歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息,且用戶特征向量可以準(zhǔn)確表征一個歷史用戶對多個多媒體數(shù)據(jù)的喜好程度信息,所以通過隱含特征向量和用戶特征向量可以對目標(biāo)用戶實現(xiàn)準(zhǔn)確的個性化推薦,即可保證所推薦的歌曲是目標(biāo)用戶所喜歡的歌曲,以提高推薦效果。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-OnlyMemory,ROM)或隨機(jī)存儲記憶體(RandomAccessMemory,RAM)等。以上所揭露的僅為本發(fā)明較佳實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。當(dāng)前第1頁1 2 3