能的實現(xiàn)方式,在 第二方面的第四種可能的實現(xiàn)方式中,所述第一確定模塊,用于根據(jù)所述對數(shù)似然的期望 值、所述正則項的期望值及所述各個隱變量的變分分布的對數(shù)的期望值確定目標(biāo)函數(shù)。
[0062] 結(jié)合第二方面的第四種可能的實現(xiàn)方式,在第二方面的第五種可能的實現(xiàn)方式 中,所述第一確定模塊確定的目標(biāo)函數(shù)「(樂豕''氣八心;I為:
[0063]
[0064] 結(jié)合第二方面的第五種可能的實現(xiàn)方式,在第二方面的第六種可能的實現(xiàn)方式 中,所述第二確定模塊,包括:
[0065] 獲取單元,用于獲取更新的各個隱變量的變分分布及更新的模型參數(shù);
[0066] 確定單元,用于根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定所述目 標(biāo)函數(shù)是否收斂;
[0067] 所述獲取單元,用于當(dāng)所述目標(biāo)函數(shù)未收斂時,重新獲取更新的各個隱變量的變 分分布及更新的模型參數(shù),直至得到使所述目標(biāo)函數(shù)收斂的各個隱變量的變分分布及模型 參數(shù)。
[0068] 結(jié)合第二方面的第六種可能的實現(xiàn)方式,在第二方面的第走種可能的實現(xiàn)方式 中,所述獲取單元,包括:
[0069] 第一更新子單元,用于按照如下公式交替更新各個隱變量的變分分布,直至得到 收斂的更新的各個隱變量的變分分布:
[0070]
[0072] 第二更新子單元,用于根據(jù)收斂的更新的各個隱變量的變分分布按照如下公式更 新模型參數(shù),得到更新的模型參數(shù):
所述t代表當(dāng)前更新,所述t-1代表上一次更新或初始化。
[0076] 結(jié)合第二方面的第六種可能的實現(xiàn)方式,在第二方面的第八種可能的實現(xiàn)方式 中,所述獲取單元,包括:
[0077] 第H更新子單元,用于按照如下公式更新模型參數(shù),得到更新的模型參數(shù):
[0078]
[0081] 第四更新子單元,用于根據(jù)更新的模型參數(shù)按照如下公式交替更新各個隱變量的 變分分布,得到收斂的更新的各個隱變量的變分分布:
[0082]
[0084] 其中,所述t代表當(dāng)前更新,所述t-1代表上一次更新或初始化。
[0085] 結(jié)合第二方面的第六種至第八種可能的實現(xiàn)方式中任一種可能的實現(xiàn)方式,在第 二方面的第九種可能的實現(xiàn)方式中,所述確定單元,包括:
[0086] 比較子單元,用于比較根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定 的目標(biāo)函數(shù)與上一次得到的目標(biāo)函數(shù)之間的距離是否小于闊值,所述上一次得到的目標(biāo)函 數(shù)根據(jù)上一次更新的各個隱變量的變分分布及更新的模型參數(shù)確定;
[0087] 確定子單元,用于當(dāng)根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定的 目標(biāo)函數(shù)與上一次得到的目標(biāo)函數(shù)之間的距離小于闊值時,確定所述目標(biāo)函數(shù)收斂。
[0088] 本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0089] 通過根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型參數(shù)確定的對數(shù) 似然、正則項及各個隱變量的變分分布的對數(shù)確定目標(biāo)函數(shù),并根據(jù)使目標(biāo)函數(shù)收斂的各 個隱變量的變分分布及模型參數(shù)確定關(guān)系模型,提高了關(guān)系模型的確定效率和精度,由于 采用正則項,因而可W對模型的復(fù)雜度進行自動控制,提高模型的確定效率。
【附圖說明】
[0090] 為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可W根據(jù)該些附圖獲得其他 的附圖。
[0091] 圖1是本發(fā)明實施例一提供的關(guān)系模型的確定方法的流程圖;
[0092] 圖2是本發(fā)明實施例二提供的關(guān)系模型的確定方法的流程圖;
[0093] 圖3是本發(fā)明實施例H提供的關(guān)系模型的確定裝置的結(jié)構(gòu)示意圖;
[0094] 圖4是本發(fā)明實施例H提供的第二確定模塊的結(jié)構(gòu)示意圖;
[0095] 圖5是本發(fā)明實施例H提供的第一種獲取單元的結(jié)構(gòu)示意圖;
[0096] 圖6是本發(fā)明實施例H提供的第二種獲取單元的結(jié)構(gòu)示意圖;
[0097] 圖7是本發(fā)明實施例H提供的確定單元的結(jié)構(gòu)示意圖。
【具體實施方式】
[0098] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方 式作進一步地詳細描述。
[0099] 實施例一
[0100] 本發(fā)明實施例提供了一種關(guān)系模型的確定方法,參見圖1,方法流程包括:
[0101] 101 ;獲取根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型參數(shù)確定的 對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù);
[0102] 作為一種可選實施例,根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型 參數(shù)確定的對數(shù)似然為:
[0103]
[0104] 其中,1〇甜0表示對數(shù)似然,P表示聯(lián)合概率密度函數(shù),X'VA為樣本數(shù)據(jù),Nr為行 樣本個數(shù),N。為列樣本個數(shù),AE為行樣本屬性,為列樣本屬性,ZE為行隱變量,為列隱變 量,0為模型參數(shù)的集合,模型參數(shù)包括a、目、#、n、S,a、目分別為行、列混合比率, 資表示每個樣本類別內(nèi)的子模型參數(shù),n表示每個樣本類別內(nèi)的行樣本屬性的模型參數(shù), 客表示每個樣本類別內(nèi)的列樣本屬性的模型參數(shù)。
[0105] 作為一種可選實施例,根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型 參數(shù)確定的正則項為:
[0106]
[0107] 其中,Nf為行樣本個數(shù),N。為列樣本個數(shù);Kf是行樣本類別的個數(shù),K。是列樣本 類別的個數(shù);霉0為隱變量的變分分布的近似值,為描述第i個行樣本數(shù)據(jù)對第P個 行樣本類別的隸屬關(guān)系的行隱變量,為描述第j個列樣本數(shù)據(jù)對第q個列樣本類別的 隸屬關(guān)系的列隱變量;a,目分別為行、列混合比率,D。為a的維度,Dg為目的維度; Dp。為第P行、第q列的樣本類別內(nèi)的子模型參數(shù)的維度;n。為第P個行樣本類別內(nèi)的行 樣本屬性的模型參數(shù),線,為n。的維度;S。為第q個列樣本類別內(nèi)的列樣本屬性的模 型參數(shù),^為 S q 的維度;L(a, b)=logb+(a-b)/b,
中
[010引作為一種可選實施例,根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型 參數(shù)確定的隱變量的變分分布的對數(shù)為:
[0109] logq 狂E)和 logq 狂G);
[0110] 其中,q狂E)為行隱變量ZE的變分分布,q仿)為列隱變量的變分分布。
[0111] 102 ;根據(jù)對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù)確定目標(biāo)函數(shù);
[0112] 作為一種可選實施例,根據(jù)對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù)確 定目標(biāo)函數(shù),包括:
[0113] 根據(jù)對數(shù)似然的期望值、正則項的期望值及各個隱變量的變分分布的對數(shù)的期望 值確定目標(biāo)函數(shù)。
[0114] 作為一種可選實施例,根據(jù)對數(shù)似然的期望值、正則項的期望值及各個隱變量的 變分分布的對數(shù)的期望值確定的目標(biāo)函數(shù)r(;f,豕代為:
[011 引
[0116] 103;確定使目標(biāo)函數(shù)收斂的各個隱變量的變分分布及模型參數(shù),根據(jù)使目標(biāo)函數(shù) 收斂的各個隱變量的變分分布及模型參數(shù)確定關(guān)系模型。
[0117] 作為一種可選實施例,確定使目標(biāo)函數(shù)收斂的各個隱變量的變分分布及模型參 數(shù),包括:
[0118] 獲取更新的各個隱變量的變分分布及更新的模型參數(shù);
[0119] 根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定目標(biāo)函數(shù)是否收斂,女口 果目標(biāo)函數(shù)未收斂,則重新獲取更新的各個隱變量的變分分布及更新的模型參數(shù),直至得 到使目標(biāo)函數(shù)收斂的各個隱變量的變分分布及模型參數(shù)。
[0120] 作為一種可選實施例,獲取更新的各個隱變量的變分分布及更新的模型參數(shù),包 括:
[0121] 按照如下公式交替更新各個隱變量的變分分布,直至得到收斂的更新的各個隱變 量的變分分布:
[0122]
[0124] 根據(jù)收斂的更新的各個隱變量的變分分布按照如下公式更新模型參數(shù),得到更新 的模型參數(shù):
表當(dāng)前更新,t-1代表上一次更新或初始化。
[0130] 作為一種可選實施例,獲取更新的各個隱變量的變分分布及更新的模型參數(shù),包 括:
[0131] 按照如下公式更新模型參數(shù),得到更新的模型參數(shù):
[0134]
[0137] 根據(jù)更新的模型參數(shù)按照如下公式交替更新各個隱變量的變分分布,得到收斂的 更新的各個隱變量的變分分布:
[013 引
[0140] 其中,t代表當(dāng)前更新,t-1代表上一次更新或初始化。
[0141] 作為一種可選實施例,根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定 目標(biāo)函數(shù)是否收斂,包括:
[0142] 比較根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù)與上 一次得到的目標(biāo)函數(shù)之間的距離是否小于闊值,上一次得到的目標(biāo)函數(shù)根據(jù)上一次更新的 各個隱變量的變分分布及更新的模型參數(shù)確定;
[0143] 如果根據(jù)更新的各個隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù)與上 一次得到的目標(biāo)函數(shù)之間的距離小于闊值,則確定目標(biāo)函數(shù)收斂。
[0144] 本發(fā)明實施例提供的方法,通過根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變 量及模型參數(shù)確定的對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù)確定目標(biāo)函數(shù),并 根據(jù)使目標(biāo)函數(shù)收斂的各個隱變量的變分分布及模型參數(shù)確定關(guān)系模型,提高了關(guān)系模型 的確定效率和精度,由于采用正則項,因而可W對模型的復(fù)雜度進行自動控制,提高模型的 確定效率。
[0145] 實施例二
[0146] 本發(fā)明實施例提供了一種關(guān)系模型的確定方法,結(jié)合上述實施例一的內(nèi)容,對本 發(fā)明實施例提供的方法進行詳細地解釋說明,參見圖2,方法流程包括:
[0147] 201 ;獲取根據(jù)樣本數(shù)據(jù)、至少兩組樣本屬性、至少兩組隱變量及模型參數(shù)確定的 對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù);
[014引關(guān)于樣本數(shù)據(jù)的內(nèi)容及維度,本實施例不作具體限定。具體實施時,樣本數(shù)據(jù)可W 為多個用戶對多個電影的評分,則樣本數(shù)據(jù)的維度可W為2,即從用戶和電影該兩個維度對 評分進行統(tǒng)計。當(dāng)然,樣本數(shù)據(jù)除了上述內(nèi)容及維度外,還可W為其他內(nèi)容及維度。
[0149]為了便于理解,W如下所示的樣本數(shù)據(jù)為例進行說明。該樣本數(shù)據(jù)W 5巧矩陣的 形式表示,矩陣的行表示用戶1至用戶5,矩陣的列表示電影1至電影5,矩陣中的任一元素X。表示用戶i對電影j的評分;其中1《i《5,1《j《5, i和j均為整數(shù)。
[0150]
[0151] 樣本屬性包括但不限于行樣本屬性及列樣本屬性等,本實施例不對樣本屬性的具 體內(nèi)容進行限定。具體實施時,樣本屬性可W為樣本數(shù)據(jù)對應(yīng)的對象的屬性。為了便于理 解,仍W上述樣本數(shù)據(jù)為例進行說明。行樣本屬性可W為行樣本數(shù)據(jù)對應(yīng)的用戶的屬性,例 女口,年齡、性別等;列樣本屬性可W為列樣本數(shù)據(jù)對應(yīng)的電影的