目標(biāo)函數(shù)未收斂,則重新獲取更新的隱變量的變分分布及更新的模型參數(shù),直至得到使 所述目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù)。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述獲取更新的隱變量的變分分布及更 新的模型參數(shù),包括: 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,并根據(jù)更新的隱 變量的變分分布獲取更新的模型參數(shù)。9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)更新的隱變量的變分分布獲取 更新的模型參數(shù)之前,還包括: 確定所述更新的隱變量的變分分布是否收斂,如果所述更新的隱變量的變分分布未收 斂,則重新根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,直至得到 收斂的更新的隱變量的變分分布; 所述根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù),包括: 根據(jù)所述收斂的更新的隱變量的變分分布獲取更新的模型參數(shù)。10. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述獲取更新的隱變量的變分分布及更 新的模型參數(shù),包括: 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),并根據(jù)更新的模型參數(shù)獲 取更新的隱變量的變分分布。11. 根據(jù)權(quán)利要求10所述的方法,其特征在于,所述根據(jù)更新的模型參數(shù)獲取更新的 隱變量的變分分布之前,還包括: 確定所述更新的模型參數(shù)是否收斂,如果所述更新的模型參數(shù)未收斂,則重新根據(jù)從 樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),直至得到收斂的更新的模型參數(shù); 所述根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布,包括: 根據(jù)所述收斂的更新的模型參數(shù)獲取更新的隱變量的變分分布。12. 根據(jù)權(quán)利要求7至9中任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)從樣本數(shù) 據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,包括: 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新行隱變量的變分分布,直至t3等于Ti時(shí),根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新列隱變量的變分分布直至t4等于T2時(shí),交替更新導(dǎo)位廣::1和g(巧fy,直至達(dá)到預(yù)設(shè)終止條件時(shí),g(巧嚴(yán)=<^但)'",交替更新g位產(chǎn)和9(巧產(chǎn),,直至達(dá)到預(yù)設(shè)終止條件時(shí),^篇產(chǎn)'-9(巧f,所述g(巧產(chǎn) 為更新的行隱變量的變分分布,所述為更新的列隱變量的變分分布; 所述根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù),包括: 根據(jù)更新的隱變量的變分分布按照如下公式獲取模型參數(shù)af和片^':根據(jù)更新的隱變量的變分分布W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭 代更新模型參數(shù);貨和辦'為更新的模型參數(shù);所述tl代表當(dāng)前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述tit,代表當(dāng) 前交替更新行隱變量的變分分布及列隱變量的變分分布,所述代表當(dāng)前迭代更新行 隱變量的變分分布,所述代表當(dāng)前迭代更新列隱變量的變分分布,所述titg代表當(dāng) 前迭代更新模型參數(shù),所述tl-1代表上一次獲取更新的隱變量的變分分布及更新的模型 參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述代表上一次交替更新行隱變量 的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變分分布, 所述代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分分布,所 述代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分布,所述 titg-1代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。13.根據(jù)權(quán)利要求根據(jù)權(quán)利要求7、10或11所述的方法,其特征在于,所述根據(jù)從樣本 數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),包括: 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式獲取模型參數(shù)afii和:根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新模型參數(shù)所述根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布,包括: 根據(jù)更新的模型參數(shù)W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新行 隱變量的變分分布廣W:根據(jù)更新的模型參數(shù)W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新列 隱變量的變分分布廣…:交替更新9(Z^心和9(馬)心,直至達(dá)到預(yù)設(shè)終止條件時(shí),g(為(巧fi, g(巧r'-9(z;,f',所述¥(苗r為更新的行隱變量的變分分布,所述g(巧產(chǎn)為更新的 列隱變量的變分分布;所述ti'代表當(dāng)前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述tit' 2代表當(dāng) 前交替更新行隱變量的變分分布及列隱變量的變分分布,所述3代表當(dāng)前迭代更新行 隱變量的變分分布,所述4代表當(dāng)前迭代更新列隱變量的變分分布,所述tit'g代表當(dāng) 前迭代更新模型參數(shù),所述tl' -1代表上一次獲取更新的隱變量的變分分布及更新的模型 參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述tit'2-1代表上一次交替更新行隱變量 的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變分分布, 所述3-1代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分分布,所 述4-1代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分布,所述 tit'5-1代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。14.根據(jù)權(quán)利要求7至13中任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)更新的隱 變量的變分分布及更新的模型參數(shù)確定所述目標(biāo)函數(shù)是否收斂,包括: 比較根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù)與上一次得到 的目標(biāo)函數(shù)之間的距離是否小于闊值,所述上一次得到的目標(biāo)函數(shù)根據(jù)上一次更新的隱變 量的變分分布及更新的模型參數(shù)確定; 如果根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù)與上一次得到 的目標(biāo)函數(shù)之間的距離小于闊值,則確定所述目標(biāo)函數(shù)收斂。15. -種關(guān)系模型的確定裝置,其特征在于,所述裝置包括: 獲取模塊,用于獲取根據(jù)樣本數(shù)據(jù)、至少兩個(gè)隱變量及模型參數(shù)確定的對(duì)數(shù)似然、正則 項(xiàng)及各個(gè)隱變量的變分分布的對(duì)數(shù),每個(gè)隱變量用于說明樣本數(shù)據(jù)擁有的特征; 第一確定模塊,用于根據(jù)所述對(duì)數(shù)似然、正則項(xiàng)及各個(gè)隱變量的變分分布的對(duì)數(shù)確定 目標(biāo)函數(shù); 第二確定模塊,用于確定使所述目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù); 第H確定模塊,用于根據(jù)使所述目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù)確定關(guān) 系模型。16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述獲取模塊獲取到對(duì)數(shù)似然為:其中,所述logp0表示對(duì)數(shù)似然,所述P表示聯(lián)合概率密度函數(shù),所述為樣本數(shù) 據(jù),所述Nf為行樣本個(gè)數(shù),所述N。為列樣本個(gè)數(shù),所述ZE為行隱變量,所述為列隱變量, 所述0為模型參數(shù)的集合,所述模型參數(shù)包括a、片?所述a、目分別為行、列混合比 率,所述表示模型參數(shù)。17. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述獲取模塊獲取到的正則項(xiàng)為:其中,所述Nf為行樣本個(gè)數(shù),所述N。為列樣本個(gè)數(shù);所述Kf是行特征的個(gè)數(shù),所述K。是 列特征的個(gè)數(shù);所述#()為隱變量的變分分布的近似值,所述Zf為第i個(gè)行樣本數(shù)據(jù)擁有 第k個(gè)行特征的行隱變量,所述Zj,為第j個(gè)列樣本數(shù)據(jù)擁有第1個(gè)列特征的列隱變量;所 述a,目分別為行、列混合比率,所述隸示模型參數(shù),所述D。為所述a的維度,所述Dg為所述目的維度,所述A為所述的維度,L(a,b)=logb+(a-b)/b,所述 D竄 V 所述b為18. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述獲取模塊獲取到的隱變量的變分 分布的對(duì)數(shù)為: logq狂E)和logq狂勺; 其中,所述q狂E)為行隱變量ZE的變分分布,所述q狂K)為列隱變量的變分分布。19. 根據(jù)權(quán)利要求15至18中任一權(quán)利要求所述的裝置,其特征在于,所述第一確定模 塊,用于根據(jù)所述對(duì)數(shù)似然的期望值、所述正則項(xiàng)的期望值及各個(gè)隱變量的變分分布的對(duì) 數(shù)的期望值確定目標(biāo)函數(shù)。20. 根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述第一確定模塊確定的目標(biāo)函數(shù)21. 根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述第二確定模塊,包括: 獲取單元,用于獲取更新的隱變量的變分分布及更新的模型參數(shù); 確定單元,用于根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定所述目標(biāo)函數(shù)是 否收斂; 所述獲取單元,用于當(dāng)所述目標(biāo)函數(shù)未收斂時(shí),重新獲取更新的隱變量的變分分布及 更新的模型參數(shù),直至得到使所述目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù)。22. 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述獲取單元,包括: 第一獲取子單元,用于根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分 分布; 第二獲取子單元,用于根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù)。23. 根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述獲取單元,還包括: 第一確定子單元,用于確定所述更新的隱變量的變分分布是否收斂; 所述第一獲取子單元,用于當(dāng)所述更新的隱變量的變分分布未收斂時(shí),重新根據(jù)從樣 本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,直至得到收斂的更新的隱變量 的變分分布; 所述第二獲取子單元,用于根據(jù)所述收斂的更新的隱變量的變分分布獲取更新的模型 參數(shù)。24. 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述獲取單元,包括: 第H獲取子單元,用于根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù); 第四獲取子單元,用于根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布。25. 根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述獲取單元,還包括: 第二確定子單元,用于確定所述更新的模型參數(shù)是否收斂; 所述第H獲取子單元,用于當(dāng)所述更新的模型參數(shù)未收斂時(shí),重新根據(jù)從樣本數(shù)據(jù)中 抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),直至得到收斂的更新的模型參數(shù); 所述第四獲取子單元,用于根據(jù)所述收斂的更新的模型參數(shù)獲取更新的隱變量的變分 分布。26. 根據(jù)權(quán)利要求21至23中任一權(quán)利要求所述的裝置,其特征在于,所述第一獲取子 單元,用于根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新行隱變量的變分分 布9位嚴(yán):直至等于Ti時(shí),根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新列隱變量的變分分布 /如\(¥如 9腳:直至t4等于T2時(shí),交替更新3 (對(duì)fy和g(巧廣':i,直至達(dá)到預(yù)設(shè)終止條件時(shí),£/ (zf廣(對(duì)f', 每(巧fy=(/(瑞r,所述y但)hi為更新的行隱變量的變分分布,所述每片r為更新的 列隱變量的變分分布; 所述第二獲取子單元,用于根據(jù)更新的隱變量的變分分布按照如下公式獲取更新的模 型參數(shù)山^1和公尸|>: i *根據(jù)更新的隱變量的變分分布W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭 代更新模型參數(shù)產(chǎn):直至t日等于Ts時(shí),= W自I,所述激 和M滬為更新的模型參數(shù);所述tl代表當(dāng)前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述tit,代表當(dāng) 前交替更新行隱變量的變分分布及列隱變量的變分分布,所述代表當(dāng)前迭代更新行 隱變量的變分分布,所述代表當(dāng)前迭代更新列隱變量的變分分布,所述titg代表當(dāng) 前迭代更新模型參數(shù),所述tl-1代表上一次獲取更新的隱變量的變分分布及更新的模型 參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述代表上一次交替更新行隱變量 的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變分分布, 所述代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分分布,所 述代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分布,所述 titg-1代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。27.根據(jù)權(quán)利要求根據(jù)權(quán)利要求21、24或25所述的裝置,其特征在于,所述第H獲取子 單元,用于根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式獲取模型參數(shù)根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新模型參數(shù)Mf'y:,直至ts等于T3'時(shí),喊y=I墻',所述a('|i、伴I哺 W滬為更新的模型參數(shù); 所述第四獲取子單元,用于根據(jù)更新的模型參數(shù)W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù) 按照如下公式迭代更新行隱變量的變分分布fbw:直至t3等于V時(shí),根據(jù)更新的模型參數(shù)W及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新列 隱變量的變分分布每巧,下'…:?直至t4等于T2'時(shí),交替更新fw和霉(馬;f^,直至達(dá)到預(yù)設(shè)終止條件時(shí),^馬;f?"'=每(巧f'?, g(Z;,p' =g(馬;f',所述g(Zf)(''i為更新的行隱變量的變分分布,所述馬;)…為更新的 列隱變量的變分分布;所述ti'代表當(dāng)前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述tit' 2代表當(dāng) 前交替更新行隱變量的變分分布及列隱變量的變分分布,所述3代表當(dāng)前迭代更新行 隱變量的變分分布,所述4代表當(dāng)前迭代更新列隱變量的變分分布,所述tit'g代表當(dāng) 前迭代更新模型參數(shù),所述tl' -1代表上一次獲取更新的隱變量的變分分布及更新的模型 參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述tit'2-1代表上一次交替更新行隱變量 的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變分分布, 所述3-1代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分分布,所 述4-1代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分布,所述 tit' 5-1代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。28.根據(jù)權(quán)利要求21至27中任一權(quán)利要求所述的裝置,其特征在于,所述第H確定模 塊,包括: 比較單元,用于比較根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù) 與上一次得到的目標(biāo)函數(shù)之間的距離是否小于闊值,所述上一次得到的目標(biāo)函數(shù)根據(jù)上一 次更新的隱變量的變分分布及更新的模型參數(shù)確定; 確定單元,用于當(dāng)根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標(biāo)函數(shù)與 上一次得到的目標(biāo)函數(shù)之間的距離小于闊值時(shí),確定所述目標(biāo)函數(shù)收斂。
【專利摘要】本發(fā)明公開了一種關(guān)系模型的確定方法及裝置,屬于統(tǒng)計(jì)技術(shù)領(lǐng)域。方法包括:獲取根據(jù)樣本數(shù)據(jù)、至少兩個(gè)用于說明樣本數(shù)據(jù)擁有的特征的隱變量及模型參數(shù)確定的對(duì)數(shù)似然、正則項(xiàng)及各個(gè)隱變量的變分分布的對(duì)數(shù);根據(jù)對(duì)數(shù)似然、正則項(xiàng)及各個(gè)隱變量的變分分布的對(duì)數(shù)確定目標(biāo)函數(shù);確定使目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù),根據(jù)使目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù)確定關(guān)系模型。本發(fā)明通過根據(jù)對(duì)數(shù)似然、正則項(xiàng)及各個(gè)隱變量的變分分布的對(duì)數(shù)確定目標(biāo)函數(shù)后,根據(jù)使目標(biāo)函數(shù)收斂的隱變量的變分分布及模型參數(shù)確定關(guān)系模型,提高了關(guān)系模型的確定效率和精度,由于采用正則項(xiàng),因而可以對(duì)模型的復(fù)雜度進(jìn)行自動(dòng)控制,提高模型的確定效率。
【IPC分類】G06F17/18
【公開號(hào)】CN104933014
【申請(qǐng)?zhí)枴緾N201410101228
【發(fā)明人】馮璐, 劉春辰, 藤巻遼平, 中臺(tái)慎二
【申請(qǐng)人】日本電氣株式會(huì)社
【公開日】2015年9月23日
【申請(qǐng)日】2014年3月18日