亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

關系模型的確定方法及裝置的制造方法

文檔序號:9217155閱讀:713來源:國知局
關系模型的確定方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及統(tǒng)計技術領域,特別涉及一種關系模型的確定方法及裝置。
【背景技術】
[0002] 隨著統(tǒng)計技術的不斷發(fā)展,對對象間的關系信息進行建模成為了一個熱點問題。 其中,對象間的關系信息多種多樣,例如被調查人群中人與人之間的聯(lián)系信息,因特網(wǎng)上 頁面與頁面之間的鏈接關系信息等等。各種各樣的關系信息描述了一類對象內的相互關 系或是多類對象間的關系,通過對關系信息進行分析,可以獲得很多有價值的信息。也正 因為如此,基于關系信息的應用種類越來越多,將不同樣本數(shù)據(jù)根據(jù)關系信息進行關系聚 類即是其中的一種。而在關系聚類的過程中,通常會用到關系模型。例如,如果某電影公司 想要獲取用戶對當前上映的一系列電影的評價,則收集一批用戶對上映的一系列電影的評 分,通過關系模型將用戶和電影分到不同的類別內,實現(xiàn)對用戶、電影和電影評分同時進行 聚類,從而通過聚類結果進行電影評價分析。然而在實際應用中,同一樣本數(shù)據(jù)可能同時擁 有多個特征,給關系聚類帶來困難。因此,如何確定關系模型成為了目前研究關系聚類的關 鍵。
[0003] 在實際應用中,關系模型由隱變量的變分分布和模型參數(shù)確定。隱變量是指不 能被直接觀測到,而需要通過樣本數(shù)據(jù)推導得出的變量,隱變量的變分分布用于描述樣本 數(shù)據(jù)被聚類到對應類別的概率;模型參數(shù)用于描述每個類別下子模型的參數(shù)。目前,文章 Findingmixed-membershipsinsocialnetworks,Koutsourelakisetal.,AAAI, 2008中 給出了一種通過采樣確定隱變量的變分分布和模型參數(shù)的方式。該方式下,從樣本數(shù)據(jù)中 有放回地抽取預設數(shù)目次至少一個樣本數(shù)據(jù),根據(jù)初始化的隱變量的變分分布及模型參數(shù) 確定抽取的每個樣本數(shù)據(jù)所擁有的特征,獲取根據(jù)每個樣本數(shù)據(jù)所擁有的特征更新的隱變 量的變分分布及模型參數(shù),根據(jù)更新的隱變量的變分分布及模型參數(shù)確定關系模型。
[0004] 在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術至少存在以下問題:
[0005] 由于從樣本數(shù)據(jù)中有放回地抽取預設數(shù)目次至少一個樣本數(shù)據(jù),并根據(jù)初始化的 隱變量的變分分布及模型參數(shù)確定抽取的每個樣本數(shù)據(jù)所擁有的特征,即需要重復抽取樣 本數(shù)據(jù)及確定每個樣本數(shù)據(jù)所擁有的特征,致使確定關系模型的效率較低。

【發(fā)明內容】

[0006] 為了解決現(xiàn)有技術的問題,本發(fā)明實施例提供了一種關系模型的確定方法及裝 置。所述技術方案如下:
[0007] 第一方面,提供了一種關系模型的確定方法,所述方法包括:
[0008] 獲取根據(jù)樣本數(shù)據(jù)、至少兩個隱變量及模型參數(shù)確定的對數(shù)似然、正則項及各個 隱變量的變分分布的對數(shù),每個隱變量用于說明樣本數(shù)據(jù)擁有的特征;
[0009] 根據(jù)所述對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù)確定目標函數(shù);
[0010] 確定使所述目標函數(shù)收斂的隱變量的變分分布及模型參數(shù),根據(jù)使所述目標函數(shù) 收斂的隱變量的變分分布及模型參數(shù)確定關系模型。
[0011] 結合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,根據(jù)所述樣本數(shù)據(jù)、至少 兩個隱變量及模型參數(shù)確定的對數(shù)似然為:
[0013] 其中,所述logp0表示對數(shù)似然,所述P表示聯(lián)合概率密度函數(shù),所述為樣本 數(shù)據(jù),所述隊為行樣本個數(shù),所述N。為列樣本個數(shù),所述ZK為行隱變量,所述Ze為列隱變 量,所述Q為模型參數(shù)的集合,所述模型參數(shù)包括a、#、所述a分別為行、列混合 比率,所述f表示模型參數(shù)。
[0014] 結合第一方面,在第一方面的第二種可能的實現(xiàn)方式中,根據(jù)樣本數(shù)據(jù)、至少兩個 隱變量及模型參數(shù)確定的正則項為:
[0016] 其中,所述隊為行樣本個數(shù),所述N。為列樣本個數(shù);所述&是行特征的個數(shù),所述 K。是列特征的個數(shù);所述外)為隱變量的變分分布的近似值,所述Z|為第i個行樣本數(shù)據(jù) 擁有第k個行特征的行隱變量,所述Zf為第j個列樣本數(shù)據(jù)擁有第1個列特征的列隱變量; 所述a,0分別為行、列混合比率,所述表示模型參數(shù),所述Da為所述a的維度,所述De 為所述0的維度,所述為所述f的維度,L(a,b)=logb+(a_b)/b,所述a為
> 所述b為
[0017] 結合第一方面,在第一方面的第三種可能的實現(xiàn)方式中,根據(jù)所述樣本數(shù)據(jù)、至少 兩個隱變量及模型參數(shù)確定的隱變量的變分分布的對數(shù)為:
[0018]logq(ZK)和logq(Zc);
[0019]其中,所述q(ZK)為行隱變量ZK的變分分布,所述q(Ze)為列隱變量ZC的變分分 布。
[0020] 結合第一方面及第一方面的第一種可能的實現(xiàn)方式至第三種可能的實現(xiàn)方式中 的任一種可能的實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,所述根據(jù)所述對數(shù)似 然、正則項及各個隱變量的變分分布的對數(shù)確定目標函數(shù),包括:
[0021] 根據(jù)所述對數(shù)似然的期望值、所述正則項的期望值及各個隱變量的變分分布的對 數(shù)的期望值確定目標函數(shù)。
[0022] 結合第一方面的第四種可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式 中,根據(jù)所述對數(shù)似然的期望值、所述正則項的期望值及各個隱變量的變分分布的對數(shù)的 期望值確定的目標函數(shù)為:
[0023]
[0024] 結合第一方面的第五種可能的實現(xiàn)方式,在第一方面的第六種可能的實現(xiàn)方式 中,所述確定使所述目標函數(shù)收斂的隱變量的變分分布及模型參數(shù),包括:
[0025] 獲取更新的隱變量的變分分布及更新的模型參數(shù);
[0026] 根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定所述目標函數(shù)是否收斂,如 果所述目標函數(shù)未收斂,則重新獲取更新的隱變量的變分分布及更新的模型參數(shù),直至得 到使所述目標函數(shù)收斂的隱變量的變分分布及模型參數(shù)。
[0027] 結合第一方面的第六種可能的實現(xiàn)方式,在第一方面的第七種可能的實現(xiàn)方式 中,所述獲取更新的隱變量的變分分布及更新的模型參數(shù),包括:
[0028] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,并根據(jù)更新 的隱變量的變分分布獲取更新的模型參數(shù)。
[0029] 結合第一方面的第七種可能的實現(xiàn)方式,在第一方面的第八種可能的實現(xiàn)方式 中,所述根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù)之前,還包括:
[0030] 確定所述更新的隱變量的變分分布是否收斂,如果所述更新的隱變量的變分分布 未收斂,則重新根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的隱變量的變分分布,直至 得到收斂的更新的隱變量的變分分布;
[0031] 所述根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù),包括:
[0032] 根據(jù)所述收斂的更新的隱變量的變分分布獲取更新的模型參數(shù)。
[0033] 結合第一方面的第六種可能的實現(xiàn)方式,在第一方面的第九種可能的實現(xiàn)方式 中,所述獲取更新的隱變量的變分分布及更新的模型參數(shù),包括:
[0034] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),并根據(jù)更新的模型參 數(shù)獲取更新的隱變量的變分分布。
[0035] 結合第一方面的第九種可能的實現(xiàn)方式,在第一方面的第十種可能的實現(xiàn)方式 中,所述根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布之前,還包括:
[0036] 確定所述更新的模型參數(shù)是否收斂,如果所述更新的模型參數(shù)未收斂,則重新根 據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)獲取更新的模型參數(shù),直至得到收斂的更新的模型參 數(shù);
[0037] 所述根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布,包括:
[0038] 根據(jù)所述收斂的更新的模型參數(shù)獲取更新的隱變量的變分分布。
[0039] 結合第一方面的第六種可能的實現(xiàn)方式至第八種可能的實現(xiàn)方式中的任一種實 現(xiàn)方式,在第一方面的第十一種可能的實現(xiàn)方式中,所述根據(jù)從樣本數(shù)據(jù)中抽取的子樣本 數(shù)據(jù)獲取更新的隱變量的變分分布,包括:
[0040] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新行隱變量的變分分 布f⑷ ?
[0041]
,直至t3等于時,
[0042] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新列隱變量的變分分 布#;;廠:
[0043]
,直至t4等于T2時,
[0044] 交替更新
I:至達到預設終止條件時,

為更新的行隱變量的變分分布,所述為更新的 列隱變量的變分分布;
[0045] 所述根據(jù)更新的隱變量的變分分布獲取更新的模型參數(shù),包括:
[0046] 根據(jù)更新的隱變量的變分分布按照如下公式獲取模型參數(shù)《@和
[0048] 根據(jù)更新的隱變量的變分分布以及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公 式迭代更新模型參數(shù):
[0049]
,直至t5等于T3時,nfkuU1,所述 和M.§>為更新的模型參數(shù);
[0050]其中,

[0053] 所述h代表當前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述t:t2代 表當前交替更新行隱變量的變分分布及列隱變量的變分分布,所述t:t2t3代表當前迭代更 新行隱變量的變分分布,所述t:t2t4代表當前迭代更新列隱變量的變分分布,所述t:t5代 表當前迭代更新模型參數(shù),所述代表上一次獲取更新的隱變量的變分分布及更新的模 型參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述tA-1代表上一次交替更新行隱變量 的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變分分布, 所述t:t2t3-l代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分分布,所 述t:t2t4-l代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分布,所述 代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。
[0054] 結合第一方面的第六種可能的實現(xiàn)方式、第九種可能的實現(xiàn)方式或第十種可能的 實現(xiàn)方式,在第一方面的第十二種可能的實現(xiàn)方式中,所述根據(jù)從樣本數(shù)據(jù)中抽取的子樣 本數(shù)據(jù)獲取更新的模型參數(shù),包括:
[0055] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式獲取模型參數(shù)'和:
[0057] 根據(jù)從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更新模型參數(shù)
,直至t5等于T3'時,
為更新的模型參數(shù);
[0058] 所述根據(jù)更新的模型參數(shù)獲取更新的隱變量的變分分布,包括:
[0059] 根據(jù)更新的模型參數(shù)以及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更 新行隱變量的變分分布f:
[0060]
,直至t3等于V時,
[0061] 根據(jù)更新的模型參數(shù)以及從樣本數(shù)據(jù)中抽取的子樣本數(shù)據(jù)按照如下公式迭代更 新列隱變量的變分分布f1:
[0062]
,直至t4等于T2'時,
[0063] 交替更新
,直至達到預設終止條件時,

?,所述¥柯尸,為更新的行隱變量的變分分布,所述?,產為更新的 列隱變量的變分分布;
[0064] 其中,
[0067] 所述t/代表當前獲取更新的隱變量的變分分布及更新的模型參數(shù),所述2代 表當前交替更新行隱變量的變分分布及列隱變量的變分分布,所述3代表當前迭代 更新行隱變量的變分分布,所述4代表當前迭代更新列隱變量的變分分布,所述5 代表當前迭代更新模型參數(shù),所述t/ -1代表上一次獲取更新的隱變量的變分分布及更新 的模型參數(shù)或初始化隱變量的變分分布及模型參數(shù),所述tj'2_1代表上一次交替更新行 隱變量的變分分布及列隱變量的變分分布或初始化行隱變量的變分分布及列隱變量的變 分分布,所述3_1代表上一次迭代更新行隱變量的變分分布或初始化行隱變量的變分 分布,所述4_1代表上一次迭代更新列隱變量的變分分布或初始化列隱變量的變分分 布,所述tj' 5_1代表上一次迭代更新模型參數(shù)或初始化模型參數(shù)。
[0068] 結合第一方面的第六種可能的實現(xiàn)方式至第十二種可能的實現(xiàn)方式中的任一種 可能的實現(xiàn)方式,在第一方面的第十三種可能的實現(xiàn)方式中,所述根據(jù)更新的隱變量的變 分分布及更新的模型參數(shù)確定所述目標函數(shù)是否收斂,包括:
[0069] 比較根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標函數(shù)與上一次 得到的目標函數(shù)之間的距離是否小于閾值,所述上一次得到的目標函數(shù)根據(jù)上一次更新的 隱變量的變分分布及更新的模型參數(shù)確定;
[0070] 如果根據(jù)更新的隱變量的變分分布及更新的模型參數(shù)確定的目標函數(shù)與上一次 得到的目標函數(shù)之間的距離小于閾值,則確定所述目標函數(shù)收斂。
[0071] 第二方面,提供了一種關系模型的確定裝置,所述裝置包括:
[0072] 獲取模塊,用于獲取根據(jù)樣本數(shù)據(jù)、至少兩個隱變量及模型參數(shù)確定的對數(shù)似然、 正則項及各個隱變量的變分分布的對數(shù),每個隱變量用于說明樣本數(shù)據(jù)擁有的特征;
[0073] 第一確定模塊,用于根據(jù)所述對數(shù)似然、正則項及各個隱變量的變分分布的對數(shù) 確定目標函數(shù);
[0074] 第二確定模塊,用于確定使所述目標函數(shù)收斂的隱變量的變分分布及模型參數(shù);
[0075] 第三確定模塊,用于根據(jù)使所述目標函數(shù)收斂的隱變量的變分分布及模型參數(shù)確 定關系t吳型。
[0076] 結合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,所述獲取模塊獲取到對 數(shù)似然為:
[0078] 其中,所述logp()表示對數(shù)似然,所述p表示聯(lián)合概率密度函數(shù),所述為樣本 數(shù)據(jù),所述隊為行樣本個數(shù),所述N。為列樣本個數(shù),所述ZK為行隱變量,所述Ze為列隱變 量,所述e為模型參數(shù)的集合,所述模型參數(shù)包括a、爲所述a分別為行、列混合 比率,所述?7表示模型參數(shù)。
[0079] 結合第二方面,在第二方面的第二種可能的實現(xiàn)方式中,所述獲取模塊獲取到的 正則項為:
[0080]
[0081] 其中,所述隊為行樣本個數(shù),所述N。為列樣本個數(shù);所述&是行特征的個數(shù),所述 K。是列特征的個數(shù);所述# )為隱變量的變分分布的近似值,所述Zj為第i個行樣本數(shù)據(jù) 擁有第k個行特征的行隱變量,所述為第j個列樣本數(shù)據(jù)擁有第1個列特征的列隱變量; 所述a,0分別為行、列混合比率,所述-表示模型參數(shù),
當前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1