亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種拒絕率可控的Metropolis-Hastings圖抽樣算法

文檔序號(hào):6637458閱讀:685來源:國(guó)知局
一種拒絕率可控的Metropolis-Hastings圖抽樣算法
【專利摘要】本發(fā)明公開一種拒絕率可控的Metropolis-Hastings算法,首先在圖上隨機(jī)游動(dòng)采集樣本;其次,根據(jù)采集得到的樣本構(gòu)造無偏估計(jì)。能夠有效地解決從一個(gè)“隱藏”的在線社交網(wǎng)絡(luò)中提取均勻樣本的問題。該方法很好地平衡了RW算法的“大偏差”問題,以及MH算法的“樣本拒絕”問題,該算法適用性非常廣泛,如社交網(wǎng)絡(luò)分析,圖數(shù)據(jù)管理、和圖數(shù)據(jù)挖掘等相關(guān)【技術(shù)領(lǐng)域】。
【專利說明】-種拒絕率可控的Metropo I i S-Hast i ngs圖抽樣算法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種拒絕率可控的Metropolis-Hastings圖抽樣算法。

【背景技術(shù)】
[0002] 近年來,在線社交網(wǎng)絡(luò)分析引起了學(xué)術(shù)界和工業(yè)界的廣泛興趣。對(duì)于在線社交網(wǎng) 絡(luò)分析,其中的一個(gè)基本研究問題是分析社交網(wǎng)絡(luò)當(dāng)中節(jié)點(diǎn)的性質(zhì)以及整個(gè)社交網(wǎng)絡(luò)的拓 撲特性。然而,在現(xiàn)有的條件下,這個(gè)問題對(duì)于從事社交網(wǎng)絡(luò)分析的研究者來說是極具挑戰(zhàn) 性。這主要是因?yàn)楹芏嘣诰€的社交網(wǎng)絡(luò)公司,例如Facebook、騰訊、新浪微博等,都沒有公布 其社交圖譜的數(shù)據(jù),而且整個(gè)社交圖譜的拓?fù)浣Y(jié)構(gòu)以及大小對(duì)于第三方來說通常都是未知 的。因此,擺在廣大研究者面前的難題就是如何開發(fā)出一種簡(jiǎn)便的方法來從一個(gè)"對(duì)于研究 者不可見"的社交網(wǎng)絡(luò)中提取出均勻的圖節(jié)點(diǎn)樣本。
[0003] 為了解決這個(gè)問題,近年來,一系列基于爬蟲技術(shù)的圖抽樣方法被提出并廣泛使 用。為了研究的方便,可以把這些方法歸結(jié)為兩大類:一類是基于圖遍歷的框架,另一類是 基于隨機(jī)游走的思想。第一類方法可以通過廣度優(yōu)先搜索(BFS,breadth_first search)或 者深度優(yōu)先搜索(DFS,depth-first search)來采集節(jié)點(diǎn)樣本,這類方法有一個(gè)致命的缺陷, 就是在采集節(jié)點(diǎn)的過程中算法會(huì)偏向于度比較高的節(jié)點(diǎn),這顯然和我們需要均勻的節(jié)點(diǎn)樣 本的目標(biāo)不符。更糟糕的是整個(gè)圖的拓?fù)浣Y(jié)構(gòu)是不公開的,因而人們無從得知到底哪些節(jié) 點(diǎn)是被算法所偏向的,這就為后期對(duì)算法糾正這種偏向帶來了很大的困難,因此這一類算 法逐漸被業(yè)界棄用;第二類算法很好地解決了第一類算法的缺陷,它可以采集到不帶"偏 見"的均勻樣本,同時(shí)對(duì)于有"偏見"的情形下它也可以度量"偏見"的多少,從而為后期的 改正"偏見"提供了可能。正因?yàn)橛羞@些優(yōu)勢(shì),第二類方法已經(jīng)成為目前主流的圖抽樣方法。
[0004] 在現(xiàn)有的文獻(xiàn)中,存在二種廣泛使用的基于隨機(jī)游走的圖抽樣算法。第一種策略 是重新加權(quán)的隨機(jī)游走算法,我們稱之為RW(re-weighted random walk)算法;第二種策 略是 Metropol is-Hastings 隨機(jī)游走算法,我們稱之為 MH (Metropolis-Hastings random walk)算法。
[0005] 假如將網(wǎng)絡(luò)抽象成一個(gè)圖G= (V,E),其中n= |V|代表節(jié)點(diǎn)的個(gè)數(shù),m= |E 代表邊的條數(shù)。令N(U)為節(jié)點(diǎn)u G V的所有鄰接節(jié)點(diǎn)的集合,du = |N(u) I記為節(jié)點(diǎn)u 的度。令f: V - R是一個(gè)定義在節(jié)點(diǎn)集V上的實(shí)值函數(shù),表示節(jié)點(diǎn)u的某種特性的值,例 如節(jié)點(diǎn)的度,或者節(jié)點(diǎn)的某個(gè)屬性值。估計(jì)網(wǎng)絡(luò)特性的目標(biāo)是估計(jì)整個(gè)網(wǎng)絡(luò)中所有節(jié)點(diǎn)

【權(quán)利要求】
1. 一種拒絕率可控的Metropolis-Hastings圖抽樣算法,包含以下步驟: 51、 在圖上隨機(jī)游動(dòng)采集樣本,得到的樣本點(diǎn)集S ;在圖中隨機(jī)選擇節(jié)點(diǎn)u設(shè)為初始節(jié) 點(diǎn),并且將節(jié)點(diǎn)u加入點(diǎn)集S,從節(jié)點(diǎn)u的鄰接節(jié)點(diǎn)中等概率隨機(jī)選取一個(gè)節(jié)點(diǎn)V,并生成一 個(gè)均勻分布的概率值q e [0, 1];如果q彡(du/dv) α則將節(jié)點(diǎn)V作為下一步的節(jié)點(diǎn)u,并將 節(jié)點(diǎn)V加入點(diǎn)集S,否則不做任何操作; 52、 根據(jù)采集得到的樣本構(gòu)造無偏估計(jì),并通過以下公式構(gòu)造無偏估計(jì):
2. 根據(jù)權(quán)利要求1所述的拒絕率可控的Metropolis-Hastings圖抽樣算法,其特征在 于:在圖上隨機(jī)游動(dòng)采集樣本所采用的概率轉(zhuǎn)移方程為:
其中
為"接收函數(shù)"。
【文檔編號(hào)】G06F17/30GK104391972SQ201410736392
【公開日】2015年3月4日 申請(qǐng)日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】李榮華, 蔡濤濤, 毛睿, 秦璐, 金檀, 邱宇軒 申請(qǐng)人:深圳大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1