面向流行病防控的人口動態(tài)接觸結構建模與發(fā)現(xiàn)方法
【技術領域】
[0001] 本發(fā)明涉及一種人口接觸結構的建模與發(fā)現(xiàn)方法,屬于信息技術和公共衛(wèi)生的交 叉領域,尤其是數(shù)據(jù)挖掘、模式識別和計算流行病學領域。
【背景技術】
[0002] 流行性傳染病簡稱流行病,流行病的不斷爆發(fā)對人類社會造成了難以衡量的巨大 損失。流行病傳播模型能夠建模流行病爆發(fā)的動力學過程,幫助人們模擬、預測、控制流行 病的爆發(fā),是防控流行病爆發(fā)、減少人類生命財產(chǎn)損失的有效工具。
[0003] 人與人之間的接觸是流行病傳播的一般途徑。在計算流行病學中,個體間的接觸 常被稱作"人口接觸(humancontact) ",定義為"同一物理環(huán)境中不同個體間相互暴露的交 互行為"。人口接觸模式是流行病傳播模型的核心參數(shù),能夠顯著決定流行病的爆發(fā)過程。 本專利所涉及的人口接觸結構建模與發(fā)現(xiàn)方法旨在揭示人口接觸的結構模式,支撐流行病 傳播模型的準確預測。
[0004] 以被廣泛研究和使用的SIR(易感-感染-恢復)傳播模型為例,其傳播模型可被 表示為:
[0005]
[0006] 其中,向量i表示新增感染病例數(shù),K被稱為下一代再生矩陣,向量I和對角矩陣S 分別表示已感染和尚未被感染的人口數(shù)量。矩陣A和C是兩個基本的流行病學參數(shù),分別 描述未感染人群的易感程度和已感染人群的傳染能力。B為人口接觸矩陣,被用來刻畫亞人 口結構中的接觸模式?,F(xiàn)代生物醫(yī)學技術可準確獲取流行病學參數(shù)A和C,也就是說,能否 準確獲取人口接觸結構B將決定流行病傳播模型的預測準確度。
[0007] 然而,真實世界中個體接觸行為的瑣碎、多樣且不易記錄等,研究者很難以收集到 足量優(yōu)質的接觸數(shù)據(jù)供科研使用。盡管流行病學、社會學和計算機科學等多個領域的研究 者對獲取人口接觸結構已做了許多努力,但至今尚未有一種方法能準確獲取個體水平上大 規(guī)模人口的接觸結構。
[0008] 現(xiàn)有的人口接觸結構獲取方法主要包括兩大類:基于記錄的方法和基于模擬的 方法。前者使用調(diào)查問卷或無線可穿戴傳感器等記錄方法,詳細收集個體的接觸事件信息 (接觸時間、接觸地點、接觸對象、持續(xù)時間等),進而構建人口的接觸結構;后者通常基于 人口統(tǒng)計等社會特征數(shù)據(jù),使用仿真模擬技術間接計算人口接觸結構。
[0009] 調(diào)查問卷方法是一類基于記錄技術的人口接觸結構獲取方法,記錄手段主要包括 調(diào)查問卷和無線可穿戴傳感器。使用調(diào)查問卷的方法,2008年Mossong等人開展了歐洲最 大規(guī)模的人口接觸調(diào)查研究項目,該項目記錄了來自8個歐洲國家7290名志愿者的97904 次接觸行為信息,并據(jù)此構建了以年齡為劃分人口接觸模式。2012年Potter等人基于調(diào)查 問卷的方法收集了美國某所高中1074名學生的校內(nèi)接觸信息,并構建了個體水平上的接 觸網(wǎng)絡。該項研究發(fā)現(xiàn)教室是學生接觸的多發(fā)場景,而課間和午餐是學生間接觸行為的多 發(fā)時段。2012年Eames等人使用調(diào)查問卷探索了人口動態(tài)接觸結構,他們在學期和假期分 別記錄并構建了不同的人口接觸模式,二者組成了一個動態(tài)的人口接觸網(wǎng)絡,基于該動態(tài) 網(wǎng)絡他們較好的模擬了 2009英國H1N1的爆發(fā)過程。以上工作中,基于調(diào)查問卷的記錄方 法雖然可以有效記錄個體的接觸事件,但其記錄的準確性往往會受到記錄者主觀因素的影 響,且其成本過高,難以大規(guī)模推廣。
[0010] 近年來,可持續(xù)、準確記錄個體接觸事件信息的無線可穿戴傳感設備逐漸成為獲 取高精度接觸信息的主流工具。2006年MIT媒體實驗室開展了現(xiàn)實挖掘項目,該項目使用 藍牙手機設備持續(xù)記錄了眾多參與者的人口接觸行為。針對于藍牙功耗較大導致手機待機 時間過短,難以長時間追蹤個體接觸行為的問題,基于射頻識別等技術的專業(yè)無線可穿戴 傳感設備成為獲取人口接觸結構的新一代技術。2010年Salath6等人使用無線傳感網(wǎng)絡技 術收集了了美國一所高中788名學生一天的高精度接觸行為信息,并據(jù)此構建了個體水平 的校園接觸網(wǎng)絡。他們的研究發(fā)現(xiàn),校園接觸網(wǎng)絡呈現(xiàn)出高密度連接和小世界結構的特征。 2011年Stehl6等人使用基于射頻識別技術的無線可穿戴傳感設備采集了一所法國小學一 天內(nèi)學生的高精度接觸行為信息,并探索了校園接觸網(wǎng)絡的動態(tài)結構變化。
[0011] 雖然使用調(diào)查問卷或無線可穿戴傳感設備的記錄方法可以收集到細粒度的人口 接觸信息,然而由于其過于昂貴的成本,該類方法僅能局限在小規(guī)模人口的研究中,難以推 廣到長時間、大規(guī)模人口的接觸行為研究中。
[0012] 與調(diào)查問卷和無線傳感器等記錄方法不同的,仿真模擬方法是另一類人口接觸結 構的獲取方法。該方法通?;谌丝诮y(tǒng)計、人口移動等社會特征數(shù)據(jù),使用多智能體等仿真 模擬技術構建存在人口接觸與交互的虛擬社會,進而據(jù)此計算社會的人口接觸結構。由于 可以有效降低獲取人口接觸結構的成本,該類方法日漸成為大規(guī)模人口接觸結構研究和流 行病傳播建模的關注熱點。2004年Eubank等人基于動態(tài)二部圖和多智能體技術開發(fā)了模 擬系統(tǒng)EpiSims,該系統(tǒng)通過模擬個體間的各類交互行為構建了城市人口的接觸網(wǎng)絡。基 于意大利人口的問卷調(diào)查數(shù)據(jù),2010年Iozzi等人虛擬了一個符合了意大利社會特征的虛 擬社會,使用多智能體模擬個體的日常生活行為,并研究了意大利社會中的人口接觸結構。 2012年Fumanelli等人提出了一種基于人口統(tǒng)計數(shù)據(jù)的通用的人口接觸結構計算方法。該 方法首先分別計算各主要社會場景(家庭、學校和工作場所等)內(nèi)的人口接觸結構,再將其 加權結合得到完整的人口接觸結構?;跉W洲各國的人口統(tǒng)計數(shù)據(jù),他們使用該方法構建 并比較了 26個歐洲國家的人口接觸結構。
[0013] 盡管以上述以工作為代表的許多現(xiàn)有工作已對人口接觸結構做了許多定性或定 量的研究,然而其中絕大多數(shù)工作僅著眼于靜態(tài)的人口接觸結構,換句話說,其所獲結果均 基于"個體的社會接觸模式不隨時間發(fā)生變化"的假設。然而在真實世界中該假設顯然不 成立,個體的接觸行為不僅受到工作休息、上學放假等個體主動行為的影響,在流行病爆發(fā) 時個體接觸行為還會隨著主動避險意識和政府疫情控制策略而發(fā)生變化。現(xiàn)有的探測傳感 技術無法實現(xiàn)長期追蹤大規(guī)模人口接觸的任務,因此缺乏足量的接觸數(shù)據(jù)研究人口接觸的 動態(tài)變化模式。因此,如何建模并發(fā)現(xiàn)大規(guī)模人口接觸的時空模式是當前流行病學領域亟 待解決的問題之一。
【發(fā)明內(nèi)容】
[0014] 本發(fā)明的目的在于揭示大規(guī)模人口接觸的時空模式,即提供一種建模與發(fā)現(xiàn)人口 動態(tài)接觸結構的方法,為流行病爆發(fā)的預測與防控提供支撐。
[0015] 為實現(xiàn)上述目的,本發(fā)明提供了一種面向流行病防控的人口動態(tài)接觸結構建模與 發(fā)現(xiàn)方法,如圖1所示其特征在于包括如下內(nèi)容:
[0016] 1、人口動態(tài)接觸結構的時空建模方法:
[0017] 使用以年齡為劃分的復合群體模型建模人口接觸結構;
[0018] 使用三階張量MeRSXSXT建模人口的動態(tài)接觸結構;
[0019] 使用接觸基底字典φ={Φη. . .,Φκ}表示人口接觸的空間模式;
[0020] 使用脈沖矩陣示eRW刻畫人口接觸結構的時間模式;
[0021] 將人口動態(tài)接觸結構Μ表示為人口接觸基底字典Φ和脈沖矩陣豪的單邊反卷積 形式。
[0022] 2、人口動態(tài)接觸結構的空間模式構建方法;
[0023] 基于人口統(tǒng)計數(shù)據(jù)的虛擬社會模擬;
[0024] 基于虛擬社會計算人口接觸基底字典Φ= ,Φκ}。
[0025] 3、人口動態(tài)接觸結構的時間模式推斷方法;
[0026] 使用流行病傳播模型It=KtIt _畫流行病傳播過程;
[0027] 基于流行病監(jiān)控數(shù)據(jù),推斷人口動態(tài)接觸結構的時間模式的目標函數(shù)為:
[0028]