本發(fā)明涉及生物信息及通信技術(shù)領(lǐng)域,具體而言,涉及一種疾病預(yù)測方法及裝置。
背景技術(shù):
基因變異是指基因組脫氧核糖核酸(deoxyribonucleicacid,dna)分子發(fā)生的突然的可遺傳的變異。目前研究發(fā)現(xiàn),腫瘤、高血壓、冠心病、糖尿病、心血管疾病及骨神經(jīng)性疾病等常見多發(fā)的疾病的發(fā)病都與患者的基因變異相關(guān)。這類疾病的發(fā)生涉及兩個以上基因的結(jié)構(gòu)或表達(dá)調(diào)控的改變。
基于上述發(fā)現(xiàn),人們開始了根據(jù)基因變異對疾病的發(fā)病進(jìn)行預(yù)測,但是,現(xiàn)有技術(shù)中,在進(jìn)行疾病預(yù)測時(shí),一般都是通過人工方式查找文獻(xiàn)或者數(shù)據(jù)庫,以確定出對該疾病會產(chǎn)生有害影響的變異位點(diǎn),并根據(jù)患者的基因測序結(jié)果,來預(yù)測患者是否可能患有上述疾病。
但是,現(xiàn)有技術(shù)中在進(jìn)行疾病預(yù)測時(shí),采用人工方式查找對該疾病產(chǎn)生有害影響的變異位點(diǎn),效率和準(zhǔn)確性均很低,并且現(xiàn)有技術(shù)僅僅只能預(yù)測患者攜帶的變異位點(diǎn)是否可能會導(dǎo)致患者患有某些疾病,只能得出定性的預(yù)測結(jié)果,參考性較差。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種疾病預(yù)測方法及裝置,以解決或者試圖緩解上述技術(shù)問題。
第一方面,本發(fā)明實(shí)施例提供了一種疾病預(yù)測方法,其中,所述方法包括:
在接收到終端發(fā)送的疾病預(yù)測請求后,獲取待預(yù)測用戶的基因測序結(jié)果,所述疾病預(yù)測請求中攜帶有待預(yù)測疾病的標(biāo)識;
根據(jù)所述基因測序結(jié)果,確定所述待預(yù)測用戶的變異位點(diǎn)信息;
確定所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率、所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和所述待預(yù)測疾病的發(fā)病概率;
根據(jù)所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率、所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和所述待預(yù)測疾病的發(fā)病概率,預(yù)測所述待預(yù)測用戶患有所述待預(yù)測疾病的概率,并將所述待預(yù)測用戶患有所述待預(yù)測疾病的概率發(fā)送給所述終端。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第一種可能的實(shí)現(xiàn)方式,其中,所述根據(jù)所述基因測序結(jié)果,確定所述待預(yù)測用戶的變異位點(diǎn)信息,包括:
將所述基因測序結(jié)果與參考基因組進(jìn)行比對,得到比對結(jié)果;
根據(jù)所述比對結(jié)果,確定所述用戶的基因變異信息。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第二種可能的實(shí)現(xiàn)方式,其中,所述確定所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率,包括:
統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中患有所述待預(yù)測疾病的人群數(shù)量,以及所述患有所述待預(yù)測疾病的人群中攜帶有所述變異位點(diǎn)的人群數(shù)量;
計(jì)算患有所述待預(yù)測疾病的人群中攜帶有所述變異位點(diǎn)的人群數(shù)量與所述患有所述待預(yù)測疾病的人群數(shù)量的第一比值;
將所述第一比值確定為所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第三種可能的實(shí)現(xiàn)方式,其中,所述根據(jù)所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率、所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和所述待預(yù)測疾病的發(fā)病概率,預(yù)測所述待預(yù)測用戶患有所述待預(yù)測疾病的概率,包括:
計(jì)算所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率與所述待預(yù)測疾病的發(fā)病概率的乘積;
計(jì)算所述乘積與所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率的第二比值,將所述第二比值確定為所述待預(yù)測用戶患有所述待預(yù)測疾病的概率。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第四種可能的實(shí)現(xiàn)方式,其中,所述將所述待預(yù)測用戶患有所述待預(yù)測疾病的概率發(fā)送給所述終端之后,所述方法還包括:
接收所述待預(yù)測用戶發(fā)送的建議獲取請求,所述建議獲取請求中攜帶有所述待預(yù)測用戶患有所述待預(yù)測疾病的概率;
從與所述待預(yù)測疾病相關(guān)聯(lián)的第三方服務(wù)器獲取與所述待預(yù)測用戶患有所述待預(yù)測疾病的概率對應(yīng)的建議信息;
將所述建議信息發(fā)送給所述終端。
第二方面,本發(fā)明實(shí)施例提供了一種疾病預(yù)測裝置,其中,所述裝置包括:
第一獲取模塊,用于在接收到終端發(fā)送的疾病預(yù)測請求后,獲取待預(yù)測用戶的基因測序結(jié)果,所述疾病預(yù)測請求中攜帶有待預(yù)測疾病的標(biāo)識;
第一確定模塊,用于根據(jù)所述基因測序結(jié)果,確定所述待預(yù)測用戶的變異位點(diǎn)信息;
第二確定模塊,用于確定所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率、所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和所述待預(yù)測疾病的發(fā)病概率;
預(yù)測模塊,用于根據(jù)所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率、所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和所述待預(yù)測疾病的發(fā)病概率,預(yù)測所述待預(yù)測用戶患有所述待預(yù)測疾病的概率;
發(fā)送模塊,用于將所述待預(yù)測用戶患有所述待預(yù)測疾病的概率發(fā)送給所述終端。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第一種可能的實(shí)現(xiàn)方式,其中,所述第一確定模塊包括:
比對單元,用于將所述基因測序結(jié)果與參考基因組進(jìn)行比對,得到比對結(jié)果;
第一確定單元,用于根據(jù)所述比對結(jié)果,確定所述用戶的基因變異信息。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第二種可能的實(shí)現(xiàn)方式,其中,所述第二確定模塊包括:
統(tǒng)計(jì)單元,用于統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中患有所述待預(yù)測疾病的人群數(shù)量,以及所述患有所述待預(yù)測疾病的人群中攜帶有所述變異位點(diǎn)的人群數(shù)量;
第一計(jì)算單元,用于計(jì)算患有所述待預(yù)測疾病的人群中攜帶有所述變異位點(diǎn)的人群數(shù)量與所述患有所述待預(yù)測疾病的人群數(shù)量的第一比值;
第二確定單元,用于將所述第一比值確定為所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第三種可能的實(shí)現(xiàn)方式,其中,所述預(yù)測模塊包括:
第二計(jì)算單元,用于計(jì)算所述變異位點(diǎn)在所述待預(yù)測疾病人群中的發(fā)生概率與所述待預(yù)測疾病的發(fā)病概率的乘積;
第三計(jì)算單元,用于計(jì)算所述乘積與所述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率的第二比值,將所述第二比值確定為所述待預(yù)測用戶患有所述待預(yù)測疾病的概率。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第四種可能的實(shí)現(xiàn)方式,其中,所述裝置還包括:
接收模塊,用于接收所述待預(yù)測用戶發(fā)送的建議獲取請求,所述建議獲取請求中攜帶有所述待預(yù)測用戶患有所述待預(yù)測疾病的概率;
第二獲取模塊,用于從與所述待預(yù)測疾病相關(guān)聯(lián)的第三方服務(wù)器獲取與所述待預(yù)測用戶患有所述待預(yù)測疾病的概率對應(yīng)的建議信息;
所述發(fā)送模塊,還用于將所述建議信息發(fā)送給所述終端。
在本發(fā)明實(shí)施例提供的疾病預(yù)測方法及裝置中,能夠得到用戶患有待預(yù)測疾病的概率,預(yù)測結(jié)果為具體的概率值,參考性較大,并且,避免了使用人工方式,準(zhǔn)確性和效率均較高。
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1示出了本發(fā)明實(shí)施例所提供的疾病預(yù)測方法的流程圖;
圖2示出了本發(fā)明實(shí)施例所提供的疾病預(yù)測方法中,確定變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率的流程圖;
圖3示出了本發(fā)明實(shí)施例所提供的疾病預(yù)測方法中,預(yù)測待預(yù)測用戶患有待預(yù)測疾病的概率;
圖4示出了本發(fā)明實(shí)施例所提供的疾病預(yù)測裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此,以下對在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例?;诒景l(fā)明的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
考慮到現(xiàn)有技術(shù)中在進(jìn)行疾病預(yù)測時(shí),大都是采用人工方式查找對該疾病產(chǎn)生有害影響的變異位點(diǎn),效率和準(zhǔn)確性均很低,并且現(xiàn)有技術(shù)僅僅只能預(yù)測患者攜帶的變異位點(diǎn)是否可能會導(dǎo)致患者患有某些疾病,只能得出定性的預(yù)測結(jié)果,參考性較差?;诖耍景l(fā)明實(shí)施例提供了一種疾病預(yù)測方法及裝置,下面通過實(shí)施例進(jìn)行描述。
參考圖1所示,本發(fā)明實(shí)施例提供了一種疾病預(yù)測方法,該方法包括步驟s110-s140,具體如下:
s110:在接收到終端發(fā)送的疾病預(yù)測請求后,獲取待預(yù)測用戶的基因測序結(jié)果,上述疾病預(yù)測請求中攜帶有待預(yù)測疾病的標(biāo)識;
s120:根據(jù)上述基因測序結(jié)果,確定待預(yù)測用戶的變異位點(diǎn)信息;
s130:確定上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率、上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和待預(yù)測疾病的發(fā)病概率;
s140:根據(jù)上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率、上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和待預(yù)測疾病的發(fā)病概率,預(yù)測待預(yù)測用戶患有待預(yù)測疾病的概率,并將待預(yù)測用戶患有待預(yù)測疾病的概率發(fā)送給終端。
本發(fā)明實(shí)施例提供的方法的執(zhí)行主體為服務(wù)器。
上述終端可以是計(jì)算機(jī)、手機(jī)或者平板電腦等。
在本發(fā)明實(shí)施例中,當(dāng)醫(yī)務(wù)工作者需要對用戶患有某種疾病的概率進(jìn)行預(yù)測時(shí),需要通過終端將疾病預(yù)測請求發(fā)送給服務(wù)器。
在步驟s110中,上述疾病預(yù)測請求中攜帶有待預(yù)測疾病的標(biāo)識以及待預(yù)測用戶的個人信息,該個人信息中包括用戶的姓名、性別、身份證號等信息。
上述待預(yù)測疾病的標(biāo)識可以是待預(yù)測疾病的名稱,比如說,肝癌、冠心病、糖尿病等。
其中,上述基因測序結(jié)果中包括多個基因序列。
在步驟s110中,獲取待預(yù)測用戶的基因測序結(jié)果,包括如下兩種情況:
第一種情況,
在服務(wù)器中存儲有待預(yù)測用戶的基因測序結(jié)果,根據(jù)待預(yù)測用戶的個人信息查找待預(yù)測用戶的基因測序結(jié)果。
第二種情況,
服務(wù)器與基因測序裝置之間建立連接,從基因測序裝置中獲取待預(yù)測用戶的基因測序結(jié)果,具體的,可以根據(jù)待預(yù)測用戶的個人信息從基因測序裝置中查找與待預(yù)測用戶的個人信息相對應(yīng)的基因測序結(jié)果。
上述基因測序裝置可以是基因測序儀。
在步驟s120中,具體可以通過以下步驟根據(jù)基因測序結(jié)果,確定待預(yù)測用戶的變異位點(diǎn)信息:
將上述基因測序結(jié)果與參考基因組進(jìn)行比對,得到比對結(jié)果;根據(jù)比對結(jié)果,確定待預(yù)測用戶的變異位點(diǎn)信息。
當(dāng)獲取到用戶的基因測序結(jié)果后,首先對上述基因測序結(jié)果進(jìn)行簡單的處理,具體包括去掉上述基因測序結(jié)果中基因序列的接頭序列和低質(zhì)量的讀數(shù),得到一系列的基因短序列,將上述得到的基因短序列與參考基因組進(jìn)行比對,確定出上述基因短序列在基因組上的位置,將上述基因短序列組裝成完整的人類基因組;其中,上述將短序列與參考基因組進(jìn)行比對是通過bwa(burrows-wheeleralignmenttool,生物序列對比工具)軟件實(shí)現(xiàn)的。
當(dāng)組裝成完整的人類基因組后,使用samtools軟件調(diào)整上述人類基因組中的基因短序列的排序,并進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,即將原來的sam格式轉(zhuǎn)換成bam文件。
接下來,采用picard軟件把上述得到的數(shù)據(jù)中的冗余信息和噪聲去掉。
之后,使用gatk軟件在上述數(shù)據(jù)中尋找上述數(shù)據(jù)與參考序列的差異,最后,對上述變異位點(diǎn)信息進(jìn)行注釋,生成包括變異所在的染色體、變異在所述染色體上的起始物理位置、變異在所述染色體上的終止物理位置、參考序列信息和觀察到的序列信息的列表在內(nèi)的變異位點(diǎn)信息。
因此,上述變異位點(diǎn)信息包括變異所在的染色體和變異在染色體上的位置,該位置包括變異在染色體上的起始物理位置及變異在染色體上的終止物理位置。
在步驟s130中,確定變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率,是通過步驟s210-s230實(shí)現(xiàn)的,參考圖2所示,具體如下:
s210,統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中患有待預(yù)測疾病的人群數(shù)量,以及患有待預(yù)測疾病的人群中攜帶有變異位點(diǎn)的人群數(shù)量;
s220,計(jì)算患有待預(yù)測疾病的人群中攜帶有變異位點(diǎn)的人群數(shù)量與患有待預(yù)測疾病的人群數(shù)量的第一比值;
s230,將上述第一比值確定為變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率。
在本發(fā)明實(shí)施例中,上述數(shù)據(jù)庫是預(yù)先建立的,具體通過如下步驟建立的:收集患有同一疾病的患者的個人基本信息和基因測序結(jié)果,并將上述患者的基因測序結(jié)果轉(zhuǎn)換成患者的變異位點(diǎn)信息,將上述患有同一疾病的患者的變異位點(diǎn)信息及個人基本信息存儲在子數(shù)據(jù)中;采用同樣的方法建立多個子數(shù)據(jù)庫,每個子數(shù)據(jù)庫中存儲有患有某一種疾病的患者的個人基本信息和基因變異信息;
另外,還需要收集隨機(jī)人群的個人基本信息和基因測序結(jié)果,并將隨機(jī)人群的基因測序結(jié)果轉(zhuǎn)換成變異位點(diǎn)信息,將上述隨機(jī)人群的個人基本信息和變異位點(diǎn)信息存儲在另外一個子數(shù)據(jù)庫中,這樣可以得到多個子數(shù)據(jù)庫,上述多個子數(shù)據(jù)庫組成上述數(shù)據(jù)庫。
上述患者的個人信息包括患者的姓名、性別、年齡、身份證號碼、患有的疾病等信息。
比如說,上述待預(yù)測用戶攜帶的變異位點(diǎn)記為a,則在上述步驟s210中,統(tǒng)計(jì)上述數(shù)據(jù)庫中患有上述待預(yù)測疾病的患者的人群數(shù)量,記為m1,以及攜帶有變異位點(diǎn)a的人群數(shù)量,記為m2,通過如下公式計(jì)算上述第一比值:
其中,在上述公式中p(變異位點(diǎn)a|待預(yù)測疾病)表示的是變異位點(diǎn)a在待預(yù)測疾病人群中的發(fā)生概率。
上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率,通過如下過程計(jì)算:
同樣,比如說,上述待預(yù)測用戶攜帶的變異位點(diǎn)記為a,統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中隨機(jī)人群的數(shù)量,記為n1,統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中攜帶有變異位點(diǎn)a的隨機(jī)人群的數(shù)據(jù),記為n2,則通過如下公式計(jì)算上述變異位點(diǎn)a在隨機(jī)人群中的發(fā)生概率:
其中,在上述公式中,p(變異位點(diǎn)a)表示的是待預(yù)測用戶的變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率。
上述待預(yù)測疾病的發(fā)病率指的是待預(yù)測疾病在人群中的發(fā)病率,具體數(shù)值可以從某些疾病研究文獻(xiàn)或者報(bào)告中獲取。
在上述步驟s140中,則根據(jù)變異位點(diǎn)在待預(yù)測人群中的發(fā)生概率、變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和待預(yù)測疾病的發(fā)病概率,預(yù)測待預(yù)測用戶患有待預(yù)測疾病的概率,參考圖3所示,包括步驟s310-s320,具體如下:
s310,計(jì)算上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率與待預(yù)測疾病的發(fā)病率的乘積;
s320,計(jì)算上述乘積與上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率的第二比值,將上述第二比值確定為待預(yù)測用戶患有上述待預(yù)測疾病的概率。
在本發(fā)明實(shí)施例中,待預(yù)測用戶的變異位點(diǎn)信息包括如下兩種情況:
第一種情況,
待預(yù)測用戶的變異位點(diǎn)信息只包括一個變異位點(diǎn)的信息,比如說,只包括變異位點(diǎn)a的信息,則通過如下公式計(jì)算待預(yù)測用戶患有待預(yù)測疾病的概率:
其中,在上述公式中,p(待預(yù)測疾病|變異位點(diǎn)a)表示攜帶有變異位點(diǎn)a的待預(yù)測用戶患有待預(yù)測疾病的概率,p(變異位點(diǎn)a|待預(yù)測疾病)表示的是變異位點(diǎn)a在待預(yù)測疾病人群中的發(fā)生概率,p(待預(yù)測疾病)表示的是待預(yù)測疾病的發(fā)病概率,p(變異位點(diǎn)a)表示的是變異位點(diǎn)a在隨機(jī)人群中的發(fā)病概率。
第二種情況,
待預(yù)測用戶的變異位點(diǎn)信息中包括兩個或者多個變異位點(diǎn)的信息,將待預(yù)測用戶的變異位點(diǎn)記為變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n,n=1,2,3,4…,則通過如下公式計(jì)算待預(yù)測用戶患有待預(yù)測疾病的概率:
其中,在上述公式中,p(待預(yù)測疾病|變異位點(diǎn)1,變異位點(diǎn)2...變異位點(diǎn)n)表示攜帶有變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n的待預(yù)測用戶患有待預(yù)測疾病的概率,p(變異位點(diǎn)1,變異位點(diǎn)2...變異位點(diǎn)n|待預(yù)測疾病)表示變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n在待預(yù)測疾病人群中的發(fā)生概率,p(待預(yù)測疾病)表示的是待預(yù)測疾病的發(fā)病概率,p(變異位點(diǎn)1,變異位點(diǎn)2...變異位點(diǎn)n)表示的是變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n在隨機(jī)人群中的發(fā)病概率。
具體的,在本發(fā)明實(shí)施例中,各個變異位點(diǎn)的發(fā)生是相互獨(dú)立的,因此,p(變異位點(diǎn)1,變異位點(diǎn)2...變異位點(diǎn)n|待預(yù)測疾病)可以通過如下公式計(jì)算得出:
其中,上述公式表示的是變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n在待預(yù)測疾病人群中的發(fā)生概率等于變異位點(diǎn)1在待預(yù)測疾病人群中的發(fā)生概率、變異位點(diǎn)2在待預(yù)測疾病人群中發(fā)生概率與變異位點(diǎn)n在待預(yù)測疾病人群中的發(fā)生概率的乘積。
具體的,在本發(fā)明實(shí)施例中,p(變異位點(diǎn)1,變異位點(diǎn)2...變異位點(diǎn)n)可以通過如下公式計(jì)算得到:
其中,上述公式表示的是變異位點(diǎn)1、變異位點(diǎn)2…變異位點(diǎn)n在隨機(jī)人群中的發(fā)病概率等于變異位點(diǎn)1在隨機(jī)人群中的發(fā)病概率、變異位點(diǎn)2在隨機(jī)人群中的發(fā)病概率與變異位點(diǎn)n在隨機(jī)人群中的發(fā)病概率的乘積。
在本發(fā)明實(shí)施例中,當(dāng)把待預(yù)測用戶患有待預(yù)測疾病的概率發(fā)送給終端,展示給用戶后,用戶還可以獲取相應(yīng)的建議,具體過程包括:
接收待預(yù)測用戶發(fā)送的建議獲取請求,該建議獲取請求中攜帶有待預(yù)測用戶患有待預(yù)測疾病的概率;從與待預(yù)測疾病相關(guān)聯(lián)的第三方服務(wù)器獲取與上述待預(yù)測用戶患有待預(yù)測疾病的概率對應(yīng)的建議信息;將上述建議信息發(fā)送給終端。
具體的,上述建議獲取請求中除了攜帶有待預(yù)測用戶患有待預(yù)測疾病的概率外,還攜帶有終端的標(biāo)識,該標(biāo)識可以是終端的互聯(lián)網(wǎng)協(xié)議(internetprotocol,ip)地址,或者還可以是待預(yù)測用戶的賬號信息等。
在本發(fā)明實(shí)施例中,當(dāng)服務(wù)器接收到終端發(fā)送的請求后,會根據(jù)上述請求中攜帶的待預(yù)測疾病的標(biāo)識鏈接到與待預(yù)測疾病相關(guān)聯(lián)的第三方服務(wù)器上,比如說,上述待預(yù)測疾病為乳腺癌,則可以鏈接到與乳腺癌相關(guān)的網(wǎng)站上,比如說,鏈接到美國國立綜合癌癥網(wǎng)站(nationalcomprehensivecancernetwork,nccn)上查找相關(guān)的建議信息。
在本發(fā)明實(shí)施例中,首先根據(jù)待預(yù)測用戶患有待預(yù)測疾病的概率從第三方服務(wù)器獲取與該概率相對應(yīng)的建議信息,比如說,如果待預(yù)測用戶患有待預(yù)測疾病的概率大于或等于第一預(yù)設(shè)值,可以判斷為待預(yù)測用戶患有待預(yù)測疾病的概率較高,這時(shí),可以獲取與該概率相關(guān)的建議信息,該建議信息可以是飲食建議、運(yùn)動建議或者治療建議等等,并將獲取的建議信息發(fā)送給終端。
除此之外,還可以通過如下方式實(shí)現(xiàn):首先從第三方服務(wù)器獲取與該待預(yù)測疾病相關(guān)聯(lián)的所有建議信息,之后,根據(jù)待預(yù)測用戶患有待預(yù)測疾病的概率,從上述所有建議信息中篩選出與待預(yù)測用戶的概率相匹配的建議信息,并將該建議信息發(fā)送給終端,呈現(xiàn)給待預(yù)測用戶。
本發(fā)明實(shí)施例提供的疾病預(yù)測方法,能夠得到用戶患有待預(yù)測疾病的概率,預(yù)測結(jié)果為具體的概率值,參考性較大,并且,避免了使用人工方式,準(zhǔn)確性和效率均較高。
參考圖4所示,本發(fā)明實(shí)施例提供了一種疾病預(yù)測裝置,該裝置用于執(zhí)行本發(fā)明實(shí)施例提供的疾病預(yù)測方法,該裝置可以是服務(wù)器,包括第一獲取模塊410、第一確定模塊420、第二確定模塊430、預(yù)測模塊440和發(fā)送模塊450;
上述第一獲取模塊410,用于在接收到終端發(fā)送的疾病預(yù)測請求后,獲取待預(yù)測用戶的基因測序結(jié)果,上述疾病預(yù)測請求中攜帶有待預(yù)測疾病的標(biāo)識;
上述第一確定模塊420,用于根據(jù)上述基因測序結(jié)果,確定上述待預(yù)測用戶的變異位點(diǎn)信息;
上述第二確定模塊430,用于計(jì)算上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率、上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和待預(yù)測疾病的發(fā)病概率;
上述預(yù)測模塊440,用于根據(jù)上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率、上述變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率和待預(yù)測疾病的發(fā)病概率,預(yù)測待預(yù)測用戶患有待預(yù)測疾病的概率;
上述發(fā)送模塊450,用于將上述待預(yù)測用戶患有待預(yù)測疾病的概率發(fā)送給終端。
具體的,上述第一確定模塊420根據(jù)基因測序結(jié)果,確定待預(yù)測用戶的變異位點(diǎn)信息是通過比對單元和第一確定單元實(shí)現(xiàn)的,具體包括:
上述比對單元,用于將上述基因測序結(jié)果與參考基因組進(jìn)行比對,得到比對結(jié)果;上述第一確定單元,用于根據(jù)上述比對結(jié)果,確定上述待預(yù)測用戶的變異位點(diǎn)信息。
其中,作為一個實(shí)施例,上述第二確定模塊430確定上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率是通過統(tǒng)計(jì)單元、第一計(jì)算單元和第二確定單元實(shí)現(xiàn)的,具體包括:
上述統(tǒng)計(jì)單元,用于統(tǒng)計(jì)預(yù)先建立的數(shù)據(jù)庫中患有待預(yù)測疾病的人群數(shù)量,以及患有待預(yù)測疾病的人群中攜帶有上述變異位點(diǎn)的人群數(shù)量;上述第一計(jì)算單元,用于計(jì)算患有上述待預(yù)測疾病的人群中攜帶有上述變異位點(diǎn)的人群數(shù)量與患有待預(yù)測疾病的人群數(shù)量的第一比值;上述第二確定單元,用于將上述第一比值確定為上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率。
具體的,上述預(yù)測模塊440預(yù)測待預(yù)測用戶患有待預(yù)測疾病的概率是通過第二計(jì)算單元、第三計(jì)算單元和第三確定單元實(shí)現(xiàn)的,具體包括:
上述第二計(jì)算單元,用于計(jì)算上述變異位點(diǎn)在待預(yù)測疾病人群中的發(fā)生概率與待預(yù)測疾病的發(fā)病概率的乘積;上述第三計(jì)算單元,用于計(jì)算上述乘積與變異位點(diǎn)在隨機(jī)人群中的發(fā)生概率的第二比值;上述第三確定單元,用于將上述第二比值確定為上述待預(yù)測用戶患有待預(yù)測疾病的概率。
其中,作為一個實(shí)施例,本發(fā)明實(shí)施例提供的裝置還包括接收模塊和第二獲取模塊;
上述接收模塊,用于接收上述待預(yù)測用戶發(fā)送的建議獲取請求,上述建議獲取請求中攜帶有待預(yù)測用戶患有待預(yù)測疾病的概率;上述第二獲取模塊,用于從與待預(yù)測疾病相關(guān)聯(lián)的第三方服務(wù)器獲取與上述待預(yù)測用戶患有待預(yù)測疾病的概率對應(yīng)的建議信息;上述發(fā)送模塊,還用于將上述建議信息發(fā)送給終端。
本發(fā)明實(shí)施例提供的疾病預(yù)測裝置,能夠得到用戶患有待預(yù)測疾病的概率,預(yù)測結(jié)果為具體的概率值,參考性較大,并且,避免了使用人工方式,準(zhǔn)確性和效率均較高。
本發(fā)明實(shí)施例所提供的疾病預(yù)測裝置可以為設(shè)備上的特定硬件或者安裝于設(shè)備上的軟件或固件等。本發(fā)明實(shí)施例所提供的裝置,其實(shí)現(xiàn)原理及產(chǎn)生的技術(shù)效果和前述方法實(shí)施例相同,為簡要描述,裝置實(shí)施例部分未提及之處,可參考前述方法實(shí)施例中相應(yīng)內(nèi)容。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,前述描述的系統(tǒng)、裝置和單元的具體工作過程,均可以參考上述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。
在本發(fā)明所提供的實(shí)施例中,應(yīng)該理解到,所揭露裝置和方法,可以通過其它的方式實(shí)現(xiàn)。以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,又例如,多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明提供的實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機(jī)存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步定義和解釋,此外,術(shù)語“第一”、“第二”、“第三”等僅用于區(qū)分描述,而不能理解為指示或暗示相對重要性。
最后應(yīng)說明的是:以上所述實(shí)施例,僅為本發(fā)明的具體實(shí)施方式,用以說明本發(fā)明的技術(shù)方案,而非對其限制,本發(fā)明的保護(hù)范圍并不局限于此,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),其依然可以對前述實(shí)施例所記載的技術(shù)方案進(jìn)行修改或可輕易想到變化,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改、變化或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實(shí)施例技術(shù)方案的精神和范圍。都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。