亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于肥胖癥相關(guān)疾病的生物標(biāo)記物的制作方法

文檔序號:11528712閱讀:530來源:國知局
用于肥胖癥相關(guān)疾病的生物標(biāo)記物的制造方法與工藝
相關(guān)申請的交叉引用無本發(fā)明涉及用于預(yù)測與微生物相關(guān)的疾病、特別是肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)的生物標(biāo)記物和方法。
背景技術(shù)
:肥胖癥在發(fā)達(dá)國家很普遍,在全世界范圍內(nèi)顯著增加(decarvalhopereira等人,2013)。據(jù)報(bào)道,在1980年至2013年期間,世界上總共的超重和肥胖癥的患病率中,成人增長了27.5%,兒童增長了47.1%。超重的人口從1980年的8.57億增加到2013年的21億,其中,6.71億人口受到了肥胖癥的影響。這其中,超過50%的肥胖癥患者生活在十個(gè)國家中,且美國擁有最大數(shù)量的肥胖人群,其次是中國(ng等人,2014)。越來越多的證據(jù)表明,由醫(yī)生診斷為超重的患者相對于未被診斷為超重的患者更有可能減輕體重。然而,醫(yī)生的低診斷率與對和肥胖癥有關(guān)的行為的健康風(fēng)險(xiǎn)因素的建議有關(guān)(bleich等人,2011)。在兒童中,肥胖癥的診斷是基于年齡與性別特異性的身體質(zhì)量指數(shù)(bmi)的切入點(diǎn)。這與成人相反,在成人中,肥胖癥的診斷是基于不考慮年齡或性別的bmi而作出的。與成年人不同,對于成年人來說肥胖癥的診斷標(biāo)準(zhǔn)更加簡單,少數(shù)肥胖兒童以更復(fù)雜的診斷標(biāo)準(zhǔn)被準(zhǔn)確地診斷且對兒童肥胖癥的術(shù)語發(fā)生了改變(walsh等人,2013年)。此外,應(yīng)考慮bmi在不同人群同一性方面的局限性(nevill等人,2006)。因此,可以認(rèn)為腰圍(wc)是用于評估腹壁多脂癥的流行病學(xué)研究的可靠而有用的工具,但是這種測量似乎更加難以執(zhí)行(miguel-etayo等人,2014)。此外,采用國際疾病分類(第九次修訂(icd-9))、國家門診醫(yī)療護(hù)理調(diào)查(namcs)和國家住院醫(yī)療護(hù)理調(diào)查(nhamcs)對兒童肥胖癥診斷的區(qū)域研究顯示出臨床診斷的相對低的敏感性(walsh等人,2013)。最近的觀察表明,人類腸道微生物群在肥胖癥中可以發(fā)揮重要作用?;跀U(kuò)增的16srrna基因測序的早期報(bào)告表明,來自12名肥胖人類的糞便樣品中的厚壁菌(firmicutes)與擬桿菌(bacteroidetes)之比遠(yuǎn)高于兩個(gè)瘦的對照(ley等人,2006)。在人類肥胖癥中采用宏基因組測序的最近觀察性研究中已經(jīng)證明細(xì)菌多樣性降低、擬桿菌(bacteroidetes)的相對缺乏和涉及碳水化合物和脂質(zhì)代謝的基因的富集(allin和pedersen,2014)。這些相關(guān)的發(fā)現(xiàn)表明,腸道微生物群的改變是肥胖癥的發(fā)病機(jī)理中的致病因素。這表明,也許我們可以利用用腸道微生物群的該特點(diǎn)作為肥胖癥診斷的標(biāo)準(zhǔn)??傊瑢Ψ逝职Y的診斷有相當(dāng)多的被忽略的機(jī)會和低靈敏度。需要開發(fā)更有效的(偏差較小的)對超重和/或肥胖癥的評估。技術(shù)實(shí)現(xiàn)要素:本公開的實(shí)施方案試圖至少在一定程度上解決現(xiàn)有技術(shù)中存在的至少一個(gè)問題。本發(fā)明基于本發(fā)明人的以下發(fā)現(xiàn):對腸道微生物群的評估和表征已經(jīng)成為對包括肥胖癥的人類疾病中的主要研究領(lǐng)域。為了對肥胖癥患者的腸道微生物成分進(jìn)行分析,本發(fā)明人基于來自158名個(gè)體的腸道微生物dna的深度鳥槍測序?qū)嵤┝撕昊蚪M關(guān)聯(lián)分析(mgwas)方案(qin,j.等人,ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.nature490,55-60(2012),通過引用并入本文)。本發(fā)明人鑒別并驗(yàn)證了54種肥胖癥相關(guān)的腸道微生物。為了利用通過腸道微生物群進(jìn)行肥胖癥分類器的潛在能力,發(fā)明人通過基于54種肥胖癥相關(guān)的腸道微生物的隨機(jī)森林模型計(jì)算了疾病概率。本發(fā)明人的數(shù)據(jù)對與肥胖癥風(fēng)險(xiǎn)相關(guān)的腸道宏基因組的特征進(jìn)行了深入研究,提供了腸道宏基因組在其它相關(guān)疾病中的病理生理作用的未來研究的范例以及用于基于腸道微生物群對此類疾病風(fēng)險(xiǎn)的個(gè)體進(jìn)行評估的潛在應(yīng)用。人們相信,54種肥胖癥相關(guān)的腸道微生物對于提高早期階段肥胖癥的檢測性是有價(jià)值的,這是由于以下原因。首先,本發(fā)明的標(biāo)記物與常規(guī)標(biāo)記物相比更具特異性且更敏感。第二,糞便分析確保了準(zhǔn)確性、安全性、可負(fù)擔(dān)性和患者依從性。并且糞便樣品是可運(yùn)輸?shù)?。因此,本發(fā)明涉及一種舒適且無創(chuàng)的體外方法,使得人們更容易地參與給定的篩選程序。第三,本發(fā)明的標(biāo)記物還可以用作肥胖癥患者的治療監(jiān)測工具,以檢測其對治療的響應(yīng)。本公開一方面提供了用于預(yù)測受試者與微生物群相關(guān)的疾病的生物標(biāo)記物集,其由腸道生物標(biāo)記物或微生物組成:所述腸道生物標(biāo)記物包括腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、alistipesshahiiwal8301、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6),卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、規(guī)則糞球菌atcc27759(coprococcuseutactusatcc27759)、肺炎克雷伯菌342(klebsiellapneumonia342)、韋榮氏球菌屬口腔分類群158菌株f0412(veillonellasp.oraltaxon158str.f0412)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、dialisterinvisusdsm15470、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、擬桿菌屬3_1_33faa(bacteroidessp.3_1_33faa)、普拉梭菌kle1255(faecalibacteriumcf.prausnitziikle1255)、產(chǎn)酸克雷伯菌kctc1686(klebsiellaoxytocakctc1686)、多形擬桿菌vpi-5482(bacteroidesthetaiotaomicronvpi-5482)、卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、瘤胃球菌屬5_1_39bfaa(ruminococcussp.5_1_39bfaa)、伴生糞球菌atcc27758(coprococcuscomesatcc27758)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、doreaformicigeneransatcc27755、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、dorealongicatenadsm13814、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、扭鏈瘤胃球菌l2-14(ruminococcustorquesl2-14)、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353),所述微生物具有包括seqidno:1至48497的基因組dna序列??蛇x地,該生物標(biāo)記物集由表3中所列種類中的至少一種物種組成,優(yōu)選由表3中所列的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%的物種組成。本公開另一方面提供了用于預(yù)測受試者與微生物群相關(guān)的疾病的生物標(biāo)記物集,其由以下組成:包括如表4中所述seqidno:1至48497的至少部分序列的腸道生物標(biāo)記物。根據(jù)本公開的實(shí)施方案,該疾病為肥胖癥或相關(guān)疾病。本公開另一方面提供了用于確定上述基因標(biāo)記物集的試劑盒,其包括用于pcr擴(kuò)增并根據(jù)seqidno:1至48497的至少部分序列所述的dna序列而設(shè)計(jì)的引物。本公開另一方面提供了用于確定上述基因標(biāo)記物集的試劑盒,其包括一個(gè)以上根據(jù)seqidno:1至48497所述的基因而設(shè)計(jì)的探針。本公開的另一方面提供了上述基因標(biāo)記物集用于預(yù)測待測試的受試者肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)中的用途,包括:(1)從所述待測試的受試者收集樣品;(2)確定步驟(1)得到的樣品中的根據(jù)權(quán)利要求1至3中任一項(xiàng)的生物標(biāo)記物集的每一個(gè)生物標(biāo)記物的相對豐度信息;(3)使用多元統(tǒng)計(jì)模型,通過將待測試的受試者的每個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較來獲得肥胖癥概率,其中,肥胖癥概率大于臨界值表示待測試的受試者具有肥胖癥或相關(guān)疾病或處于發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)中。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是基于多個(gè)具有肥胖癥的受試者和多個(gè)正常受試者的每一個(gè)生物標(biāo)記物的相對豐度信息使用多元統(tǒng)計(jì)模型來構(gòu)建的,可選地,多元統(tǒng)計(jì)模型是隨機(jī)森林模型。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是矩陣,其中各行代表根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的生物標(biāo)記物集的各個(gè)生物標(biāo)記物,各列代表樣品,各個(gè)單元代表樣品中生物標(biāo)記物的相對豐度譜,樣品疾病狀態(tài)是矢量,其中1為肥胖癥,0為對照。根據(jù)本公開的實(shí)施方案,腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、alistipesshahiiwal8301、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6),卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、規(guī)則糞球菌atcc27759(coprococcuseutactusatcc27759)、肺炎克雷伯菌342(klebsiellapneumonia342)、韋榮氏球菌屬口腔分類群158菌株f0412(veillonellasp.oraltaxon158str.f0412)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、dialisterinvisusdsm15470、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、擬桿菌屬3_1_33faa(bacteroidessp.3_1_33faa)、普拉梭菌kle1255(faecalibacteriumcf.prausnitziikle1255)、產(chǎn)酸克雷伯菌kctc1686(klebsiellaoxytocakctc1686)、多形擬桿菌vpi-5482(bacteroidesthetaiotaomicronvpi-5482)、卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、瘤胃球菌屬5_1_39bfaa(ruminococcussp.5_1_39bfaa)、伴生糞球菌atcc27758(coprococcuscomesatcc27758)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、doreaformicigeneransatcc27755、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、dorealongicatenadsm13814、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、扭鏈瘤胃球菌l2-14(ruminococcustorquesl2-14)、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)和霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)中的每一個(gè)的相對豐度信息都是根據(jù)seqidno:1至48497的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是表5-1、5-2、5-3和5-4中的至少一個(gè),并且肥胖癥概率為至少0.5說明待測試的受試者具有肥胖癥或相關(guān)疾病或具有發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)。本公開另一方面提供了上述基因標(biāo)記物集在制備用于預(yù)測待測試的受試者肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)的試劑盒中的用途,其包括:(1)從所述待測試的受試者收集樣品;(2)確定步驟(1)得到的樣品中根據(jù)權(quán)利要求1至3中任一項(xiàng)的生物標(biāo)記物集的每一個(gè)生物標(biāo)記物的相對豐度信息;(3)使用多元統(tǒng)計(jì)模型,通過將待測試的受試者的每個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較來獲得肥胖癥概率,其中,肥胖癥的概率大于臨界值表示待測試的受試者具有肥胖癥或相關(guān)疾病或處于發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)中。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是基于多個(gè)具有肥胖癥的受試者和多個(gè)正常受試者的每一個(gè)生物標(biāo)記物的相對豐度信息使用多元統(tǒng)計(jì)模型來構(gòu)建的,可選地,多元統(tǒng)計(jì)模型是隨機(jī)森林模型。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是矩陣,其中各行代表根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的生物標(biāo)記物集的各個(gè)生物標(biāo)記物,各列代表樣品,各個(gè)單元代表樣品中生物標(biāo)記物的相對豐度譜,樣品疾病狀態(tài)是矢量,其中1為肥胖癥,0為對照。根據(jù)本公開的實(shí)施方案,腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、alistipesshahiiwal8301、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6),卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、規(guī)則糞球菌atcc27759(coprococcuseutactusatcc27759)、肺炎克雷伯菌342(klebsiellapneumonia342)、韋榮氏球菌屬口腔分類群158菌株f0412(veillonellasp.oraltaxon158str.f0412)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、dialisterinvisusdsm15470、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、擬桿菌屬3_1_33faa(bacteroidessp.3_1_33faa)、普拉梭菌kle1255(faecalibacteriumcf.prausnitziikle1255)、產(chǎn)酸克雷伯菌kctc1686(klebsiellaoxytocakctc1686)、多形擬桿菌vpi-5482(bacteroidesthetaiotaomicronvpi-5482)、卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、瘤胃球菌屬5_1_39bfaa(ruminococcussp.5_1_39bfaa)、伴生糞球菌atcc27758(coprococcuscomesatcc27758)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、doreaformicigeneransatcc27755、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、dorealongicatenadsm13814、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、扭鏈瘤胃球菌l2-14(ruminococcustorquesl2-14)、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)和霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)中的每一個(gè)的相對豐度信息都是根據(jù)seqidno:1至48497的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是表5-1、5-2、5-3和5-4中的至少一個(gè),并且肥胖癥概率為至少0.5說明待測試的受試者具有肥胖癥或相關(guān)疾病或具有發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)。本公開另一方面提供了診斷受試者是否具有與微生物群相關(guān)的異常狀況或處于發(fā)展與微生物群相關(guān)的異常狀況的風(fēng)險(xiǎn)中的方法,其包括:確定來自受試者的樣品中的上述生物標(biāo)記物的相對豐度,和基于所述相對豐度確定受試者是否具有與微生物群相關(guān)的異常狀況或者處于發(fā)展與微生物群相關(guān)的異常狀況的風(fēng)險(xiǎn)中。根據(jù)本公開的實(shí)施方案,該方法包括:(1)從待測受試者收集樣品;(2)確定步驟(1)得到的樣品中根據(jù)權(quán)利要求1至3中任一項(xiàng)的生物標(biāo)記物集的每一個(gè)生物標(biāo)記物的相對豐度信息;(3)使用多元統(tǒng)計(jì)模型,通過將待測試的受試者的每個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較來獲得肥胖癥概率,其中,肥胖癥的概率大于臨界值表示待測試的受試者具有肥胖癥或相關(guān)疾病或處于發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)中。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是基于多個(gè)具有肥胖癥的受試者和多個(gè)正常受試者的每一個(gè)生物標(biāo)記物的相對豐度信息使用多元統(tǒng)計(jì)模型來構(gòu)建的,可選地,多元統(tǒng)計(jì)模型是隨機(jī)森林模型。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是矩陣,其中各行代表根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的生物標(biāo)記物集的各個(gè)生物標(biāo)記物,各列代表樣品,各個(gè)單元代表樣品中生物標(biāo)記物的相對豐度譜,樣品疾病狀態(tài)是矢量,其中1為肥胖癥,0為對照。根據(jù)本公開的實(shí)施方案,腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、alistipesshahiiwal8301、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6),卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、規(guī)則糞球菌atcc27759(coprococcuseutactusatcc27759)、肺炎克雷伯菌342(klebsiellapneumonia342)、韋榮氏球菌屬口腔分類群158菌株f0412(veillonellasp.oraltaxon158str.f0412)、擬桿菌屬1_1_30(bacteroidessp.1_1_30)、dialisterinvisusdsm15470、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、擬桿菌屬3_1_33faa(bacteroidessp.3_1_33faa)、普拉梭菌kle1255(faecalibacteriumcf.prausnitziikle1255)、產(chǎn)酸克雷伯菌kctc1686(klebsiellaoxytocakctc1686)、多形擬桿菌vpi-5482(bacteroidesthetaiotaomicronvpi-5482)、卵形擬桿菌3_8_47faa(bacteroidesovatus3_8_47faa)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、普拉梭菌l2-6(faecalibacteriumprausnitziil2-6)、腸道擬桿菌dsm17393(bacteroidesintestinalisdsm17393)、副流感嗜血桿菌t3t1(haemophilusparainfluenzaet3t1)、瘤胃球菌屬5_1_39bfaa(ruminococcussp.5_1_39bfaa)、伴生糞球菌atcc27758(coprococcuscomesatcc27758)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、doreaformicigeneransatcc27755、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、dorealongicatenadsm13814、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)、霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)、扭鏈瘤胃球菌l2-14(ruminococcustorquesl2-14)、dorealongicatenadsm13814、產(chǎn)氣柯林斯菌atcc25986(collinsellaaerofaciensatcc25986)、卵瘤胃球菌a2-162(ruminococcusobeuma2-162)和霍氏真桿菌dsm3353(eubacteriumhalliidsm3353)中的每一個(gè)的相對豐度信息都是根據(jù)seqidno:1至48497的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方案,訓(xùn)練數(shù)據(jù)集是表5-1、5-2、5-3和5-4中的至少一個(gè),并且肥胖癥概率為至少0.5說明待測受試者具有肥胖癥或相關(guān)疾病或具有發(fā)展肥胖癥或相關(guān)疾病的風(fēng)險(xiǎn)。附圖說明本公開的這些和其它的方面和優(yōu)點(diǎn)從以下結(jié)合附圖的描述中將變得明顯和更容易理解,其中:圖1肥胖p值分布的關(guān)聯(lián)分析確定出強(qiáng)相關(guān)標(biāo)記物在較低p值時(shí)不成比例的過度表示。圖2roc由訓(xùn)練集中的疾病概率繪制,auc=0.9651。圖3為了驗(yàn)證54個(gè)mlg標(biāo)記物,本發(fā)明人采用隨機(jī)森林設(shè)置模型,然后預(yù)測42個(gè)樣品,并計(jì)算每個(gè)樣品的疾病概率。預(yù)測錯(cuò)誤率為8/42=19.05%。圖4測試集(42個(gè)樣品)的roc由測試集的肥胖癥指數(shù)繪制,auc=0.9188。圖5計(jì)算手術(shù)之前和之后的樣品的疾病概率。圖6示出了每個(gè)樣品中疾病概率的變化。圖7示出了三組中疾病概率。手術(shù)后樣本的概率顯著低于手術(shù)之前。具體實(shí)施方式示例本文使用的術(shù)語具有與本發(fā)明相關(guān)領(lǐng)域的普通技術(shù)人員通常理解的含義。諸如“一”、“一個(gè)”和“該”的術(shù)語不是旨在僅指單數(shù)實(shí)體,而是包括可用于說明特定示例的一般類別。除非在權(quán)利要求中有所說明,本文中的術(shù)語用于描述本發(fā)明的具體實(shí)施方案,但是它們的用法不限制本發(fā)明。本發(fā)明在以下非限制性示例通過中進(jìn)一步舉例說明。除非另有說明,份數(shù)和百分比都以重量計(jì),度數(shù)為攝氏度。對于本領(lǐng)域普通技術(shù)人員顯而易見的是,這些示例雖然代表了本發(fā)明的優(yōu)選實(shí)施方案,但僅以說明的方式給出,并且所有試劑都是可商購的。示例1.鑒別評估肥胖癥風(fēng)險(xiǎn)的生物標(biāo)記物1.1樣品收集來自158名中國受試者(包括78名肥胖癥患者和80名對照受試者(訓(xùn)練集))的糞便樣品由上海交通大學(xué)醫(yī)學(xué)院瑞金醫(yī)院于2012年收集。肥胖癥患者年齡從18至30歲,bmi高于25。要求受試者在醫(yī)院收集新鮮糞便樣品。將收集的樣品置于無菌管中,立即儲存于-80℃直至進(jìn)行進(jìn)一步分析。取得了完整的倫理批準(zhǔn),且所有患者都給予了書面知情同意。該研究獲得了上海交通大學(xué)醫(yī)學(xué)院瑞金醫(yī)院倫理審查委員會的批準(zhǔn)。1.2dna提取將糞便樣品在冰上解凍,并使用qiagenqiaampdnastoolmini試劑盒(qiagen),根據(jù)制造商的說明進(jìn)行dna提取。采用無dna酶的rna酶處理提取物以消除rna污染。使用nanodrop分光光度計(jì)、qubit熒光計(jì)(具有quant-ittmdsdnabr測定試劑盒)和凝膠電泳測定dna量。1.3糞便樣品的dna文庫構(gòu)建和測序根據(jù)制造商的說明進(jìn)行dna文庫構(gòu)建(illumina,插入尺寸大小350bp,讀段長度100bp)。本發(fā)明人使用與前述相同的工作流程進(jìn)行簇生成、模板雜交、等溫?cái)U(kuò)增、線性化、封閉和變性以及測序引物的雜交。本發(fā)明人對于每個(gè)樣品都構(gòu)建了一個(gè)具有插入尺寸大小為350bp的末端配對的(pe)文庫,隨后進(jìn)行高通量測序獲得了長度為2x100bp的約3千萬個(gè)pe讀段。通過從illumina原始讀段中過濾出具有不確定的“n”堿基、接頭污染和人源dna污染的低質(zhì)量讀段并通過同時(shí)剪切讀段的低質(zhì)量末端堿基來獲得高質(zhì)量讀段。本發(fā)明人在illuminahiseq2000平臺上從158個(gè)樣品(78個(gè)病例和80個(gè)對照)中總共輸出每個(gè)樣品約5.9gb的糞便微生物群測序數(shù)據(jù)(高質(zhì)量干凈數(shù)據(jù))(表1)。表1宏基因組數(shù)據(jù)匯總。第四列報(bào)告來自wilcoxon秩和檢驗(yàn)的結(jié)果。1.4宏基因組數(shù)據(jù)處理和分析1.4.1讀段比對本發(fā)明人使用了li,j.等人,anintegratedcatalogofreferencegenesinthehumangutmicrobiome.nat.biotechnol.(2014)(通過引用并入本文)建立的更新的人類腸道基因目錄,并且以比對標(biāo)準(zhǔn)同一性≥90來將高質(zhì)量讀段比對到該更新的人類腸道基因目錄。平均的讀段比對率示于表1中。該比對率接近li,j.等人,2014,同上中的樣品,這說明了該比對率足以進(jìn)行進(jìn)一步研究。在讀段比對之后,本發(fā)明人使用與li,j.等人,2014,同上相同的方法從比對結(jié)果中導(dǎo)出基因譜(9.9mb基因)?;虻姆诸悓W(xué)分配。采用在已公開的論文(li,j.等人,2014,同上)中所描述的內(nèi)部開發(fā)的流程(pipeline)進(jìn)行預(yù)測基因的分類學(xué)分配。1.4.2數(shù)據(jù)文件構(gòu)建基因譜。基于讀段比對的結(jié)果,本發(fā)明人使用在公開的t2d論文(qin等人,2012,同上)中所描述的相同方法來計(jì)算相對基因豐度。1.4.3影響腸道微生物群基因譜的因素分析?;诨蜃V,本發(fā)明人使用非參數(shù)多元方差分析(permanova)來評估6個(gè)臨床參數(shù)(包括年齡、性別、身高、體重、bmi和肥胖)的影響。發(fā)明人采用在r中的“vegan”包中實(shí)施的方法進(jìn)行分析,并且通過10,000次置換(permutation)獲得置換的(permuted)p值。本發(fā)明人還利用benjamini-hochberg方法在r中采用“p.adjust”來校正多重測試,以獲得每個(gè)測試的q值。permanoa確定了與腸道微生物相關(guān)的三個(gè)重要因素(基于基因譜)(q<0.05,表2)。分析表明,體重、bmi和肥胖狀態(tài)是強(qiáng)關(guān)聯(lián)標(biāo)記,證明了疾病(肥胖)狀態(tài)是影響腸道微生物群組成的主要決定性因素。表2基于基因譜的歐幾里德距離分析的permanova。在q值<0.05下進(jìn)行分析以測試臨床參數(shù)和肥胖狀況是否對腸道微生物群具有顯著影響。表型dfsqs匯總平均sqsf.模型r2pr(>f)年齡10.3170347380.3170347381.0041125790.0063954540.4094性別10.3773294970.3773294971.1965429030.0076117630.1727身高10.3314096670.3314096671.0499472840.0066854350.3291體重10.9695365150.9695365153.1119418570.0195581921.00e-04bmi10.9541868930.9541868933.06170690.0192485481.00e-04肥胖10.9721853520.9721853523.1206139590.0196116262.00e-041.4.4肥胖癥相關(guān)標(biāo)記物的確定肥胖癥相關(guān)基因的確定。為了確定宏基因組譜和肥胖癥之間的關(guān)聯(lián),在9,879,897個(gè)高發(fā)生率基因(移除在所有158個(gè)樣品中存在于少于10個(gè)樣品中的基因)譜中采用雙尾wilcoxon秩和檢驗(yàn)。得到在病例和對照中都富集的396,100個(gè)基因標(biāo)記物,p值<0.01、fdr=3.8%(圖1)。錯(cuò)誤發(fā)現(xiàn)率估計(jì)(fdr)。本發(fā)明人應(yīng)用在先前研究中提出的“q值”法而不是連續(xù)p值排除法(sequentialp-valuerejectionmethod)來估計(jì)fdr(storey,jdadirectapproachtofalsediscoveryrates.journaloftheroyalstatisticalsociety64,479-498(2002),通過引用并入本文)。受試者工作特征(roc)分析。本發(fā)明人應(yīng)用roc分析來評估基于宏基因組標(biāo)記物的肥胖癥分類的表現(xiàn)。然后,本發(fā)明人使用r中的“proc”包來繪制roc曲線。1.4.5mlg的構(gòu)建和與肥胖癥相關(guān)的mlg物種標(biāo)記物的鑒別基于與396,100肥胖癥相關(guān)的標(biāo)記物基因譜的237個(gè)mlg物種。本發(fā)明人使用396,100個(gè)基因標(biāo)記物,采用在公開的t2d論文(qin等人,2012,同上)中所描述的相同方法構(gòu)建宏基因組連鎖群(mlg)。通過在imgv400中將這些基因比對至4,653個(gè)參考基因組來注釋所有396,100個(gè)基因。如果超過50%的組成基因被注釋到該基因組,則將mlg指定至該基因組,否則將其稱為未分類。選擇基因數(shù)>100的總共237個(gè)mlg基因組(p值<0.01)。為了估計(jì)mlg物種的相對豐度,本發(fā)明人在去除5%的最低和5%的最高豐度基因后,估計(jì)了mlg物種的基因的平均豐度(qin等人2012,同上)。1.5基于mlg的分類器采用訓(xùn)練隊(duì)列(158個(gè)樣品)的mlg豐度譜對隨機(jī)森林模型(r.2.14,隨機(jī)森林4.6-7包)(liaw,andy&wiener,matthew.classificationandregressionbyrandomforest,rnews(2002),第2/3卷,第18頁,通過引用并入本文)進(jìn)行訓(xùn)練,以選擇mlg標(biāo)記物的最佳集。在一個(gè)以上測試集上測試模型,并計(jì)算預(yù)測誤差。關(guān)于隨機(jī)森林模型,利用r版本2.14中“隨機(jī)森林4.6-7包”,輸入的是訓(xùn)練數(shù)據(jù)集(即所選擇的訓(xùn)練樣品中mlg的相對豐度譜)、樣品疾病狀態(tài)(訓(xùn)練樣品的樣品疾病狀態(tài)是向量,1為肥胖癥,0為對照)和測試集(僅為所選擇的mlg在測試集中的的相對豐度譜)。然后,發(fā)明人使用來自r軟件中的隨機(jī)森林包的隨機(jī)森林函數(shù)來構(gòu)建分類,并且使用預(yù)測函數(shù)來預(yù)測測試集。輸出的是預(yù)測結(jié)果(疾病概率;臨界值為0.5,如果疾病概率≥0.5,則受試者處于肥胖癥的風(fēng)險(xiǎn))。54個(gè)mlg物種標(biāo)記物鑒別。為了鑒別237個(gè)mlg物種標(biāo)記物,發(fā)明人基于237個(gè)肥胖癥相關(guān)的mlg物種采用r版本2.14中的“隨機(jī)森林4.6-7包”。首先,本發(fā)明人通過“隨機(jī)森林”方法給出的重要性(liaw,andy&wiener,matthew,classificationandregressionbyrandomforest,rnews(2002),第2/3卷,第18頁,通過引用并入本文)將所有237個(gè)mlg物種進(jìn)行排序。通過創(chuàng)建從1個(gè)mlg物種開始并到包含所有237個(gè)mlg物種結(jié)束的排名靠前的mlg物種的增量子集來構(gòu)建mlg標(biāo)記物集。對于每個(gè)mlg標(biāo)記物集,發(fā)明人計(jì)算了158個(gè)樣本中的假預(yù)測比。最后,選擇出具有最低假預(yù)測比的54個(gè)mlg物種集作為mlg物種標(biāo)記物(表3和表4)。此外,發(fā)明人基于所選擇的mlg物種標(biāo)記物使用來自隨機(jī)森林模型的oob(outofbag)預(yù)測疾病概率來繪制roc曲線(表5-0、5-1、5-2、5-3、5-4),并且在158個(gè)樣品中,roc曲線下的面積(auc)為0.9651(圖2)。在最佳臨界值0.5294處,真陽性率(tpr)為0.8625,假陽性率(fpr)為0.07692,表明這54個(gè)mlg標(biāo)記物可用于準(zhǔn)確地分類肥胖癥個(gè)體。表354個(gè)與肥胖癥相關(guān)的最能判別的mlg(物種標(biāo)記物)表4.54個(gè)mlg物種的seqid表5-0在158個(gè)樣品中54個(gè)mlg的預(yù)測結(jié)果示例2.驗(yàn)證42個(gè)樣品(測試集)中的54個(gè)生物標(biāo)記物本發(fā)明人采用另一個(gè)新的獨(dú)立研究組(包括在上海交通大學(xué)醫(yī)學(xué)院瑞金醫(yī)院收集的17名肥胖癥患者和25名非肥胖癥對照)驗(yàn)證了肥胖癥分類器的辨別能力。提取每個(gè)樣品的dna并構(gòu)建dna文庫,然后如示例1所述進(jìn)行高通量測序。本發(fā)明人使用與qin等人,2012,同上中所述相同的方法計(jì)算這些樣品的基因豐度譜。然后確定如seqidno:1-48497所示的每個(gè)標(biāo)記物的基因相對豐度。本發(fā)明人通過使用來自該mlg的基因的相對豐度值(qin等人,2012,同上)估計(jì)了所有樣品中mlg的相對豐度。為了驗(yàn)證54個(gè)mlg標(biāo)記物,本發(fā)明人使用隨機(jī)森林來設(shè)置模型。關(guān)于隨機(jī)森林模型,采用r版本2.14中的“隨機(jī)森林4.6-7包”,輸入的是訓(xùn)練數(shù)據(jù)集(即所選擇的訓(xùn)練樣品中的mlg的相對豐度譜,表5-1、5-2、5-3、5-4)、樣品疾病狀態(tài)(訓(xùn)練樣品的樣品疾病狀態(tài)是向量,1為肥胖癥,0為對照)和測試集(僅為所選擇的測試集中的mlg的相對豐度譜)。然后,發(fā)明人使用來自r軟件中的隨機(jī)森林包的隨機(jī)森林函數(shù)來構(gòu)建分類,并且使用預(yù)測函數(shù)來預(yù)測測試集。輸出的是預(yù)測結(jié)果(疾病概率;臨界值為0.5,如果疾病概率≥0.5,則受試者處于肥胖癥的風(fēng)險(xiǎn))。然后本發(fā)明人預(yù)測了42個(gè)樣品,并計(jì)算每個(gè)樣品的疾病概率(表6)。預(yù)測錯(cuò)誤率為8/42=19.05%(圖3)。并且大多數(shù)肥胖癥患者(16/17)被正確診斷為肥胖癥。此外,測試集的roc由測試集的疾病概率繪制,auc=0.9188(圖4),其證實(shí)54個(gè)mlg標(biāo)記物可用于準(zhǔn)確地分類肥胖癥個(gè)體。在最佳臨界值0.592處,真陽性率(tpr)為0.8824,假陽性率(fpr)為0.16。表642個(gè)樣品的54個(gè)mlg的預(yù)測結(jié)果示例3.驗(yàn)證22個(gè)樣品(測試集)中的54個(gè)基因生物標(biāo)記物發(fā)明人使用另一個(gè)測試集樣品驗(yàn)證了肥胖癥分類器的辨別能力(表7),其中包括9個(gè)病例樣品和13個(gè)對照樣品(手術(shù)1個(gè)月后的5個(gè)樣品和手術(shù)3個(gè)月后的8個(gè)樣品),樣品也在上海交通大學(xué)醫(yī)學(xué)院瑞金醫(yī)院收集。病例表示手術(shù)前的樣本,對照表示手術(shù)后1個(gè)月和3個(gè)月。表722個(gè)樣品的信息*之前:手術(shù)前;1-m:一個(gè)月后手術(shù);3-m:三個(gè)月后手術(shù)。提取每個(gè)樣品的dna并構(gòu)建dna文庫,然后如示例1所述進(jìn)行高通量測序。本發(fā)明人使用與qin等人,2012,同上中所述相同的方法計(jì)算這些樣品的基因豐度譜。然后確定如seqidno:1-48497所示的每個(gè)標(biāo)記物的基因相對豐度。本發(fā)明人通過使用來自該mlg的基因的相對豐度值(qin等人,2012,同上)估計(jì)了所有樣品中mlg的相對豐度。為了驗(yàn)證54個(gè)mlg標(biāo)記物,本發(fā)明人使用隨機(jī)森林來設(shè)置模型。關(guān)于隨機(jī)森林模型,采用r版本2.14中的“隨機(jī)森林4.6-7包”,輸入的是訓(xùn)練數(shù)據(jù)集(即所選擇的訓(xùn)練樣品中的mlg的相對豐度譜,表5-1、5-2、5-3、5-4)、樣品疾病狀態(tài)(訓(xùn)練樣品的樣品疾病狀態(tài)是向量,1為肥胖癥,0為對照)和測試集(僅為所選擇的測試集中的mlg的相對豐度譜)。然后,發(fā)明人使用來自r軟件中的隨機(jī)森林包的隨機(jī)森林函數(shù)來構(gòu)建分類,并且使用預(yù)測函數(shù)來預(yù)測測試集。輸出的是預(yù)測結(jié)果(疾病概率;臨界值為0.5,如果疾病概率≥0.5,則受試者處于肥胖癥的風(fēng)險(xiǎn))。在手術(shù)樣品之前和之后計(jì)算疾病概率。這表明,手術(shù)后疾病概率降低(圖5,表8)。錯(cuò)誤率為9%(2/22)。為了得知每個(gè)樣本的變化,疾病概率如圖6所示。在三組中,手術(shù)樣品后的疾病概率顯著低于手術(shù)以前(圖7,表9),證實(shí)該54個(gè)mlg標(biāo)記物可用于準(zhǔn)確地分類肥胖癥個(gè)體。表822個(gè)樣品中54個(gè)mlg的預(yù)測結(jié)果表9三組中患病概率的p值之前1-m3-m之前0.00074374.114e-051-m0.8584因此,本發(fā)明人通過基于肥胖癥相關(guān)的基因標(biāo)記物的隨機(jī)森林模型鑒別出并驗(yàn)證了54個(gè)肥胖癥相關(guān)的腸道微生物。并且本發(fā)明人基于這54個(gè)腸道微生物構(gòu)建了評估了肥胖癥的風(fēng)險(xiǎn)的方法。盡管已經(jīng)示出和描述了說明性實(shí)施方案,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解的是,上述實(shí)施方案不能被解釋為限制本公開,并且可以對實(shí)施方案進(jìn)行改變、替換和修改而不脫離本發(fā)明的精神、原理和范圍。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1