本發(fā)明涉及生物標志物領(lǐng)域,具體的,本發(fā)明涉及疾病標志物及應用,更具體的,本發(fā)明涉及一種強直性脊柱炎微生物標志物、強直性脊柱炎標志物的用途、一種利用強直性脊柱炎標志物確定個體的狀態(tài)的方法、一種利用強直性脊柱炎標志物確定個體的狀態(tài)的裝置、一種利用強直性脊柱炎標志物對多個個體進行分類的方法、一種治療強直性脊柱炎的藥物以及一種制備治療強直性脊柱炎藥物的方法。
背景技術(shù):
強直性脊柱炎(ankylosingspondylitis,as)是一種主要侵犯脊柱,并累及骶髂關(guān)節(jié)和周圍關(guān)節(jié)的慢性進行性炎性疾病。起病多為15~30歲的男性,現(xiàn)在研究顯示,該病男女之比為2:1~3:1,強直性脊柱炎的病因目前尚未完全明確,近年來研究結(jié)果表明該病與遺傳素質(zhì)、感染及免疫等因素有關(guān)。
強直性脊柱炎一般起病比較隱匿,早期可無任何臨床癥狀,有些病人在早期可表現(xiàn)出輕度的全身癥狀,如乏力、消瘦、長期或間斷低熱、厭食、輕度貧血等。由于病情較輕,病人大多不能早期發(fā)現(xiàn),致使病情延誤,失去最佳治療時機。
強直性脊柱炎與人體白細胞抗原h(huán)la-b27密切相關(guān),據(jù)流行病學調(diào)查,強直性脊柱炎病人hla-b27陽性率高達90%~96%,而普通人群hla-27陽性率僅4%~9%;hla-b27陽性者強直性脊柱炎發(fā)病率約為10%~20%,而普通人群發(fā)病為1‰~2‰,相差約100倍。雖然hla-b27檢測對強直性脊柱炎的診斷有一定的幫助,但絕大部分的患者還要通過病史、體征和x線檢查作出診斷。目前,強直性脊柱炎的早期診斷主要是用ct、放射性核掃描、磁共振等影像學進行檢查,檢查過程較復雜。
隨著人體基因組測序完成及高通量測序技術(shù)的高速發(fā)展,基因篩查成為強直性脊柱炎診斷的方向,對于發(fā)現(xiàn)強直性脊柱炎潛在人群很有優(yōu)勢。研究表明超過70%的強直性脊柱炎患者患有腸道炎癥,這些患者中5~10%腸道炎癥很嚴重,可能會發(fā)展為臨床上的炎癥性腸病(ibd)或克羅恩氏病(cd)(mielantsetal.,1985)。克羅恩氏病(cd)的一些標記基因與強直性脊柱炎相關(guān)聯(lián)(parkesetal.,2013),說明兩種疾病可能有類似發(fā)病機制,可能與腸道失調(diào)相關(guān)。有研究表明與強直性脊柱炎相關(guān)的多基因在腸道免疫中起重要作用,如涉及 到白介素il-23途徑的基因?qū)δc道健康的調(diào)節(jié)起重要作用(wellcomeetal.,2007)。與健康對照相比,強直性脊柱炎患者及其直系親屬腸道通透性增加,再次說明腸道微生物在強直性脊柱炎中的重要作用(mielantsetal.,1991)。到目前為止,還沒有強直性脊柱炎患者腸道微生物標記物的相關(guān)報道。
技術(shù)實現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決上述技術(shù)問題之一或至少提供一種商業(yè)選擇。
依據(jù)本發(fā)明的第一方面,提供一種強直性脊柱炎微生物標志物,所述標志物由以下微生物組成:放線菌(actinomycessp.icm47)、短雙歧桿菌(bifidobacteriumbreve)、雙歧桿菌(bifidobacteriumsp.12_1_47bfaa)、長雙歧桿菌(bifidobacteriumlongum)、產(chǎn)氣柯林斯菌(collinsellaaerofaciens)、兩岐雙岐桿菌(bifidobacteriumbifidum)、假小鏈雙歧桿菌(bifidobacteriumpseudocatenulatum)、遲緩埃格特菌(eggerthellalenta)和鏈狀雙歧桿菌(bifidobacteriumcatenulatum)。
上述本發(fā)明一方面提供的強直性脊柱炎微生物標志物是發(fā)明人通過對大量患強直性脊柱炎個體和大量健康對照個體的糞便樣本中的微生物的豐度的差異比較分析、以及驗證,而確定下來的,明確了腸道微生物中強直性脊柱炎相關(guān)的微生物標志物。利用所稱的強直性脊柱微生物炎標志物,能夠確定個體處于患有強直性脊柱炎狀態(tài)的概率高低或者處于健康狀態(tài)的概率高低,能夠用于非侵入性的早期發(fā)現(xiàn)或輔助檢測強直性脊柱炎。
依據(jù)本發(fā)明的第二方面,本發(fā)明提供上述強直性脊柱炎微生物標志物在檢測強直性脊柱炎、監(jiān)測治療強直性脊柱炎、制備治療強直性脊柱炎的藥物和/或制備功能性食品中的用途。
上述強直性脊柱炎微生物標志物是發(fā)明人通過差異比較分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。相較于在健康群體組,所稱強直性脊柱炎標志物在強直性脊柱炎患者中顯著富集,所稱顯著富集是指與在健康組中的豐度相比,上述強直性脊柱炎標志物所包含的各種微生物在疾病組中的豐度均具有統(tǒng)計意義地高于或者明顯地、實質(zhì)性地高于在健康組中的豐度。能夠使其豐度減小的物質(zhì)能夠用于治療強直性脊柱炎或者益于強直性脊柱炎患者服用,能夠使其豐度減少的物質(zhì)不限于治療強直性脊柱炎的藥物和有益腸道菌群平衡的功能性食品,上述本發(fā)明一方面提供的強直性脊柱炎標志物能夠用于制備治療強直性脊柱炎的藥物和/或用于制備益于平衡腸道菌群的功能性食品、保健藥等。
依據(jù)本發(fā)明的第三方面,提供一種利用上述強直性脊柱炎微生物標志物確定個體的狀 態(tài)的方法,該方法包括:(1)確定所述個體的糞便樣本中的所述強直性脊柱炎標志物中的各種微生物的豐度;(2)分別將(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度與其在對照組中的豐度進行比較,依據(jù)獲得的比較結(jié)果確定所述個體的狀態(tài),所述對照組由一組或多組相同狀態(tài)的個體的糞便樣本組成,所述狀態(tài)包括患有強直性脊柱炎和不患有強直性脊柱炎。所稱強直性脊柱炎標志物是發(fā)明人通過差異比較分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。
上述本發(fā)明這一方面的方法基于檢測個體的糞便樣本中的強直性脊柱炎微生物標志物中的各種微生物的豐度,分別將檢測確定的各種微生物的豐度與其在對照組中豐度進行比較,依據(jù)獲得的比較結(jié)果能夠確定個體為強直性脊柱炎個體或者為健康個體的概率。為早期發(fā)現(xiàn)強直性脊柱炎提供一種非侵入性的輔助檢測方法。
上述本發(fā)明的這一方面的利用強直性脊柱炎微生物標志物確定個體的狀態(tài)的方法的全部或部分步驟,可以利用包含可拆分的相應單元功能模塊的裝置/系統(tǒng)來施行,或者將方法程序化、存儲于機器可讀介質(zhì),利用機器運行該可讀介質(zhì)來實現(xiàn)。
依據(jù)本發(fā)明的第四方面,提供一種利用上述強直性脊柱炎微生物標志物確定個體的狀態(tài)的裝置,該裝置用以實施本發(fā)明一方面的利用強直性脊柱炎微生物標志物確定個體的狀態(tài)的方法的全部或部分步驟,該裝置包括:數(shù)據(jù)輸入單元,用于輸入數(shù)據(jù);數(shù)據(jù)輸出單元,用于輸出數(shù)據(jù);處理器,用于執(zhí)行可執(zhí)行程序,執(zhí)行所述可執(zhí)行程序包括完成上述利用強直性脊柱炎確定個體的狀態(tài)的方法的所有或部分步驟;存儲單元,與所述數(shù)據(jù)輸入單元、所述數(shù)據(jù)輸出單元和所述處理器相連,用于存儲數(shù)據(jù),其中包括所述可執(zhí)行程序。上述對本發(fā)明一方面的利用強直性脊柱炎微生物標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的裝置,在此不再贅述。
依據(jù)本發(fā)明的第五方面,提供一種利用上述強直性脊柱炎微生物標志物確定個體狀態(tài)的系統(tǒng),該系統(tǒng)用以實施本發(fā)明一方面的利用強直性脊柱炎微生物標志物確定個體的狀態(tài)的方法的全部或部分步驟,該系統(tǒng)包括:微生物豐度確定單元,用于確定所述個體的糞便樣本中的所述強直性脊柱炎標志物中的各種微生物的豐度;個體狀態(tài)確定單元,用于分別將來自所述微生物豐度確定單元的所述強直性脊柱炎標志物中的各種微生物的豐度與其在對照組中的豐度進行比較,依據(jù)獲得的比較結(jié)果確定所述個體的狀態(tài),所述對照組由一組或多組相同狀態(tài)的個體的糞便樣本組成,所述狀態(tài)包括患有強直性脊柱炎和不患有強直性脊柱炎。上述對本發(fā)明一方面的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的系統(tǒng),在此不再贅述。
依據(jù)本發(fā)明的第六方面,提供一種利用上述強直性脊柱炎微生物標志物對多個個體進行分類的方法,該方法包括:分別利用上述本發(fā)明一方面的確定個體狀態(tài)的方法確定各個個體的狀態(tài);依據(jù)獲得的各個個體的狀態(tài)對所述各個個體進行分類。該方法能夠依據(jù)個體的狀態(tài)的不同區(qū)分開多個個體或者區(qū)分開多個未知的糞便樣本,便于歸類、標記管理。另外,上述對本發(fā)明一方面的利用強直性脊柱炎微生物標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的方法,在此不再贅述。
依據(jù)本發(fā)明的第七方面,提供一種治療強直性脊柱炎的藥物,所述藥物促使上述強直性脊柱炎微生物標志物中的各種微生物的豐度減少。所稱強直性脊柱炎微生物標志物是發(fā)明人通過差異分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。相較于在健康群體組,所稱強直性脊柱炎標志物在強直性脊柱炎疾病組中顯著富集,所稱顯著富集是指與在健康組中的豐度相比,上述強直性脊柱炎標志物所包含的各種微生物在疾病組中的豐度均具有統(tǒng)計意義地高于或者明顯地、實質(zhì)性地高于在健康組中的豐度。能夠使其豐度減少的物質(zhì)能夠用于治療強直性脊柱炎或者益于強直性脊柱炎患者服用,能夠使其豐度減少的物質(zhì)可以作為治療強直性脊柱炎的藥物。
利用本發(fā)明這一方面的藥物或者功能性食品,合理有效地應用確定的強直性脊柱炎微生物標志物,扶持腸道有益菌的生長和/或抑制腸道潛在致病菌,對于輔助降低血內(nèi)毒素水平和/或減輕強直性脊柱炎的臨床癥狀具有重要意義。
依據(jù)本發(fā)明的第八方面,本發(fā)明提供一種制備或篩選上述本發(fā)明一方面的治療強直性脊柱炎的藥物的方法,該方法包括制備或者篩選能夠促使上述本發(fā)明一方面的強直性脊柱炎標志物中的各個微生物的豐度減少的物質(zhì)作為所述藥物的步驟。
利用本發(fā)明這一方面的生產(chǎn)或篩選治療強直性脊柱炎的藥物的方法,通過合理有效地應用確定的強直性脊柱炎生物標志物進行篩選,能夠獲得能扶持腸道有益菌的生長和/或抑制腸道潛在致病菌的藥物,對于輔助降低血內(nèi)毒素水平和/或減輕強直性脊柱炎的臨床癥狀具有重要意義。
附圖說明
本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施方式的描述中將變得明顯和容易理解,其中:
圖1是本發(fā)明的實施例中的篩選鑒定強直性脊柱炎微生物標志物的試驗分析流程示意圖。
圖2是本發(fā)明的實施例中的微生物物種標志物作為診斷指標的auc評價結(jié)果示意圖。
具體實施方式
下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中,自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。需要說明的,本文中所使用的術(shù)語“第一”或者“第二”等僅為方便描述,不能理解為指示或暗示相對重要性,也不能理解為之間有先后順序關(guān)系。
在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。在本文中,除非另有明確的規(guī)定和限定,術(shù)語“相連”、“連接”等術(shù)語應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件內(nèi)部的連通。
生物學標志物是從生物學介質(zhì)中可以檢測到的細胞、生物化學或分子改變。生物學介質(zhì)包括各種體液、組織、細胞、糞便、頭發(fā)、呼氣等。
所稱的某種微生物的豐度指在某一微生物群體中該種微生物的豐富程度,例如在腸道微生物群體中該種微生物的豐富程度,可表示為該種微生物在該群體中的含量。
所稱序列的一致性(identity)和序列的相似度(similarity)分別指序列間相同或相似的程度。
根據(jù)本發(fā)明的一個實施方式提供的一種強直性脊柱炎生物標志物,檢測該生物標志物的變化可以確定個體患有強直性脊柱炎的相對概率高低。所述強直性脊柱炎微生物標志物由以下微生物組成:放線菌(actinomycessp.icm47)、短雙歧桿菌(bifidobacteriumbreve)、雙歧桿菌(bifidobacteriumsp.12_1_47bfaa)、長雙歧桿菌(bifidobacteriumlongum)、產(chǎn)氣柯林斯菌(collinsellaaerofaciens)、兩岐雙岐桿菌(bifidobacteriumbifidum)、假小鏈雙歧桿菌(bifidobacteriumpseudocatenulatum)、遲緩埃格特菌(eggerthellalenta)和鏈狀雙歧桿菌(bifidobacteriumcatenulatum)。
所稱的強直性脊柱炎微生物標志物是發(fā)明人通過對大量強直性脊柱炎個體和大量健康對照個體的糞便樣本中的微生物的豐度進行差異比較分析、以及驗證,而確定下來的,明確了腸道微生物中強直性脊柱炎相關(guān)的微生物標志物。利用所稱的強直性脊柱炎標志物,能夠確定個體處于患有強直性脊柱炎狀態(tài)的概率或者處于健康狀態(tài)的概率,能夠用于非侵入性的早期發(fā)現(xiàn)、輔助檢測強直性脊柱炎等。
根據(jù)本發(fā)明一個實施方式提供的上述強直性脊柱炎微生物標志物在檢測強直性脊柱 炎、監(jiān)測治療強直性脊柱炎、制備治療強直性脊柱炎的藥物和/或在制備功能性食品中的用途。所強直性脊柱炎微生物標志物是發(fā)明人通過差異比較分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。相較于在健康群體組,所稱強直性脊柱炎微生物標志物在強直性脊柱炎疾病組中顯著富集,所稱顯著富集是指與在健康組中的豐度相比,上述強直性脊柱炎標志物所包含的各種微生物在疾病組中的豐度均具有統(tǒng)計意義地高于或者明顯地、實質(zhì)性地高于在健康組中的豐度。
能夠使所稱強直性脊柱炎標志物豐度減小的物質(zhì)能夠用于治療強直性脊柱炎或者益于強直性脊柱炎患者服用,能夠使所稱強直性脊柱炎標志物豐度減小的物質(zhì)不限于治療強直性脊柱炎的藥物和有益腸道菌群平衡的功能性食品,該實施方式提供的強直性脊柱炎標志物能夠用于制備治療強直性脊柱炎的藥物和/或用于制備益于平衡腸道菌群的功能性食品、保健藥等。
根據(jù)本發(fā)明的另一個實施方式提供的一種利用上述實施例中的強直性脊柱炎標志物確定個體的狀態(tài)的方法,該方法包括以下步驟(1)和(2):
(1)確定待測個體中的強直性脊柱炎微生物標志物的豐度。
確定待測個體的糞便樣本中的強直性脊柱炎微生物標志物中的各種微生物的豐度。
根據(jù)本發(fā)明的實施例,進行以下以完成該步驟:獲得所述個體的糞便樣本中的核酸序列的測序數(shù)據(jù),所述測序數(shù)據(jù)包括多個讀段;將所述讀段比對至所述標志物中的各種微生物的基因組,獲得比對結(jié)果;依據(jù)所述比對結(jié)果,確定所述標志物中的各種微生物的豐度。
所稱的測序數(shù)據(jù)通過對樣本中的核酸序列進行測序得來,測序依據(jù)所選的測序平臺的不同,可選擇但不限于半導體測序技術(shù)平臺比如pgm、ionproton、bgiseq-100平臺,合成邊測序的技術(shù)平臺比如illumina公司的hiseq、miseq序列平臺以及單分子實時測序平臺比如pacbio序列平臺。測序方式可以選擇單端測序,也可以選擇雙末端測序,獲得的下機數(shù)據(jù)是測讀出來的片段,稱為讀段(reads)。
比對可以利用已知比對軟件進行,例如soap、bwa和teramap等,在比對過程中,一般對比對參數(shù)進行設置,設置一個或者一對讀段(reads)最多允許有s個堿基錯配(mismatch),例如設置s≤2,若reads中有超過s個堿基發(fā)生錯配,則視為該reads無法比對到(比對上)該組裝片段上。所稱的獲得的比對結(jié)果包含各條讀段與各物種的基因組的比對情況,包括讀段是否能夠比對上某個或某些物種的基因組、只唯一比對到一種物種還是比對到多種物種的基因組、比對到物種的基因組的位置、比對到物種基因組的唯一位置還是多個位置等信息。根據(jù)本發(fā)明的一個實施例,利用soapalign2.21進行比對,設置參 數(shù)為–r2–m100–x1000。
所稱微生物的基因組指預先確定的該微生物物種的序列,可以是預先獲得的待測樣本所屬或者所包含的生物類別的任意參考模板,例如,目標是待測樣本中的微生物,參考序列可選擇ncbi數(shù)據(jù)庫中的各種微生物的參考基因組和/或hmp、metahit項目公開的dacc腸道基因組,進一步地,也可以預先配置包含更多參考序列的資源庫,例如依據(jù)待測樣本來源的個體的狀態(tài)、地域等因素選擇或是測定組裝出更接近的序列作為參考序列。根據(jù)本發(fā)明的一個實施例,各種微生物的參考基因組從公開的數(shù)據(jù)庫中獲得,通常的,一種微生物的參考基因組有多個版本,即一種微生物有多個公開的基因組。
reads與物種的參考基因組比對,比對上的可以被分為兩部分:a)uniquereads(u):唯一比對上一個物種的基因組;稱這些reads為uniquereads。即,如果reads比對上的基因組均來自同一物種,定義這些reads為uniquereads。b)multiplereads(m):比對上一個以上物種的基因組,定義為multiplereads。即,如果reads比對上的基因組來自至少兩種物種,定義這些reads為multiplereads。
根據(jù)本發(fā)明的一個實施例,所稱依據(jù)測序數(shù)據(jù),所述依據(jù)比對結(jié)果,確定所述標志物中的各種微生物的豐度,包括利用以下公式確定微生物物種s的豐度:微生物物種s的豐度ab(s)=ab(us)+ab(ms),其中,ab(us)=us/ls,us為唯一比對上該種微生物s的讀段數(shù)目,ls為比對上的該種微生物s的基因組的長度,
對于給定的微生物物種s,其豐度為ab(s),與uniquereads和multiplereads相關(guān),上述公式中的ab(u)和ab(m)分別為該物種s的uniquereads和multiplereads貢獻的豐度。每個multiplereads,有特異的物種豐度系數(shù)co,假設一條multiplereads比對上n個物種,可以利用下列公式計算該條multiplereads的co:
(2)豐度比較,以確定個體狀態(tài)。
分別將(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度與其在對照組中的豐度進行比較,依據(jù)獲得的比較結(jié)果確定所述個體的狀態(tài),所述對照組由一組或多組相同狀態(tài)的個體的糞便樣本組成,所述狀態(tài)包括患有強直性脊柱炎狀態(tài)和健康狀態(tài)。所稱強直性脊柱炎標志物是發(fā)明人通過差異比較分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。
所稱標志物中的各種微生物在對照組中的豐度可以與待測個體的同時測定或者先后測定。根據(jù)本發(fā)明的一個實施例,將標志物中的各種微生物在對照組中的豐度預先測定保存,用以作為設定閾值的依據(jù)。將標志物中的微生物在待測個體樣本中的豐度與所稱的閾值比較,基于二者的差異程度,進行待測個體的狀態(tài)的確定。所稱閾值可以為一數(shù)值或者數(shù)值范圍,例如,基于某種微生物在對照組中的豐度均值,該微生物對應的閾值可以設為該豐度均值的95%的置信區(qū)間。
根據(jù)本發(fā)明的實施例,對照組由多個患強直性脊柱炎的個體的糞便樣本組成,該步驟(2)包括:當步驟(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度都與其在對照組中的豐度無差異,確定所述個體的狀態(tài)為患有強直性脊柱炎。根據(jù)本發(fā)明的實施例,所述無差異為來自所述微生物豐度確定單元的強直性脊柱炎標志物中的各種微生物的豐度落入其在對照組中的豐度的第一預定置信區(qū)間,任選的所述第一預定置信區(qū)間為95%置信區(qū)間。
所稱無差異為步驟(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度都落入其在對照組中的豐度的第一預定置信區(qū)間。所稱的置信區(qū)間是指由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間。在統(tǒng)計學中,一個概率樣本的置信區(qū)間(confidenceinterval)是對這個樣本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。置信區(qū)間給出的是被測量參數(shù)的測量值的可信程度,即前面所要求的“一定概率”。這個概率被稱為置信水平。
根據(jù)本發(fā)明的實施例,對照組由多個健康個體的糞便樣本組成,該步驟(2)包括:當步驟(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度都與其在對照組中的豐度無差異,確定所述個體的狀態(tài)為沒有患強直性脊柱炎。所稱無差異為(1)中確定的強直性脊柱炎標志物中的各種微生物的豐度都落入其在對照組中的豐度的第二預定置信區(qū)間,任選的所述第二預定置信區(qū)間為95%置信區(qū)間。
需要說明的是,根據(jù)目的或要求不同,可能對確定個體狀態(tài)結(jié)果的可信程度有不同的要求,本領(lǐng)域技術(shù)人員可以選擇不同的顯著性水平(α),即選擇不同的可能犯錯誤的概率,如此,確定的個體的狀態(tài)的可信程度為1-α。例如,利用該實施例確定個體處于所確定出的 狀態(tài)95%是可靠的。
該方法基于檢測個體的糞便樣本中的強直性脊柱炎標志物中的各種微生物的豐度,分別將檢測確定的各種微生物的豐度與其在對照組中豐度進行比較,依據(jù)獲得的比較結(jié)果能夠確定個體為強直性脊柱炎個體或者為健康個體的概率。為早期發(fā)現(xiàn)強直性脊柱炎提供一種非侵入性的輔助檢測或者輔助干預治療的方法。
以上任一實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的全部或部分步驟,可以利用包含可拆分的相應單元功能模塊的裝置/系統(tǒng)來施行,或者將方法程序化、存儲于機器可讀介質(zhì),利用機器運行該可讀介質(zhì)來實現(xiàn)。
根據(jù)本發(fā)明的一個實施方式提供的一種利用上述本發(fā)明實施例中的強直性脊柱炎標志物確定個體的狀態(tài)的裝置,該裝置用以實施上述本發(fā)明實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的全部或部分步驟,該裝置包括:數(shù)據(jù)輸入單元,用于輸入數(shù)據(jù);數(shù)據(jù)輸出單元,用于輸出數(shù)據(jù);處理器,用于執(zhí)行可執(zhí)行程序,執(zhí)行所述可執(zhí)行程序包括完成上述本發(fā)明任一實施例中的確定個體的狀態(tài)的方法;存儲單元,與所述數(shù)據(jù)輸入單元、所述數(shù)據(jù)輸出單元和所述處理器相連,用于存儲數(shù)據(jù),其中包括所述可執(zhí)行程序。上述對本發(fā)明任一實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的裝置,在此不再贅述。
根據(jù)本發(fā)明的一個實施方式提供的一種利用上述本發(fā)明實施例中的強直性脊柱炎標志物確定個體的狀態(tài)的系統(tǒng),該裝置用以實施上述本發(fā)明任一實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的全部或部分步驟,該系統(tǒng)包括:微生物豐度確定單元,用于確定所述個體的糞便樣本中的所述強直性脊柱炎標志物中的各種微生物的豐度;個體狀態(tài)確定單元,用于分別將來自所述微生物豐度確定單元的所述強直性脊柱炎標志物中的各種微生物的豐度與其在對照組中的豐度進行比較,依據(jù)獲得的比較結(jié)果確定所述個體的狀態(tài),所述對照組由一組或多組相同狀態(tài)的個體的糞便樣本組成,所述狀態(tài)包括患有強直性脊柱炎和不患有強直性脊柱炎。上述對本發(fā)明任一實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的系統(tǒng)。
根據(jù)本發(fā)明的實施例,所述微生物豐度確定單元用于進行以下:獲得所述個體的糞便樣本中的核酸序列的測序數(shù)據(jù),所述測序數(shù)據(jù)包括多個讀段;將所述讀段比對至所述標志物中的各種微生物的基因組,獲得比對結(jié)果;依據(jù)所述比對結(jié)果,確定所述標志物中的各種微生物的豐度。
所稱的測序數(shù)據(jù)通過對樣本中的核酸序列進行測序得來,測序依據(jù)所選的測序平臺的不同,可選擇但不限于半導體測序技術(shù)平臺比如pgm、ionproton、bgiseq-100平臺,合 成邊測序的技術(shù)平臺比如illumina公司的hiseq、miseq序列平臺以及單分子實時測序平臺比如pacbio序列平臺。測序方式可以選擇單端測序,也可以選擇雙末端測序,獲得的下機數(shù)據(jù)是測讀出來的片段,稱為讀段(reads)。
比對可以利用已知比對軟件進行,例如soap、bwa和teramap等,在比對過程中,一般對比對參數(shù)進行設置,設置一個或者一對讀段(reads)最多允許有s個堿基錯配(mismatch),例如設置s≤2,若reads中有超過s個堿基發(fā)生錯配,則視為該reads無法比對到(比對上)該組裝片段上。所稱的獲得的比對結(jié)果包含各條讀段與各物種的基因組的比對情況,包括讀段是否能夠比對上某個或某些物種的基因組、只唯一比對到一種物種還是比對到多種物種的基因組、比對到物種的基因組的位置、比對到物種基因組的唯一位置還是多個位置等信息。根據(jù)本發(fā)明的一個實施例,利用soapalign2.21進行比對,設置參數(shù)為–r2–m100–x1000。
所稱微生物的基因組指預先確定的該微生物物種的序列,可以是預先獲得的待測樣本所屬或者所包含的生物類別的任意參考模板,例如,目標是待測樣本中的微生物,參考序列可選擇ncbi數(shù)據(jù)庫中的各種微生物的參考基因組和/或hmp、metahit項目公開的dacc腸道基因組,進一步地,也可以預先配置包含更多參考序列的資源庫,例如依據(jù)待測樣本來源的個體的狀態(tài)、地域等因素選擇或是測定組裝出更接近的序列作為參考序列。根據(jù)本發(fā)明的一個實施例,各種微生物的參考基因組從公開的數(shù)據(jù)庫中獲得,通常的,一種微生物的參考基因組有多個版本,即一種微生物有多個公開的基因組。
reads與物種的參考基因組比對,比對上的可以被分為兩部分:a)uniquereads(u):唯一比對上一個物種的基因組;稱這些reads為uniquereads。即,如果reads比對上的基因組均來自同一物種,定義這些reads為uniquereads。b)multiplereads(m):比對上一個以上物種的基因組,定義為multiplereads。即,如果reads比對上的基因組來自至少兩種物種,定義這些reads為multiplereads。
根據(jù)本發(fā)明的一個實施例,所稱依據(jù)測序數(shù)據(jù),所述依據(jù)比對結(jié)果,確定所述標志物中的各種微生物的豐度,包括利用以下公式確定微生物物種s的豐度:微生物物種s的豐度ab(s)=ab(us)+ab(ms),其中,ab(us)=us/ls,us為唯一比對上該種微生物s的讀段數(shù)目,ls為比對上的該種微生物s的基因組的長度,
對于給定的微生物物種s,其豐度為ab(s),與uniquereads和multiplereads相關(guān),上述公式中的ab(u)和ab(m)分別為該物種s的uniquereads和multiplereads貢獻的豐度。每個multiplereads,有特異的物種豐度系數(shù)co,假設一條multiplereads比對上n個物種,可以利用下列公式計算該條multiplereads的co:
根據(jù)本發(fā)明的實施例,所述個體狀態(tài)確定單元中的對照組包括多個患強直性脊柱炎的個體的糞便樣本,所述個體狀態(tài)確定單元用于進行以下:當來自所述微生物豐度確定單元的所述強直性脊柱炎標志物中的各種微生物的豐度都與其在對照組中的豐度無差異,確定所述個體的狀態(tài)為患有強直性脊柱炎。
根據(jù)本發(fā)明的實施例,所述無差異為來自所述微生物豐度確定單元的強直性脊柱炎標志物中的各種微生物的豐度落入其在對照組中的豐度的第一預定置信區(qū)間,任選的所述第一預定置信區(qū)間為95%置信區(qū)間。
根據(jù)本發(fā)明的實施例,所述個體狀態(tài)確定單元中的對照組包括多個健康個體的糞便樣本,所述個體狀態(tài)確定單元用于進行以下:當來自所述微生物豐度確定單元的所述強直性脊柱炎標志物中的各種微生物的豐度都與其在對照組中的豐度無差異,確定所述個體的狀態(tài)為沒有患強直性脊柱炎。
根據(jù)本發(fā)明的實施例,所述無差異為來自所述微生物豐度確定單元的強直性脊柱炎標志物中的各種微生物的豐度落入其在對照組中的豐度的第二預定置信區(qū)間,任選的所述第二預定置信區(qū)間為95%置信區(qū)間。
根據(jù)本發(fā)明的另一個實施方式提供的一種利用上述本發(fā)明任一實施例的強直性脊柱炎標志物對多個個體進行分類的方法,該方法包括:分別利用上述本發(fā)明任一實施例中的確定個體的狀態(tài)的方法確定各個個體的狀態(tài);依據(jù)獲得的各個個體的狀態(tài)對各個個體進行分類。該方法能夠依據(jù)個體的狀態(tài)的不同區(qū)分開多個個體或者區(qū)分開多個未知的糞便樣本,便于歸類、標記管理。另外,上述對本發(fā)明任一實施例中的利用強直性脊柱炎標志物確定個體的狀態(tài)的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的方法,在此不再 贅述。
根據(jù)本發(fā)明的又一個實施方式提供的一種治療強直性脊柱炎的藥物,所述藥物能夠促使上述本發(fā)明任一實施例中的強直性脊柱炎標志物中的各個微生物的豐度減少。所稱強直性脊柱炎標志物是發(fā)明人通過差異分析各種腸道微生物在強直性脊柱炎疾病組和健康組的糞便樣本中的豐度,以及經(jīng)過大量已知狀態(tài)的糞便樣本的驗證,而確定下來的。相較于在健康群體組,所稱強直性脊柱炎標志物在強直性脊柱炎疾病組中顯著富集,所稱顯著富集是指與在健康組中的豐度相比,上述強直性脊柱炎標志物所包含的各種微生物在疾病組中的豐度均具有統(tǒng)計意義地高于或者明顯地、實質(zhì)性地高于在健康組中的豐度。能夠使其豐度減少的物質(zhì)能夠用于治療強直性脊柱炎或者益于強直性脊柱炎患者服用,能夠使其豐度減少的物質(zhì)可以作為治療強直性脊柱炎的藥物。
利用這一實施方式的藥物或者功能性食品,合理有效地應用確定的強直性脊柱炎微生物標志物,扶持腸道有益菌的生長和/或抑制腸道潛在致病菌,可以阻止腸道屏障的缺損,改善并恢復腸道微生態(tài)結(jié)構(gòu),對于輔助降低血內(nèi)毒素水平和/或減輕強直性脊柱炎的臨床癥狀具有重要意義。
根據(jù)本發(fā)明的又一個實施方式,提供一種制備或篩選上述實施方式中的治療強直性脊柱炎的藥物的方法,該方法包括制備或者篩選能夠促使上述本發(fā)明任一實施例中的強直性脊柱炎標志物中的各個微生物的豐度減少的物質(zhì)作為所述藥物的步驟。
利用本發(fā)明該實施方式中的生產(chǎn)或篩選治療強直性脊柱炎的藥物的方法,通過合理有效地應用確定的強直性脊柱炎生物標志物進行篩選,能夠獲得能扶持腸道有益菌的生長和/或抑制腸道潛在致病菌的藥物,可以阻止腸道屏障的缺損,改善并恢復腸道微生態(tài)結(jié)構(gòu),對于輔助降低血內(nèi)毒素水平和/或減輕強直性脊柱炎的臨床癥狀具有重要意義。
以下結(jié)合具體實施例對本發(fā)明的方法和/或裝置進行詳細的描述。除另有交待,以下實施例中涉及的未特別交待的試劑、序列(接頭、標簽和引物)、軟件及儀器,都是常規(guī)市售產(chǎn)品或者開源的,例如購買illumina的轉(zhuǎn)錄組文庫構(gòu)建試劑盒。
以下實施例包括第一階段和第二階段,即對應發(fā)現(xiàn)階段和驗證階段。發(fā)現(xiàn)階段包括:基于分析比較73個強直性脊柱炎患者及83個健康對照組的腸道微生物成分及功能改變,以確定物種標志物;驗證階段包括:利用24個as患者及31個健康對照組驗證第一階段結(jié)果的準確性。
實施例1
該示例中,發(fā)明人從73個強直性脊柱炎患者、83個健康對照的糞便樣品開展整個腸道菌群微生物的關(guān)聯(lián)分析研究描述糞便微生物群落及功能成分特征??偟膩碚f,發(fā)明人下 載約428.09gb高質(zhì)量的測序數(shù)據(jù)(lc健康人)以及實驗測序得到的294gb高質(zhì)量測序數(shù)據(jù)構(gòu)建了強直性脊柱炎參照基因集,并且和下載的lc基因集、igc基因集構(gòu)建一個更加完整的基因集。宏基因組分析顯示,17個微生物物種與強直性脊柱炎疾病密切相關(guān),其中7個菌在健康人的腸道微生物中富集,10個菌在強直性脊柱炎病人的腸道微生物中富集。
1、測序數(shù)據(jù)的獲取
1.1樣本收集和dna提取
強直性脊柱炎患者來自杭州浙江中醫(yī)藥大學第一附屬醫(yī)院,實驗共采集了73個中國強直性脊柱炎患者的糞便樣品,其中每個個體的新鮮糞便樣品分成200mg/份,共5份,立即-80℃冰箱冷凍保存。
73個中國強直性脊柱炎患者的糞便樣品中提取總dna。苯酚三氯甲烷處理提取dna方法提取dna。
1.2構(gòu)建文庫及測序,以及參照數(shù)據(jù)下載
dna建庫按儀器制造商(illumina)的操作指南進行。對文庫進行pe100bp測序。illuminahiseq2000(illumina,sandiego,ca)平臺對73個樣品的文庫進行測序。每個樣本平均產(chǎn)生4.03gb(sd.±0.64gb)高質(zhì)量測序結(jié)果,總計294gb測序數(shù)據(jù)量。
從ebi下載83個健康中國人的測序數(shù)據(jù),accession號:erp005860。
參照圖1的實驗流程,鑒定強直性脊柱炎的相關(guān)生物標志物,其中省略的步驟或者細節(jié)為本領(lǐng)域技術(shù)人員所熟知,幾個重要步驟介紹如下面步驟所述。
2、生物標志物的鑒定
2.1測序數(shù)據(jù)的基本處理
1)測序數(shù)據(jù)經(jīng)過質(zhì)控:獲得第一階段的73個as樣品的測序數(shù)據(jù)以后,對其進行過濾,質(zhì)控按以下標準進行:a)去除低質(zhì)量堿基(q20)大于50%的reads;b)移除大于5個n堿基的reads;c)移除尾部低質(zhì)量(q20)和n堿基。丟失成對reads的序列被認為是單條reads用于組裝。
2)同樣處理下載的健康人數(shù)據(jù)。
3)lc基因集獲自
qin,n.etal.alterationsofthehumangutmicrobiomeinlivercirrhosis.nature513,59-64(2014).,從
ftp://climb.genomics.cn/pub/10.5524/100001_101000/100064/1.genecatalogs/igc.fa.gz下載得到igc基因集。
2.2物種豐度分析
利用soapalign2.21將經(jīng)過上步驟處理的paired-endcleanreads比對(匹配)到冗余基因組,這里,所稱的冗余基因組來自各數(shù)據(jù)庫中公開的的細菌的參考基因組。比對參數(shù)為–r2–m100–x1000。reads與冗余基因組比對,可能被分為兩部分:a)uniquereads(u):reads只比對上一個物種的基因組;這些reads被定義為uniquereads。即,如果這些基因組來自同一物種,reads與一個以上的基因組比對,發(fā)明人將這些reads定義為uniquereads。b)multiplereads(m):如果reads比對上一個物種以上的基因組,定義為multiplereads。即,如果比對上的基因組來自不同物種,發(fā)明人定義這些reads為multiplereads。
對于物種s,其豐度為ab(s),與特有的ureads和共享的mreads相關(guān),豐度的計算方式如下:
ab(s)=ab(u)+ab(m)
ab(u)=u/l
ab(u)和ab(m)分別為來自該物種s的uniquereads和multiplereads的豐度,l表示基因組的長度。每個multiplereads,有特異物種系數(shù)co;假設某一multiplereads比對上n個物種,按以下方法計算該條multiplereads的co:
對于這些reads,發(fā)明人以加和的n個物種的uniquereads的豐度作為標準。即對于multiplereads,發(fā)明人把其所比對上的n個物種的uniquereads豐度之和作為分母。
2.3關(guān)聯(lián)分析/篩選物種標記物
為了獲得與強直性脊柱炎疾病密切相關(guān)的腸道微生物物種標記物,發(fā)明人利用強直性脊柱炎患者組(73例)與健康人組(83例)兩組腸道微生物物種豐度數(shù)據(jù),在物種級別做了一個與疾病相關(guān)性的研究。
基于上步驟得到的物種豐度表,發(fā)明人設置標準如下:(1)強直性脊柱炎患者組或健康人組物種豐度的中位數(shù)必須大于0.00001;(2)通過結(jié)合benjaminihochberg的多重檢驗的wilcoxon秩和檢驗進行檢驗,得到每個物種和強直性脊柱炎疾病的相關(guān)性p值和q值;(3)使用一個相對非常嚴格的閾值(q_values<5.0e-05)。然后,發(fā)明人得到28個與強直性脊柱炎疾病密切相關(guān)的腸道微生物物種。其中在強直性脊柱炎(as)患者中富集的有14個物種,在健康人(hd)中富集的有14個物種。這28個微生物物種標記物如下表1所示。
表1
實施例2
為了證實實施例1中的分析結(jié)果可以用以作為強直性脊柱炎物種標志物,進一步比較驗證群體中的31個健康人及24個強直性脊柱炎患者的物種豐度,并對最終微生物物種標記物根據(jù)驗證情況做出篩選。驗證群體的測序數(shù)據(jù)的獲得與處理,參照實施例1進行。
驗證結(jié)果如下:上述富集在健康人群中的14個物種中,7個在驗證集中得到高質(zhì)量的驗證(p_values<0.05),健康人富集的微生物物種標志物驗證的p值和q值情況如下表2所示。微生物物種分別為毛螺科菌(lachnospiraceaebacterium6_1_63faa)、死亡梭桿菌(fusobacteriummortiferum)、擬桿菌([bacteroides]pectinophilus)、陰溝腸桿菌(enterobacter cloacae)、挑剔真桿菌(eubacteriumeligens)、毛螺科菌(lachnospiraceaebacterium8_1_57faa)、梭菌(clostridiumsp.l2-50)。擬桿菌存在于人體腸道中,主要是幫助分解食物以提供人體所需的營養(yǎng)和能量。
表2
對于上述富集在強直性脊柱炎患者中的14個物種,其中10個在驗證集中得到高質(zhì)量的驗證(p_values<0.05),強直性脊柱炎患者富集的微生物物種標志物驗證的p值和q值情況如下表3所示,分別為放線菌(actinomycessp.icm47)、短雙歧桿菌(bifidobacteriumbreve)、雙歧桿菌(bifidobacteriumsp.12_1_47bfaa)、長雙歧桿菌(bifidobacteriumlongum)、產(chǎn)氣柯林斯菌(collinsellaaerofaciens)、兩岐雙岐桿菌(bifidobacteriumbifidum)、假小鏈雙歧桿菌(bifidobacteriumpseudocatenulatum)、遲緩埃格特菌(eggerthellalenta)、鏈狀雙歧桿菌(bifidobacteriumcatenulatum)、青春雙歧桿菌(bifidobacteriumadolescentis)。
雙歧桿菌可以預防腹瀉,減少便秘,即雙向調(diào)節(jié)。有研究表明超過70%的強直性脊柱炎患者患有腸道炎癥,這些患者中5~10%腸道炎癥很嚴重,可能會發(fā)展為臨床上的炎癥性腸病(ibd)或克羅恩氏病(cd)(mielantsetal.,1985),研究發(fā)現(xiàn)ibd病人腸道中擬桿菌、梭狀芽胞桿菌、厚壁菌下降,放線菌、變形菌比例升高。
表3
發(fā)明人認為,可以將從健康人富集的7個微生物物種標記物,作為強直性脊柱炎疾病患病的反向指標,或作為治療強直性脊柱炎進行研發(fā)的微生物制劑藥物菌群成分,或作為檢測強直性脊柱炎、監(jiān)測強直性脊柱炎治療進程的恢復指標;將強直性脊柱炎患者富集的10個微生物物種標記物,作為強直性脊柱炎疾病患病的正向指標,特別用于強直性脊柱炎疾病非創(chuàng)傷式的檢測和診斷。
發(fā)明人利用這17個微生物物種標記物,構(gòu)建一個綜合指標,估計roc(receiver-operatingcharacteristic)曲線下面積auc,auc越大,表示診斷能力越高,評價綜合得分對應其對強直性脊柱炎的診斷能力。通過對一期(第一階段)的156個樣品和二期(第二階段)的55個樣品進行評測,具體情況如圖2所示,都表現(xiàn)出了很好的診斷能力,在一期得到auc=96.62%,如圖2左邊圖所示,置信區(qū)間為93.93%-99.31%;二期得到auc=89.92%,如圖2右邊圖所示,置信區(qū)間為81.28%-98.56%。
實施例3
利用45個糞便樣本進行樣本來源的個體狀態(tài)的檢測。
參照實施例2的方法確定各糞便樣本中的表3的放線菌(actinomycessp.icm47)、短雙歧桿菌(bifidobacteriumbreve)、雙歧桿菌(bifidobacteriumsp.12_1_47bfaa)、長雙歧桿菌(bifidobacteriumlongum)、產(chǎn)氣柯林斯菌(collinsellaaerofaciens)、兩岐雙岐桿菌(bifidobacteriumbifidum)、假小鏈雙歧桿菌(bifidobacteriumpseudocatenulatum)、遲緩埃格特菌(eggerthellalenta)和鏈狀雙歧桿菌(bifidobacteriumcatenulatum)的豐度,判斷各樣本中的這九種菌株豐度是否落入各自在疾病對照組或者健康對照組的豐度的95%的置信區(qū)間,判定這九種菌種的豐度均落入疾病組的對應區(qū)間的樣本所對應的個體的狀態(tài)為強直性脊柱炎患者,判定九種菌種的豐度均落入健康組的對應區(qū)間的樣本所對應的個體的狀態(tài)為非強直性脊柱炎患者。
結(jié)果顯示,利用上述方法能夠?qū)ζ渲械?9個樣本進行個體狀態(tài)判斷,而且對這39個 樣本中的38個樣本對應個體的狀態(tài)的判斷,與記錄的該樣本來源個體的狀態(tài)一致。
另外,發(fā)明人發(fā)現(xiàn)對表2和表3中的物種聯(lián)合檢測,例如檢測表3中的物種標志物被富集,同時表2中物種標記物不被富集,能夠更準確的判斷發(fā)現(xiàn)強直性脊柱炎患者或易感人群。
在利用標志物治療強直性脊柱炎的方案中,發(fā)明人發(fā)現(xiàn)使3中的物種標志物生長得到抑制或者清除,同時使表2中物種標記物被富集,治療效果極佳。
在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。