本發(fā)明涉及基因突變體及其應用。具體地,本發(fā)明涉及分離的核酸、分離的多肽、篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法、篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)、用于篩選易感原發(fā)性纖毛運動障礙征的生物樣品的試劑盒、構建體以及重組細胞。
背景技術:
原發(fā)性纖毛運動障礙(primary ciliary dyskinesia,PCD),又稱纖毛不動綜合征(immobile cilia syndrome),是因纖毛結構缺陷導致活動障礙引起纖毛清除功能降低及其他功能障礙的基因遺傳病。該病臨床表現(xiàn)多樣,可累及多個器官組織,其診斷和鑒別診斷存在困難。PCD現(xiàn)階段,尋找致病基因對疾病診斷或治療意義重大。雖然目前已發(fā)現(xiàn)一些PCD的致病基因,但熱點率相對較低,且目前已報道的PCD亞型多達18個,涉及數(shù)十幾個基因,因此,仍存在著相當一部分未知致病基因位點。
因而,目前對原發(fā)性纖毛運動障礙征的研究仍有待深入。
技術實現(xiàn)要素:
本發(fā)明旨在至少解決現(xiàn)有技術中存在的技術問題之一。為此,本發(fā)明的一個目的在于提出一種能夠有效篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法。
本發(fā)明是基于發(fā)明人的下列工作而完成的:發(fā)明人通過高通量外顯子組測序聯(lián)合候選基因突變驗證的方法確定了原發(fā)性纖毛運動障礙征的致病基因上的新突變。
根據(jù)本發(fā)明的第一方面,本發(fā)明提出了一種分離的核酸。根據(jù)本發(fā)明的實施例,與SEQ ID NO:1相比,該核酸具有c.G8030A突變;或者與SEQ ID NO:3相比,該核酸具有c.C6265T突變。根據(jù)本發(fā)明的實施例,發(fā)明人確定了DNAH5和DNAH11基因突變體,這些新突變體與原發(fā)性纖毛運動障礙征的發(fā)病密切相關,從而通過檢測這些新突變體在生物樣品中是否存在,可以有效地檢測生物樣品是否易感原發(fā)性纖毛運動障礙征。
根據(jù)本發(fā)明的第二方面,本發(fā)明提出了一種分離的多肽。根據(jù)本發(fā)明的實施例,與SEQ ID NO:2相比,該分離的多肽具有p.R2677Q突變;或者與SEQ ID NO:4相比,該分離的多肽具有p.R2089*突變。通過檢測生物樣品中是否表達該多肽,可以有效地檢測生物樣品是否易感原發(fā)性纖毛運動障礙征。
根據(jù)本發(fā)明的第三方面,本發(fā)明提出了一種篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法。根據(jù)本發(fā)明的實施例,該方法包括以下步驟:從生物樣品提取核酸樣本;確定所述核酸樣本的核酸序列;所述核酸樣本的核酸序列或其互補序列,與SEQ ID NO:1相比具有c.G8030A突變,或者與SEQ ID NO:3相比具有c.C6265T突變,是所述生物樣品易感原發(fā)性纖毛運動障礙征的指示。通過根據(jù)本發(fā)明實施例的篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法,可以有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。
根據(jù)本發(fā)明的第四方面,本發(fā)明提出了一種篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)。根據(jù)本發(fā)明的實施例,該系統(tǒng)包括:核酸提取裝置,所述核酸提取裝置用于從所述生物樣品提取核酸樣本;核酸序列確定裝置,所述核酸序列確定裝置與所述核酸提取裝置相連,用于對所述核酸樣本進行分析,以便確定所述核酸樣本的核酸序列;判斷裝置,所述判斷裝置與所述核酸序列確定裝置相連,以便基于所述核酸樣本的核酸序列或其互補序列,與SEQ ID NO:1相比具有c.G8030A突變,或者與SEQ ID NO:3相比具有c.C6265T突變,判斷所述生物樣品是否易感原發(fā)性纖毛運動障礙征。利用該系統(tǒng),能夠有效地實施前述篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法,從而可以有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。
根據(jù)本發(fā)明的第五方面,本發(fā)明提出了一種用于篩選易感原發(fā)性纖毛運動障礙征的生物樣品的試劑盒。根據(jù)本發(fā)明的實施例,該試劑盒含有:適于檢測DNAH5和DNAH11基因突變體的至少一種的試劑,其中與SEQ ID NO:1相比,所述DNAH5基因突變體具有c.G8030A突變;與SEQ ID NO:3相比,所述DNAH11基因突變體具有c.C6265T突變。利用根據(jù)本發(fā)明的實施例的試劑盒,能夠有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。
根據(jù)本發(fā)明的第六方面,本發(fā)明還提出了一種構建體。根據(jù)本發(fā)明的實施例,該構建體包含前面所述的分離的核酸。需要說明的是,“構建體包含前面所述的分離的核酸”表示,本發(fā)明的構建體包含與SEQ ID NO:1相比具有c.G8030A突變的DNAH5基因突變體的核酸序列,或者包含與SEQ ID NO:3相比具有c.C6265T突變的DNAH11基因突變體的核酸序列,或者同時包含上述DNAH5基因突變體和DNAH11基因突變體的核酸序列。由此,利用本發(fā)明的構建體轉化受體細胞獲得的重組細胞,能夠有效地用于篩選治療原發(fā)性纖毛運動障礙征的藥物。
根據(jù)本發(fā)明的第七方面,本發(fā)明還提出了一種重組細胞。根據(jù)本發(fā)明的實施例,該重組細胞是通過前面所述的構建體轉化受體細胞而獲得的。根據(jù)本發(fā)明的一些實施例,,利用本發(fā)明的重組細胞,能夠有效地篩選治療原發(fā)性纖毛運動障礙征的藥物。
本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
附圖說明
本發(fā)明的上述和/或附加的方面和優(yōu)點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1:顯示了根據(jù)本發(fā)明一個實施例的篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)及其組成部分的示意圖,其中,
A為根據(jù)本發(fā)明實施例的篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)的示意圖,
B為根據(jù)本發(fā)明實施例的核酸提取裝置的示意圖,
C為根據(jù)本發(fā)明實施例的核酸序列確定裝置的示意圖;
圖2:顯示了根據(jù)本發(fā)明一個實施例的兩個PCD患者家系的家系圖譜,其中,
A為根據(jù)本發(fā)明實施例的PCD患者家系1的家系圖譜,
B為根據(jù)本發(fā)明實施例的PCD患者家系2的家系圖譜;
圖3:顯示了根據(jù)本發(fā)明一個實施例,PCD患者家系1內(nèi)的先證者及其父母的DNAH5基因突變位點的Sanger測序驗證峰圖;
圖4:顯示了根據(jù)本發(fā)明一個實施例,PCD患者家系2內(nèi)的先證者及其父母DNAH11基因突變位點的Sanger測序驗證峰圖。
具體實施方式
下面詳細描述本發(fā)明的實施例。下面描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
DNAH5及DNAH11基因突變體
根據(jù)本發(fā)明的第一方面,本發(fā)明提出了一種分離的核酸。根據(jù)本發(fā)明的實施例,與SEQ ID NO:1相比,該核酸具有c.G8030A突變;或者與SEQ ID NO:3相比,該核酸具有c.C6265T突變。需要說明的是,本發(fā)明的分離的核酸編碼DNAH5或者DNAH11突變體,也可以稱為“編碼DNAH5或者DNAH11突變體的核酸”,即該核酸可以理解為與編碼DNAH5或者DNAH11突變體的基因相對應的核酸物質(zhì),即核酸的類型不受特別限制,可以是任何包含與DNAH5和DNAH11的編碼基因相對應的脫氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根據(jù)本發(fā)明的一個具體示例,前面所述的編碼DNAH5和DNAH11突變體的核酸為DNA。根據(jù)本發(fā)明的實施例,發(fā)明人確定了DNAH5和DNAH11基因的新突變體,該突變體與原發(fā)性纖毛運動障礙征的發(fā)病密切相關,從而通過檢測該突變體在生物樣品中是否存在,可以有效地檢測生物樣品是否易感原發(fā)性纖毛運動障礙征,也可以通過檢測該突變體在生物體中是否存在,可以有效地預測生物體是否易感原發(fā)性纖毛運動障礙征。
對于本發(fā)明說明書和權利要求書中,提及核酸,本領域技術人員應當理解,實際包括互補雙鏈的任意一條,或者兩條。為了方便,在本說明書和權利要求書中,雖然多數(shù)情況下只給出了一條鏈,但實際上也公開了與之互補的另一條鏈。例如,提及SEQ ID NO:1,實際包括其互補序列。本領域技術人員還可以理解,利用一條鏈可以檢測另一條鏈,反之亦然。
這些編碼DNAH5和DNAH11突變體的核酸,是本申請的發(fā)明人通過高通量外顯子組測序聯(lián)合候選基因突變驗證的方法,確定的原發(fā)性纖毛運動障礙征的致病基因上的新突變,并且在現(xiàn)有技術中并未見到DNAH5基因上的c.G8030A突變,以及DNAH11基因上的c.C6265T突變與原發(fā)性纖毛運動障礙征相關的報道。
DNAH5基因為負義鏈編碼。野生型DNAH5基因的cDNA的核苷酸序列如SEQ ID NO:1所示(13875 nt):
其編碼的的氨基酸序列如SEQ ID NO:2所示(4624 aa):
野生型DNAH11基因的cDNA的核苷酸序列如SEQ ID NO:3所示(13569 nt):
其編碼的的氨基酸序列如SEQ ID NO:4所示(4523 aa):
發(fā)明人發(fā)現(xiàn)的DNAH5基因突變體與SEQ ID NO:1相比,具有c.G8030A突變,即相對于野生型DNAH5基因,本發(fā)明的DNAH5基因突變體的cDNA中第8030位的G突變?yōu)锳,由此,其所編碼的產(chǎn)物與野生型DNAH5(SEQ ID NO:2)相比,具有p.R2677Q突變,即其2677位氨基酸從R突變?yōu)镼。
此外,發(fā)明人發(fā)現(xiàn)的DNAH11基因突變體與SEQ ID NO:3相比,具有c.C6265T突變,即相對于野生型DNAH11基因,本發(fā)明的DNAH11基因突變體的cDNA中第6265位的C突變?yōu)門,由此,其所編碼的產(chǎn)物與野生型DNAH11相比,具有p.R2089*突變,即其第2089位編碼氨基酸R的密碼子突變后成終止密碼子,翻譯終止。
本發(fā)明的發(fā)明人首次提出DNAH5基因的c.G8030A突變以及DNAH11基因的c.C6265T突變導致患者出現(xiàn)原發(fā)性纖毛運動障礙癥狀。根據(jù)本發(fā)明的第二方面,本發(fā)明提出了一種分離的多肽。根據(jù)本發(fā)明的實施例,與SEQ ID NO:2相比,該分離的多肽具有p.R2677Q突變;或者與SEQ ID NO:4相比,該分離的多肽具有p.R2089*突變。根據(jù)本發(fā)明的一些具體示例,具有p.R2677Q突變的多肽是由前述分離的編碼DNAH5突變體的核酸編碼的,具有p.R2089*突變突變的多肽是由前述分離的編碼DNAH11突變體的核酸編碼的。通過檢測生物樣品中是否表達該多肽,可以有效地檢測生物樣品是否易感原發(fā)性纖毛運動障礙征,也可以通過檢測這些多肽在生物體中是否存在,有效地預測生物體是否易感原發(fā)性纖毛運動障礙征。
篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法
根據(jù)本發(fā)明的第三方面,本發(fā)明提出了一種篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法。根據(jù)本發(fā)明的實施例,該篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法可以包括以下步驟:
首先,從生物樣品提取核酸樣本。根據(jù)本發(fā)明的實施例,生物樣品的類型并不受特別限制,只要從該生物樣品中能夠提取到反映生物樣品DNAH5和DNAH11是否存在突變的核酸樣本即可。根據(jù)本發(fā)明的實施例,生物樣品可以為選自人體血液、皮膚、皮下組織的至少一種。由此,可以方便地進行取樣和檢測,從而能夠進一步提高篩選易感原發(fā)性纖毛運動障礙征的生物樣品的效率。根據(jù)本發(fā)明的實施例,這里所使用的術語“核酸樣本”應做廣義理解,其可以是任何能夠反映生物樣品中DNAH5和DNAH11是否存在突變的樣本,例如可以是從生物樣品中直接提取的全基因組DNA,也可以是該全基因組中包含DNAH5和DNAH11編碼序列的一部分,可以是從生物樣品中提取的總RNA,也可以是從生物樣品中提取的mRNA。根據(jù)本發(fā)明的一個實施例,所述核酸樣本為全基因組DNA。由此,可以擴大生物樣品的來源范圍,并且可以同時對生物樣品的多種信息進行確定,從而能夠提高篩選易感原發(fā)性纖毛運動障礙征的生物樣品的效率。另外,根據(jù)本發(fā)明的實施例,針對采用RNA作為核酸樣本,從生物樣品提取核酸樣本可以進一步包括:從生物樣品提取RNA樣本,優(yōu)選RNA樣本為mRNA;以及基于所得到的RNA樣本,通過反轉錄反應,獲得cDNA樣本,所得到的cDNA樣本構成核酸樣本。由此,可以進一步提高利用RNA作為核酸樣本篩選易感原發(fā)性纖毛運動障礙征的生物樣品的效率。
接下來,在得到核酸樣本之后,可以對核酸樣本進行分析,從而能夠確定所得到核酸樣本的核酸序列。根據(jù)本發(fā)明的實施例,確定所得到核酸樣本的核酸序列的方法和設備并不受特別限制。根據(jù)本發(fā)明的具體實施例,可以通過測序方法,確定核酸樣本的核酸序列。根據(jù)本發(fā)明的實施例,可以用于進行測序的方法和設備并不受特別限制。根據(jù)本發(fā)明的實施例,可以采用第二代測序技術,也可以采用第三代以及第四代或者更先進的測序技術。根據(jù)本發(fā)明的具體示例,可以利用選自Hiseq2000、SOLiD、454和單分子測序裝置的至少一種對核酸序列進行測序。由此,結合最新的測序技術,針對單個位點可以達到較高的測序深度,檢測靈敏度和準確性大大提高,因而能夠利用這些測序裝置的高通量、深度測序的特點,進一步提高對核酸樣本進行檢測分析的效率。從而,能夠提高后續(xù)對測序數(shù)據(jù)進行分析時的精確性和準確度。由此,根據(jù)本發(fā)明的實施例,確定核酸樣本的核酸序列可以進一步包括:首先,針對所得到的核酸樣本,構建核酸測序文庫;以及對所得到的核酸測序文庫進行測序,以便獲得由多個測序數(shù)據(jù)構成的測序結果。根據(jù)本發(fā)明的一些實施例,可以采用選自Hiseq2000、SOLiD、454和單分子測序裝置的至少一種對所得到的核酸測序文庫進行測序。另外,根據(jù)本發(fā)明的實施例,可以對核酸樣本進行篩選,富集DNAH5和DNAH11外顯子,該篩選富集可以在構建測序文庫之前,構建測序文庫過程中,或者構建測序文庫之后進行。根據(jù)本發(fā)明的一個實施例,針對核酸樣本,構建核酸測序文庫進一步包括:利用選自DNAH5和DNAH11基因外顯子特異性引物的至少一種,對核酸樣本進行PCR擴增;以及針對所得到的擴增產(chǎn)物,構建核酸測序文庫。由此,可以通過PCR擴增,富集DNAH5和DNAH11外顯子,從而能夠進一步提高篩選易感原發(fā)性纖毛運動障礙征的生物樣品的效率。根據(jù)本發(fā)明的實施例,DNAH5和DNAH11基因外顯子特異性引物的序列不受特別限制,根據(jù)本發(fā)明的優(yōu)選實施例,DNAH5基因外顯子特異性引物可以具有如SEQ ID NO:5-6所示的核苷酸序列,DNAH11基因外顯子特異性引物可以具有如SEQ ID NO:7-8所示的核苷酸序列。發(fā)明人驚奇地發(fā)現(xiàn),通過采用SEQ ID NO:5-6所示的引物,可以在PCR反應體系中顯著有效地完成對DNAH5尤其是c.G8030A所在的外顯子序列的擴增;采用SEQ ID NO:7-8所示的引物,可以顯著有效地完成對DNAH11尤其是c.C6265T所在外顯子序列的擴增。需要說明的是,這些SEQ ID NO:5-8所示的核苷酸序列是本發(fā)明的發(fā)明人在付出了艱苦的勞動后,意外獲得的。
關于針對核酸樣本,構建測序文庫的方法和流程,本領域技術人員可以根據(jù)不同的測序技術進行適當選擇,關于流程的細節(jié),可以參見測序儀器的廠商例如Illumina公司所提供的規(guī)程,例如參見Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb 2010)或Paired-End SamplePrep Guide(Part#1005063;Feb 2010),通過參照將其并入本文。根據(jù)本發(fā)明的實施例,從生物樣品提取核酸樣本的方法和設備,也不受特別限制,可以采用商品化的核酸提取試劑盒進行。
需要說明的是,在這里所使用的術語“核酸序列”應作廣義理解,其可以是在對核酸樣本進行測序得到的測序數(shù)據(jù)進行組裝后,得到的完整的核酸序列信息,也可以是直接采用通過對核酸樣本進行測序所得到的測序數(shù)據(jù)(reads)作為核酸序列,只要這些核酸序列中含有對應DNAH5和DNAH11基因的編碼序列即可。
最后,在確定核酸樣本的核酸序列之后,將所得到的核酸樣本的核酸序列相應的參考序列進行比對,當所得到的核酸序列中具有前述的三種突變的至少之一時,即指示生物樣品易感原發(fā)性纖毛運動障礙征。具體地,當獲得的核酸樣本是采用DNAH5基因外顯子特異性引物擴增獲得時,將該核酸樣本的核酸序列與SEQ ID NO:1的序列相比對,如果在所得到的核酸序列中具有c.G8030A突變,則指示生物樣品易感原發(fā)性纖毛運動障礙征。當獲得的核酸樣本是采用DNAH11基因外顯子特異性引物擴增獲得時,將該核酸樣本的核酸序列與SEQ ID NO:3的序列相比對,如果在所得到的核酸序列中具有c.C6265T突變,則指示生物樣品易感原發(fā)性纖毛運動障礙征。當獲得的核酸樣本是采用DNAH11及DNAH5基因外顯子特異性引物擴增獲得時,將該核酸樣本的核酸序列分別與SEQ ID NO:1和SEQ ID NO:3的序列相比對,如果在所得到的核酸序列中具有c.G8030A、c.C6265T突變,則指示生物樣品易感原發(fā)性纖毛運動障礙征。由此,通過根據(jù)本發(fā)明實施例的篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法,可以有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。根據(jù)本發(fā)明的實施例,對核酸序列與SEQ ID NO:1及SEQ ID NO:3進行比對的方法和設備并不受特別限制,可以采用任意常規(guī)的軟件進行操作,根據(jù)本發(fā)明的具體實例,可以采用SOAPALIGNER/SOAP2進行比對。
需要說明的是,根據(jù)本發(fā)明實施例的“篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法”的用途不受特別限制,例如可以用作非診斷目的的篩選方法。
篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)和試劑盒
根據(jù)本發(fā)明的第四方面,本發(fā)明提出了一種能夠有效實施上述篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法的系統(tǒng)。
參考圖1,根據(jù)本發(fā)明的實施例,該篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)1000包括:核酸提取裝置100、核酸序列確定裝置200以及判斷裝置300。
根據(jù)本發(fā)明的實施例,核酸提取裝置100用于從生物樣品提取核酸樣本。如前所述,根據(jù)本發(fā)明的實施例,核酸樣本的類型并不受特別限制,對于采用RNA作為核酸樣本,則核酸提取裝置進一步包括RNA提取單元101和反轉錄單元102,其中,提取單元101用于從生物樣品提取RNA樣本,反轉錄單元102與RNA提取單元101相連,用于對RNA樣本進行反轉錄反應,以便獲得cDNA樣本,所得到的cDNA樣本構成核酸樣本。
根據(jù)本發(fā)明的實施例,核酸序列確定裝置200與核酸提取裝置100相連,用于對核酸樣本進行分析,以便確定核酸樣本的核酸序列。如前所示,可以采用測序的方法確定核酸樣本的核酸序列。由此,根據(jù)本發(fā)明的一個實施例,所述核酸序列確定裝置200可以進一步包括:文庫構建單元201以及測序單元202。文庫構建單元201用于針對核酸樣本,構建核酸測序文庫;測序單元202與文庫構建單元201相連,用于對核酸測序文庫進行測序,以便獲得由多個測序數(shù)據(jù)構成的測序結果。如前所述,可以通過PCR擴增,富集DNAH5和DNAH11外顯子,進一步提高篩選易感原發(fā)性纖毛運動障礙征的生物樣品的效率。由此,文庫構建單元201可以進一步包括PCR擴增模塊(圖中未示出),在該PCR擴增模塊中設置有選自DNAH5和DNAH11基因外顯子特異性引物的至少一種,以便利用DNAH5和DNAH11基因外顯子特異性引物的至少一種,對所述核酸樣本進行PCR擴增,根據(jù)本發(fā)明的具體實施例,DNAH5基因外顯子特異性引物具有如SEQ ID NO:5-6所示的核苷酸序列,DNAH11基因外顯子特異性引物具有如SEQ ID NO:7-8所示的核苷酸序列。根據(jù)本發(fā)明的實施例,測序單元202可以包括選自HISEQ2000、SOLiD、454和單分子測序裝置的至少一種。由此,結合最新的測序技術,針對單個位點可以達到較高的測序深度,檢測靈敏度和準確性大大提高,因而能夠利用這些測序裝置的高通量、深度測序的特點,進一步提高對核酸樣本進行檢測分析的效率。從而,提高后續(xù)對測序數(shù)據(jù)進行分析時的精確性和準確度。
根據(jù)本發(fā)明的實施例,判斷裝置300與核酸序列確定裝置200相連,適于將核酸樣本的核酸序列進行比對,以便基于核酸樣本的核酸序列與SEQ ID NO:1及SEQ ID NO:3的區(qū)別判斷生物樣品是否易感原發(fā)性纖毛運動障礙征。具體地,基于所述核酸樣本的核酸序列或其互補序列,與SEQ ID NO:1相比具有c.G8030A突變,或者與SEQ ID NO:3相比具有c.C6265T突變,判斷生物樣品是否易感原發(fā)性纖毛運動障礙征。如前所述,根據(jù)本發(fā)明的一個實施例,核酸樣本的核酸序列或其互補序列,與SEQ ID NO:1相比具有選自c.G8030A突變,或者與SEQ ID NO:3相比具有c.C6265T突變,是生物樣品易感原發(fā)性纖毛運動障礙征的指示。如前所述,根據(jù)本發(fā)明的實施例,對核酸序列與SEQ ID NO:1以及SEQ ID NO:3進行比對的設備并不受特別限制,可以采用任意常規(guī)的軟件進行操作,例如根據(jù)本發(fā)明的具體實例,可以采用SOAPALIGNER/SOAP2進行比對。
由此,利用該系統(tǒng),能夠有效地實施前述篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法,從而可以有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。
根據(jù)本發(fā)明的第五方面,本發(fā)明提出了一種用于篩選易感原發(fā)性纖毛運動障礙征的生物樣品的試劑盒。根據(jù)本發(fā)明的實施例,該用于篩選易感原發(fā)性纖毛運動障礙征的生物樣品的試劑盒包括:適于檢測DNAH5和DNAH11基因突變體的至少一種的試劑,其中與SEQ ID NO:1相比,該DNAH5基因突變體具有c.G8030A突變;與SEQ ID NO:3相比,該DNAH11基因突變體具有c.C6265T突變。利用根據(jù)本發(fā)明的實施例的試劑盒,能夠有效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。在本文中,所使用的術語“適于檢測DNAH5和DNAH11基因突變體的至少一種的試劑”應做廣義理解,即可以是檢測DNAH5和DNAH11編碼基因的至少一種的試劑,也可以是檢測DNAH5和DNAH11突變體的至少一種的試劑,例如可以采用識別特異性位點的抗體。根據(jù)本發(fā)明的一個實施例,該試劑為核酸探針。由此,可以高效地篩選易感原發(fā)性纖毛運動障礙征的生物樣品。
構建體及重組細胞
根據(jù)本發(fā)明的第六方面,本發(fā)明還提出了一種構建體。根據(jù)本發(fā)明的實施例,該構建體包含前面所述的分離的核酸。需要說明的是,“構建體包含前面所述的分離的核酸”表示,本發(fā)明的構建體包含與SEQ ID NO:1相比具有c.G8030A突變的DNAH5基因突變體的核酸序列,或者包含與SEQ ID NO:3相比具有c.C6265T突變的DNAH11基因突變體的核酸序列,或者同時包含上述DNAH5基因突變體和DNAH11基因突變體的核酸序列。由此,利用本發(fā)明的構建體轉化受體細胞獲得的重組細胞,能夠有效地用于篩選治療原發(fā)性纖毛運動障礙征的藥物。其中,所述受體細胞的種類不受特別限制,例如可以為大腸桿菌細胞、哺乳動物細胞,優(yōu)選該受體細胞來源于哺乳動物。
在本發(fā)明中所使用的術語“構建體”是指這樣的一種遺傳載體,其包含特定核酸序列,并且能夠將目的核酸序列轉入宿主細胞中,以獲得重組細胞。根據(jù)本發(fā)明的實施例,構建體的形式不受特別限制。根據(jù)本發(fā)明的實施例,其可以為質(zhì)粒、噬菌體、人工染色體、粘粒(Cosmid)、病毒的至少一種,優(yōu)選質(zhì)粒。質(zhì)粒作為遺傳載體,具有操作簡單,可以攜帶較大片段的性質(zhì),便于操作和處理。質(zhì)粒的形式也不受特別限制,既可以是環(huán)形質(zhì)粒,也可以是線性質(zhì)粒,即可以是單鏈的,也可以是雙鏈的。本領域技術人員可以根據(jù)需要進行選擇。在本發(fā)明中所使用的術語“核酸”可以是任何包含脫氧核糖核苷酸或者核糖核苷酸的聚合物,包括但不限于經(jīng)過修飾的或者未經(jīng)修飾的DNA、RNA,其長度不受任何特別限制。對于用于構建重組細胞的構建體,優(yōu)選所述核酸為DNA,因為DNA相對于RNA而言,其更穩(wěn)定,并且易于操作。
根據(jù)本發(fā)明的第七方面,本發(fā)明還提出了一種重組細胞。根據(jù)本發(fā)明的實施例,該重組細胞是通過前面所述的構建體轉化受體細胞而獲得的。從而,本發(fā)明的重組細胞能夠有效表達構建體所攜帶的DNAH5基因突變體和DNAH11基因突變體的至少一種。根據(jù)本發(fā)明的一些實施例,利用本發(fā)明的重組細胞,能夠有效地篩選治療原發(fā)性纖毛運動障礙征的藥物。根據(jù)本發(fā)明的實施例,受體細胞的種類不受特別限制,例如可以為大腸桿菌細胞、哺乳動物細胞,優(yōu)選所述受體細胞來源于非人哺乳動物。
需要說明的是,在本文前面篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法部分中所描述的特征和優(yōu)點,同樣適用于篩選易感原發(fā)性纖毛運動障礙征的生物樣品的系統(tǒng)或者試劑盒,在此不再贅述。
此外,還需要說明的是,根據(jù)本發(fā)明實施例的篩選易感原發(fā)性纖毛運動障礙征的生物樣品的方法、系統(tǒng)以及試劑盒,是本申請的發(fā)明人經(jīng)過艱苦的創(chuàng)造性勞動和優(yōu)化工作才完成的。
下面參考具體實施例,對本發(fā)明進行說明,需要說明的是,這些實施例僅僅是說明性的,而不能理解為對本發(fā)明的限制。若未特別指明,實施例中所采用的技術手段為本領域技術人員所熟知的常規(guī)手段,可以參照《分子克隆實驗指南》第三版或者相關產(chǎn)品進行,所采用的試劑和產(chǎn)品也均為可商業(yè)獲得的。未詳細描述的各種過程和方法是本領域中公知的常規(guī)方法,所用試劑的來源、商品名以及有必要列出其組成成分者,均在首次出現(xiàn)時標明,其后所用相同試劑如無特殊說明,均以首次標明的內(nèi)容相同。
實施例1全外顯子組測序確定致病基因及突變位點
1、樣本收集:
發(fā)明人收集到2個PCD患者家系,在本文中有時也稱為“PCD患者家系1”和“PCD患者家系2”。其中,圖2分別顯示了上述2個PCD患者家系PCD患者家系2的家系圖譜。其中,圖2A為PCD患者家系1PCD患者家系1的家系圖譜,圖2B為PCD患者家系2PCD患者家系2的家系圖譜。如圖2所示,表示正常女性;表示無法確定是否患病的女性;表示正常男性;表示女性患者;表示已故正常男性;表示已故正常女性;表示男性患者;表示女性患者;表示已故無法確定是否患病的女性;箭頭所指為先證者。如圖2所示,PCD患者家系1,先證者為青年女性,29歲;表現(xiàn)為自幼反復的上呼吸道驗證、鼻竇炎、支氣管擴張、右位心臟及不孕。先證者有一同胞妹妹,因車禍去世,其生前也有自幼上呼吸道感染,并支氣管擴張。先證者父母為近親結婚,均為正常人。結合先證者病史、檢查及家族史,先證者被臨床診斷為PCD。
PCD患者家系2,先證者為中年女性,36歲,河北人;表現(xiàn)為自幼反復的上呼吸道驗證、鼻竇炎、支氣管擴張、右位心臟。先證者父母為近親結婚,均為正常人;先證者育有一女,身體健康。結合先證者者病史、檢查及父母近親結婚的情況,先證者被臨床診斷為PCD。
兩個先證者的病理診斷均為:原發(fā)性纖毛運動障礙征。
發(fā)明人收集獲得上述PCD患者家系1中先證者及其父母(家系內(nèi)正常人)的DNA樣本,PCD患者家系2中先證者及其父母(家系內(nèi)正常人)的DNA樣本。
2、全外顯子組測序確定致病基因及突變位點
發(fā)明人利用NimbleGen SeqCap EZ Human Exome Library v2.0全外顯子捕獲平臺,結合Illumina Hiseq 2000高通量測序技術,對上述2個PCD患者家系中先證者及其父母(家系內(nèi)正常人)均進行了全外顯子組捕獲測序,具體步驟如下:
2.1樣品制備
分別取上述2個PCD患者家系中先證者及其父母(家系內(nèi)正常人)的外周血,利用常規(guī)鹽析法抽提基因組DNA,并利用分光光度計測量DNA的濃度及純度,所得的每個標本基因組DNA的OD260/OD280均位于1.7-2.0之間,濃度不少于200ng/μl,總量不少于30μg,備用。
2.2文庫構建及測序
利用超聲波儀(CovarisS2,Massachusetts,USA)將各基因組DNA樣本隨機打斷成250-300 bp左右的片段,隨后按照制造商提供的操作說明書,在片段兩端分別連接上接頭制備文庫(可參見:http://www.illumina.com/提供的Illumina/Solexa標準建庫說明書,通過參照將其全文并入本文)。文庫經(jīng)純化后經(jīng)過Ligation-mediated PCR(LM-PCR)的線性擴增與捕獲試劑SureSelect Biotiny lated RNA Library(BAITS)進行雜交富集,再經(jīng)過LM-PCR的線性擴增,文庫檢測合格后即可上機測序,以便獲得原始測序數(shù)據(jù)。其中,參照Illumina標準的成簇和測序的protocol進行測序,測序平臺為Illumina Hiseq 2000,讀取長度為90bp,樣本的平均測序深度為50×。
2.3變異檢測、注釋及數(shù)據(jù)庫比較
利用Illumina basecalling Software 1.7對上述獲得的原始測序數(shù)據(jù)進行處理,經(jīng)過過濾去污染后,使用SOAPaligner/SOAP2(可參見:Li R,Li Y,Kristiansen K,et al,SOAP:short oligonucleotide alignment program.Bioinformatics 2008,24(5):713-714;Li R,Yu C,Li Y,ea al,SOAP2:an improved ultrafast tool for short read alignment.Bioinformatics 2009,25(15):1966-1967,通過參照將其全文并入本文)比對到參考基因組UCSC NCBI37/hg19,以便獲得比對到基因組上的唯一比對序列。然后利用SOAPsnp(可參見:Li R,Li Y,Fang X,Yang H,et al,SNP detection for massively parallel whole-genome resequencing.Genome Res 2009,19(6):1124-1132,通過參照將其全文并入本文)確定靶區(qū)域的基因型。
在得到測序結果之后,對非同義突變、剪接受體/供體位點突變、編碼區(qū)插入和缺失突變這三類最有可能與病理相關的突變進行研究。結果,發(fā)明人通過測序分析發(fā)現(xiàn),針對PCD患者家系1中,在先證者的DNA樣本中發(fā)現(xiàn)100289個單核苷酸多態(tài)性(SNPs)和7059個插入/缺失(Indels),在先證者父親的DNA樣本中發(fā)現(xiàn)99191個SNPs和6960個Indels,在先證者母親的DNA樣本中發(fā)現(xiàn)97904個SNPs和6981個Indels;針對PCD患者家系2,在先證者的DNA樣本中發(fā)現(xiàn)100414個單核苷酸多態(tài)性(SNPs)和7088個插入/缺失(Indels),在先證者父親的DNA樣本中發(fā)現(xiàn)103106個SNPs和7011個Indels,在先證者母親的DNA樣本中發(fā)現(xiàn)94530個SNPs和7017個Indels。隨后通過dbSNP數(shù)據(jù)庫(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp132.txt.gz),HapMap數(shù)據(jù)庫(ftp://ftp.ncbi.nlm.nih.gov/hapmap),千人基因組數(shù)據(jù)庫(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp),炎黃數(shù)據(jù)庫(http://yh.genomics.org.cn/)等公共數(shù)據(jù)庫的過濾,去掉所有已知的且在數(shù)據(jù)庫中頻率高的變異(變異MAF值高,通常為不致病的普通多態(tài)性)。同時過濾掉內(nèi)含子或基因間區(qū)的突變以及其他區(qū)域的同義突變,即過濾掉不影響蛋白結構和功能的突變。接著,發(fā)明人結合兩個PCD家系的實際情況及PCD特點,利用隱性遺傳策略篩選獲得的突變進行進一步分析。然后,將分析后的結果與目前已經(jīng)報道的與PCD相關的基因列表取交集。結果,發(fā)明人從PCD患者家系1中得到DNAH5基因的c.G8030A突變(p.R2677Q),從PCD患者家系2中得到DNAH11基因的c.C6265T突變(p.R2089*)。
進一步分析可知,PCD患者家系1中先證者具有c.G8030A的純合突變,其正常父母在該位點為雜合突變,該突變?yōu)橐阎虻男峦蛔兦曳铣k[模型,同時考慮測序質(zhì)量高且SIFT預測突變有危害因素,發(fā)明人初步認為此突變?yōu)樵摷蚁档闹虏⊥蛔?;PCD患者家系2中先證者c.C6265T的純合突變,其正常父母在該位點為雜合突變,該突變?yōu)橐阎虻男峦蛔兦曳铣k[模型,同時考慮測序質(zhì)量高且SIFT預測突變有危害因素,發(fā)明人初步認為此突變?yōu)樵摷蚁档闹虏⊥蛔儭?/p>
由于外顯子組測序存在一定程度的假陽性,接下來,發(fā)明人又利用Sanger測序方法,對上述確定的2個突變在2個PCD患者家系的先證者中分別進行了驗證,結果顯示DNAH5基因的c.G8030A突變及DNAH11基因的c.C6265T突變均為真實的突變。由此,表明DNAH5和DNAH11基因為原發(fā)性纖毛運動障礙征的致病相關基因,c.G8030A(DNAH5)和c.C6265T(DNAH11)突變是原發(fā)性纖毛運動障礙征的致病突變。
實施例2 Sanger法測序驗證原發(fā)性纖毛運動障礙征的致病突變
分別對PCD患者家系1中的3人(先證者及其表現(xiàn)正常的父母)、PCD患者家系2中的4人(先證者及其為表現(xiàn)正常的父母)(見圖2)的DNAH5和DNAH11基因進行檢測,針對DNAH5基因的c.G8030A突變位點和DNAH11基因的c.C6265T突變位點所在序列設計引物,然后通過PCR擴增、產(chǎn)物純化和測序的方法獲得上述突變的有關序列,根據(jù)確定序列測定結果屬于突變型還是野生型,是雜合突變還是純合突變,以及序列與表型在家系內(nèi)是否呈共分離來驗證DNAH5和DNAH11與原發(fā)性纖毛運動障礙征之間的相關性。具體方法步驟如下:
1、DNA提取
分別采集上述PCD患者家系1中先證者及其表現(xiàn)正常的父母、PCD患者家系2中先證者及其表現(xiàn)正常的父母,然后利用QIAmp Blood kit(Qiagen,Hilden,Germany)抽提外周血白細胞中的基因組DNA,并利用Qubit Fluorometer和瓊脂糖凝膠電泳測量所提取DNA的濃度及純度,所得的每個標本基因組DNA的OD260/OD280均位于1.7-2.0之間,濃度不少于50ng/微升,總量不少于3μg,由此,獲得各DNA樣品,備用。
2、引物設計及PCR反應
首先,參考人類基因組序列數(shù)據(jù)庫GRCh37.1/hg19,設計得到具有SEQ ID NO:5-6所示的核苷酸序列的DNAH5基因外顯子特異性引物,以及具有SEQ ID NO:7-8所示的核苷酸序列的DNAH11基因外顯子特異性引物,具體見下表。
DNAH5和DNAH11基因外顯子特異性引物
接著,分別按照以下配比配制各基因組DNA樣本的PCR反應體系以及進行PCR反應。
針對DNAH5基因的c.G8030A突變位點和DNAH11基因的c.C6265T突變位點所在的外顯子序列,按以下配比分別配制各基因組DNA樣本的各PCR反應體系:
反應體系:25μl
然后,將配制獲得各PCR反應體系按照以下反應條件分別進行PCR反應(不同的突變位點采用相同的反應條件):
反應條件:
由此,獲得上述PCD患者家系1中先證者及其表現(xiàn)正常的父母、PCD患者家系2中先證者及其表現(xiàn)正常的父母的PCR擴增產(chǎn)物。
3、測序
將步驟2中獲得的獲自PCD患者家系1中先證者及其表現(xiàn)正常的父母、PCD患者家系2中先證者及其表現(xiàn)正常的父母PCR擴增產(chǎn)物,進行DNA測序。其中,測序采用ABI3730型測序儀
基于測序結果,對上述各樣本進行DNAH5和DNAH11基因編碼序列比對。發(fā)明人發(fā)現(xiàn),兩個家系內(nèi)的患者(先證者)及其家系內(nèi)正常人(PCD患者家系1中先證者的父母、PCD患者家系2中先證者的父母)分別在c.G8030A(DNAH5)和c.C6265T(DNAH11)出現(xiàn)共分離現(xiàn)象,PCD患者家系1和PCD患者家系2的患者分別攜帶c.G8030A和c.C6265T突變。由此,證明DNAH5基因的c.G8030A突變、DNAH11基因的c.C6265T突變是原發(fā)性纖毛運動障礙征的致病突變。
其中,圖3顯示了PCD患者家系1內(nèi)的先證者及其父母的DNAH5基因突變位點的Sanger測序驗證峰圖,圖4顯示了PCD患者家系2內(nèi)的先證者及其父母的DNAH11基因突變位點的Sanger測序驗證峰圖。由圖3和4可知,PCD患者家系1中患者的DNAH5基因具有c.G8030A突變,而該家系中的正常人不攜帶該突變;PCD患者家系2中患者的DNAH11基因具有c.C6265T突變,而該家系中的正常人不攜帶該突變。由此,進一步證明DNAH5基因的c.G8030A突變、DNAH11基因的c.C6265T突變是原發(fā)性纖毛運動障礙征的致病突變。
需要說明的是,DNAH5為已知PCD致病基因,國內(nèi)外對該基因的致病性進行了大量的研究,DNAH5約占總PCD致病基因的28%,并被認為是PCD的主要致病基因。PCD的發(fā)病基礎是動力纖毛的結構異?;蛘{(diào)控動力纖毛過程出現(xiàn)異常。動力纖毛結構為9+2結構,中央為兩個中心微小管,周圍由次纖維A和次纖維B組成9對外周微小管,有動力臂、鏈接環(huán)和輪幅使之互相聯(lián)接。動力臂有兩條,分別是內(nèi)側動力臂(IDA)和外側動力臂(ODA),在動力纖毛運動中起關鍵作用。目前大部分研究認為,DNAH5突變會導致外側動力蛋白臂結構異常,但也有研究認為DNAH5突變會同時導致內(nèi)外側動力臂同時異常。DNAH11也是已知的PCD的致病基因,目前該基因的致病性已明確。DNAH11位于7號染色體短臂,具有82個外顯子。目前研究顯示,DNAH11并不造成動力纖毛的結構異常,其致病特點主要通過調(diào)解機制對動力纖毛的擺動產(chǎn)生影響。
綜上,發(fā)明人進一步證明了DNAH5和DNAH11基因為原發(fā)性纖毛運動障礙征的致病相關基因,DNAH5基因的c.G8030A突變、DNAH11基因的c.C6265T突變是原發(fā)性纖毛運動障礙征的致病突變。
實施例3檢測試劑盒
制備一檢測試劑盒,其包含適于檢測DNAH5和DNAH11基因突變體的至少一種的引物(其中與SEQ ID NO:1相比,所述DNAH5基因突變體具有c.G8030A突變;與SEQ ID NO:3相比,所述DNAH11基因突變體具有c.C6265T突變),以便用于篩選易患原發(fā)性纖毛運動障礙征的生物樣品,其中這些引物包括SEQ ID NO:5-6所示的DNAH5基因外顯子特異性引物(見實施例1),以及SEQ ID NO:7-8所示的DNAH11基因外顯子特異性引物(見實施例1)。
利用上述試劑盒篩選易患原發(fā)性纖毛運動障礙征的生物樣品的具體步驟為:按照實施例2的步驟1所述的方法提取待測者DNA,以所提取的DNA為模板與上述外顯子特異性引物進行PCR反應,并按照本領域常規(guī)方法對PCR產(chǎn)物純化,將純化的產(chǎn)物進行測序,然后通過觀察測序所得到的序列是否具有選自c.G8030A和c.C6265T的至少一種突變,從而有效地檢測待測者是否易患原發(fā)性纖毛運動障礙征,進一步,能夠從待測者中篩選出易患原發(fā)性纖毛運動障礙征的生物樣品。
在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領域的普通技術人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由權利要求及其等同物限定。