基因定位的多重檢驗方法
【技術領域】
[0001]本發(fā)明涉及生物信息技術領域,尤其涉及一種基因定位的多重檢驗方法。
【背景技術】
[0002]簡化基因組方法是一種利用酶切技術、序列捕獲芯片技術或其他實驗手段降低物種基因組復雜程度,進而研宄基因組各類遺傳結構性變異的技術手段。目前常見的簡化基因組技術包括 RAD (Restrict1n site Associated DNA)和 GBS (Genotyping BySequencing)。這些技術都可以在極短的時間內開發(fā)出成千上萬的SNP標記,而分子標記是開展遺傳作圖、關聯(lián)分析、群體遺傳分析以及生態(tài)多樣性分析等的基礎,所以利用簡化基因組技術開展科研工作是當前第二代測序技術的一種熱門應用。
[0003]BSA(分離體分組混合分析法或混合分組分析法,又稱集團分離分析法,BulkedSegregat1n Analysis)分析法首次由Michlmore等…提出并成功地在萬苣中篩選出與目的基因相連鎖的標記。該方法首先從一對具有目標基因的表型差異的親本所產生的任何一種分離群體中,根據(jù)目標基因的表型分別選取一定數(shù)量的植株,構成2個亞群或集團。將每群的DNA等量混合,形成兩個相對性狀的“基因池”(GENE poor),然后用合適的分子標記對兩個基因池進行分析,在兩群問表現(xiàn)多態(tài)性的分子標記遺傳上與目標性狀基因座位相連鎖。在獲得了與目標基因相連鎖的分子標記以后,可以利用某一作圖群體進行分析以便進一步檢測所得分子標記與目標性狀基因的連鎖程度,以及其在某已知分子圖譜中或染色體上的位置,這樣才能完成真正意義上的對基因的標記定位。由于建池時使用了特定的分離群體,并且在分組時僅對目標性狀進行選擇,這樣可以保證其他性狀的遺傳背景基本相同,兩個基因池之間理論上就應主要在目標基因區(qū)段存在差異,因此兩基因池又被稱為近等基因池,這就排除了環(huán)境及人為因素的影響,使研宄結果更為準確可靠。BSA法克服了很多作物難以得到近等基因系的限制,并且比近等基因系法省時省力,是一種非常實用的基因標記定位的方法,應用非常廣泛。
[0004]但是,由于兩者都屬于初定位的范疇,對于基因定位的精度難以滿足功能基因的研宄。因此需要一種方法提高定位的精度與準確度。以前傳統(tǒng)標記(例如SSR、RFLP等)無法實現(xiàn)在一次獨立實驗中同時進行兩個分析的可能。然而基于簡化基因組的測序技術,測得的數(shù)據(jù)不僅為遺傳圖構建提供了可能,而且,測序的reads也為BSA分析提供了便利。
【發(fā)明內容】
[0005]本發(fā)明的目的是解決以上提出的問題,提供一種基因定位的多重檢驗方法,通過簡化基因組測序技術結合混合分析分離分析思路,來提升基因定位的精度和準確度。
[0006]本發(fā)明的技術方案如下:
[0007]一種基因定位的多重檢驗方法,其特征在于,包括:
[0008]步驟一:利用第二代測序技術對親本DNA樣品和子代DNA樣品進行測序,獲得高精度短片段序列;
[0009]步驟二:利用SNP分析軟件對獲得的所述高精度短片段序列與參考序列比對或者相互聚類,得到每個樣品準確的SNP信息;
[0010]步驟三:將這類SNP信息轉換成群體SNP,進一步轉換成標準的分子標準格式,利用作圖軟件進行遺傳圖譜構建,并在遺傳圖譜的基礎上,進行QTL分析得到QTL座位信息;
[0011]步驟四:鑒定子代DNA樣品的表型信息,并準確地統(tǒng)計表型值分布,將表型值按梯度分組,把極端的表型值所對應的子代DNA樣品的高精度短片段序列分別混合,分析基因型頻率分布,通過卡方檢驗和秩和檢驗,找到與表型信息相關的顯著區(qū)域;
[0012]步驟五:整合QTL座位信息與步驟四得到準確的與表型信息相關的基因定位信息。
[0013]作為優(yōu)選,所述的子代DNA樣品為親本DNA樣品雜交產生的后代。
[0014]作為優(yōu)選,步驟一之前還包括步驟建庫,所述的建庫為把DNA分子處理成可以上機測序的分子集合,得到DNA文庫。
[0015]作為優(yōu)選,所述步驟建庫之前還包括步驟酶切,所述的酶切為用限制性內切酶切斷DNA分子。
[0016]作為優(yōu)選,步驟一之后還包括步驟質控,所述的質控為判斷高精度短片段序列的質量,并去除低質量的高精度短片段序列。
[0017]作為優(yōu)選,所述步驟四包括以下步驟:
[0018]A.統(tǒng)計子代DNA樣品的表型值;
[0019]B.以表型值為依據(jù),將表型值按梯度進行分組,將極端表型值所對應的子代DNA樣品測序得到的高精度短片段序列分別混合;
[0020]C.通過每組混合的高精度短片段序列提供的基因型頻率信息,利用卡方檢驗和秩和檢驗,找到與表型信息相關的顯著區(qū)域。
[0021]作為優(yōu)選,所述的第二代測序技術為Illumina第二代測序技術,采用的是Hiseq測序儀,測序文庫包括簡化基因組文庫、全基因組鳥槍法文庫。
[0022]作為優(yōu)選,所述的SNP分析軟件為SOAP2、SOAPsnp、BWA、samtools或Stacks,分析過程包括比對或者相互聚類。
[0023]作為優(yōu)選,步驟三中的作圖軟件為joinmap、linkage或mapmaker。
[0024]本發(fā)明的有益效果如下:
[0025]本發(fā)明實現(xiàn)了簡化基因組測序技術與混合分離分析思路在一次獨立的遺傳群體構建實驗中的結合,有效了提高了研宄材料與研宄數(shù)據(jù)的利用率;通過綜合使用這兩種方法,在不增加實驗成本的情況下,一次實驗中完成遺傳圖譜的構建與BSA分析,并以遠低于其它基因精細定位手段的成本,提升基因定位的精度和準確度;同時也顯著縮短了基因定位研宄的周期,可以有效地為后續(xù)的遺傳群體構建與分析提供指導與參考。同時,本發(fā)明的數(shù)據(jù)也是基因克隆與功能基因組學研宄的第一手數(shù)據(jù)。
【附圖說明】
[0026]圖1是本發(fā)明的流程示意圖。
【具體實施方式】
[0027]下面結合附圖對本發(fā)明的實施例進行進一步詳細說明:
[0028]本發(fā)明公開了一種基因定位的多重檢驗方法,其特征在于,包括:
[0029]步驟一:利用第二代測序技術對親本DNA樣品和子代DNA樣品進行測序,獲得高精度短片段序列;
[0030]步驟二:利用SNP分析軟件對獲得的所述高精度短片段序列與參考序列比對或者相互聚類,得到每個樣品準確的SNP信息;
[0031]步驟三:將這類SNP信息轉換成群體SNP,進一步轉換成標準的分子標準格式,利用作圖軟件進行遺傳圖譜構建,并在遺傳圖譜的基礎上,進行QTL分析得到QTL座位信息;
[0032]步驟四:鑒定子代DNA樣品的表型信息,并準確地統(tǒng)計表型值分布,將表型值按梯度分組,把極端的表型值所對應的子代DNA樣品的高精度短片段序列分別混合,分析基因型頻率分布,通過卡方檢驗和秩和檢驗,找到與表型信息相關的顯著區(qū)域;
[0033]步驟五:整合QTL座位信息與步驟四得到準確的與表型信息相關的基因定位信息。
[0034]所述的子代DNA樣品為親本DNA樣品雜交產生的后代。
[0035]步驟一之前還包括步驟建庫,所述的建庫為把DNA分子處理成可以上機測序的分子集合,得到DNA文庫。
[0036]步驟建庫之前還包括步驟酶切,所述的酶