亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于高通量分型的高密度遺傳圖譜的構(gòu)建和評價的制作方法

文檔序號:6513517閱讀:1304來源:國知局
基于高通量分型的高密度遺傳圖譜的構(gòu)建和評價的制作方法
【專利摘要】本發(fā)明提出一種基于高通量分型的高密度遺傳圖譜HighMap構(gòu)建方法,包括步驟:1)通過高通量測序方法對遺傳分離群體標(biāo)記開發(fā)和分型;2)對兩兩標(biāo)記進(jìn)行遺傳連鎖檢驗,劃分連鎖群;3)利用SGS算法線性排序并計算遺傳距離,利用KNN算法對樣品分型數(shù)據(jù)中的分型錯誤和分型缺失進(jìn)行糾錯和補(bǔ)缺失;4)對所構(gòu)建圖譜進(jìn)行準(zhǔn)確性評估,運(yùn)用可視化方法直觀展現(xiàn)圖譜質(zhì)量。本發(fā)明提出的HighMap構(gòu)建方法通過分型糾所錯有效消除高通量測序分型帶來的分型錯誤和分型缺失,顯著提高了所構(gòu)建圖譜的準(zhǔn)確性;采用SGS排序算法,排序速度快,可完成單個連鎖群超過1,000標(biāo)記的高密度圖譜構(gòu)建,作圖效率顯著提升;對原始分型數(shù)據(jù)的要求進(jìn)一步降低,對分型錯誤的容忍度大大提升。
【專利說明】基于高通量分型的高密度遺傳圖譜的構(gòu)建和評價
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物化學(xué)領(lǐng)域,具體涉及一種遺傳工程數(shù)據(jù)圖譜的構(gòu)建方法,以及對圖譜的評價方法。
【背景技術(shù)】
[0002]隨著具有高通量、低成本、測序錯誤率低、測序讀長短特點(diǎn)的新一代測序技術(shù)和生物信息學(xué)的發(fā)展,高通量標(biāo)記開發(fā)逐漸成為性價比最高的分子標(biāo)記開發(fā)方式。SLAF-seq、RAD-seq及GBS等簡化基因組技術(shù)可在全基因組范圍內(nèi)進(jìn)行分子標(biāo)記開發(fā)和大規(guī)模分型,這些技術(shù)在不同物種的應(yīng)用產(chǎn)生了海量標(biāo)記分型數(shù)據(jù),使得構(gòu)建高密度遺傳圖譜成為可能,同時也對圖譜構(gòu)建所需的方法和軟件提出了新的要求,而傳統(tǒng)構(gòu)圖軟件和方法在處理與測序深度相關(guān)的分型錯誤和分型缺失上表現(xiàn)乏力。
[0003]HighMap (高密度遺傳圖譜構(gòu)建方法)是一種構(gòu)建高密度遺傳圖譜的有效方法,利用高通量測序產(chǎn)生的群體大規(guī)模分型數(shù)據(jù),基于生物信息學(xué)和統(tǒng)計方法進(jìn)行海量分子標(biāo)記的高效準(zhǔn)確定位,根據(jù)生物學(xué)重組規(guī)律對測序分型錯誤和缺失進(jìn)行高效糾錯,以保證所構(gòu)建遺傳圖譜的密度,質(zhì)量和準(zhǔn)確性。對于具有分型錯誤和缺失的高通量測序分型數(shù)據(jù),HighMap通過抽樣技術(shù)和數(shù)學(xué)算法解決傳統(tǒng)方法作圖效率低和準(zhǔn)確性不高的問題,提高生物學(xué)分析的準(zhǔn)確性,通過對群體高通量測序數(shù)據(jù)的高效利用,進(jìn)一步降低成本,提高效率。對于高雜合群體,目前尚未見利用HighMap構(gòu)建高密度遺傳連鎖圖譜的報道。

【發(fā)明內(nèi)容】

[0004]針對現(xiàn)有技術(shù)存在的不足,本發(fā)明提供一種基于高通量分型的高密度遺傳圖譜構(gòu)建方法一HighMap,該技術(shù)首先采用SGS抽樣技術(shù)對分子標(biāo)記進(jìn)行準(zhǔn)確定位和快速排序,在此基礎(chǔ)上利用KNN算法對高通量測序產(chǎn)生的具有分型噪音的數(shù)據(jù)進(jìn)行糾錯處理,進(jìn)一步通過多輪次標(biāo)記排序和分型糾錯,進(jìn)行不同物種不同遺傳分離群體的高密度遺傳圖譜的高準(zhǔn)確性、高通量構(gòu)建。本發(fā)明所述方法可為遺傳學(xué)領(lǐng)域研究提供高質(zhì)量的遺傳圖譜,特別適用于高雜合分離群體的遺傳圖譜構(gòu)建。
[0005]本發(fā)明的另一目的是提出一種遺傳圖譜的評價方法。
[0006]實現(xiàn)本發(fā)明上述目的技術(shù)方案為:
[0007]—種基于高通量分型的高密度遺傳圖譜構(gòu)建方法,包括步驟:
[0008]I)通過高通量測序方法對遺傳分離群體進(jìn)行全基因組標(biāo)記開發(fā)和分型,獲得遺傳分離群體的基因分型數(shù)據(jù);
[0009]2)對兩兩標(biāo)記進(jìn)行遺傳連鎖檢驗,將分子標(biāo)記劃分為不同的連鎖群,與目標(biāo)物種的染色體建立對應(yīng)關(guān)系;
[0010]3)利用SGS算法獲得每個連鎖群內(nèi)標(biāo)記的線性排序并計算相鄰位點(diǎn)之間的遺傳距離,基于SGS算法得到的標(biāo)記順序,利用KNN算法進(jìn)行糾錯和補(bǔ)缺失處理,終獲得遺傳圖譜;[0011]4)從標(biāo)記排序和遺傳圖距估計的準(zhǔn)確性兩個角度,對所構(gòu)建的遺傳圖譜進(jìn)行全面評估,通過可視化方法直觀展示最終所得遺傳圖譜的質(zhì)量;
[0012]其中,所述遺傳分離群體為性狀分離群體,選自Fl、F2、BCl、DH中的一種或多種目標(biāo)性狀分離的群體。
[0013]其中,所述步驟2)中,包括步驟a、構(gòu)架二維棋盤表;b、統(tǒng)計分型頻數(shù);c、計算獨(dú)立性檢驗統(tǒng)計量,進(jìn)行連鎖群劃分,具體為:
[0014]a、根據(jù)每一標(biāo)記位點(diǎn)可能的分型構(gòu)建二維棋盤表,所述二維棋盤表為2X2、2X3、2X4、3X3、3X4或4X4的棋盤表;
[0015]b、統(tǒng)計每一個棋盤表中每種分型頻數(shù),其中R,C,T和O分別為行頻數(shù),列頻數(shù),總頻數(shù)及每一棋盤表中每種分型的頻數(shù),并根據(jù)行頻數(shù),列頻數(shù),總頻數(shù)計算每種分型出現(xiàn)的理論頻數(shù)E:
[0016]E=R*C/T(I)
[0017]C、基于觀測和理論頻數(shù),計算獨(dú)立性檢驗統(tǒng)計量G:
[0018]
【權(quán)利要求】
1.一種基于高通量分型的高密度遺傳圖譜構(gòu)建方法,包括步驟: 1)通過高通量測序方法對遺傳分離群體進(jìn)行全基因組標(biāo)記開發(fā)和分型,獲得遺傳分離群體的基因分型數(shù)據(jù); 2)對兩兩標(biāo)記進(jìn)行遺傳連鎖檢驗,將分子標(biāo)記劃分為不同的連鎖群,與目標(biāo)物種的染色體建立對應(yīng)關(guān)系; 3)利用SGS算法獲得每個連鎖群內(nèi)標(biāo)記的線性排序并計算相鄰位點(diǎn)之間的遺傳距離,基于SGS算法得到的標(biāo)記順序,利用KNN算法進(jìn)行糾錯和補(bǔ)缺失處理,終獲得遺傳圖譜; 4)從標(biāo)記排序和遺傳圖距估計的準(zhǔn)確性兩個角度,對所構(gòu)建的遺傳圖譜進(jìn)行全面評估,通過可視化方法直觀展示最終所得遺傳圖譜的質(zhì)量。
2.根據(jù)權(quán)利要求1所述的遺傳圖譜構(gòu)建方法,其特征在于,所述遺傳分離群體為性狀分離群體,選自Fl、F2、BCl、DH中的一種或多種目標(biāo)性狀分離的群體。
3.根據(jù)權(quán)利要求1所述的遺傳圖譜構(gòu)建方法,其特征在于,所述步驟2)中,包括步驟a、構(gòu)架二維棋盤表;b、統(tǒng)計分型頻數(shù);c、計算獨(dú)立性檢驗統(tǒng)計量,進(jìn)行連鎖群劃分。
4.根據(jù)權(quán)利要求1所述的遺傳圖譜構(gòu)建方法,其特征在于,所述步驟3)中SGS為空間抽樣、模擬退火和吉布斯抽樣方法的組合;所述利用KNN算法對樣品分型數(shù)據(jù)中的分型錯誤和分型缺失進(jìn)行糾錯和補(bǔ)缺失處理。
5.根據(jù)權(quán)利要求1-4任一所述的遺傳圖譜構(gòu)建方法,其特征在于,所述步驟3)中基于SGS算法的標(biāo)記順序和基于KNN算法的糾錯和補(bǔ)缺失處理的操作循環(huán)進(jìn)行3-10次。
6.根據(jù)權(quán)利要求1-4`任一所述的遺傳圖譜構(gòu)建方法,其特征在于,所述步驟4)中可視化方法包括: a、利用物種本身或近緣物種的參考基因組,通過共線性圖譜來檢驗遺傳圖譜標(biāo)記排序的準(zhǔn)確性; b、利用熱圖檢查每一標(biāo)記在圖譜上的定位是否與相鄰分子標(biāo)記的遺傳重組相容,檢驗每一標(biāo)記排序和定位與觀測數(shù)據(jù)的相容度; C、通過重組圖譜直觀展示樣品分離群體的重組情況,檢查樣品分型數(shù)據(jù)矩陣中的分型錯誤。
7.一種遺傳圖譜質(zhì)量的評價方法,其特征在于,從標(biāo)記排序和遺傳圖距估計的準(zhǔn)確性兩個角度,通過可視化方法評估遺傳圖譜的質(zhì)量。
8.根據(jù)權(quán)利要求7所述的評價方法,其特征在于,所述可視化方法包括: a、利用物種本身或近緣物種的參考基因組,通過共線性圖譜來檢驗遺傳圖譜標(biāo)記排序的準(zhǔn)確性; b、利用熱圖檢查每一標(biāo)記在圖譜上的定位是否與相鄰分子標(biāo)記的遺傳重組相容,檢驗每一標(biāo)記排序和定位與觀測數(shù)據(jù)的相容度; C、通過重組圖譜直觀展示樣品分離群體的重組情況,檢查樣品分型數(shù)據(jù)矩陣中的分型錯誤。
9.根據(jù)權(quán)利要求7所述的評價方法,其特征在于,所述標(biāo)記排序的準(zhǔn)確性是通過與自身或近緣物種的參考基因組的比較基因組分析來驗證。
【文檔編號】G06F19/26GK103525917SQ201310449422
【公開日】2014年1月22日 申請日期:2013年9月24日 優(yōu)先權(quán)日:2013年9月24日
【發(fā)明者】鄭洪坤 申請人:北京百邁客生物科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1