亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

可視化核酸序列的制作方法

文檔序號(hào):9355203閱讀:851來源:國(guó)知局
可視化核酸序列的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明要求的優(yōu)先權(quán)是美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/757007,申請(qǐng)日2013年1月 25日,其公開的內(nèi)容在此引用,以其整體并入本文。
[0002] 本發(fā)明涉及計(jì)算機(jī)輔助分析之生物信息數(shù)據(jù)處理,更具體地,涉及染色體核酸序 列的計(jì)算機(jī)輔助圖形分析。
【背景技術(shù)】
[0003] 脫氧核糖核酸(DNA)分子中含有在生物體的發(fā)育和功能中使用的遺傳密碼。這些 指令被編碼在堿基構(gòu)成的DNA分子的兩個(gè)互補(bǔ)平行鏈中。具體地說,所述指令被存儲(chǔ)在核 苷酸鏈中,它們由四種不同的核苷酸構(gòu)成(腺嘌呤(A),胞嘧啶(C),鳥嘌呤(G)和胸腺嘧啶 (T))。特定的核苷酸序列定義了生物體內(nèi)的所有生理生化反應(yīng)。
[0004] 為了更好地了解DNA序列是如何影響生物體,已經(jīng)開發(fā)了一套稱為DNA測(cè)序流程, 其中核苷酸序列被讀取并存儲(chǔ)。這些序列可以隨后被分析,以識(shí)別核苷酸的某些序列,分析 與之在生物體內(nèi)產(chǎn)生的生化特性之間的關(guān)系。該技術(shù)具有廣泛的應(yīng)用,如在診斷,生物技 術(shù),法醫(yī)生物系統(tǒng)學(xué)等相關(guān)領(lǐng)域。
[0005] 雖然DNA測(cè)序已經(jīng)廣泛應(yīng)用,將所得序列數(shù)據(jù)進(jìn)行全面分析是很困難的,這是由 DNA序列數(shù)據(jù)性質(zhì)決定的。例如,對(duì)基因?qū)W家來說,查看一長(zhǎng)串A,T,C和G組成的核苷酸鏈, 從中提取分析有意義的信息是件極困難的事。此外,日益增長(zhǎng)的海量DNA序列數(shù)據(jù),使序列 分析成為一項(xiàng)繁重的任務(wù)。一套完整的人類染色體DNA含有33億個(gè)堿基對(duì)。這種數(shù)據(jù)規(guī) 模的分析是極為困難和耗時(shí)的。更困難的是,目前還沒有有效的方法,在宏觀水平上,對(duì)不 同物種,進(jìn)行染色體序列比對(duì)分析。
[0006] 本發(fā)明引用的所有參考,都通過引用其整體,并入本發(fā)明。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明提供的方法(如計(jì)算機(jī)實(shí)現(xiàn)的方法,其中包括軟件系統(tǒng)和處理過程),用于 分析染色體核酸序列的數(shù)據(jù);示例性方法包括:給定一條核苷酸序列,序列中的每個(gè)堿基 被分配一個(gè)數(shù)值(賦值);使用這些分配的值,求和可以計(jì)算出核苷酸序列中每個(gè)堿基位置 的累計(jì)值;生成一組累計(jì)值序列,然后,在坐標(biāo)系中以曲線的形式,按分析需要,繪制成不同 的圖形(也稱為"序列圖譜")。
[0008] 本發(fā)明提供的方法,允許海量序列數(shù)據(jù)信息的分析;通過可視化顯示以曲線形式 表達(dá)的核苷酸序列數(shù)據(jù)(序列圖譜),能夠輕而易舉地識(shí)別序列曲線的特征圖案或圖形樣 式,(例如峰和/或峰叢)它們都對(duì)應(yīng)于特定核苷酸序列組合;隨例顯示,序列圖示化曲線 上升意味著和A、G優(yōu)勢(shì)含量相關(guān)(或是其反映);下降的曲線意味著,和堿基序列內(nèi)的T、C 優(yōu)勢(shì)含量相關(guān)(或是其反映)。因此,在實(shí)際應(yīng)用中,序列圖譜的曲線能從視覺上判斷出,核 苷酸序列中的某些部分內(nèi)的A、G或T、C相對(duì)含量。這些曲線圖形可以進(jìn)一步被標(biāo)記或注 釋,展示出富有特征片段的序列圖形"地圖"(如,基因分布圖,tRNA,rRNA,Alu族,重復(fù)序 列,SNP,甲基化等等分布圖),這樣,在其上能提供更多的有價(jià)值的基因信息內(nèi)容。本發(fā)明 還提供方法命名,例如,在堿基序列中,為便于識(shí)別某種具有特征序列圖案或是相關(guān)的一部 分或多個(gè)部分而進(jìn)行命名(即命名序列圖譜的部分)。
[0009] 本發(fā)明提供的方法,允許(例如不同的染色體間)核苷酸序列進(jìn)行大片段序列相 似性比對(duì);通過比較不同序列的圖譜或?qū)ふ仪€圖案相同或相似的形狀,可以容易地標(biāo)識(shí) 出不同核苷酸序列間它們共通的相似序列;這方法使得比較各類各源的核苷酸序列變得簡(jiǎn) 單快速,尤其是大片段的核苷酸序列,例如染色體序列間的比對(duì),并輕而易舉地找出這些序 列之間的相似片段位置。
[0010] 本發(fā)明提供的方法,也可用于在一個(gè)特定序列中,尋找自身序列中的大片段重復(fù) 序列,例如,比對(duì)同一條序列譜圖(自相比對(duì))的不同部分,就很容易地識(shí)別出序列內(nèi)的重 復(fù)序列。本方法同時(shí)提供人們進(jìn)行序列測(cè)序質(zhì)量控制方法(如在基因測(cè)序項(xiàng)目中),涉及大 量序列信息拼接。在單一序列中,通過鑒別人工拼接序列中重復(fù)序列發(fā)生的位點(diǎn)和出現(xiàn)的 頻率,能直觀地評(píng)估合理性以及評(píng)價(jià)測(cè)序數(shù)據(jù)的質(zhì)量。
[0011] 因此,在一個(gè)方面,本發(fā)明提供了一種方法(如計(jì)算機(jī)實(shí)現(xiàn)的方法),用于產(chǎn)生核 苷酸序列的一個(gè)可視化表達(dá)(例如一個(gè)序列圖譜)。在另一個(gè)方面,提供了分析核苷酸序列 (例如核苷酸序列至少0.01,0. 1,1,10或100百萬堿基大小范圍)的方法。在另一個(gè)方面, 提供了圖示化核苷酸序列(例如,至少0. 〇1,〇. 1,1,10或100百萬堿基大小的范圍的核苷 酸序列)的方法。在另一個(gè)方面,提供了識(shí)別序列重復(fù)的方法在給定的核苷酸序列內(nèi)(例 如重復(fù)序列中的至少0. 〇1,〇. 1,1,10或100百萬堿基大小的范圍)。還提供了用于實(shí)施本 申請(qǐng)所描述的計(jì)算機(jī)實(shí)現(xiàn)的方法。
[0012] 因此,例如,在一些實(shí)際應(yīng)用中,提供了一種計(jì)算機(jī)實(shí)現(xiàn)的方法,用于圖示化核酸 序列數(shù)據(jù),該方法包括:(a)給定一組核苷酸的序列;(二)賦值該核苷酸序列中的每個(gè)堿 基,生成一組核苷酸值序列;(C)使用該核苷酸值序列,求和,計(jì)算該組序列的每個(gè)位置的 部分累計(jì)值,生成一組累計(jì)值序列(d)使用該累計(jì)值序列數(shù)據(jù),圖示表達(dá)顯示。在這些實(shí)際 應(yīng)用中,核苷酸序列包含多個(gè)核苷酸,包括腺嘌呤,胸腺嘧啶,鳥嘌呤和胞嘧啶。在這些實(shí)際 應(yīng)用中,在該序列中的每個(gè)腺嘌呤核苷酸被分配一個(gè)相同的值;在該序列中的每個(gè)胸腺嘧 啶核苷酸被分配一個(gè)相同的值;在該序列中的每個(gè)鳥嘌呤核苷酸被分配一個(gè)相同的值;在 該序列中的每個(gè)胞嘧啶核苷酸被分配一個(gè)相同的值;
[0013] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,分配給該序列中的胸腺嘧啶核苷酸值和腺嘌呤 核苷酸的值是絕對(duì)值相等、符號(hào)相反,并分配給該序列中鳥嘌呤核苷酸的值,和分配該序列 中胞嘧啶核苷酸的值是絕對(duì)值相等、符號(hào)相反。
[0014] 在根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,一組累計(jì)值序列數(shù)據(jù)的可視化顯示包括累計(jì) 值序列數(shù)據(jù)的曲線圖形化表達(dá)。
[0015] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,一套累計(jì)值序列數(shù)據(jù)是,由該序列每個(gè)堿基位 置的部分累加值組成的序列。
[0016] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,該方法還包括:從上述第一組累計(jì)值序列數(shù)據(jù) 圖形中,截取復(fù)制一段數(shù)據(jù)圖形,用此數(shù)據(jù)片段,產(chǎn)生上述第一組數(shù)據(jù)所示圖示化圖形的一 部分。
[0017] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,復(fù)制的數(shù)據(jù),圖示顯示后(做空間變換),包含 的圖形和上述核苷酸累計(jì)值序列所示圖形部分(或全部)是同形的,或是鏡像對(duì)稱、或旋轉(zhuǎn) 對(duì)稱。
[0018] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,其中,所述方法還包括,在前述核苷酸累計(jì)值序 列圖形上,進(jìn)行特征片段的標(biāo)注或注釋顯示
[0019] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,其中,進(jìn)一步包括:識(shí)別前述核苷酸累計(jì)值序列 可視化圖形的相同/相似部分。
[0020] 根據(jù)上述任一應(yīng)用在實(shí)際應(yīng)用中,其中,還包括,在前述核苷酸累計(jì)值序列數(shù)據(jù)可 視化圖形中,識(shí)別出對(duì)稱結(jié)構(gòu)。
[0021] 在前述核苷酸累計(jì)值序列數(shù)據(jù)中,其中,本發(fā)明進(jìn)一步包括,給定第二組核苷酸序 列,賦值核苷酸,生成第二組核苷酸值序列;利用這第二組核苷酸值序列,產(chǎn)生第二組累計(jì) 值序列數(shù)據(jù),使用該累計(jì)值序列數(shù)據(jù),產(chǎn)生一個(gè)可視化的數(shù)據(jù)圖形顯示。
[0022] 在一些實(shí)際應(yīng)用中,第二組序列中的核苷酸被分配的值,和第一組序列中核苷酸 被分配的值相同。
[0023] 在一些實(shí)際應(yīng)用中,該方法還包括,識(shí)別所述第一組累計(jì)值序列數(shù)據(jù)圖示圖形中 的一個(gè)部分和第二組累計(jì)值序列數(shù)據(jù)的圖示圖形的一個(gè)部分之間相似或?qū)ΨQ。
[0024] 在一些實(shí)際應(yīng)用中,提供了一種由上述方法產(chǎn)生的任何一種圖示圖形表達(dá)。
[0025] 在一些實(shí)際應(yīng)用中,提供了一種命名核酸數(shù)據(jù)圖形的方法,其中,圖示化表達(dá)是由 以下方法產(chǎn)生(包含):(a)給定一條核苷酸序列;(b)給該核苷酸序列中的每個(gè)堿基賦值, 產(chǎn)生一組核苷酸值序列,(C)使用該核苷酸值序列,計(jì)算生成一條累計(jì)值序列;以及(d)使 用所述累計(jì)值序列數(shù)據(jù),產(chǎn)生一個(gè)可視化的圖形顯示。
【附圖說明】
[0026] 圖1顯示了根據(jù)不同樣本,可視化核酸序列數(shù)據(jù)的處理流程。
[0027] 圖2顯示了可視化核酸序列數(shù)據(jù)樣本的步驟原理示意圖。
[0028] 圖3顯示了一組核酸序列四個(gè)方向讀取所產(chǎn)生的數(shù)據(jù)圖示,呈對(duì)稱圖形,是序列 圖示分析原理所在。
[0029] 圖4顯
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1