通過雜交進(jìn)行的隨機(jī)陣列DNA分析本發(fā)明專利申請是國際申請?zhí)枮镻CT/US2004/006022,國際申請日為2004年2月26日,進(jìn)入中國國家階段的申請?zhí)枮?00480010806.3,名稱為“通過雜交進(jìn)行的隨機(jī)陣列DNA分析”的發(fā)明專利申請的分案申請。相關(guān)申請的相互參照本申請要求2003年2月26日提交的美國臨時申請60/450,566的優(yōu)先權(quán),其題目為“通過雜交進(jìn)行的隨機(jī)陣列DNA分析”,代理人審理號CAL-2。相關(guān)主題公開于共有、共待審的2003年12月16日提交的美國專利申請10/738,108,題目為“通過用探針分子編制多個瞬時相互作用進(jìn)行的單靶分子分析”,代理人審理號CAL-3,其要求2002年12月20日提交的美國臨時申請60/435,539的優(yōu)先權(quán),該臨時申請的題目為“通過用探針分子編制多個瞬時相互作用進(jìn)行的單靶分子分析”,代理人審理號30311/39054。這些和所有其他專利和專利申請納入本文作為參考。技術(shù)領(lǐng)域本發(fā)明涉及分析分子的方法和進(jìn)行這種分析的裝置。方法和裝置對單分子核酸進(jìn)行可信賴的分析。這種單分子可來自天然樣品,如不分離或富集的單個組分細(xì)胞、組織、土壤、空氣和水。在本發(fā)明的某些方面,方法和裝置是用于進(jìn)行核酸序列分析或核酸定量包括基因表達(dá)。
背景技術(shù):有三種建立的DNA測序技術(shù)。今天使用的主要測序方法是基于Sanger’s雙脫氧鏈終止法(Sanger等,美國國家科學(xué)院院刊74:5463(1977),以整體納入本文作為參考),依賴于各種基于凝膠的分離設(shè)備,從手工系統(tǒng)到完全自動化的毛細(xì)管測序儀。Sanger法在技術(shù)上是困難的,而且閱讀長度限制在約1kb或更短,要求多次閱讀以達(dá)到高準(zhǔn)確度。第二種方法-焦測序(pyrosequencing)也用聚合酶產(chǎn)生序列信息,即通過監(jiān)測在測試具體DNA堿基摻入生長鏈的連續(xù)循環(huán)期間產(chǎn)生的焦磷酸鹽進(jìn)行(Ronaghi,基因組研究11:3(2001),整體納入本文作為參考)。該方法提供優(yōu)秀的多孔板測定,但是僅用于非常短的10-50堿基片段的局部測序。此閱讀長度限制對于基于序列的診斷是一個嚴(yán)重的限制。上面兩種技術(shù)代表直接測序法,其中鏈上每個堿基的位置是由直接試驗順序決定的。雜交測序(SBH)(美國專利5,202,231;Drmanac等,基因組學(xué)4:114(1989),將兩者整體納入本文作為參考),使用互補核酸的堿基特異性雜交的基礎(chǔ)生命化學(xué),間接組裝靶DNA的堿基順序。在SBH中,將已知序列的重疊探針雜交至樣品DNA分子,使用計算機(jī)算法所得的雜交模式用來產(chǎn)生靶序列(共有、共待審美國專利申請09/874,772;Drmanac等,科學(xué)260:1649-1652(1993);Drmanac等,Nat.Biotech.16:54-58(1998);Drmanac等,“用寡核苷酸探針雜交進(jìn)行DNA測序和指紋分析”,分析化學(xué)百科全書,第5232-5237頁(2000);Drmanac等,“雜交測序(SBH):優(yōu)點、成就及機(jī)會”,生化工程/生物技術(shù)進(jìn)展:芯片技術(shù),Hoheisel,J.(編輯),第76卷,第75-98頁(2002);所有以整體納入本文作為參考)。探針或DNA靶可以高密度陣列的形式排列(例如參見Cutler等,基因組研究11:1913-1925(2001),整體納入本文作為參考)。SBH法的優(yōu)點包括實驗的簡單性,閱讀長度較長、準(zhǔn)確度較高和單一測定中可分析多個樣品。當(dāng)前,迫切需要在復(fù)雜樣品中可以快速并準(zhǔn)確地檢測、分析和鑒定所有潛在的病原體的新生物防御技術(shù)?,F(xiàn)有病原體探測技術(shù)通常缺乏在樣品中準(zhǔn)確鑒定痕量的病原體的靈敏性和選擇性,并且難以操作。此外,在它們的現(xiàn)有應(yīng)用中,所有三個測序技術(shù)都需要大量的樣品DNA。通常用幾種擴(kuò)增方法之一制備樣品,主要是PCR。雖然與DNA擴(kuò)增和序列制備有關(guān)的費用相當(dāng)大,但是這些方法,尤其SBH可以提供良好的個體基因或2-5個基因混合物的基于序列的診斷。因此,所有現(xiàn)有測序方法都缺乏以接受的費用水平在復(fù)雜生物樣品中進(jìn)行全面的基于序列的病原體診斷和篩選提供所需的速度和效率。這在現(xiàn)有技術(shù)能力和新的測序需求之間造成大的差距。理想的是,合適的診斷方法應(yīng)該允許對環(huán)境或臨床樣品中可能存在的所有重要病原體同時進(jìn)行篩查,樣品包括隱藏在生物體中的工程改造的病原體混合物。全面病原體診斷的要求包括需要同時測序10-100個重要基因或整個基因組,從中篩查幾百個病原體,并進(jìn)行上千個樣品的篩查。最終,對于進(jìn)行連續(xù)系統(tǒng)測量的實驗室來說,每個樣品需要測序10-100Mb的DNA,或每天需要測序100Mb至10Gb的DNA?,F(xiàn)有的測序方法比全面病原體診斷和癥狀前測量所需的要求,在測序通量上低100倍,而費用上高100倍?,F(xiàn)有的生物傳感器技術(shù)使用各種分子識別策略,包括抗體、核酸探針、適體、酶、生物受體和其他小分子配體(Iqbal等,生物傳感器和生物電子學(xué)15:549-578(2000),整體納入本文作為參考)。分子識別元件必須偶聯(lián)報道分子或標(biāo)記,以提供陽性檢測事件。DNA雜交和基于抗體的技術(shù)都已廣泛應(yīng)用于病原體診斷。通常,基于核酸的技術(shù)比基于抗體的檢測更特異性和更靈敏,但它是耗時的,而且不太耐用(Iqbal等,2000,上述)。通常需要DNA擴(kuò)增(通過PCR或克隆)或信號放大以達(dá)到可信賴的信號強度,還需要準(zhǔn)確的先序列知識以構(gòu)建病原體特異性探針。雖然單克隆抗體的開發(fā)增加了免疫測定的特異性和可靠性,但該技術(shù)相對昂貴,并容易產(chǎn)生假陽性信號(Doing等,臨床微生物學(xué)雜志37:1582-1583(1999);Marks,臨床化學(xué)48:2008-2016(2002),將兩者整體納入本文作為參考)。其他分子識別技術(shù)如噬菌體展示、適體和小分子配體仍在其早期發(fā)展階段,仍不能多方面足以解決所有病原體檢測問題。所有現(xiàn)有診斷技術(shù)的主要不利條件是它們?nèi)狈υ跇悠分袡z測和鑒定所有潛在病原體的靈敏性和多功能性。武器設(shè)計者可容易地設(shè)計新的生物戰(zhàn)劑來阻撓大部分病原體特異性探針或免疫測定。顯然迫切需要有效的基于序列的診斷。為此,申請人開發(fā)了一種高效基因組測序系統(tǒng),即通過雜交進(jìn)行的基于隨機(jī)DNA陣列的測序(rSBH)。rSBH可用于對復(fù)雜微生物群落中存在的所有基因組進(jìn)行基因組序列分析以及人類個體的基因組測序。rSBH不需要DNA克隆或DNA分離,并減少了用本領(lǐng)域已知方法進(jìn)行測序的費用。
技術(shù)實現(xiàn)要素:本發(fā)明提供新穎方法、組合物或混合物和能夠分析單分子DNA的裝置,以對任何長DNA片段、片段混合物、整個基因、基因混合物、mRNA混合物、染色體的長片段、整個染色體、染色體混合物、整個基因組或基因組混合物進(jìn)行快速和準(zhǔn)確地測序。另外,本發(fā)明提供在靶核酸內(nèi)鑒定核酸序列的方法。通過連續(xù)瞬時雜交,從編制數(shù)據(jù)中獲得準(zhǔn)確而廣泛的序列信息。在一個示范性實施例中,將單靶分子瞬時雜交到一種探針或探針群。雜交與一種或多種探針不再存在后,靶分子再次瞬時雜交到下一個探針或探針群。探針或探針群與以前的瞬時雜交探針可以相同或不同。編制相同單靶分子與一種或多種同型探針分子的一系列連續(xù)結(jié)合提供了可靠的測量。因此,因為單靶分子與探針連續(xù)接觸,可以提供足夠數(shù)量的數(shù)據(jù),以鑒定靶分子內(nèi)的序列。通過編制數(shù)據(jù),可以確定整個靶分子的核酸序列。本發(fā)明還提供在單個生物體水平上分析和檢測存在于復(fù)雜生物樣品中的病原體,以及鑒定所有毒力控制基因的方法、組合物和裝置。本發(fā)明提供分析靶分子的方法,該方法包括下述步驟:a)將靶分子與一種或多種探針分子在一系列連續(xù)結(jié)合反應(yīng)中接觸,其中每個結(jié)合都對靶分子或探針分子產(chǎn)生效應(yīng);和b)編制系列連續(xù)結(jié)合反應(yīng)的效應(yīng)。本發(fā)明還提供分析靶分子的方法,該方法包括下述步驟:a)將靶分子與一種或多種探針分子在一系列連續(xù)雜交/解離反應(yīng)中接觸,其中每個結(jié)合都對靶分子或探針分子產(chǎn)生效應(yīng);和b)編制系列連續(xù)雜交/解離反應(yīng)的效應(yīng)。在某些實施例中,該系列包含至少5、至少10、至少25、至少50、至少100或至少1000個連續(xù)雜交/解離或結(jié)合反應(yīng)。在一個實施例中,該系列包含至少5并少于50個連續(xù)雜交/解離或結(jié)合反應(yīng)。本發(fā)明包括實施例,其中探針分子序列或結(jié)構(gòu)是已知或可確定的。這種實施例的一個優(yōu)點是,它們用于在從編制一個或多個已知/可確定序列的探針效應(yīng)的靶中鑒定序列。而且,當(dāng)在一個靶分子內(nèi)鑒定到多個重疊序列時,這種鑒定的重疊序列可用于對靶分子測序。本發(fā)明還提供一種分析靶分子的方法,其中分析中包括的效應(yīng)編制涉及時間測量(即檢測到信號的時間長度或在預(yù)設(shè)時段信號的檢測等)。在某些實施例中,用測定靶分子或探針分子產(chǎn)生熒光信號的時間來編制效應(yīng)。本發(fā)明也提供用檢測僅在靶分子與探針的雜交或結(jié)合時產(chǎn)生的信號來編制效應(yīng)的方法。方法包括通過測定信號產(chǎn)生的時段量來編制效應(yīng)的的方法,和通過測定信號產(chǎn)生量來編制效應(yīng)的的方法。在某些實施例中,靶分子包含熒光共振能量轉(zhuǎn)移(FRET)供體和含有FRET受體的探針分子。在其他實施例中,靶分子包含F(xiàn)RET受體和含有FRET供體的探針分子。本發(fā)明也提供對一種或多種探針的效應(yīng)是探針修飾的方法。在某些實施例中,探針被連接,該方法還包括檢測連接的探針。探針可用納米標(biāo)記進(jìn)行標(biāo)記。在雜交或結(jié)合對探針的效應(yīng)是探針修飾的實施例中,由全匹配雜交引起的修飾比錯配雜交引起的修飾更頻繁,可通過檢測存在相當(dāng)高數(shù)量的修飾來確定全匹配。本發(fā)明的方法包括:a)核酸分子的片段化產(chǎn)生靶分子;b)通過限制酶消化、超聲波處理、氫氧化鈉處理或低壓剪切完成片段化;c)可檢測地標(biāo)記靶分子;d)用選自熒光標(biāo)記、納米標(biāo)記、化學(xué)發(fā)光標(biāo)記、量子點、量子珠、熒光蛋白、具有熒光標(biāo)記的樹狀聚體、微轉(zhuǎn)發(fā)器、電子供體分子或分子結(jié)構(gòu)和光反射顆粒的標(biāo)記可檢測地標(biāo)記靶分子和/或探針分子;e)用電荷偶聯(lián)裝置(CCD)檢測標(biāo)記;f)具有相同信息區(qū)的探針分子分別與相同可檢測標(biāo)記結(jié)合;g)一種或多種探針分子包含多個標(biāo)記;h)將探針分子分至庫中,每個庫包含至少兩種具有不同信息區(qū)的探針分子,每個庫內(nèi)的所有探針分子都與相同標(biāo)記結(jié)合,該標(biāo)記對與其他庫相比的庫是獨特的;i)通過排序雜交到靶分子的重疊探針序列,組裝靶分子的序列;j)通過排序重疊探針序列和從摻入的探針的雜交效率確定組裝序列的分?jǐn)?shù)/可能性/概率,組裝靶分子的序列;k)信息區(qū)中的探針各自獨立,長度在4至20個核苷酸之間;l)信息區(qū)中的探針各自獨立,長度在4至100個核苷酸之間;m)附著分子的靶序列具有的長度在約20至2000個堿基之間;n)一種或多種探針由至少一種修飾或通用堿基組成;o)一種或多種探針由至少一種在末端位置的通用堿基組成;p)雜交條件有效使靶分子僅與靶分子的一部分完美互補的那些探針雜交;q)接觸包括具有互不相同的信息區(qū)的至少約10、至少約100、至少約1000或至少約10,000探針分子;和/或r)用少于1000、800、600、400、200、100、75、50、25或10靶分子。在一個實施例中,本發(fā)明的方法可用于在微生物生物薄膜中及其一定百分比的組合物中分析微生物基因組。生物薄膜群落包含的微生物包括嗜鐵鉤端螺菌(Leptospirillumferriphilum)種系型、亞鐵螺菌(Ferrospirillumsp.)、熱氧化硫化桿菌種系型、古菌(包括Ferroplasmaacidarmanus、Aplasma、Geneplasma種系型)和真核生物(包括protests和真菌)。本發(fā)明還提供等溫擴(kuò)增的方法,該方法使用鏈取代酶,基于以侵入物寡核苷酸引物退火為目的的單鏈DNA形成。本發(fā)明還提供支持rSBH全基因組(復(fù)雜的DNA樣品)并可處理多達(dá)3Gbp至10Gbp序列的軟件。本發(fā)明還提供試劑和試劑盒,以同時分析許多基因或診斷區(qū)、并從血樣中處理和制備病原體DNA。本發(fā)明還包括包含探針、靶核酸和連接分子的混合物的組合物,以從血液、組織或環(huán)境樣品中分析許多病原體基因或診斷區(qū)。在考慮下面以目前優(yōu)選實施例進(jìn)行的本發(fā)明詳述時,本領(lǐng)域技術(shù)人員將會明白本發(fā)明的許多其他方面和優(yōu)點。附圖說明結(jié)合下面的附圖可更好理解本發(fā)明的詳述:圖1描述了接頭連接和延伸。雙鏈發(fā)夾接頭(實線)被發(fā)夾端的交聯(lián)堿基維持發(fā)夾形式。B和F分別代表結(jié)合引物和固定的引物序列,它們的互補序列以小寫字母表示。細(xì)線代表基因組序列。A)非磷酸化接頭連接于基因組DNA在具有游離3’末端(箭頭)的鏈中產(chǎn)生缺口。B)從3’末端延伸產(chǎn)生一條替代鏈和接頭序列的復(fù)制。圖2描述了接頭設(shè)計和附著于DNA片段,其中實心黑條代表基因組DNA,F(xiàn)代表游離的引物,B代表結(jié)合的引物,f和b分別代表它們的補體。圖3描述了芯片表面上ampliot的產(chǎn)生。A)接頭捕獲的基因組DNA解鏈后,一條鏈通過與結(jié)合引物B雜交而被捕獲在載玻片表面上。從引物B的聚合酶延伸產(chǎn)生雙鏈分子。B)通過加熱和洗滌載玻片去除模板鏈,引入游離引物F并沿固定鏈延伸。C)F引起的連續(xù)鏈替代擴(kuò)增導(dǎo)致產(chǎn)生一條可以移動至附近的引物B雜交位點的鏈。D)將替代鏈用作模板,從新的引物B位點延伸。圖4描述了用RNA中間體產(chǎn)生ampliot。T7代表T7噬菌體RNA聚合酶啟動子。A)單鏈接頭區(qū)雜交至結(jié)合引物B,用DNA聚合酶延伸形成第二條鏈導(dǎo)致雙鏈T7啟動子的形成。B)T7RNA聚合酶產(chǎn)生RNA拷貝(虛線)。C)然后,RNA結(jié)合至附近的引物B,用逆轉(zhuǎn)錄酶產(chǎn)生cDNA。然后用RNA酶H破壞雙鏈RNA。圖5是描述入侵物介導(dǎo)的等溫DNA擴(kuò)增過程的示意圖。圖6描述了通過雜交(rSBH)方法進(jìn)行的隨機(jī)陣列測序。從上至下分別為:(a)將CCD照相機(jī)放置在反應(yīng)平臺上面,用一個透鏡將平臺上的1微米2面積放大并聚焦于CCD照相機(jī)的一個像素上。(b)陣列(~3毫米x3毫米)由1百萬或更多個1微米2面積,它作為虛擬反應(yīng)池(分別對應(yīng)于CCD相機(jī)的單個像素)。每個像素對應(yīng)底物上的相同位置。在一系列及時反應(yīng)中,一個CCD像素可以結(jié)合幾個反應(yīng)的數(shù)據(jù),因此產(chǎn)生虛擬反應(yīng)池。將DNA樣品隨機(jī)消化并排列在反應(yīng)平臺的表面上,平均濃度為每像素一個片段。(c)用幾個信息探針庫之一對該陣列進(jìn)行rSBH組合連接。記錄每個像素的信號。(d)去除第一個庫的探針,用不同庫或探針對該陣列進(jìn)行第二輪rSBH組合連接。(e)由于兩個相鄰并互補的探針連接而顯示熒光共振能量轉(zhuǎn)移(FRET)信號產(chǎn)生分子細(xì)節(jié)的插入物,所述探針的補體由靶代表。圖7描述了rSBH反應(yīng)。總內(nèi)反射顯微術(shù)(TIRM)檢測系統(tǒng)造成一個漸消失區(qū),在這個區(qū)域,增強激發(fā)僅發(fā)生在玻璃底物的上方區(qū)域。FRET信號在探針雜交到排列的靶時產(chǎn)生,接著連接,因此將FRET對定位在漸消失區(qū)內(nèi)。未連接的探針無論在溶液中游離或者瞬時雜交到靶,均不產(chǎn)生可檢測的信號。因此,TIRM系統(tǒng)的漸消失區(qū)在減少從未反應(yīng)探針產(chǎn)生的背景噪音的同時,在需要平面內(nèi)提供強信號。圖8描述序列組裝。通常,在SBH方法中,用重疊陽性探針組裝靶序列。在本方法中,每個堿基都被閱讀數(shù)次(即用10-mer探針閱讀10次等),這保證很高準(zhǔn)確度,即使一些探針沒有被正確記錄。圖9描述用于rSBH方法的微流體裝置的示意圖。該裝置集成了DNA制備、隨機(jī)單分子DNA陣列形成、組合庫混合和反應(yīng)室的周期裝載和洗滌。當(dāng)樣品管附著于芯片時,用預(yù)裝載的試劑進(jìn)行一系列反應(yīng),以分離并片段化DNA,該DNA隨機(jī)連接于芯片表面,密度約為每像素一個分子。然后用微流體裝置將來自信息探針庫(IPPs)的5’和3’組的兩個探針庫與反應(yīng)溶液混合。一組探針庫用FRET供體標(biāo)記,另一組用FRET受體標(biāo)記。然后,將含有DNA連接酶的混合庫轉(zhuǎn)移至單分子DNA上面的反應(yīng)室。當(dāng)兩種探針(每庫一個)在陣列表面上面狹窄的反射區(qū)域(~100nm)內(nèi),雜交至靶DNA分子的相鄰互補序列時,發(fā)生可檢測的連接事件。在反射區(qū)域內(nèi)5’和3’探針的連接產(chǎn)生FRET信號,用超靈敏CCD相機(jī)檢測并記錄該信號。記錄連接事件后,用洗滌溶液去除每個庫混合物,將預(yù)裝載在微流體芯片上的相同IPPs組的第二對庫組合,并引入反應(yīng)室。通過將兩組IPPs內(nèi)所有可能庫組合,記錄陣列中每個靶分子用于兩個探針組內(nèi)存在的探針序列的每種可能組合的存在/不存在。圖10描述TIRM裝置的基本光學(xué)和光路。(a)位于棱鏡頂部的傳統(tǒng)底物和產(chǎn)生漸消失區(qū)的光路描述。(b)和(c)顯示使用電流計控制從激光器到棱鏡組件的光路。圖11描述rSBH部件和過程的示意圖,顯示rSBH裝置的組件和實驗方法的逐步描述。不依賴該裝置收集并制備樣品(步驟1和2)。通過樣品集成模塊(組件A)進(jìn)一步處理產(chǎn)生的原始樣品用于rSBH陣列形成(步驟3)。隨后將靶排列在反應(yīng)盒(組件B)內(nèi)的底物模塊上。通過探針模塊(組件C)輸送SBH探針,用SBH探針對樣品進(jìn)行SBH連接測定(步驟4)。處理產(chǎn)生的原始數(shù)據(jù),產(chǎn)生序列數(shù)據(jù)的組裝(步驟5)和解釋性分析(步驟6)。圖12顯示4個打點靶的全匹配連接信號。以范圍1至90微摩爾的7個不同濃度打點四個不同的靶。連接探針濃度(5’探針:3’探針比例是1:1)從0.1至1皮摩爾/20微升不等。圖13顯示將打點靶作為其他靶的捕獲探針的圖示。當(dāng)載玻片直接用Tg2-5’探針和Tgt2-3’探針雜交/連接時(圓形),當(dāng)載玻片用靶Tgt2-Tgt1-rc預(yù)雜交、然后用Tgt2-5’探針和Tgt2-3’探針連接時(方形),測量連接信號。具體實施方式本發(fā)明提供單分子DNA分析方法和裝置,以對任何長DNA片段、片段混合物、整個基因、基因混合物、mRNA混合物、染色體的長片段、整個染色體、染色體混合物、整個基因組或基因組混合物進(jìn)行快速和準(zhǔn)確地測序。本發(fā)明方法允許在單個生物體水平上檢測存在于復(fù)雜生物樣品中的病原體,和鑒定毒力控制基因。本發(fā)明方法將雜交和尤其是,通過雜交測序技術(shù)(SBH)與總內(nèi)反射顯微術(shù)(TIRM)或用熒光、納米?;螂妼W(xué)方法的其它靈敏的光學(xué)方法組合。本發(fā)明也提供了樣品排列技術(shù),該技術(shù)建立了與超靈敏電荷偶聯(lián)裝置(CCD)相機(jī)的個體像素相關(guān)的虛擬反應(yīng)室。用熒光標(biāo)記的寡核苷酸探針的完全/通用組信息庫和組合連接方法,對排列的基因組進(jìn)行重復(fù)探測,以便解碼它們的序列。用生物信息學(xué)算法(共有、共待審的美國專利申請09/874,772;Drmanac等,科學(xué)260:1649-1652(1993);Drmanac等,Nat.Biotech.16:54-58(1998);“用寡核苷酸探針雜交進(jìn)行DNA測序和指紋分析”,分析化學(xué)百科全書,第5232-5237頁(2000);Drmanac等,“雜交測序(SBH):優(yōu)點、成就及機(jī)會”,生化工程/生物技術(shù)進(jìn)展:芯片技術(shù),Hoheisel,J.(編輯),第76卷,第75-98頁(2002);所有以整體納入本文作為參考)將信息性熒光信號轉(zhuǎn)換成組裝的序列數(shù)據(jù)。該裝置用定位在診斷實驗室或小移動實驗室的單一小型裝置每小時可以測序超過100兆DNA堿基(30,000堿基/秒)。由于隨機(jī)單分子陣列的大容量,可用本發(fā)明方法檢測、鑒定并測序復(fù)雜生物樣品內(nèi)痕量的病原體DNA。因此,隨機(jī)陣列SBH(rSBH)提供必需技術(shù),以使DNA測序除其它測序應(yīng)用外,在對付生物戰(zhàn)劑的防御中起重要的作用。本發(fā)明提供單DNA分子分析方法,在病原體、宿主和環(huán)境DNA的復(fù)雜生物混合物中快速、準(zhǔn)確地檢測并鑒定任何病原體,并通常分析任何DNA,包括人類個體DNA。本發(fā)明方法允許在單個生物體水平上檢測樣品中存在的病原體,和鑒定所有毒力控制基因。本發(fā)明方法將小組通用信息探針庫(IPPs)的組合雜交/連接方法直接或個體排列分子原位擴(kuò)增約10-或100-、或1000-或10,000-倍后,用于隨機(jī)單分子陣列。在一個典型測試中,將獲自一個樣品的幾百萬隨機(jī)排列單DNA分子與IPPs對雜交,該IPPs對代表所有長度為8至10堿基的可能探針序列的通用庫。當(dāng)兩種探針雜交到靶DNA中相鄰的互補序列時,它們連接產(chǎn)生一個靶分子的陽性記錄,從重疊探針序列信息編制累計的這種記錄組以組裝靶序列。在本發(fā)明的另一實施方式中,單個靶的特征或序列可用于組裝整個基因或基因組的較長序列。此外,通過計算來自相同基因的相同分子或相同片段在陣列中出現(xiàn)多少次,可以得到定量的基因表達(dá)或病原體DNA,這種數(shù)據(jù)可以與獲得的序列組合。SBH是一種發(fā)展良好的技術(shù),可通過很多本領(lǐng)域技術(shù)人員已知的方法實施。具體地,該技術(shù)涉及下述文獻(xiàn)討論的通過雜交進(jìn)行測序,這些文獻(xiàn)以整體納入本文作為參考:Bains和Smith,J.Theor.Biol.135:303-307(1988);Beaucage和Caruthers,TetrahedronLett.22:1859-1862(1981);Broude等,美國國家科學(xué)院院刊91:3072-3076(1994);Breslauer等,美國國家科學(xué)院院刊83:3746-3750(1986);Doty等,美國國家科學(xué)院院刊46:461-466(1990);Chee等,科學(xué)274:610-614(1996);Cheng等,Nat.Biotechnol.16:541-546(1998);Dianzani等,Genomics11:48-53(1991);Drmanac的PCT國際專利申請WO95/09248;Drmanac的PCT國際專利申請WO96/17957;Drmanac的PCT國際專利申請WO98/31836;Drmanac等的PCT國際專利申請WO99/09217;Drmanac等的PCT國際專利申請WO00/40758;PCT國際專利申請WO56937;Drmanac和Jin共有、共待審的美國專利申請09/874,772;Drmanac和Crkvenjakov,ScientiaYugoslaviea16:99-107(1990);Drmanac和Crkvenjakov,Intl.J.GenomeRes.1:59-79(1992);Drmanac和Drmanac,Meth.Enzymology303:165-178(1999);Drmanac等,美國專利5,202,231;Drmanac等,Nucl.AcidsRes.14:4691-4692(1986);Drmanac等,Genomics4:114-128(1989);Drmanac等,J.Biomol.Struct.Dyn.8:1085-1102(1991);Drmanac等,“通過雜交進(jìn)行部分測序:在基因組分析中的概念和應(yīng)用”,第一屆電泳、超級計算和人類基因組國際會議,第60-74頁,世界科學(xué)出版公司,新加坡,馬來西亞(1991);Drmanac等,第一屆電泳、超級計算和人類基因組國際會議會刊,Cantor等編輯,世界科學(xué)出版公司,新加坡,7-59頁(1991);Drmanac等,Nucl.AcidsRes.19:5839-5842(1991);Drmanac等,Electrophoresis13:566-573(1992);Drmanac等,科學(xué)260:1649-1652(1993);Drmanac等,DNAandCellBiol.9:527-534(1994);Drmanac等,Genomics37:29-40(1996);Drmanac等,NatureBiotechnology16:54-58(1998);Gunderson等,GenomeRes.8:1142-1153(1998);Hacia等,NatureGenetics14:441-447(1996);Hacia等,GenomeRes.8:1245-1258(1998);Hoheisel等,Mol.Gen.220:903-14:125-132(1991);Hoheisel等,細(xì)胞73:109-120(1993);Holey等,科學(xué)147:1462-1465(1965);Housby和Southern,Nucl.AcidsRes.26:4259-4266(1998);Hunkapillar等,科學(xué)254:59-63(1991);Khrapko,F(xiàn)EBSLett.256:118-122(1989);Kozal等,NatureMedicine7:753-759(1996);Labat和Drmanac,“排序模擬和與少量寡聚探針雜交的隨機(jī)DNA克隆的序列重建,第二屆電泳、超級計算和人類基因組國際會議,第555-565頁,世界科學(xué)出版公司,新加坡,馬來西亞(1992);Lehrach等,基因組分析:遺傳和物理作圖1:39-81(1990),冷泉港實驗室出版社;Lysov等,Dokl.Akad.Nauk.SSSR303:1508-1511(1988);Lockhart等,Nat.Biotechnol.14:1675-1680(1996);Maxam和Gilbert,美國國家科學(xué)院院刊74:560-564(1977);Meier等,Nucl.AcidsRes.26:2216-2223(1998);Michiels等,CABIOS3:203-210(1987);Milosavljevic等,GenomeRes.6:132-141(1996);Milosavljevic等,Genomics37:77-86(1996);Nikiforov等,Nucl.AcidsRes.22:4167-4175(1994);Pevzner和Lipschutz,“向DNA測序芯片”,《計算機(jī)科學(xué)的數(shù)學(xué)基礎(chǔ)》(1994);Poustka和Lehrach,TrendsGenet.2:174-179(1986);Privara等,編輯,第143-158頁,第19屆國際研討會會刊,MFCS94年,Kosice,Slovakia,Springer-Verlag,柏林(1995);Saiki等,美國國家科學(xué)院院刊86:6230-6234(1989);Sanger等,美國國家科學(xué)院院刊74:5463-5467(1977);Scholler等,Nucl.AcidsRes.23:3842-3849(1995);Southern的PCT國際申請WO89/10977;Southern的美國專利5,700,637;Southern等,Genomics13:1008-1017(1992);Strezoska等,美國國家科學(xué)院院刊88:10089-10093(1991);Sugimoto等,Nucl.AcidRes.24:4501-4505(1996);Wallace等,Nucl.AcidsRes.6:3543-3557(1979);Wang等,科學(xué)280:1077-1082(1998);Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227-259(1991).rSBH的優(yōu)點:rSBH使附著在合適距離的兩個靶DNA分子之間的靶-靶阻斷相互作用減至最小或消除。每點的DNA序列(200-300間堿基)的低復(fù)雜性降低了可互相阻斷的反向重復(fù)的可能性。在一些片段中,用平均每20個源DNA堿基一個切口,分開了回文序列和發(fā)夾臂,并連接至非互補引物DNA。假陽性被最小化,因為重疊片段具有不同的重復(fù)和/或強的不匹配序列。探針-探針連接產(chǎn)物可通過洗滌除去雜交/連接特異性和差示全匹配/不匹配穩(wěn)定性的組合用于由連接制成11-13-mer探針,對于產(chǎn)生更準(zhǔn)確的數(shù)據(jù)是可能的。rSBH提供了在溶液中用3探針連接的有效方法,包括短DNA的分析。模式化探針庫可有效用于兩種探針組分,以提供更具有信息的數(shù)據(jù)。另一優(yōu)點是只需要非常小量的源DNA。消除了對制備標(biāo)準(zhǔn)探針-點陣列的需要,因此成本降低。rSBH提供高達(dá)1000樣品的多重測序,樣品用不同引物和接頭標(biāo)記。此外,本發(fā)明提供在高達(dá)一百萬個體樣品的庫中對單個變體的檢測。通過計算兩個變體,可以檢測雜合子。本發(fā)明在每個表面提供比標(biāo)準(zhǔn)陣列多10至100,000倍的信息。1.多核苷酸的制備和標(biāo)記本發(fā)明的實施利用各種多核苷酸。一般地,一些多核苷酸被可檢測地標(biāo)記。本發(fā)明實施中所用的多核苷酸種類包括靶核酸和探針。術(shù)語“探針”指相對短的多核苷酸,優(yōu)選DNA。探針優(yōu)選比靶核酸至少短1個堿基,探針的長度更優(yōu)選為25個堿基或更短,長度更優(yōu)選為20個堿基或更短。當(dāng)然,探針的最優(yōu)長度將取決于分析的靶核酸的長度。在由約100或更少堿基組成的靶核酸的從頭測序(不用參考序列)中,探針優(yōu)選至少7-mer;對于約100-200個堿基的靶核酸來說,探針優(yōu)選至少8-mer;對于約200-400個堿基的靶核酸來說,探針優(yōu)選至少9-mer;對于約400-800個堿基的靶核酸來說,探針優(yōu)選至少10-mer;對于約800-1600個堿基的靶核酸來說,探針優(yōu)選至少11-mer;對于約1600-3200個堿基的靶核酸來說,探針優(yōu)選至少12-mer;對于約3200-6400個堿基的靶核酸來說,探針優(yōu)選至少13-mer;對于約6400-12,800個堿基的靶核酸來說,探針優(yōu)選至少14-mer。對于靶核酸的長度每再增加兩倍,最優(yōu)探針長度增加一個附加堿基。本領(lǐng)域技術(shù)人員將認(rèn)識,對于SBH應(yīng)用所用的連接探針來說,上述探針長度是連接后的。探針通常為單鏈,雖然在一些應(yīng)用中可使用雙鏈探針。雖然探針一般由天然產(chǎn)生的堿基和磷酸二酯骨架組成,但它們不必如此。例如,探針可由一個或多個修飾的堿基組成,如7-脫氮鳥苷或通用“M”堿基,或一個或多個修飾的骨架鏈接,如硫代磷酸酯。唯一的要求是探針能夠雜交到靶核酸。已知各種修飾堿基和骨架鏈接可以與本發(fā)明聯(lián)合使用,這對本領(lǐng)域技術(shù)人員來說將是顯而易見的。上述的探針長度指探針信息內(nèi)容的長度,不一定是探針的真實物理長度。用于SBH的探針經(jīng)常包含簡并末端,該簡并末端并不有助于探針的信息內(nèi)容。例如,SBH應(yīng)用經(jīng)常用式NxByNz的探針混合物,其中N代表4種堿基中的任意一種,它因給定混合物中的多核苷酸而改變,B代表4種堿基中的任意一種,但對給定混合物中的各多核苷酸是相同的,x、y和z是整數(shù)。一般地,x和z是0和5之間的獨立整數(shù)而y是4和20之間的整數(shù)。已知堿基By的數(shù)量定義了多核苷酸的“信息內(nèi)容”,因為簡并末端不有助于探針的信息內(nèi)容。包含固定多核苷酸的混合物的線性陣列在,例如通過雜交測序中是有用的。在這些簡并探針混合物中錯配的雜交區(qū)別僅指信息內(nèi)容的長度,而并非全部物理長度。可以用本領(lǐng)域中的公知技術(shù)制備本發(fā)明中使用的探針,例如用AppliedBiosystems合成儀進(jìn)行自動合成。此外,可以用GenosysBiotechnologies公司的方法制備探針,該方法使用大量多孔特氟隆圓片。對于本發(fā)明目的來說,所用的寡核苷酸探針來源并不重要,本領(lǐng)域技術(shù)人員將明白,用現(xiàn)在已知或以后開發(fā)的其他方法制備寡核苷酸也是足夠的。術(shù)語“靶核酸”指需要序列信息的一種多核苷酸或一種多核苷酸的一些部分,一般是在SBH測定中測序的多核苷酸。靶核酸可以是任何數(shù)量長度的核苷酸,取決于探針的長度,但一般長度約為100、200、400、800、1600、3200、6400或更多核苷酸。一個樣品一般具有多于100、多于1000、多于10,000、多于100,000、多于一百萬或多于一千萬靶。靶核酸可由核糖核苷酸、脫氧核糖核苷酸或其混合物組成。一般地,靶核酸是DNA。雖然靶核酸可以是雙鏈,但是它優(yōu)選是單鏈。而且,靶核酸實際上可獲自任何來源。在使用SBH測定前,根據(jù)它的長度,將其優(yōu)選地剪切成上述大小的片段。與探針相似,靶核酸可由一種或多種修飾堿基或骨架鏈接組成。靶核酸可獲自任何合適的來源,如cDNA、基因組DNA、染色體DNA、微切割染色體條帶、粘粒或酵母人工染色體(YAC)插入物和RNA,包括沒有經(jīng)過任何擴(kuò)增步驟的mRNA。例如,Sambrook等《分子克隆:實驗室手冊》,冷泉港出版社,紐約(1989),整體納入本文作為參考,該書描述了三種從哺乳動物細(xì)胞中分離高分子量DNA的方案(第9.14-9.23頁)。然后,一般用本領(lǐng)域技術(shù)人員已知的任何方法將多核苷酸片段化,這些方法包括,例如,如Sambrook等(1989)在第9.24-9.28頁所述的使用限制酶消化、超聲波剪切和NaOH處理。尤其適用于將DNA片段化的方法是,用兩個堿基識別內(nèi)切核酸酶CviJI,由Fitzgerald等,Nucl.AcidsRes.20:3753-3762(1992)所述,整體納入本文作為參考。在一個優(yōu)選實施方式中,制備靶核酸,使它們不能相互連接,例如通過用磷酸酶(即小牛腸磷酸酶)處理由酶消化或物理剪切獲得的片段化的核酸。此外,樣品核酸的非可連接片段可通過在樣品核酸的Sanger雙脫氧測序反應(yīng)中用隨機(jī)引物(即N5-N9,其中N=A、G、T或C)獲得,該隨機(jī)引物在5’末端沒有磷酸。在大多數(shù)情況下,將DNA變性產(chǎn)生可用于雜交的單鏈?zhǔn)侵匾摹_@可通過將DNA溶液在80-90℃孵育2-5分鐘完成。然后將該溶液迅速冷卻至2℃,防止DNA片段在與探針接觸之前復(fù)性。可以可檢測地標(biāo)記探針和/或靶核酸。事實上,任何產(chǎn)生可檢測信號的標(biāo)記和能夠被固定在底物或附著于多核苷酸的標(biāo)記均可以與本發(fā)明的陣列聯(lián)合使用。產(chǎn)生的信號優(yōu)適合于定量。合適的標(biāo)記包括但不限于,放射性同位素、熒光團(tuán)、發(fā)色團(tuán)、化學(xué)發(fā)光部分。由于它們易檢測,優(yōu)選標(biāo)記熒光團(tuán)的多核苷酸序列。書中已有適于標(biāo)記多核苷酸的熒光團(tuán)的描述,例如分子探針目錄(MolecularProbes公司,俄勒岡州Eugene)和其中引用的參考文獻(xiàn)。將熒光團(tuán)標(biāo)記連接到多核苷酸的方法是公知的,可在,例如Goodchild,Bioconjug.Chem.1:165-187(1990)中找到,以整體納入本文作為參考。優(yōu)選熒光團(tuán)標(biāo)記是Cy5染料,它可從AmershamBiosciences購得。此外,探針或靶可用本領(lǐng)域任何其他已知技術(shù)標(biāo)記。優(yōu)選技術(shù)包括直接化學(xué)標(biāo)記法和酶標(biāo)記法,如激酶化和切口平移。標(biāo)記的探針可容易地購自各種商業(yè)來源,包括GENSET,而非合成。通常,可將標(biāo)記連接于探針或靶多核苷酸的任何部分,包括一個或多個堿基的游離末端。當(dāng)標(biāo)記通過多核苷酸連接于固體支持物時,它必須定位在可以用錯配特異性內(nèi)切核酸酶切割從固體支持物上釋放的位置,如共有、共待審的美國專利申請09/858,408所述(整體納入本文作為參考)。優(yōu)選的是,該標(biāo)記位置并不干擾標(biāo)記的多核苷酸的雜交、連接、切割或其他雜交后修飾。本發(fā)明的一些實施方式使用多種標(biāo)記,即用許多可區(qū)別標(biāo)記(如不同的熒光團(tuán))。多重標(biāo)記允許在一次雜交反應(yīng)中同時檢測許多序列。例如,4個顏色的多重標(biāo)記通過附加因子4減少所需的雜交數(shù)。其他實施方式使用探針信息庫減少通常在SBH方案中發(fā)現(xiàn)的冗余,因此減少明確確定靶DNA序列所需的雜交反應(yīng)數(shù)。在共有、待審的美國專利申請09/479,608中可以發(fā)現(xiàn)探針信息庫及其使用方法,整體納入本文作為參考。2.多核苷酸附著于固體底物本發(fā)明的一些實施方式需要將多核苷酸,例如靶DNA片段附著于固體底物。在優(yōu)選實施方式中,可檢測地標(biāo)記適合的DNA樣品,并隨機(jī)地附著于固體底物,濃度為每像素1個片段。固體底物的特性和幾何學(xué)取決于各種因素,其中包括陣列類型和附著方式(例即共價或非共價)。通常,底物可由任何允許固定多核苷酸的材料組成,且這種材料不會在用來雜交和/或變性核酸的條件下解鏈或顯著降解。此外,考慮到共價固定,底物應(yīng)該可與活性基團(tuán)激活,該活性基團(tuán)能夠與待固定的多核苷酸形成共價鍵。很多適于用作本發(fā)明底物的材料在本領(lǐng)域中已有描述。在優(yōu)選實施方式中,該底物由光學(xué)透明的物質(zhì),如載玻片組成。其他合適的示范材料包括,例如丙烯酸、苯乙烯-甲基異丁烯酸共聚物,乙烯/丙烯酸,丙烯腈-丁二烯-苯乙烯(ABS)ABS/聚碳酸酯,ABS/聚砜,ABS/聚氯乙烯,乙烯基丙烯,乙烯乙酸乙烯酯(EVA),硝酸纖維素,尼龍(包括尼龍6、尼龍6/6、尼龍6/6-6、尼龍6/10、尼龍6/12、尼龍11和尼龍12),聚丙烯腈(PAN),聚丙烯酸酯,聚碳酸酯,聚對苯二甲酸丁烯酯(PBT),聚對苯二甲酸乙二醇酯(PET),聚乙稀(包括低密度、線性低密度、高密度、交聯(lián)和超高分子量級),聚丙烯均聚物,聚丙烯共聚物,聚苯乙烯(包括通用級和高沖擊級),聚四氟乙烯(PTFE),氟化乙烯-丙烯(FEP),乙烯-四氟乙烯(ETFE),全氟化烷氧基乙烯(PFA),聚氟乙烯(PVF),聚偏氟乙烯(PVDF),聚三氟氯乙烯(PCTFE),聚乙烯-三氟氯乙烯(ECTFE),聚乙烯醇(PVA),硅苯乙烯-丙烯腈(SAN),苯乙烯馬來酐(SMA),金屬氧化物和玻璃。通常,多核苷酸片段可通過合適活性基團(tuán)結(jié)合于支持物。這種活性基團(tuán)是本領(lǐng)域公知的,包括,例如,氨基(-NH2)、羥基(-OH)或羧基(-COOH)??赏ㄟ^本領(lǐng)域技術(shù)人員已知的任何方法,用任何合適支持物,如玻璃來制備支持物連接的多核苷酸片段??赏ㄟ^很多方法完成固定,包括,例如使用被動吸附(Inouye和Hondo,J.Clin.Microbiol.28:1469-1472(1990),整體納入本文作為參考)、使用紫外光(Dahlen等,Mol.CellProbes1:159-168(1987),整體納入本文作為參考),或堿基修飾DNA的共價結(jié)合(Keller等,Anal.Biochem.170:441-451(1988),Keller等,Anal.Biochem.177:392-395(1989),兩者整體納入本文作為參考)或在探針和支持物之間形成酰胺基(Zhang等,Nucl.AcidsRes.19:3929-3933(1991),整體納入本文作為參考)??紤]到,進(jìn)一步適合使用本發(fā)明的方法是PCT專利申請WO90/03382(Southern等)中描述的方法,納入本文作為參考。該制備結(jié)合到支持物的多核苷酸片段的方法包括將核苷3’試劑通過磷酸基團(tuán)的共價磷酸二酯鍵連接到支持物載有的脂肪族羥基基團(tuán)。然后,在支持的核苷上合成寡核苷酸,在不從支持物切下寡核苷酸鏈的標(biāo)準(zhǔn)條件下,將保護(hù)基團(tuán)從合成的寡核苷酸鏈去除。合適的試劑包括核苷亞磷酰胺和核苷磷化氫。此外,可尋址激光激活的光去保護(hù)可用于寡核苷酸直接在玻璃表面上的化學(xué)合成,如Fodor等,科學(xué)251:767-773(1991)所述,納入本文作為參考。一種具體的制備支持物結(jié)合的多核苷酸片段的方式是用Pease等,美國國家科學(xué)院院刊91:5022-5026(1994)(納入本文作為參考)所述的光發(fā)生合成。這些作者使用現(xiàn)有的照相平版印刷技術(shù)產(chǎn)生固定了寡核苷酸探針的陣列,即DNA芯片。這些把光用于在高密度、小型化陣列中指導(dǎo)寡核苷酸探針合成的方法,使用了光不穩(wěn)定性5’-保護(hù)的N-酰基-脫氧核苷亞磷酰胺、表面連接化學(xué)和各種組合合成策略??捎么朔椒óa(chǎn)生256個空間位置確定的寡核苷酸探針的基質(zhì)。然后用于如上所述的SBH測序。在一個優(yōu)選實施方式中,通過連接部分將本發(fā)明的DNA片段連接到固體基質(zhì)。該連接可由能夠形成至少兩個共價鍵的原子組成,例如碳、硅、氧、硫、磷等,或由能夠形成至少兩個共價鍵的分子組成,例如糖-磷酸基團(tuán)、氨基酸、肽、核苷、核苷酸、糖、碳水化合物、芳環(huán)、烴環(huán)、線性和分支烴等。在本發(fā)明的一個尤其優(yōu)選的實施方式中,連接部分由烯化二醇部分組成。在優(yōu)選實施方式中,將可檢測標(biāo)記連接到DNA片段(即靶DNA)。3.在固體支持物上形成可檢測標(biāo)記的雙鏈體在本發(fā)明的一個優(yōu)選實施方式中,一個標(biāo)記探針通過互補堿基配對相互作用連接到一個可檢測的標(biāo)記靶核酸,該核酸本身連接到固體支持物作為多核苷酸陣列的一部分,因此形成雙鏈體。在另一優(yōu)選實施方式中,將標(biāo)記探針共價附著,即連接到另一探針,該探針通過互補堿基配對相互作用連接到一個靶核酸,該核酸本身連接到固體支持物作為空間可尋址的多核苷酸陣列的一部分,如果兩種探針以連續(xù)方式雜交到靶核酸。這里使用的核苷酸堿基“配對”或“互補”,如果它們在特定條件下形成穩(wěn)定的雙鏈體或結(jié)合對。一個堿基對于另一堿基的特異性是由堿基上的氫鍵供體和受體的有效性和方向指定的。例如,在通常用于雜交測定的條件下,腺嘌啉(A)與胸腺嘧啶(T)配對,而不與鳥嘌呤(G)或胞嘧啶(C)配對。相似地,G與C配對,而不是A或T。以不太特異的方式相互作用的堿基如次黃嘌呤或通用堿基(M堿基,Nichols等,自然369:492-493(1994),整體納入本文作為參考)與那些在特定條件下與其形成穩(wěn)定雙鏈體的堿基互補,或其他修飾堿基,例如甲基化堿基。未互相互補的核苷酸堿基被稱為“錯配”。一對多核苷酸,如一個探針和一個靶核酸,如果在特定條件下核酸由互補核苷酸堿基配對介導(dǎo)的相互作用互相雜交、因此形成雙鏈體,則稱為“互補”或“配對”。在兩個多核苷酸之間形成的雙鏈體可以包括一個或多個堿基錯配。這樣的雙鏈體被稱為“錯配雙鏈體”或雜合雙鏈體。雜交條件越寬松,越可能容忍錯配和可形成相對穩(wěn)定的錯配雙鏈體。配對多核苷酸的亞類,稱為“完美互補”或“完美配對”多核苷酸,由含有互相互補的連續(xù)堿基序列的成對多核苷酸組成,其中沒有錯配(即沒有任何環(huán)境序列效應(yīng),形成的雙鏈體具有該具體核酸序列的最大結(jié)合能)?!巴昝阑パa”和“完美配對”的含義也包括具有類似物或修飾核苷酸的多核苷酸和雙鏈體。對于類似物或修飾核苷酸的“完美配對”是根據(jù)針對該類似物或修飾核苷酸選擇的“完美配對規(guī)則”(例如具有具體類似物或修飾核苷酸的最大結(jié)合能的結(jié)合對)來判斷的。在使用上述具有簡并末端的NxByNz類型的探針庫情況下,完美配對包括探針的信息內(nèi)容區(qū),即By區(qū)完美配對的任何雙鏈體。N區(qū)中的區(qū)別錯配并不影響雜交實驗的結(jié)果,因為這種錯配不干擾由實驗得來的信息。在本發(fā)明尤其優(yōu)選的實施例中,提供了多核苷酸陣列,其中在特定條件下提供在固體底物上形成靶DNA片段,該特定條件允許它們與至少一組溶液中提供的可檢測標(biāo)記的寡核苷酸探針雜交。在組內(nèi)或組間,探針長度可以相同或不同。確定合適雜交條件的準(zhǔn)則可以在文獻(xiàn)中找到,例如Drmanac等,(1990),Khrapko等(1991),Broude等,(1994)(所有在上述已引用)和WO98/31836,以整體納入本文作為參考。這些文章闡明了雜交溫度范圍、緩沖液和適用于SBH最初步驟中的洗滌步驟。探針組可以分別或同時應(yīng)用于靶核酸。雜交到靶核酸上的連續(xù)位點的探針是相互共價附著或連接的。連接可以通過化學(xué)連接劑(如水溶性碳二亞胺或溴化氰)、通過連接酶如市售的T4DNA連接酶、通過層積作用或通過任何其他引起相鄰探針間形成化學(xué)鍵的方法進(jìn)行。確定合適連接條件的準(zhǔn)則可以在文獻(xiàn)中找到,例如共有美國專利申請09/458,900、09/479,608和10/738,108,以整體納入本文作為參考。4.隨機(jī)陣列SBH(rSBH)本發(fā)明方法使用隨機(jī)陣列SBH(rSBH),它將組合連接方法延伸至單分子陣列,大大增加本發(fā)明方法的靈敏度和能力。rSBH依賴通過標(biāo)記寡核苷酸信息庫對隨機(jī)排列的DNA片段進(jìn)行連續(xù)審查。在本發(fā)明方法中,待測序的復(fù)雜的DNA混合物展示在總內(nèi)熒光反射顯微(TIRM)平臺的聚焦平面內(nèi)的光學(xué)透明表面上,用超靈敏兆像素CCD相機(jī)連續(xù)監(jiān)測。DNA片段以約每平方微米1至3個分子的濃度排列,該面積與一個單獨CCD像素對應(yīng)。將TIRM用于顯現(xiàn)焦點和被研究物體與連接表面間的緊密接觸。在TIRM中,來自內(nèi)反射激發(fā)源的漸消失區(qū),在表面或表面附近選擇性激發(fā)熒光分子,產(chǎn)生非常低的背景散射光和良好的信號背景比。可使背景與其相關(guān)噪聲足夠低,以在環(huán)境條件下檢測單熒光分子(參見Abney等,Biophys.J.61:542-552(1992);Ambrose等,Cytometry36:224-231(1999);Axelrod,Traffic2:764-774(2001);Fang和Tan,“用漸消失波激發(fā)研究單分子成像和相互作用”,美國生物技術(shù)實驗室(ABL)應(yīng)用說明書,2000年4月;Kawano和Enders,“總內(nèi)反射熒光顯微術(shù)”,國生物技術(shù)實驗室(ABL)應(yīng)用說明書,1999年12月;Reichert和Truskey,J.CellSci.96(第2部分):219-230(1990),以整體納入本文作為參考)。用微流體技術(shù),標(biāo)記供體和受體熒光團(tuán)的探針庫對與DNA連接酶混合,且朝向隨機(jī)陣列。當(dāng)探針雜交到靶片段的相鄰位點,它們連接在一起,產(chǎn)生熒光共振能量轉(zhuǎn)移(FRET)信號。FRET是距離依賴(10-100埃之間)的兩種熒光分子的電子激發(fā)態(tài)間的相互作用,其中激發(fā)由供體分子轉(zhuǎn)移至受體分子而不發(fā)射光子(Didenko,Biotechniques31:1106-1121(2001);Ha,Methods25:78-86(2001);Klostermeier和Millar,Biopolymers61:159-179(2001-2002),以整體納入本文作為參考)。這些信號可以通過CCD相機(jī)檢測,表明在片段內(nèi)有配對序列。一旦檢測到來自第一個庫的信號,就去除探針并用連續(xù)循環(huán)測試不同探針組合。根據(jù)由幾百個獨立雜交/連接事件產(chǎn)生的熒光信號編制每個DNA片段的整個序列。雖然只有一個可檢測的顏色就能滿足要求,但是多個顏色會增加多種組合并提高系統(tǒng)的效率。本領(lǐng)域現(xiàn)有狀態(tài)提示可以同時使用四種顏色。除傳統(tǒng)的直接熒光策略之外,也可使用時間分辨系統(tǒng)和時間分辨FRET信號系統(tǒng)(Didenko,Biotechniques31:1106-1121(2001),整體納入本文作為參考)。也可使用新的常規(guī)化學(xué)方法,如量子點增強的三重FRET系統(tǒng)??梢杂脴錉罹垠w技術(shù)和相關(guān)的信號放大技術(shù)克服信號微弱。不像傳統(tǒng)雜交方法,本發(fā)明方法依賴雜交和連接的協(xié)同作用,其中來自兩個庫的短探針連接在一起產(chǎn)生具有更多信息容量的較長探針。例如,兩組1024個5-mer寡核苷酸可以組合以檢測超過一百萬可能的10-mer序列串。信息探針庫的使用(其中所有探針共享一個共同標(biāo)記)大大簡化了方法,允許幾百萬潛在探針配對隨僅幾百個庫組合出現(xiàn)。多個重疊探針閱讀連續(xù)堿基使得從獲得的雜交模式準(zhǔn)確測定DNA序列。通過將它們的用途延伸到單分子測序,增強了上述的組合連接和信息庫技術(shù)。5.結(jié)構(gòu)的隨機(jī)DNA制備A.DNA分離和最初片段化用建立良好的基本方案(Sambrook等,上述,1999;《新編分子生物學(xué)實驗指南》,Ausubel等編輯,JohnWileyandSons公司,紐約,1999,將兩者整體納入本文作為參考)或商業(yè)試劑盒[如:可從QIAGEN(Valencia,CA)或Promega(Madison,Wl)購得的試劑盒]裂解細(xì)胞和分離DNA。重要的要求是:1)DNA不含DNA處理酶和雜質(zhì)鹽;2)整個基因組被同樣地代表;和3)DNA片段長度在~5,000和~10,000個堿基之間。不需要對DNA進(jìn)行消化,因為裂解和提取中產(chǎn)生的剪切力將產(chǎn)生所需范圍內(nèi)的片段。在另一實施方式中,通過酶片段化可產(chǎn)生較短片段(1-5kb)。10-100拷貝的輸入基因組數(shù)量將保證整個基因組重疊和允許陣列上靶的差捕獲率。還有一個實施方式提供載體、在小量DNA情況下使用的循環(huán)合成的雙鏈DNA。B.DNA標(biāo)準(zhǔn)化在一些實施方式中,環(huán)境樣品的標(biāo)準(zhǔn)化對于減少普遍種類的DNA成分以使每陣列測序的不同種類的總數(shù)量最大是必需的。因為rSBH要求少至10個基因組等效物,所以可以進(jìn)行徹底的DNA標(biāo)準(zhǔn)化或減少方法。用通常用于在cDNA文庫產(chǎn)生期間標(biāo)準(zhǔn)化cDNA文庫的方法可完成標(biāo)準(zhǔn)化。從樣品收集的DNA一分為二,其中一份的質(zhì)量比另一份大10倍。通過末端轉(zhuǎn)移酶和ddCTP生物素化較大量的樣品,并將其作為單鏈DNA連接到鏈親和素柱或鏈親和素包被的珠。另外,生物素化的隨機(jī)引物可以用來產(chǎn)生連接到鏈親和素的序列。也可應(yīng)用整個基因組擴(kuò)增方法(MolecularStaging公司,NewHaven,CT)。然后將得標(biāo)準(zhǔn)化的樣品雜交到連接的分子,由于結(jié)合位點的數(shù)目較大,所以從溶液中優(yōu)選地去除樣品中有過多代表的那些分子??梢詫ο嗤瑯悠窇?yīng)用幾個雜交/去除循環(huán),以獲得完全標(biāo)準(zhǔn)化。另一實施方式提供了長雙鏈DNA片段的有效雜交,而無需DNA變性,該雜交用定時的lambda核酸外切酶消化產(chǎn)生單鏈DNA的短末端區(qū)。另一實施方式提供對難于用DNA標(biāo)準(zhǔn)化和rSBH的組合來分析低豐度成員的測序。一個樣品對于另一個樣品的標(biāo)準(zhǔn)化允許隨條件變化監(jiān)測共有結(jié)構(gòu)中的變化并鑒定新成員作為條件變化。C.二級DNA片段化和接頭連接本發(fā)明提供將通過剪切力產(chǎn)生的長DNA片段懸浮在溶液中,該溶液在位于載玻片的室內(nèi)。調(diào)節(jié)DNA的濃度,使每個片段占據(jù)的體積為50x50x50微米。反應(yīng)室包含限制性內(nèi)切酶、T4DNA連接酶、鏈取代聚合酶和特別設(shè)計的接頭的混合物。用限制性內(nèi)切酶部分消化DNA產(chǎn)生平均長度為250bp的片段,它們具有一致的突出端序列。T4DNA連接酶將非磷酸化的雙鏈接頭與基因組片段末端通過互補粘性末端連接,產(chǎn)生穩(wěn)定結(jié)構(gòu)的基因組插入物,兩端各有一個接頭,但在一條鏈上有一個缺口,連接酶在此處不能催化形成磷酸二酯鍵(圖1)。T4DNA連接酶在大多數(shù)限制性內(nèi)切酶緩沖液中是有活性的,但需要加入ATP和相對于基因組DNA一摩爾過量的接頭,以促進(jìn)在基因組分子的每端都連接接頭。用非磷酸化的接頭對于防止接頭-接頭連接是重要的。此外,接頭包含兩個引物結(jié)合位點,接頭通過發(fā)夾端的交聯(lián)堿基維持在一個發(fā)夾結(jié)構(gòu)中,這能防止接頭在高溫解鏈期間解離。用鏈取代聚合酶,如Vent或Bst從3’末端延伸導(dǎo)致兩端具有接頭序列的DNA鏈的產(chǎn)生。然而,一端的接頭將被維持在發(fā)夾結(jié)構(gòu)中,用于防止互補序列在DNA片段的另一端上結(jié)合。本發(fā)明提供隨機(jī)DNA陣列,以在一個測定中測序多個高度相似的樣品(即來自病人的個體DNA),該測序在隨機(jī)陣列形成之前,對每個樣品的DNA片段進(jìn)行標(biāo)記。用于將引物序列摻入到DNA片段末端的一個或兩個接頭可以具有標(biāo)記盒。不同的標(biāo)記盒可用于各個樣品。附著接頭(優(yōu)選通過連接)后,將所有樣品的DNA混合,形成單一的隨機(jī)陣列。完成片段的測序后,通過指定的標(biāo)記序列識別屬于各個樣品的片段。用該標(biāo)記法允許對來自約10-1000個樣品的少量標(biāo)記DNA區(qū),在具有高達(dá)約一千萬DNA片段的高容量隨機(jī)陣列上進(jìn)行有效測序。D.DBA附著和原位擴(kuò)增然后將接頭連接的基因組DNA通過雜交到寡核苷酸與來自原始5-100kb片段的其他片段一起定位在載玻片上,該寡核苷酸與接頭序列互補(引物B)。接頭連接和DNA延伸后,加熱溶液,變性分子,該分子與附著在載片表面的高濃度引物寡核苷酸接觸時,在重退火階段雜交到這些互補序列。在另一實施方式中,不發(fā)生原位擴(kuò)增,接頭附著到支持物,DNA片段被連接。由一個親代分子產(chǎn)生的大部分DNA結(jié)構(gòu)都定位到載片的一面,占50x50微米;因此如果限制酶消化一個親代分子產(chǎn)生1000個分子,每個片段將平均占據(jù)1-4微米2區(qū)域。1-4微米2區(qū)域可用CCD相機(jī)的單個像素觀察,且代表一百萬孔的陣列內(nèi)的一個虛擬反應(yīng)池。在50-100微米厚的防止液體紊流的毛細(xì)管室中,短時間內(nèi)不可能顯著出現(xiàn)DNA片段穿過載片表面?zhèn)认驍U(kuò)散超過50微米。此外,高粘度緩沖液或凝膠可用于使擴(kuò)散最小化。在另一實施例中,需要有限的紊流,在50x50微米表面擴(kuò)散幾百個取自單個5-100kb分子的短DNA片段。請注意,擴(kuò)散并不必須是完美的,因為SBH可以在相同像素位點分析幾個DNA片段的混合物??梢灾苽湓紭悠返膸讉€具有更一致片段長度的部分(即5-10kb、10-20kb、20-40kb、40-1000kb),達(dá)到短片段之間相等間隔。而且,可將電場施加于庫,以使短DNA片段附著于表面。具有局部混合短片段的部分結(jié)構(gòu)的陣列幾乎與完全結(jié)構(gòu)的陣列同樣有效,因為沒有來自任何單個、長片段的短片段與約10,000個其他長起始片段產(chǎn)生的短片段混合。本發(fā)明另一個實施方式提供將兩個引物序列附著到DNA片段的連接方法。該方法基于靶向由雙鏈DNA片段變性產(chǎn)生的單鏈DNA。因為單鏈DNA具有獨特的5’和3’末端,各端可連接特定的引物序列。設(shè)計了兩個特定的接頭各自包含兩個寡核苷酸(圖2),它們具有特定修飾的末端,其中F和B代表未結(jié)合的、無溶液的引物(F)和表面結(jié)合引物(B)序列,f和b代表與這些引物序列互補的序列(即引物f與引物F互補)。只有連接到DNA片段必需的3’-OH基團(tuán)在引物F上,其他寡核苷酸可以有雙脫氧3’末端(dd),以防止接頭-接頭連接。除存在于引物b的5’-磷酸基團(tuán)(P)外,引物B也可具有用于接頭連接后該引物降解的5’-P基團(tuán),以將用于雜交的引物b序列暴露到表面附著的引物/捕獲探針B。為允許接頭連接到由源DNA通過隨機(jī)片段化產(chǎn)生的任何DNA片段,寡核苷酸f和B具有幾個(約3-9個,優(yōu)選5-7個)簡并堿基(Ns)。雖然rSBH檢測設(shè)計用于單分子檢測,但一些實施方式原位擴(kuò)增了各DNA靶。本發(fā)明方法提供在一個微米大小的定位擴(kuò)增子內(nèi)的等溫指數(shù)擴(kuò)增,這里稱為“ampliot”(定義為擴(kuò)增子位點)(圖3)。通過用結(jié)合至表面的引物(引物B)和一個溶液中的游離引物(引物F)完成擴(kuò)增。引物B首先與原始靶序列雜交,然后延伸復(fù)制靶序列。將非附著鏈解鏈,并洗滌掉。加入新試劑成分,包括具有鏈取代特性的DNA聚合酶(如BstDNA聚合酶),dNTSs和引物F。然后用連續(xù)擴(kuò)增反應(yīng)合成新鏈并取代之前合成的補體。連續(xù)指數(shù)擴(kuò)增反應(yīng)產(chǎn)生了一條取代鏈,它包含與捕獲陣列寡核苷酸互補的序列,因此,反過來被捕獲并用作進(jìn)一步擴(kuò)增的模板。該鏈取代方法需要引物能夠連續(xù)引發(fā)聚合。本領(lǐng)域中有幾種描述的策略,如ICANTM技術(shù)(TakaraBioEurope,Gennevilliers,法國)和SPIA技術(shù)(NuGEN,SanCarlos,Ca;美國專利6,251,639,整體納入本文作為參考)。一旦延伸開始,允許另一引物雜交并引發(fā)聚合和鏈取代,就用RNA酶H在RNA/DNA雙鏈體中降解RNA的特性去除引物。在一個優(yōu)選實施方式中,將引物F位點設(shè)計在接頭中的A/T富集區(qū),以使雙鏈DNA能夠經(jīng)常變性并允許F引物在所選DNA聚合酶的最優(yōu)化溫度下結(jié)合。ampliot中約100至1000拷貝是通過連續(xù)指數(shù)擴(kuò)增產(chǎn)生的,而無需熱循環(huán)。本發(fā)明的另一實施方式將T7啟動子摻入接頭,并合成RNA作為中間體(圖4)。載片表面上首先用切口平移或鏈取代聚合酶產(chǎn)生雙鏈DNA。將新形成鏈用作T7聚合酶的模板,通過從引物B延伸也形成必需的雙鏈啟動子。從啟動子的轉(zhuǎn)錄產(chǎn)生可以雜交到附近的表面結(jié)合引物的RNA鏈,反過來可以用反轉(zhuǎn)錄酶反轉(zhuǎn)錄。該線性擴(kuò)增方法可以產(chǎn)生100-1000靶拷貝。然后,產(chǎn)生的cDNA可以通過用RNA酶H將RNA/DNA雙鏈體中的RNA鏈降解或通過堿和熱處理轉(zhuǎn)化成單鏈DNA。為了引物B序列在RNA分子中的分子內(nèi)雜交最小化,引物B的一半序列可來自T7啟動子序列,因此將產(chǎn)生的互補序列量減少到約10個堿基。兩種擴(kuò)增方法都是等溫的,以確保合成鏈僅在ampliot內(nèi)有限擴(kuò)散。ampliot大小約2微米,但它可以大至10微米,因為擴(kuò)增的DNA信號可以補償每CCD像素總表面背景增加25倍。而且,引物B附著位點是以約10納米間隔(10,000/微米2)分開,這提供取代DNA的立即捕獲。封閉的毛細(xì)管反應(yīng)室?guī)缀跚宄司彌_液紊流。本發(fā)明的另一實施方式提供了用鏈取代酶進(jìn)行等溫擴(kuò)增的方法,鏈取代酶基于侵入物寡核苷酸形成用于引物退火的單鏈DNA(參見圖5)??梢杂脙煞N引物在恒溫下擴(kuò)增雙鏈DNA,一個侵入物寡核苷酸或其他試劑,和鏈取代聚合酶,如Klenow片段聚合酶。侵入物寡核苷酸的濃度等于或高于相應(yīng)的引物濃度。起始時,靶DNA約比引物濃度低100至1億倍。用侵入物寡核苷酸進(jìn)行的等溫擴(kuò)增法包括下述步驟:1)通過侵入方法將侵入物核苷酸(可由LNA或PNA或提供與DNA較強結(jié)合的其它修飾物部分制備)結(jié)合到靶DNA的5’末端序列之一。侵入核苷酸可以是單鏈或雙鏈突出端(Ds)??梢酝ㄟ^接頭加到相應(yīng)靶DNA末端的(TA)x或相似序列的低雙鏈體穩(wěn)定性可以幫助入侵。2)將引物1雜交到可用的單鏈DNA位點并引發(fā)引物延伸和用聚合酶取代一條DNA鏈。侵入物核苷酸與引物1部分互補。為避免完全阻斷引物,將在所用溫度和濃度下互補部分的大小和結(jié)合效率設(shè)計為提供約9:1的結(jié)合/不結(jié)合平衡比。約10%的游離引物1是超過靶DNA的量。3)將引物2雜交到單鏈DNA的另一端,用聚合酶產(chǎn)生一個新的雙鏈DNA。4)由于起始和新的dsDNA分子連續(xù)引發(fā)步驟1-3,重復(fù)步驟1-3。E.探針和庫設(shè)計可以用一個或多個可檢測顏色;然而多個顏色會降低連接循環(huán)的數(shù)量并提高系統(tǒng)效率。本領(lǐng)域的現(xiàn)狀提示可以同時使用四個顏色。本發(fā)明的優(yōu)選實施方式使用基于FRET的系統(tǒng),時間分辨系統(tǒng)、時間分辨FRET信號系統(tǒng)(Didenko,2001,上述)。也考慮使用常規(guī)化學(xué)方法,如量子點增強的三重FRET系統(tǒng),以及樹狀聚體技術(shù)。優(yōu)選實施方式中使用了基于FRET檢測的兩組通用探針。用前面在共有美國專利申請09/479,608和10/608,298(整體納入本文作為參考)中描述的探針設(shè)計,用1024或更少的單個合成產(chǎn)生所有4096個可能的六聚物。在用于實驗之前對探針進(jìn)行篩選(matriculation)和QC(質(zhì)量控制)處理方案(CallidaGenomics公司,Sunnyvale,CA)。設(shè)計探針使效率差異最小化,各個探針與全匹配或錯配靶的實際表現(xiàn)是由QC測定確定,并通過高級堿基調(diào)用系統(tǒng)(CallidaGenomics公司)使用。6.核心技術(shù)本發(fā)明方法依賴三個核心技術(shù):1)通用探針,它允許通過雜交來自任何生物體的DNA和檢測任何可能的序列改變來完成測序。這些探針是用統(tǒng)計原理設(shè)計的,而并不參考已知的基因序列(參見共有、共待審美國專利申請10/608,293,整體納入本文作為參考);2)組合連接,其中通過DNA連接酶的“酶校對”提供兩個通用小組短探針組合產(chǎn)生成千上萬個具有優(yōu)良特異性的長探針序列(參見美國專利申請10/608,293);3)信息探針庫(IPPs),幾百個標(biāo)記相同而序列不同的探針的混合物簡化了雜交過程,而不會對序列確定產(chǎn)生負(fù)面影響(參見美國專利申請09/479,608,整體納入本文作為參考)。本發(fā)明方法使用幾百萬單分子DNA片段隨機(jī)排列在光學(xué)透明的表面上,作為雜交/連接來自IPPs的熒光標(biāo)記探針對的模板。用一個具有先進(jìn)光學(xué)的靈敏的兆像素CCD相機(jī),同時檢測整個陣列上的幾百萬單個雜交/連接事件(圖6)。將DNA片段(長度為25至1500bp)排列成密度約每CCD像素1個分子(每平方微米底物1至10個分子)的陣列。各CCD像素限定一個約0.3至1微米的虛擬反應(yīng)池,包含一個(或幾個)DNA片段和幾百個標(biāo)記的探針分子。SBH分析樣品混合物和組裝所包含各片段的能力對于隨機(jī)陣列大有好處。DNA密度可以調(diào)節(jié)到1-3個片段,在超過90%的所有像素中可以有效地分析。各反應(yīng)的體積約1-10毫微微升。一個3x3毫米的陣列具有容納1億個片段或約1千億個DNA堿基(相當(dāng)于30個人類基因組)的能力。7.組合SBH如上所述,標(biāo)準(zhǔn)SBH比競爭性基于凝膠的測序技術(shù)具有顯著優(yōu)點,包括樣品閱讀長度的改進(jìn)。然而,標(biāo)準(zhǔn)SBH方法最終受限于需要使用指數(shù)較大的探針組以測序越來越長DNA靶。組合SBH克服了標(biāo)準(zhǔn)XBH技術(shù)的很多限制。在組合SBH(Drmanac的美國專利6,401,267,整體納入本文作為參考)中,在DNA連接酶存在下將兩個完整、通用短探針組與靶DNA接觸。一般地,一組探針與固體支持物連接,如載玻片,而此外一組標(biāo)記了熒光團(tuán)的探針在溶液中游離(圖6和7)。當(dāng)附著和標(biāo)記的探針在精確相鄰的位置與靶雜交時,它們被連接,產(chǎn)生與表面共價連接的長標(biāo)記探針。洗滌去除靶和未附著的探針后,用標(biāo)準(zhǔn)陣列閱讀儀對各個陣列位置上的熒光信號進(jìn)行記分。在給定位置,陽性信號說明在靶內(nèi)存在一個與兩種探針互補的序列,它們結(jié)合產(chǎn)生信號。組合SBH比標(biāo)準(zhǔn)SBH方法具有巨大的閱讀長度、成本和材料優(yōu)勢。例如,在標(biāo)準(zhǔn)SBH中,對長度為10-100kb的靶DNA準(zhǔn)確測序(為了發(fā)現(xiàn)突變)需要超過一百萬10-mer探針的全組探針。相反,用組合SBH,通過將兩小組1024個5-mer探針結(jié)合產(chǎn)生相同的10-mer探針組。通過大大降低實驗復(fù)雜性、成本和材料要求,組合SBH在DNA閱讀長度和測序效率上取得了引人注目的改進(jìn)。8.信息探針庫通過使用信息探針庫(IPPs),組合SBH的效率進(jìn)一步增強。IPPs是統(tǒng)計選擇的探針組,它們在雜交過程中匯集以使必須測試的組合數(shù)目最小化。設(shè)計包含4至64個不同庫的一組IPPs以明確確定任何給定的靶序列。每個庫組包含一個通用探針組。庫的大小一般為16至256個探針。當(dāng)這些探針中的一個或多個產(chǎn)生陽性信號時,庫中所有探針接受陽性記分。用來自任何獨立IPP配對的記分產(chǎn)生一個對各堿基位置的組合概率分?jǐn)?shù)。準(zhǔn)確的序列數(shù)據(jù)實際上是確實的,因為各堿基位置的記分是由分別在不同庫中的十個或更多重疊探針組合產(chǎn)生的。對于一個探針的假陽性記分容易通過很多其他來自不同庫的正確分?jǐn)?shù)校正。此外,對互補DNA鏈的獨立測序使庫相關(guān)的假陽性探針的影響減至最小,因為在不同庫中,對于各互補鏈的真實陽性探針偶然趨于降低。較長探針的IPPs實際上比單獨記分的較短探針提供更多信息并提供更準(zhǔn)確的數(shù)據(jù)。例如,對于2kb的DNA片段,16,000個64個10mer的庫比16,000個單獨的7-mer提供的假陽性少100倍。IPPs組將用于從陣列的DNA靶中獲得序列信息。IPPs是仔細(xì)選擇的給定長度的寡核苷酸庫,一般各庫包含16至128個單個探針。所有這種長度的可能的寡核苷酸都在各組IPPs中至少出現(xiàn)一次。用供體熒光團(tuán)標(biāo)記一組IPPs,用受體熒光團(tuán)標(biāo)記此外一組。當(dāng)來自供體和受體組的探針間發(fā)生連接時,這些一起作用產(chǎn)生FRET信號。該連接事件僅在兩個探針同時雜交到靶上相鄰的互補位點時發(fā)生,因此鑒定了其中8-10堿基長的互補序列。每像素可分析的DNA片段長度是探針長度、庫大小和測試探針庫對的數(shù)量的函數(shù),一般范圍在20至1500bp。通過增加庫和/或探針的數(shù)量,可以測序幾千個堿基的靶DNA??梢杂眯喗M的IPPs或者甚至單個探針對完成1-10kbDNA片段的部分測序和/或特征分析。如果使用多個熒光標(biāo)記,可以在連續(xù)雜交循環(huán)中或同時測試IPP對。CCD相機(jī)相對于陣列的固定位置保證了對單個靶分子連續(xù)雜交的準(zhǔn)確追蹤。設(shè)計的IPPs是促進(jìn)強FRET信號和序列特異性連接的。一般的探針設(shè)計包括,第一組IPPs為5'-Fx-N1-4-B4-5-OH-3'和第二組為5'-P-B4-5-Nl-4-Fy-3',其中Fx和Fy是供體和受體熒光團(tuán),Bn是特異性(信息)堿基,Nn是簡并(隨機(jī)混合)堿基。簡并堿基的存在增加了有效探針長度,而沒有增加實驗復(fù)雜性。各探針組需要合成256至1024個探針,然后將它們混合建立每庫16個或更多探針的庫,每組總共8至64IPPs。單個探針可按需存在于一個或多個庫中,以使實驗靈敏度、柔性和冗余度最大化。將來自供體組的庫與陣列雜交順序地與來自受體組的庫在DNA連接酶的存在下雜交。一旦來自供體組的庫與來自受體組的庫配對,則記錄8-10個堿基信息序列的所有可能組合,由此鑒定各像素上靶分子內(nèi)的互補序列。該技術(shù)的能力在于用兩小組合成的寡核苷酸探針組合建立并記錄可能是幾百萬的較長序列串。該方法的精確的生化反應(yīng)依賴于序列特異性雜交和兩個短寡核苷酸的酶連接,使用單個DNA靶分子作為模板。雖然隨時僅探查單一靶分子,但是各靶可用到幾百個相同序列的探針分子,以進(jìn)行快速連續(xù)探查,提供統(tǒng)計顯著性測定。連接過程中的酶效率與最優(yōu)化反應(yīng)條件結(jié)合提供了相同單靶分子的快速多重探查。在相當(dāng)高的探針濃度和高反應(yīng)溫度下,單個探針迅速雜交(2秒以內(nèi)),但是解離更快(約0.5秒),除非它們是連接的。此外,在最優(yōu)化溫度下連接的探針保留雜交到靶的時間約為4秒,連續(xù)產(chǎn)生可被CCD相機(jī)檢測的FRET信號。通過以每秒1-10像幀監(jiān)測各像素60秒,在配對靶序列上平均出現(xiàn)10個連續(xù)的連接事件,在該位置,60秒中產(chǎn)生約40秒的光信號。在錯配靶的情況下,連接效率低約30倍,因此很少產(chǎn)生連接事件,在60秒反應(yīng)時間中產(chǎn)生小信號或不產(chǎn)生信號。主要的監(jiān)測挑戰(zhàn)是背景信號的最小化,這可由所需過量的標(biāo)記探針分子產(chǎn)生。除了使CCD像素聚焦于最小的可能底物面積外,我們對此問題的基本解決方式依賴于表面接近和FRET技術(shù)的協(xié)同組合(圖7)。僅在一對探針排列在相同靶分子上極接近照明面時(例如由總內(nèi)反射產(chǎn)生的100納米寬的漸消失區(qū)),一個探針上報道標(biāo)記的長時間激發(fā)才會發(fā)生。因此,背景信號并不會從溶液中過量的未雜交探針產(chǎn)生,因為或者供體離照明面太遠(yuǎn),或者受體離供體太遠(yuǎn)不能引起能量轉(zhuǎn)移。此外,可以用多種染料分子(由分支樹狀聚體連接)標(biāo)記探針分子,比普通系統(tǒng)背景增加探針信號。在測試了所有IPPs后,用SBH算法和軟件(共有、共待審的美國專利申請09/874,772;Drmanac等,科學(xué)260:1649-1652(1993);Drmanac等,Electrophoresis13:566-573(1992);Drmanac等,J.Biomol.Struct.Dyn.8:1085-1102(1991);Drmanac等,Genomics4:114-128(1989);Drmanac等的美國專利5,202,231和5,525,464,以整體納入本文作為參考)進(jìn)行單個分子的序列組裝。這些先進(jìn)的統(tǒng)計學(xué)方法定義了匹配具有最高可能性的連接數(shù)據(jù)的序列。將用CCD相機(jī)測定的亮度作為給定探針對的全匹配序列存在于該像素/靶位點的概率處理。因為來自不同庫的幾個陽性重疊探針以正確的序列獨立“閱讀”各堿基(圖8),這些探針的結(jié)合概率提供了準(zhǔn)確的堿基測定,即使幾個探針失敗。此外,不正確序列相對應(yīng)的多個獨立探針不能與靶雜交,則認(rèn)定該序列的結(jié)合概率低。即使在幾個不正確序列相對應(yīng)的探針顯示陽性的情況下也會發(fā)生,因為它們恰好存在于具有真陽性探針的IPP中,該真陽性探針匹配真實序列。9.rSBH方法本發(fā)明rSBH方法的核心涉及建立并分析含有幾百萬基因組DNA片段的高密度隨機(jī)陣列。該隨機(jī)陣列去除了在底物表面上排列探針的昂貴、耗時的步驟,也去除了對個別制備幾千個測序模板的需要。代之以,它們提供了快速和有成本效益的方式來分析單個測定中包含10Mb至10Gb的復(fù)雜DNA混合物。本發(fā)明的rSBH方法結(jié)合了下述優(yōu)點:1)在溶液中兩個IPPs的組合探針連接產(chǎn)生序列特異性的FRET信號;2)用來分析一個測定中DNA混合物的組合方法的準(zhǔn)確性、長閱讀長度和能力;3)TIRM,一種高靈敏、低背景的熒光檢測方法;4)市售的具有單光子靈敏度的兆像素CCD相機(jī)。本發(fā)明方法提供在單靶分子上檢測連接事件的能力,因為僅當(dāng)兩個連接探針雜交到附著的靶,使供體和受體熒光團(tuán)互相在6-8納米內(nèi),并且在陣列表面上產(chǎn)生500納米寬的漸消失區(qū)內(nèi)時,才會產(chǎn)生長時間信號。本發(fā)明方法一般用幾千至幾百萬單分子DNA片段,隨機(jī)排列在光學(xué)透明的表面作為雜交/連接來自IPPs的熒光標(biāo)記探針對的模板(圖6)。用供體和受體熒光團(tuán)標(biāo)記的探針庫對與DNA連接酶混合,并提供給隨機(jī)陣列。當(dāng)探針雜交到靶片段上的相鄰位點時,它們被連接在一起,產(chǎn)生FRET信號。用具有先進(jìn)光學(xué)的靈敏的兆像素CCD相機(jī)同時檢測整個陣列上的幾百萬單個雜交/連接事件。各配對序列可能產(chǎn)生幾個獨立的雜交/連接事件,因為連接探針對最終從靶中擴(kuò)散開來并被新雜交的供體和受體探針取代??拷ハ嚯s交的未連接對可瞬間產(chǎn)生FRET信號,但并不保持結(jié)合到靶足夠長時間以產(chǎn)生顯著的信號。一旦檢測到來自第一個庫的信號,就去除探針并用連續(xù)連接循環(huán)測試不同探針組合。CCD相機(jī)相對于陣列的固定位置保證了對連續(xù)測試的256個IPP對(16x16IPPs)的準(zhǔn)確追蹤,且花費2-8個小時。根據(jù)由幾百個獨立雜交/連接事件產(chǎn)生的熒光信號編制每個DNA片段的整個序列。將DNA片段(長度為15-1500bp)以密度約為每平方微米底物1個分子排列。各CCD像素限定約1x1至3x3微米的虛擬反應(yīng)池,包含一個(或幾個)DNA片段和幾百個標(biāo)記的探針分子。本發(fā)明方法有效利用SBH的能力來分析樣品混合物并組裝混合物中各片段的序列。各反應(yīng)的體積約1-10毫微微升。一個3x3毫米的陣列具有容納100-1000萬片段或約10-100億個DNA堿基的能力,上限是3個人類基因組的等效物。每像素可分析的DNA片段長度是探針長度、庫大小和測試探針庫對的數(shù)量的函數(shù),一般范圍在50至1500bp。通過增加庫和/或探針的數(shù)量,可以測序幾千堿基的靶DNA。可以用小亞組IPPs或者甚至單個探針對完成1-10kbDNA片段的部分測序和/或特征分析。本發(fā)明的rSBH方法保留了組合SBH的所有優(yōu)點,包括連接方法的高度特異性。同時,它增加了幾個重要益處,這些益處來自DNA片段而不是探針的附著。DNA附著產(chǎn)生使用容量比常規(guī)探針陣列更大的隨機(jī)DNA陣列的可能性,并通過溶液中兩個標(biāo)記探針的連接進(jìn)行FRET檢測。此外,溶液中具有兩種探針組件允許將IPP策略延伸至兩個探針組,而在常規(guī)組合SBH中是不可能的。10.方法步驟rSBH全樣品分析包括下述處理步驟,可以歸并到單微流體芯片中(圖9):1)簡單樣品處理或DNA分離(如果需要),包括一種在病原體混合物柱上收集病原體DNA的有效方法;2)隨機(jī)DNA片段化,產(chǎn)生合適長度的靶3)DNA的直接末端附著到活性底物表面,例如通過連接到通用錨;4)陣列洗滌,去除所有未結(jié)合DNA和樣品中存在的其他分子;5)以合適探針濃度從兩個IPP組中引入第一個IPP對,以及T4連接酶和一些其他(即熱穩(wěn)定性)DNA連接酶;6)照明的同時孵育少于1分鐘,以每秒1-10幀進(jìn)行信號監(jiān)測。7)洗滌去除第一個IPP對,然后引入第二個IPP對;和8)在測試了所有IPP對后,計算機(jī)程序?qū)a(chǎn)生各片段的特征或序列,然后將它們與特征或序列的綜合數(shù)據(jù)庫進(jìn)行比較,并報告樣品中存在的DNA的性質(zhì)。11.裝置大小和特征本發(fā)明方法所用的裝置是基于共有、共待審的美國專利申請10/738,108中的描述,整體納入本文作為參考。本發(fā)明的裝置包括三個主要部件:1)操作(混合、引入、去除)IPPs的操作子系統(tǒng),考慮到此模塊可以擴(kuò)展引入“芯片上”的樣品制備,2)反應(yīng)室-能裝載任何底物的溫控流通室,和3)照明/檢測子系統(tǒng)(圖10)。這些子系統(tǒng)一起工作,提供單熒光團(tuán)檢測靈敏度。本發(fā)明的裝置操作具有一個槽和口的插入式反應(yīng)室,槽用于放置陣列底物,口用于連接探針模塊,如果DNA附著和/或原位擴(kuò)增在該室內(nèi)完成,那么口也用于連接一個可能的陣列制備模塊。盒包括多達(dá)64個單獨的儲器,用于多達(dá)32個FRET供體和多達(dá)32個FRET受體庫(圖11)。盒包括一個與各庫的儲器連接的混合室,該連接通過單一的微流體通道和一個整體真空/壓力啟動的微型閥實現(xiàn)。11.1反應(yīng)室底物一旦附著到反應(yīng)室,則形成雜交室的底面。該室控制雜交溫度、提供向室中加入探針庫的口、從漸消失區(qū)去除探針庫、探針庫在整個室中再分布以及洗滌底物。將標(biāo)記的探針庫溶液引入反應(yīng)室,在給定時間與靶DNA雜交(數(shù)秒)。通過在雜交溶液中建立電壓勢,從漸消失區(qū)中拔出沒有參與雜交事件的探針。用能夠檢測單光子的高靈敏度CCD相機(jī),通過反應(yīng)室頂部的窗口監(jiān)測底物,檢測FRET雜交/連接事件(Ha,Methods25:78-86(2001),整體納入本文作為參考)。以約30秒的規(guī)則間隔拍攝底物的圖像。然后沖洗室,去除所有探針,引入下一個探針庫。此過程重復(fù)256-512次,直到測定了所有探針庫。11.2照明子系統(tǒng)照明子系統(tǒng)基于TIRM背景降低模型。TIRM在兩個光學(xué)特性不同的材料的界面建立了100-500納米厚的漸消失區(qū)(Tokunga等,Biochem.Biophys.Res.Commun.235:47-53(1997),整體納入本文作為參考)。本發(fā)明裝置使用的照明法消除了測定中光束的高斯分布的任何效應(yīng)。本發(fā)明裝置的這個子系統(tǒng)中的激光器和所有其他組件都安裝到光學(xué)臺上。通過移動安裝在電流計1和2上的鏡子建立一條1厘米的掃描線(圖10)。然后用電流計3將掃描線通過棱鏡1導(dǎo)入底物。調(diào)整電流計3,使掃描線在其臨界角交叉玻璃/水界面。光束進(jìn)行全內(nèi)反射,在底物上建立漸消失區(qū)。該漸消失區(qū)是超過玻璃/水接界面幾百納米(通常是100-500納米)的光束能量的延伸。11.3檢測子系統(tǒng)本發(fā)明裝置使用能進(jìn)行光子計數(shù)的高靈敏度CCD相機(jī)(如AndorTechnology(Hartford,CT)的DV887,512x512像素),將它懸掛在雜交室上方。該相機(jī)通過反應(yīng)室的窗口監(jiān)測底物。相機(jī)的透鏡提供足夠的放大倍數(shù),使各像素接受來自3平方微米底物的光線。在另一實施方式中,相機(jī)可以是水冷的,以供低噪音應(yīng)用。高靈敏度的電子倍增CCD(EMCCD)檢測器使高速檢測單個熒光團(tuán)成為可能。假設(shè)532納米處的1瓦特激發(fā)激光(用于Cy3/Cy5FRET),可以計算每秒由激光器發(fā)出的光子數(shù)目,也可以估計每秒到達(dá)檢測器的光子數(shù)目。用等式e=hc/λ,其中λ代表波長,一個532nm波長的光子具有能量3.73e-19焦耳。假設(shè)激光器輸出功率是1瓦特,或1焦耳/秒,預(yù)計每秒從激光器發(fā)出2.68e18個光子。將此數(shù)量的能量擴(kuò)展穿過1cm2的底物面積,預(yù)計每平方納米將接受約1e-15焦耳的能量,或約26,800個光子。假設(shè)熒光團(tuán)的量子產(chǎn)量為0.5,預(yù)計每秒約輸出13,400個光子。用高精度透鏡,用CCD應(yīng)該能夠捕獲收集到總輸出的約25%或總共3350個光子。Andor的DV887CCD在670-700納米處具有的量子效率為約0.45,Cy5在此發(fā)射。每秒產(chǎn)生約1500個光子被各像素記錄下來。在每秒10幀,每幀記錄150個數(shù)。在-75℃時,相機(jī)的無照電流約是0.001電子/像素/秒,一秒內(nèi)每1000像素平均有1個假陽性計數(shù)。即使假設(shè)每秒每像素1個假陽性計數(shù),每幀每像素0.1個,也獲得了1500:1的信噪比。結(jié)合TIRM照明技術(shù),檢測器的背景實際上為零。11.4裝置的小型化在另一實施方式中,本發(fā)明方法可以在一個微型裝置中進(jìn)行。一個簡單的、僅需要幾個現(xiàn)成組件的物理裝置就可以進(jìn)行整個過程。照明和檢測組件形成該系統(tǒng)的核心。該核心系統(tǒng)僅由一個CCD相機(jī)、一個激光器或其他光源、0至3個掃描電流計、用于底物的石英或等效支持物和一個反應(yīng)室組成。將所有這些組件置于1立方英尺的裝置中是可能的。微型流體操作機(jī)器人或微流體芯片實驗室裝置(圖9)將通過訪問IPPs對進(jìn)行該測定,該IPPs對來自兩個8至64個IPPs的庫,這種裝置可占據(jù)約0.5英尺3。高密度多孔板或具有64儲器的芯片實驗室將可以供該庫的超小型存儲使用。單板計算機(jī)或便攜式電腦可以運行該裝置并進(jìn)行分析。該系統(tǒng)易于運輸,并可裝入幾乎任何車輛中,以用于野外環(huán)境調(diào)查或者對急救隊或生物危害工作者作出反應(yīng)。該系統(tǒng)的組件包括:1)微型個人電腦(1英尺x1英尺x6英寸),2)機(jī)器人或芯片實驗室流體操作系統(tǒng)(1英尺x1英尺x2英寸),3)激光器(6英寸立方體),4)具有散熱器的掃描電流計(3英寸立方體),5)載片/雜交室組件(3英寸x1英寸x2英寸),6)CCD相機(jī)(4英寸x4英寸x7英寸)和7)流體儲器(約10-1000毫升容量)。本發(fā)明裝置的另一實施方式集成了一個基于模塊微流體的底物,在它上面進(jìn)行病原體檢測的所有測定(圖11)。該消耗型底物是以集成的“反應(yīng)盒”的形式。反應(yīng)盒的底物組分必須接受三種不同種類的一次性集成模塊,包括:探針庫模塊、樣品集成模塊和反應(yīng)底物模塊。所有機(jī)器功能都作用于此盒產(chǎn)生測定結(jié)果。該底物需要集成的流體,如提供反應(yīng)盒和相關(guān)模塊的快速連接。將微流體引入底物以便在底物的檢測表面上處理信息探針庫。使用模塊方法,其中開發(fā)的起始探針操作模塊不依賴底物,可以用“即插即用”法將最終設(shè)計加到標(biāo)準(zhǔn)底物反應(yīng)盒中。該反應(yīng)盒包含多達(dá)64個單獨的儲器,用于多達(dá)32個FRET供體庫和多達(dá)32個FRET受體庫(參見圖11)。可以將較大數(shù)量的IPPs儲存到一個或一組反應(yīng)盒上,例如2x64、或2x128、或2x256、或2x512或2x1024個IPPs。該反應(yīng)盒具有與主通道連接的混合室,該連接通過其自己的微流體通道和一個整體真空/壓力啟動的微型閥實現(xiàn)。當(dāng)閥打開時,應(yīng)用真空將庫移動入混合室。然后關(guān)閉閥,重復(fù)該過程,加入第二個庫。混合室與洗滌泵成一行,洗滌泵用于攪動庫并將它們推入反應(yīng)室。12.軟件部件和算法行數(shù)據(jù)代表每像素中每對庫(即IPPs)在不同時間/溫度點的約3-30個強度值。通過統(tǒng)計處理10-100CCD測量(優(yōu)選每秒5-10)獲得各值。各個片段有512組3-30個強度值。有一百萬片段的陣列包含約一百億強度值??梢詫装賯€像素的組進(jìn)行信號標(biāo)準(zhǔn)化。如果組不符合預(yù)計特點,那么將丟棄給定IPP對的所有數(shù)據(jù)點。將丟棄無有用數(shù)據(jù)(即沒有足夠的陽性或陰性數(shù)據(jù)點)的各個像素(其中大部分具有合適的DNA)。確定強度值在其他像素中的分布并用來調(diào)整堿基調(diào)用參數(shù)。所有單個短片段可用記錄特征作圖為一個相應(yīng)的參比序列,也可用比較測序方法分析或用從頭SBH函數(shù)進(jìn)行序列組裝。從引物序列開始,由約一百萬可能的10-mers組裝各個約為250堿基的片段。組裝過程通過評價組合10-mer記錄進(jìn)行,從幾百萬局部候選序列變體的重疊10-mers中計算。一組來自一個陣列區(qū)域的片段代表了一個長的連續(xù)基因組片段,該片段與幾組來自其他陣列區(qū)域的片段組具有顯著的重疊序列。這些組也可以通過短片段序列與參比序列的比對來識別,或作為一個包含被空像素環(huán)繞的像素的DNA島。將短片段定向到組,尤其在部分結(jié)構(gòu)的陣列中是一個引人感興趣的算法問題。一組內(nèi)的短片段來自一個片段化的單DNA分子,且不重疊。但是短序列在相應(yīng)組間會重疊,代表常、重疊DNA片段,長片段的組裝是通過與鳥槍測序方法中粘?;駼AC克隆的序列組裝相同的方法進(jìn)行的。因為rSBH方法中的長基因組片段在5-100kb范圍內(nèi)變化,代表5-50基因組等效物,在所有相關(guān)水平提供作圖信息,以指導(dǎo)準(zhǔn)確的毗連群組裝。該方法可容許將小片段分配到長片段中的遺漏和誤差以及單個組中約30-50%隨機(jī)缺少片段。本發(fā)明的rSBH方法提供了稀有生物體的檢測,或細(xì)胞數(shù)量或各微生物基因表達(dá)的定量。當(dāng)優(yōu)勢種有1x基因組覆蓋時,約10個基因組片段代表該種以0.1%水平存在。DNA標(biāo)準(zhǔn)化可以進(jìn)一步將檢測靈敏度提高到超過10,000個細(xì)胞中的一個細(xì)胞。DNA定量是通過計數(shù)代表一個基因或一個生物體的DNA片段存在的數(shù)量完成的。不含克隆步驟意味著,rSBH應(yīng)該比常規(guī)測序提供各DNA序列類型發(fā)生率的更定量的估計。為了量化研究,直接將樣品片段化到250bp片段,形成標(biāo)準(zhǔn)(非結(jié)構(gòu)的)隨機(jī)陣列是足夠的??捎貌糠謽?biāo)準(zhǔn)化使差異最小化,但仍然存在差異;可用標(biāo)準(zhǔn)化曲線計算原始頻率。一個一百萬個片段的陣列足夠定量幾百個基因種和它們的基因表達(dá)。12.1rSBH軟件本發(fā)明提供了支持rSBH全基因組(復(fù)雜DNA樣品)測序的軟件。該軟件可以按比例增加到分析整個人類基因組(~3Gb)或高達(dá)~10Gb的基因組混合物??紤]了在幾個CPU上進(jìn)行并行計算。rSBH裝置可以高達(dá)10/秒或更快的速度生成一組tiff圖像。各圖像代表靶與合并的標(biāo)記引物對的雜交。各雜交可以產(chǎn)生多幅圖像,以確定信號平均值。將靶片段化為長度約100-500個堿基的多個片段。這些片段附著在隨機(jī)分布中的玻璃底物表面。雜交和洗滌未雜交探針后,用CCD相機(jī)拍攝表面的圖像。最后,圖像的各像素可包含一個片段,雖然有些像素可以是空的,而另外一些可含有兩個或更多片段。該裝置可能成像100-1000萬,或者甚至更多片段??偟难b置運行時間是由雜交/洗滌/成像循環(huán)(~1分鐘)乘以使用的庫組的數(shù)目決定的。用1024庫組(產(chǎn)生1024圖像),該運行將持續(xù)約17小時;兩種顏色可減少該過程的一半時間。圖像分析軟件以近實時處理圖像,并將數(shù)據(jù)發(fā)送到堿基調(diào)用分析軟件。A.并行處理rSBH分析理想地適于并行處理。因為各“點”雜交到不同片段,堿基調(diào)用分析可以在各點并行進(jìn)行,而無需分析之間的通訊。在整個分析中僅有的通訊是在控制模件(GUI)和分析程序之間進(jìn)行的。為避免競爭情況,需采取非常次要的步驟。在實踐中,CPU的數(shù)目限制了并行處理的數(shù)目。對于一百萬個片段來說,一臺有100個處理器的計算機(jī)將把該工作分成100個并行的堿基調(diào)用程序,每一個連續(xù)分析10,000或更多的片段。一個200個片段組可以在一個處理器上運行,然而它也可以在幾個CPU上運行。如果沒有突變或突變試驗(升級功能),最優(yōu)化的堿基調(diào)用程序可以在~100毫秒內(nèi)完成。該時間包括數(shù)據(jù)加載和標(biāo)準(zhǔn)化。對于最長的參比序列(見下文)來說,可以加~100毫秒的參比查找時間。參比序列查找時間與其長度成正比,對短長度可以忽略。分析多突變可以將運行時間延長到約1分鐘/多突變位點。如果平均分析時間是每片段1秒,一百萬個片段用100個CPU就可以在10,000秒內(nèi)分析。類似地,200個片段用一個CPU可以在200秒內(nèi)分析,或者用10個CPU在20秒內(nèi)分析。使程序速度最優(yōu)化需要每個CPU有大量的RAM。如下所述,如果各CPU具有~2GB至8GB,取決于CPU的數(shù)目和片段的數(shù)目,該軟件就不會受存儲器限制。當(dāng)前,為每個系統(tǒng)購買32GB以上的RAM是可能的。B.數(shù)據(jù)流在一個CPU上運行GUI和圖像分析程序,而在幾個(N)CPU上運行堿基調(diào)用分析程序。在啟動時,圖像分析程序裝有數(shù)目N,監(jiān)測CCD相機(jī)寫入tiff圖像的目錄。對各tiff文件來說,它獲得各片段的記錄并將其分組到N個文件,一個對一個分析CPU。例如,如果有200個片段和10個CPU,圖像分析程序把第一個20個片段記錄寫入一個文件,用第一個堿基調(diào)用分析CPU處理,第二個20個片段記錄寫入第二個文件,用第二個堿基調(diào)用分析CPU處理,依此類推。也考慮到用其他的通訊方式,例如插座或MPI。因此,可以把文件的輸入/輸出定位于一個模塊,這樣它后來容易被換出。隨著時間推移,針對連續(xù)增長的tiff文件數(shù)量會產(chǎn)生大量的圖像分析文件。本發(fā)明為各堿基調(diào)用分析CPU提供了分離的圖像分析目錄。堿基調(diào)用分析CPU各自監(jiān)測它們各自的圖像分析目錄,一旦數(shù)據(jù)可用則進(jìn)行加載。存儲所有圖像數(shù)據(jù)必需的RAM/CPU數(shù)量是[2字節(jié)x片段數(shù)量x圖像數(shù)量÷N]。對于1百萬片段,1024幅圖像和1個CPU來說,這是~2GB/CPU;或者對于10個CPU,這是200KB/CPU。其他大量(在RAM方面)輸入到堿基調(diào)用分析程序的數(shù)據(jù)是參比序列(長度L)。為了優(yōu)化速度,把參比轉(zhuǎn)換成10-mer(和11-mer,12-mer)位置的矢量,提供快速查找各片段的最高記錄探針(見下文)。這是在每個堿基調(diào)用分析CPU中存儲參比序列位置數(shù)據(jù)的最快方法。存儲參比序列位置數(shù)據(jù)需要的存儲量是2字節(jié)xL或2字節(jié)x412中較大的。最大的RAM是2字節(jié)x10GB=20GB。也必須存儲實際參比本身,但這可以1字節(jié)/堿基儲存,甚至壓縮到0.22字節(jié)/堿基。各片段的分析產(chǎn)生調(diào)用序列結(jié)果。這些結(jié)果被串接到寫入圖像分析目錄的文件,圖像分析目錄與各CPU相關(guān)。當(dāng)堿基調(diào)用完成時,GUI處理調(diào)用的序列文件。它從不同CPU中加載所有文件并重新排列片段的位置,產(chǎn)生最終完全的調(diào)用序列。注意到,該重新排列并不重要,因為在前面的參比序列查找步驟中已經(jīng)將各片段定位。GUI也可以提供該調(diào)用序列的可視化工具。此外,GUI可以顯示最終序列的強度圖。在這種情況下,堿基調(diào)用程序也必須輸出強度文件(串接為調(diào)用序列數(shù)據(jù))?,F(xiàn)有的堿基調(diào)用程序輸出一種基于參比和點記錄(例如來自HyChipTM)的短報告文件。這對于rSBH可能不是有用的,因為各片段的點分布在很多雜交載片中。代之以,對各雜交產(chǎn)生了一種新的“短報告”,它比HyChip的短報告更加簡要。具體地,新報告可以列出各載片上的全匹配數(shù)目(N)和最高的N記錄的中位數(shù)。它也可給出任何對照點的中位數(shù),如標(biāo)準(zhǔn)參照物或空點,如果存在的話。該新報告的優(yōu)點是可在經(jīng)常升級的GUI桌面上實時觀測各個圖像。這將在早期(和運行全程)告訴用戶,rSBH系統(tǒng)是否正在產(chǎn)生有用數(shù)據(jù),而不是等待一天才看到最終結(jié)果。該新報告的高級用途是,允許用戶向rSBH裝置反饋。例如,從GUI暫停/停止運行,或者如果任何一個庫組失敗,重復(fù)運行一個庫組。GUI也可以在運行中實時顯示裝置參數(shù),如雜交和洗滌溫度。最終,產(chǎn)物可以將該裝置集成到用戶GUI的命令和控制模塊中。C.堿基調(diào)用因為合并的探針庫對于每個片段都是相同的,所以rSBH堿基調(diào)用程序可以在合并的探針中對所有片段只閱讀一次。堿基調(diào)用程序需要輸入?yún)⒈刃蛄?。對于rSBH,參比來自對最高的幾百個記錄群集的分析。最高記錄位置的簡單存儲倉(binning)算法是最有效的,因為它要求一次通過存儲倉位置找到最大存儲倉計數(shù)。最大存儲倉計數(shù)的窗口定位了參比序列中的片段位置。用250bp片段和1024個測定,1/4的片段記錄是陽性的(即全匹配雜交記錄)。然后,由于合并的探針的復(fù)雜性,1/4的10-mer代表陽性記錄。而且,對于長于410的參比序列來說,探針被重復(fù),使參比序列中所有10-mers的1/4是陽性。對于11-mers和12-mers同樣應(yīng)用,所有參比探針的1/4是陽性。對于1毫微秒中可以把一個探針放入存儲倉的處理器來說,為一個片段找到參比序列需要[L÷4÷109]秒。對于極值L=10,000,000,000,用一個CPU需要2.5秒/片段。對于一百萬個片段和100個CPU來說,找到參比序列的總時間為~25,000秒(6-8小時)。將最高L記錄放入存儲倉的替代方法是對各片段進(jìn)行從頭型的序列組裝,將上面實例中使用的探針數(shù)量減少到大大少于250。如果該從頭算法是快的(如少于1毫秒),它將加速片段查找過程。一種快速從頭算法可包括找到幾組10個或更多具有重疊探針的最高250個記錄,并可減少所需的時間一個數(shù)量級或更多。D.堿基調(diào)用算法1.讀探針庫文件2.讀參比序列(長度RL)并儲存到參比序列對象中。2a.產(chǎn)生參比序列位置數(shù)據(jù)結(jié)構(gòu)。3.讀亮度文件(實時,因為它們由圖像分析產(chǎn)生)。3a.把值存儲到存儲數(shù)據(jù)結(jié)構(gòu)中。4.累加各片段的最高L記錄(中位數(shù)長度L)5.各片段的分析環(huán)5a.為最高L記錄建立一個參比序列中的位置列表5b.建立長度為[RL÷(m×L)]的向量,將最高L記錄位置放入存儲倉中。這產(chǎn)生了m×L的存儲長度,其中m應(yīng)該是~1.5,以在片段的任何一側(cè)提供邊界。5c.將最高L記錄的位置放入存儲倉向量中。5d.找到總存儲計數(shù)最高的區(qū)域。這給出片段參比序列到(m-1)×L堿基位置內(nèi)。5e.用片段參比序列進(jìn)行堿基調(diào)用。5f.將調(diào)用序列串接成一個文件:稱為“序列”(包括位置信息)。13.附加實施方式本發(fā)明方法允許通過多種機(jī)制設(shè)計探針和IPPs。在一個實施方式中,通過改變每庫探針數(shù)量來設(shè)計探針和IPPs,更具體地,每庫為4到4096探針范圍。在第二個實施方式中,通過改變每組庫的數(shù)量來設(shè)計探針和IPPs,更具體地,每組為4到1024探針范圍。探針可含有2至8個信息堿基,提供總共4-16個堿基。在另一實施方式中,用一些位置上的簡并合成制備探針作為庫。另一實施方式包括兩組IPPs的兩個組裝物,其中不同探針混合在一個庫內(nèi)。一個20到幾百探針的小組可以提供單個核酸片段的獨特雜交特征。將雜交模式與序列配對以鑒定病原體或任何其他核酸,例如計數(shù)mRNA分子。本發(fā)明方法的一個實施方式使用特征以在不同隨機(jī)陣列上識別相同的分子。在不同陣列上雜交相同探針組后,這可以產(chǎn)生特征,由相同樣品制備的不同陣列上不同亞組的測試探針雜交,然后結(jié)合每個體分子的數(shù)據(jù)。本發(fā)明方法的另一實施方式進(jìn)行不用組合連接、僅用單個IPPs組或單個探針的單分子DNA分析。在該實施方式中,通過用供體熒光團(tuán)標(biāo)記靶和具有受體熒光團(tuán)的探針,或用受體熒光團(tuán)標(biāo)記靶和具有供體熒光團(tuán)的探針檢測FRET信號。可以個別地或作為在特定位置含有簡并堿基(混合)的庫,來合成5’-Nx-B4-16-Ny-3’形式的探針。在另一實施方式中,通過摻入一個或多個標(biāo)記的核苷酸,基于聚合酶的雜交探針的延伸與探針/探針庫雜交結(jié)合,其核苷酸一般是區(qū)別標(biāo)記的。本發(fā)明方法的另一實施方式利用探針去除,以便用相同探針序列完成一個靶分子的多個測試,可以用電場、磁場或溶液流從和向支持物表面重復(fù)去除探針分子。循環(huán)從每1-10秒至20-30秒發(fā)生。僅在探針去除開始后或僅在探針去除完成后,記錄循環(huán)中各相的熒光信號。去除與溫度循環(huán)偶聯(lián)。在該實施方式中,探針去除不需要FRET標(biāo)記,而是依賴來自一個標(biāo)記的直接熒光。此外,F(xiàn)RET反應(yīng)在標(biāo)記的探針和附著于靶分子的染料分子之間發(fā)生。本發(fā)明方法涉及重復(fù)測試探針序列的另一實施方式,采用從容器外將相同探針重復(fù)加載到反應(yīng)室中。然后,首先用不去除全匹配雜交體(如果用連接則是兩個探針的連接產(chǎn)物)但去除游離探針的洗滌緩沖液,快速去除以前的探針負(fù)荷。在后續(xù)探針負(fù)荷引入之前,用第二次洗滌解鏈所有雜交體。在另一實施方式中,僅測量一次各探針與靶分子的相互反應(yīng)。該過程依賴在陣列內(nèi)不同位置的相同DNA區(qū)段的多余代表,和/或依賴一次連接事件的準(zhǔn)確性。除在上樣于支持物上形成陣列之前制備最終片段外,在本發(fā)明方法的另一實施方式中使用了兩級切割程序。首先將樣品DNA隨機(jī)切割形成較長片段(約2-200kb或更長)。將這些片段的混合物裝到支持物上,該支持物可以由包含約10x10微米2大小單元的柵格形式的疏水材料組成。調(diào)節(jié)樣品濃度使各單元中主要存在一個或幾個長片段。這些片段將被進(jìn)一步原位隨機(jī)片段化,使最終片段長度約20-2000個堿基,并附著于支持物表面。最優(yōu)單元大小取決于每單元引入的DNA總長度和最終片段的優(yōu)選長度。本發(fā)明的這個片段化方法提供長范圍的作圖信息,因為一個單元中所有的短片段都屬于一個或幾個來自長重疊片段的長片段。這個推論簡化了長DNA序列的組裝,并可提供全染色體單倍型結(jié)構(gòu)。在本發(fā)明的另一實施方式中,用例如柱從復(fù)雜的樣品中捕獲選擇的靶DNA,該柱含有特定基因或生物體的均等數(shù)量的DNA分子。例如,選擇的病毒或細(xì)菌基因組,或部分基因組可以附著的單鏈DNA(ssDNA)的形式在這些柱上出現(xiàn)。如果通過雜交到固定的DNA捕獲了雙鏈DNA(dsDNA)和互補鏈,那么樣品DNA被解鏈。洗滌掉過量的互補DNA或任何其他不相關(guān)的DNA。然后用高溫或化學(xué)變性去除捕獲的DNA。在感染劑的診斷中,可以用該方法去除人或其他復(fù)雜的DNA。也提供了降低有過多代表的試劑濃度的方法,以檢測在較小陣列上以低拷貝數(shù)存在的其他試劑??梢栽诠?、多孔板的孔或微流體芯片中進(jìn)行捕獲過程。通過用有下游切割的限制酶切割DNA和連接匹配接頭來完成特異性基因或其他基因組片段的選擇(共有、共待審的美國專利申請10/608,293中描述,整體納入本文作為參考)。不被接頭捕獲的片段將被破壞或去除。另一實施方式使用6-60個堿基的核苷酸,或更優(yōu)選10-40個堿基,或甚至更優(yōu)選15-30個堿基,設(shè)計與具有一個或多個錯配的給定序列配對,允許使用錯配識別與切割酶一起切割DNA,可以設(shè)計兩個寡核苷酸用于切割具有約1-20個堿基移動的互補鏈,產(chǎn)生連接接頭或連接載體臂的粘性末端??梢垣@得和捕獲來自基因組片段的兩對所述寡核苷酸切割模板,或為用特異性接頭捕獲而進(jìn)行末端修飾。合成切割模板,或設(shè)計一個或多個短寡核苷酸文庫以提供任何DNA的必需切割模板的通用源。256個寡核苷酸的文庫可用下列共有序列表示:nnnbbbnn、nnbbbbnn或cggnnnbbbbnn、nnbbbnn、nnbbbnnncac,其中n代表四個堿基的混合物或通用堿基,b代表一個特定堿基,bbbb代表256個可能的4-mer序列中的一個,cgg和cac代表該文庫中所有成員共享的特定序列的實例,它們可用來建立切割模板。為了建立切割模板,可以用組裝模板連接兩個或三個選自相應(yīng)核苷酸文庫的成員,該組裝模板為nnnnnnnnnnnnnnnnnn或gccnnnnnnnnnnnnnnnnnnnnnnnnngtg。除了各種化學(xué)附著方法之外,使用附著到錨、接頭、引物、其他附著到表面的特異性結(jié)合物的片段,將通過隨機(jī)切割或特異性切割制備的DNA片段附著到表面。一個實施方式使用具有長度約1-10堿基的粘性末端的隨機(jī)附著錨,將ssDNA片段或dsDNA片段與配對的粘性末端連接。附著到DNA片段的接頭可以提供粘性末端。該方法提供了將底物面與具有不同粘性末端的錨用于鑒定附著片段的末端序列的可能性。另一實施方式將引物連接到支持物上,該引物與連接到DNA片段上的接頭互補。在ssDNA與引物雜交后,用聚合酶延伸引物。將產(chǎn)生的dsDNA解鏈,去除沒有附著到支持物的鏈,用于下述的DNA擴(kuò)增。另一實施方式中,用特異性結(jié)合物(例如環(huán)肽)覆蓋表面,該結(jié)合物能識別DNA片段的3’或5’端并與它們高親和性結(jié)合。分析一側(cè)或兩側(cè)上附著接頭的短片段,可以幫助讀遍回文結(jié)構(gòu)和發(fā)夾結(jié)構(gòu),因為當(dāng)回文結(jié)構(gòu)/發(fā)夾結(jié)構(gòu)內(nèi)有一個切口時,新接頭序列將與剩余序列不互補的序列連接。接頭允許用所有重疊探針閱讀靶DNA的每個堿基。在另一實施方式中,通過使用單分子的隨機(jī)陣列,然后原位、局部擴(kuò)增(Drmanac和Crkvenjakov,1990,上述,納入本文作為參考)增加了檢測的準(zhǔn)確度和效率,在相同像素區(qū)域內(nèi)產(chǎn)生多達(dá)10、多達(dá)100、多達(dá)1000、多達(dá)10,000個附著的復(fù)制分子。在這種情況下,無需要求單分子靈敏度,因為探針的多個記錄是不必需的,即使仍可用FRET和TIRM。擴(kuò)增過程包含下述步驟:1)用覆蓋了一種引物(約1000-50,000個引物分子/微米2)的支持物,2)用連接接頭修飾的樣品DNA片段和溶液中的第二引物。需要使混合和擴(kuò)散最小化,例如通過用毛細(xì)管室(與支持物僅有10-100微米空間的蓋玻片)或?qū)泻偷诙锴度肽z。由單個靶分子擴(kuò)增產(chǎn)生的分子群將形成一個點,或“擴(kuò)增子”,它的大小應(yīng)該小于10-100微米。雜交或連接事件的擴(kuò)增也可以用來增加信號。一個優(yōu)選實施方式使用連續(xù)等溫擴(kuò)增(即不同類型的鏈取代),因為無需用高溫變性dsDNA,高溫會引起大量擴(kuò)散或紊亂,除了連接引物,該取代鏈不結(jié)合其他互補DNA,可以產(chǎn)生局部的高濃度DNA。另一使用等溫擴(kuò)增的實施方式是設(shè)計至少一個接頭(針對靶DNA的一端)與具有低解鏈溫度的核心序列(即用具有3-13個TA重復(fù)的TATATAT…序列),引物與此核心序列基本配對。在聚合酶能夠進(jìn)行此反應(yīng)中所用的鏈取代的最佳溫度下,TATATA…位點的dsDNA會局部解鏈,允許進(jìn)行引物雜交并起始一個新的復(fù)制循環(huán)??梢哉{(diào)節(jié)核心的長度(即穩(wěn)定性),以適應(yīng)30-80℃之間的溫度。在這個連續(xù)擴(kuò)增反應(yīng)(CAR)中,進(jìn)行以前合成的酶從引物位點一移動,就開始合成新鏈,花費約數(shù)秒。用該方法只要使用一個引物,就可以從dsDNA開始產(chǎn)生高濃度的ssDNA。對于一個引物附著于表面的擴(kuò)增來說,低溫解鏈接頭應(yīng)該是針對非附著端的,相應(yīng)的引物在溶液中游離。除了聚合酶外,CAR并不需要任何其他酶。為在可能需要高溫解鏈的源dsDNA上進(jìn)行兩個或多個起始擴(kuò)增循環(huán),通過與DNA片段連接或靶特異性引物的尾延伸引入接頭。上述的核酸分析方法是單獨基于探針/探針庫雜交,或與堿基延伸或兩個探針連接到樣品DNA片段的隨機(jī)陣列結(jié)合,該方法用于各種應(yīng)用,包括:較長DNA(包括細(xì)菌人工染色體(BACs)或整個病毒、整個細(xì)菌或其他復(fù)雜基因組)或DNA混合物的測序;選擇基因的診斷性序列分析;新生嬰兒的全基因組測序;精確了解新作物和動物的遺傳基因組成的農(nóng)業(yè)生物技術(shù)研究;單個細(xì)胞表達(dá)監(jiān)測;癌癥診斷;DNA計算的測序;監(jiān)測環(huán)境;食品分析;和發(fā)現(xiàn)新的細(xì)菌和病毒生物體。本發(fā)明方法從單個標(biāo)記探針產(chǎn)生了足夠信號,而將背景降低到檢測的閾值以下。特殊的底物材料或包被物(如金屬化)和先進(jìn)光學(xué)系統(tǒng)被用來降低高系統(tǒng)背景,此高系統(tǒng)背景阻礙了從1厘米2表面并行檢測幾百萬單分子。另外,在樣品引入或在DNA附著過程中產(chǎn)生的背景可以通過樣品的特殊處理降低,包括親和柱、改良的DNA附著化學(xué)方法(如連接)或排除DNA特異性的結(jié)合分子(如環(huán)肽)。在一些情況下,降低由溶液中的未結(jié)合探針復(fù)合物或底物上的組裝物所產(chǎn)生的背景,需要循環(huán)去除未雜交/連接的探針,該去除可通過下述方法進(jìn)行:電場脈沖;特別工程改造的連接酶,酶具有最優(yōu)化的熱穩(wěn)定性和全匹配特異性;或三重FRET系統(tǒng),該系統(tǒng)具有第三種染料(如量子點)連接于靶分子。在另一實施方式中,本發(fā)明方法需要用電場提高支持物上DNA分子的濃度,以便從隨機(jī)陣列表面上的染色體或基因組中捕獲所有片段。允許正確組裝的染色體片段化可能需要間隔化的底物和原位片段化,原位片段化將起始單個的100kb到1Mb的DNA片段,獲得較短的1-10kb片段的連接的組。得到的快速雜交/連接允許用一對引物庫在少于60秒/循環(huán)中多次探查靶,可能需要使用最優(yōu)化的緩沖液和/或主動探針操縱,這可能使用電磁場。用激發(fā)性質(zhì)與DNA穩(wěn)定性兼容的熒光染料(或樹狀聚體)和照明(納秒激光脈沖)的精確控制來增加系統(tǒng)(包括排列的靶DNA分子)的化學(xué)和物理穩(wěn)定性,以允許幾個小時的照明。快速實時圖像處理和來自重疊探針的單個片段和來自重疊的DNA片段的整個基因組的組裝可能需要可編程的邏輯陣列或多處理器系統(tǒng)用于高速計算。本發(fā)明方法依賴下述過程:通過標(biāo)記探針和DNA酶產(chǎn)生可見熒光信號,來進(jìn)行互補DNA序列的特異性分子識別。通過依賴自然進(jìn)化的序列識別和酶校對過程,rSBH消除了顯著的技術(shù)挑戰(zhàn),該技術(shù)挑戰(zhàn)是在物理上區(qū)別單個DNA堿基,它們僅有0.3納米大小并且互相的差別僅幾個原子。本發(fā)明方法也有非常簡單的樣品制備和處理,包括染色體或其他DNA的隨機(jī)片段化,形成每平方微米包含約一個DNA分子小(1-10毫米2)隨機(jī)單分子陣列。本發(fā)明方法同時從幾百萬單DNA片段中高速收集數(shù)據(jù)。用10個熒光顏色和10兆像素的CCD相機(jī),單個rSBH裝置每秒可以閱讀105個堿基。本發(fā)明的閱讀長度是可調(diào)的,從每片段約20-20,000個堿基,每個隨機(jī)陣列上單個實驗總共高達(dá)1千億個堿基。通過單個長片段的起始片段化和相應(yīng)短片段組連接到分離的隨機(jī)亞陣列,rSBH方法的有效閱讀長度可以高達(dá)1Mb。對于各個測試的單DNA分子來說,每個堿基獲得100個獨立檢測(即10重疊探針序列,平均各測試10個相同DNA分子的連續(xù)連事件),這保證了最大的測序準(zhǔn)確度。用IPPs的組合SBH對PCR擴(kuò)增幾千個堿基長度的樣品提供準(zhǔn)確度超過99.9%的序列數(shù)據(jù)。該閱讀長度比目前使用的基于凝膠的方法獲得的長度長許多倍,并在單個測定中提供全基因測序。本發(fā)明方法將基于雜交的DNA分析的并行性、準(zhǔn)確性和簡單性的優(yōu)點與小型化的效率和單分子DNA分析的低材料成本相結(jié)合。應(yīng)用通用探針組,組合連接和信息探針庫允許對任何和所有DNA分子進(jìn)行有效和準(zhǔn)確的分析,并用單個小組的寡核苷酸探針庫檢測其中的任何序列變化。本發(fā)明方法用一個集成系統(tǒng)應(yīng)用公知的生物化學(xué)和信息學(xué),處理超高密度、隨機(jī)單分子陣列,以獲得比現(xiàn)有的凝膠和SBH測序方法顯著高1,000到10,000倍的測序通量。本發(fā)明方法將允許對所有存在于復(fù)雜生物樣品中的核酸分子進(jìn)行測序,包括未經(jīng)DNA擴(kuò)增或幾百萬克隆操作的細(xì)菌、病毒、人和環(huán)境DNA的混合物。使樣品處理和低化學(xué)品消耗最小化,以及完全集成的方法將每個堿基的測序成本降低至少1,000倍,或更多。本發(fā)明方法能夠在一天內(nèi),在單個陣列上對整個人類基因組進(jìn)行測序。容易制備短DNA片段的隨機(jī)陣列,該陣列比目前使用的大多數(shù)標(biāo)準(zhǔn)DNA陣列密度高100倍。探針與該陣列雜交和先進(jìn)的光學(xué)系統(tǒng)允許用兆像素CCD相機(jī)進(jìn)行超快速并行數(shù)據(jù)收集。陣列中各像素監(jiān)測不同DNA分子的雜交,以每秒1-10幀的速率提供數(shù)千萬的數(shù)據(jù)點。隨機(jī)陣列可以在3x3毫米表面上包含超過1千億個堿基對,在10-100個像素單元中代表每個DNA片段。SBH方法提供的固有冗余度(其中幾個獨立重疊探針閱讀每個堿基)幫助保證了最高的最終序列準(zhǔn)確度。為達(dá)到本發(fā)明連接方法的全部容量,即每分子閱讀高達(dá)1000個堿基,必須同時處理多個IPP試劑。本發(fā)明連接方法不需要共價修飾每個需要分析的靶分子。因為SBH探針不和靶共價結(jié)合,所以它們在循環(huán)間可以被容易地去除或光致漂白。此外,包含聚合酶保證了在任何給定的DNA分子中,一個堿基只能被測試一次。本發(fā)明的雜交/連接方法允許用每個給定探針多次探查,并通過幾個重疊探針多次探查各堿基,為每個堿基提供的測量數(shù)量增加了100倍。此外,連接酶比聚合酶允許利用較大的標(biāo)記結(jié)構(gòu)(即具有多個熒光團(tuán)或量子點的樹狀聚體),這進(jìn)一步提高檢測準(zhǔn)確度。本發(fā)明方法可以用常通用探針的較小不完全組產(chǎn)生長DNA分子的通用特征分析。每個像素可以分析長達(dá)10kb的單分子。片段長度為10,000bp,1千萬片段的陣列包含一萬億(1012)DNA堿基,相當(dāng)于300個人類基因組。用一個10兆像素CCD相機(jī)分析這個陣列。在10-100分鐘內(nèi)獲得信息特征,取決于多重標(biāo)記的水平。分析較之小10-或100-或1000-倍的陣列在特征或測序或定量應(yīng)用中是非常有用的。在一個實施方式中,在陣列中用10-10,000片段代表一個病原體細(xì)胞或病毒,因此不需要DNA擴(kuò)增。本申請的單分子特征方法提供了對病原體基因組每個區(qū)域的綜合調(diào)查,說明比在標(biāo)準(zhǔn)探針陣列上分析成千個DNA擴(kuò)增子的多重擴(kuò)增有顯著改進(jìn)。DNA擴(kuò)增是一個非線性過程,在單分子水平并不可靠。不是每個病原體擴(kuò)增幾個區(qū)段,用病原體親和柱將不需要或污染DNA的濃度降低,可以分析收集病原體的整個基因組??梢詮纳锨梭w細(xì)胞中收集單個病毒或細(xì)菌細(xì)胞,收集的細(xì)胞由10-1000像素上的1至10kb的片段代表,提供準(zhǔn)確鑒定和精確的DNA分類。在另一實施方式中,用本發(fā)明方法檢測并抵御生物戰(zhàn)劑。rSBH鑒定結(jié)標(biāo)記,這允許在致病性和癥狀發(fā)生之前,在單個生物體水平對生物劑進(jìn)行立即檢測。SBH對參與病原體的攻擊方式、毒性和抗生素敏感性的任何或所有基因提供綜合分析,以便迅速地了解參與的基因和如何回避任何和所有這些基因。rSBH可以分析包含病原體、宿主和環(huán)境DNA混合物的復(fù)雜生物樣品。此外,本發(fā)明方法采用快速、低成本綜合檢測方法可用來監(jiān)測環(huán)境和/或員工,并且可以制成便于攜帶的產(chǎn)品。14.試劑盒本發(fā)明也提供作為產(chǎn)品的IPP試劑盒,可以裝載到盒或有預(yù)加載探針的盒,試劑盒任選地包括含有緩沖液和酶的連接混合物。本發(fā)明也提供病原體/基因-特異性樣品制備試劑盒,和從樣品如血樣中分析病原體的方案,病原體如炭疽桿菌(Bacillusanthracis)和鼠疫耶爾森氏菌(YersinaPestis)。本發(fā)明提供將樣品制備DNA產(chǎn)物集合到底物中,形成本發(fā)明的rSBH陣列。描述了每像素產(chǎn)生單個靶陣列的逐步方法,和任選的每像素產(chǎn)生10-1000拷貝的原位擴(kuò)增。產(chǎn)生了靶DNA的隨機(jī)陣列,該陣列進(jìn)行rSBH的序列分析。本發(fā)明中制備底物的模塊化方法允許早期形式的底物具有簡單的樣品應(yīng)用位點,而最終開發(fā)的底物可以具有一個“即插即用”陣列制備模塊。滿足最小純度和量規(guī)格的DNA樣品,將用作用rSBH樣品排列技術(shù)進(jìn)行的真實樣品整合的起始材料。樣品整合以酶消化(限制酶或核酸酶消化)原始樣品產(chǎn)物開始,產(chǎn)生提供特異性(或隨機(jī))粘性末端的長度大約250bp的片段。這個酶混合物代表產(chǎn)品試劑盒中或許提供的幾個組分之一。消化的排列涉及粘性末端與排列在表面上補體的連接。按照下述方法從其原始玻璃表面修飾陣列表面:1)形成氨丙基硅烷單層;2)用對稱的二異硫氰酸鹽激活;3)用新的氨基化寡核苷酸混合物(包括捕獲探針、引物探針和間隔探針),用異源的單層探針修飾激活的陣列表面。所有的附著探針共享保守的設(shè)計(>90%),因此阻止了間隔和捕獲探針被隔離的同源島形成。捕獲探針與所有其他探針的比產(chǎn)生等于1互補連接位點(樣品和捕獲探針)/平方微米的平均密度,通過超靈敏CCD的單個像素觀察各平方微米。下一步,將消化的DNA樣品加入預(yù)先形成的陣列表面,用T4連接酶連接到捕獲探針,獲得由每像素一個靶組成的新rSBH反應(yīng)位點。從陣列表面去除多余樣品,通過加熱和附加洗滌,dsDNA產(chǎn)生ssDNA。這里,在捕獲探針設(shè)計中使用磷酸化策略,以保證實際上僅有一條鏈共價連接到rSBH陣列,另一條鏈被洗滌去除。在適合的公知技術(shù)(Andreadis和Chrisey,Nucl.AcidsRes.28:E5(2000);Abath等,Biotechniques33:1210(2002);Adessi等,Nucl.AcidsRes.28:E87(2000),以整體納入本文作為參考)的檢測中,局部原位擴(kuò)增靶對于產(chǎn)生滿意的檢測信號是必需的。等溫鏈取代技術(shù)可能是最合適于局部低拷貝數(shù)擴(kuò)增的。為了隔開捕獲探針,需要摻入間隔探針和引物探針。這些探針共享一些保守序列和結(jié)構(gòu),每種探針都起到其名稱描述的作用。因此,捕獲探針捕獲靶DNA,間隔探針幫助形成間隔合適的單層探針,如果需要,引物探針的存在是為了進(jìn)行原位擴(kuò)增。所有靶逐漸清除相同的陣列引物序列,簡化任務(wù)。一旦樣品與陣列連接,陣列DNA的游離末端就會獲得通用引物用于擴(kuò)增。用標(biāo)準(zhǔn)方案和材料(即引物、聚合酶、緩沖液、NTPs等)在陣列內(nèi)的分子上進(jìn)行原位擴(kuò)增。雖然10-1000個拷貝可能足夠,但是只需要約50個拷貝即可。可用不同效率擴(kuò)增各靶,而并不影響序列分析??傊瑯悠氛虾蛂SBH陣列形成需要DNA消化原始樣品制備的產(chǎn)物、分離和集合到底物,以形成rSBH陣列。本發(fā)明提供了與消化、分離和連接步驟有關(guān)的試劑和試劑盒。15.序列表序列表列出了這里描述的多核苷酸序列,并以含有2004年2月26日11:26:18AM由Windows2000操作系統(tǒng)的IBMPC創(chuàng)建的文件標(biāo)簽“CAL-2CIPPCT.txt”-8.00KB(8.192字節(jié))的光盤提交。名為“CAL-1CIPPCT.txt”的序列表以整體納入本文作為參考。這里提交序列表“CAL-2CIPPCT.txt”的計算機(jī)可讀形式(“CRF”)和3份副本(“拷貝1”、“拷貝2”和“拷貝3”)。本發(fā)明申請人申明分別依照37CRF§1.821(c)和(e)提交的序列表的CRF和拷貝1、2和3的內(nèi)容是相同的。實施例1.對一個細(xì)菌基因組進(jìn)行測序?qū)σ粋€通常無毒實驗室菌株的整個細(xì)菌基因組進(jìn)行測序。選擇了已經(jīng)很好表征且序列已知的大腸桿菌菌株。在一個一天測定中對整個基因組進(jìn)行測序。該測定說明診斷性系統(tǒng)的全部操作,以及確定與系統(tǒng)輸入和輸出設(shè)計中相關(guān)的重要規(guī)格和對于原始樣品分離和制備的一般要求。來自劃線平板的單一的菌落或幾微升液體培養(yǎng)物提供足量材料。裂解細(xì)胞和分離DNA,用本領(lǐng)域公知的方案(參見Sambrook等,《分子克隆:實驗室手冊》,冷泉港實驗室出版社,紐約州(1989)或Ausubel等,《新編分子生物學(xué)實驗指南》,JohnWiley&Sons,紐約,紐約州(1989),二者以整體納入本文作為參考)。產(chǎn)率并不重要,重要的因素是DNA的質(zhì)量。本實施例中定義的樣品規(guī)格應(yīng)用于所有其他樣品。將拷貝數(shù)為10-100的基因組用于最終分析。本測定的附加要求是:1)DNA不含DNA處理酶;2)樣品不含雜質(zhì)鹽;3)整個基因組被平均代表,且構(gòu)成大部分總DNA;4)DNA片段長度在500至50,000個堿基之間;和5)樣品以無菌DNA溶液提供,濃度已知(例如1.0微克/毫升,1微升就足夠)。10-100的輸入拷貝數(shù)保證整個基因組的重疊,并容許陣列上捕獲靶差。用10-100拷貝獲得足夠的重疊片段,以保證堿基調(diào)用和高準(zhǔn)確度的足夠成功。rSBH樣品的質(zhì)量約為1-10皮克,其中大部分用于樣品的鑒定和定量。通過連續(xù)稀釋鑒定的產(chǎn)物,獲得用于分析的樣品。DNA必須不含蛋白,尤其是核酸酶、蛋白酶和其他酶。用基于苯酚的提取,如PCl將大部分蛋白去除并失活(Sambrook等,1989,上述;Ausubel等,1989,上述)。低滲裂解或基于去垢劑的裂解(用核酸酶抑制劑混合物,如EDTA和EGTA),接著PCl提取是一種快速有效的樣品消化和一步DNA分離的方法。鎖相提取(可用于3’5’)簡化了這個任務(wù),產(chǎn)生純凈的DNA。此時不需要DNA消化,因為裂解和提取期間的剪切力產(chǎn)生了所需長度范圍的片段。通過嚴(yán)格純化DNA(即后續(xù)的氯仿提取、乙醇沉淀和大小排阻)完成苯酚去除。用苯酚留下的紫外(UV)光譜特征進(jìn)行純度檢測和DNA定量。DNA必須不含雜質(zhì)鹽和有機(jī)物,懸浮在SBH相容性Tris緩沖液中。這通過大小排阻層析或微量透析完成。原始DNA樣品范圍在500bp到50,000bp。低于500bp的片段很難在分離和純化中復(fù)性,且也影響陣列過程。大于50,000bp的片段很難溶解,并且可以不可逆地聚集。以1微克/毫升的無菌溶液提供樣品至少1微升。原始DNA的總需要量僅為~1納克至1皮克,比進(jìn)行測序量的1%還少。對于最終樣品制備來說,消化DNA產(chǎn)生預(yù)期平均長度約250bp的片段,該片段帶有可用于在組合陣列表面上排列分子的粘性末端。間隔這些分子,使每平方微米出現(xiàn)一個分子,這是通過CCD相機(jī)的單個像素觀察到的,且代表幾百萬個孔的陣列內(nèi)的一個虛擬反應(yīng)孔。這需要消除自組裝單層(SAM)效應(yīng)。使用一種酶驅(qū)動流程,該流程將樣品與間隔排列在組合陣列單層內(nèi)的特異性位點連接,所述單層化學(xué)附著到檢測底物的表面上。通過SAM化學(xué)方法驅(qū)動捕獲陣列,但是在末端互補突出端中的小變化不應(yīng)該產(chǎn)生類似序列的島。因此,用捕獲陣列制備底物,將樣品通過合適突出端的酶連接附著到底物表面。此外,需要原位擴(kuò)增各靶,產(chǎn)生“擴(kuò)增子”。用通用引物接頭完成擴(kuò)增,該接頭通過未在起始捕獲連接中附著的末端連接到靶序列上。用DNA聚合酶和NTPs合成一條新鏈,取代原始的補體,在捕獲陣列上提供具有互補元件的取代鏈,因此依此捕獲并連接。預(yù)期通過線性擴(kuò)增產(chǎn)生~10個拷貝。此外,可用指數(shù)擴(kuò)增策略每微米產(chǎn)生100-1000個拷貝。用專用探針和集成微流體將陣列樣品、單分子或者局部擴(kuò)增子進(jìn)行rSBH循環(huán)測序。將生物信息學(xué)完全整合用于數(shù)據(jù)收集、儲存、分析和序列比對。用堿基調(diào)用和準(zhǔn)確度的統(tǒng)計分析候選生物體的基因組序列報告結(jié)果。2.從炭疽桿菌和鼠疫耶爾森氏菌細(xì)胞培養(yǎng)物或血樣制備樣品2.1全基因組分析從原始樣品中分離具體的病原體需要從原始樣品中分離或富集細(xì)胞,然后裂解產(chǎn)生具體的基因組。標(biāo)準(zhǔn)生物化學(xué)和細(xì)胞生物學(xué)實驗室技術(shù),例如分部離心、過濾、培養(yǎng)或親和層析用來分離細(xì)胞,然后提取基因組。一般地,大部分病原體比人細(xì)胞至少小兩個數(shù)量級,而比大部分生物分子結(jié)構(gòu)大幾個數(shù)量級,因此合理地允許通過傳統(tǒng)物理技術(shù)進(jìn)行容易的分離。優(yōu)選用市售的抗體或其他已用于某些靶的親和工具來層流分離,并將風(fēng)險減至最小,該親和工具如病毒外被蛋白。生物體富集時,用標(biāo)準(zhǔn)方案將生物體裂解并分離DNA。此外,可以用含有可逆親和標(biāo)記的特異性引物(用于異源的原始樣品)或通用引物組(用于分離的細(xì)胞類型)完成基因組擴(kuò)增。將樣品進(jìn)行裂解,如果需要,并進(jìn)行原始DNA的分離。將引物和擴(kuò)增混合物同時加入原始樣品,通過可逆標(biāo)記和親和捕獲分離產(chǎn)物。2.2基因組足跡分析該方法包括擴(kuò)增特定組的足跡基因,該足跡基因?qū)Ω信d趣的生物體特異。通過同時檢測多個基因區(qū)域,可以區(qū)分相同病原體的不同菌株,或者可篩選大量的不同病原體。下述文獻(xiàn)(Radnedge等,App.Env.Micro.67:3759-3762(2001);Wilson等,MolecularandCellularProbes16:119-127(2002);Radnedge等,Microbiology148:1687-1698(2002);Radnedge等,Appl.Eizv.Micro.印刷中(2003),以整體納入本文作為參考)中描述了可用于檢測各種生物威脅性病原體的測定。鑒定了對感興趣的病原體特異的DNA區(qū)域,而該病原體的近親中不存在這些區(qū)域。然后設(shè)計引物,檢查環(huán)境樣品中DNA產(chǎn)物的擴(kuò)增。將炭疽桿菌和鼠疫耶爾森氏菌用作模式生物。確定量的病原體細(xì)胞與人血混合,以確定檢測的靈敏度。早期癥狀的病人血液中含有這些病原體中任何一個,濃度>104細(xì)胞/毫升血液。目的是在其到達(dá)癥狀期之前檢測病原體。檢查具有101到105細(xì)胞/毫升的血樣,以確定檢測的準(zhǔn)確度。用QiaAmp組織試劑盒250(Qiagen公司,Valencia,CA)或NucleoSpinMulti-8血液試劑盒(Macherey-Nagel公司,Düren,德國)提取基因組DNA。通過平板接種對數(shù)中期細(xì)胞并用血球計數(shù)板顯微計數(shù)來測定病原體濃度,顯微計數(shù)中將10微升稀釋細(xì)胞加入到190微升人血中,接近癥狀前濃度。然后提取基因組DNA,準(zhǔn)備用于診斷靶和基因的擴(kuò)增。3.從無生物危害性的炭疽桿菌和鼠疫耶爾森氏菌樣品中制備100個診斷靶的測定選擇靶,以鑒定可能的抗生素抗性區(qū)、毒性基因的突變和遺傳工程中可作參考的載體序列。這種靶,尤其是毒性和抗生素抗性基因,一般并不對具體病原體獨特,但提供了附加的定性信息。將用50個引物對擴(kuò)增靶DNA,以探查各病原體中相關(guān)的獨特和定性區(qū)域。將產(chǎn)物匯入一個樣品中用于SBH分析??梢杂枚鄠€引物對以簡化靶序列的擴(kuò)增。使用的引物具有一個可切割標(biāo)記,用于從原始復(fù)合DNA混合物中分離擴(kuò)增子。優(yōu)選地,該標(biāo)記是基于生物素/鏈親和素的,具有一個DTT可切割二硫鍵,或者引物內(nèi)特別地基因工程的限制性位點。通過親和標(biāo)記分離擴(kuò)增子,并作為純化的DNA樣品釋放。進(jìn)一步通過大小排阻純化產(chǎn)物,去除任何不需要的鹽和有機(jī)物,然后定量用于下游整合。4.從微生物生物薄膜測序樣品用結(jié)合現(xiàn)場研究和FISH的rSBH檢查生物薄膜群落基因組。用rSBH,在多于一個時間點和從不同棲息地對生物薄膜群落測序,以確定基因種。樣品間的DNA標(biāo)準(zhǔn)化簡化了分析,以突出在群落結(jié)構(gòu)的基因種水平中的差異,并提供對低豐度基因種基因組的顯著覆蓋。根據(jù)非常確實的流程構(gòu)建各樣品的16SrDNA克隆文庫。區(qū)別種系型的FISH探針和靶向SNP以區(qū)別種系型內(nèi)細(xì)微變體用來繪制分布模式圖,并提供SBH確定的基因種和16SrDNA種系型分布間的相關(guān)性。從物理和化學(xué)性質(zhì)不同的棲息地收集樣品,在樣品收集時間測量主要環(huán)境參數(shù),包括pH、溫度、離子強度、氧化還原態(tài)(即Fe2+/Fe3+比)和溶解的有機(jī)碳、銅、鋅、鎘、砷和其他離子的濃度。5.堿基調(diào)用模擬測試用90%重疊的250bp(平均長度)片段的大腸桿菌產(chǎn)生模擬數(shù)據(jù)。用標(biāo)準(zhǔn)單堿基改變調(diào)用分析首先的10,000個片段。這個量超過了足夠檢查準(zhǔn)確度和計時的量。參比序列查找在全部4Mbp參比基因組中成功找到10,000個片段位置。此外,在每個片段上進(jìn)行的堿基調(diào)用都是正確的。將各片段依全部4Mbp參比序列存儲,確證查找計時和準(zhǔn)確度與受測片段的數(shù)目無關(guān)。參比序列查找和堿基調(diào)用所需的時間是0.8秒/片段。堿基調(diào)用包括單個堿基改變的測試和用于優(yōu)化準(zhǔn)確度的標(biāo)準(zhǔn)化。在參比序列查找中允許片段兩側(cè)出現(xiàn)邊緣,這增加了分辨時間。6.使單個Q-點陣列和成像將2微升0、8、160和400皮摩爾的結(jié)合鏈親和素的Q-點(Qdot公司,Hayward,CA)沉積在生物素修飾的蓋玻片(Xenopore公司,Hawthorne,NJ)表面(在蓋玻片中心),2分鐘。通過真空去除液滴。施以10微升去離子水,再以相同方式去除。該洗滌重復(fù)4次。將蓋玻片顛倒處理,置于干凈的載玻片上。用1微升水將載玻片與表面粘合。將少量物鏡浸油放在蓋玻片邊緣,以通過蓋玻片周圍產(chǎn)生密封阻止蒸發(fā)。用ZeissAxiovert200顯微鏡,通過PlanFluar100x浸油物鏡(1.45na)表面照明成像。用標(biāo)準(zhǔn)色品度Cy3濾光片組從Q點成像的655nm發(fā)射。色品度Cy3發(fā)射濾光片的透射光譜與用于655nmQ點的發(fā)射濾光片重疊。用RoperScientificCoolSNAPHQTM相機(jī)(RoperScientific公司,Tuscon,AZ)記錄圖像,曝光時間是50毫秒。從這些圖像可以明顯看出,較高的Q點濃度產(chǎn)生更可見的點。由于各種污染,用水點沾的對照蓋玻片僅含幾個可見點。除了看到Q點組具有預(yù)計顏色的穩(wěn)定熒光之外,也看到個別亮度和顏色都不同的閃亮點。這些特征說明這些小點是單Q點。遙遠(yuǎn)的波長、聚焦平面外或個別顆粒之間的活性變化可以解釋亮度差異。這些結(jié)果的顯著性是,單個分子如果標(biāo)記了Q點,就可以用先進(jìn)的顯微技術(shù)檢測到。用TIRF系統(tǒng)進(jìn)一步降低背景,希望通過激光能更有效地激發(fā),以進(jìn)行單個熒光分子的常規(guī)準(zhǔn)確檢測。7.連接信號和點樣靶和寡核苷酸設(shè)計這些實驗以證明:1)點樣靶可以用作兩個探針連接的模板,具有良好的全匹配特異性;2)點樣寡核苷酸可以用作引物(或捕獲探針),以將靶DNA連接到表面。A.裝配載玻片可以用作靶或引物或捕獲探針的4個5'-NH2-修飾的寡核苷酸(序列參見表1),以7個不同濃度(1、5、10、25、50、75、90皮摩爾/微升)點在1,4-亞苯基異硫氰酸鹽衍生的載玻片上,各濃度重復(fù)6次。長的Tgt2-Tgtl-rc寡核苷酸包含整個Tgt2序列和Tgtl互補序列的一部分(下劃線部分是反平行方向中互補的)。將Tgt2-Tgtl-rc用作可以被Tgtl捕獲的測試靶,通過把2-探針連接與直接點樣并被Tgtl捕獲的Tgt2序列相比,可以測定捕獲效率。表1寡核苷酸用作靶或引物或捕獲探針B.實驗1在一個封閉室中,室溫下進(jìn)行雜交/連接1小時。反應(yīng)溶液包含50毫摩爾Tris、0.025單位/微升T4連接酶(Epicentre,Madison,WI)和0.1毫克/毫升BSA、10毫摩爾MgCl2、1毫摩爾ATP、pH7.8和不同量的連接探針庫(見表2),探針庫從0.005至0.5皮摩爾/微升。反應(yīng)后,用3xSSPE在45℃下洗滌載玻片30分鐘,然后用重蒸餾水沖洗3次,離心干燥。然后在AxonGenePix4000A上掃描這些載玻片,PMT設(shè)置在600毫伏。表2注:*說明標(biāo)記的Tamra,下劃線堿基說明單堿基錯配的位置。C.實驗2用4個NH2-修飾的26-32mers點樣載玻片,用溶解在20微升50毫摩爾Tris的1皮摩爾長靶Tgt2-Tgtl-rc(表1)和0.1毫克/毫升BSA、10毫摩爾MgCl2,pH7.8,室溫下雜交該載玻片2小時。載玻片于45℃用6xSSPE洗滌30分鐘。然后在0.5單位/20微升的T4連接酶存在下,與連接探針(Tgt2-5'探針和Tgt2-3'探針,表2)在室溫下孵育1小時。反應(yīng)后,如上所述洗滌并掃描載玻片。D.結(jié)果1.連接信號取決于反應(yīng)溶液中點樣靶的濃度和5'探針和3'探針的濃度圖12顯示連接信號對溶液中點樣靶和連接探針的依賴性。當(dāng)點樣靶濃度約為75皮摩爾/微升,20微升反應(yīng)溶液中連接探針(探針-5'和探針-3')約是1皮摩爾時,獲得最高信號。這些依賴性說明觀察的信號實際上是連接依賴的信號,點樣靶可以用作連接模板。全匹配連接探針和單堿基錯配探針之間的區(qū)別約是4-20倍(表3)。表3:連接信號的全匹配和單錯配區(qū)別靶5'-探針的FM/SMM3'-探針的FM/SMMTgt11420Tgt2712Tgt3916Tgt4442.點樣寡核苷酸可以用作引物(或捕獲探針),以有效地連接靶DNA點在載玻片上的寡核苷酸1(Tgt1)用作靶Tgt2-Tgt1-rc的捕獲探針,在其3'-側(cè),Tgt2-Tgt1-rc包含一個Tgt1的反向互補序列,在其5'-側(cè),包含一個Tgt2的反向互補序列。在雜交/捕獲Tgt2-Tgt1-rc后,連接探針(Tgt2-5'探針和Tgt2-3'探針)雜交連接到Tgt2靶的點上,也雜交到Tgt1靶的點上。圖13顯示了觀察到的連接信號。很清楚,在這個條件下,點樣靶可以用作引物(或捕獲探針),以可以用來雜交/連接短探針的形式來連接靶DNA,用于序列測定。