專利名稱:基因轉(zhuǎn)錄物比較分析的制作方法
1.發(fā)明領(lǐng)域本發(fā)明屬于分子生物學(xué)和計算機科學(xué)領(lǐng)域;更確切地說,本發(fā)明描述了分析基因轉(zhuǎn)錄物的方法和分析細胞與組織的遺傳表達的方法。
2.發(fā)明背景直到最近,分子生物學(xué)的歷史還由“一次一個基因”方式寫成。科學(xué)家們觀察了細胞的物理變化,從細胞或其環(huán)境中分離出混合物,提純了蛋白,將蛋白測序并由此制備了探針以尋找其相應(yīng)的基因。
最近,不同的國家已經(jīng)設(shè)立了大量的項目來對人類基因組的幾十億個堿基測序,這些項目的典型步驟是先將基因組分為染色體的大片段,然后確定這些片段的序列,再分析這些序列與已知蛋白或是蛋白的被稱為基元(motif)部分的一致性。不幸的是,大多數(shù)基因組DNA并不編碼蛋白,雖然其被假定為對細胞合成蛋白的能力有作用,其與醫(yī)學(xué)上應(yīng)用的關(guān)系目前并未為人們所知。
第三種方法包括只對編碼積極參與合成蛋白的細胞機制的轉(zhuǎn)錄物(即mRNA)進行測序,。其優(yōu)點在于細胞已經(jīng)編輯剪除了所有不編碼的DNA,使確認RNA中編碼蛋白的部分相對容易些。對研究基因的工作者來說,這種途徑的用途并不很一目了然。事實上,最初提出cDNA測序時,這種方法曾受到負責(zé)基因測序者的嚴(yán)厲指責(zé)。例如,美國人類基因組項目主席將cDNA測序貶為無價值的,并且拒絕為其提供資金。
在本公開內(nèi)容中,我們給出分析DNA的方法,包括分析cDNA文庫的方法?;谖覀兊姆治龊脱芯浚覀儼衙恳环N單獨基因產(chǎn)物視作信息的“象素”,其與(并只與)基因的表達相關(guān)。在此我們給出一種方法,此方法能將基因表達信息的單獨“象素”組合成單一基因轉(zhuǎn)錄物的“圖象”,在圖象中,每個單獨的基因同時可見,并且使基因象素間的關(guān)系容易看到和理解。
我們進一步給出一種新的我們稱為電子減法(electronic subtraction)的新方法。電子減法能使研究基因的科研人員將單一的圖象轉(zhuǎn)變?yōu)榛顒拥漠嬅?,畫面描述細胞或完整組織水平上基因表達的瞬態(tài)或動力學(xué)過程。正是這種對細胞或器官水平上的細胞機制“運作”的認識形成了本新發(fā)明。本發(fā)明為活細胞的生理學(xué)進程提供了新的視角,并且為揭示和發(fā)現(xiàn)醫(yī)學(xué)上新的治療和診斷途徑提供了希望。
我們給出了第二種我們稱之為“電子Northern”的方法,該方法能夠跨越多種細胞和組織追蹤某單一基因的表達。
核酸(DNA和RNA),其序列攜帶遺傳信息并由此而成為生命的基本分子。在所有活體生物,包括細菌、真菌、病毒、植物和動物中都發(fā)現(xiàn)有核酸。不同細胞、組織和生物體在一段時間內(nèi),在不同條件、不同處理和培養(yǎng)下測定其不同核酸的相對豐度是很有意義的。
人體的所有可分裂細胞,都有同一套23對染色體。據(jù)估計,這些常染色體和性染色體編碼約100,000個基因。據(jù)信不同類型細胞間的差別反映了這100,000個左右基因的不同表達。了解在不同細胞中的哪些基因被轉(zhuǎn)錄,且知道轉(zhuǎn)錄物的相對豐度,就能回答生物學(xué)的基本問題了。
以前,通過標(biāo)準(zhǔn)的分子生物學(xué)技術(shù)如PCR,Northen印跡分析或其它類型DNA探針分析如原位雜交,本領(lǐng)域只能一次分析少數(shù)已知的基因。每一種上述的方法一次可分析的僅是已知基因和/或少數(shù)基因的轉(zhuǎn)錄物。參考文獻Nucl.Acids Res.19,7097-7104(1991);Nucl.Acids Res.18,4833-42(1990);Nucl.Acids Res.18,2789-92(1989);European J.Neuroscience2,1063-1073(1990);Analytical Biochem.187,364-73(1990);Genet.AnnalsTechn.Appl.7,64-70(1990);GATA 8(4),129-33(1991);Proc.Natl.Acad.Sci.USA 85,1696-1700(1988);Nucl.Acids Res.19,1954(1991);Proc.Natl.Acad.Sci.USA 88,1943-47(1991);Nucl.Acids Res.19,6123-27(1991);Proc.Natl.Acad.Sci.USA85,5738-42(1 988);Nucl.Acids Res.16,10937(1988).
研究基因的類型及數(shù)量,已用許多方法進行了好多年。所述基因的轉(zhuǎn)錄物是在如激活、分化、衰老、病毒轉(zhuǎn)化、形態(tài)發(fā)生和有絲分裂這樣的細胞進程中誘導(dǎo)或是調(diào)節(jié)的。最早的一種方法是在一個細胞、組織、器官系統(tǒng),或甚至是生物體中在所感興趣的過程之前或之后分離蛋白并分析蛋白的水平。其中一種分析某樣品中的多種蛋白的方法是用雙向凝膠電泳,原則上其中的蛋白形成各自的帶而被確定和定量,并且最終簡化為不連續(xù)的信號。目前雙向分析僅能解析約15%的蛋白。為了更確定地分析那些被解析的帶,每條帶必須從膜上切下,并用Edmen降解來對其進行蛋白質(zhì)測序分析。不幸的是,大多數(shù)的帶在量上太小以至不能得到可靠的序列,并且其中許多帶包括不止一種蛋白。第二困難在于許多蛋白的氨基末端被封閉,使測序過程更加復(fù)雜。
由于重組DNA技術(shù)能放大包含極少材料的信號,分析基因轉(zhuǎn)錄水平上的分化克服了上述不利之處及缺陷。一種最常用的方法,我們稱之為“雜交減法”,包括在所感興趣的發(fā)育過程之前(B)和之后(A)從生物樣品中分離出mRNA,將一套mRNA轉(zhuǎn)錄為cDNA,通過雜交從樣品A中減去樣品B(cDNA減去mRNA),并且利用未雜交的mRNA部分構(gòu)建一個cDNA文庫。許多不同的課題組成功地運用這種策略,有許多流程已經(jīng)發(fā)表,并且在相同的基本方案上加以了改進。參考文獻Nucl.Acids Res.19,7097-7104(1991);Nucl.Acids Res.18,4833-42(1990);Nucl.Acids Res.18,2789-92(1989);European J.Neuroscience 2,1063-1073(1990);AnalyticalBiochem.187,364-73(1990);Genet.Annals Techn.Appl.7,64-70(1990);GATA 8(4),129-33(1991);Proc.Natl.Acad.Sci.USA 85,1696-1700(1988);Nucl.Acids Res.19,1954(1991);Proc.Natl.Acid.Sci.USA88,1943-47(1991);Nucl.Acids Res.19,6123-27(1991);Proc.Natl.Acad.Sci.USA 85,5738-42(1988);Nucl.Acids Res.16,10937(1988).
雖然這些技術(shù)中的每一種都有其特定的優(yōu)缺點,這些方法仍有其局限性與不足之處首先,構(gòu)建這樣的基因文庫所需的時間和精力是很大的。典型地,一個訓(xùn)練有素的分子生物學(xué)者,根據(jù)其水平、經(jīng)驗及運氣,構(gòu)建及表征一個這樣的基因文庫需三到六個月。其次,所得到的減法基因文庫通常不如標(biāo)準(zhǔn)方法建立的基因文庫,一個典型的傳統(tǒng)cDNA文庫至少需要106個克隆的克隆群,并且一般的插入片段大小為1-3kB。相比之下,減法基因庫的克隆群含102或103個克隆且一般的插入片段大小為0.2kB。因此,與這些基因文庫相關(guān)的克隆和序列信息可能有顯著的丟失。第三,這種途徑允許研究人員捕捉的僅是相對于樣品B來說樣品A中誘導(dǎo)的基因,反之則不行,且與第三種感興趣的樣品(C)作比較也并非易事。第四,這種途徑要求很大量(幾百微克)的“驅(qū)動者”mRNA(樣品B),由于許多組織和細胞很難大量得到,這樣就顯著地限制了能用的減法的數(shù)量及類型。
第五,減法的解析依賴于DNADNA或RNADNA雜交體的物理性質(zhì)。一個給定序列尋找雜交配對物的能力取決于其特定的CoT值。CoT值是某特定序列拷貝數(shù)(濃度)與雜交時間的積的函數(shù)。其結(jié)果是對于豐富序列來說,雜交事件很快發(fā)生(低CoT值),而稀有序列將在很高的CoT值形成雙螺旋。使稀有序列形成雙螺旋從而可被有效地選出的CoT值在便利的時間范圍內(nèi)是很難達到的。因此,雜交減法并不是一種研究稀有mRNA種類相對水平的有用技術(shù)。第六,對于某一給定序列來說,雙螺旋的形成也與核苷酸堿基組成有關(guān),這種事實使問題更加復(fù)雜化。那些富含G+C的序列比A+T含量高的序列形成更強的雙螺旋。因此,通過雜交減法前者序列將傾向于被選擇性地除去。第七。不很精確的配對在雜交過程中也是可能發(fā)生的。當(dāng)這種情況發(fā)生時,其同源基因的表達可能“掩蓋”了感興趣的基因的表達,人為地歪曲了從該特定基因得到的結(jié)果。
Matsubara和Okubo建議用部分cDNA序列來建立基因的表達描述,這可用于人的基因組功能分析。Matsubara和Okubo告誡人們不要用隨機引發(fā),因為這種方法從單獨的mRNA中產(chǎn)生多種單一的DNA片段,從而歪曲了每個基因庫中特定mRNA的數(shù)量的分析。他們從3’端引導(dǎo)cDNA基因文庫中隨機選擇克隆測序,并且建立了不同的EST的出現(xiàn)頻率。他們建議,比較不同類型的細胞中EST的清單以將基因分類。即使基因的完整序列未知或基因產(chǎn)物的生物活性未知,在許多不同類型的細胞中表達的基因也被稱為管家基因,那些在某些細胞中選擇性表達的基因稱為細胞特異性基因,。
通過對每個RNA和/或它們相應(yīng)的cDNA進行高產(chǎn)出序列特異分析,本發(fā)明提供了對于某一給定生物樣品中多種基因轉(zhuǎn)錄物相對豐度的定量方法,避免了以前技術(shù)中的缺陷。
本發(fā)明和現(xiàn)有的發(fā)現(xiàn)的蛋白的方法相比有好幾種優(yōu)點,現(xiàn)有的發(fā)現(xiàn)蛋白的方法是通過在生物學(xué)效應(yīng)的基礎(chǔ)上力圖分離單個蛋白。本發(fā)明的方法提供了細胞描述的詳細特征比較,揭示了每種轉(zhuǎn)錄物的表達上的各種變化。
本發(fā)明與現(xiàn)有的減法方法相比有許多優(yōu)點,包括一個更復(fù)雜的基因庫分析(與103個克隆相比有106~107個克隆),該分析能確定低豐度的信息和確定豐度上升和下降的信息。與以前構(gòu)建基因庫的方法相比,這種大基因庫的構(gòu)建是很常規(guī)的。另外,用本發(fā)明的方法很容易分辨出同源物。
本方法是很方便的,因為它將大量的數(shù)據(jù)組成一個能理解的易領(lǐng)會的形式。最顯著的差異被電子減法強化。做深入的分析更方便了。
本發(fā)明比以前的cDNA電子分析方法有若干優(yōu)點。當(dāng)分析大于100,優(yōu)選地大于1000個基因轉(zhuǎn)錄物時,本方法特別有效力。在這種情況下發(fā)現(xiàn)了新的低頻轉(zhuǎn)錄物且測定了組織類型。
基因表達的高解析度分析能被直接用來作為特征描述或用來確定疾病特異性的基因,作為對比較經(jīng)典的診斷途徑的發(fā)展。
這種過程被稱為基因轉(zhuǎn)錄物頻率分析。基因轉(zhuǎn)錄物的定量分析結(jié)果被稱為基因轉(zhuǎn)錄物的比較分析。
3.發(fā)明概述本發(fā)明是一種分析含基因轉(zhuǎn)錄物樣品的方法,包括下列步驟(a)構(gòu)建一個生物序列的文庫;(b)產(chǎn)生一套轉(zhuǎn)錄物序列,該套序列中每一個轉(zhuǎn)錄物序列表示了文庫中的一個不同的生物序列;(c)在一個已編程的計算機(其中貯存了表示參考序列的參考轉(zhuǎn)錄物序列數(shù)據(jù)庫)中處理轉(zhuǎn)錄物序列,用以對每一個轉(zhuǎn)錄物序列產(chǎn)生一個確定的序列值,上述的每個確定序列值表示序列的標(biāo)注,且表示文庫中某一生物序列與至少一個參考序列間的配對程度,和(d)處理每一個上述的確定序列值以產(chǎn)生最終的數(shù)據(jù)值,該數(shù)據(jù)值表示了每一確定的序列值在文庫中的出現(xiàn)次數(shù)。
本發(fā)明還包括比較兩種含基因轉(zhuǎn)錄物樣品的方法。第一種樣品用上述方法處理。第二種樣品用來產(chǎn)生第二種生物序列文庫,以產(chǎn)生第二套轉(zhuǎn)錄物序列,在第二套序列中每一個轉(zhuǎn)錄物序列表示了第二個文庫中某一生物序列。然后,第二套轉(zhuǎn)錄物序列在一個已編程的計算機中處理以產(chǎn)生第二套確定的序列值,稱為“進一步確定的序列值”,每一個值表示一個序列的標(biāo)注,和第二個文庫中某一生物序列與至少一種參考序列間的匹配程度。處理進一步確定的序列值以產(chǎn)生進一步的最終數(shù)據(jù)值,該值表示每一個進一步確定的序列值在第二個文庫中出現(xiàn)的次數(shù)。處理第一種樣品中的最終數(shù)據(jù)值和第二種樣品中的進一步確定的序列值以產(chǎn)生轉(zhuǎn)錄物序列的比率,此比率表示了兩種樣品間的基因轉(zhuǎn)錄物數(shù)量上的差別。
在進一步的實施方案中,所用方法包含了對某一生物樣品中mRNA相對豐度進行量化,方法如下(a)從生物樣品中分離出總mRNA轉(zhuǎn)錄物;(b)通過序列特異性方法確定轉(zhuǎn)錄該mRNA的基因;(c)確定每個基因?qū)?yīng)的mRNA轉(zhuǎn)錄物的數(shù)量;和(d)用mRNA轉(zhuǎn)錄物的數(shù)量來決定該mRNA轉(zhuǎn)錄物在總mRNA轉(zhuǎn)錄物中的相對豐度。
在此還公開了一種進行基因轉(zhuǎn)錄物圖象分析的方法,該方法先獲得mRNA的混合物,從中得到cDNA拷貝,將cDNA插入到一個合適載體中,將載體轉(zhuǎn)染到一個合適的宿主菌株細胞中,然后涂平板,使其長成菌落,每一個克隆代表一個特定的mRNA。分離出一批有代表性的轉(zhuǎn)染了cDNA的克隆。該克隆群中每個克隆用能確定特定mRNA的轉(zhuǎn)錄模板基因的序列特異性方法確定。每個基因被確定到單個克隆的次數(shù)被用來評估基因轉(zhuǎn)錄物的豐度。按豐度的順序列出基因及其豐度以產(chǎn)生基因轉(zhuǎn)錄物的“圖象”。
在更進一步的實施方案中,將一種類型細胞或組織中的基因轉(zhuǎn)錄物的相對豐度與第二種類型細胞或組織中的基因轉(zhuǎn)錄物的相對豐度相比,以便確定異同處。
在更進一步的實施方案中,所用方法包括一個用來分析生物序列文庫的系統(tǒng),該系統(tǒng)包括用來得到一套轉(zhuǎn)錄物序列的方法,其中每一種轉(zhuǎn)錄物序列代表文庫中某一不同的生物序列;以及一種用來在一個計算機系統(tǒng)中處理轉(zhuǎn)錄物序列的方法,該計算機中已貯存一個表示參考序列的參考轉(zhuǎn)錄物序列數(shù)據(jù)庫。該計算機用軟件編程以對每一轉(zhuǎn)錄物序列產(chǎn)生一個確定的序列值,其中每一種所述的確定的序列值代表序列的一個標(biāo)注和文庫中的不同的生物序列與至少一種參考序列的匹配程度,處理每一上述的確定的序列值以產(chǎn)生最終數(shù)據(jù)值,該值代表每一確定的序列值在文庫中的出現(xiàn)次數(shù)。
實際上,本發(fā)明是用來對在一生物樣品中的基因轉(zhuǎn)錄物的相對豐度定量的方法和系統(tǒng)。本發(fā)明提供一種在兩個或多個不同生物樣品中比較基因轉(zhuǎn)錄物圖象的方法,以便將兩樣品加以區(qū)別,并確定一個或多個在兩個樣品中不同地表達的基因。因此該基因轉(zhuǎn)錄物圖象及其比較可用于診斷。該方法的一種實施方案對復(fù)合RNA或其相應(yīng)的cDNA進行了高產(chǎn)出的序列特異性分析基因轉(zhuǎn)錄物圖象。該方法的第二種實施方案通過用高產(chǎn)出cDNA序列分析得到基因轉(zhuǎn)錄物的圖象分析。另外,兩個或多個基因轉(zhuǎn)錄物圖象可以進行比較并用來檢測或診斷某一特定生物狀態(tài)、疾病、或與在給定細胞或細胞群中基因轉(zhuǎn)錄物相對豐度有關(guān)的條件。
4.表和附圖的描述4.1表表1給出了表2-表5中使用的符號的詳細解釋。
表2列出了一百個最普通的基因轉(zhuǎn)錄物。它是HUVEC cDNA文庫的分離物的部分清單,該cDNA文庫的構(gòu)建和測序見后面的描述。左手欄中涉及的是表中序列的豐度順序。標(biāo)有“數(shù)字”的下一欄是克隆號,該克隆號是第一個HUVEC序列與在“條目”欄號中序列相匹配的確定參考的克隆號。沒有測序的分離物未列在表2中,標(biāo)有“N”的再下一欄表示與在“條目”欄中的參考轉(zhuǎn)錄物的序列相配對程度一樣的cDNA的總數(shù)。
標(biāo)有“條目”的一欄給出了NIH GENBANK位名,該位名與文庫中的序列號相對應(yīng)?!皊”欄表示了在一些情況下參考序列的種類,“s”欄中的符號在表1中列出。標(biāo)有“描述符”的一欄給出了與“條目”欄中的NIH GENBANK位名相關(guān)的序列的平白的英文解釋。
表3是在正常的單核細胞和活化了的巨噬細胞中最豐富的15種基因轉(zhuǎn)錄物的比較。
表4是將THP-1和人類的巨噬細胞cDNA序列進行概括性比較的文庫減法分析的詳細總結(jié)。在表4中用了與表2中一樣的符號。附加欄用來列“bgfreq”(在減法文庫中的豐度數(shù)),“rfend”(在靶文庫中的豐度數(shù))和“比率”(靶豐度數(shù)除以減法豐度數(shù))。細讀表以后清楚,當(dāng)在減法文庫中的豐度數(shù)為“0”時,該靶豐度數(shù)除以0.05,這是一個獲得結(jié)果的辦法(不可能除以0)且將結(jié)果與減法數(shù)為1的比率相區(qū)別。
表5是計算機程序,是用源程序?qū)懗龅?,用來產(chǎn)生基轉(zhuǎn)錄物減法形象。
表6是在本發(fā)明提供的電子Northern印跡分析中所用的數(shù)據(jù)庫entries的部分清單。
4.2附圖的簡述
圖1是根據(jù)構(gòu)建基因庫中序列的制備和分析部分所收集和貯存的數(shù)據(jù)的總結(jié)圖。
圖2是一個代表著在發(fā)明方法的一類優(yōu)選實施方案中用“豐度排序”軟件執(zhí)行的操作順序的圖。
圖3是本發(fā)明系統(tǒng)的優(yōu)選實施方案的方框圖。
圖4是一個更詳細的生物信息流程的方框圖,該生物信息流程從新序列(已被測序但未被確認的)到轉(zhuǎn)錄物圖象分析的印出。和數(shù)據(jù)庫訂閱的條例。
5.本發(fā)明的詳細描述本發(fā)明提供一種在不同生物樣品中比較基因轉(zhuǎn)錄物相對豐度的方法。該方法通過對每一個RNA及其相應(yīng)cDNA(或換而言之,對于代表其它生物序列的數(shù)據(jù))用高效產(chǎn)生的序列特異性分析。這個過程在此處表示為基因轉(zhuǎn)錄物圖象。對一套基因轉(zhuǎn)錄物相對豐度的定量分析在此處表示為“基因轉(zhuǎn)錄物圖象分析”或“基因轉(zhuǎn)錄物頻率分析”。本發(fā)明能得到任意類型器官中任一給定細胞群或組織中的總的基因轉(zhuǎn)錄物圖譜。本發(fā)明可得到一個樣品的圖譜,該樣品可以是含單細胞(或單細胞克隆),或許多細胞或比單細胞更復(fù)雜的且含多種細胞類型的組織,如肝。
本發(fā)明在診斷、毒理學(xué)和藥理學(xué)等領(lǐng)域有顯著的優(yōu)點。能在還未作診斷的病人中作很復(fù)雜的診斷測試。取到含病人體液或組織的生物樣品,然后分離基因轉(zhuǎn)錄物,并擴大到能確定它們的程度。也可選擇將基因轉(zhuǎn)錄物轉(zhuǎn)變?yōu)閏DNA。將基因轉(zhuǎn)錄物樣品進行序列特異性分析和定量。將這些基因轉(zhuǎn)錄物序列豐度和包括病人及健康人的標(biāo)準(zhǔn)數(shù)據(jù)集的參考數(shù)據(jù)庫序列豐度進行比較。病人的疾病和病人的數(shù)據(jù)集密切相關(guān)。
例如,正如在表3中基因轉(zhuǎn)錄物頻率分析體現(xiàn)正常單核細胞和活化的巨噬細胞間差別一樣,基因轉(zhuǎn)錄物頻率分析也能用來對正常細胞或組織與有病的細胞或組織加以區(qū)別。
在毒理學(xué)中,一個基本問題是哪些測試對預(yù)測或檢測毒效最有效?;蜣D(zhuǎn)錄物圖象提供了細胞和組織環(huán)境的詳細信息,而有些信息是不能用傳統(tǒng)上的,不詳細的篩選方法得到的?;蜣D(zhuǎn)錄物圖象對預(yù)測藥物毒性和藥效是一種更有效的方法。在藥理學(xué)領(lǐng)域運用這種工具會得到相似的益處?;蜣D(zhuǎn)錄物圖象能選擇性地用于查明預(yù)期受比如能解除毒物毒性的酶影響的蛋白類別。
在第二實施方案中,比較性基因轉(zhuǎn)錄物頻率分析可用于區(qū)分對抗癌藥物有反應(yīng)和無反應(yīng)的癌細胞??拱┧幬锢佑腥桨卑?、長春新堿、長春花堿、鬼臼毒素、依托泊甙、替尼泊甙、順鉑,生物反應(yīng)的調(diào)節(jié)物,如干擾素、IL-2、GM-CSF、酶、激素等。本方法也提供一種通過功能類別來對基因轉(zhuǎn)錄物進行分類的手段。在癌細胞例子中,轉(zhuǎn)錄因子或其它重要的調(diào)節(jié)分子對于在不同的文庫中進行分析是相當(dāng)重要的類別。
在第二實施方案中,比較性基因轉(zhuǎn)錄物頻率分析用來區(qū)分對照的肝細胞與從實驗藥物如FIAU治療的病人身上分離出的肝細胞,以區(qū)分疾病引起的和藥物引起的病理現(xiàn)象。
在第二實施方案中,比較性基因轉(zhuǎn)錄物頻率分析用來區(qū)分用鋰治療和未用鋰治療的病人的腦組織。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄物頻率分析用來區(qū)分用環(huán)孢菌素和FK-506處理的細胞和正常細胞。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄物頻率分析可用來對病毒性感染(包括HIV感染)的人類細胞和未感染的人類細胞加以區(qū)分?;蜣D(zhuǎn)錄物頻率分析還可用來檢測在抗HIV、感染HIV和HIV敏感的細胞中的基因轉(zhuǎn)錄物?;蜣D(zhuǎn)錄物豐度的比較將顯示治療的成功和/或研究新的途徑的成功。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄物頻率分析用來對有多種疾病的不健康的病人和健康人中支氣管洗出液加以區(qū)別。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄物分析用來對細胞、植物、微生物及動物的突變體和野生型之間加以區(qū)別。另外轉(zhuǎn)錄物豐度程序也適用于科研工作者評估在許多不同組織中某一基因的轉(zhuǎn)錄。這種比較能確定不產(chǎn)生某一基因產(chǎn)物的缺失突變體和產(chǎn)生豐度減少或其它不同信息的點突變體。這種突變會影響基礎(chǔ)性的生化或藥理學(xué)過程,如礦質(zhì)營養(yǎng)和代謝,并且能被本領(lǐng)域的技術(shù)人員所知的手段分離出來。因此,具有產(chǎn)量提高,對害蟲有抵抗力和其它特性的莊稼能被開發(fā)出來。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄物頻率分析能用作種間比較性分析,這就允許人們可選擇更好的藥理學(xué)的動物模型。在本實施方案中,人或其它動物(如鼠),或其被培養(yǎng)的細胞用一種特定的測試試劑處理。每一cDNA群體的相對序列豐度被確定下來。如果動物測試系統(tǒng)是一種好的模型,動物cDNA群中的同源基因應(yīng)與人類細胞中的同源基因類似地改變表達。如果用藥物測出副效應(yīng),詳細的轉(zhuǎn)錄物豐度分析將被用來檢測基因轉(zhuǎn)錄物的改變。通過比較基本的生理學(xué)變化,將能對模型進行評估。
在更進一步的實施方案中,比較性基因轉(zhuǎn)錄頻率分析被用作在臨床研究中對病人的細胞或組織(如血樣)給出一個高度詳細的基因轉(zhuǎn)錄物圖譜。特別是,基因轉(zhuǎn)錄物頻率分析可被用于對某一疾病狀況或條件給出一高解析基因表達圖譜。
在優(yōu)選的實施方案中,本方法使用高產(chǎn)出cDNA測序以確定感興趣的特定轉(zhuǎn)錄物。然后,所生成的cDNA和推斷出的氨基酸序列將廣泛地與GENBANK和其它下面所述序列數(shù)據(jù)庫比較。與現(xiàn)有的通過試圖確定在一特定生物效應(yīng)中所包含的單一蛋白的雙向凝膠發(fā)現(xiàn)蛋白的方法相比,本方法有好幾種優(yōu)點。此處,對活化的和非活化的細胞的詳細比較的圖譜揭示單一轉(zhuǎn)錄物在表達中的大量變化。當(dāng)確定該序列是否是“嚴(yán)格”匹配、近似匹配或非匹配的之后,該序列被送入數(shù)據(jù)庫。然后,將與每一種基因相對應(yīng)的cDNA的拷貝數(shù)制表。雖然所有的條目的內(nèi)容可以被慢而費力地由人工處理,但計算機程序?qū)⑦@些信息制表是快速有效的。cDNA拷貝數(shù)(任選地除以在該數(shù)據(jù)集中的總序列數(shù))提供了與每個基因相應(yīng)的轉(zhuǎn)錄物的相對豐度的圖。列出的代表基因能根據(jù)在總cDNA中的豐度排序。大量的比較或量度的附加類型是可能的且在下面有例示。
一個可選的產(chǎn)生基因轉(zhuǎn)錄物圖象的方法包括以下步驟先得到測試mRNA的混合物,提供有代表性的一批單一探針,這些探針的序列至少與測試mRNA中的一部分互補。然后,將固定量的測試mRNA和成列的探針加到一起。測試mRNA和探針一起溫育足夠的時間以形成測試mRNA與探針的雜交物。mRNA和探針的雜交物被檢測并被定量。由雜交物在探針序列的位置來確定雜交物。每種雜交物的數(shù)量合計起來給出一個總量。每種雜交物的數(shù)量除以總量就可得到一組相對豐度數(shù),這稱為基因轉(zhuǎn)錄物圖象分析。
6.實施例下面的實施例用來說明主題發(fā)明。這些實施例以實例的方式來提供,并且不包含限制本發(fā)明的目的。
6.1組織來源和細胞系為了用本發(fā)明要求的計算機程序進行分析,生物序列實際上可從任何來源得到。最常用的是從人體中得到的組織。組織可從身體任一器官、任一年齡的供體、任何不正?;虿凰兰毎档玫?。在一些情況下更愿意選擇不死細胞系,因為其細胞類型具有單純性;其它組織樣品必定包括了混合的細胞類型。有一種特殊的技術(shù)可得到單一細胞(例如,腦細胞),并利用該細胞的自身機制來產(chǎn)生足量的用來測序的cDNA,其所用的技術(shù)和分析手段在此有描述(美國專利號5,021,335和5,168,038,該文獻在此引入作為參考)。本文所舉的實施例用如下細胞系類單核U-937細胞、活化的類巨噬THP-1細胞,誘導(dǎo)的血管內(nèi)皮細胞(HUVEC細胞)和類肥大細胞HMC-1細胞。
U-937細胞系是人類組織淋巴瘤細胞系,其具有單核白細胞的特征,是從一個患擴散的組織淋巴瘤病人的胸膜滲出物中得到的惡性細胞建立起來的。(Sundstrom,C.and Nilsson,K.(1976)Int.J.Cancer 17565)。U-937是少數(shù)幾種具有組織細胞形態(tài)學(xué)、細胞化學(xué)、表面受體和類單核細胞特征的人類細胞系之一。這些細胞能誘導(dǎo)出最終為單核細胞的分化,并且當(dāng)用人類混合淋巴細胞培養(yǎng)物的上清激活時,這些細胞表達新的細胞表面分子。在這種體外激活類型中,細胞經(jīng)歷形態(tài)學(xué)上和功能上的變化,包括針對紅細胞和腫瘤靶細胞的抗體依賴性細胞毒性(ADCC)的增加(巨噬細胞的一種主要功能)。用佛波醇12-肉豆蔻酸酯13-乙酸酯(PMA)在體外活化U-937細胞,刺激了幾種化合物的產(chǎn)生,包括前列腺素、白細胞三烯和血小板激活因子(PAF),這些是有力的炎癥介體。因此U-937是很適于確定和分離與正常單核細胞相關(guān)的基因轉(zhuǎn)錄物的細胞系。
HUVEC細胞系是從人臍靜脈早期通道內(nèi)皮細胞培養(yǎng)物(CellSystems Corp.,12815 NE 124th Street,Kirkland,WA 98034)中得到的正常的、均一的、性質(zhì)明確的細胞系。僅對誘導(dǎo)或處理后的HUVEC細胞的基因轉(zhuǎn)錄物進行了測序。一份含有1×108細胞的培養(yǎng)物在收獲前用1U/ml的rIL-1b和100ng/ml的E.coli脂多糖(LPS)內(nèi)毒素處理5個小時。第二份2×108細胞培養(yǎng)物在收獲前用4U/ml TNF及2U/ml γ-干擾素(IFN-gamma)平行處理。
THP-1是具有明顯單核細胞特性的人類白細胞系。這一細胞系由一名患有嚴(yán)重單核細胞白血病的一周歲男性兒童的血液中分離得到(Tsuchiya,S.et al.(1980)Int.J.Cancer171-76)。下列幾點是說明這一細胞系的單核細胞本質(zhì)的細胞學(xué)和細胞化學(xué)判據(jù)(1)存在能夠被氟化鈉抑制的α-萘酚丁酸酯酶的活性;(2)能夠產(chǎn)生溶菌酶;(3)具有吞噬溶膠(latex)顆粒和致敏SRBC(綿羊紅血細胞)的能力;(4)用伴刀豆球蛋白A(Con A)處理后再用絲裂霉素C處理的THP-1細胞可以激活T淋巴細胞。在形態(tài)學(xué)上,其細胞質(zhì)中含有嗜天青顆粒,細胞核凹進并有不規(guī)則深陷的褶皺。細胞系具有Fc和C3b受體,可能在吞噬過程中起作用。用腫瘤促進因子12-o-十四酰-佛波醇-13乙酸酯(TPA)處理的THP-1細胞停止分裂并分化為與來自正常單核細胞的巨噬細胞十分相似的類巨噬細胞細胞。當(dāng)細胞發(fā)生形態(tài)轉(zhuǎn)變時,細胞核變得更加無規(guī)則,細胞質(zhì)中出現(xiàn)更多的吞噬泡。分化了的THP-1細胞同時也表現(xiàn)出增強的對組織培養(yǎng)塑料的粘附性。
HMC-1細胞(人類肥大細胞系)是從一位患肥大細胞白血病的MayoClinic患者的外周血培養(yǎng)建立起來的(Leukemia Res.(1988)12345-55)。HMC-1細胞培養(yǎng)物與未成熟的鼠肥大細胞克隆相似,含有組胺,對于氯乙酸酯酶、氨基己酸酯酶、嗜曙紅主要堿性蛋白(MBP)及類胰蛋白酶染色法均呈現(xiàn)陽性結(jié)果。但是,HMC-1細胞喪失了合成正常IgE受體的能力。在用白細胞泳動法直接從患者血液中分離出的HMC-1細胞具有10∶16轉(zhuǎn)位功能,因而排除了其在培養(yǎng)過程中獲得此功能的可能。由此可見,HMC-1細胞系是肥大細胞的一個很好的模式細胞。
6.2 cDNA文庫的構(gòu)建為了進行文庫間的比較,所有文庫必須在相似條件下制備。在構(gòu)建過程中,有幾個因素至關(guān)重要。這些因素中的一個是分離mRNA的方法。重要的是必須使用相同的條件以從對比文庫中除去DNA和非均一性核RNA。cDNA的大小分級必須嚴(yán)格控制。在制備對比文庫時應(yīng)當(dāng)優(yōu)選地使用同一克隆載體,至少也要使用同一類型的載體(例如單向插入載體)以保證結(jié)果的可比性。優(yōu)選使用單向插入載體以使結(jié)果分析更為簡便。
在制備cDNA時,優(yōu)選地使用寡聚dT單向引物從而使得從每個mRNA轉(zhuǎn)錄物只獲得一個克隆。當(dāng)然,用寡聚dT和隨機引物的混合物也有其優(yōu)點,在也以搜尋基因為目的時,這一混合物可以導(dǎo)致更大的序列多樣性。應(yīng)用DR2(Clontech公司)及的HXLOX(US Biochemical公司)或Invitrogen和Novagen公司的載體也可以得到相似的效果。這些載體都應(yīng)滿足兩個條件第一,有商用引物如T3或M13反向引物的引物結(jié)合位點;第二,能夠容納多至10kB的插入片段。
cDNA克隆的隨機取樣也是很重要的,因此應(yīng)該使用相當(dāng)大量的克隆。分析5,000個克隆以得出正確結(jié)果是很常見的操作,如果要得到非常稀有的基因和/或測定它的相對豐度時,可能會從一個文庫中對100,000個克隆取樣。cDNA的大小也要嚴(yán)格控制??蛇x地,可以選擇噬菌斑而不是克隆。
除了下面將要提到的Stratagene公司的Uni-ZAPTM載體系統(tǒng)外,據(jù)信也可以使用其它類似的單向載體。例如,這些載體包括但不限于DR2(Clontech公司)和HXLOX(US.Biochemical公司)。
一種優(yōu)選的方法是將構(gòu)建文庫的具體細節(jié)(如圖1中所示)都收集起來并儲存于一個數(shù)據(jù)庫中以方便日后對參考序列進行檢索。圖1包括了有關(guān)文庫合作者或細胞或cDNA提供者、預(yù)處理方法、生物來源、培養(yǎng)物、mRNA制備以及cDNA構(gòu)建過程的許多重要信息。當(dāng)要深入分析序列及文庫時,有關(guān)其它步驟的類似的詳盡信息將是有益的。
cDNA文庫的構(gòu)建是從由細胞和組織樣品中獲得RNA開始的??梢砸罁?jù)已有文獻中描述過的方法來進行(參看Manatis,T.et al.(1982),分子克隆,冷泉港實驗室紐約),或者也可以直接購買cDNA文庫。U-937 cDNA文庫(分類號937207)購自Stratagene公司(11099 M.Torrey Pines Rd.,La Jolla,CA 92037)。
THP-1 cDNA文庫是由Stratagene公司用常規(guī)方法從用100nm TPA處理48小時和1μg/ml LPS處理4小時的THP-1細胞培養(yǎng)物中制備的。人肥大細胞HMC-1 cDNA文庫也是Stratagene公司從培養(yǎng)的HMC-1細胞用常規(guī)方法構(gòu)建的。而HUVEC cDNA文庫是Stratagene公司將兩批誘導(dǎo)過的HUVEC細胞分別處理后用常規(guī)方法構(gòu)建得到的。
重要的是,以上所有文庫均用同一種方式制得。首先,純化poly(A+)RNA(mRNA)。對于U-937和HMC-1RNA,cDNA合成僅用寡聚dT引發(fā)。對THP-1和HUVEC RNA,分別同時用寡聚dT和隨機六聚體引發(fā)cDNA合成,由此得到的兩個cDNA文庫各自在獨立條件下處理。然后,將合成的寡聚核苷酸和cDNA的末端連接起來使其能夠插入Uni-ZAPTM載體系統(tǒng)(Stratagene公司),從而能得到高效率的單向(有意義方向)λ文庫構(gòu)建體,并可以用簡便的藍-白篩選在質(zhì)粒系統(tǒng)中檢測有無cDNA插入的克隆。最后,混合等量的噬菌體以使兩個文庫合并為一個。
基因文庫的篩選可以用DNA探針或抗體探針來進行,Stratagene公司提供的pBluescript噬菌??梢匝杆俚卦隗w內(nèi)進行切割。應(yīng)用噬菌粒的質(zhì)粒系統(tǒng)可以很方便地進行插入分析、測序、定點突變、產(chǎn)生單向切除和對融合蛋白進行表達。用常規(guī)方法構(gòu)建好的文庫噬菌體顆粒被用于感染Stratagene公司的XLl-Blue E.coli宿主菌株,這一菌株具有高的轉(zhuǎn)化效率,增加了獲得cDNA文庫中稀有的和非典型性克隆的幾率。
6.3分離cDNA克隆各個cDNA克隆均以噬菌粒的形式通過體內(nèi)切割步驟獲得,其中宿主菌株被λ噬菌體和輔助噬菌體f1同時感染。由含有文庫的噬菌體和輔助噬菌體指導(dǎo)合成的蛋白在λDNA上打開缺口,從而啟動依λ靶DNA上特定序列的新DNA合成,并且產(chǎn)生了包含全部pBluescript質(zhì)粒序列和cDNA插入序列的一個較小的單鏈環(huán)狀噬菌粒DNA分子。從細胞中分離純化這一噬菌粒用于再次感染新的寄主細菌,在菌體內(nèi)形成雙鏈?zhǔn)删NA。由于噬菌粒攜帶β-內(nèi)酰胺酶的基因,因而可以在含有氨芐青霉素的平板上篩選新轉(zhuǎn)化的細菌。
在純化噬菌粒DNA的過程中使用的是Magic MiniprepsTMDNA純化系統(tǒng)(Promega Catalogue#A7100.Promega公司,2800WoodsHollow Rd.,Madison,WI 53711)。通過使用一種專利DNA結(jié)合樹脂,這一小量法過程提供了一個簡便可靠的裂解細菌細胞并快速分離純化噬菌粒DNA的方法。從純化樹脂上洗脫下來的DNA可以直接用于DNA測序及其它分析操作。
噬菌粒的純化也可以使用QIAGEN的DNA純化系統(tǒng)中的QIAwel1-8質(zhì)粒純化系統(tǒng)來完成,(QIAGEN公司,9259 Eton Ave.,Chattsworth,CA 91311)。這一產(chǎn)品系列使用QIAGEN的陰離子交換樹脂,采用3M公司的多孔格式EMPORETM膜技術(shù),提供了一種簡便、迅速、可靠及高產(chǎn)出的裂解細菌和分離高純度噬菌粒DNA的方法。從純化樹脂上洗脫的DNA可以直接用于DNA測序及其它分析操作。
最近出現(xiàn)了第二種純化噬菌粒的方法。它基于Miniprep試劑盒(分類號77468,得自先進基因技術(shù)公司,19212 Orbit Drive,Gaithersburg,Maryland)。這一試劑盒被設(shè)計為96孔板的規(guī)格并提供了足以進行960次純化的試劑量。每個試劑盒都帶有一套建議使用的操作規(guī)程。這一規(guī)程除以下部分需要進行少量改動外其它都被直接應(yīng)用。第一,96孔板每個孔中只加入1ml滅菌的含25mg/L的羧芐青霉素和0.4%甘油的高濃度肉湯培養(yǎng)基。在孔中接種后培養(yǎng)24小時,用60μl裂解緩沖液處理。將板中容物加到初級過濾板前要在2,900rpm下離心5分鐘。向Tris緩沖液中加異丙醇的任選步驟沒有按常規(guī)進行。在規(guī)程的最后一步完成后,樣品被轉(zhuǎn)移到一個Beckman 96孔板中貯存起來。
第二新DNA純化系統(tǒng)是產(chǎn)品WIZARDTM,可以得自Promega公司(分類號A7071),可以使之適用于96孔板規(guī)格。
6.4 cDNA克隆的測序?qū)腢-937和THP-1文庫中隨機分離的cDNA插入片段進行了部分測序。DNA測序方法已經(jīng)是本領(lǐng)域內(nèi)眾所周知的。傳統(tǒng)的酶法測定使用DNA聚合酶Klenow片段、測序酶TM或Taq聚合酶從一個寡聚核苷酸引物開始延伸DNA鏈,該引物與所感興趣的DNA模板退火結(jié)合。改進了的方案可以用單鏈或雙鏈模板。鏈中止反應(yīng)產(chǎn)物通常用尿素-丙烯酰胺凝膠電泳分離,電泳結(jié)果通過放射自顯影(對于放射性核素標(biāo)記的前體)或熒光(對熒光標(biāo)記前體)的方法來檢測,近年來,由于發(fā)展了機械化的反應(yīng)物制備、測序、熒光分析等新穎的儀器技術(shù),使得每天可以測定的序列數(shù)目增加(如Applied Biosystem 373,377 DNA測序儀,Catalyst800)。使用上述系統(tǒng),目前測序長度依據(jù)各克隆的不同從250至400堿基之間不等。另外,測序長度也隨著在凝膠中電泳時間的長短而變動。一般說來,短的電泳時間傾向于截短能夠測定的序列長度。為了得到確定和可重復(fù)的結(jié)果,至少25至50個堿基長度是必需的?;蜣D(zhuǎn)錄物圖象的使用可以用任何序列特異性手段,包括但不限于雜交、質(zhì)譜、毛細管電泳、505凝膠電泳。
6.5 cDNA克隆及其所得蛋白的同源性檢索(及后續(xù)步驟)將從cDNA克隆得到的的核酸序列作為待查序列(序列表中的序列),可以到含有許多已知DNA序列的數(shù)據(jù)庫中去尋找同源的區(qū)域。Genebank和EMBL是這樣的數(shù)據(jù)庫的兩個代表。下面我們將描述兩個同源性檢索算法的具體實例,然后描述隨后進行的依據(jù)本發(fā)明優(yōu)選實施方案中由計算機完成的操作步驟。
在說明本發(fā)明中由計算機進行的步驟時,單詞“文庫”被用于指稱一系列(或一群)生物樣品的核酸序列。一個“文庫”可以由能夠表征一個生物樣品的cDNA序列、RNA序列或其它類似的序列組成。我們所說的生物樣品既可以由單一類型的人體細胞(或上面提到過的其它樣品類型)。為了準(zhǔn)確表示或表征一個生物樣品(例如從單個人類細胞中提純的RNA克隆的代表性cDNA序列)我們希望文庫中的序列已被測定。
在下文描述的本發(fā)明中由計算機進行的步驟中,“數(shù)據(jù)庫”一詞指的是一套代表了一個序列集合的儲存數(shù)據(jù),而這一序列集合又反映了生物參考樣品的組合,舉例來說,一個數(shù)據(jù)庫可以由代表被各種病毒感染的或處于不同年齡階段的人類細胞以及不同種的哺乳動物細胞等的cDNA序列數(shù)據(jù)。
在優(yōu)選的專利實施方案中,本發(fā)明使用軟件(將被描述)編程的計算機進行如下操作(a)處理表示一個cDNA序列文庫的數(shù)據(jù)(由高效率的cDNA測序法或其它方法得到)以決定文庫中的每一序列是否同參考DNA序列數(shù)據(jù)庫中的一個DNA序列相匹配(如果有的話,就確定這一參考數(shù)據(jù)庫中與之匹配的條目并指出文庫序列和參考序列間的匹配程度),并賦以一個基于序列標(biāo)注和同文庫中各序列匹配程度的確定的序列值;
(b)對數(shù)據(jù)庫中部分或全部條目,將文庫中確定為匹配的序列值的數(shù)目列表(雖然這一工作可依據(jù)全部條目的清單手工完成,但我們建議用如下的計算機軟件來實現(xiàn)這一操作)從而得到一組最終數(shù)值或“豐度數(shù)”;(c)如果文庫大小不同,將其豐度數(shù)除以文庫序列總數(shù),得到每一確定的序列值的相對豐度數(shù)(也就是每一基因轉(zhuǎn)錄物的相對豐度)。
確定的序列值(或是相應(yīng)的基因)的表可以依照在cDNA群中的豐度進行排序。此外還有其它很多種比較的方法和角度。
例如(詳細說明見下)可以對兩個不同的文庫進行步驟(a)和(b)操作(有時將兩個文庫中的一個稱為“目標(biāo)”文庫而第二個稱為“減法”文庫)。然后,對每一確定的序列值(或基因轉(zhuǎn)錄物)用目標(biāo)庫的豐度值(對該確定的序列值)除以減法庫的豐度值(對該確定的序列值),得到一個“比率”值。
事實上,減法也可以在多個文庫中進行。有可能把幾個文庫(比如說3個)中的轉(zhuǎn)錄物相加,然后除以得自多個文庫(也比如是3個)的一組轉(zhuǎn)錄物。這一操作可以概括表達為(A+B+C)/(D+E+F),其中每個大寫字母表示完整的一個庫。任選地在實施減法之前用總和文庫中轉(zhuǎn)錄物的豐度值除以總樣品的大小。
和標(biāo)準(zhǔn)的雜交技術(shù)允許在兩個文庫之間進行單一的減法不同,當(dāng)對一系列文庫轉(zhuǎn)錄物序列進行處理并將結(jié)果儲存入計算機后,就可以在文庫中實施任意數(shù)目的減法。例如通過這種方法,比率的數(shù)值可以用第一個文庫的相對豐度除以第二個文庫中的對應(yīng)數(shù)值而得到,反之亦然。
作為步驟(a)的一個變化,文庫也可以由得自cDNA克隆的核苷酸序列組成。可以實施步驟(a)中的同源(相似)區(qū)域檢索的商用數(shù)據(jù)庫有Genebank(NIH),EMBL(歐洲分子生物學(xué)實驗室,德國)以及GENESEQ(Intelligenetics,Mountain View,California)。
D,J.Lipman和W.R.Pearson的題目為“快速和靈敏的蛋白質(zhì)相似性檢索”Science,2271435(1985)的文章描述了一種可用于步驟(a)的同源性檢索算法。在這一算法中,檢索同源區(qū)域的過程分兩步進行。首先,通過使用一種同源值表來計算匹配值,從而得到最高度同源性區(qū)域。在這一步驟中引入一個參數(shù)Ktup來規(guī)定進行兩序列比較時可以移動的最小窗口大小。同時,Ktup值也規(guī)定了從序列中提取出最高度同源區(qū)域時所需要達到的堿基對數(shù)目。在這一步中,不進行插入或刪除操作,序列同源性用一個起始值(INIT)表示。
在第二步中,通過插入一段間隙,加入一個可被刪除的部分,將同源區(qū)域“校準(zhǔn)”,以得到最高的匹配值。從第一步得到的匹配值用同源值表和插入值表重新計算,最后的結(jié)果是一個優(yōu)化(OPT)數(shù)值。
兩個DNA序列間的同源性可用Harr的方法建立點陣同源性圖來比較和檢驗(Needleman,S,B,Wunsch c.o.,J.Mol.Biol.48443(1970))。這一方法可生成一張二維圖,有助于確定相對于重復(fù)區(qū)的同源區(qū)。
但是在一類優(yōu)選的實施方案中,步驟(a)是通過使用名為INHERIT670 Sequence Analysis System的商業(yè)軟件處理文庫數(shù)據(jù)來進行的。這一程序可從Applied Biosystems公司(Foster City,California)處得到,此外還包括叫做Factura Software的軟件,也可得自該公司。Fuctura程序先對每一文庫序列進行預(yù)處理,“剪輯掉”和感興趣的序列無關(guān)的信息,比如說用于文庫制備的載體序列。其它可以剪輯掉或掩蔽(而被檢索程序所忽略)的序列包括但不限于ploy A尾和重復(fù)性GAG、CCC序列??梢跃幹埔粋€簡單的檢索程序用于掩蔽掉這樣的“低信息度”的序列,或者象BLAST一類的程序可以忽略這種低信息度序列。
在INHERIT 670序列分析系統(tǒng)執(zhí)行的算法中,使用模式規(guī)范語言(由TRW公司開發(fā))來辨別同源區(qū)域。在INHERIT Analysis用戶手冊1.0版,Applied Biosystems公司,(1991.1)的第2至15頁中這樣寫道“有三個參數(shù)決定INHERIT analysis進行序列比較的方式窗口大小、窗口偏置和容錯度。窗口大小規(guī)定將待查序列劃分的片段長度,窗口偏置規(guī)定從何處開始下一片段(用于比較),計數(shù)時從上一片段的起點開始。容錯度指的是在規(guī)定長度序列中可以容忍的插入、缺失或是替換的總數(shù)。容錯度可以取0-6的任何整數(shù)值。系統(tǒng)的缺省設(shè)置如下窗口長度=20,窗口偏置=10,容錯度=3”。
使用這三個參數(shù)的組合可以在一個數(shù)據(jù)庫(如DNA數(shù)據(jù)庫)中搜尋包含有同源區(qū)的序列并對合適的序列給出一個初始值。然后,使用點陣同源圖來檢驗這些同源區(qū)域從而得到相對于重復(fù)區(qū)的同源區(qū),通過Smith-Waterman校準(zhǔn)方法可以顯示這一同源檢索的結(jié)果。此INHERIT軟件在使用UNIX操作系統(tǒng)的Sun計算機系統(tǒng)上執(zhí)行。
INHERIT的可選研究手段包括BLAST程序,GCG(可得自GeneticsComputer Group,WI)和Dasher程序(Temple Smith,Boston大學(xué),Boston,MA)。核苷酸序列可以在Genbank,EMBL或諸如GENESEQ(可取自Intelligenetics,Mountain View,CA)的用戶數(shù)據(jù)庫或其它基因數(shù)據(jù)庫中檢索。此外,我們用自備的數(shù)據(jù)庫檢索了一些序列。
在優(yōu)選實施方案中,用INHERIT軟件分析轉(zhuǎn)錄物序列,尋找最匹配的參考基因轉(zhuǎn)錄物來指定為序列標(biāo)稱物,并且賦予同源度,二者合起來作為確定的序列值,輸入用“豐度排序與減法分析”計算機程序(見下述)編程的Macintosh個人計算機(可得自Apple公司)并由計算機進一步處理。在“豐度排序和減法分析”程序(又稱為“豐度排序程序”)處理之前,對來自cDNA克隆的確定的序列用匹配度賦值(根據(jù)上面給出的參數(shù)),匹配度依照下列類別“嚴(yán)格”匹配(具有高度一致性的區(qū)域)、人類同源匹配(具有高度相似性,但不是“嚴(yán)格”匹配的區(qū)域),非人類同源匹配(存在于非人類的物種中具有高度相似性的區(qū)域),非匹配(與以數(shù)據(jù)庫形式存儲的確定的的核苷酸序列無明顯同源性的區(qū)域)??蛇x地,匹配度可以是如下所述的數(shù)值。
再參考在參考序列與數(shù)據(jù)庫之間確定匹配的步驟,可以由核苷酸序列推導(dǎo)出蛋白質(zhì)和肽類序列,應(yīng)用推導(dǎo)出的多肽序列,可以周與處理cDNA序列相似的方式進行匹配確定。一段蛋白質(zhì)序列可以用作待查序列,與存儲于諸如Swiss/Prot,PIR和NBRF蛋白質(zhì)數(shù)據(jù)庫中的確定的序列相比較,來發(fā)現(xiàn)同源蛋白質(zhì)。首先,對這些蛋白質(zhì)應(yīng)當(dāng)用一張同源性分值表(Orcutt,B.C.和Dayoff,M.O.分值矩陣,PIR報告MAT-0285(1985年2月))給同源性記分,得到一個INIT值。通過插入一段間隙(這段間隙添加了一個可以被刪除的部分)將同源序列校準(zhǔn)以獲得最高匹配值。應(yīng)用同源值表和插入值表再計算匹配值,得到優(yōu)化(OPT)數(shù)值,即使對一段分離得到的序列的正確閱讀框架毫無了解,也可以通過檢索所有3個閱讀框架進行上述的蛋白質(zhì)同源性檢索。
與DNA序列同源性檢索相類似,應(yīng)用INHERIT 670序列分析系統(tǒng)也可以確定肽類及蛋白質(zhì)的序列同源性。模式規(guī)范語言和參數(shù)窗口被用來檢索蛋白質(zhì)數(shù)據(jù)庫,尋找包含以一個初始值記分的同源性區(qū)域。接下來的在點陣同源性圖上的顯示展示出相對于重復(fù)區(qū)域的同源性區(qū)域。可應(yīng)用于模式檢索數(shù)據(jù)庫的其它檢索工具,包括PLsearch Blocks(取自Henikoff &Henikoff,華盛頓大學(xué),西雅圖),Pasher和GCG。模式檢索數(shù)據(jù)庫包括,但不限于,Protein Blocks(可取自Henikoff & Henikoff,華盛頓大學(xué),西雅圖),Brookhaven Protein(可取自Brookhaven國家實驗室,Brookhaven,MA),PROSITE(可取自Amos Bairoch,日內(nèi)瓦大學(xué),瑞士),ProDom(可取自Temple Smith,波士頓大學(xué))和PROTEINMOTIF FINGERPRINT(可取自利茲(Leeds)大學(xué),聯(lián)合王國)。
INHERIT DNA分析系統(tǒng)(可獲自Applied Biosystems,公司,F(xiàn)osterCity CA)的一部分,ABI Assembler應(yīng)用軟件,可以通過把選定的序列片段的數(shù)據(jù)組合成一段大的序列,生成及管理序列組合項。Assembler軟件綜合了兩種先進的計算機技術(shù),最大限度地提高了將已測序的DNA片段裝配成裝配體(Assemblage)的能力。裝配體是一種特殊的數(shù)據(jù)分組,其中序列之間的關(guān)系以圖形疊加,圖形排列及統(tǒng)計圖顯示出來。該過程基于片段裝配的Meyers-Kececioglu模型(INHERITTMAssembler用戶手冊,Applied Biosystems,公司,F(xiàn)oster City,CA),以圖論作為一種非常嚴(yán)格的裝配DNA序列片段的多序列排列工具的基礎(chǔ)。其它可用的裝配程序包括MEGALIGN(可取自DNASTAR公司Madison,WI),Dasher和STADEN(可取自Roger Staden,英國劍橋)。
下一步,參考圖2,我們更詳細地描述“豐度排序”程序。該程序?qū)嵤┥鲜觥安襟E(b)”,將與每個數(shù)據(jù)庫條目匹配的文庫中序列的數(shù)目(即每個數(shù)據(jù)庫條目的“豐度值”)制表。
圖2是豐度排序程序的優(yōu)選實施方案的流程圖。該豐度排序程序?qū)嵤┓桨傅脑创a列表見表5。在表5的實施方法中,豐度排序程序用FoxBASE編程語言寫成。該語言可從微軟公司買到。盡管FoxBASE是本技術(shù)首選程序,但是不應(yīng)局限于此。正如對本領(lǐng)域的技術(shù)人員顯而易見的,許多其它編程語言也可使用。Sybase是一個尤其合乎需要的可選程序。圖2中列出的子程序名對應(yīng)于表5列出的子程序。
再參考圖2,“確定的序列”是轉(zhuǎn)錄物序列,它們代表文庫中每一段序列和與之匹配的數(shù)據(jù)庫條目的相應(yīng)識別標(biāo)志(若有的話),換句話說,“確定的序列”是代表上述步驟(a)的輸出的轉(zhuǎn)錄物序列。
圖3是實施本發(fā)明的系統(tǒng)的方塊圖。圖3系統(tǒng)包括文庫生成單元2,此文庫生成單元生成一個文庫并且決定著一個對應(yīng)于構(gòu)成文庫的生物序列的轉(zhuǎn)錄物序列輸出流。編程的處理器4從單元2接收數(shù)據(jù)流并依照上述步驟(a)處理數(shù)據(jù),生成確定的序列,處理器4可以由下列軟件編程,即商業(yè)的稱為INHERIT 670序列分析系統(tǒng)的計算機程序,商業(yè)的稱為Factura程序的計算機程序(二者均可得自Applied Biosystems,公司)和UNIX操作系統(tǒng)。
仍參考圖3,確定的序列裝入由豐度排序程序編程的處理器6,處理器6生成圖2和圖3提到的最終轉(zhuǎn)錄物序列。圖4顯示一個plannedrelational計算機系統(tǒng)的更加詳細的方塊圖,它包括各種可被執(zhí)行的檢索技術(shù)以及用于檢索的數(shù)據(jù)庫的組合。
參考圖2,豐度排序程序首先對確定的程序進行稱為“模板數(shù)(Tempnum)”的操作,以棄去除了與選擇類型的數(shù)據(jù)庫條目匹配的確定的序列之外的所有確定的序列。例如,用“模板數(shù)”處理可以挑選出代表與下列類型數(shù)據(jù)庫條目(定義見上述)相匹配的確定的序列,這些類型是“嚴(yán)格”匹配,人類“同源”匹配,代表見于人類以外的其它物種的“其它種”匹配“非”匹配(沒有明顯地與代表先前確定的核苷酸順序的數(shù)據(jù)庫條目具有同源性的區(qū)域),“I”匹配(非先前已知DNA序列的Incyte),或“X”匹配(與參考數(shù)據(jù)庫中的ETS相匹配)這樣就去除了U、S、M、V、A、R和D序列(定義見表1)。
在“模板數(shù)”過程中選出的確定的序列值,再進行稱為“模板讀(Tempred)”的進一步選擇(清除)操作。舉例來說,該操作可以棄去所有代表與被選擇的數(shù)據(jù)庫條目相匹配的確定的序列值。接著,在“模板指認(Tempdesig)”操作中依照文庫對經(jīng)“模板讀”過程選出的確定的序列值進行分類??梢哉J為“確定的序列”可以代表來自單一文庫或兩個文庫或更多文庫的序列。
首先考慮如下情況,即確定的序列值代表來自單一文庫的序列。在這種情況下,在“模板讀”過程中決定的所有確定的序列值,經(jīng)過“文庫模板(Templib)”操作排序,經(jīng)過“文庫排序(Libsort)”操作進一步排序,最后經(jīng)“目標(biāo)模板排序(Temptarsort)”過程進一步排序。例如,這三次排序操作可以按“豐度數(shù)”遞降順序排序確定的序列(以生成一個遞減豐度數(shù)的表,每一個豐度數(shù)對應(yīng)一個特定的確定的序列條目;或生成幾個遞減豐度數(shù)的表,每一表中的豐度數(shù)對應(yīng)一選定類型的數(shù)據(jù)庫條目),并把每個排序表中的冗余部分剔除。在此情況下,可略過稱為“擠壓(Cruncher)”的操作,則“最終數(shù)據(jù)”值是經(jīng)“目標(biāo)模板排序”過程建成的有組織的轉(zhuǎn)錄物序列。
下一步考慮這種情況,即經(jīng)“模板讀”操作產(chǎn)生的轉(zhuǎn)錄物序列代表來自兩個文庫的序列(這兩個文庫稱為“目標(biāo)”文庫和“減法”文庫)。例如,目標(biāo)文庫可能包括來自一種患病細胞克隆的cDNA序列,而減法文庫可能包括來自接受藥物處理后該患病細胞的克隆的cDNA序列。又例如,目標(biāo)文庫可能包括來自一個年輕人的一種細胞類型的克隆的cDNA序列,而減法文庫可能包括來自這個人在不同年齡時同種細胞類型的克隆的cDNA序列。
在這種情況下,“模板指認”操作使所有代表目標(biāo)文庫的轉(zhuǎn)錄物序列依照“文庫模板”(接下去是“文庫排序”和“目標(biāo)模板排序”)操作處理,而使所有代表減法文庫的轉(zhuǎn)錄物序列按照“Tempsub”(接下去是“減法排序(Subsort)”和“減法模板排序(Tempsubsort)”)操作處理。例如,連續(xù)的“文庫模板”,“文庫排序”和“目標(biāo)模板排序”排序操作從目標(biāo)文庫中按豐度數(shù)遞降順序?qū)Υ_定的序列排序(以生成一張遞減的豐度數(shù)的表,每一個豐度數(shù)對應(yīng)于一個數(shù)據(jù)庫條目,或者生成幾張遞減的豐度數(shù)的表,每張表的豐度數(shù)對應(yīng)一種選定類型的數(shù)據(jù)庫條目),并將每張已排序表中的冗余部分剔除。連續(xù)的“減法模板(Tempsub)”,“減法排序”和“Tempsubsort”排序操作從減法文庫中按豐度數(shù)遞降順序?qū)Υ_定的序列排序(以生成一張遞減的豐度數(shù)的表,每一個豐度數(shù)對應(yīng)一個數(shù)據(jù)庫條目,或者生成幾張遞減的豐度數(shù)的表,每張表的豐度數(shù)對應(yīng)一種選定類型的數(shù)據(jù)庫條目),并將每張已排序表中的冗余部分剔除。
“Tempsubsort”操作的轉(zhuǎn)錄物序列輸出典型地代表已排序表,從該表可生成一張直方圖,沿其中一軸(例如橫軸)的位置表示(目標(biāo)文庫序列的)豐度數(shù),沿第二軸的(例如縱軸)位置表示確定的序列值(例如人類或非人類基因類型)。類似地,“Tempsubsort”操作的轉(zhuǎn)錄物序列輸出典型地代表已排序表,從該表可生成一張直方圖,沿其中一軸(例如橫軸)的位置表示(減法文庫序列的)豐度數(shù),沿第二軸(例如縱軸)的位置表示確定的序列值(例如人類或非人類基因類型)。
來自Tempsubsort的轉(zhuǎn)錄物序列(已排序表)輸出和Tempsubsort排序操作通過稱為“擠壓”的操作綜合到一起?!皵D壓”操作確定各對相對應(yīng)的目標(biāo)與減法豐度數(shù)(二者代表同一確定的序列值),用其中一個除以第二個,從每對相對應(yīng)的豐度數(shù)得到一個“比率”值,然后按比率值遞降順序排序比率值?!皵D壓”操作的數(shù)據(jù)輸出(圖2中的終轉(zhuǎn)錄物序列)一般地是一張已排序表,從該表可以生成一張直方圖1,沿其中一軸的位置表示(對于來自目標(biāo)文庫與減法文庫的相對應(yīng)的確定的序列的)豐度數(shù)比率的大小,沿第二軸的位置表示確定的序列值(例如基因類型)。
優(yōu)選地,在獲得兩個文庫豐度值的比值之前擠壓操作將每一比率值除以目標(biāo)文庫和減法文庫二者之一或全部的總序列數(shù)。從擠壓操作生成的“相對”比率值結(jié)果表可以應(yīng)用于醫(yī)學(xué)、科研或工業(yè)等許多用途。另外,優(yōu)選地,擠壓操作的輸出是一個表的集合,每個表代表對于數(shù)據(jù)庫條目的一個不同的選定子集(例如蛋白質(zhì)家族)的比率值的遞降序列。
舉一個例子,對于一個文庫,本發(fā)明的豐度排序程序把對應(yīng)于數(shù)據(jù)庫中確定的每一基因的mRNA轉(zhuǎn)錄物數(shù)目制成表格。這些數(shù)目除以取樣的克隆的總數(shù),除得的結(jié)果反映了mRNA轉(zhuǎn)錄物在其來源的細胞類型或組織中的相對豐度。在此,獲取這種最終數(shù)據(jù)集合稱為“基因轉(zhuǎn)錄物圖象分析”得到的減法數(shù)據(jù)精確地顯示了在高度詳盡的復(fù)雜體系中,哪些蛋白質(zhì)和基因被增量調(diào)節(jié)和減量調(diào)節(jié)。
6.6 HUVEC cDNA文庫表2是一張列舉誘導(dǎo)的HUVEC文庫中各種基因轉(zhuǎn)錄物的豐度表。轉(zhuǎn)錄物以豐度降序排列,這種電子排序簡化了組織分析,加速了對該細胞類型特異的重要的新蛋白質(zhì)的確定過程。這種上皮細胞位于心血管系統(tǒng)的組織中,對其組成,尤其是它在應(yīng)激反應(yīng)中的組成,了解越多,就會有更多的蛋白質(zhì)目標(biāo)可供選擇,用以治療該組織的疾患,例如普遍存在的動脈硬化癥。
6.7單核細胞和肥大細胞cDNA文庫表3和表4給出兩個文庫的一個縮短的比較。表3和表4中的“正常單核白細胞”是HMC-1細胞,“激活巨噬細胞”是由PMA預(yù)處理和LPS激活的THP-1細胞。表3按豐度降序列出兩種細胞類型的最豐富的基因轉(zhuǎn)錄物。由于從每種細胞類型中只選用15個基因轉(zhuǎn)錄物,該表可用于快速定量比較常見的轉(zhuǎn)錄物。這種豐度排序,加上方便的同步顯示,提供了一種及時而有用的研究工具。在本例中,該研究工具表明1)15種最大量的激活巨噬細胞轉(zhuǎn)錄物中僅有一種也見于15種最豐富的單核白細胞基因轉(zhuǎn)錄物(多聚腺苷酸結(jié)合蛋白);2)相對而言,一種新基因轉(zhuǎn)錄物(以前未在其它數(shù)據(jù)庫中見到報導(dǎo))更顯著地出現(xiàn)在激活巨噬細胞中,但在正常巨噬細胞中不是同樣地顯著。這種研究工具為研究人員研究新蛋白提供了一條捷徑,這些新蛋白可以是受體、細胞表面信號分子和細胞內(nèi)信號分子,它們可以在商業(yè)藥物篩選程序中用作藥物靶。這種研究工具同目的在于鑒別細胞內(nèi)和細胞周圍的重要蛋白質(zhì)的無的放矢的發(fā)現(xiàn)程序相比要節(jié)省相當(dāng)多的時間,因為這些執(zhí)行日常細胞功能并且對應(yīng)于穩(wěn)態(tài)mRNA的蛋白質(zhì)在進一步研究其特性的過程中迅速被消除。
這樣就說明基因轉(zhuǎn)錄物圖譜如何隨著變化的細胞功能而變化。本領(lǐng)域的專業(yè)人員均了解細胞的生化組成隨著諸如癌癥(包括癌癥各個階段)和接觸毒物等其它功能變化而變化。如同在表3中那樣的基因轉(zhuǎn)錄物減法圖譜對這種基因表達和蛋白質(zhì)研究是一種有用的初步篩選工具。
6.8正常單核白細胞和激活單核白細胞cDNA文庫的減法分析cDNA數(shù)據(jù)存入計算機以后,表5所述的計算機程序就可用于從例6.7所討論的兩個文庫中獲取所有基因轉(zhuǎn)錄物的比率,基因轉(zhuǎn)錄物按比率值降序排序。如果基因不在一個文庫之中,則該基因轉(zhuǎn)錄物的豐度未知,但應(yīng)當(dāng)小于1。作為近似以獲得一個比率(如果未見于文庫的基因的豐度定為0,則得不到該比率),只見于二個文庫之一的基因賦予豐度值1/2。不在文庫中的克隆的豐度賦為1/2,增加了“開啟-關(guān)閉”基因的相對重要性,這些基因的產(chǎn)物可能是藥物候選物。打印出的計算機處理結(jié)果稱為減法表,它也是一種極有價值的篩選方法,這可以從下面的數(shù)據(jù)上看出來。
表4是一張減法表,其中正常單核白細胞文庫用計算機從激活巨噬細胞文庫中“減去”。該表最為有效地顯示了由于巨噬細胞的激活引起的基因轉(zhuǎn)錄物的豐度變化,甚至在列舉的前20種基因轉(zhuǎn)錄物中就有幾種未知的基因轉(zhuǎn)錄物。因此,電子計算機減法是一件有用的工具,可用它協(xié)助研究人員更快地確定兩種細胞類型之間基本生化物質(zhì)的變化。這樣一種工具可以為花費大量資金用于研究的大學(xué)和制藥公司在研究發(fā)現(xiàn)的初期節(jié)省寶貴的時間和實驗室資源,并且可以加快藥物開發(fā)周期,從而使研究人員更早地建立藥物篩選方案。因此,該研究工具為新藥物更快更經(jīng)濟地推向公眾提供了一條途徑。
此外,這樣的減法表可用于病人診斷。單個病人的樣本(諸如來自組織活體解剖或血樣的單核白細胞)可以與此處提供的數(shù)據(jù)比較,來診斷與巨噬細胞激活相關(guān)的狀況。
表4揭示了許多新的基因轉(zhuǎn)錄物(標(biāo)為Incyte克隆)。注意在激活巨噬細胞中許多基因的開啟(亦即單核白細胞在bgfreg欄中值為0)。本篩選方法優(yōu)于其它篩選方法,例如Western印跡法,后者不能揭示如此大量的不同的新基因轉(zhuǎn)錄物。
減法篩選方法也揭示出在激活巨噬細胞中有大量癌癥基因轉(zhuǎn)錄物(rho致癌基因,ETS2,rab-2 ras,YPT1相關(guān)和急性髓樣白血病mRNA)。這些基因轉(zhuǎn)錄物歸因于無限增殖細胞系的使用,因此其本身令人頗感興趣。該篩選技術(shù)提供一個包括致癌基因在內(nèi)的增量調(diào)節(jié)基因轉(zhuǎn)錄物的詳細圖片,有助于解釋為何抗癌藥物干擾病人的激活的巨噬細胞介導(dǎo)的免疫反應(yīng)。具備了由該篩選方法得來的知識,本領(lǐng)域的研究人員可以建立更有目的性、更有效的藥物篩選方案來確定對下列情況分別有效的藥物。這些情況為1)相關(guān)的癌癥和具有相同基因轉(zhuǎn)錄物圖譜的激活的巨噬細胞的狀態(tài);2)僅為癌癥;3)激活的巨噬細胞的狀態(tài)。
平滑肌衰老蛋白(22kd)在激活的巨噬細胞中受增量調(diào)節(jié),這說明它是控制炎癥的可供阻抑的候選物。
6.9正常細胞和肝炎感染的肝細胞cDNA文庫的減法分析在本實施例中,大鼠們接觸肝炎病毒,并維持群體狀態(tài),直到它們顯示明確的肝炎癥狀為止。經(jīng)診斷患有肝炎的大鼠的一半用新型抗肝炎藥劑(AHA)處理,從所有接觸肝炎病毒之前的大鼠和所有接受或未接受AHA治療之后的大鼠中提取肝樣本。另外,也可以當(dāng)患肝炎大鼠恰好在接受AHA治療之前獲取它肝樣本。
如例6.2和6.3所述處理肝組織,獲取mRNA并進一步對cDNA測序。每一樣本的cDNA依照表5的計算機程序處理并做豐度分析。得到的cDNA的基因轉(zhuǎn)錄物圖象為每種動物的基線(對照)以及這些動物的感染和/或治療后的狀態(tài)提供了一幅詳細的圖片。一組樣本的cDNA數(shù)據(jù)可以對所有對照樣本,所有受感染大鼠的樣本和所有受AHA治療的大鼠的樣本進行綜合,得到一組扼要的基因轉(zhuǎn)錄物圖譜。
減法操作可以在合適的個體文庫和分組文庫之間進行。對動物個體、對照與研究后樣本可以做減法。并且,如果是在AHA治療前和治療后獲得的樣本,則動物個體和受治療的組的數(shù)據(jù)可做減法。此外,所有對照樣本的數(shù)據(jù)可以匯集起來求平均值,對照平均值可以從研究后AHA和研究后非AHA治療cDNA樣品的平均值中做減法得到。如果有治療前和治療后的樣本,它們可以單個地(或用電子計算機求平均后)比較并做減法。
這些減法表可用于兩種一般用途。首先,用與持續(xù)肝惡化或與持續(xù)肝恢復(fù)相聯(lián)系的基因轉(zhuǎn)錄物來分析表中差值。減法表用來把藥物治療效果從更深層的肝炎基本病理中分離出來。由于肝炎影響多種參數(shù),只用對一般酶的血檢很難檢測出附加的肝毒性,而基因轉(zhuǎn)錄物組成與減法提供了更復(fù)雜的生化圖片,研究人員可應(yīng)用它來分析這類難題。
此外,減法表提供一種工具,用來確定臨床標(biāo)記物,蛋白質(zhì)個體或其它生化決定因素,這些生化物質(zhì)用于預(yù)測和/或評價臨床最終結(jié)果,諸如疾病,藥物引起的狀況改善,甚至是藥物引起的附加病理現(xiàn)象。減法表特異地顯示被開啟和關(guān)閉的蛋白。因此,減法表對一組候選基因轉(zhuǎn)錄物作為臨床標(biāo)記物的應(yīng)用提供初步篩選。隨后,附加的細胞和組織文庫的計算機減法揭示何種潛在標(biāo)記物真正地出現(xiàn)在不同的細胞和組織文庫中。在附加文庫中存在的候選基因轉(zhuǎn)錄物從潛在臨床標(biāo)記物集合中被剔除。接著對血液或其它已知具有或不具有相關(guān)狀態(tài)的相關(guān)樣品的測試加以比較,以使臨床標(biāo)記物的選擇合理化。依照本方法,不需要確定蛋白質(zhì)轉(zhuǎn)錄物的具體生理效應(yīng),即可將基因轉(zhuǎn)錄物定為臨床標(biāo)記物。
6.10電子Northern印跡法電子減法的一個缺陷是難以同時比較多于一對的圖象。一旦某個特定基因產(chǎn)物被確定為適于進一步研究(通過電子減法或其它方法),研究單個基因在大量不同組織中的表達將是有用的。實驗室中“Northern”印跡雜交技術(shù)用于此目的。在該技術(shù)中,單個cDNA或相應(yīng)的探針經(jīng)標(biāo)記后與包含從大量組織或細胞類型中制備的RNA樣本的印跡雜交。經(jīng)放射自顯影,該特定基因的表達模式會依次在所有涵蓋的樣本中定量。
6.11第I期臨床試驗基于上述動物試驗的安全性和有效性的確定,實行第I期臨床測試。正常的病人接受正常的初期臨床實驗室測試。另外,采集適當(dāng)樣本,進行基因轉(zhuǎn)錄物分析。在測試過程中按預(yù)定設(shè)置的間隔采集病人樣本。依上述內(nèi)容對樣本進行基因轉(zhuǎn)錄物分析。此外,在早期大鼠毒性研究中注意到的基因轉(zhuǎn)錄物變化,經(jīng)認真評價,作為后面病人的臨床標(biāo)記物?;蜣D(zhuǎn)錄物分析中的變化經(jīng)過評價,作為與臨床狀況和癥候和其它實驗室結(jié)果相關(guān)的毒性指示物。此外,對個體病人樣本和平均病人樣本實行減法操作。減法分析著重顯示出受治療病人的任何毒理變化。這是一種非常精細的毒性確定法。減法方法也對臨床標(biāo)記物進行注解??捎脺p法分析法分析進一步的子組,這包括,舉例來說,1)按有害效應(yīng)的發(fā)生與類型分類;2)按劑量分類。
6.12臨床研究中的基因轉(zhuǎn)錄物成像分析單基因轉(zhuǎn)錄物圖象分析(或多基因轉(zhuǎn)錄物圖象分析)在其它臨床研究中也是有用的工具。例如,治療前后的基因轉(zhuǎn)錄物成像分析的差別可以用于對安慰劑治療和藥物治療的病人的評估。該方法也有效地篩選臨床標(biāo)記物,以備下一步的藥物臨床應(yīng)用。
6.13種間比較基因轉(zhuǎn)錄物分析減法方法可用于篩選多種來源的cDNA文庫。例如,應(yīng)用基因轉(zhuǎn)錄物分析比較不同物種的同一細胞類型,以篩選特定的差別,諸如解毒酶系統(tǒng)中的差別。這樣的檢測有助于對一種動物模型的選擇與合理性進行確證,這種動物模型用于藥物篩選的商業(yè)用途或用于人類或動物的藥物毒性檢測。如果不同種動物間的比較按每一物種列成一欄,則稱之為種間比較或動物印跡法。
本發(fā)明的實施方案可以采用從微軟公司購置的FoxBASE編程語言編寫的數(shù)據(jù)庫。本發(fā)明的其它實施方案采用其它數(shù)據(jù)庫,諸如隨機肽數(shù)據(jù)庫,聚合物數(shù)據(jù)庫,人工合成寡聚物數(shù)據(jù)庫或寡聚核苷酸數(shù)據(jù)庫,它們分別高于在下述文獻中描述的類型,即美國專利5,270,170,1993年12月14日公開,授與Cun等;PCT國際申請公開,標(biāo)注WO 93 22684,1993年11月11日出版;PCT國際申請公開,標(biāo)注WO 93 06121,1993年4月11日出版;PCT國際申請公開,標(biāo)注WO 91 19818;1991年12月26日出版。這四種參考專利(在此引入作為參考)包括教學(xué)手段,可應(yīng)用于本發(fā)明其它實施方案的實施。
前文提到的所有參考文獻均在此引入作為參考。
本領(lǐng)域的專業(yè)人員均明確,不偏離本發(fā)明的實質(zhì)和范圍,本發(fā)明的上述方法和系統(tǒng)會有許多修改和變通。盡管本發(fā)明是與特定的優(yōu)選實施方案相聯(lián)系來描述,應(yīng)當(dāng)理解為,本發(fā)明的權(quán)利要求不應(yīng)過份限于該特定的實施方案。名稱(D) 分布(F)定位(Z) 功能(R)E=嚴(yán)格的 C=非特異的 N=核 T=翻譯H=同源的 P=細胞/組織特異的 C=細胞基質(zhì) L=蛋白質(zhì)加工O=其它種 U=未知 K=細胞骨架 R=核糖體蛋白N=不匹配 E=細胞表明 O=致癌基因D=非編碼基因種(S) Z=細胞內(nèi)膜 G=GTP結(jié)合蛋白U=不可讀 H=人 M=線粒體 V=病毒成分R=重復(fù)DNA A=猿 S=分泌的 Y=激酶/磷酸化酶A=只有poly-A P=豬 U=未知 A=腫瘤抗原相關(guān)的V=只是載體D=狗 X=其它 I=結(jié)合蛋白M=線粒體DNA V=牛 D=No-結(jié)合/轉(zhuǎn)錄S=跳讀B=兔狀態(tài)(I) B=表面分子/受體I=與Incyte克隆匹配R=大鼠 0=當(dāng)前無興趣 C=Ca++結(jié)合蛋白X=EST匹配 S=倉鼠 1=無初級分析 S=配體/效應(yīng)物C=雞 2=初級分析已完成 H=應(yīng)激反應(yīng)蛋白文庫(L)F=兩棲類 3=全長序列 E=酶U=U937I=無脊椎動物 4=次級分析 F=鐵蛋白M=HMC Z=原生動物 5=組織Northern雜交 P=蛋白酶/抑制物T=THP-1 G=真菌 6=獲得全長 Z=氧化磷酸化H=HUVEC Q=糖代謝S=脾M=氨基酸代謝L=肺N=核酸代謝Y=T細胞與B細胞 W=酯代謝A=腺狀的K=結(jié)構(gòu)的表1 X=其它U=未表2克隆數(shù)15000至20000文庫HUVEC按豐度排序分析的總克隆數(shù)5000319個基因,共1713個克隆號數(shù)N c 條目 s 描述符11536567HSRPL41Riboptn L4121500465NCY015004 INCYTE 01500431563863NCY015638 INCYTE 01563841539050NCY015390 INCYTE 01539051519347HSFIB1 Fibronectin61522047RRRPL9 R Riboptn L971528047NCY015280 INCYTE 01528081558333M62060 EST HHCH09 (IGR)91566231HSACTCGR Actin,gamma10 1502629NCY015026 INCYTE 01502611 1527924HSEF1ARElf 1-alpha12 1502723NCY015027 INCYTE 01502713 1503320NCY015033 INCYTE 01503314 1519820NCY015198 INCYTE 01519815 1580920HSCOLL1Collagenase16 1522119NCY015221 INCYTE 01522117 1526319NCY015263 INCYTE 01526318 1529019NCY015290 INCYTE 01529019 1535018NCY015350 INCYTE 01535020 1503017NCY015030 INCYTE 01503021 1523417NCY015234 INCYTE 01523422 1545916NCY015459 INCYTE 01545923 1535315NCY015353 INCYTE 01535324 1537815S76965 Ptn kinase inhib25 1525514HUMTHYB4 Thymosin beta-426 1540114HSLIPCRLipocortin I27 1542514HSPOLYAB Poly-A bp28 1821214HUMTHYMA Thymosin,alpha29 1821614HSMRP1 Motility relat ptn;MRP-1;CD-930 1518913HS18D Interferon induc ptn 1-8D31 1503112HUMFKBPFK506 bp32 1530612HSH2AZ Histone H2A33 1562112HUMLEC Lectin,B-galbp,14kDa34 1578911NCY015789 INCYTE 01578935 1657811HSRPS11Riboptn S1136 1663211M61984 EST HHCA13 (IGR)37 1831411NCY018314 INCYTE 01831438 1536710NCY015367 INCYTE 01536739 1541510HSIFNIN1 interferon induc mRNA40 1563310HSLDHARLactate dehydrogenase41 1581310CHKNMHCB C Myosin heavy chain B42 1821010NCY018210 INCYTE 01821043 1823310HSRPII140 RNA polymerase II44 1899610NCY018996 INCYTE 01899645 15088 9HUMFERLFerritin,light chain46 15714 9NCY015714 INCYTE 01571447 15720 9NCY015720 INCYTE 01572048 15863 9NCY015863 INCYTE 01586349 16121 9HSET Endothelin50 18252 9NCY018252 INCYTE 01825251 15351 8HUMALBPLipid bp,adipocyte52 15370 8NCY015370 INCYTE 015370
表2繼續(xù)號數(shù)N c條目 s描述符53156708BTCIASHI VNADH-ubiq oxidoreductase54157958NCY015795 INCYTE01579555162458NCY016245 INCYTE01624556182628NCY018262 INCYTE01826257183218HSRPL17 Riboptn L1758151267XLRPL1BRF Riboptn L159151337HSAC07Actin,beta60152457NCY015245 INCYTE01524561152887NCY015288 INCYTE01528862152947HSGAPDR G-3-PD63154427HUMLAMB Laminin receptor,54kDa64154857HSNGMRNA Uracil DNA glycosylase65166467NCY016646 INCYTE01664666180037HUMPAIA Plsmnogen activ gene67150326HUMUB Ubiquitin68152676HSRPS8Riboptn S869152956NCY015295 INCYTE01529570154586RNRPS10R RRiboptn S1071158326RSGALEM RUDP-galactose epimerase72159286HUMAPOJ Apolipoptn J73165986HUMTBBM40 Tubulin,beta74182186NCY018218 INCYTE01821875184996HSP27 Hydrophobic ptn p2776189636NCY018963 INCYTE01896377189976NCY018997 INCYTE01899778154325HSAGALAR Galactosidase A,alpha79154755NCY015475 INCYTE01547580157215NCY015721 INCYTE01572181158655NCY015865 INCYTE01586582162705NCY016270 INCYTE01627083168865NCY016886 INCYTE01688684185005NCY018500 INCYTE01850085185035NCY018503 INCYTE01850386196725RRRPL34 RRiboptn L3487150864XLRPL1AR FRiboptn L1a88151134HUMIFNWRS tRNA synthetase,trp89152424NCY015242 INCYTE01524290152494NCY015249 INCYTE01524991153774NCY015377 INCYTE01537792154074NCY015407 INCYTE01540793154734NCY015473 INCYTE01547394155884HSRPS12 Riboptn S1295156844HSEF1GElf 1-gamma96157824NCY015782 INCYTE01578297159164HSRPS18 Riboptn S1898159304NCY015930 INCYTE01593099161084NCY016108 INCYTE016108100 161334NCY016133 INCYTE016133
正常單核白細胞與激活的巨噬細胞15種豐度最大的基因正常的 激活的1延伸因子1α白細胞介素-1β2核糖核蛋白體磷蛋白 巨噬細胞炎癥蛋白-13核糖核蛋白體S8蛋白同系物 白細胞介素-84β-珠蛋白 淋巴細胞激活基因5鐵蛋白H鍵 延伸因子-1α6核糖核蛋白體L7蛋白 β-肌動蛋白7核質(zhì)蛋白 Rantes T細胞特異性蛋白8核糖核蛋白體S20蛋白同系物 Poly-A結(jié)合蛋白9轉(zhuǎn)鐵蛋白受體 Osteopontin;nephropontin10 Poly-A結(jié)合蛋白 腫瘤壞死因子α11翻譯控制的腫瘤ptn INCYTE克隆01105012核糖核蛋白體S25蛋白 Cu/Zn超氧化物歧化酶13信號識別顆粒SRP9 腺苷酸環(huán)化酶(酵母同系物)14組蛋白H2A.Z NGF相關(guān)B細胞激活分子15核糖核蛋白體Ke-3蛋白 蛋白酶Nexin-1,神經(jīng)酸質(zhì)衍生表3
表4文庫THP-1減去HMC按豐度排序分析的總克隆數(shù)73751057個基因,共2151個克隆號數(shù) 條目 描述符 bgfreq rfend 比率10022HUMIL1 IL 1-beta 0131262.0010036HSMDNCF IL-8 0119238.0010089HSLAG1CDNLymphocyte activ gene 0 71142.0010060HUMTCSM RANTES 0 2346.00010003HUMMIP1A MIP-1 312140.33310689HSOP Osteopontin0 2040.00011050NCY011050INCYTE 011050 0 1734.00010937HSTNFR TNF-alpha 0 1734.00010176HSSODSuperoxide dismutase 0 1428.00010886HSCDW40 B-cell activ,NGF-relat0 1020.00010186HUMAPR Early resp PMA-induc 0 918.00010967HUMGDN PN-1,glial-deriv 0 918.00011353NCY011353INCYTE 011353 0 816.00010298NCY010298INCYTE 010298 0 714.00010215HUM4COLA Collagenase,type IV 0 612.00010276NCY010276INCYTE 010276 0 612.00010488NCY010488INCYTE 010488 0 612.00011138NCY011138INCYTE 011138 0 612.00010037HUMCAPPROAdenylate cyclase 1 1010.00010840HUMADCY Adenylate cyclase 0 510.00010672HSCD44E Cell adhesion glptn0 510.00012837HUMCYCLOXCyclooxygenase-2 0 510.00010001NCY010001INCYTE 010001 0 510.00010005NCY010005INCYTE 010005 0 510.00010294NCY010294INCYTE 010294 0 510.00010297NCY010297INCYTE 010297 0 510.00010403NCY010403INCYTE 010403 0 510.00010699NCY010699INCYTE 010699 0 510.00010966NCY010966INCYTE 010966 0 510.00012092NCY012092INCYTE 012092 0 510.00012549HSRHOB Oncogene rho 0 510.00010691HUMARF1BAADP-ribosylation fctr 0 4 8.00012106HSADSS Adenylosuccinate synthetase0 4 8.00010194HSCATHL Cathepsin L0 4 8.00010479CLMCYCA I Cyclin A 0 4 8.00010031NCY010031INCYTE 010031 0 4 8.00010203NCY010203INCYTE 010203 0 4 8.00010288NCY010288INCYTE 010288 0 4 8.00010372NCY010372INCYTE 010372 0 4 8.00010471NCY010471INCYTE 010471 0 4 8.00010484NCY010484INCYTE 010484 0 4 8.00010859NCY010859INCYTE 010859 0 4 8.00010890NCY010890INCYTE 010890 0 4 8.00011511NCY011511INCYTE 011511 0 4 8.00011868NCY011868INCYTE 011868 0 4 8.00012820NCY012820INCYTE 012820 0 4 8.00010133HSI1RAP IL-1 antagonist0 4 8.00010516HUMP2A Phosphatase,regul 2A 0 4 8.00011063HUMB94 TNF-induc response 0 4 8.00011140HSHB15RNAHB15 gene;new Ig 0 3 6.00010788NCY001713INCYTE 001713 0 3 6.00010033NCY010033INCYTE 010033 0 3 6.00010035NCY010035INCYTE 010035 0 3 6.00010084NCY010084INCYTE 010084 0 3 6.00010236NCY010236INCYTE 010236 0 3 6.00010383NCY010383INCYTE 010383 0 3 6.000
表4繼續(xù)號數(shù) 條目 描述符 bgfreq rfend 比率10450NCY010450INCYTE 010450036.00010470NCY010470INCYTE 010470036.00010504NCY010504INCYTE 010504036.00010507NCY010507INCYTE 010507036.00010598NCY010598INCYTE 010598036.00010779NCY010779INCYTE 010779036.00010909NCY010909INCYTE 010909036.00010976NCY010976INCYTE 010976036.00010985NCY010985INCYTE 010985036.00011052NCY011052INCYTE 011052036.00011068NCY011068INCYTE 011068036.00011134NCY011134INCYTE 011134036.00011136NCY011136INCYTE 011136036.00011191NCY011191INCYTE 011191036.00011219NCY011219INCYTE 011219036.00011386NCY011386INCYTE 011386036.00011403NCY011403INCYTE 011403036.00011460NCY011460INCYTE 011460036.00011618NCY011618INCYTE 011618036.00011686NCY011686INCYTE 011686036.00012021NCY012021INCYTE 012021036.00012025NCY012025INCYTE 012025036.00012320NCY012320INCYTE 012320036.00012330NCY012330INCYTE 012330036.00012853NCY012853INCYTE 012853036.00014386NCY014386INCYTE 014386036.00014391NCY014391INCYTE 014391036.000
表5<pre listing-type="program-listing"><![CDATA[*減法輸出的主菜單SET TALK OFFSET SAFETY OFFSET EXACT ONSET TYPEAHEAD TO 0CLEARSET DEVICE TO SCREENUSE ″SmartGuyfoxBASE+/Macfox filesClones.dbf″GO TOPSTORE NOMBER TO INITIATEGO BOTTOMSTCHE NUMBER TO TERMINATESTORE ′′TO Target1STORE ′′TO Target2STORE ′′TO Target3STORE ′′TO Object1STORE ′′TO Object2STORE ′′TO Object3STORE 0 TO ANALSTORE 0 TO EMATCHSTORE 0 TO HMATCHSTORE 0 TO CMATCHSTORE 0 TO IMATCHSTORE 0 TO PTFSTORE 1 TO BAILDO WHILE .T.* Program.Subtraction 2.fmt* Date....10/11/94* Version. FoxBASE+/Mac,ravision 1.10* Notes....Format file Subtraction 2*SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,9 COLOR 0,0,0,@ PIXELS 75,120 TO 178,241 STYLE 3871 COLOR 0,0,-1,24610,-1,8947@ PIXELS 27,134 SAY ″Subtraction Menu″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-1,-1,-1,-1@ PIXELS 117,126 GET EMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Exact″ SIZE 15,62 CO@ PIXELS 135,126 GET HMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Hcmologous″ SIZE 15,1@ PIXELS 153,126 GET CMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Other spc″SIZE 15,84@ PIXELS 90,152 SAY ″Matches″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1@ PIXELS 171,126 GET Imatch STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Incyte″ SIZE 15,65 CO@ PIXELS 252,137 GET initiate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1@ PIXELS 252,236 GET terminate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1@ PIXELS 252,35 SAY ″Include clones″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1@ PIXELS 252,215 SAY ″->″ STYLE 65536 FONT ″Geneva″,14 COLOR 0,0,-1,-1,-1,-1 @ PIXELS 198,126 GET PTF STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C .Print to file″SIZE 15,9@ PIXELS 90,9 TO 181,109 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1 @ PIXELS 90,288 TO 181,397 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 81,296 SAY ″Background″STYLE 65536 FONT ″Geneva″,270 COLOR 0,0,-1,-1,-1,-1.@ PIXELS 45,135 GET ANAL STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Overall;Function″ SIZE 4@ PIXELS 81,26 SAY ″Target″ STYLE 65536 FONT ″Geneva″,270 COLOR 0,0,-1,-1,-1,-1@ PIXELS 108,20 GET target1 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 135,20 GET target2 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 162,20 GET target3 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 108,299 GET object1 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 135,299 GET object2 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 162,299 GET object3 STYLE 0 FONT ″Geneva″,9 SIZE 12,79 COLOR 0,0,-1,-1,-1,-1@ PIXELS 276,324 GET Bail STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Rum;Bail out″SIZE 4112** EOFSubtraction 2.fmt IF Bail=2 CLEAR CLOSE DATABASES USE ″SmartGuyFoxBASE+/Macfox filesclonea.dbf″ SET SAFETT ON SCREEN 1 OFF RETURNENDIF STORE VAL(SYS(2)) TO STARTIME STORE UPPER(Target1) TO Target1 STORE UPPER(Target2) TO Target2 STORE UPPER(Target3) TO Target3 STORE UPPER(Object1) TO Object1 STORE UPPER(Object2) TO Object2 STORE UPPER(Object3) TO Object3 clear SET TALX ON GAP=TERMINATE-INITIATE+1 GO INITIATE COPY NEXT GAP FIELDS NUMBER,library,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,START,RFEND,I TO TEMPNUM USE TEMPNUM CCONT TO TOT COPY TO TEMPRED FOR D=′E′,OR.D=′O′.OR.D=′H′.OR.D=′N′.OR.D=′I′ USE TEMPRED . IF Ematch=0 .AND. Hmatch=0 .AND. Omatch=0 .AND. IMATCH=0 COPY TO TEMPDESIG ELSE COPY STRUCTURE TO TEMPDESIG USE TEMPDESIG IF Ematch=1 APPEND FROM TEMPNUM FOR D=′B′ ENDIF IF Hmatch=1 APPEND FROM TEMPNUM FOR D=′H′ ENDIF IF Omatch=1 APPEND FROM TEMPNUM FOR D=′O′ ENDIF IF Imatch=1 APPEND FROM TEMPNUM FOR D=′I′.OR.D=′X′ *.OR.D=′N′ ENDIF ENDIF COUNT TO STARTOT COPY STRUCTURE TO TEMPLIB USE TEMPLIB APPEND FROM TEMPDESIG FOR library=UPPER(target1) IP target2′ ′ APPEND FROM TEMPDESIG FOR library=UPPER(target2) ENDIF IF target3<>′ ′ APPEND FROM TEMPDESIG FOR library=DPPER(target3) ENDIF COUNT TO ANALTCT USE TEMPDESIG COPY STRUCTURE TO TEMPSUB USE TEMPSUB APPEND FROM TEMPDESIG FOR library=UPPER(Object1) IP target2′′ APPEND FROM TEMPDESIG FOR library=UPPER(Object2) ENDIF IF target3′′ APPEND FROM TEMPDESIG FOR library=UPPER(Object3) ENDIF COUNT TO SUBTRACTOT SET TALX OFF ******************************************************************** * COMPRESSION SUBRCUTINE A ?′COMPRESSING QUERY LIBRARY′ USE TEMPLIBSORT ON ENTRY,NUMBER TO LIBSORTUSE LIBSORTCOUNT TO IDGENEREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=IDGENE PACK COUNT TO AUNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASTORE D TO DESIGASW=0DO WHILE SW=0 TESTSXIPSTORE ENIRY TO TESTBSTORE D TO DESIGB IF TESTA=TESTB,AND.DESIGA=DESIGB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACR RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO.TESTLOOPENDDO ROLLSORT ON RFEND/D,NUMBER TO TEMPTARSORTUSE TEMPTARSORT*REPLACE ALL START WITH RFEND/IDGENE=10000COUNT TO TEMPTARCO****************************************************************** COMPRESSION SUBRCUTINE 3? ′COMPRESSING TARGET LIBRARY′USE TEMPSUBSORT ON ENTRY,NUMBER TO SUBSORTUSE SUBSORTCOUNT TO SUBGENEREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=SUBGENE PACKCOUNT TO BUNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENIRY TO TESTASTORE D TO DESIGASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTESTORE D TO DESIGB IF TESTA=TESTB.AND.DESIGA=DESIGBDELETE DUP=DUP+1 LOOP ENDIF GO MARK1 REPLACE RFEND WITH DUP MARK1=MARK1+DUP SW=1 LOOP ENDDO TEST LOOP ENDDO ROLL SORT ON RFEND/D,NUMBER TO TEMPSUBSORT USE TEMPSUBSORT *REPLACE ALL START WITH RFEND/IDGENE*10000 COUNT TO TEMPSUBCO ******************************************************************* *FUSION ROUTINE ?′SUBTRACTING LIBRARIES′ USE SUBTRACTION COPY STRUCTURE TO CRUNCHER SELECT 2 USE TEMPSUBSORT SELECT 1 USE CRUNCHER APPEND FROM TEMPTARSORT COUNT TO BAILOUT MARK=0 DO WHILE .T. SELECT 1 MARK=MARK+1 IF MARK>BAILOUT EXIT ENDIF GO MAR STORE ENTRY TO SCANNER SELECT 2 LOCATE FOR ENTRY=SCANNER IF FOUND( ) STORE RFEND TO BIT1 STORE RFEND TO BIT2 PLSE STORE 1/2 TO BIT1 STORE 0 TO BIT2 ENDIF SELECT 1 REPLACE BGFREQ WITH BIT2 REPLACE ACTUAL WITH BIT1 LOOP ENTDO SELECT 1 REPLACE ALL RATIO WITH RFEND/ACTUAL ? ′DOING PINAL SORT BY RATIO′ SORT ON RATIO/D,BGFREQ/D,DESCRIPTOR TO FINAL USE FINAL ************************************************************** set talk off DO CASE CASE PTF=0 SET DEVICE TO PRINT SET PRINT ON ELECT CASE PIF=1 SET ALTERNATE TO ″Adenoid.Patent FiguresSubtraction.txt″SET ALTERNATE ONENDIASESTORE VAL(SYS(2)) TO FINTIMEIF FINTIME<STARTIMESTORE FINTINE+86400 TO FINTIMEENDIFSTORE FINTIME-STARTIME.TO COMPSECSTORE COMPSEC/60 TO COMPMIN********************SET MARGIN TO 10@1,1 SAY ″Library Subtraction Analysis″STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,0,-1,-1,-1?????date()??′ ′??TIME()?′Clone numbers′??STR(INTTIATE,5,0)??STR(TERMINATE,6,0)?′Libraries′?Target1IF Target2′??′,′??Target2ENDIFIF Target3′??′,′??Target3ENDIF?′Subtracting?Object1IF Object2<>′??′,′??Object2ENDIFIF Object3<>′??′,′??Object3ENDIF ?′Designationser′IF Ematch=0.AND.Hmatch=0.AND.Omatch=0.AND.IMATCH=0??′All′ENDIFIF Ematch=1??′Exact,′ENDIFIF Hmatch=1??′Human,′ENDIFIF Omatch=1??′Other sp.′ENDIFIF Imatch=1??′INCYTE′ENDIFIF ANAL=1?′Sorted by ABUNDANCE′ENDIFIF ANAL=2?′Arranged by FUNCTION′ENDIF?′Total clones represented′??STR (TOT,5,0)?′Total clones analyzed′??STR(STARTOT,5,0)?′Total. computation.time??STR(COMPMING,5,2)??′minutes′??′d=designation f=distribution z=location r=function s=species i=inte?*******************************************SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,9 COLOR 0,0,0,DO CASECASE ANAL=1??STR(AUNTQUE,4,0)??′genes,for a total of ′??STR(ANALTOT,4,0)??′clones′?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 FIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fiels number ,D,F(xiàn),Z,R,ENTRY,S,DESORIPTOR,RFEND,RATIO,ISET PRINT OFFCLOSE DATABASESUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf′CASE.ANAL=2* arrang3/functionSET PRINT ONSET HEADING ONSOREEN 1 TYPE.0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 FIXELB FONT ″Helvetica″,268 COLOR 0??′ BINDING PROTEINS′?SCREEN1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE,482 PIXELS FONT ″Helvetica″,265 COLOR 0?′Surface molscules and receptors′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT” AT 40,2 SIZE 286,492 PIXELS SONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESORIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′B′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS .FONT ″Helvetica″,265 COLOR 0?′Calcium-binding proteins′SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′C′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Ligands and effectors′ SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND;RATIO,I FOR R=′S′SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Other binding protains′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′I′?SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0? ′ ONCOGENES′?SCREEN 1 TYPE 0 HEADING ′Screen 1′ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′General oncogenes′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0 0,list OFF fields number ,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′O′SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′GTP-binding proteins′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′G′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT “Helvetica”,265 COLOR 0?′Viral elements′Page,7 of 38SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIZELS FONT ″Geneva,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′V′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,255 COLOR 0?′Kinases and Phosphatases′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFIXD,RATIO,I FOR R=′Y′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Tumor-related antigens′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geveva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′A′?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0?′ PROTEIN SYNTHETIC MACHINERY PROTEINS′?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Transcription and Numcleic Acid-binding proteins′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′D′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ 265 COLOR 0?′Translation′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′T′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Riboscmal proteins′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 285,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFENT,RATIO,I FOR R=′R′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Protein processing′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RATIO,I FOR R=′L ′?SCREEN 1 TYPE 0 HEADING ′Screen 1′ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ ,268 COLOR 0??′ ENZYMES′?SCREEN 1 TYPE 0 HEADING ′Screen 1′AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″ 265 COLOR 0?′Ferroproteins′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′F′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetice″,265 COLOR 0?′Proteases and innibitors′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,3 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,P,Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′P′SCREEN 1 TYPE 0 HEADUBG ″Screen 1″ AT 40,2 SIZE 296,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Oxidative phosphorylation′ SCREEN 1 TYPE HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′Z′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Sugar metabolism′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′Q′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,255 COLOR 0?′Amino acid metabolism′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′M′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,?′Nucleic acid metabolism′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 FIXELS FONT ″Geneva″,7 COLOR 0,0,0list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′N′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIZELS FONT ″Helvetica″,265 COLOR O?′Lipid metabolism′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′W′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Other snzymss′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′E′?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,268 COLOR 0?? MISCELLANEOUS CATEGORIES′?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Stress response′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′H′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Structural′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′K′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Other clones′SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0list OFF fields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′X′SCREEN 1 TYPE 0 HEADING ″Screen 1″SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Helvetica″,265 COLOR 0?′Clones of unknow function′SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list OFF fiields number,D,F(xiàn),Z,R,ENTRY,S,DESCRIPTOR,BGFREQ,RFEND,RATIO,I FOR R=′U′ENDCASEDO ″Test print.prg″SET PRINT OFFSET DEVICE TO SCREENCLOSE DATABASESERASE TEMPLIB,DBFERASE TEMPNUM,DBFERASE TEMPDESIG,DBFSET MARGIN TO 0CLEARLOOPENDDO″Northern (single),version 11-25-94close databasesSET TALX OFFSET PRINT OFFSET EXACT OFFCLEAESTORE ′ ′TO EobjectSTORE′STORE 0 TO NumbSTORE 0 TO ZogSTORE 1 TO BailDO WHILE .T.*Program.Northern(single).fmt*Date....8/8/94* Version..FoxBASE+/Mac,revision 1.10* Notes....Format file Northern (single)*SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT″Geneva″,12 COLOR 0,0,0@ PIXELS 15,81 TO 46,397 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 89,79 TO 192,422 STYLE 28447 COLOR 0,0,0,-25600,-1,-1@ PIXELS 115,98 SAY ″Entry #″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1@ PIXELS 115,173 GET Eobject STYLE 0 FONT ″Geneva″,12 SIZE 15,142 COLOR 0,0,0,-1,-1,-1@ PIXELS 145,89 SAY ″Description″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1 @ PIXELS 145,173 GET Dobject STYLE 0 FONT ″Geneva″,12 SIZE 15,241 COLOR 0,0,0,-1,-1,-1@ PIXELS 35,89 SAY ″Single Northern search screen″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-@ PIXELS 220,162 GET Eail STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*R Continue;Bail out″ SIZE@ PIXELS 175,98 SAY ″Clone #″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1@ PIXELS 175,173 GET Numb STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-1@ PIXELS 80,152 SAY ″Enter any ONE of the following″ STYLE 65536 FONT ″Geneva″,12 COLOR -1,**EOFNorthern(single),fmtREADIF Bail=2CLEARscreen 1 offRETURNINDIFUSE ″SmartGuyFoxBASE+/MacFox filesLookup,dbf″SET TALK ONIF Eobjeot′STORE UPPER(Eobject) to EobjectSET SAFETY OFFSORT ON Entry TO ″Lookup entry,dbf″SET SAFETY ONUSE ″Lookup entry,dbf″LOCATE FOR Look=EobjectIF .NOT,F(xiàn)OUNDCLEARLOOPENDIFEROWSESTORE Entry TO SearchvalCLOSE DATABASESERASE ″Lookup entry,dbf″ENDIFIF Dobject′SET EXACT OFFSET SAFETY OFFSORT ON descriptor TO ″Lookup descriptor.dbf″SET SAFETY OnUSE ″Lookup descriptor,dbf″LOCATE FOR UPPER(TRIM(descriptor))=UPPER(TRIM(Dobject)) IF .NOT.FOUND( )CLEARLOOPENDIFEROWSESTORE Emtry TO SearchvalERASE ″Lookup descriptor,dbf″SET EXACT ONENDIFIF Numb0USE ″SmartGuyFoxBASE+/MacFox filesclones,dbf″Go NumbBROWSESTORE Entry TO SearchvalENDIFCLEAR?′Northern enalysis for entry′??Searchval??′Enter Y to proceedWAIT TO OKCLEARIF UPPER(OK)′Y′screen 1 offRETURNENDIF* COMPRESSION SUBROUTINE FOR Library,dbf?′Compressing the Libraries file now...′USE ″SmartGuyFoxBASE+/MacFox fileslibraries.dbf′SET SAFETY OFFSORT ON library TO ′Compressed libraries.dbf″* FOR entered>0SET SAFETY ONUSE ″Compressed libraries.dbf″DELETE FOR entered=0PACKCOUNT TO TOTMARK1=1SW2=0 DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK SW2=1 ENDIFGO MARK1STORE library TO TESTASKIPSTORE Library TO TESTBIF TESTA=TESTBDELETEENDIFMARK1=MARK1+1LOOPENDDO ROLL* Northern analysisCLEAR?′Doing the northern now...SET TALK ONUSE ″SmartGuyFoxBASE+/MacFox filesclones.dbf″SET SAFETY OFFCOPY TO ″Hits.dbf″entry=searchvalSET SAFETY ON* MASTER ANALYSIS 3;VERSION 12-9-94* Master menu for analysis outputCLOSE DATABASESSET TALK OFFSET SAFETY OFFCLEARSET DEVICE TO SCREENSET DEFALLT TO ″SmartGuyFoxBASE+/Macfox filesOutput programs″USE ″SmartGuyFoxBASE+/Macfox filesClones.dbf″GO TOPSTORE NUMBER TO INITIATEGO BOTTOMSTORE NUMBER TO TERMINATESTORE 0 TO ENTIRESTORE 0 TO CONDENSTORE 0 TO ANALSTORE 0 TO EMATCHSTORE 0 TO HMATCHSTORE 0 TO OMATCHSTORE 0 TO IMATCHSTORE 0 TO XMATCHSTORE 0 TO PRINTONSTORE 0 TO PTFDO WHILE .T.*Program.Master analysis.fmt* Date....12/9/94* Version.FoxBASE+/Mac,revision 1.10* Notes....Format file Master analysis*SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Ganeva″,9 COLOR 0,0,0,@ PIXELS 39,255 TO 277,430 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 75,120 TO 178,241 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 27,98 SAY ″Customized Output Menu″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-1,-1,-1@ PIXELS 45,54 GET conden STYLE 65536 FONT “Chicago”,12 PICTURE ″@*C Condensed format″ SIZE@ PIXELS 54,261 GET anal STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*RV Sort/number;Sort/entry;@ PIXELS 117,126 GET EMATCH STYLE 65536 FONT ″Chicago″ ,12 PICIURE ″@*C Exact″SIZE 15,62 CO@ PIXELS 135,126 GET HMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Homologous″ SIZE 15,1@ PIXELS 153,126 GET OMATCH STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Other spc″ SIZE 15,84@ PIXELS 90,152 SAY ″Matches″ STYLE 65536 FONT ″Geneva″,268 COLOR 0,0,-1,-1,-1,-1@ PIXELS 63,54 GET PRINTON STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Include clone listing″@ PIXELS 171 126 GET Imatch STYLE 65536 FONT ″Chicago″ ,12 PICTURE ″@*C Incyte″ SIZE 15,65 CO@ PIXELS 252 146 GET initiate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1@ PIXELS 270 146 GET terminate STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1@ PIXELS 234,134 SAY ″Include clones″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1@ PIXELS 270 125 SAY ″->″ STYLE 65536 FONT ″Geneva″,14 COLOR 0,0,-1,-1,-1,-1@ PIXELS 198 126 GET PIF STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*C Print to file″ SIZE 15,9@ PIXELS 189 0 TO 257,120 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 209 8 SAY ″Library selection″ STYLE 65536 FONT ″Geneva″,266 COLOR 0,0,-1,-1,-1,-1@ PIXELS 227 18 GET ENTIRE STYLE 65536 FONT ″Chicago″,12 PICTURE ″@*RV All;Selected″ SIZE 16** EOFMaster analysis.fmtREAD IF ANAL=9 CLEAR CLOSE DATAEASES ERASE TEMPMASTER,DBF USE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″ SET SAFETY ON SCREEN 1 OFF RETURN ENDIFclear?INITIATE?TERMINATE?CONDEN?ANAL?ematch?Hmatch?Cmatch?IMATCHSET TALK ON IF ENTIRE=2USE ″Unique libraries.dbf″ REPLACE ALL i WITH′ BROWSE FIELDS i,libname,library,total,entered AT 0,0 ENDIFUSE ″SmartGuyFoxBASE+/Macfox filesclcnes.dbf″* COPY TO TEMPNUM FOR NUMBER>=INITIATE,AND.NUMBER<=TERMINATE* USE TEMPNUMCOPY STRUCTURE TO TEMPLIBUSE TEMPLIB IF ENTIRE=1 APPEND FROM ″SmartGuyFoxBASE+/Macfox filesClones.dbf″ ENDIF IF ENTIRE=2USE ″Unique libraries,dbf″ COPY TO SELECTED FOR UPPER (i)=′Y ′ USE SELECTED STORE RECCOUNT() TO STOPIT MARK=1 DO WHILE ,T, IF MARK>STOPIT CLEAR EXIT ENDIF USE SELECTED GO MARK STORE library TO THISONE ?′COPYING′ ??THISONE USE TEMPLIB APPEND FROM ″SmartGuyFoxBASE+/Macfox filesClones,dbf″ FOR library=THISONE STORE MARK+1 TO MARK LOOP ENDDO ENDIFUSS “SmartGuyFoxBASE+/Macfox filesclones.dbf″COUNT TO STARTOTCOPY STRUCTURE TO TEMPDESIGUSE TEMPDESIG IF Ematch=0.AND.Hmatch=0.AND.IMATCH=0 APPEND FROM TEMPLIB ENDIF IF Ematch=1 APPEND FROM TEMPLIB FOR D=′E′ ENDIF IF Hmatch=1 APPEND FROM TEMPLIB FOR D=′H′ ENDIF IF Omatch=1 APPEND FROM TEMPLIB FOR D=′O′ ENDIF IF Imatch=1 APPEND FROM TEMPLIB FOR D=′I′ .OR,D=′X′ ,OR,D=′N′ ENDIF IF Xmatch=1 APPEND FROM TEMPLIB FOR D=′X′ ENDIFCOUNT TO ANALTOTset talk off*********************************DO CASECASE PTF=0SET DEVICE TO PRINTSET PRINT ONCASE PTF=1SET ALTERNATE TO ″Total function sort.txt″*SET ALTERNATE TO ″H and O function sort.txt″*SET ALTERNATE TO ″Shear Stress HUVEC 2Abundance sort.txt″*SET ALTERNATE TO ″Shear Stress HUVEC 2Abundnce con.txt″*SET ALTERNATE TO ″Shear Stress HUVEC 2Function sort.txt″*SET ALTERNATE TO ″Shear Stress HUVEC 2Distribution sort.txt″*SET ALTERNATE TO ″Shear stress HUVEC 1Clone list.txt″*SET ALTERNATE TO ″Shear Stress HUVEC 2Location sort.txt″SET ALTERNATE ONENDCASE******************************IF PRINTON=1@1,30 SAY ″Database Subset Analysis″ STYLE 65536 FONT ″Ganeva″,274 COLOR 0,0,0,-1,-1,-1ENDIF?????date??′ ′????TIME()?′Clone numbers′??STR(INITIATE,6,0)??′through′??STR(TERMINATE,6,0)?′Libraries′IF ENTIRE=1?′All libraries′ENDIFIF ENTIRE=2 MARK=1 DO WHILE .T. IF MARK>STOPIT EXIT ENDIF USE SELECTED GO MARK ? ′′ ??TRIM (libname) STORE MARK+1 TO MARK LOOP ENDDOENDIF?′Desionations′IF Ematch=0 .AND. Hmatch=0 .AND. Omatch=0 .AND. IMATCH=0??′All′ENDIFIF Ematch=1?? ′Exact,′ENDIFIF Hmatch=1??′Human,′ENDIF IF Omatch=1??′Other sp. ′ENDIFIF Imatch=1??′INCYTE′ENDIFIF Xmatch=1??′EST′ENDIFIF CCNDEN=1?′Condensed format analysis′ENDIFIF ANAL=1?′Sorted by NUMBER′ENDIFIF ANAL=2?′Sorted by ENTRY′ENDIF IF ANAL=3?′Arranged by ABUNDANCE′ENDIFIF ANAL=4?′Sorted by INTEREST′ENDIFIF ANAL=5?′Arranged by LOCATION′ENDIF IF ANAL=6?′Arranged by DISTRIBUTION′ENDIFIF ANAL=7?′Arranged by FUNCTION′ENDIF?′Total clones represented′??STR(STARTOT,6,0)?′Tocal clones analyzed′??STR(ANALTOT,6,0)??′l=library d=designation f=distributicn z=location r=function c=cer?*****************************************************************************USE TEMPDESIGSCREEN 1 TYPE 0 HEADING ″Screen 1DO CASECASE ANAL=1* sort/numberSET HEADING ONIF CONDEN=1SORT TO TEMP1 ON ENTRY,NUMBERDO ″COMPRESSION number.PRG″ELSESORT TO TEMP1 ON NUMBERUSE TEMP1list off fields number,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR*list off fields number,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,ICLOSE DATABASESERASE TEMP1.DBFENDIFCASE ANAL=2* sort/DESCRIPTORSET HEADING ON*SORT TO TEMP1 ON DESCRIPTOR,ENTRY,NUMBER/S for D=′E′,OR.D=′H′,OR.D=′O′,OR,D=′X′.OR.D=′I′*SORT TO TEMP1 ON ENTRY,DESCRIPTOR,NUMBER/S for D=′E′.OR.D=′H′,OR.D=′O′.OR.D=′X′.OR.D=′I′SORT TO TEMP1 ON ENTRY,START/S for D=′E′.OR.D=′H′ .OR.D=′O′ .OR.D=′X′.OR.D=′I′IF CONDEN=1DO ″COMPRESSION entry.PRG″ELSEUSE TEMP1list off fields number,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,ICLOSE DATABASESERASE TEMP1.DBFENDIFCASE ANAL=3″sort by abundanceSET HEADING ONSORT TO TEMP1 ON ENTRY,NUMBER for D=′E′.OR.D=′H′.OR.D=′O′.OR.D=′X′.OR.D=′I′DO ″COMPRESSION abundance.PRG″CASE ANAL=4* sort/interestSET HEADING ONIF CONDEN=1SORT TO TEMP1 ON ENTRY,NUMBER FOR I>0DO ″COMPRESSION interest.PRG″ELSESORT ON I/D,ENTRY TO TEMP1 FOR I>1USE TEMP1list off fields number,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,RFEND,INIT,ICLOSE DATABASESERASE TEMP1.DBFENDIFCASE ANAL=5* arrange/locationSET HEADING ONSTORE 4 TO AMPLIFIER?′Nuclear′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Cytoplasmic′SORT ON ENIRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location,prg″ELSEDO ″Ncrmal subroutine 1″ENDIF?′Cytoskeleton′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Cell surface′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″DO ″Normal subroutine 1″ENDIF?′Intracellular membrane′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutino 1″ENDIF?′Mitochondrial′SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Secreted′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Other′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Unknown′SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression location.prg″ELSEDO ″Normal subroutine 1″ENDIFIF CONDEN=1SET DEVICE TO PRINTERSET PRINTER ONELECTDO ″Output heading.prg″USE ″Analysis location.dbf″DO ″Create bargraph.prg″SET HEADING OFF?′FUNCTIONAL CLASS TOTAL UNIQUE NEW % TOTAL′?LIST OFF FIELDS Z,NAME,CLONES,GEMES,NEW,PERCENT,GRAPHCLOSE DATABASESERASE TEMP2.DBFSET HEADING ON*USE ″SmartGuyFoxBASE+/Macfox filesTEMPMASTER.dbf″ENDIFCASE ANAL=6* arrange/distributionSET HEADING ONSTORE 3 TO AMPLIFIER?′Cell/tissue specific distribution′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression distrib.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Non-specifio distribution′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression distrib.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Unknown digtribution′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIP CONDEN=1DO ″Compression distrib.prg″ELSEDO ″Normal subroutine 1″ENDIFIF CONDEN=1SET DEVICE TO PRINTERSET PRINTER ONEJECTDO ″Output heading.prg″USE ″Analysis distribution.dbf″DO ″Create bargraph.prg″SET HEADING OFF?′FUNCTIONAL CLASS TOTAL UNIQUE * TOTAL′?LIST OFF FIELDS P,NAME,CLONES,GENES,PERCENT,GRAPHCLOSE DATABASESERASE TEMP2.DBFSET HEADING OF*USE ″SmartGuyFoxBASE+/Macfox filesTEMPMASTER.dbf″ENDIFCASE ANAL=7* arrange/functionSET HEADING ONSTORE 10 TO AMPLIFIER?′ BINDING PROTEINS ′??′Surface molecules and receptors′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEELSEDO ″Normal subroutine 1″ENDIF?′Calcium-binding proteins′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR, LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Ligands and effectors′SORT ON ENTRY,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ′Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Other binding proteins′SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF*EJECT?′ ONCOGENES′??′General oncogenes′SORT ON ENTRY,NUMBER FIELDS,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prgELSEDO ″Normal subroutine 1″ENDIF?′GTP-binding proteins′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Viral elements′SORT ON ENTRY,NUMEBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Kinases and Phosphatases′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Tumor-related antigens′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF*EJECT?′PROTEIN SYNTHETIC MACHINERY PROTEINS′??′Transcription and Nucleic Acid-binding proteins′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Translation′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Riboscmal proteins′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Protein processing′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF*EJECT?′ENZYMES′??′Ferroproteins′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Proteases and inhibitors′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Oxidative phosphorylation′SORT ON ENTRY,NUMEBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Sugar metabolism′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Amino acid metabolism′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression funotion.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Nucleic acid metabolism′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ′Normal subroutine 1″ENDIF?′Lipid metabolism′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Other enzymes′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF*EJECT?′ MISCELLANEOUS CATEGORIES′??′Stress response′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Structural′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression runcticn.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Other clones′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression function.prg″ELSEDO ″Normal subroutine 1″ENDIF?′Clones of unknow function′SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,COMMENIF CONDEN=1DO ″Compression functicn.prg″ELSEDO ″Normal subroutine 1″ENDIFIF CONDEN=1* SET DEVICE TO PRINTER*SET PRINT ONDO ″Output heading.prg″***USE ″Analysis function.dbf″DO ″Create bargraph.prg″SET HEADING OFF***SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,12 COLOR 0,0,0***?′TOTAL TOTAL NEW DIST?′ FUNCTIONAL CLASS CLONES GENES GENES FUNCTIONAL CLASS′?′****LIST OFF FIELDS P,NAME,CLONES,GENES,NEW,PERCENT,GPAPH,COMPANYLIST OFF FIELDS P,NAME,CLONES,GENES,NEW,PERCENT,GRAPHCLOSE DATABASESERASE TEMP2.DBFSET HEADING ON*USE ″SmartGuyFoxBASE+/Macfox filesTEMPMASTER,dbf″ENDIFCASE ANAL=8DO ″Subgrcup summary 3.prg″ENDCASEDO ″Test print.prg″SET PRINT OFFSET DEVICE TO SCREENCLOSE DATABASES*ERASE TEMPLIB,DBF*ERASE TEMPNUM,DBF*ERASE TEMPDESIG,DBF*ERASE SELECTED,DBFCLEARLOOPENDDO* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1 COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE COUNT TO NEWGENES FOR D=′H′.OR.D=′O′ SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1.REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLLGO TOPSTORE Z TO LOCUSE ″Analysis location.dbf″LOCATE FOR Z=LOCREPLACE CLONES WITH TOTREPLACE GENES WITH UNIQUEREPLACE NEW WITH NEWGENESUSE TEMP1SORT ON RFEND/D TO TEMP2USE TEMP2??STR(UNIQUE,5,0)??′genes,for a total of′??STR(TOT,5,0)??′.clones′?′ V Coincidence′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I*SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE TEMPDESIG* COMPRESSION SUEROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1 >=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLL* BROWSE*SET PRINTER ONSORT ON DATE TO TEMP2USE TEMP2??STR(UNIQUE,4,0)??′genes,for a total of′??STR(TOT,4,0)??′clones′??′ V Coincidence′COUNT TO P4 FOR I=4IF P4>0? STR(P4,3,0)??′genes with priority=4 (Secondary analysis)′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=4?ENDIFCOUNT TO P3 FOR I=3IF P3>0?STR(P3,3,0)??′genes with priority=3(Full insert sequence)′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=3ENDIFCOUNT TO P2 FOR I=2.IF P2>0?STR(P2,3,0)??′genes with priority=2 (Primary analysis complete)′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=2?ENDIFCOUNT TO P1 FOR I=1IF P1>0?STR(P1,3,0)??′genes with priority=1 (Primary analysis needed)′list off fields number,RFEND,L,D,P,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT for I=1ENDIF*SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1 >=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLL* BROWSE*SET PRINTER ONSORT ON NUMBER TO TEMP2USE TEMP2??STR(UNIQUE,4,0)??′genes,for a total of′??STR(TOT,5,0)??′clones′?′V Coincidence′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I*SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE COUNT TO NEWGENES FOR D=′H′.OR.D=′O′ SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK 1 REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLLGO TOPSTORE R TO FUNEUSE ″Analysis function.dbf″LOCATE FOR P=FUNERFPLACE CLONES WITH TOTREPLACE GENES WITH UNIQUEREPLACE NEW WITH NEWGENES.USE TEMP1SORT ON RFEND/D TO TEMP2USE TEMP2SET HEADING ON??STR(UNIQUE,5,0)??′genes,for a total of ′??STR(TOT,5,0)??′clones′***?′ V Coincidence′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I****SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT″Geneva″,12 COLOR 0,0,* list off fields RFEND,S,DESCRIPTOR* SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE TEMPDESIG* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP 1COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLLGO TOPSTORE F TO DISTUSE ″Analysis distribution.dbf″LOCATE FOR P=DISTREPLACE CLONES WITH TOTREPLACE GENES WITH UNIQUEUSE TEMP1sort on rfend/d to TEMP2USE TEMP2??STR(UNIQUE,5,0)??′genes,for a total of ′??STR(TOT,5,0)??′clones′?′ V Coincidence′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I* SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE TEMPDESIG* COMPPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1COUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENIRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE.RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLLGO TOPUSE TEMP1??STR(UNIQUE,5,0)??′genes,for a total of ′??STR(TOT,5,0)??′clones′?′ V Coincidence′list off fields number,RFEND,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I*SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFUSE TEMPDESIG* COMPRESSION SUEROUTINE FOR ANALYSIS PROGRAMSUSE ″SmartGuyFoxBASE+/Macfox filesClones.dbf″COPY TO TEMP1 FORUSE TEMP1COUNT TO IDGENE FOR D=′E′.OR.D=′O′.OR.D=′H′.OR.D=′N′.OR.D=′R′.OR.D=′A′DELETE FOR D=′N′ .OR.D=′D′ .OR.D=′A′ .OR.D=′U′ .CR.D=′S′ .OR.D=′M′ .OR.D=′R′ .OR.D=′V′PACKCOUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTB IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLL*BROWSE*SET PRINTER ONSORT ON RFEND/D,NUMBER TO TEMP2USE TEMP2REPLACE ALL START WITH RFEND/IDGENE*10000??STR(UNIQUE,5,0)??′genes,for a total of′??STR(TOT,5,0)??′clones′?′Coincidence V V Clones/10000′set heading offSCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,?COLOR 0,0,0,list fields number,RFEND,START,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR,INIT,I* SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″* COMPRESSION SUBROUTINE FOR ANALYSIS PROGRAMSUSE TEMP1COUNMT TO IDGENE FOR D=′E′’,OR,D=′H′,OR,D=′N′.OR.D=′A′DELETE FOR D=′N′ .OR.D=′D′ .OR.D=′A′ .OR.D=′U′ .OR.D=′S′ .OR.D=′M′ .OR.D=′R′ .OR.D=′V′PACKCOUNT TO TOTREPLACE ALL RFEND WITH 1MARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK COUNT TO UNIQUE SW2=1 LOOP ENDIFGO MARK1DUP=1STORE ENTRY TO TESTASW=0DO WHILE SW=0 TESTSKIPSTORE ENTRY TO TESTE IF TESTA=TESTB DELETE DUP=DUP+1 LOOP ENDIFGO MARK1REPLACE RFEND WITH DUPMARK1=MARK1+DUPSW=1LOOPENDDO TESTLOOPENDDO ROLL*BROWSE*SET PRINTER ONSORT ON RFEND/D,NUMBER TO TEMP2USE TEMP2REPLACE ALL START WITH RFEND/IDGENE*10000??STR(UNIQUE,5,0)??′genes,for a total of ′??STR(TOT,5,0)??′clones′?′Coincidence VV Clones/10000′set heading offSCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,list fields number,RFEND,START,L,D,F(xiàn),Z,R,C,ENTRY,S,DESCRIPTOR;INIT,I*SET PRINT OFFCLOSE DATABASESERASE TEMP1.DBFERASE TEMP2.DBFUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″USE TEMP1COUNT TO TOT??′Total of′?? STR(TOT,4,0)??′clones′?*list off fields number,L,D,F(xiàn),Z,R,C,ENTRY,DESCRIPTOR,LENGTH,RFEND,INIT,Ilist off fields number,L,D,F(xiàn),Z,R,C,ENTRY,DESCRIPTORCLOSE DATABASESERASE.TEMP1.DBFUSE TEMPDESIG* Lifescan menu;version 8-7-94SET TALK OFFset cevice to screenCLEARUSE ″SmartGuyFoxBASE+/Macfox filesclones.dbf″STORE LUPDATE() TO UpdateGO BOTTOMSTORE RECNO() TO cloneoSTORE 6 TO ChooserDO WHILE .T.* Program.Lifeseq menu.fmt* Date....1/11/95* Version.FoxEASE+/Mac,revision 1.10*Notes....Formatt file Lifeseq menu*SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,268 COLOR 0,0,@ PIXELS 18,126 TO 77,365 STYLE 28479 COLOR 32767,-25600,-1,-16223,-16721,-15725@ PIXELS 110,29 TO 188,217 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 45,161 SAY ″LIFESEQ″STYLE 65536 FONT ″Geneva″,536 COLOR 0,0,-1,-1,7135,5884@ PIXELS 36,269 SAY ″TM″STYLE 65536 FONT ″Geneve″,12 COLOR 0,0,-1,-1,7135,5884@ PIXELS 63,143 SAY ″Molecular Biology Desktop″ STYLE 65536 FONT ″Helvetica″,18 COLOR 0,0,0,@ PIXELS 90,252 TO 251,467 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 117,270 GET Chooser STYLE 65536 FONT ″Chicago″,12 PICTURE ″G+RV Transcript profiles@ PIXELS 135,128 SAY Update STYLE 0 FONT ″Geneva″,12 SIZE 15,79 COLOR 0,0,0,-25600,-1,-1@ PIXELS 171,128 SAY cloneno STYLE 0 FONT ″Geneva″,12 SIZE 15,79 COLOR 0,0,0,-25600,-1,-1@ PIXELS 135,44 SAY ″Last update″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1@ PIXELS 171,44 SAY ″Total clones″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,-1,-1,-1,-1@ PIXELS 45,296 SAY ″v1.30″ STYLE 65536 FONT ″Geneva″,782 COLOR 0,0,-1,-1,-1,-1* EOFLifeseq menu.fmtREADDO CASECASE Chooser=1DO ″SmartGuyFoxEASE+/Macfox filesOutput programsMaster analysis 3.prg″CASE Chooser=2DO ″SmartGuyFoxBASE+/Macfox filesOutput programsSubtraction 2.prg″CASE Chooser=3DO ″SmartGuyFoxBASE+/Macfox filesOutput programsNorthern (single) .prg″CASE Chooser=4USE ″Libraries.dbf″CASE Chooser=5DO ″SmartGuyFoxBASE+/Macfox filesOutput programsSee individual clone.prg″CASE Chooser=6DO ″SmartGuyFoxBASE+/Macfox filesLibrariesOutput programsMenu.prg″CASE Chooser=7CLEARSCREEN 1 OFFENDCASELOOPENDDO@1,30 SAY ″Database Subset Analysis″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,0,-1,-1,-1?????date??′′??TIME?′Clone numbers ′??STR(INITIATE,6,0)??′through′??STR(TERMINATE,6,0)?′Libraries′IF ENTIRE =1?′All libraries′ENDIFIF ENTIRE=2 MARK=1 WHILE .T. IF MARD>STOPIT EXIT ENDIF USE SELECTED GO MARK ???′′ ????TRIM(Libname) STORE MARK+1 TO MARK LOOP ENDDOENDIF?′Desicnations′IF Ematch=0 .AND.Hmatch=0.AND.Omatch=0??′All′ENDIFIF Ematch=1??′Exact,′ENDIFIF Hmatch=1??′Human,′ENDIFIF Omatch=1??′Other sp.′ENDIFIF CONDEN=1?′Condensed format analysis′ENDIFIF ANAL=1?′Sorted by NUMBER′ENDIFIF ANAL=2?′Sorted by ENTRY′ENDIFIF ANAL=3?′Arranged by ABUNDANCE′ENDIFIF ANAL=4?′Sorted by INTERSET′ENDIFIF ANAL=5?′Arranced by LOCATION′ENDIFIF ANAL=6?′Arranged by DISTRIBUTION′ENDIFIF ANAL=7?′Arranged by FUNCTION′ENDIF?′Total clones represented ??STR(STARTOT,6,0)?′Total clones analyzed′??STR(ANALTOT,6,0)??USE TEMP1COUNT TO TOT??′Total of′??STR(TOT,4,0)??′clones′?*list off fields number,L,D,F(xiàn),Z,R,C,DESCRIPTOR,LENGTH,RFEND,INIT,Ilist off fields number,L,D,F(xiàn),Z,R,C,ENTRY,DESCRIPTORCLOSE DATABASESERASE TEMP1.DBFUSE TEMPDESIGUSE TEMP1COUNT TO TOT??′Total of′??STR(TOT,4,0)??′cloces′? *list off fields number,L,D,F(xiàn), Z,R,C,ENTRY,DESCRIPTOR,LENGTH,RFEND,INIT,Ilist off fields number,L,D,F(xiàn),Z,R,C,ENTRY,DESCRIFTORCLOSE DATABASESERASE TEMP1,DBFUSE TEMPDESIG*Northern (single),version 11-25-94close databasesSET TALK OFFSET PRINT OFFSET EXACT OFFCLEARSTORE′ ′TO EobjectSTORE′′TO DobjectSTORE O TO NumbSTORE 0 TO ZogSTORE 1 TO BailDO WHILE .T.* Program.Northern (single).fmt* Date....8/8/94* Version.FoxBASE+/Mac,revision 1.10*Notes....Format file Northern(single)*SCREEN 1 TYPE 0 HEADING ″Screen 1″AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,12 COLOR 0,0,0@ PIXELS 15,81 TO 46,397 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1@ PIXELS 89,79 TO 192,422 STYLE 28447 COLOR 0,0,0,-25600,-1,-1@ PIXELS 115,98 SAY ″Entry#″ STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1@ PIXELS 115,173 GET Eobject STYLE 0 FONT ″Geneva″,12 SIZE 15,142 COLOR 0,0,0,-1,-1,-1@ PIXELS 145,89 SAY ″Description″STYLE 65536 FONT ″Geneva″,12 COLOR 0,0,0,-1,-1,-1@ PIXELS 145,173 GET Dobject STYLE 0 FONT ″Geneva″,12 SIZE 15,241 COLOR 0,0,0,-1,-1,-1@ PIXELS 35,89 SAY ″Single Northern search screen″ STYLE 65536 FONT ″Geneva″,274 COLOR 0,0,-@ PIXELS 220,162 GET Bail STYLE 65536 FONT ″Chicagc”,12 PICTURE ″@*R Continue;Bail out″ SIZE@ PIXELS 175,98 SAY ″Clone #″ STYLE 65536 FONT ″Geneva″;12 COLOR 0,0,0,-1,-1,-1@ PIXELS 175,173 GET Numb STYLE 0 FONT ″Geneva″,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-1@ PIXELS 80,152 SAY ″Enter any ONE of the following″STYLE 65536 FONT ″Geneva″,12 COLOR -1,* EOFNorthern (single).fmtIF Bail=2screen 1 offRETURNENDIFUSE ″SmartGuyFoxBASE+/MacFox filesLookup.dbf″SET TALK ONIF Eobject′ STORE UPPER(Ebject) to EobjectSET SAFETY OFFSORT ON Entry TO ″Lookup entry.dbf″SET SAFETY ONUSE ″Lookup entry,dbf″LOCATE FOR Look=EobjectIF .NOT.FOUNDCLEARLOOPENDIFBROWSESTORE Entry TO Searchval CLOSE DATABASESERASE ″Lookup entry.dbf″ENDIFIF Dobject′SET EXACT OFFSET SAFETY OFFSORT ON descriptor TO ″Lookup descriptor.dbf″SET SAFETY OnUSE ″Lookup descriptor. dbf″LOCATE FOR UPPER (TRIM (descriptor))=OPPER(TRIM(Dobject))IF .NOT.FOUND()CLEARLOOPENDIFBROWSESTORE Entry TO SearchvalCLOSE DATABASESERASE ″Lookup descriptor.dbf″SET EXACT ONENDIFIF Numb0USE ″SmartGuyFoxBASE+/MacFox filesclones,dbf″GO NumbBROWSESTORE Entry TO SearchvalENDIFCLEAR?′Northern analysis for entry′??Searchval??′Enter Y to proceed′WAIT TO OKCLEARIF UPPER(OK) <>′Y′screen 1 offRETURNENDIF* COMPRESSION SUBROUTINE FOR Library,dbf?′Compressing the Lihraries file now...′USE ″SmartGuyFoxBASE+/MacFox fileslibraries.dbf″SET SAFETY OFFSORT ON library TO″Compressed libraries.dbf″*FOR entcred>0SET SAFETY ONUSE ″Compressed libraries.dbf″DELETE FOR entered=0PACKCOUNT TO TOTMARK1=1SW2=0DO WHILE SW2=0 ROLL IF MARK1>=TOT PACK SW2=1 LOOP ENDIFGO MARK1STORE library TO TESTASKIPSTORE Library TO TESTBIF TESTA=TESTBDELETEENDIFMARK1=MARK1+1LOOPENDDO ROLL* Northern analysisCLEAR?′Doing the northern now...′SET TALK ONUSE ″SmartGuyFoxSASE+/MacFox filesclones.dbf″SET SAFETY OFFCOPY TO ″Hits.dbf″ FOR entry=searchvalSET SAFETY ONCLCSE DATABASESSELECT 1USE ″Compressed litraries,dbf″STORE RECCOUNT() TO EntriesSELECT 2USE ″Hits,dbf″Mark=1DO WHILE .T.SELECT 1IF Mark>EntriesEXITENDIFGO MARKSTORE library TO JiggerSELECT 2COUNT TO Zog FOR library=JiggerSELECT 1REPLACE hits with ZogMark=Mark+1LOOPENDDOSELECT 1BROWSE FIELDS LIERARY,LIENAME,ENTERED,HITS AT 0,0CLEAR?′Enter Y to print′WAIT TO PRINSETIF UPPER(PRINSET) = ′Y′SET PRINT ONCLEAREJECTSCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS PONT ″Geneva″,14 COLOR 0,0,0?′DATAEASE ENTRIES MATCHING ENTRY′?? Secrcnval?DATE()?SCREEN 1 TYPE 0 HEADING ″Screen 1″ AT 40,2 SIZE 286,492 PIXELS FONT ″Geneva″,7 COLOR 0,0,0,LIST OFF FIELDS library,libname,entered,hits??SELECT2LIST OFF FIELD NUMBER,LIBRARY,D,S,F(xiàn),Z,R,ENTRY,DESCRIPTOR,RFSTART,START,RFENDSET TALK OFFSET PRINT OFFENDIFCLOSE DATABASESSET TALK OFFCLEARDO ″Test print.prg″RETURN]]></pre>
表6文庫 庫名ADENINB01發(fā)炎的增殖腺ADRENOR01 腎上腺(r)ADRENOT01 腎上腺(Y)AMLBNOT01AML胚細胞(T)BMARNOT01 骨髓BMARNOT02 骨髓(T)CARDNOT01 心肌(T)CHAONOT01中國倉鼠卵巢CORNNOT01角膜基質(zhì)FIBRAGT01成纖維細胞AT 5FIBRAGT02成纖維細胞AT 30FIBRANT01成纖維細胞ATFIBRNGT01成纖維細胞UV 5FIBRNGT02成纖維細胞UV 30FIBRNOT01 成纖維細胞FIBRNOT02成纖維細胞正常HMC1NOT01 肥大細胞系HUVELPB01 HUVECIFN,TNF,LPSHUVENOB01 HUVEC對照HUVESTB01HUVEC剪切變HYPONOB01 下丘腦KIDNNOT01 腎(T)LIVRNOT01 肝(T)LUNGNOT01 肺(T)MUSCNOT01骨胳肌(T)OVIDNOB01 輸卵管PANCNOT01胰腺,正常PTTUNOR01 垂體(r)PITUNOT01 垂體(T)PLACNOB01 胎盤SINTNOT02 小腸(T)SPLNFET01脾+肝,胎兒SPLNNOT02 脾STOMNOT01 胃SYNORAE01 滑膜粘液TBLYNOT01T+B成淋巴細胞TESTNOT01 睪丸THP1NOB01THP-1對照THP1PEB01THP佛波醇THP1PLB01 THP-1佛波醇LPSU937NOT01 U937,單核白細胞號數(shù)文庫 dsizr條目 描述符 rtstar tstart rfend2304U937NOT01EHCCT HUMEF1BElongation factor 1-beta0 0 7733240HMC1NOT01EHCCT HUMEF1BElongation factor 1-beta0 370 7733259HMC1NOT01EHCCT HUMEF1BElorgation factor 1-beta0 371 7734693HMC1NOT01EHCCT HUMEF1BElongation factor 1-beta0 470 7738989HMC1NOT01EHCCT HUMEF1BElongation factor 1-beta0 327 7739139HMC1NOT01EHCCT HUMEF1BElongation factor 1-beta0 375 77權(quán)利要求
1.一種分析含有基因轉(zhuǎn)錄物的樣本的方法,該方法包括下述步驟(a)建立一個生物序列文庫,(b)生成一個轉(zhuǎn)錄物序列的集合,該集合中每一段轉(zhuǎn)錄物序列對應(yīng)文庫中不同生物序列。(c)在一臺已編程的計算機中處理轉(zhuǎn)錄物序列,該計算機中存儲了與參考生物序列對應(yīng)著的參考轉(zhuǎn)錄物序列的數(shù)據(jù)庫,從而對每一段轉(zhuǎn)錄物序列生成一個確定的序列值,每一個上述確定的序列值對應(yīng)一個序列標(biāo)注和一段轉(zhuǎn)錄物序列與至少一段參考轉(zhuǎn)錄物序列之間的匹配程度。(d)處理每一個上述確定的序列值以生成最終數(shù)據(jù)值,它對應(yīng)每一個確定的序列值出現(xiàn)于文庫中的次數(shù)。
2.權(quán)利要求1的方法,其中步驟(a)包括下列步驟獲取mRNA的混合物;制備mRNA的cDNA拷貝;分離受上述cDNA轉(zhuǎn)染的代表性克隆群體,并且從中建立生物序列文庫。
3.權(quán)利要求1的方法,其中的生物序列是cDNA序列。
4.權(quán)利要求1的方法,其中的生物序列是RNA序列。
5.權(quán)利要求1的方法,其中的生物序列是蛋白質(zhì)序列。
6.權(quán)利要求1的方法,其中,所述匹配的第一值表示嚴(yán)格匹配,匹配的第二值表示非嚴(yán)格匹配。
7.一種比較兩種含有基因轉(zhuǎn)錄物的樣本的方法,該方法包括(a)按照權(quán)利要求1的方法分析第一樣本;(b)建立第二生物序列文庫,(c)生成第二轉(zhuǎn)錄物序列集合,該集合中的每一段轉(zhuǎn)錄物序列對應(yīng)于上述第二文庫中不同生物序列之一;(d)在前述已編程的計算機上處理第二轉(zhuǎn)錄物序列集合,以生成第二確定的序列值集合,稱為進一步確定的序列值,其中每一個進一步確定的序列值對應(yīng)一個序列標(biāo)注和在第二文庫中的一段生物序列與至少一段參考序列的匹配程度;(e)處理每一個上述進一步確定的序列值,以生成進一步最終數(shù)據(jù)值,它表示每一個進一步確定的序列值出現(xiàn)在第二文庫中的次數(shù)。(f)處理從第一樣本得到的最終數(shù)據(jù)值與從第二樣本得到的進一步確定的序列值,生成轉(zhuǎn)錄物序列的比率,每一比率值對應(yīng)于兩個樣本之間基因轉(zhuǎn)錄物數(shù)目的差別。
8.一種將一個生物樣本中的mRNA相對豐度量化的方法,該方法包括下述步驟(a)從生物樣本中分離mRNA轉(zhuǎn)錄物群體;(b)確定以序列特異性方法轉(zhuǎn)錄mRNA的基因;(c)確定對應(yīng)于每一個基因的mRNA轉(zhuǎn)錄物數(shù)目;(d)利用mRNA轉(zhuǎn)錄物數(shù)目確定mRNA轉(zhuǎn)錄物群體中mRNA轉(zhuǎn)錄物的相對豐度。
9.一種包括產(chǎn)生基因轉(zhuǎn)錄物圖象的診斷方法,該方法包括下述步驟(a)從生物樣本中分離出mRNA轉(zhuǎn)錄物群體;(b)確定以序列特異性方法轉(zhuǎn)錄mRNA的基因;(c)確定對應(yīng)于每一個基因的mRNA轉(zhuǎn)錄物數(shù)目;(d)利用mRNA轉(zhuǎn)錄物數(shù)目確定mRNA轉(zhuǎn)錄物群體中mRNA轉(zhuǎn)錄物的相對豐度,確定mRNA轉(zhuǎn)錄物相對豐度值的數(shù)據(jù)來自生物樣本的基因轉(zhuǎn)錄物圖象。
10.權(quán)利要求9的方法,進一步包括(e)提供一個標(biāo)準(zhǔn)的正常條件下與病理條件下基因轉(zhuǎn)錄物圖象的集合;(f)比較生物樣本的基因轉(zhuǎn)錄物圖象與步驟(e)的基因轉(zhuǎn)錄物圖象,以確定至少一種標(biāo)準(zhǔn)基因轉(zhuǎn)錄物圖象,該圖象最接近生物樣本的基因轉(zhuǎn)錄物圖象。
11.權(quán)利要求9的方法,其中生物樣本是活體解剖組織、痰、血或尿。
12.一種生成基因轉(zhuǎn)錄物圖象的方法,該方法包括下述步驟(a)獲取mRNA的混合物;(b)制備mRNA的cDNA拷貝;(c)將cDNA插入適當(dāng)?shù)妮d體并利用該載體轉(zhuǎn)染適當(dāng)?shù)乃拗骶昙毎拗骶昙毎佊谄桨宀⑸L成克隆,每一克隆代表一個特定的mRNA;(d)分離重組克隆的代表性群體;(e)利用一種序列特異性的方法確定群體中從每一克隆中擴增的cDNA,該方法確定轉(zhuǎn)錄特定的mRNA的基因;(f)確定每一基因在克隆群體中出現(xiàn)的次數(shù),作為相對豐度的指標(biāo);(g)將基因及其相對豐度按豐度次序列表,以生成基因轉(zhuǎn)錄物圖象。
13.權(quán)利要求12的方法,還包括如下診斷疾病的步驟對生物樣本重復(fù)步驟(a)至(g)以生成正常條件下與病理條件下基因轉(zhuǎn)錄物圖象的參考集合,生物樣本來自正常人與患各種疾病的人的隨機樣本;獲取一個人類的測試樣本,對它實施步驟(a)至(g)以生成一個測試基因轉(zhuǎn)錄物圖象;比較測試基因轉(zhuǎn)錄物圖象和基因轉(zhuǎn)錄物圖象參考集合;確定至少一種參考基因轉(zhuǎn)錄物圖象,該圖象最接近測試基因轉(zhuǎn)錄物圖象。
14.一個分析生物序列文庫的計算機系統(tǒng),該系統(tǒng)包括接受轉(zhuǎn)錄物序列集合的手段,其中每一段基因轉(zhuǎn)錄物序列對應(yīng)于文庫中不同的生物序列之一;在此計算機系統(tǒng)中處理轉(zhuǎn)錄物序列的手段,該系統(tǒng)中存儲一個對應(yīng)于參考生物序列的參考轉(zhuǎn)錄物序列的數(shù)據(jù)庫,其中計算機用軟件編程,用來對每一段轉(zhuǎn)錄物序列生成一個確定的序列值,每一個確定的序列值對應(yīng)于一個基因標(biāo)注和文庫中不同生物序列之一與至少一段參考轉(zhuǎn)錄物序列之間的匹配程度,該手段也用來處理每一個上述確定的序列值,以產(chǎn)生最終數(shù)據(jù)值,這些最終數(shù)據(jù)值表示每一個確定的序列值出現(xiàn)在文庫中的次數(shù)。
15.權(quán)利要求14的系統(tǒng),還包括建立生物序列文庫以及從該文庫生成上述轉(zhuǎn)錄物序列集合的文庫生成手段。
16.權(quán)利要求15的系統(tǒng),其中文庫生成手段包括獲取mRNA混合物的手段;制備mRNA的cDNA拷貝的手段;將cDNA拷貝插入細胞和使細胞生長成克隆的手段;分離克隆的代表性群體及由此建立生物序列文庫的手段。
全文摘要
在生物樣品中量化基因轉(zhuǎn)錄物相對豐度的方法和系統(tǒng)。該方法的一個實施方案產(chǎn)生多RNA或其對應(yīng)的cDNA的高產(chǎn)出序列特異性分析(基因轉(zhuǎn)錄物圖象分析)。方法的另一實施方案通過使用高產(chǎn)出cDNA序列分析完成基因轉(zhuǎn)錄物圖象分析。另外,基因轉(zhuǎn)錄物圖象可以用于在一給定的細胞或細胞群中檢測或診斷特殊的生物學(xué)狀態(tài),疾病或與基因轉(zhuǎn)錄物相對豐度有關(guān)的狀況。本發(fā)明提供了在兩個或更多生物樣品中比較基因轉(zhuǎn)錄物圖象分析的方法,用來區(qū)分兩個樣品并且確定在兩個樣品中表達情況不同的一個或多個基因。
文檔編號G06F19/28GK1145098SQ95192325
公開日1997年3月12日 申請日期1995年1月27日 優(yōu)先權(quán)日1994年1月27日
發(fā)明者J·J·塞爾哈默, R·W·施科特 申請人:因塞特藥品公司