專利名稱:重組卵以及基于鳥類腺病毒的基因克隆和表達載體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于分子生物學領(lǐng)域。本發(fā)明特別涉及到含有重組蛋白和/或重組DNA的卵以及用于在卵中進行重組蛋白生產(chǎn)的載體和基因。
背景技術(shù):
將遺傳信息轉(zhuǎn)入可進入市場的產(chǎn)品是制藥產(chǎn)業(yè)中的一種新興范例。生物產(chǎn)品市場預期到2000年可達到1500億美元,這在很大程度上由基因組學和新藥的發(fā)現(xiàn)所推動。這一增長反映了對新發(fā)現(xiàn)的基因進行分子鑒定的需求,這些基因地功能可能為疾病提供治療。一旦這些基因被鑒別,通常會需要更大量的生產(chǎn)以進行研究和臨床試驗,這些研究和試驗可導致可進入市場的產(chǎn)品。能夠用于生產(chǎn)臨床質(zhì)量的產(chǎn)品的重組蛋白生產(chǎn)技術(shù)很少。將細菌、酵母或昆蟲細胞培養(yǎng)系統(tǒng)作為生產(chǎn)制造過程的基礎(chǔ)仍然是困難、不可預期和昂貴的。因此,需要開發(fā)一種高產(chǎn)的重組蛋白表達系統(tǒng),該系統(tǒng)便于使用,而且擴大至制造生產(chǎn)水平所需的成本較低。
發(fā)明概述
為滿足這些需求,本發(fā)明針對一種雞腺病毒表達載體(AdCEV),該載體為一種基于1型禽類腺病毒(Ad FAV1)的重組蛋白表達載體。該Ad FAV1的宿主為受精的雞卵,該宿主多年以來為多種用于對人類或者動物進行免疫接種的病毒的生長提供了簡單的途徑。例如,多種家禽疫苗以及用于人類或者動物的流感疫苗仍然在受精的卵中生產(chǎn)制造。本發(fā)明將可在受精卵中生產(chǎn)的可用的高價值產(chǎn)物的范圍,擴展至可通過本發(fā)明的AdCEV系統(tǒng)穩(wěn)定表達的任何蛋白。AdCEV轉(zhuǎn)染將每個卵變成一個在卵液中生產(chǎn)大量重組蛋白的袖珍工廠。我們的方法消除了對篩選步驟的需要,在轉(zhuǎn)染之后產(chǎn)生了高百分比的重組細胞。本發(fā)明的AdCEV/卵系統(tǒng)提供了以下的優(yōu)點1.簡便和低成本;2.高產(chǎn)量-毫克級的蛋白/卵;3.簡短的生產(chǎn)步驟-孵育72小時;4.真核蛋白的正確加工;5.從卵液中的簡單純化程序;6.用于大批量生產(chǎn)的簡單規(guī)?;?;和7.高水平的生物安全性。
本發(fā)明進一步針對一種含有重組蛋白的卵。該卵可為一種家禽卵。該卵可以是易感于腺病毒感染的任何鳥類的卵。
本發(fā)明進一步針對一種含有重組DNA的卵。本發(fā)明進一步針對一種含有重組RNA的卵。
本發(fā)明還針對于一種制備含有異源基因的重組鳥類腺病毒載體的方法,該方法包括這些步驟(a)制備一種含有鳥類腺病毒DNA的質(zhì)粒、粘?;蛘呤删w,所述的DNA含有(i)至少一種轉(zhuǎn)錄調(diào)控序列,該序列鄰接于至少一種限制性內(nèi)切核酸酶位點,以及(ii)來自Ad FAV1基因組的非必需區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列和所述的限制性內(nèi)切核酸酶位點;以及(b)向鄰接于所述的轉(zhuǎn)錄調(diào)控序列的所述的限制性切核酸酶位點,插入至少一個來自外源基因的蛋白質(zhì)編碼序列。本發(fā)明進一步針對遺傳修飾鳥類腺病毒的方法,包括以下步驟(a)制備一種載體,該載體含有包含鳥類腺病毒DNA的質(zhì)粒、粘?;蛘呤删w,所述DNA含有(i)至少一種轉(zhuǎn)錄調(diào)控序列,該序列鄰接于至少一個限制性內(nèi)切切核酸酶位點,以及(ii)來自鳥類腺病毒的非關(guān)鍵區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列和所述的限制性內(nèi)切核酸酶位點;以及(b)向鄰連于所述的轉(zhuǎn)錄和翻譯調(diào)控序列的所述的限制性內(nèi)切核酸酶位點插入至少一個來自外源基因的蛋白質(zhì)編碼序列;(c)提供至少一種經(jīng)重組鳥類腺病毒感染的細胞;(d)從所述的細胞中分離出一種能夠表達所述的蛋白質(zhì)編碼序列的重組鳥類腺病毒。
本發(fā)明進一步針對于一種方法,該方法使用一種重組鳥類腺病毒作為一種疫苗,該方法包括步驟(a)制備一種感染性鳥類腺病毒,該病毒中含有一種嵌合基因,該基因含有至少一種鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列以及至少一種來自外源基因的蛋白質(zhì)編碼序列,所述的嵌合基因側(cè)生于來自鳥類腺病毒基因組的非必需區(qū)域的DNA,這樣使所述的腺病毒能夠感染一種細胞時,表達所述的蛋白質(zhì)編碼序列。在第二個步驟中,以一種接種體對一種動物或者人類進行接種,該接種體含有的所述的重組蛋白的濃度足以在該動物或者人類體內(nèi)引發(fā)免疫反應。
本發(fā)明進一步針對于一種載體,該載體含有(a)一種質(zhì)粒、粘?;蛘呤删w;(b)一種嵌合基因,該基因含有來自一種外源基因的至少一種鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列;以及(c)來自鳥類腺病毒基因組的非必需區(qū)域的DNA,所述的DNA側(cè)生于所述的嵌合基因。
本發(fā)明進一步針對于一種感染性鳥類腺病毒,該病毒中含有一種嵌合基因,該基因含有至少一種鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列以及至少一種來自外源基因的蛋白質(zhì)編碼序列,所述的嵌合基因側(cè)生有來自鳥類腺病毒基因組的非必需區(qū)域的DNA,這樣使所述的腺病毒能夠在感染細胞時,表達所述的蛋白質(zhì)編碼序列。
在一個替代的實施方案中,本發(fā)明針對于一種感染性鳥類腺病毒重組子,該重組子通過含有以下步驟的過程產(chǎn)生(a)制備一種載體,該載體含有一種含有鳥類腺病毒DNA的細菌或者酵母質(zhì)粒、粘?;蛘呤删w,所述的DNA含有(i)至少一種轉(zhuǎn)錄和翻譯調(diào)控序列,該序列鄰接于至少一個限制性內(nèi)切核酸酶位點,以及(ii)來自鳥類腺病毒基因組的非必需區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列和所述的限制性內(nèi)切核酸酶位點;(b)向鄰接于所述的轉(zhuǎn)錄和翻譯調(diào)控序列的所述的限制性內(nèi)切核酸酶位點,插入至少一個來自外源基因的蛋白質(zhì)編碼序列。
在一個替代的實施方案中,本發(fā)明針對于在卵液中生產(chǎn)大量的來自一種被表達基因的重組蛋白。在某些情況下,目的基因編碼一種表達得很少的蛋白,即,該蛋白產(chǎn)量不豐并且/或者在天然生理條件下僅進行瞬時生產(chǎn)。在其它情況下,該待表達的基因的大小超過了病毒的“非必需區(qū)域”的容量,該“非必需區(qū)域”可在不影響該重組病毒的所需感染力的情況下被替換。
一種增強蛋白質(zhì)生產(chǎn)的途徑是使用瞬時細胞表達系統(tǒng),在該系統(tǒng)中細胞經(jīng)“微型染色體”轉(zhuǎn)染,該“微型染色體”預期不能整合入宿主細胞基因組。在瞬時細胞表達系統(tǒng)中使用的微型染色體也可經(jīng)修飾而進一步提高其在被感染細胞的復制期間的拷貝數(shù)。
本發(fā)明包括兩個被克隆的反向腺病毒末端序列在一種載體DNA分子中的整合,以及以該載體同作為輔助病毒的非缺陷腺病毒DNA一起進行的對細胞的共轉(zhuǎn)染。在這些系統(tǒng)中,輔助腺病毒DNA以反式途徑提供了載體包裝所需的所有蛋白質(zhì)功能,該載體僅僅含有病毒DNA復制和包裝所需的順式作用元件,主要是反向末端重復序列(包括病毒復制起點)以及包裝信號序列。
在本發(fā)明中,該載體系統(tǒng)由一種DNA微型染色體和作為輔助病毒的非缺陷型腺病毒DNA組成,該染色體含有一種可被反式激活的轉(zhuǎn)錄序列(啟動子)、一個增強轉(zhuǎn)錄的RNA穩(wěn)定序列、至少一種來自外源基因的蛋白質(zhì)編碼序列以及載體復制所需的反向腺病毒末端。
在一個替代的實施方案中,該載體系統(tǒng)由一個DNA微型染色體和作為輔助病毒的非缺陷型腺病毒粒子組成,該染色體含有一種可被反式激活的轉(zhuǎn)錄序列(啟動子)、一個增強翻譯的RNA穩(wěn)定序列、至少一種來自外源基因的蛋白質(zhì)編碼序列以及載體復制所需的反向腺病毒末端。
由此,鑒于上述公開的內(nèi)容,熟練的遺傳工程人員可構(gòu)建一些轉(zhuǎn)染子,這些轉(zhuǎn)染子克服了與表達載體的大小限制以及特定的低水平表達基因相關(guān)的生產(chǎn)問題。在具體情況下,這些重組DNA技術(shù)的技術(shù)人員可設(shè)計編碼一種目的蛋白的適當?shù)腄NA載體、來自基因組左右兩端的DNA復制的腺病毒起點、轉(zhuǎn)錄反式激活子和翻譯激活物,以及作為輔助病毒的腺病毒DNA,并且隨后使用本文披露的轉(zhuǎn)染子制造方法來通過轉(zhuǎn)基因卵的生產(chǎn)而獲得大量的目的蛋白。這樣的蛋白可以以天然形式或者截短類似物的形式以及融合蛋白或者其它能夠模擬目的蛋白的生物活性的工程化結(jié)構(gòu)物的形式存在。
圖表簡述
本發(fā)明可通過參考一些圖而被更好地理解,在這些圖中
圖1所示為質(zhì)粒pSKII-DC5′-MLP-2bLD的示意圖。
圖2所示為質(zhì)粒psKII-DC5′-MLP-2bLD-RGSV40-p(A)的示意圖。
圖3所示為質(zhì)粒pSKII-DC5′-MLP-2bLD-RG-p(A)-DC(XbaI-NotI)的示意圖。
圖4所示為重組Ad CELO(AdCEV)基因組的構(gòu)建步驟示意圖。
圖5所示為rCRP結(jié)構(gòu)體的示意圖。
圖6所示為在CRP克隆(圖5)的構(gòu)建中使用的660個堿基對的CRP PCR產(chǎn)物。
圖7所示為人類CRP在卵中的表達。將來自經(jīng)CRP結(jié)構(gòu)體感染的卵的7μl尿囊液上樣至4-20%的梯度SDS-PAGE膠。以考馬斯亮藍染液對該膠的一半進行染色并將另一半轉(zhuǎn)移至硝酸纖維素上并同抗CRP抗血清進行反應。這些泳道所含的物質(zhì)如下1.rCRP克??;2.分離自人類體液的CRP對照蛋白;3.N/a;4.以FAV1感染的尿囊液;5.未經(jīng)感染的尿囊液。預染的分子量標記物被標記為MW。
圖8所示為重組CRP在經(jīng)重組腺病毒(AdCEV)感染的雞胚的尿囊液中的表達。根據(jù)制造商的方案將尿囊液以及參照樣品同O-磷酯酰乙醇胺Sepharose(Sigma,USA)一起保溫。通過與PAGE上樣緩沖液一起煮沸而洗脫樣品,并將其上樣至凝膠中,該緩沖液含有1%SDS。1.
FAV1感染的尿囊液;2.未感染的尿囊液;3.重組CRP病毒感染;4.重組CRP病毒感染;5.純化自人類體液的CRP;6.未感染的尿囊液;7.分子量標準;8.純化自人類體液的CRP。
圖9所示為質(zhì)粒pSKII-DC5′-MLP-2BLD-GR-pA-DC3′制備的示意圖。
圖10所示為狂犬病糖蛋白G在感染的卵(R)以及參照卵(C)的尿囊液中的表達。在參照組中,野生型病毒被用于感染這些卵并且可見到這些腺病毒的組分之一(A)。在狂犬病克隆中可以見到對應于該狂犬病結(jié)構(gòu)體的預期大小的68kd蛋白。MW為分子量標記。
圖11所示為狂犬病糖蛋白G在經(jīng)重組腺病毒載體pKSII-DC5′-MLP-2BLD-GRV-p(A)-DC3′以及輔助病毒CELO病毒DNA感染的雞胚的尿囊液中的表達。1.分子量標準2.pKSII-DC5′-MLP-2BLD-GRV-p(A)-DC3′和輔助CELO病毒DNA轉(zhuǎn)染胚胎的尿囊液(蛋白質(zhì)樣品在上樣前煮沸)。3.pKSII-DC5′-MLP-2BLD-GRV-p(A)-DC3′和輔助CELO病毒DNA轉(zhuǎn)染胚胎的尿囊液(蛋白質(zhì)樣品在上樣前煮沸)4.CELO病素DNA轉(zhuǎn)染胚胎的尿囊液;5.未轉(zhuǎn)染胚胎的尿囊液;
發(fā)明詳述
定義
為確保對本發(fā)明的完整理解而提供了以下的定義
腺病毒任何屬于Adenoviridae家族的病毒。龐大的腺病毒家族(45個類型)根據(jù)其天然宿主范圍分為感染哺乳動物的腺病毒(Mastadenoviridae)以及感染鳥類的腺病毒(Aviadenoviridae)。
鳥類腺病毒Aviadenoviridae科的一種腺病毒。根據(jù)在Fenner,F(xiàn).et al.Vterinary Virology,Acadenic Press,Orlando Florida1987,pp329-337中的披露,至少存在10個不同血清型的鳥類腺病毒,這些病毒通常感染雞以及其它鳥類,如鴨、鵪鶉以及火雞,該文獻在此引為參考。
CELO雞胚致死孤兒病毒(Chicken Embryo Lethal Orphanvirus)。CLEO與1型家禽腺病毒(FAV-1)或者1型鳥類腺病毒(AAV-1)同義。CELO為Adenoviridae家族的一種鳥類腺病毒。CELO病毒的一般結(jié)構(gòu)組織為一個直徑70-80nm的二十面體殼粒,該殼粒由六鄰體和五鄰體結(jié)構(gòu)組成。CELO病毒基因組為一種線性雙鏈DNA分子,該DNA通過病毒編碼的核心蛋白被壓縮入毒粒。CELO病毒具有共價連接的末端蛋白并且具有反向的末端重復序列。
Ad CEV一種重組腺病毒載體,該載體來自于雞胚致死孤兒病毒。
啟動子啟動子為微型的DNA序列,該序列足以引導轉(zhuǎn)錄。啟動子可以使轉(zhuǎn)錄受控于細胞特異性、組織特異性、器官特異性或者使其成為可誘導表達。啟動子元件可位于該天然基因的5′或者3′區(qū)域。
多聚腺苷酸化位點多聚腺苷酸化位點為一種核苷酸序列,該序列導致特定酶在特定位點對mRNA的切割并添加一段腺苷酸殘基的序列于該mRNA的3′-末端。
多肽多肽指的是任何氨基酸的鏈,無論鏈長或者翻譯后的修飾(例如,糖基化或者磷酸化),并且包括蛋白質(zhì)在內(nèi)??稍诒景l(fā)明中使用的多肽包括HIV糖蛋白;狂犬病糖蛋白;漢塔(Hanta)病毒糖蛋白;埃博拉病毒糖蛋白;人類乳頭狀瘤糖蛋白;乙型肝炎表面抗原;甲型病毒包膜蛋白;丙型肝炎包膜蛋白;戊型肝炎包膜蛋白;人類巨細胞病毒主要包裝糖蛋白;偽狂犬病毒糖蛋白;水泡性口炎病毒糖蛋白;呼吸適合胞病毒包膜蛋白;風疹病毒糖蛋白;麻疹病毒包膜蛋白;黃熱病毒包膜蛋白;流感病毒蛋白;蜱生腦炎病毒包膜蛋白;副流感病毒包膜蛋白;骨鈣素;骨粘連蛋白;胃促胰酶;甲狀腺過氧化酶;白細胞介素;凋亡酶(caspases);鈣激活中性蛋白酶;細胞凋亡蛋白;胰島素;腫瘤壞死因子;粒細胞巨噬細胞集落刺激因子;表皮生長因子;促紅細胞生成素(erithropoetin);干擾素;前列腺素;溶栓蛋白(纖溶酶原、尿激酶、纖溶酶原組織激活劑等等);嗜曙紅細胞產(chǎn)生的神經(jīng)毒素(主要為嗜曙紅細胞核糖核酸酶);形態(tài)發(fā)生蛋白(humanjagged、mouse jagged、整聯(lián)蛋白、纖連蛋白;玻連蛋白;骨橋蛋白、鈣粘著蛋白、lavendustin A;受體酪氨酸激酶;垂體蛋白;endoglin;β-2-巨球蛋白抗原;人類C反應蛋白;脂肪酸結(jié)合蛋白;人類絨毛膜促性腺激素;神經(jīng)元特異烯醇化酶、人類生長激素;巨細胞病毒包膜蛋白、Epstein Bar病毒蛋白、肝炎核心抗原;Dilofilaria immitis糖蛋白;牛白血病病毒糖蛋白;流行性腮腺炎病毒包膜蛋白;人類細小病毒包膜蛋白、輪狀病毒糖蛋白、vero細胞毒素;甲狀旁腺病毒,但不限于此。
基本同一對于一種多肽,基本同一指的是一種多肽同一種參照多肽表現(xiàn)出至少50%的同一性,在優(yōu)選的情況下至少70%,更優(yōu)選的情況下至少90%,最優(yōu)選的情況下95%。對于一種核酸,基本同一指的是一種核酸序列同一種參照核酸序列表現(xiàn)出至少85%的同一性,在優(yōu)選的情況下至少90%,更優(yōu)選的情況下至少95%,最優(yōu)選的情況下97%。對于多肽,比較序列的長度在一般情況下至少為16個氨基酸,在優(yōu)選的情況下至少20個氨基酸,更優(yōu)選的情況下至少25個氨基酸,最優(yōu)選的情況下至少35個氨基酸。對于核酸,比較序列的長度在一般情況下至少為30個核苷酸,在優(yōu)選的情況下至少60個核苷酸,更優(yōu)選的情況下至少75個核苷酸,最優(yōu)選的情況下至少110個核苷酸。序列同一性在典型情況下使用序列分析軟件進行測量(例如,GeneticsComputer Group(GCG),University of Wisconsin BiotechnologyCenter,1710 University Avenue,Madison,Wis.53705的序列分析軟件包)。這樣的軟件通過排列各種替換、缺失、替換以及其它修飾的同源性程度來匹配類似序列。在典型情況下保守替換包括以下群體內(nèi)的替換甘氨酸,丙氨酸;纈氨酸,異亮氨酸,亮氨酸;天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺;絲氨酸,蘇氨酸;賴氨酸,精氨酸;苯丙氨酸和酪氨酸。
基本純的多肽基本純的多肽指的是一種從多種天然狀態(tài)下與之伴生的組分中分離出來的多肽。在典型情況下,該多肽在其質(zhì)量百分比為至少60%,不含其天然相關(guān)的蛋白質(zhì)和天然有機分子的情況下是基本純的。在優(yōu)選的情況下,該制備物中的目的多肽的質(zhì)量百分比應為至少75%,更優(yōu)選的情況下為至少90%,在最優(yōu)選的情況下為至少99%。純度可通過任何適當?shù)姆椒ㄟM行測量,例如,柱層析、聚丙烯酰胺凝膠電泳或者HPLC分析。
基本純的DNA基本純的DNA所指的DNA,不含有任何在本發(fā)明的DNA所來自的生物體的天然基因組中側(cè)生于該基因的基因。該術(shù)語在此包括,例如,一種整合入本發(fā)明的載體的重組DNA。該術(shù)語還包括一種重組DNA,該DNA為一種編碼額外的多肽序列的嵌合基因的一部分。
轉(zhuǎn)化細胞轉(zhuǎn)化細胞指的是一種細胞,該細胞(或其親代)中通過重組DNA工藝的方法被引入了一種編碼(如本文所使用)一種多肽的DNA分子。
轉(zhuǎn)化卵轉(zhuǎn)化卵指的是一種卵,該卵中通過重組DNA工藝的方法被引入了一種編碼(如本文所使用)一種多肽的DNA分子。
表達定位表達定位指的是該DNA分子經(jīng)定位而鄰接于一種引導該序列的轉(zhuǎn)錄和翻譯(即,輔助諸如一種重組多肽或者RNA分子這樣的物質(zhì)的產(chǎn)生)的DNA序列。
可操作地連接可操作地連接指的是,一種基因同一種或者多種調(diào)控序列的連接方式,能夠使基因在適當?shù)姆肿?例如,轉(zhuǎn)錄激活劑蛋白)結(jié)合于該調(diào)控序列的情況下表達。
微型染色體一種DNA分子,該分子至少含有腺病毒基因組的5′-末端和3′-末端重復序列,該序列含有復制起點和包裝序列。這樣的一種DNA分子可在被輔助病毒感染的細胞中自動復制,該輔助病毒以反式方式提供所有的復制功能。
發(fā)明詳述
考慮這些定義在內(nèi),本發(fā)明針對于一種基于鳥類腺病毒感染的雞卵的重組蛋白生產(chǎn)系統(tǒng)。龐大的腺病毒家族根據(jù)宿主范圍分為感染哺乳動物的腺病毒(Mastadenoviridae)以及感染鳥類的腺病毒(Aviadenoviridae)。雞胚孤兒致死(CELO)病毒(McCraken,R.M.,et al.,Viral infections of vertebrate,vol.3Viral infectionsof birds.Elsevier Scientific Publishers,Amsterdam.,1993;McFerran,J.B.,and B.M.Adair,Avian Pathol.v.6,189-217,1977)最初在繁殖一種牛皮膚病因子的嘗試中,經(jīng)鑒定為一種胚卵的偶然污染物(Van den Ende,M.,et al.,J.Gen.Microbiol.,v.3,174-183,1949),并且在1957年被鑒定為一種感染劑(Yates,V.J.,and D.E.Fry,Am.J.Vet.Res.,v.18,657-660,1957)。CELO被歸類于一種1型禽類腺病毒(FAV-1),并且是多年來鳥類腺病毒學的主要課題。FAV-1腺病毒可分離自健康的雞類,并且當實驗性的重新引入雞內(nèi)時,并不引起疾病(Cowen,B.,et al.,Avian Dis.,v.22,459-470,1978)。CELO的一般結(jié)構(gòu)組織類似于哺乳動物的腺病毒,它具有一個直徑為70到80nm的二十面體殼粒,由六鄰體和五鄰體結(jié)構(gòu)組成。CELO病毒基因組為一種線性雙鏈DNA分子,該DNA通過病毒編碼的核心蛋白壓縮于毒粒中。CELO病毒基因組具有共價連接的末端蛋白并且具有反向的末端重復序列(ITRs),盡管該序列短于哺乳動物病毒的ITRs。CELO病毒編碼一種蛋白酶,它與哺乳動物腺病素蛋白酶有61-69%的同源性。
CELO的DNA序列和基因組組織已被報道(Chiocca,S.,et al.,J.Virol.,v.70,N5,2939-2949,1996)。該序列為一種43.8kb的病毒基因組,比人類亞屬C腺病毒Ad2和Ad5的35.9kb基因組長約8kb。存在主要病毒結(jié)構(gòu)蛋白(六鄰體、五鄰體基座、IIIa、纖維蛋白、pVI、pVII和pVIII)的基因,并位于基因組的預期位置。同時還存在早期區(qū)域2(E2)基因(編碼DNA結(jié)合蛋白、DNA聚合酶和末端蛋白)。但是,CELO病毒缺乏與哺乳類腺病毒的E1、E3和E4區(qū)域同源的序列。CELO病毒基因組的左端約5kb的序列和右端約15kb的序列同mastadenoviridae基因組具有有限的同源性或者不具備同源性。這些新序列含有一些開放讀碼框架(ORFs)并且它可能編碼可能代替失去的E1、E3和可能E4區(qū)域的功能。
被引入9日雞胚尿囊腔的AD CELO(Phelps毒株)的脫蛋白DNA,誘導感染性Ad CELO病毒的繁殖(Grabko,V.I.,ActaVirologica-1987,v.31,No 1-2,pp.97-102)。使用病毒DNA的異源二體分析方法,我們將一種非必需的區(qū)域定位于Ad CELO基因組的EcoRI-B片段。作為對病毒載體結(jié)構(gòu)化能力的測試,我們將質(zhì)粒pUC19插入該非必需區(qū)域(2686bp),通過連接對CELO DNA片段進行體組裝,并且以CELO DNA的交疊片段對9天大的雞胚進行轉(zhuǎn)染。作為病毒DNA體內(nèi)重組的結(jié)果,我們獲得了含有在非必需區(qū)域具有質(zhì)粒pUC19的基因組的毒粒(Grabko V.I.,Construction of recombinantadenovirus CELO,Patent of Russia,N5061908/13,1993)。這樣,一種高達2700n.b.的DNA片段可被插入Ad CELO的天然基因組中(插入一個非必需性區(qū)域)而不影響該病毒復制的成功。如果該非必需性區(qū)域(大約基因組的6%)通過任何方式被缺失,該基因組的容量據(jù)推測可增加2000-3000個額外的堿基對。
原核系統(tǒng)的主要優(yōu)點是便于遺傳和表型標記被用作為選擇正確重組子的工具。在真核系統(tǒng)中,這一過程通常較為困難,在雞胚系統(tǒng)中尤為如此,這是由于改造一種有效的重組子篩選系統(tǒng)是載體設(shè)計中的一種主要問題。在本發(fā)明中,我們已經(jīng)開發(fā)出了一種從兩個片段體外組裝重組Ad CELO的有效工藝。使用本發(fā)明的組裝方案,無需耗費時間和勞動的使用表型標記進行重組子克隆的選擇和純化。在本發(fā)明的方案中,各種片段均是非感染性的。僅僅在體外組裝后才形成重組的感染性DNA,這誘導了感染性重組毒粒在轉(zhuǎn)染期間的繁殖(Celis,E.,et al.,J.Immunol.,v.136,629-697,1986)。
事實上任何目的多肽均可使用本發(fā)明的表達系統(tǒng)而表達。這樣的多肽的一個例子是來自疫苗株系Vnukovo-32的狂犬病病毒糖蛋白G。
針對狂犬病的疫苗接種仍舊是防止狂犬病毒感染后的疾病的唯一方法。被用作為疫苗的表達狂犬病毒糖蛋白(RG)的重組病毒對于克服這樣的一些問題頗有潛力。RG可誘導保護性的病毒中和抗體(Wiktor,T.J.,et al.,J.Am.Med.Assoc.v.224,1170-1171,1973)以及MHC類型I或者類型II限制的細胞毒性T細胞(Celis,E.,et al.,J.Immunol.,v.136,629-697,1986)并且表達該抗原的牛痘病毒被作為口服疫苗評價(Kiney,M.P.,Nature,v.312,163-166,1984)。腺病毒載體化的疫苗是痘苗病毒載體化疫苗的有用的輔助疫苗(Hruby,D.E.Clin.Microbiol.Rev.v.3,153-170,1990)并且在某些情況下可以是適當?shù)奶娲呙?Kaplan,C.,Archs.Virol.,v.106,127-139,1989)。狂犬病毒糖蛋白G在具胚卵中克隆的描述見下文的實施例部分。
牛痘病毒是痘病毒家族中研究最徹底的成員,該病毒作為活疫苗成功地被用于消除天花。對牛痘病毒的醫(yī)療關(guān)注便隨后低落,然而當活體痘苗重組子表現(xiàn)出能夠表達外源基因(Mackett,M.,et al.,Proc.Natl.Acad.Sci.USA,v.79,7415-7419,1982)并且能使動物保護性免疫化來抵抗狂犬病毒(Wikytor,T.J.,et al.,Proc.Natl.Acad.Sci.USA v.81,7194-7198,1984)及其它多種病毒的感染的潛力時,對該病毒的興趣又再度獲得刺激。
牛痘病毒還可被用作為一種克隆和表達載體(Grabko,V.I.,etal.,VI Conference of Russian Federation-New DirectionBiotechnology,p.102-103,1994)。從株系Vnukovo-32中表達RG的重組痘苗病毒,在小鼠中誘導了針對狂犬病毒的保護性抗體。
在狂犬病毒糖蛋白DNA編碼序列后還可連有一種多聚腺苷酸化(poly(A))序列,例如一種SV40早期poly(A)區(qū)域。屬于一種RNA轉(zhuǎn)錄多聚腺甘酸化信號的poly(A)區(qū)域,可能起到使轉(zhuǎn)錄穩(wěn)定的作用。從多種存在天然的poly(A)區(qū)域的基因可產(chǎn)生類似的poly(A)區(qū)域。在多聚腺苷酸化和轉(zhuǎn)錄穩(wěn)定功能不受明顯不良影響的情況下,這一區(qū)域還可經(jīng)修飾改變其序列。
將含有Ad CELO基因組的左末端、主要晚期啟動子、二分前導序列、狂犬病病毒糖蛋白DNA編碼序列以及poly(A)SV40的重組DNA分子,同Ad CELO基因組的右端大片段進行連接。這兩個被連接的DNA片段共同涵蓋了腺病毒的全部基因組并且含有一種感染性病毒的信息。下一步將該重組病毒載體DNA引入一種鳥類的卵或者鳥類的細胞培養(yǎng)物中。
可對該異源蛋白質(zhì)編碼序列在上述系統(tǒng)中的轉(zhuǎn)錄和表達進行監(jiān)視。例如,可使用Southern印跡分析來測定該RG基因的拷貝數(shù)。可使用Northern印跡分析來測定該RG基因的拷貝數(shù)。Northern印跡分析提供關(guān)于被轉(zhuǎn)錄的基因序列的大小的信息(例見Maniatis et al.,上文引用)。轉(zhuǎn)錄水平也可以被定量。所選擇RG蛋白質(zhì)在鳥類細胞或者鳥卵尿囊液中的表達,可以通過western印跡分析和對產(chǎn)生糖蛋白的活性測定而得以進一步證實。作為另一個實施例,表達系統(tǒng)使用鳥卵,并且包括pSKII-DC5′-MLP-2BLD-RG-poly(A)-DC3′載體和作為輔助病毒的Ad CELO DNA。pSKII-DC5′-MLP-2BLD-RG-poly(A)-DC3′載體包括AD CELO基因組左端,主要晚期啟動子、二分前導序列、狂犬病病毒糖蛋白DNA編碼序列、poly(A)SV40以及AdCELO基因組的右端。以該載體和純化的AdCELO DNA對具胚卵進行共轉(zhuǎn)染,這產(chǎn)生了積累于尿囊液中的重組狂犬病病毒糖蛋白的表達。
下列的實施例可使本領(lǐng)域的技術(shù)人員對于本發(fā)明的這些和其它實施方案十分明了。盡管這些實施例通常指1型禽類腺病毒(FAV1),應當理解這是出于闡釋目的并且同樣的特征適用于其它類型的禽類腺病毒的,特別是1、2、3、4、5、6、7、8、9、10、11和12型,并且本文所描述的發(fā)明計劃能覆蓋所有這些鳥類腺病毒。另外,應當理解,出于本發(fā)明的目的,任何蛋白質(zhì)均可使用這些不同的腺病毒在卵中產(chǎn)生。
實施例1
利用瑞典研究者們描述人類Ad2和Ad CELO的六鄰體基因之間的同源性的結(jié)果(J.Virology-1982,v.42,N1,306-310),我們合成了一些引物,這些引物是人類Ad2六鄰體基因的獨特特征序列。通過對來自Ad CELO和人類Ad5的克隆片段的測序,測定了引物的特異性。引物之一被用于合成一種Ad CELO片段,該片段同人類Ad2六鄰體基因雜交。反向引物來自于人類Ad2基因組位置21164-21185bp
5′AGGAACCAGTCTTTGGTCATGT-3′SEQ ID NO27
這一引物已經(jīng)被用于Ad CELO六鄰體基因的cDNA合成。以AMV反轉(zhuǎn)錄酶進行第一條鏈cDNA的合成。為進行第二條鏈的合成而使用了RNA酶H、DNA-pol 1和T4DNA-pol。將該雙鏈cDNA(約2500-3500核苷酸堿基對)從瓊脂糖凝膠中洗出并克隆入pBluescript II SK(+)載體。通過分子量以及同32P-標記的CELO DNA進行雜交來對克隆進行選擇。對大小最有可能的克隆從克隆片段的兩端進行測序。當克隆片段的5′末端具有與被測試克隆同源的序列時,所有這些克隆均在其3′末端具有該引物序列。這些克隆同32P標記的Ad CELO片段(XbalI-B片段和EcoRI-A片段)的雜交已經(jīng)表明,它們含有六鄰體基因的一部分以及二分前導。CELO六鄰體基因(MLP)的啟動子可在本發(fā)明的載體中使用以進行外源基因的表達。
實施例2
本實施例描述了質(zhì)粒pSKII-DC5′-MLP-2bLd的產(chǎn)生,該質(zhì)粒為
圖1所描述。質(zhì)粒pSKII-DC5′-MLP-2bld通過3個連續(xù)步驟的定向克隆而制備。
1.FAV1基因組的5′末端的克隆
首先,通過使用寡核苷酸引物以及聚合酶鏈反應(PCR),多達538個堿基對(bp)的Ad CELO基因組的左末端(位于鳥類腺病毒CELO基因組的0到538bp DNA序列之間)被擴增并且分離。所使用的引物為
5′-CAAGTGGTACCGGCCAAATTGGCCGATGATGTATAATAACCTCA-3′[SEQ ID
NO1]
5′-CAACCAAGCTTCTCTTCCGAAGTCATCTG-3′[SEQ ID NO2]
538bp的被擴增序列在表1中出示(SEQ ID NO21)
被擴增的DNA含有必需啟始點(ori)以及包裝序列(pkg)。僅以HindIII對這一kPCR片段(KpnI-ori/pkg-HindIII)進行消化,并將其插入pSKII載體,該載體經(jīng)過HindIII和SmaI消化。這一結(jié)構(gòu)體被用于從DC5′片段(KpnI-ori/pkg-HindIII)中缺失一個EcoRI位點。以EcoRI對質(zhì)粒(pSKII-DC5′進行消化并且使用T4DNA聚合酶填充該位點。隨后將該載體進行重新連接。以KpnI-HindIII對經(jīng)缺失的pSKII-DC5′EcoRI[-]進行消化。分離所產(chǎn)生的片段DC5′EcoRI[-]并同KpnI-HindIII所切割的pSKII載體進行連接。由比缺失了位于538bp和1988bp之間的Ad CELO基因組。
2.主要晚期啟動子MLP的克隆
第二步,在7000bp附近發(fā)現(xiàn)了一個主要晚期啟動子區(qū)域,該啟動子在7488bp具有TATA盒(Chiocca,S.,et al.,J.Virol.,v.70,N5,2939-2949,1996),使用以下的引物通過PCR產(chǎn)生了該區(qū)域。
5′-CAACTAAGCTTGAGCTGTACGTGTCACTTCC-3′[SEQ ID NO3]
5′-CAACAGAATTCCTGGAAGTCGAGGCGACC-3′[SEQ ID NO3]
被擴增的DNA含有主要晚期啟動子(MLP)。隨后以HindIII-EcoRI打開pSKII載體并在其中插入該PCR片段HindIII-MLP-EcoRI。該序列在表II中出示(SEQ ID NO22)。
3.二分前導序列的克隆和分離
以濃度為108毒粒/ml的CELO病毒對9天大的雞胚進行每個胚0.1ml的接種。接種程序根據(jù)(Rev.Roum.Med.Virol.(1985)36,4,235-240)中的描述進行。感染后18到20個小時,在冰上冷卻兩個胚。根據(jù)描述分離尿囊絨膜并以冰冷的磷酸鹽緩沖液洗滌。隨后將經(jīng)洗滌的膜在緩沖液A中在Potter-Elvehjem勻漿器進行混合(10mMHepes pH7.5;25mM NaCl;5mM MgCl2)。通過加入含有5%Triton X-100的緩沖液A來裂解勻漿物。通過在3000rpm下離心10分鐘來沉淀細胞核。向上清中加入3%的SDS并隨后進行苯酚抽提(2×)、氯仿抽提(2×)以及乙醇沉淀。將總胞質(zhì)RNA溶于含有4M的異硫氰酸胍以及20mMNaCl的40mM Tris-HCl(pH7.4),并且在150,000(g(+4℃)下離心20小時以使RNA沉積于5.7M的CsCl鋪墊。在6M的鹽酸胍中重懸浮該沉淀。隨后加入0.025體積的1M乙酸以及0.5體積的乙醇并且如同上步沉淀RNA。如Grabko所述(Grabko,V.I.,F(xiàn)EBS Leters,v.387,pp.189-192,1996),將該RNA沉淀溶于最小體積的DEP處理過的水并用于通過RT/PCR來產(chǎn)生雙鏈cDNA。
反轉(zhuǎn)錄酶(RT)混合物(20μl)含有67mM Tris-HCl(pH8.8)、16.6mM的(NH4)2SO4、4種脫氧核苷三磷酸(dATP、dCTP、dGTP、dTTP)各0.25mM、2mM MnCl2、或者1.5mM MgCl2、20pM XbaI引物(反向的)、5個單位的Taq或者Tth DNA聚合酶以及不同量的毒粒RNA(0.2μg到2pg)。向加熱至60℃的RT混合物中加入RNA模板,隨后鋪上40μ1的礦物油并且在60℃保溫3分鐘,在70℃下繼續(xù)該過程15分鐘。RT反應之后加入80μlPCR混合物,該混合物含有67mM Tris-HClpH8.8、16.6mM(NH4)2SO4、0.01%Tween-20、0.75mM EGTA、4種脫氧核苷三磷酸(dATP、dCTP、dGTP、dTTP)各0.25mM、2mM MgCl2,最后加入20pM EcoR I引物(正向的)。隨后將全部保溫混合物(100μl)在DNA熱循環(huán)儀中(Perkin-Elmer Cetus Instruments)進行如下的擴增94℃下1分鐘、56℃下1分鐘、72℃下1.5分鐘,進行35個循環(huán)。在1%的瓊脂糖凝膠電泳中對等份的產(chǎn)物(5μl)進行分析。以氯仿對含有cDNA擴增片段的RT/PCR保溫混合物進行抽提,并在3體積的乙醇中沉淀。以限制性酶XbaI和EcoRI水解擴增片段和質(zhì)粒pBluescript II SK(+),并且通過T4 DNA連接酶進行連接。對大腸桿菌DH5細胞進行轉(zhuǎn)化,并通過以PCR擴增插入片段以及隨后的在1%的瓊脂糖凝膠中的電泳來對重組子克隆進行篩選。
所使用的引物為
5′-CATGGAATTCCAGGTCTACGCCGACGAGAGGATCG-3′[SEQ ID NO5]
5′-CAACTCTAGAGCCTGAATTTGTTTTTCAAGTC-3′[SEQ ID NO6]
該擴增DNA含有二分前導序列(2bld)以及六鄰體mRNA序列。隨后以EcoRI-XbaI打開該pSKII載體,并且在其中插入PCR片段EcoRI-2bld-5′hex-XbaI。使用以下的引物進行的PCR僅僅獲得了二分前導
5′-CATGGAATTCGACTTCCAGGTCTACGGCGACGAGAGG-3′[SEQ ID NO7]
5′-CCTGGATCCGATGTGTTCCTTGAACCAAAC-3′[SEQ ID NO8]
該被擴增DNA僅含有二分前導序列(2bld)。隨后以EcoRI-BamHI打開該pSKII載體,并且在其中插入PCR片段EcoRI-2bld-BamHI。該pSKII載體含有必需起始點(ori)以及包裝序列(pkg)(KpnI-ori/pkg-HindIII),以HindIII-EcoRI將其打開并且將主要晚期啟動子(MLP)同ori和pkg元件進行連接。隨后以EcoRI-BamHI將這一含有(KpnI-ori/pkg-MLP-EcoRI)的pSKII載體打開,并且將二分前導序列同該ori/pkg和MLP元件進行連接。
實施例3
本實施例描述了質(zhì)粒pSKII-DC5′-MLP-2BLD-RG-p(A)的產(chǎn)生,該質(zhì)粒在圖2中有所描述。質(zhì)粒pSKII-DC5′-MLP-2BLD-RG-p(A)通過定向克隆在三個連續(xù)的步驟中制備。首先,使用寡核苷酸引物、反轉(zhuǎn)錄酶(Amersham)以及PCR,從狂犬病病毒疫苗毒株Vnukovo-32的RNA中制備該病毒的糖蛋白基因,高達1640bp的狂犬病病毒DNA序列被擴增并分離。所使用的引物為
5′-GGATCCAGGAAAGATGGTTCCTCAGGCTCTCCTGTTTG-3′[SEQ ID NO9]
5′-GCTGCAGCAAGGGGAGGTGATCTTCAGACTTGGATCGT-3′[SEQ ID NO10]
該被擴增的DNA含有狂犬病病毒疫苗毒株Vnukovo-32序列(RG)的糖蛋白基因。隨后以BamHI-PstI打開該pSKII載體,并且在其中插入PCR片段BamHI-RG-PstI。第二步,使用寡核苷酸引物和聚合酶鏈反應(PCR),多至240個堿基對(bp)的基因組SV40(位于猿猴病毒40基因組的2530到2770bp的DNA序列)被擴增并且分離。所使用的引物為
5′-CAATCTGCAGATCATAATCAGCCATACCAC-3′[SEQ ID NO11]
5′-CAACTCTAGATCCAGACATGATAAGATACATTG-3′[SEQ ID NO12]
該被擴增DNA含有SV40的poly(A)位點。隨后以BamHI-XbaI打開該pSKII載體,并且向其中插入片段BamHI-RG-PstI以及PCR片段PstI-p(A)-XbaI。第三步,以BamHI-XbaI打開含有(KpnI-ori/pkg-HindIII-MLP-EcoRI-2bld-BamHI)的pSKII載體,隨后在其中插入片段BamHI-RG-PstI-p(A)-XbaI。表V為poly(A)SV40的序列[SEQ ID NO25]。
實施例4
本實施例描述的是質(zhì)粒pSKII-DC5′-MLP-2bLD-RG-p(A)-DC(XbaI-NotI)的產(chǎn)生,該質(zhì)粒在圖3中有所描述。質(zhì)粒pSKII-DC5′-MLP-2bLD-RG-p(A)-DC(XbaI-NotI)通過定向克隆一步產(chǎn)生。以XbaI-NotI打開含有(KpnI-ori/pkg-HindIII-MLP-EcoRI-2bld-BamHI-RG-PstI-p(A)-Xba)的載體pSKII,并且在其中插入Ad CELO基因組XbaI-(位于2到17.4kb之間)-NotI片段。通過體外的一步連接制備重組Ad CELO基因組的集合物,該基因組在圖4中有所描述。以SfiI-NotI打開含有(KpnI-Sfil-ori/pkg-HindIII-MLP-EcoRI-2bld-BamHI-RG-PstI-p(A)-XbaI-Ad CELO-NotI)的pSKII載體,并且同Ad CELO基因組NotI-(位于17.4到48.3kb之間)-3′末端Ad CELO基因組片段進行連接。將這一連接混合物(約1μg/單個胚)注射入9天大的雞胚的尿囊腔中。在加濕培育箱中37℃下培養(yǎng)72小時后收集尿囊液并且進行狂犬病病毒糖蛋白重組蛋白分析。
實施例5
CRP表達克隆的構(gòu)建
我們構(gòu)建了一個可以表達除去了N-末端前導肽的成熟形式的該亞基的克隆——該亞基類似在蛋白質(zhì)數(shù)據(jù)庫(Protein DataBank)中的結(jié)構(gòu)數(shù)據(jù)輸入PDB1GNH中所描述的結(jié)晶分子的形式,由此我們的重組結(jié)構(gòu)體編碼的一種蛋白起始于序列(NH-GLN THR ASP MET SER ARG......)[SEQ ID NO23]。我們認為盡管該具胚卵系統(tǒng)可以基本正確地切割CRP的前體形式,該系統(tǒng)可能不會在經(jīng)CELO感染的細胞中產(chǎn)生同樣的定位結(jié)果。病毒蛋白被CELO感染的細胞特異地排出到尿囊液中,并且我們期望同樣的情況發(fā)生在CRP亞基或者五聚體上。
為產(chǎn)生一種正確的蛋白,通過在正確的讀碼框架內(nèi)引入一個甲硫氨酸密碼子,我們?nèi)斯さ叵蛟摻Y(jié)構(gòu)體蛋白的N-末端加入一個甲硫氨酸(NH-MET GLN THR ASP MET SER ARG......)[SEQ ID NO13]。由于多數(shù)真核細胞中的蛋白通過細胞酶的非特異性加工以除去N-末端甲硫氨酸,我們相信該添加可以在實際上增強正確產(chǎn)物的幾率。
PCR引物
使用GenBank(序列號Acc.No.X56692)的序列作為指導,設(shè)計用于引入限制性酶切位點和構(gòu)建上文所述的重組CRP(rCRP)分子的引物。引物引入了用于構(gòu)建該結(jié)構(gòu)體的限制性位點(圖5)。
5′引物
5′-CGTTAGGATCCATGCAGACAGACATGTCGAGGAAGGC-3′[SEQ ID NO13]
3′引物
3′-CCAAGCGGCCGCTGCAGTCATCAGGGCCACAGCTGGGGTTTGGT-3′
[SEQ ID NO14]
I引物-正向(37mer)
5′-CGTTAGGATCCATGTCGAGGAAGGCTTTTGTGTTTCC-3′[SEQ ID NO15]
II引物-正向(38mer)
5′-CCAATCTGCAGTCATCAGGGCCACAGCTGGGGTTTGGT-3′[SEQ ID NO16]
質(zhì)粒DNA分離自ATCC 324978克隆的過夜培養(yǎng)物并且以EcoRI和XhoI限制性酶進行消化。在凝膠中觀察到約1.8kb的預期片段大小。質(zhì)粒DNA被用作為PCR反應的模板,該反應以用材料和方法中所描述的引物來進行。與發(fā)表的序列數(shù)據(jù)相一致,觀察到了約650bp的片段。在圖6所示的瓊脂糖凝膠照片中,以CRP引物進行的PCR擴增產(chǎn)物顯示在分子量標記的旁邊。表III所示為由該PCR插入片段所編碼的序列,該序列編碼我們的重組人類CRP蛋白[SEQ ID NO23]。
該PCR片段被整合入一種pSKII-DC5′-MLP-2bld-hCRP-p(A)-DC3′結(jié)構(gòu)體。該重組子在各個階段的選擇通過限制性消化和瓊脂糖凝膠上進行的片段大小測定來進行。在該結(jié)構(gòu)體中還含有病毒的末端重復序列(TR),該序列對于病毒基因組的復制至關(guān)重要。
該卵中的克隆人類C-反應蛋白產(chǎn)生了一種重組子,該蛋白的五聚化的能力與正常蛋白相同,并且與CRP特異性血清之間的免疫化學交叉反應性同正常蛋白同一。該結(jié)果在圖7中顯示。在另一個實驗中,分析了該CRP同O-磷脂酰乙醇胺瓊脂糖進行結(jié)合的能力。結(jié)果顯示重組CRP形成了一種五聚體,這是因為該五聚體對于同該基質(zhì)有效結(jié)合是必需的(圖8)。
實施例6
狂犬病病毒糖蛋白的克隆
狂犬病病毒疫苗毒株Vnukovo-32的糖蛋白基因的核苷酸序列和推定的氨基酸序列是已知的(Fodor,I.,Grabko,V.I.,et al.,Arch.Virol.v.135,N3-4,451-459,1994)。狂犬病病毒疫苗毒株Vnukovo-32在原代的倉鼠腎臟細胞或者猿猴腎臟細胞系4647中繁殖。感染之后,通過超濾使上清澄清并且通過超速離心濃縮病毒顆粒。在4M的硫氰酸胍中重懸浮這些沉積物并且通過酚氯仿抽提以及乙醇沉淀來分離該病毒RNA。使用反轉(zhuǎn)錄酶(Amersham)從RNA制備了cDNA,該制備使用一種3′末端特異性引物
5′-GGATCCAGGAAAGATGGTTCCTCAGGCTCTCCTGTTTG-3′[SEQ ID NO17],
該引物覆蓋了翻譯起始(ATG)密碼子。該cDNA使用PCR(GeneAmp,Perkin Elmer Cetus)、3′-和5′-特異引物進行擴增。
該5′-特異性引物具有以下的序列
5′-GCTGCAGCAAGGGGAGGTGATCTTCAGACTTGGATCGT-3′[SEQ ID NO18],
該5′-引物含有終止密碼子。在1%的瓊脂糖凝膠上進行該PCR產(chǎn)物的電泳,并且從膠上切下預期大小的雙鏈DNA的帶并且隨后以BamHI和PstI進行切割。將該切割產(chǎn)物同經(jīng)類似處理的pUC19載體進行連接。在經(jīng)X-gal處理的平板上對大腸桿菌DH5細菌細胞進行轉(zhuǎn)化后獲得了一些克隆。在以BamHI和PstI切割后,通過瓊脂糖凝膠電泳鑒別出了含有插入片段的質(zhì)粒DNA。
以SEquenase試劑盒(USB,USA)通過雙脫氧核苷酸終止法對cDNA的兩條鏈均進行了測序。通過計算機使用7.1版的“GCG”軟件包對DNA序列進行了分析。該糖蛋白的核苷酸序列和推定的氨基酸序列已被提交至EMBL Date Library并且分配了索取號碼X71879。524個氨基酸的多肽的推定序列在大小和組織上同多數(shù)先前鑒定的狂犬病病毒糖蛋白同一。在對8種gp G基因的核苷酸序列進行比較時,Vnukovo-32毒株同ERA(99.4%)和SAD B19(99.1%)具有最大的同源性。當對推定的氨基酸序列進行分析時獲得了類似的結(jié)果。在細菌細胞中對糖蛋白G基因的功能活性進行研究(Grabko V.I.,F(xiàn)ragment of DNAcoding synthesis glycoprotein G of Rabies virus,recombinantplasmid DNA coding glyprotein G of rabies virus,strain ofbacteria E.coli-Production of Glyprotein G of Rabies virus,Patent of Russia,N2008355,1994)。重組質(zhì)粒插入于pUC18載體中,處于lacz啟動子的控制之下。以重組質(zhì)粒DNA對大腸桿菌菌株DH5進行轉(zhuǎn)化??寺VG18-1表現(xiàn)出狂犬病病毒糖蛋白G的高度免疫原活性。
實施例7
本實施例所描述的為質(zhì)粒DC5′-GRV-DC3′(pSKII-DC5′-MLP-2BLD-GRV-p(A)SV40-DC3′-pSKII),該質(zhì)粒在圖9中有所描述。質(zhì)粒pSKII-DC5′-MLP-2BLD-GRV-p(A)SV40-DC3′-pSKII通過定向克隆分兩步制備。
1.FAV1基因組的3′末端的克隆
首先,使用寡核苷酸引物、DNA Ad CELO和聚合酶鏈反應(PCR),多達830個堿基對(bp)的Ad CELO基因組的右端(位于鳥類腺病毒CELO基因組的42995bp和43804bp之間的DNA序列)被擴增和分離出來。所使用的引物為
5′-CAACCTCTAGACATCACCATAGCAATCATTGG-3′[SEQ ID No19]
Xbal 42995-43016bp Ad CELO
5′-CATTCGCGGCCGCGATGATGTATAATAACCTCAAAAACTAACG-3′
Notl43804-43774bp Ad CELO[SEQ ID No 20]
表VI為830bp的擴增序列。
在第二步中,擴增DNA序列含有必需起始點(ori)。隨后以XbaI-NotI對pSKII載體(Stratagen cloning Systems,La Jola,CA)進行消化,并在其中插入PCR片段DC3′(XbaI-ori-NotI)。
在XbaI、NotI位點對載體pSKII-DC3′(XbaI-ori-NotI)進行切割,并且分離出含有FAVI基因組的3′末端的XbaI-NotI片段。將含有FAVI基因組的3′末端的片段(XbaI-NotI)插入經(jīng)過XbaI-NotI消化的載體pSKII-DC5′-MLP-2bld-GRV-p(A)SV40。將經(jīng)連接的DNA轉(zhuǎn)化入大腸桿菌并且通過以酶XbaI、HindIII、KpnI、EcoRI、BamHI、NotI進行的限制性內(nèi)切對正確的質(zhì)粒進行鑒定。所有的限制性內(nèi)切的條件按制造商推薦的進行(New England BioLabs)。
實施例8
狂犬病病毒G蛋白在具胚卵中的表達
狂犬病病毒糖蛋白也可在本發(fā)明的載體中克隆。該序列在SEQ IDNO24中給出。完整的CELO(FAVI)病毒基因組序列在表VIII中顯示[SEQ ID NO27]。
圖10所示為狂犬病病毒糖蛋白G在經(jīng)感染(R)和參照(C)卵的尿囊液中的表達?;谶@些結(jié)果,本發(fā)明的系統(tǒng)可以在每個卵中產(chǎn)生足以用于多劑量疫苗的物質(zhì)。
實施例9
本實施例描述了對鳥類卵的轉(zhuǎn)染,該轉(zhuǎn)染通過重組腺病毒載體DNA(DC5′-GRV-DC3′)以及作為輔助病毒的DNA Ad CELO來進行。
轉(zhuǎn)染根據(jù)Grabko V.I.(Acta Virologica 1987,v.31,N1-2,pp.97-102)進行。典型地,在無菌鹽水中將脫蛋白的毒粒DNA Ad CELO制備物稀釋(1-5μg每個胚)并且在同樣的無菌鹽水中稀釋載體DNADC5′-GRV-DC3′(pSKII-DC5′-MLP-2bld-RG-p(A)SV40-DC3′-pSKII)(5-10μg每個胚),該DNA經(jīng)SfiI-NotI預切割。通過單一玻璃毛細管將該混合物引入9天大的雞胚的尿囊腔中。該胚在37℃下保溫72-96小時。將該胚冷凍之后收集尿囊液并進行蛋白產(chǎn)量分析。
基于Bradford法(Anal.Biochem.-1976,72,248-)的Bio-Rad蛋白質(zhì)分析,被用作為用于測定溶解蛋白質(zhì)含量的簡單和精確的方法。它涉及到向蛋白質(zhì)溶液加入一種酸性染料以及隨后以光度計在595nm下進行的測量。同標準曲線進行的比較提供了蛋白質(zhì)濃度的相對測量值。
蛋白質(zhì)水平可通過Western印跡(免疫印跡)使用由“CapriconProductions,Inc.”(USA)提供的抗-RGP的小鼠單克隆抗體,以及由“Bio-Rad”提供的印跡級親和純化的山羊抗小鼠IgG(H+L)堿性磷酸酶偶聯(lián)物進行。該樣品的純度通過SDS-PAGE(4-20%的凝膠)并隨后以Gradipure電泳凝膠染色劑進行染色(
圖11)來進行分析。表7概述了所進行的實際實驗性轉(zhuǎn)染,該轉(zhuǎn)染用于測定上述的載體(單獨以及同DNA Ad CELO聯(lián)合使用)在狂犬病病毒糖蛋白G產(chǎn)物上的效果。
本文所引用的所有的參考文獻,包括出版物和專利在內(nèi),特此在同一的程度上收為參考,猶如各參考文獻被經(jīng)單獨并且專門的指出被收為參考并且在此全文引入。盡管該發(fā)明著重于優(yōu)選的實施方案來進行描述,對于本領(lǐng)域普通技術(shù)人員來說優(yōu)選的實施方案很明顯可被變動。特別地,應當注意任何蛋白均可在本發(fā)明的轉(zhuǎn)基因卵系統(tǒng)中被表達。類似地,本發(fā)明意圖能通過本文具體描述的以外的方式來實行。因此,本發(fā)明包括了附加的權(quán)利要求的精神和范圍所涵蓋的所有修改。
序列表
表I
Seq ID No21
鳥類腺病毒CELO基因組的堿基對0-538
(左端反向末端重復序列和包裝信號序列)
表II
Seq ID No22
鳥類腺病毒CELO基因組的主要晚期啟動子
表III
Seq ID No23
CRP蛋白的cDNA序列 1 ATG TCG AGG AAG GCT TTT GTG TTT CCC AAA GAG TCG GAT ACT 42
MET Ser Arg Lys Ala Phe Val Phe Pro Lys Glu Ser Asp Thr 43 TCC TAT GTA TCC CTC AAA GCA CCG TTA ACG AAG CCT CTC AAA 84
Ser Tyr Val Ser Leu Lys Ala Pro Leu Thr Lys Pro Leu Lys 85 GCC TTC ACT GTG TGC CTC CAC TTC TAC ACG GAA CTG TCC TCG 126
Ala Phe Thr Val Cys Leu His Phe Tyr Thr Glu Leu Ser Ser127 ACC CGG GGT ACA GTA TTT TCT CGT ATG CCA CCA AGA GAC AAG 168
Thr Arg Gly Thr Val Phe Ser Arg MET Pro Pro Arg Asp Lys169 ACA ATG AGA TTC TTC ATA TTT TGG TCT AAG GAT ATA GGA TAC 210
Thr MET Arg Phe Phe Ile Phe Trp Ser Lys Asp Ile Gly Tyr211 AGT TTT ACA GTG GGT GGG TCT GAA ATA TTA TTC GAG GTT CCT 252
Ser Phe Thr Val Gly Gly Ser Glu Ile Leu Phe Glu Val Pro253 GAA GTC ACA GTA GCT CCA GTA CAC ATT TGT ACA AGC TGG GAG 294
Glu Val Thr Val Ala Pro Val His Ile Cys Thr Ser Trp Glu295 TCC GCC TCA GGG ATC GTG GAG TTC TGG GTA GAT GGG AAG CCC 336
Ser Ala Ser Gly Ile Val Glu Phe Trp Val Asp Gly Lys Pro337 AGG GTG AGG AAG AGT CTG AAG AAG GGA TAC ACT GTG GGG GCA 378
Arg Val Arg Lys Ser Leu Lys Lys Gly Tyr Thr Val Gly Ala379 GAA GCA AGC ATC ATC TTG GGG CAG GAG CAG GAT TCC TTC GGT 420
Glu Ala Ser Ile Ile Leu Gly Gln Glu Gln Asp Ser Phe Gly421 GGG AAC TTT GAA GGA AGC CAG TCC CTG GTG GGA GAC ATT GGA 462
Gly Asn Phe Glu Gly Ser Gln Ser Leu Val Gly Asp Ile Gly463 AAT GTG AAC ATG TGG GAC TTT GTG CTG TCA CCA GAT GAG ATT 504
Asn Val Asn MET Trp Asp Phe Val Leu Ser Pro Asp Glu Ile505 AAC ACC ATC TAT CTT GGC GGG CCC TTC AGT CCT AAT GTC CTG 546
Asn Thr Ile Tyr Leu Gly Gly Pro Phe Ser Pro Asn Val Leu547 AAC TGG CGG GCA CTG AAG TAT GAA GTG CAA GGC GAA GTG TTC 588
Asn Trp Arg Ala Leu Lys Tyr Glu Val Gln Gly Glu Val Phe589 ACC AAA CCC CAG CTG TGG CCC TGA 612
Thr Lys Pro Gln Leu Trp Pro TER
表IV
Seq ID No24
狂犬病病毒糖蛋白基因(毒柱“Vnukovo-32”)
序列r ab-vn32,長度1645分析范圍1-1645 1 GGATCCAGGA AAGATGGTTC CTCAGGCTCT CCTGTTTGTA CCCCTTCTGG 51 TTTTTCCATT GTGTTTTGGG AAATTCCCTA TTTACACGAT ACCAGACAAG 101 CTTGGTCCCT GGAGCCCGAT TGACATACAT CACCTCAGCT GCCCAAACAA 151 TTTGGTAGTG GAGGACGAAG GATGCACCAA CCTGTCAGGG TTCTCCTACA 201 TGGAACTTAA AGTTGGATAC ATCTTAGCCA TAAAAATGAA CGGGTTCACT 251 TGCACAGGCG TTGTGACGGA GGCTGAAAAC TACACTAACT TCGTTGGTTA 301 TGTCACAACC ACGTTCAAAA GAAAGCATTT GCGCCCAACA CCAGATGCAT 351 GTAGAGCCGC GTACAACTGG AAGATGGCCG GTGACCCCAG ATATGAAGAG 401 TCTCTACACA ATCCGTACCC TGACTACAGC TGGCTTCGAA CTGTAAAAAC 451 CACCAAGGAG TCTCTCGTTA TCATATCTCC AAGTGTAGCA GATTTGGACC 501 CATATGACAG ATCCCTTCAC TCGAGGGTCT TCCCTAGCGG GAAGTGCTCA 551 GGAGTAGCGG TGTCTTCTAC CTACTGCTCC ACTAACCACG ATTACACCAT 601 TTGGATGCCC GAGAATCCGA GACTAGGGAA GTCTTGTGAC ATTTTTACCA 651 ATAGTAGAGG GAAGAGAGCA TCCAAAGGGA GTGAGACTTG CGGCTTTGTA 701 GATGAAAGAG GCCTATATAA GTCTTTAAAA GGAGCATGCA AACTCAAGTT 751 ATGTGGAGTT CTCGGACTTA GACTTATGGA TGGAACATGG GTCGCGATGC 801 AAACATCAAA TGAAACCAAA TGGTGCCCTC CCGATCAGTT GGTGAACCTG 851 CACGACTTTC GCTCAGACGA AATTGAGCAC CTTGTTGTAG AGGAGTTGGT 901 CAGGAAGAGA GAGGAGTGTC TGGATGCACT AGAGTCCATC ATGACAACCA 951 AGTCAGTGAG TTTCAGACGT CTCAGTCATT TAAGAAAACT TGTCCCTGGG1001 TTTGGAAAAG CATATACCAT ATTCAACAAG ACCTTGATGG AAGCCGATGC1051 TCACTACAAG TCAGTCAGAA CTTGGAATGA GATCCTCCCT TCAAAAGGGT1101 GTTTAAGAGT TGGGGGGAGG TGTCATCCTC ATGTGAACGG GGTGTTTTTC1151 AATGGTATAA TATTAGGACC TGACGGCAAT GTCTTAATCC CAGAGATGCA1201 ATCATCCCTC CTCCAGCAAC ATATGGAGTT GTTGGAATCC TCGGTTATCC1251 CCCTTGTGCA CCCCCTGGCA GACCCGTCTA CCGTTTTCAA GGACGGTGAC1301 GAGGCTGAGG ATTTTGTTGA AGTTCACCTT CCCGATGTGC ACAATCAGGT1351 CTCAGGAGTT GACTTGGGTC TCCCGAACTG GGGGAAGTAT GTATTACTGA1401 GTGCAGGGGC CCTGACTGCC TTGATGTTGA TAATTTTCCT GATGACATGT1451 TGTAGAAGAG TCAATCGATC AGAACCTACG CAACACAATC TCAGAGGGAC1501 AGGGAGGGAG GTGTCAGTCA CTCCCCAAAC GTGGAAGATC ATATCTTCAT1551 GGGAATCACA CAAGAGTGGG GGTGAGACCA GACTGTGAGG ACTGGCCGTC1601 CTTTCAACGA TCCAAGTCCT GAAGATCACC TCCCCTTAAC TGCAG
表V
Seq ID No25
SV 40基因組poly(A)位點的序列
(猿猴病毒40基因組的堿基對2533-2770)
表IV
Seq ID No26
鳥類腺病毒CELO基因組的堿基對42995-43804
(右端反向末端重復序列)
表VII
表VIII
SEQ ID27CELO(FAV1)病毒基因組的FASTA格式序列>gi|1314432|gb|U46933|AAU46933 Avian adenovirus CELO,completegenomeGATGATGTATAATAACCTCAAAAACTAACGCAGTCATAACCGGCCATAACCGCACGGTGTCACTCGGGTACAAATTATGAATTCGATCTTTGGACTTTTCGACGCGCCCAGTGACTGTACTTTATTGCGCCAATTCACCACGCCCGGGAGATTTCGAAATTGCTATTTCCGTGCAGTTCCGCATTCCGAAGTACAATTTAACCGGTTTTATGGGTGTTCGGTGTTTTTCTAGCTTAATCATTGTTTTTAGACGACACAGTGGGTATCTGTTTTCGCTTGGACTTGGCTCCGCTTTGTGAAAATTCAACTCGATCCAACATTTTCCTTATTGATGGAAGGCTTTTATTATTTGCACAACAGACATCGCGCTATTTACACAGAACGCAAAGTGCTGTCTTTTTTATTCCTTGTTCCGGGTACATCTTTTATTGCTAGTGCCTCGCCTATTTTTAGTCACGTATCTTCCTTGTTCTATAGCTATATATTCACGCGGTTTTCGGTCTCTCCTCACTCGGCAGATGACTTCGGAAGAGAAGCTGCAGAGTTCGTCTCCGGAGACCGGCCTCGCCGCTGTCGTCCTGCAAAGCCCCCTTGAGGTACGTGTGCCTGCCGTTCTTCCTCCTCCAGTGCGAATTGACATCTACCGCTACCCAGGCTTTCCGCCAACGGAGACCATCTGGCACGGTCTCATCACGCAGACTGAGTTAAACCAGGCTTTGGAGAGCATCGTTGAGCAATTGTAGTAAGTGTCAGTCCCTATTTTTCTGTTTTTTCTTGTATTTCCTCTTAGACGATGGACCCGTTCGGTTCTTCTTCAGTCCCTCCGTGCTCTACATCAGACCTTCCCGAACCCAAGCTCTATTTCGTCCGCTTGTCACCCCATGCAGTGCCTCCAGTTAGGGCTACGCACGGAGCTGCAGGATACGATTTGTTTAGCGCTTACGACATTAAAGTGCCTGCTCGCGGTCGGGCGCTAGTTCCCACAGATTTAGTTTTTCAATTTCCGCCCGGCTGTTACGGTCGGATTGCTCCTCGCTCGGGCTTGGCCGCCAAATTTTTCATTGACGTCGGAGCGGGTGTTATCGATCCCGATTACCGCGGGAACGTTAGCGTGGTTTTGTTCAATTTCTCCGAGAGCTCGTTCAACATCAGGCGAGGCGATAGGGTAGCACAGCTTATTCTGGAGCGTATTATGGTTCCGGAGCTGTCGGAACTGACGCAGCTAGGCGAGACAGACCGCGGGGCGTCGGGTTTCGGGTCCACAGGTATGGGTGCTGTAGACCGCAATCAGCGCTCTGTGTTGGAATGGCTGACCCCTGGTTCCCGTTGATAGGACCCTTGCGACGAAGTCGACTTCGCTGTACGCTTGCAAGCAGATTTTGAGGGGGACGACGACACATACGGACATTGTCTGTGCGAAGGCAGCACCAGCAAGAGGCCCTGCTGTACGCTCTGTAACAGTTACTGCGTGCTTCTTTAGGTATGATTGTGAGCGTGTGGCAGCTCGCGACCATCGCGATTGAGTTTTGCGATAAGTGGGTGGGGAAATACTACAGATTCCGACCGTATCATGAGAGACTTTTGCTTATGCAGAGTCGGCAAGCTTTGGAAAGGAGCTTGCGCCGCTGCGTAAGTGAAGTTGGACCTCCGCCAGAGCCTCTAGAATAGCGATGGAGTCCGGCGCACGTGGTGCTTCCTGACTTTCTGCACCATTACCGTGGTGTTTCTGGCCTTCTTTCTGCAGAAACTTCTCAACTACATAGATTTCAGAGATAGCGACTGCACAGAATGTTTTTTTGTGTAGTTGACAGGACTATGGACCAGACAGCAACCCATACAGCTTTGATTCTTCTGATCGTCTTGACGGTGTTCACGGGCGCGGTGGTAGCTTTGATGTTGTATATTGCGATAACTGGACTTCCTTGCTCTATGCTTTGCTCTCAATAAAGATTTTCAGAATGGTGATTCTATGGTATTTTGTCTTTTTTCTAGACAGTCATGTCGCGTGAGTCTGAACGTTACTGGACTTTGGTGCACGCTCTGATTGATCGGGGTGTAGTCAGCCGTGAACAGTGGCAAATGGTTGACCCTGCGCAATACCAGTTCTACCACCGCTCCAAACAGAGGGGTTTTAAGGTCCGTCACATTCTTCGTGATGTGATTCGCCACATGTGTTGGTCTCGGACTCTGTTAGATTATATGTCCTCGGCCTCGACACCTAGTCCGGACGATGTATTACGCAATCCCCTGTATCAGTTGCTGTTATGTAATGGATATAACCCCGCTGTTGTGGGGACAGCGCTGATCCGGTGGGCGGGCCATCAGAGCAACCGTAACACTGTTTGGATTCGAGGCACCCCTATGTCCGGAGCTCCGTACTTGGCACAGGCTATCGCGTACTGCTCTCCCCTCGTAGGGAGCGTTGATTGGCGCAACAAGTCTAACCCATTCGAAGGGTGTCCAGATAGTCTGGTGTTTTGGTGGGACGGCGGTTATGTTTATGATTGTTGTGTGGGTCTGGTGAAGCAGGTGTTCCGGGGAGAACATGTTATTTTGCCTCCTGAGGGCTTGCGTGGCCCCAACCCGTGCTCTGAACTCTTCAGGACCCCAGTCTTGATGTACAGCCAGGCGGATATTTGTATGACTAGGCTGAGATCAGGGGAACTAAGTGCAGAGCATGCGGTGGGCCTCAGGGATTGTATGTACCTGATCCGTTTGACAGAAGATTTTGACTGCGCGGGTGGTATATCGTGTGCAGATGTCAAACAGTTTGTGGCGTGGAGCCGCGAACACCCTGGGGAGGTTCGCGAGACCCACGAACTCAAATAAAAATTCGGGACTTCTGTGTACGTTCCTTTTCATGTTTATTAAACACTGTTCTTTCGAGTGAGTCATATCACGTGGAAGTTAATTGCGACTGGGAGCCGCAGAAGCAGGTGGTAAAAGCAAGCTATGCAGGGATAGTTTACGATGTCCCTTGGAAGACAGACATAGAGTGTTTGTCCTTCCAGTCGCGTGTAGGCGCCTTGGCGCCGCGCAACGGTTACTGCTGTATATATTTGTTCGAGGGCAGGGTTCAAGTTGCATAACCTGCAGTGAGTAGCATATGTGTATAAGATGAGATTAAGAGGGAGTTGGGGCTGGTGGTCGTGTTGAGCAACGAAATTGACGACCGTTTTGGCCCAGTGAGCTGTAAGCACTCGGATGAGGGATAAACAAAAGAGGGAACGGGGTGTCTCGCAGCTGCAGATGTACTGGATAGTCCAGTCGGTACATCGCATCTCAATAACTCTTATCCAGCTGCAGAATGACCTGAGCTGGAGGTCACACTCTTCGTCCGTAATGCAGTGGGGCGAGTGCTTGAAGGGGTACATCTGTCTTTTAAGGAGAAAGAGTAGGAAATCGGGATCTGTGATTAGGGTAATGCCCACGCGCGTGAACAGGGGCTCGATGTAGATATGCCAACTGTGTTGGGGCTCGTCCTCATCGTTGTCACTATCCCAAACAAGGTCGCACGACTCGAATGTCTGTAAAACATCAAAAGTTTATTACTGATTTTGAAGAGGGGTACGTATACAGGGGTTACAGAGTTTATTATCGCGTTTGCAATGCAGTGTCATTAAGCAAGCACAAGCGGCAGCATTAGCAACAAAGTCGCGTAGCTCTTTGCGCGGGTGGTAGCATGGAGGGGTCTTGGTGTGGTCTCCTGTGAGGAAGAAGACGACCGTGTTCCGCGCCGTGAACTCGTTGGCGAGCGAGAGGTCCGCGCAGTGGATTAGCATGGGGGTCGAGGGGATGTGGAACGTTTTCTTATTCAGCCTGCAGGTGGCAGCATTGCCTTCCATAAAGTGCAGCATCAACGGGTCCGGCTTCTCGTCTACGAAGGGCAGACAGTATAGAGAGGCGTGGGGTGCGATTTCGCCCAGTGATAGTATGGAGTTGATTCGGCTGTCGGAGATCGCGAGCGGGAAACACGCGCATAAGGCATTAAAGAGACTCTTGGCGTTGGAAAGTCTTCCTCCGCAGAGCACGAGGGTGTTTAGTTCTCCTCGGAGCCATCGGAGGATGGCGTTAGCTGCCACTTTTCCCTCGTAGCCTTCGGCTTCCATCATCTGATGGAACCAGTTGTCGCAGACGTTGTAGAACGCAGCCTTGAGGGTGTCGGGCTCTTCGGAGGGTAACTGGTTAATGAGGCTCTGTCCGGGTCCGAACCGTTCCTTGAGGGCTTCGAGTACACGCTCTCGTTCGTAGGTGGGTATGAGGTTCTTGGACGGGAAGTTCCACTGGACTTCGTGTGCTACACCTTCGACAAACAACCGTTCAACCAACTGATCCATGGGGGACGTGGACGGAAATAAGCAGGGTGAAGGGGTGTCTGGAATGCAGGATGCTATTTGCTCCTCTTCGCTACTTAAAGACGACTGAGACTCGCGTCGCCTCTTGGTGCACTGTGGGAGAGAATTATATGTCATGTGATGAGTGACAAGCATTGCATGGGGAGGTCCACGAGCGGGAACAGAGCATTCCTTTGTTCTCGCATAGGAGAGCGCGCAAGGCGTCGTTGTCATTATCTGCCTGTAATTGGTGTATGCGATGAATGTAGCGGGAGAGCTCTCCCAGAAAGAACCCGCAGCCGTTGGCGGGTTCGTAGAACCTAATAATGATATGTTCGTCGGGAGCAGTGGGCAGATGTTCGGGATGGGGGAGCTGATATAAGCGGACGAGGCATTTTTTCTCACTGATGTCCACGAGACCGTCGCGGGTCATTGTGGTGAATGACCTGCCTTTCAGCAGCTGGTTAGCAACGGGATCTTTGAACGTGTTACAATGAGCTGTGCAGGGGAAATAAAGCATCTTGACTAAATCTTGCTGTCTGGCGTACTGGCCAAAGTCGAACGCGTTAATGTTGGCAGTGAGGACAAATTGGAATAATCTGAGGATGGATGCAGTGAATATATCTGCGGCAGAGGAAGGTTCTCCTACGACATAGAGCGTGTTAGTATAATGGCACAGGCGACTAATGCTCATGGCAGACATCCACAGATAAATGGCGTAGATGGCTACCGGAGCATTGTAACCTTCGGCTTCTAGCATGGCTCGGAGATCTCTTTGTGAGGACAGCTCGAAGCCTTGCAGATTGAAATTGATCGTTTGACTGAGCCCGTAGCTGCAGTATAATTTGCGCGCTTCTTCCAGAAGCGCGGGGGCGACCGATTCGAATAGTTCAGCATCTTGGGGATACCGAGTGAGCCAATCTTTGTAGGTAAAGATGTTGTTTCGCTGGAGATCGAATATTAGCCTGTGTGTGACTAAATCGTCGTCGTCTTCTCCCGTGTGGCGGTTCCTGAGTCTCTTAACGCTATCCTTAAGTTTCCTGAAACGTTCCTGGGGGAGAAAGTTTTTCGAGATCGGTTAGTTTGGGGTTTCTCTCTAACTGCTTTCTATGTGTTTCGCTAAATTTGATGATAGATTTGGCTGTTTTCAGGAATCTCTCCTGAATGTTAACATTGAGAGGGATGATCGAGTACTGCTGATCTATACTGCACCACCTAAAGGACTCGGATACTGGGTCCGGAGTGTACATGACCCAGCTGAACCGCTGGTTCTGCTGCAGGAAGGAAAAGTAAGCTTTGAGAAGGACAACGAGGTCCTTCGAGATGTTGTGTGCGAACGCATAGAGGAACCTAGCGAACTGGAATTGGGGAATATGACAGGATAGGATGTGCATTTTCGCGTTCACTTTGAGGGTGGGAACGTTTCCTATCGCGGTGCGCCGTGCCATGTTGTGCAAGACTACGAAAATGTAGAAGGCTGTACAGTGGGCAGAGCGAGCAAAGAGCTTAGAAGGAAGGGCGTGAAAGAGGACAGAGACGCTGGAGCCTGAACAGAGCTTATCCATGCACTCGTCCATGATAATGGCGACGGGTCCCCGCTTGGAGACTTTCACGTAAATGTTGTCTGGATGGTCGATGTTGAGATGTTCGGGTGCGGTGGCCTCCTCGTAAGTCATCTCCATAAATTCGGGACGGAACGTGCTTGTCTTAGGGGCGATGGTGCCGTCTTCCCTGCAGTCGAAATTGGCCTCGACCAGCTGCAGGTTCCAGGACGTCTGTTCGATGGGTGGAATCATGTTCTTTTCCGGAGTGATGAAGATGACCGTTTCGGGGATCGGGTCCAACATGTTGCACGAGATGAGCGCCCGCAGCAGATGCGACTTGCCGGATCCCGTGGGTCCGTAGATGACCCCGATGATGGGCTGCTTGCCCATGTTGATGGACGGCAGCTGTCCGTGTTGGAGGTAGCGACTGTCCATCTGTTCCTGGGCTTTAACTTCTTCGTGGGCTTCGAGAAACTTCTCATTAACGCCCCCTAGGCTGTAGAACTCGTCGTAGGAGGGGAAGTGTTGCTCGCGGAAGAGCTGCGGTGCTAGGTCGACAGCTCCGTCGTACCAGCTGGTGACGCGCTGGTAGAAGTCCCGCGAGGCTTCGTACTCTTCTTCCTCATACTCCCAGGCTTTCCGCTTCCTGGGAGCTATCATCTGCGAAGAGTAGGTCGTGAACTTGCCCGCATTCCTCTTCGGATAGGAACGCGTAGGGTTCCCATCGTAGGGGTGCGAGGGGGTCTTCGTGCCCGACGATTGGGACGGGTCGTACGTCTCCTGTCGTGCGGGGATTTGGGTGCTCATTGTCGTAGGGGTACAGGTAGTCCCCGTGCTCGTATAGGGTGAGGTCCTTCCACGGACGCAGCACTCGCGTGAGCTGCTCGTTGTGAATGGTGAAAGGGTCGTAGCGACTGACCTTGTTCAGAAGCGTGGTTTTAAAGATGGTTCTCCGCGTGTGTAGCTCTGGGATGTTGCTCTGCGCTCCGAATTGCACGTCCTCGTGTCTACGCCAACAGCGCAGCAGCGTGTCGTAGATGAGTTCGGACTGCCTGTGTCCCTTCGATCTGATTTTCCCGGGTCCTACCGTGCGGCACTGTTCGTTGACGCAGATTGAGTTTTTCAGTCCGTACAGTTTTGGCGCTAGGAAGATGGTTTCCGAGCTGTACGTGTCACTTCCGCAGGCTTTGCACTTGATGTCGCAATCGCAGGCCCAGTAGAGGCCGGGATTTTCTGGATCGAAAGTCAGTCGAGTGGATTCTGTTTTGATTCGGTGCGCGCCGCGGCTTTTCATGCGATGATAGCCTGTTTCTGTGACGAACAGGCTGTCGGTATCGCCATAGAGGCTGCGCGGCTCCTCCCTTCGCAGGATGTGCACTCCTCTGTCCGGTCCGTACAGGATGTCACACCACTCGCTGAAGAAGGCCCTCGACCAGCCCAGCACGAAGCAGGCGATTTGCGTGGCGTATCTTTTGTTTGCCACCTGCTTGTCCAGGCTTTCCAGATGGAGCACGGTTAGGGCTTCTGGTGTGGCTTCGAGGAGACGCATAGGTTTAAACCGGGTCTCGTTAGCGCGAGCGTAGTGGGCGGAGCTTAGCTCCCCCTCGGGTATATAAGGGCCCGTCGCGAGGGTCGCCTCGACTTCCAGGTCTACGGCGACGAGAGGATCGTCTTCGGTAAGTGCGTTTTTCGGCTTACGGGCACTCTCGCGATCGCTGTCGTCTCCTTCTTCTTCCCCATCCTCTTCTGCTTCGGGCTCTTCCTGTTCGGGGTCGTCTGCGTAGCGGAACTGTTGTCGTAGACTCTCCTCACTGAAGGGGTTAGGCGCGTTTTCGAGGGTGACTTCCGTTCCGTTGAACGAGTCGTCATTGAGCAGCGTGACGTGTTTGACGATTTCAGTGCCTTCGTAGATGTTTTTCTTATCTGCTTCCGAGAGGTCCTGTTCAAAGATGATGCGCGTGGTGTCCATGTTGGTGGCAAACGCACCGTACAGCGCGTTGCTCAGCATTTTGGAGATGGATCGAATCACTTCGTTCTTCTCGCGATCGGCTTTTTCTTTGGCGAGGATGTTTTTCGTGACGTAGTCGGCACATAGCGTTTTCCATTCCGGAAAAACAATGTTCATCTCGTCATGGAGGACCTGGACTCGCCATCCCCGGTTGTGCAGCGTGAGGATATCTATGACGGTGACCACCTCGTCGTAGAGAGCCTCGTTGGTCCAGACCAGTCTGCCTCCCCTCCGGGAGCAGATGGGAGGGAGTGGGTCTAACATTTCGGGCGGGGGAGGGTAGGCTTCTATTTTCAGGATGGAAGGCTTGATACGCGCATCGAAGTAGCTCAGATGCGATTCGTTGGTCAGCAGCCGGTTGAGCTCCTCCACGTGCTGCGCGGTAAATTTTGGATCTAGGGGCATTCCGTGGGGCATGGGGTGGGTGAGGGCGGAAGCGTACATGCCGCAGATGTCAAAGACGTAGACGGGTTTCAGGTAAGGTCCGAGCACGTTGGGGTAGCATCGTCCGCCGCGGAGCGCTTGGCGTATGTATTTGAACATGGGGCGGTGGGGGGCGTAGACTTCGGCCACGTAGTCGGGGGAGGGTTGTTTTTTCTTTTTGGTTCGACCTTTCTTTTTGGGGGGTTCGGGGACGGAGGGAGGGCATGTCGCACGCTGTTCGCGGACGTAATTGGAAAAGGTAAGTTGCTTCCAAAAGGCATGAGTGTTGCTGGGGATGGTGGGCCGCACGAAGATGTTAAAATGGCCTTCCATCCCTAGTTCTCGTTGGAAATAGGCGTCGTAGCTGTCGTGTAACGTGTGGGCCAGCTTTTGGGTGACGCGGACGTCCTGCATGCAGTATTCGAGGCACGCTTGGACGATGTCGTACTGCTGGCCCGGGTGTTCTTTCTGCCATAGATTCTTCTGTTCAGCGATGACGGATGGGTCTTCCCAGTACCTTTCGACAGGAAAGCCGTCGGCGTCCGCGTGAAAGCGCCCCGTGGAAATGAATTCGTTGATGGCCTCGTATGGGCAATGTCCCTTGCAGAGGTCTAGCGCGTAGGCTGCCGCGGCTTTGGAGAGTTTGGCCCCGCTGGTGAGCTGTAGAGTGTCTCGCACCATGAACCGCACAAATACCGAGCGCGCATCCTGATGGGACACGATCCCGCGAGACCAGCGTTCTACGCGGGAGGCGTCTTTCTTCACGTAGTTGGGGTTTGGCATGCGGAAAATGATATCATTGAACAGAAGGCGACCGACGCGAGGCATGAAGGATCGATCACATTTGCACGCTTCCGGGAATAGGTCCCTGCGCTCGACGAGTTCCGTGGCTAAGAGGAGTTCATCGAACTTACATATGTTGTGACCTAGCACTACGATGTCTACGGAATAAAAGTTATCCGGGAGGGAGAGGGGGGAGGTGGGTTTCTCGAAGAGCTCGTACGGTATTTTGTGAACGGAGCCGTACTTTCCGTCCTTGACTAGCTGGTCGCAATAATCTCGGTTGGCAGCCGCGTAGCGGTCGACTAGATTTTGGGCAAATTCTATTTGCAGACGGGACCTGAAGTTGCGAAACCTTCTGGCAACCTCGCCCGGATGGCTGTCTAGCCAATAGAAGCCTTCGTCGAGGGCTTTGAGACGGTCGTCCTGCCGTGCTAAGCGTTCGGCGCGGGAGACCAGCTGGGGGTCTCCGCTGAGCATGAAGCACAACATAAACGGATGCATGCGCTTGCCTTTCTTTTCGAACACGGTATACGTCTCGATATCGTAGGTGATGTACAACTGACGTATGTGGGGGTGTTGGGCTGGACAGGAGAAGTGGACGTGCTGCCACAAATCGCTGCCCGATCCCTGGACGGCGTGGTAGTAGAAGGCAGAGCGGCGTTCGTTGCACGAGTGTCGTCTGACCCAGTGTCGGCCGCAGGTGGGACACTGTTGAACCGGAGTGCGGCTGGTGATCCAGACCCATTCTCCGGTGACGTTTTTGGCGATGAGCATGGGGGGAAGGGCGGGATGTTCGGAGATGTGCACGGTCCGCAGGCGCGCTGTTTTGCCTTTAAAGTTGATGACGGTGACCTGGGCGGGCTTAAAGTCGGGGAGGGAGCGTTCGGGGTCTCGGGCATAGTGCAGATAGTCTATTCGGTCGTAGCCTCTGGCTCTCTTAGACAGCAGGAAGCGGTGGGTGCGTAGGAATTTCTTGAGACCTATGGGGAATACAGTGGGTTGGAAGCGGAAGGGCTGTTCCTCGATGTAATAGACGTTTGTGCGTAGGGGGTTGCCCCGGAAGCTCTTGAAGTACTTTCGGGTCTCTTCCAGCCGTTTAGCGGAAATGGTTCGGATGACGTGCGAATCGGGGCCCAGCACGCTGTCCGTGAGGGGAGGCCCCGCGTCTGCTTCCATTTACAGAGGCTGACCTCGTCGCGCCGCCGCTTCGATGTCTTCGCGGCGGTGGCGGAGCACGCGTCTGAGGTTGGCTTTGATCTCCTCGTTGGTAGCGATGGCTACGATGCCTTTAAATTTGATGCGGAAACTGATGTCGATGCTATCGATCAGCTCTTCGCTGAGGTTGAGCTGCTTCAGCACTTCTTCGATGTCACCGGAGCGGTCTCTGTATTGAATATCAGAGAGAAACAGTTGTTGGTCCGCATCGTCCATGCCTTCGAATTGACCCGTCCGTTCGACCATCATAAGAAAATCGCGTAATATACGTTCCCACAGGGTTTCGAATATGGTGGCGGGGTTGGATTGCTCGCTCCATATGCGTTTAAAAACCTGCTGCGCGTTGACGTCCCATCCCACGACGAGTACTTGTAAGGTCAGGACGTCGACGTACCGGCGGAACTCGCGGTTGGCGATGAAGTGGCTGTACAGGTAGTAGAGTGTAGAGGCGATATGTTCGGCTAAGAAGAAGTACAGCACCCACTTGCGCAGGAACGACTCTCCCATGAGTCCCGCGTCGCGCGCGGTCAGGAGCATGCGGTAGAAGTCGTTGGCAAACCTGAAGAGTTCGTGTCTCCGGGCGGCCCCGCTGAGCTCGTCTTGCAGTGCCCCGATGGCTTCGAGCGCTGTGCGAATCACCTCGTCTAACAGCTCTTCTTCCTCCTCTTCTGGTTCTTCTACTTCCATGGCGGCTTCTTCTATTTCTTCGGGAGGGGGCGCGGGGGAGGGGGGTCTCCGTCGCCGCCGCGTGACGCGGGGCAGGCGGTCTACGAAGGCCCGCACGGCACGGGGCCTAATGCGGCGCGCTTCGGACGCGGTGATGGCTCTGCCGTGGCGGTCTCTAGGGCGCAGGCCGGTGCGGTCGGTTACCCGCCGGCTGCAGAGGGTGATGGCGCCTCCTGACAGACCCGTTCCTGCTAAGGAAACGGCGTCGCTCGCTAGAGTGCTCATGAAACATCTCGCCATTGTTTCCGTAGGTTCCTCTACGTCCCGTCTTCCTCGAAACTTGCGCTCGGCATCCCGCACCAGTTGCTGGGTGTCTAGCTCCGCGAAGGCTTCCGCGAAGTAGGAGAGCCAGTTTGGTTCAAGGAACACATCGGATCCAGGTAAGAACCGATATCTTTCTTCCGTTTGAAATAGATCATATGCGTAGCAGAATAGATAGTGGCAGAGGGCGACTCTTAGTTGGCGGATGGCGGCGAGCAGTTCGGCGTCGGCGGCAGAGGCCGTTCGCATGAGGACGCCTTCTTGCAAGCCACCCGCTCCGTTGCCCGACAGTAGGCTGTGGTGTTCGGCGTCGAGCTGCGGCAACACTTGTCCGTGACGGCCTACGTCGATTCCCCTACCTCGCAGATGCGCCCGGCCCATGTCCGCGGCCACGCGGTCCATGAGTACGGCGTTGTGCATCTGCGTGAACGTACCGTGAAAGTTGTCGAGATCGAGAAATCGCATGTACTGCCCTACATTGACGGCGTAGGAGCAGTCGGTCAGACAGGTCCAAAAGAGGCGTCTGGGTCTTTGGGGTGGGCTATCGTAACCTATCTGCATAAAAACGCGGTTGTCGAAAAGGTAATCGTTGAGCGCGCGGTGCATAGCTTGGTACCCGAGGAGAAGGTGCGGCGGCGGCAATCCGTTGTAGGGCGGCGCGGCGACGTTCGGCGATCGCGGCGCGAGGTCTCGGAGTTGCATTAAACGGTAGTCGTACACCCGGCTGACGAGAAACACGCTTCGGGGGTGGACCAGGGCTGGTTCTTCCCGAACGAGGACATAGTCAGCGGTGATGACGGGTTCGCAGAAGCGGACGGTGGCTAGACTCTGTCCGGTGAGATCCGCGAAGACTCTGTAAGCCTGAAATTGAGCCCCTGACGTTTTTAGACCGCTCGTAATGCACCCCGTCCTGCAAAGCGTTCGAAACGCGAGCGTGAGCGCCGGAGGACCCCATCAACAGCAACCGCAGCAGCAACAGCACGGTGTGTCGTCGGTCCGTCGTCCTCCTTCACCACCCCGATATCCCGCACAACATGCCTATCCCGGCGCGGGCGCGACACCCACGGCAGGACGAGGCGATTTCGACGGCGCGCTTGATCCCGATGAAGGACCGGTCGCGTGCGGGCTGGCGGCCGGGGCCGGTGTGGACGAAGTTAGAATGAGGGAGCGGGACGCCGCGCGGCGAGCCACGGTGCCCGAGATCAATCTTTTTAAGGCTCGACGTGACGTGGTGCCCAATGGGGATTACGAGAGGGATCTGATGTACCACTCGGGACAGGCAATCGATATCGATCGGCAACGTGTGCTCACTCCGGAAGACTTTAAGGGGTCCGAGCCGGCTTTCACGCCGGCTGTCAACCATATGCGCGCGGCCGAGTTGAAGAGGGCGGCTGAGCAGACGGCATTTGGGGAGGAATTGAGGAATACCTGCCATCAGACCCGCATCCGCACGGCTCTGTTAAGGCCCGAGATCGGAGCGGGAATCTACTATCTGTACGATTTCGTCCAGACTTATCTGGAGCATCCGGACGGTCGGGTGAAGCTCAATCCTCAGCTGGTGTTGGTGGCTCAGCACGCGGGCAATACTATGCTGGCGCAGCGCTTGTGGGCCATCGCAGAGGAGAAGAATGCGTGGTTGAGAGATTTGATAGAGATGGCGTACATGATCGTGAACGATCCGTACCTCAATACGGAGCAGCAGCTGTCGGCCATCTGCACGACGGTGGTCGAGTTGAGCATGAAATACGCCAAGTTGGCCGCCAAGAACGGTTACCCGTCCATGGCGCAGATGGCTAAGGCGCAGGAATTTTTCTACCGGGTCATGCAAGCGGTGCTCGATTTAGGTGTCCAAGTGGGGGTGTATAACAACCGACCAGCTCGGTACCGTCAGAAGCGCATGAGCGAGATTCCGCAGATGACTGACGCCGAGTACATGTTCGGTTTGACCCAGGCGCTGGAGAGCAGGCCTCCGCAGGGCGAATCTTTTGCCGACGAGGGGCCGTCAGAATCGGACGACGAGGATGACTTCATCTGATACGTTTCTGGCTCTTGCGCCCTACGGGCGTCAGGAGGTGGCGGACGCCCTCAGTTCGCTCCCAGATGGCAAGGACGCGCGGTCGCTACGTCATGCACCCTACGCAAATCGCCTCATCAAACTCCAGAGCGCCATGGTGCCTCCAAAAGTGGACGGTACTTCCGAGCGGGTGGCCGAAATCGTGAAAGGGCTAGCCGAGCAAGGCGCCATCTACCCCGATCAGATGGGCGCGATCCACTCAGATTTGCTTAATCGAGCTTACACGTGGAATTCCATGGGGGTGCAGGAGAGCATCCAGGCGCTGGTCAACGACGTGATCCACGGACAGAACCGGACATTGCAAGACGAGCTTGCGCGGACGAAAGAAATAGCGAATGCTTCGCTCTTGACCCAATTTTTCGATTCCCTGTACAAAACGGTGGATCGTGGGCAGCGAAATTTTGAGGGCTTTAAGAAACTTTTGCGTCTTTTCGTGAATAACGTGCCGAATGCCGAAGTGTACGGGTCTTCGGGGTCCTTTAGCGTGCAGATAAATCTTGGCGGATCTAGTCAAAACATCAATCTGACCAATGCGTTTGAGAATTTGAAGCCGATATGGGGCGCACGGTGGGACGCGGTGAATAATCCTCGCATCGGGGCGCTTCTGACACCCAACACTCGAGCGTTGTTGTTTTTCGTGAGCTCTTTTTACGACTACGGGGCTATGGAGCCCGGTAGTTACTTGGACAATATCATGAGGCTGTACAAGGAGGCTATCAGAGCCGATGTGGACGCGGAGGGTGATGCCATTATGGAGCTCGGGGAGGCGGGCGCAAATCTCAACTTGCGGTTCAACGATTACAAGGACACACTAAACTACCTCCTGCAAAATCGAGAGGTTGTACCCGACACGGCTCCGCTGGAGCTGAGCGCGGAGCAGGAAATGCTCTTGAAGTACCTGATGAGGCAACTACGACAGGCTCTTAAGGACGGGGTCCCGGCGGACATTTCTATCAGTACCATGACTCAGTACCTAGATCCTAGGCTGTATCAGACGAACAAGGTGTTCGTGGAGAAATTGCAAAACTACCTGTTGGCGGCTCAGGCGCGCAATCCTGTGTATTACCGACTGTTGGTGCTGGACCCCAACTGGCGGCCTCCGGCAGGCCTATATACGGGTAATTACGTGATACCCGACCGCTACGACTTTGAGGACGTGCAGAGCGAGCTTGAATACGCGGGTCCCTCCAGAGACGAGTATTTCGATGATTCTTTGTTCGCACCAGGTCCTCAGCGCCGCTTAAATTCGGCCGAGGAGGCTCAATTGGAGCGTGACATCGAATCTTTGACCGGCCACATTGACGAAGAGCTGGGCGTCCAATCTCAGGCTGGCTGGCTCGCCGATCACCGCCTGCCTGTCGCGTTCGATGGCGCTCTCAGCCTTACCGAACGCAACGCCTACAACACGCCGTTGCCCCCCGATTCCCACATGCGTAGCCGTTCTAGCTCCGTCGCTAGCGATCTTGGGCTATTGAACCTATCTGGGACGGGGGGACCGGGCTTTTTCGCTAGTCTGCGGCCTTCCATCGGCAGCCGTCAACCGACCGGCACGGCCGTGGGCCTCCGCCCGACGACACCGTACAGCGGTTCGGGGTGTATGAGGGGCACCGGTCTGGCGCGCAAAGTTTTAAACCCGGCCGCGTCGCGCCGGGGGCGCAAGCTACGGTTCTACTGAACCCTAGACTCTGACGAAGAAACTTAAAAACGCTTACCGCCATTTCGCCGCGCAGAAGTTGGAAGGATGTACCGGAGCCTGCGACCGCCGACGTCGATTCCTCCTCCGCCTCCCTCTGGTCCCTCGCCTTATCCGGCGATGATCAACGGATATCCCCCGGATGTGCCGGTGGGGTCACCTGCCAACGGAGATGCGGAGCTGTTCGTGCCGCTCCAGAGGGTGATGCCGCCTACGGGTGGACGGAACAGCATTAGATACCGGAATTATGCGCCGTGCCAAAACACCACCAAGTTTTTTTACGTAGACAATAAGCTGAGCGACTTAGACACCTACAACGAGGACGCGAATCACAGCAATTTTAGGACGACAGTCATTCATAATCAGGACTTAGACCCGTCAACGGCCGCCACAGAGACCATTCAGCTCGACAATAGGTCGTGTTGGGGCGGAGAGCTAAAAACAGCGGTGAAAACCAATTGCCCGAACATCAGCTCGTTTTTCCAAAGTGATACAGTGCGCGTGCGTCTGATGAGCAAGCGCGATCCGGGGGGTACCGACCCAGACGCGGGGGTGAACAACCCACCCGGGGCCGAGTACAAGTGGTATGATCTGAGGATTCCCGAAGGTAACTACGCGTTGAACGAGATCATTGACCTTTTGAACGAAGGCATCGTCCAGCTGTACCTGCAGGAGGGGCGCCAAAACAATGTGCTCAAGAGCGATATCGGGGTTAAGTTCGATACGCGGTATCTGGATTTGCTGAAGGACCCCGTGACGGGGCTGGTGACGCCCGGCACCTACGTTTACAAAGGATACCATCCCGACATCATCCTCCTCCCCGGCTGCGCGGTCGACTTTACGTTCAGCAGGCTTAGTCTTCTGCTCGGTATCGCGAAGCGCGAGCCCTACTCGAAGGGGTTTACGATTACTTACGAAGATCTTCAAGGAGGGAACGTGCCCGCGCTGCTCGATCTGTCCTCCGTGCAGGTAGACGATCAAGACGAGGACGTGATCGTGGTGGCAGACGCAAGGCCTCTTTTAAAAGACTCCAAGGGCGTTTCCTATAACGTGATCACCACTGGCGTGACTCAACCGCAAACCGCTTATCGGTCTTGGCTCCTTGCCTACCACACCCTGGACTCCCCCGCGCGCAATAAAACG竹ATTGACTGTTCCGGATATGGCAGGTGGTATCGGCGCTATGTACACATCGATGCCGGACACGTTTACCGCACCTGCCGGATTTAAGGAAGACAATACGACCAACCTTTGTCCTGTGGTGGCCATGAACCTGTTCCCGAGTTTCAATAAGGTATTTTACCAGGGCGCGTCCGCCTACGTGCAGCGCTTAGAAAATGCCACGCAATCCGCAACGGCCGCTTTCAACCGGTTTCCCGAAAACGAAATTCTAAAGCAGGCCCCACCCATGAATGTTTCCTCGGTGTGTGATAACCAACCCGCCGTCGTTCAGCAGGGTGTGCTACCGCTGAAGAATTCTCTGTCTGGCCTACAGCGCGTGTTGATCACCGACGACCGGCGCCGTCCCATTCCATACGTGTACAAAACCATCGCCACCGTGCAACCGCGCGTTTTGAGCAGTTCAACCCTGCAGTGAGGAGCGGAAGGATTTTCAAACATGTCCATTCTGATTTCACCCAGTGATAACAGAGGTTGGGGAGCAAACATGCGTTACCGCCGTAGAGCATCCATGCGCGGGGTCGGTCGCCGTCGTCTCACCCTGAGGCAGCTATTGGGTCTGGGGTCTCGCCGGAGACGGCGATCCAGGCCCACGACCGTCAGTAACCGTTTGGTGGTTGTGAGCACCCGCCGCCGCTCTTCCCGAAGACGCCGATGAAGCAAGCAGCTGATGAGATGTTCTTCTGACTATGTGTGCCGTCGCTATACACAGGAGCGACGTCGTTATGCCTTCCGTTCTTTTGACCGGCGGGCGGACCGCCAAGGGCAAGAAGAGAGCCTCTCGTCGTCGAGTGAAAGTGCCTAAGTTGCCTAAGGGAGCGCGCCGAAAGCGTGCGTCGGTGACGCCGGTCCCTACCGTAGCTACCGCGACCGCTTCCGAGCGCGCGGCTCTGACGAACCTAGCCAGACGGCTCCAGCGCGGCGACTACGCCGCTTGGAGGCCCGCCGACTACACGTCACCGGCCGTTTCCGAGGCGGCTCGCGCAGCCGCCTCGTCCGGCACCCCCGCGACCGCGAGGGATCTCGCGACGGGAACCCTCGCTCGCGCCGTGCCCATGACGGGTACCGGCGGAAGGCGGCGCAAGCGCACCGCTACCCGCCGCCGATCTCTGAAGGGGGGCTTCCTGCCGGCTCTGATACCTATCATTGCGGCCGCTATCGGCGCCATTCCGGGCATCGCAGGCACCGCCGTGGGCATCGCCAATCTGAAGGAGCAGCAGAGACAGTTTAATAAGATTTACGGGGACAAAAAGTGATGCTGACTGGACGCACTAAAAGGCCCTTTCAATAAACGCGTTTTTGTAGAACCGGCTCGCGTCATGGACTACGCTGCGCTATCACCGCATCTCGGTGGGTGGGCCCTGAGAGACCACCACATCGGCGACTCTAGCTTGAGAGGGGGAGCCATCAACTGGGGCAACCTCGGGTCGCGCATAACCAGCGCGCTGAACTCCACCGGTCGCTGGCTGTATAACACCGGCAACCGCTTCGTGCATTCGAACACTTTCAACCAGATTAAACAAGGCATACAAGACAGCGGGGTCATACGCAACGTGGCTAATTTGGCCGGAGAGACGCTGGGGGCCCTGACCGACATCGGCCGGTTGAAGTTGCAACAGGATCTGGAGAAGCTGCGGCGTAAAGCTTTGGGGGAGGAAGGTCCAGCGACCCAGGCCGAACTGCAGGCTCTCATTCAGGCCCTGCAGGCGCAAGTGGCTGCCGGAGAGCCGCCCGCCGCACCCGCGGCGCCGGCGCCGGCCCCGCCGCTCGTGCCCACCACTCGTCCTATTCCCGAAATGCTAACGGAGGTTAAGCCTCCCGTTACGTCTTCGGCGCCAGCCGTCCCCGTAGACGTGCCGACCACGCTGGAAATGCGACCTCCGCCGCCCAAGCGCAGGCGCAAGAGGGCACGACCGGGACAATGGAGGGCACGCTTGGACAGCCTCTCGGGTACCGGAGTAGCGACCGCCACTAGACGTATGTGTTACTAAAATTCCGTCGTTCCGCTATGTCTAATTTTTAGCTCACCGGTTGTCTCCCGAAGGCGTCATGACTGCGCTTACTCCCGACCTGACCACGGCGACGCCGCGGCTGCAGTACTTTCATATCGCGGGCCCTGGCACCCGAGAGTATCTATCCGAGGATCTCCAGCAGTTTATCTCGGCCACGGGGAGCTACTTTGACTTGAAAAACAAATTCAGGCAGACGGTCGTAGCTCCCACTCGCAATGTCACCACCGAAAAGGCACAACGTCTGCAGATCAGATTCTACCCGATCCAGACGGATGACACGCCAAACAGCTATCGCGTGCGCTACAGCGTCAACGTTGGGGACAGCTGGGTGTTGGACATGGGGGCGACCTACTTCGACATAAAGGGTGTGCTGGACCGCGGACCTTCCTTCAAGCCGTACGGCGGAACGGCTTATAATCCCCTTGCGCCAAGAGAAGCTATTTTCAACACCTGGGTGGAGAGCACTGGTCCTCAGACCAATGTGGTGGGACAGATGACCAACGTGTACACAAATCAGACCAGGAACGACAAGACGGCCACGCTTCAGCAGGTCAATAGCATCTCCGGGGTGGTTCCCAACGTCAACCTGGGACCCGGCCTCAGTCAACTAGCATCCCGGGCCGACGTGGATAATATTGGCGTGGTGGGACGTTTCGCCAAGGTAGACTCAGCGGGCGTGAAGCAGGCGTACGGAGCCTATGTCAAGCCCGTGAAGGACGACGGGTCTCAGTCTCTGAACCAGACCGCGTACTGGCTGATGGACAACGGAGGTACCAACTATCTGGGTGCCCTGGCTGTGGAAGACTACACTCAGACCCTGAGTTACCCCGATACCGTGCTCGTGACCCCTCCCACCGCTTACCAGCAAGTCAACTCCGGCACCATGCGGGCATGCAGGCCCAACTACATCGGCTTCCGAGACAACTTTATCAACCTACTGTACCACGACTCGCGCGTCTGCAGCGGAACGCTCAACTCCGAGCGCTCCGGCATGAACGTGGTCGTGGAACTCCAGGACAGAAACACAGAACTGAGTTACCAGTACATGCTGGCGGACATGATGTCCCGTCATCACTACTTCGCGCTGTGGAACCAGGCCGTCGACCAGTACGACCACGACGTGCGCGTCTTCAACAACGACGGCTACGAAGAGGGCGTGCCTACTTACGCCTTCCTGCCCGACGGGCACGGGGCGGGCGAAGACAACGGTCCCGACCTCAGCAATGTCAAAATTTACACCAACGGACAGCAAGATAAGGGCAACGTGGTGGCCGGAACGGTTTCCACACAGCTCAATTTCGGTACCATTCCCTCCTACGAGATCGACATTGCTGCTGCCACCAGGCGCAACTTCATCATGAGCAACATTGCCGACTACCTGCCCGACAAATACAAGTTTAGCATTCGCGGTTTCGACCCTGTTACAGACAACATCGACCCTACCACCTACTTTTACATGAATCGCAGGGTTCCCTTGACCAACGTGGTAGACCTGTTTACCAACATTGGTGCCAGATGGTCCGTGGACCAGATGGACAACGTCAATCCCTTCAACCACCACCGTAACTGGGGGTTGAAGTACAGGTCTCAGCTGCTCGGAAACAGCAGATACTGCCGTTTCCATATTCAGGTGCCGCAGAAATACTTTGCCATCAAGAATCTGCTCCTGTTGCCCGGCACCTACACTTACGAGTGGGTCCTCAGAAAGGATCCCAACATGATTCTGCAGTCCAGCCTTGGCAACGACTTGCGCGCGGACGGCGCGCAGATCGTGTATACCGAGGTGAACCTTATGGCCAATTTCATGCCCATGGACCACAATACCAGCAACCAGCTGGAGCTGATGTTGCGCAACGCTACCAACGACCAGACCTTCGCGGACTACTTGGGCGCCAAGAACGCTCTCTACAACGTTCCGGCCGGCTCCACGCTGCTGACCATCAATATTCCCGCCAGAACATGGGAGGGTATGCGGGGCTGGTCTTTTACCCGCCTCAAGGCCTCGGAGACGCCCCAGCTGGGCGCTCAGTACGACGTCGGTTTCAAGTATTCAGGCTCCATTCCCTATTCGGATGGCACCTTTTACCTGTCCCACACGTTCCGCAGTATGAGCGTGTTGTTTGATACCTCTATCAACTGGCCTGGCAACGACCGTCTGCTCACACCTAACCTGTTCGAGATCAAGAGGCCAGTGGCCACCGACAGCGAAGGCTTCACTATGTCGCAGTGCGACATGACCAAGGACTGGTTCCTCGTGCAGATGGCCACCAACTACAACTACGTGTACAACGGTTATAGGTTCTGGCCTGACAGACACTACTTCCACTATGACTTCCTACGCAACTTCGACCCCATGTCGCGTCAGGGCCCCAACTTCCTGGACACCACGCTGTACGACCTGGTGTCCAGCACTCCCGTTGTTAACGACACCGGCTCACAGCCGTCTCAGGACAACGTGCGTAACAACTCCGGCTTTATCGCCCCTCGCAGCTGGCCCGTATGGACCGCACAGCAGGGCGAAGCCTGGCCCGCTAACTGGCCGTACCCGCTGATCGGGAACGACGCCATCAGTTCCAACCAAACCGTCAACTACAAGAAGTTCCTGTGCGATAACTACCTCTGGACCGTGCCGTTCAGCTCGGACTTTATGTATATGGGAGAGCTGACCGATCTGGGTCAGAACCCCATGTACACAAACAACTCCCATAGCATGGTTATCAACTTTGAGTTGGACCCCATGGATGAGAATACTTACGTGTACATGCTGTACGGGGTATTTGATACCGTTCGCGTGAACCAGCCCGAGCGTAACGTGCTAGCCATGGCTTACTTCCGTACGCCTTTCGCCACAGGCAACGCTGTGTAAAAAAAAGACGGCTGGGATGTCGGGAACCACCGAGACCCAACTGCGGGACCTGCTGTCCTCTATGCACCTGCGGCACCGCTTCCTGGGTGTTTTTGACAAAAGTTTCCCAGGATTTCTCGATCCGCACGTGCCCGCCTCAGCTATCGTCAACACCGGCTCCCGGGCCTCCGGAGGTATGCACTGGATCGGGTTCGCGTTCGACCCTGCCGCAGGACGATGTTACATGTTTGACCCTTTCGGGTGGTCAGACCAGAAGCTGTGGGAGTTATACAGAGTCAAGTACAACGCTTTCATGCGTCGGACCGGCTTACGGCAGCCCGATCGCTGTTTTACCCTGGTCCGTTCTACCGAGGCCGTGCAGTGCCCCTGCTCGGCCGCTTGTGGGCTTTTTAGTGCCCTTTTTATCGTCTCTTTCGACCGTTACCGGTCGAAGCCCATGGATGGCAATCCCGTGATCGACACCGTAGTCGGTGTGAAGCACGAAAATATGAATTCTCCGCCCTACCGCGACATCCTGCACCGTAACCAAGAGCGCACCTATTACTGGTGGACCAAGAATAGCGCCTATTTTCGTGCTCATCAAGAGGAACTCCGACGAGAAACGGCCCTTAACGCCCTACCTGAAAATCACGTTTAATGACCGACTGTAAATAAAGAACGACGCACACACGTACTGTACATATTTGTGAATAGAGCAACCGTTTATTAGATAAACGTCAATAAATGCCGACCGATAGACCGACAAGGCTCTTCACTGGCTTTATTTAAAGAAACAAAAGGATTAAGCGAACGGGTCGTCACTGGCGATGGGCGAGACTGGCGCCAACACCTCCGTTTTAAAGGCGTACGACTCGTTCCAACGGAACTCAGGCACATGTGTGGGCTCTGAAGAACCCATCACGGCAGTAAACAGCTCCGTAGCAAAGACGTACGCGTAGCGCAGATCCATGGCCGACAGACGCCAGGCGCAGGTTTTTTCGGTCTTCTTCAGACCGCGGCCTGCTCCGCCCGACGCCGCCTGCGGGTTGCAGCAGGTGAACACCATGGTATGCGGGTTTTTCTTGTGAGCCTTCATATCGGGCCTGCTCTCGACCATGTCGCGAGTAATGTCGTCTGTGCCGTTGAGCTTATAAGGAGTCATTTTACAGAACTGTCTCCCTGAAATGGCTCGATCGGAGGCGTAGTTGCAGTTGCAATTGGTTGAGATGAGGACACATTCCTCTGCCCGGCGCTTGTCCGCGTTGGGGTAAAGCGCCTTCGTCCAGTCTATGTCGTGACGCATCGCGCTGACCGCCTTGGCGGCGTCGGAAAAGACCATGGCGCAACTGCCGTGCGCGTGGGGATGAGGGAAGCCGCTGTGCTCCTGATCCTTGTAGCACACCGCGTTCGCGTCGAACCTGAGCACCACCACCTGTCGTCCAAACCGGTTCTTCTCGATTACGCCGTTCTGTTCGGCCAGAGCCCTCTTTCCCGCCTCGCTAGACGGGTTCAACTCCACGGTACGAGGTTTCGTCACCATGTCCACACCGTGCATGCATTTCGGGAAGGGCTCCTGGAGCGCTGGGAACCAGCCATGGCGCCAAACGTGCGCCCCTCCGGGCACGAACTTGGGCTCCAGACCCGCGCGGCTCTAGATAACGGCTGCCAGGAACCGCCCTACCTGAGCGTTGAAAGAGTCGTAGCTAGAAAAGGTCAGGCGAAATTCGGGATGCTTTTTGCGAACGTATGTACCCCCCATTTTGGTCCAAATGGAGTCGTCGGGGCGCACGCTGGCTCCCTGCCACTGTAGGTCGAGAGCTTCGCAGATGCTGGCGACGGTGGCCATGGCGCGTTGCGCGCCGTAGACCACGGGGTCTGACAGAGGGGCCTCCGGGGATTCCTCGTCGCTGGCGTTTTCTTCGTCATCGACAACGGTTTCCCGCCGGCGGGTAACTCGCCTTACGGGGGATGGGGACTCCTCGCGGCGGCTGACCTTCTTGCGAGTCGCGCCTCGGCCCGGGGCGACCACTTCCACTTCTTCCTCCTCCTCTTCCATCATGACTTCTGCCGTTCTCTTGACAGGCTTGGTGCTGCGAAAGCCATGAGCTCTTTTCGGGGTTCTTTCCATGACTTCTGCTTCGCTGACGGGATCTCGCGTTTCAAAAAGTTCTTGCTCTCCCTCCTCTTCAGAGTCAGGGACTACTGCCGGAGAGGGTGGAAGCGTCTTTTGAAGCTTCCTGGGACCTATAGGGTAAAGTTAACGCCCATCGTCAGCGAGACCACGCCTCGCTGGCCGATGGGATCACGAGACACGATAAAAGACCGCGACCAAAACACTCTTGGGGCTAGTATCCCTACCCGGGTGCGAGCGTGGCAGATCTTCGCTCTTCTGCTTCTCCAGTGGATTCTCGGGGTCTTTCGGCCCCGTCGGTCTCTGGGGTGGGAGAGGCCTGCTCCTCCCTCTGTTTGACTTGATTACCGTCGACGGCCCGGGCTCTTCGAGGTCCACGAAGTCCGCCACGTCTTCGTCGCTGCTGATCGTCTCTGGGTGAAGCGTTTCTGCCATCGTGGCTGTCATCGAAAATGGCAGACAAGATTACCCGAGAGGAAAAAACCATAGCGACGCTGGACCTCGTGTTACGCGTGGTCGTCGATGCTGGTAACTGGGACGTGTTCTCGAAACGTTTGGTTCGCTACACACGCGAACAGTACGGAATCGAGCTGCCCGAAGATATCGGGGACTTACCGGACACATCTGAGGTCTCGAAAGTGCTGTTGAGTCATTTGGGGGAAGACAAGGCGGTACTGTCCGCGTACCGAATCGCGGAACTGACGCAACCTTCCGAAATGGACCGCGCTAAGGTCACAGAGGGAGGCCTGGCCGTACTTAACGCGAGTCGCGATGAAAGCGAAGCTCAGAACCCCTCGAACCCCGAACCCGAGAGCATCGAGAGCGACGCCGTAGAGGATCTCGGCGTTGCAGCAGAGAGCGACCCTAGCGATGACGAACCCGACCCAGAACCCGAGTATGACCATCGAGAGGCGGATCATGACTCTGATGCGGATAGCGGATACTATTCGGCAGATGGGGGACGACCTGGAACACCAGTGGACGAGGAGCCCCAGGACGATTCTCCCTCTTCCGAGGAGACCGCATCCACTGTCATCGAAGAAGCGCAGACTAGCGCTAGCAACGATTCTCATGACGACGACACTCACCGCGACGACGGCAGTGCTTCTGAAGAGGATCTCGAGCGGGACGCCCTCGTGGCCCCGGCCGATCCTTTTCCCAACTTGCGGAAGTGTTTCGAGCGCCAAGCCATGATGCTGACCGGGGCGTTAAAAGACGCCGCGGACACGGCTGATCCGCCAGAAACGCTCTCCGTCGACAGCGTGCAAAGGCAGCTCGAACGCTTCGTCTTTAACCCCGACCGCCGCGTGCCCGCCGAACACTTGGAGGTACGCTACAATTTCTACCCTCCTTTCCTCACCCCCAAGGCCATCGCGAGCTATCACATCTTTGCCGTCACCGCTTCCATCCCTCTAAGCTGCAAAGCCAACCGCAGCGGCAGCGACCTTCTAGCCAAAGCAAAAGAGAGCACTTTCTTCAAACGCTTACCTAAATGGCGTCTCGGGATAGAGATCGACGACGGGTTGGGAACGGAAGTCACGGCGGTAACAGAGCTGGAAGAGGCAAAAATGGTTCCGTTAAAGGACGACGTGTCTCGTCTGCAGTGGGCAAAAATGCGCGGCGAGCACATTCGCTTCTTCAGCTACCCGTCGCTGCACATGCCTCCCAAAATTTCCCGCATGCTGATGGAAACGCTGTTGCAACCGTTCGCGGACGAAAACCAAAAGGCGGAAGAGGCACTTCCCTGTCTGTCGGACGAGGAAGTGCTGGCCATCGTGGACCCGACAGGGCGCCTCCACGGCGAGGACGCGCTCAAGGCCGTGGAAAAGCGGAGGGCCGCGGTCACTATGGCGGTACGCTACACCGCGACCCTCGAACTCATGGAACGCGTGTTCCGCGAACCGTCTATGGTCAAAAAGATGCAGGAGGTCCTCCACCATACCTTCCACCACGGCTTCGTCGCCCTGGTACGCGAAACCGCAAAAGTCAACCTGAGCAACTATGCGACCTTCCATGGGCTTACCTACAACAACCCCCTGAACAACTGCATCATGTCCAAGCTCCTAGAAGGAGCAGACAAGGAGGACTATGTGGTGGACTCGATCTACCTTTTCTTGGTCCTGACGTGGCAAACGGCTATGGGTATGTGGCAGCAGGCCATAGACGATATGACTATCCAGATGTACACCGAGGTCTTTACCAAGAATAAGTACAGGCTGTACTCGCTGCCCAACCCGACCGCCATCGGCAAGGCCATCGTGGACATCCTCATGGACTACGACCGGCTCACCGAGGAAATGCGGAAAGCGCTGCCCAACTTCACCTGTCAGAGCCAGATTACTGCCTTCCGCCATTTTCTACTGGAACGGTCCAACATCCCAGCGGTCGCCGCGCCTTTCATGCCAAGCGACTTTGTGCCTCTGGCTTACAAGCAGAGCCCTCCCCTCCTCTGGGACCAGGTCTATCTGCTGCAGCTGGCCTTCTATCTCACTAAGCACGGAGGCTACCTGTGGGAAGCCCCGGAGGAAGAGGCCAACAACCCGTCCAACCGGACTTACTGTCCTTGCAATCTCTGCAGTCCGCACCGGATGCCAGGTCACAATGCGGCATTGCACAACGAGATTCTGGCTATCGGAACGTTCGAGATCCGCAGTCCGGACGGGAAGACCTTCAAGCTCACGCCTGAGCTGTGGACCAACGCATACCTCGACAAATTTGACGCCGAGGACTTCCACCCGTTCACGGTGTTCCACTATCCCGAGAACGCATCGCGGTTCGCATCCACTCTAAAAGCATGCGTCACGCAGAGCCCCGAAATCTTGAGCCTGATTCGCCAGATTCAGGAATCGAGGGAGGAGTTTCTGCTCACCAAGGGCAAGGGGGTGTACAAAGACCCGAACACCGGAGAAACCATCTCCAGACAGCCCCGGGACACTGCCCGCGCGCAGCACGCTGGAGACGGTCAAGCTCTACCAGCCCCTGGAGCCTATACCACCGGAGGAAATAGAGCGGAGACAGCGCCTGCTGGAGCTGTACGGCTTGCCCCGGACTACCAAGACGGGCAGTTTCCTATCGCGAAAGTCGGCCCGCACTACCATGGCCCAAAGAATGTTAGACGAGAAGACCAGGGTTACAGAGGCGGGCCCGGAGGTGTACGGGGAGAGCGCGAGGTCGTCCTTTCACGAAGAGCAGGAGGAAGACGTTTCGGACGGAGAAACACTAGGCAGTCAGGATACAACGAACGGGCTAACCGATATTTCGGAAGAGGAGGAGGAGGATCTGTTCGAGGGCAACAAGGAGAACATCCCACCACCTCGCCGTCCGCCTCGGAACCGCCGGCTCCGAGCCGCATACTCGCTCGAGGAACCCCTCCTTCCCCCGAGCGCCGCGACCGACAAGAAGAGTAAGAAAGTCCCAAAAAGGCGAGGTAAATATCGCAGCTGGGCTAAGCACCGCGTGGCGATATGCCAGGCACTTCGCGATGCGGTCTTTGACCGCAAAAAGGCGGGCGAAATCCTCAAGCGGGGTCACCGGCTCTTCGTGCCCGCTACTGTCATAGGCTACTATGCTCGCAAACTCTCTCCCTCATTTCTCGCTCCTCTCTCCAGCCACACCGCACCCCTCCTCCCACCAAAAAAACACCGGCGCTAAGGCTGTGCGTCTGCGCCAAGATCCGGTGCCGCAGCACATCGCGGACCTCAGAGGGGAAATACTCGACATCCTGTTGGAAATCGAGTCGTACGCCCGCCGCCGTCCCGACCGCCACGTGTCCATTCGCAACAGAACGCGCGAAAGCATCACCCGAAAACTGCATTACGAGAAAAATGAAGATAAGCTTACCCGTATGAAGAGCGATGCTATCAAGTTGCTCGCTCTCTGGCAGACCGTTTAACTCGTGTTCCTTTATAGCCCTTCGGAACCATGAACCTGATGAACGCCACACCCACCGAATACGTATGGAAGTACAACCCAGTCTCCGGCATTCCCGCCGGCGCGCAACAGAATTACGGCGCCACTATAGACTGGGTGTTGCCAGGAGGAACCGGTTTCGCAATAGCAACCAACGACATTCGAAGACAAACCCTTAACCCGGCCGTGACCCGTGCAATTACCGCGCGTTTTGAAGCTGAGTCAGACCAGCAACCGTACGCTAGCCCTCACGAGACCAATGTTATCGCGGCCAATGTCCTCGACTCGGGTTATCCCAAATCCGGTCTCTACCCATTAGAGCTCAGCGGCAATCAGCGCGTACAGCTGGCAGGCGGCCTAATGGTAGGTCGCACTGAGGGCAGGATGCAATTAGCGGGCGGTTTAACAGAAGGAAGAGTGCAACTTTCTGGAGGTTTCCACGGACGGCCGTTGGTTAGAGGGCGGAGCAGAAGACCGCCCAGATGGTGCGGCGCCGAACTGACTGGGAACGGACTGCCCGAGCAAGCCGAAGTCACTTCTGACACTTACAAGTACTTCCTGAGAACACAGGGTCCCAGCCAAGTGGTTGAAGAGCCCGGCGTCTTTTCGCAAAGACAATTTATGACTACCTTCCTCCCCTCCGTTGTCCCTCATCCCTTCGACAGCACCAACCCCGGCGATTTCCCCGCGCAGTACAGTGCCATCTACAAAGGCCGCACGGCCTTCGAAGACACCTTTTGGGACTGGTGAAGCGCACCTTTTGTTGGCGATGCTCCGTTTCGCAATAAATTTCTTCCAATTCTCTGTCGTTAAACGGCTCCCGTCTGGTCACTGTCACGCGCTCGCCGCCCTCGCTCGTCACCCGCGCGCGGTACCGTCGCCTCAGCCAGAATACAAAACCGGGGTTCAGGGGTTCGTCGAACCGTACCACAGCCTGGTCGTTTAATCTCAACCAATATTTTCTAGGGTTCGACATCATGAACGAGGAGGTTCCCCTAAAGCGTGTCAGCCCTGACGAAACCGAGACGGTTCCCAAAAAACCGCGAACCGACGTTCGCGACACCGTCAGGGCCGGCACTGACGACACGGTAGATCTCGTGTACCCTTTTTGGTGGAATCTCGGAACGGGAGGGGGCGGAGGAGGAGGAGGCGGGGGCGGCGGCAGTGGAACCTCTCTCCAGCCCAATGACCCGCTTTACGCCGCCAGCGGGACCATCAACCTACGCATGACATCCCCGCTAACGTTGTCACAACGAGCCTTGGCTCTCAAAACGGACAGCACCCTCACCCTCAACACGCAAGGCCAGCTGGGCGTCAGCCTCACCCCCGGAGACGGGCTCGTCCTCAACACCAACGGGCTCAGCATCAACGCAGACCCGCAAACCCTCGCATTCAACAACAGCGGGGCGCTCGAAGTCAACCTAGACCCCGACGGACCCTGGTCTAAAACCGCCACGGGGATCGATCTGCGTCTAGATCCGACGACGCTCGAAGTAGACAATTGGGAACTAGGAGTCAAGCTCGATCCCGACGAAGCCATCGATTCCGGGCCCGACGGTCTCTGCCTCAACCTGGACGAGACTCTGCTGCTCGCCACCAACAGCACATCCGGCAAAACGGAGCTCGGGGTACACCTCAACACCAGCGGTCCCATTACTGCGGACGACCAGGGCATCGACCTGGACGTCGATCCCAACACCATGCAGGTGAACACAGGACCTTCCGGAGGCATGCTGGCCGTCAAACTCAAATCTGGCGGCGGGCTCACCGCTGACCCCGACGGTATCTCGGTCACGGCCACCGTCGCGCCTCCGTCCATCAGTGCGACAGCTCCTCTCACCTACACCAGCGGCACCATTGCACTCACTACGGATACGCAAACGATGCAAGTCAACAGCAACCAACTGGCCGTGAAGCTCAAAACGGGAGGCGGTCTGACGGCTGACGCGGACGGAATCTCCGTTTCGGTTGCACCGACCCCGACGATCAGCGCTTCTCCCCCGCTAACCTACACCAACGGGCAAATAGGGCTCTCTATCGGAGACCAAAGCCTCCAAGTCAGCTCTGGACAGCTCCAAGTCAAACTGAAAAGCCAGGGCGGTATTCAACAGAGCACGCAGGGGCTGGGAGTGGCGGTTGATCAAACCCTTAAGATTGTGTCTAACACGCTCGAGGTCAACACGGACCCGAGCGGACCCCTCACCAGCGGCAACAACGGTCTCAGCTTAGCGGCCGTCACACCCCTAGCAGTGTCTTCCGCCGGCGTCACCCTGAACTATCAGTCCCCTCTTACAGTCACGAGTAACTCTCTCGGGCTCTCCATAGCCGCGCCACTCCAGGCGGGTGCGCAAGGCTTGACGGTAAACACGATGGAACCCTTGAGCGCCTCGGCGCAGGGCATCCAGCTGCACTACGGACAGGGATTTCAGGTCGTCGCGGGCACGCTGCAGCTGCTCACTAATCCCCCCATCGTTGTCTCATCCCGCGGGTTCACCTTACTCTACACTCCCGCCTTCACGGTGAGCAACAATATGTTGGGGTTGAATGTAGACGGCACTGACTGCGTGGCTATCAGTTCAGCCGGCCTACAGATCCGTAAGGAAGCCCCGCTGTACGTGACCTCGGGAAGCACTCCAGCATTAGCCCTTAAGTACAGCTCCGACTTTACCATTACCAATGGTGCGCTCGCGTTAGCGAACAGCGGCGGAGGAGGAAGTTCCACACCCGAGGTGGCCACCTATCACTGCGGGGATAACCTACTCGAGTCCTACGACATCTTCGCCTCTCTACCCAACACCAACGCGGCTAAGGTGGCGGCTTACTGCCGTTTAGCTGCTGCAGGTGGCGTGGTCAGCGGGACCATTCAAGTGACAAGCTATGCCGGACGATGGCCTAAAGTGGGCAACAGCGTTACGGACGGCATCAAATTTGCCATCGTCGTGTCTCCCCCCATGGACAAAGACCCACGATCGAACCTCAGTCAGTGGCTGGGTGCCACCGTATTCCCTGCGGGCGCGACTACTGCTCTCTTCTCACCCAACCCGTACGGCTCCCTCAACACCATCACCACACTGCCATCCATCGCCTCGGACTGGTACGTGCCCGAGTCCAACCTGGTCACGTATACCAAGATCCATTTTAAACCAACGGGGTCGCAGCAGCTGCAGCTCGCGAGCGGAGAACTCGTTGTTGCAGCGGCGAAATCGCCCGTGCAGACGACGAAATACGAATTGATCTATCTGGGATTTACGCTTAAGCAGAACTCCTCGGGTACCAACTTCTTCGATCCCAATGCCTCCTCCGATCTATCCTTTCTGACACCACCGATTCCGTTTACTTATCTGGGGTACTATCAATGAACTTGTTAACTCCTGCAGCAGCAGCAGCAGCAGCAGCAGCATGGCTGACCAGAAAAGGAAGCTGGCGGATCCGGATGCCGAGGCTCCGACGGGCAAGATGGCCCGCGCGGGTCCGGGAGAACTGGACCTCGTCTACCCTTTCTGGTACCAAGTAGCCGCTCCCACGGAAATCACACCTCCGTTCTTGGACCCGAACGGTCCCCTGTACTCCACGGACGGCTTGTTGAACGTCAGGCTCACGGCACCCCTCGTTATCATCCGTCAATCTAACGGCAACGCGATCGGGGTCAAGACCGACGGAAGCATTACCGTCAATGCGGACGGCGCGCTGCAGATCGGAATCAGCACGGCCGGACCTCTCACCACTACCGCCAACGGCATCGATCTTAATATCGATCCCAAAACCCTGGTCGTTGACGGTAGCAGCGGCAAGAACGTCTTGGGAGTGCTTCTGAAAGGACAGGGGGCGCTACAGAGCAGCGCGCAAGGCATAGGCGTTGCCGTCGACGAGTCTCTACAAATCGTCGATAACACCTTGGAAGTGAAGGTAGATGCTGCAGGTCCGCTCGCCGTCACAGCAGCCGGCGTAGGGTTGCAGTACGACAACACCCAATTTAAAGTCACGAATGGGACTTTGCAACTGTACCAAGCGCCCACTAGCAGCGTGGCCGCATTTACATCCGGGACGATCGGCTTGTCCTCCCCTACGGGCAATTTTGTGAGCTCTAGCAACAACCCGTTTAACGGGAGCTACTTCCTGCAGCAGATCAATACCATGGGCATGCTGACTACCTCGCTCTACGTCAAAGTCGACACAACCACCATGGGTACGCGTCCCACGGGCGCGGTAAACGAGAACGCGCGATACTTTACCGTCTGGGTGAGCTCCTTCCTCACGCAGTGCAACCCCTCGAACATCGGTCAAGGGACCCTAGAGCCAAGCAACATCAGTATGACCTCTTTTGAACCCGCCAGAAACCCCATCTCACCTCCCGTGTTCAATATGAACCAAAACATACCCTACTACGCTTCCCGATTCGGGGTACTGGAGTCTTACCGGCCTATCTTCACCGGCTCGCTCAACACGGGAAGTATCGACGTACGGATGCAAGTGACGCCCGTCCTCGCCACCAACAACACGACCTACAATCTCATCGCCTTTACCTTCCAATGCGCCAGTGCCGGACTGTTCAATCCCACCGTGAACGGCACCGTGGCCATCGGACCGGTGGTGCATACCTGTCCCGCTGCCCGCGCCCCCGTTACGGTCTGAACAATAAAGACAAGGTGAACCATTTATACAGTCTCACGTCTCTTTATTGCATACGCTCCGCTAAATGTTTCCATTCGCTCATTTGCCAGTAATACAGCAGATTCGCAAACTCACTGAACCAATCTTCTGTATAAAAATGTACGCGCTGCGTGTCCAAATCAACATCAATTTTCCTCATATACAGACAGGGGCTGCCACCCGCCTCCCCCAAGCGCGACACCGCAATTAGGAATGGTAGCCTGCTGTGCAGGTCCACGTGAATTAACATCCCGCACACGTTCCCGATCGGTCGCTGCATAAATACTGGAGAGAAATCGCTAAACCCCGGTGACGCCCACATAGCCACGAAGTACACCCCTGCCACATTCAAGTCATCCTCCAACCTGGCCCAAACATAAGTGGCCAAATCGGAAGGAGCCAGGTGGCAAGCCGATAACCCCATACGATGCAAAGGTAACCCGTGGCAAGCGCATCCCCCGAAATGAAGTTCGAAAGAATCGTAACACAGTAGCTGATAGGCATGAAGCGGCGTCGGCATCTGAAGACCGTCATCATCTTCGTCGTCTTCCATGTCATCCCCAACTTCCTCCTCGCGCTCCGCTTCCTGTTGGCGGCGCTGCTGGTGCTGCAGCACCATCTCCAGGATCTGCTCGTCGTTCATCTTAATCCGGAATTATCGCGTACGGATGTTCCTCGTCGTCCGAACTGACAACAGAAGGCGGAGGAGCTGTCAGTGGTGCTGTAGAGGCTAACGATGCTGCAGCACCGGTCTCTTGCAATTCGAAATACCAAGGGTTGCTACTGACGGTCCAGTTCCCGCCCCGTGAACCAGGCCAGCGGGAAATCGGTGCAGGTAGGGGATCCGGTGAAGGAGACCGGGAATGGAGGGAAGGAACTGCGAGATCCTTATCCACTCGATACAAACCGTATAACAGGGAGCCCAACGCCAGGTACACCAGGAACGTACTACAAACGAACACGCTGATTACAAAGTTTAACGAAGACAGATGGTTCTGTAGGAACAGGAAGCTGCACAGGATGATGCTGCTGTAGGACAGGGCGACCAGGAGGGCCAAGAACTCGCGCCAATAGCGTCCACAACACTGCAAAATCAAACACGTAATTAGCTATACGGACGTTCACCAGCGACTCTCGCGCGTCGTTCCATAAACACATTGCGCAGATAAGCCAACTGAGCAGAACAGAACAGAGAGAGAGGTTGCCGCGTCGAACACTGTTTGCACTGTCCGAAACACTCGGGATGAGACTCCCCGTACTTCCCGTGCACATGAAATACCCACTCTTCGACGTTAGCGTAGGACAACCGACGGTAACCGGGGAAGTAACACAGTCCCTGCGACACGATCGGCCACAGTTCCGGCGACACCATCACGCGGAGCATGCTTCTCAGGCAGACGGGTTGGGTCACGGCGCTGCTGCGAGAAATAGTTTCCACCATGATGGTGGCCGTCACGGTCACGCGACACGCATTCATGAGAACAACCGGAGACCGCACAAAAGGAACAGACGAAGGCACTTGCGAAAAGGACACACACAGTAGCTGATAGGCATGAAGCGGCGTCGGCATCTGAAGACCGTCATCATCTTCGTCGTCTTCCATGTCATCCCCAACTTCCTCCTCGCGCTCCGCTTCCTGTTGGCGGCGCTGCTGGTGCTGCAGCACCATCTCCAGGATCTGCTCGTCGTTCATCTTAATCCGGAATTATCGCGTACGGATGTTCCTCGTCGTCCGAACTGACAACAGAAGGCGGAGGAGCTGTCAGTGGTGCTGTAGAGGCTAACGATGCTGCAGCACCGGTCTCTTGCAATTCGAAATACCAAGGGTTGCTACTGACGGTCCAGTTCCCGCCCCGTGAACCAGGCCAGCGGGAAATCGGTGCAGGTAGGGGATCCGGTGAAGGAGACCGGGAATGGAGGGAAGGAACTGCGAGATCCTTATCCACTCGATACAAACCGTATAACAGGGAGCCCAACGCCAGGTACACCAGGAACGTACTACAAACGAACACGCTGATTACAAAGTTTAACGAAGACAGATGGTTCTGTAGGAACAGGAAGCTGCACAGGATGATGCTGCTGTAGGACAGGGCGACCAGGAGGGCCAAGAACTCGCGCCAATAGCGTCCACAACACTGCAAAATCAAACACGTAATTAGCTATACGGACGTTCACCAGCGACTCTCGCGCGTCGTTCCATAAACACATTGCGCAGATAAGCCAACTGAGCAGAACAGAACAGAGAGAGAGGTTGCCGCGTCGAACACTGTTTGCACTGTCCGAAACACTCGGGATGAGACTCCCCGTACTTCCCGTGCACATGAAATACCCACTCTTCGACGTTAGCGTAGGACAACCGACGGTAACCGGGGAAGTAACACAGTCCCTGCGACACGATCGGCCACAGTTCCGGCGACACCATCACGCGGAGCATGCTTCTCAGGCAGACGGGTTGGGTCACGGCGCTGCTGCGAGAAATAGTTTCCACCATGATGGTGGCCGTCACGGTCACGCGACACGCATTCATGAGAACAACCGGAGACCGCACAAAAGGAACAGACGAAGGCACTTGCGAAAAGGACACCTCAAAGCTCATCGAGCGGAGAGCCATCTTTACGGATATCTTCTCCGCAATCAGAAAGCCTGTGGTGAAAAACTTAAAATCTGTCTTCCTGCGAGCAAGCATCCACGGTTCCAAGTCGTACTTCATCCCAGGTGTAATAAAAAGCAACCTACGTGAGAGGTAGTGCAGCAGGGCGGTCTTCTCTGCCCGGTTCAGGTGAAGGGCACTCACAATCCGGACTATGCAATTCATGAGTACGTAGTCTCGCCGTTTGAAACACACAAACTTTGCGCTGCGTACCGTCACTAGCACCGTGACAGAACTATGCAATCGCCTCATCAGATCATTATCGAAACACCGCAAGCTAGCCACGGCTCTATTTATGCGGTACTCGTTCAGTCTCTCCATTTCCTCCTGTCGACAAGTTGGATCGTGACGTAGGAGAAAACTAAACCATATTACTCCTACTTCGTTATGAAAGCCACAAGCTCTGCTGACGGTTAAAGACTCCTTAAGAAAGAAAAGGTAGTACAGTCAAGCTGACCCATACAGGTGAACCCGCCCCAAGTCACGTAAGTCAACTCACCGAAAGAGGACACAGAGCCATATCCGCTGCTTCAAAGCTTTATTGACGGGTCTAAAGGCGTAAAGAAAAGAAGAATTTACCGTTCTGCATCTCAAACCCCACCACCACGCGAAAAAGTCCGAACGATGCTGCAGCACCGTTCACGCAAAAGTCCCGGACGCGCACAAATAAACCCTTAATCCCGATAACGGTGCTGCAGCACCGTCACGCTGCTGCAGCATCGTCAGACGTTTATGACATGCAGCCGATTCCGTGCGGATTTATGGTCCCATAACGGTTCCAGGTCCTTTCGTTGCTGCAGCACCGTTTCACGTAAAGAAGCTGTACAGGTCAAACTGGTCCGGATTACTGATTATTCGGGGGAGAGCCACGTGACGTAGACTCGAACGACGTCCACTTCCGATACAAACCACATCTCTCTGGACACAGGCTTGTCCGCCTTGAGCCAAACCATGTGATTCTTCCGGTCCGTTCTGACGTCAATGCCGACACGCCTCTTGGTGTTTGAACAGGCATCCCAGTACGTAGCCAGGACCACTCGGTGACGTCGAGGTTGAGGTTTAAAGGTCACTACGGCCTGTAACCCGGTACTCCAGGGCCCTAAACTAACATATTCTCCGGCCCTGCCCACTACATTCGGGTGATCAAATATGACATAATCCTTAAACAATTTGGGGAACTTCAAACAGCCACATTTGGGCGGGACAGGAAGATGGTGCGCAGAAACATTGATATGAGAGCGCCATCTAGGGACATCAAAGCGGTGCCCGCCTGGATGGCAATCGTACTTCTTAGTTCCGGTAAAGTAATAGGTGTGAGTCCGGAAACACGTAAACTCCGTCACTTCCTGTGTCGTCATTGCCCTCGCCCCTAGTGACGTCAGAGTGCCACGCCCCTTGTACAGTCTAATAAATTTTAATACACCCCCGCCCCTAGCATATAAAACAATGGGAGCCTCGCCCACATTCCTATCCCTAATAAAATACCATCTGACCGAATACCCGTGTTCCATCCCTATTGTTTTAGTATAATAAGGGTCATAAGTCCACAACTCCGCGGCATTGCCCTCTGTCACCACCAACAGCAAATAGGAAGATGCCATGTCATCCTCTCGTAAAAGCATCCTCCAATCAGCTACCTCTTCCGTGTAGTACTGAGTTGGCTGACTGTAATCACGCCCCGTGACGTAGGCTGACCACGCGGAAGGAACACTTCCGTGCATGCTCAGTAGCTGGTCAGCCTGGTGAGTATCCAGGGCCTTCATAAAGGTCAAAGGCGCCATAATGTGATAACACAGTCCATCCGATCGGAGGAAATCAAAGGGAATATGTACATCTTCACAATGGCGCCTCCCAGAATAAGACCATGCACAGATTTGACCTTTCCACCAAGCACGTGACTCGCAAGCCTCATGTTTTTGACCAGTCAGATCGCTCCGTATATACTCGTCTCCTATTGGTCGATCAAAACCGTACGAACCAATACTAGACGCAATCACCACTACGTAATCCGCGTCATCCCTAGAGATAACACTATCCGCATCCCTATTGGCTGACCAATGACCACCGGAAGACAGCAAAAGGTTTAACCCTTTTGTGTGTAAGTCCATCCTATAACCCTGGAAACTTTCCAATGGGGGATCTAGCGCCACTATGCGGCCAACCTTTTTTGACCCCGAGAGAAAATCCCGCGCAGAGAACAGAGCTCTCAGGTAGGGGTCTGGAGCTCTCTGGAAAAATCGCGGGCTCTTATACACTTACTCTCCGCCCATTCGAAAGCCGCGCCTGACTAGAGTACACACTATAAATTCCATTCCGGTGACTTACTACTAGGCGCTGGCCACTTATCAAAAGAAACAGTTCTAAGAATAGGACAAAGTCCAACCGCAATAAAACACCCTTGTCAAACATGATAAGAGTGTTCTCGAGAAGCTACTGGAAAAGCAAACAGTCCAACTCCCAAGTTAAATATTACGCAAAGAGGCGTAACGAGAAAAGACTAGAAAGTGTAAACACACCTCTCCTAGTTATATATAAACCCAGCGGGGCAGTCCCTAGAAGAACACTACCTCAATCCAGTTACACATTAACCCGGGAACCTATTATTGATTAACTAGACAGTACTTCCTCATTTTCTACTGGAACTTTCCACTGCCCTCCGGGGATTTTCCATTGGCAATCATTAACTTGACTTTGTACTTTATGTTTACTCTCCATAGCAACGCACCTTATATGGAAAATATGCTCCTCCCCGGACCGCCCATCGTACCACCTGAGCAGGTAGGCTGTACCTTTTCCTATTGGCCCATTATGAGCTCACCTGGTTAATCATATACCCGCTCCGCCTATATAGGTAGCATACCGGGACAGGTTCCCTCACAGTCTATTGCAGACTGCCGAAGAGAGAGGAGCTCCGCATAGGACTGGGACCAGAACCCCGAGACTCTGCCGGTAATATTTTAATTTCATTTAATCGAATCAAATAAATCAAAAATCAACTCAAACCCATGATTCTCAATGGAAATTTCTTGTGATTTTCTTTCGCGCGCGACCACCCCCTATGGCACCCCCCTGTACACCCCCCTGTACACCCCCCTGTACAAGGGAACCTACCCCCCTGTACAGCGACCACCCCCCATGGACACCCCCCTGTACATTCTACAGGTATGGCCCGCAACCCATTCCGCATGTTCCCTGGGGACCTTCCATACTACATGGGGACCATTTCCTTTACTTCGGTGGTCCCTGTGGACCCTAGCCAGCGGAATCCCACCACTAGCCTTAGAGAAATGGTGACCACCGGCCTGATTTTTAACCCTAACCTGACCGGCGAGCAACTGCGGGAATACTCATTCAGCCCCCTAGTGTCCATGGGGAGAAAGGCAATCTTCGCAGACTACGAGGGTCCCCAGCGCATTATCCACGTTACCATTAGGGGGCGCTCCGCGGAACCCAAGACCCCCAGTGAGGCCCTCATTATGATGGAGAAGGCGGTCCGTGGCGCGTTCGCGGTTCCTGATTGGGTGGCCAGGGAATACTCGGATCCCCTCCCCCACGGCATAACCCACGTGGGGGACCTGGGCTTCCCCATTGGTTCCGTGCATGCCCTGAAGATGGCGCTAGACACACTGAAGATCCATGTCCCTCGCGGAGTGGGGGTCCCTGGCTATGAGGGTCTCTGTGGGACCACCACCATCAAAGCCCCCCGACAATATCGGCTCCTGACCACTGGAGTTTTCACCAAAAAAGATCTGAAAAGAACACTTCCAGAACCATTCTTCAGCCGATTTTTTAACCAAACTCCCGAAGTTTGTGCCATCAAGACTGGCAAAAATCCGTTTTCTACAGAAATTTGGTGTATGACTCTCGGCGGGGATAGCCCCGCCCCCGAGAGAAATGAACCCAGAAATCCCCATTCTCTCCAAGATTGGGCAAGACTGGGTGTCATGGAAACCTGCCTACGTATGAGTAGGCGGGGACTCGGGTCTCGGCACCACCCCTACCATTCTCTGTAACCAATCCCTGAATAAAGATTTGCATAACAGAACTTTGACTCCTCCTTTTATGTGGGTGGGGTAATGGGCGGCACTTGGGGGTAATGGCGGTTCCTATTGGATGGGTAACACCGACTCCGCCCTACAAAGTTAATGATTGATTTTTCGGACTTAGAAAAATTTCGACTGTCACCTGGATGTTTTTCCCCACTTAACCTCTAGGGGGAGATAGATCGCGTCCAAGGGGAGGAGCTCAATACCGGACCGCCTATTAGGTGTGGCTTCGGGCTCCGCCTAGTGGGAGGAGACAGGAAAACCACGCCTAGTGACGCTGGGTCAAAGTCCAAGGGGAGTGGTTTATGCGCACCGCCTTGGGGCGTGGTTTGGGCGGCGCAAGGTAACCCTTGGACTGGGAGGAGACTTCTGTCCCTTGGGCGTGTCAAACAGGTAAACCCCACCCGCGCGATTAATGATTAATTTTTCGGACTTAGAAAATTTTCAACCTGATACTTTATTTTCAAGCTTTTCCCGCCGACGGGCAAGCCTCCTATCTCTCCGTCTATGACTCCACAGAGCCTCATCTGAATATGTAAATGTGCTGAACCGCAACCCCGTAGACCGCGCCCACCCCAGCATCAAAGGTAACGCCCCCGATGCCACAATGTAATTACCCACTGTTAAATTAGGATCCTTACACCAATCATTTCTGTACAATTTAAACCACCGCCCACGCGGGACTTTCCCGTGGTGGTAGAAAAAGGTTTTGAAAAACGCGCGCATTATTTTCGTGGCTTCATTAATAGCGGACATGCGCAGATCCAGAAAGGTCAGACACACCACCACGGTCACATGACATTTGCATGGAGACAGGGATTGGATACCGACACAATACGCCATCGGATACTGAATGTCCACATTGGTCCGTGCATATACAGTGTGCCACCTCCTCTTGACCGCAGCCACGAATCCCCAGAAGAGTTCTTCCCGCCACAAAATCGAAACCGGGGCGGCGGCCCCAAAGCACAAATACAAAGGCATCCTCCTGAGGCTCTAGAAAAAACAACTCATTAACAGGCATCCCGCTCATAGGTACATTCGTGTAAACAGGGCTGCATGCCAACCAATGCCCCGCGTTTTACAAAGTGACGGGCCACCCTATTGGCGGAGGGGGTCCACGTATTGCGCACCGCGTAAATAGAAGCCACCCCTCGCGGAACCTGTGTACATTCAAATCTCCTCCAAATACATTCGCGCAGTAAAGCCACCGCCCTTTTCAAGAAAGTCCAATCAACCTTATGCGTGGGCAAAAAAATAGAAGCTGAATATACCCCCGCAAACTCCTCCAATCGGAACAGGTAATCTACACTATAGTGGGACAGCATCTCAACAGTTAAACTTTCCCAGGCATTTATCACCGTCAATTTCAGATCATGGAATACGGCCAAGTTAGGCTCCATCAAGGTCACGCGGAGGTGGAAGTAATACATCCCGAAATACCCTGTTAAAAAAAATAGAAAAATGAACTAACCGACAATAAGATCGGCAGTACCCAGTTTCGATCTGGGGACCTCCGGAGTGCAAGTCCGACGCTCTTACGGCTGAGCTACACTGTCGATCTTGATCCGCTAGGGTACGCAGTCCGGAGAAGAAATATACTAAGTGAGACCCGGTCCTATATATACAGGTTGGTTCAAAGGAACCTTTGTACCCATTAAAACAGGTGCGTGACTGTAGAAGCCACACCCCTACCTGTACCGATAAGGCACACCCTGAGCAAACAAACCATAAAGGTATACTTCCTTATTCAGACAGGTATAAATGGAACCTCCGCACAACAGTCCGGTACCATTTTCCATCGCGAAAATGGGCAACCCTACTCTGCTCCTTCTTTCAGGTCTCCTTTCTCTGACCCAGGCCATTTCCATCGGAGAACACGAAAACAAAACCCGGCATGTGATTGTATGGCGGCACTCCTCCTCCCACCAATGCTCTGATTGGAGAACAGTCACGGAATGGTTCCCGCCCCAAAAAGGCAACCCGGTGAGACCACCCTACACCCAGCGGGTTTCCCTGGATACGGCAAACAATACCCTCACGGTAAAACCCTTCGAGACAAACAACGGGTGTTGGGAAACTACGTCACAAGGCATTAACCATCCACCAACCACCATTCAGTACCGGGTATGGAACATCACCACCACGCCCACCATACAGACAATCAACATTACCAAAATAACTGTTCGGGAGGGGGAGGACTTTACCTTATACGGACCTGTGTCCGAAACCATGAGTATTATCGAATGGGAATTCATCAAGGATGTCACGCCCCAGTTCATCCTCCAATACTATCTCTCCATTAACTCTACTATTGTGTACGCAAGCTACCAAGGGAGAGTTACCTTTAACCCCGGTAAAAACACACTAACCTTAAAAGGCGCGAAGACCACCGACAGCGGCACCTACAAGTCCACGGTGAACCTCGACCAGGTATCCGTCCACAACTTCCGAGTAGGAGTCACGCCCATCGAGAAAAAAGAAGAAGCTACCGCAGAGACACCTGCCAGCAAGCCCACGCCCATACCACGTGTCCGAGCGGATGCTCGAAGTACTGCCCTATGGGTTGGACTTGCCCTTTGCATCCTGACTGTTATACCCGCCCTTATTGGGTGGTACTTCAGAGATAGGCTCTGTGTTCCCGATCCAATCATTGAACTGGAAATCCCCGGACAACCCCATGTAACAATACACATATTGAAAGGTCCCGATGATGATTGCGAAACTTAATGATTGACAAACGTAATAAAAAAGCTGTGACGCACATAAGTACGTGTCTGTGTCATTCATCCATACCTATATATGGTGATAGCCCCTTCCTCAATACACACCGAGCCGCGATGGACCCCAGACCACTTGTTCTGCTCCTCCTCCTAGCGTCCCATATAAGTACATTCCGGCAAATGTACTTTGAAGGGGAAACCATCCATTTCCCTATGGGCATATATGGAAATGAGACCACCCTCTATATGAATGACATCATCCTGGAAGGAACACGCGCCAATACGACCACCCGTACAATCAGCCTCACGACCACCAAGAAGAATGCGGGAACTAACCTGTACACTGTGATCTCCGAAACGGGACACAACGCCACCTATCTGATAACTGTACAACCGCTGGGACAATCGATACACCACGCCTACACTTGGGCTGGAAATACTTTTACCTTACAAGGACAGGTATTTGAACACGGTAATTATACACGATGGGTGCGGCTGGAGAATGCGGAACCGAAACTCATTATCAGCTGGGCATTGTCCAACAGAACAATAAACAAAGGACCGGCCTATACTGCAAACATGGACTTTGATCCCGGAAACAACACCCTCACTCTCCACCCTGTGCTGATAACAGATGCCGGGATTTTCCAATGCGTCATTGATCAGCAAACAAACCTAACCCTCACCATAAACTTTACAGTCTCCGAGAATCCACCAATCGTAGCACACCTGGATATCCATAAAACTATTTCTAGAACAATTGCCATTTGTAGCTGTTTGCTTATCGCGGTAATTGCGGTCTTGTGTTGCCTACGTCAGCTCAATGTAAACGGGCGGGGAAATTCCGAAATGATATAAAACAATAAAGCAGTGTGCGTCATGGAAACTTTTCTCAGGTGCTTCCTCATTCACACAGGTATATATAGGGAATGGAAAATTAGACAGATACCCACACCGGAACAATGCTACTTCTCACAGTAGTTCTGTTGGTGGGGGTCACCCTCGCTGCGGACCATCCTACTCTATACGCTCCGAAAGGGGGCAGTATAGAATTGGGTGTGGGGGCTAAACAGAAAGGGCAATACAAATTTGAATGGCGGTTTGGAAATCTAAAAATTGTGATAGCCGAAATGTCATCCACTAACCAATTAGAAATCAAATTTCCCGATAACGGTTTCCAAAATCGATCCGAGTTTAACCCCACCAAACATAACTTAACCATTCATAATGCCAGCTACGAGGACAGCGGAACCTACTCACTCCACCAGGAAGAAAATGATGGCACGGAACACACGGACAACTTCAAAGTGATTGTTCAAGGTATGTCATTATATACATATTTACAATATGCATTAATATCACCTATCTAATAGAGCATTAATTATCCAGACCCGATTCCACGCCCTGAAGTCAAGGGAACCACTATGCAAATCAACGGGAAAACTTTCACCAATATATCCTGCCATCTACCGGCCGGTTCCTACGGCAATGTCTCCTGGCATTGGAATTATACCGACCCAATCATAGTCGGGTACGAAAATCAGAGCATGCTCGTTGGACCTTTAGGGGTAATGTATTCATGTACGGCATCCAATCAAGTCTCAAAAAACTCCAGTGCAATAAGTATGGACACCGCCGAACCATCAGAGAGTAAGTAGCGCCCTCTATAGACATTATATAGAATATAACTGAACACATTAAGAAACCTCTGTAATTATTTATAGGAGCGGAGTGCGCATATACAGGATACATTGCGGGCATTATAATCTTAGGAGTGCTTTGCATATTGTTCATTTACCTATATGCAAATACCCCTGAAGTGCGGCAGAGAATAACCGACCAATTAGAAAAGCTTCTCGGAACATTCTGTGACGTCAGTATAGAAGACGGAATACCGGAACGCACCAGAAGAAACAAAAAAAGAATCATCTTAAAGGAGCCCTCCCATAGGTGGATCTGGATTCAGTCATTTGCATAATATGCTGTGTCATAACCGCCACCATCACCATAGCAATCATTGGGCGTAAGTATTGTGACGTAAGAAAAGGCATGTCTAAAAAAACGGTCACTCACCATAATGCTGCCCCCGATAGGTTGCGACCGCCTTCCGGAGTTTGACGTAGTATGCCCGCGAGACTGGATCGGATTTCAAAGCAAGTGCTACTACTTTTCGGAGTCAGAGTCCAATTGGAGTGAAGCCGAAAAATTTTGTAGACAGCAAGAGGCGGAGCTAGCAGTTCGGCGTTCCGAGGAGGAAAAGGTAAAAAGTTAAATTCCAGGAAACTCCTAATTCCCCGAAAAATTACAAAAATTAACGGAGACCCTTTACAGGAGTTCCTTCTGCGCCAATGCGGAACAGGAACTAACTGGCTGGGCGTAACCAGGAAGTCGAAGGACGGAGCTGATTGGGTGGATGCATCGTACGATGATTACGTACCATGGTGAGTCATGTTATACGTCACATCCGGGATGTGACGTATGCGGAAGTTGATCCGGGAGTGAAAACCCGGAAGTAACCTGTTAATTTGCATACAGGTATGAAATTCGGGGAGGCGGAGACTGCGTGTATTTAAATGGAGACCGAGTGACGTCAGCCTACTGTGATACCCAGAAGCTATTTGTCTGTTCCTGTCAAGATTCGTATTCGTATTGGTTAGAAAACAAATAAATCAATAAACTAATTTATGATATCATTCATATTTATGGGTGTGGTTTTATTATGCGTCATAAAACTATTTTGCGTATAGCGACACGCTGCGGTTATGGCCGGTTATGACTGCGTTAGTTTTTGAGGTTATTATACATCATC
權(quán)利要求
1.一個含有一種重組蛋白質(zhì)的卵。
2.權(quán)利要求1的卵,其所述的卵為一種禽類的卵。
3.權(quán)利要求1的卵,其所述的卵為一種鳥類的卵。
4.一種含有重組DNA的卵。
5.權(quán)利要求4的卵,其所述的卵為一種禽類的卵。
6.權(quán)利要求4的卵,其所述的卵為一種鳥類的卵。
7.一種制備重組鳥類腺病毒載體的方法,該載體含有一種異源基因,該方法包括的步驟有
(a)制備一種質(zhì)粒、粘?;蚴删w,它們含有鳥類腺病毒DNA,所述的DNA含有
(i)至少一種轉(zhuǎn)錄調(diào)控序列,該序列鄰接于至少一種限制性內(nèi)切酶位點,以及;
(ii)來自Ad CELO基因組的一個非必需區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列以及所述的限制性內(nèi)切酶位點;以及
(b)在所述的限制性內(nèi)切酶位點插入至少一種來自外源基因的蛋白質(zhì)編碼序列,該位點鄰接于所述的轉(zhuǎn)錄調(diào)控序列。
8.權(quán)利要求7的方法,其中該Ad CELO DNA進一步含有前述的DNA并且包括RNA合成起始的的位點。
9.權(quán)利要求7的方法,其中該轉(zhuǎn)錄調(diào)控序列調(diào)控所有的病毒mRNA,這些mRNA由主要晚期轉(zhuǎn)錄本加工而成。
10.權(quán)利要求7的方法,其中所述的鳥類腺病毒DNA為Ad CELODNA。
11.權(quán)利要求7的方法,其中所述的來自外源基因的蛋白質(zhì)編碼序列含有對應于所述的外源基因翻譯起始點的位點,并且含有延伸于所述的外源基因的轉(zhuǎn)錄終止位點之外的DNA。
12.權(quán)利要求11的方法,其中該蛋白質(zhì)編碼序列獲自DNA基因的DNA拷貝或者RNA基因的DNA拷貝。
13.權(quán)利要求7的方法,其中所述的非必需區(qū)域含有Ad CELO的1%到8%的圖譜的Ad CELO區(qū)域。
14.權(quán)利要求7的方法,其中所述的所形成的質(zhì)粒屬于包含KDnI-DC5′-HindIII、HindIII-MLP-EcoRI、EcoRI-2bld-BamHI、BamHI-GRV-PstI、PstI-p(A)SV40-XbaI和XbaI-DC-NotI集合的其中之一。
15.一種用于對一種鳥類腺病毒進行遺傳修飾的方法,該方法包括的步驟有
(a)制備一種質(zhì)粒、粘粒或噬菌體,它們含有鳥類腺病毒DNA,所述的DNA含有
(i)至少一種轉(zhuǎn)錄調(diào)控序列,該序列鄰近于至少一種限制性內(nèi)切酶位點,以及
(ii)來自Ad CELO基因組的一個非必需區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列以及所述的限制性內(nèi)切酶位點;以及
(b)在所述的限制性內(nèi)切酶位點中插入至少一種來自外源基因的蛋白質(zhì)編碼序列,該位點鄰接于所述的轉(zhuǎn)錄調(diào)控序列;
(c)提供至少一種經(jīng)重組鳥類腺病毒感染的細胞;
(d)從所述的細胞中分離一種重組鳥類腺病毒,該病毒能夠表達所述的蛋白質(zhì)編碼序列。
16.一種方法,該方法中使用一種重組的鳥類腺病毒作為疫苗,該方法包括
(a)制備一種感染性鳥類腺病毒,該病毒含有一種嵌合基因,該基因含有至少一種鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列以及至少一種來自外源基因的蛋白質(zhì)編碼序列,所述的嵌合基因側(cè)生有來自鳥類腺病毒基因組的非必需性區(qū)域的DNA,以使所述的感染性鳥類腺病毒能夠在感染一種細胞時表達所述的蛋白質(zhì)編碼序列;以及
(b)以一種接種劑對動物或者人類進行接種,該接種劑含有一定濃度的所述的重組蛋白質(zhì),該濃度足以在所述的動物或者人中體內(nèi)引發(fā)一種免疫反應。
17.權(quán)利要求16的方法,其中所述的免疫反應包括抗體的產(chǎn)生,該抗體至少針對由所述的編碼序列所編碼的蛋白質(zhì)的抗原性部分。
18.一種載體,該載體包括
(a)一種質(zhì)粒、粘?;蛘呤删w;
(b)一種嵌合基因,該基因至少包括一種來自外源基因的鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列;以及
(c)來自鳥類腺病毒基因組的非必需區(qū)域的DNA,所述的DNA側(cè)生于所述的嵌合基因。
19.權(quán)利要求18的載體,其中所述的蛋白質(zhì)編碼序列為一種選自狂犬病病毒群體的外源基因。
20.權(quán)利要求18的載體,其中所述的蛋白質(zhì)編碼序列編碼一種免疫原性蛋白。
21.權(quán)利要求20的載體,其中所述的蛋白質(zhì)編碼序列編碼至少一種所述的免疫原性蛋白的抗原性部分。
22.權(quán)利要求21的載體,其中所述的載體選自包含KpnI-DC5′-HindIII、HindIII-MLP-EcoRI、EcoRI-2bld-BamHI、BamHI-GRV-PstI、PstI-p(A)SV40-XbaI和DC5′-MLP-2bld-GRV-p(A)DC(XbaI-NotI)的集合。
23.一種感染性鳥類腺病毒,該病毒中含有一種嵌合基因,該基因含有至少一種鳥類腺病毒轉(zhuǎn)錄和翻譯調(diào)控序列以及至少一種來自外源基因的蛋白質(zhì)編碼序列,所述的嵌合基因側(cè)生有來自鳥類腺病毒基因組的非必需性區(qū)域的DNA,以使所述的感染性鳥類腺病毒能夠在感染一種細胞時表達所述的蛋白質(zhì)編碼序列。
24.權(quán)利要求23的一種感染性鳥類腺病毒,其中所述的嵌合基因進一步含有前述的鳥類腺病毒DNA并且包括RNA合成起始的位點。
25.權(quán)利要求24的一種感染性鳥類腺病毒,其中所述的蛋白質(zhì)編碼序列編碼一種免疫原性蛋白。
26.權(quán)利要求25的一種感染性鳥類腺病毒,其中所述的蛋白質(zhì)編碼序列編碼至少一種所述的免疫原性蛋白的抗原性部分。
27.權(quán)利要求26的一種感染性鳥類腺病毒,其中所述的免疫原性蛋白為狂犬病病毒的糖蛋白G抗原。
28.權(quán)利要求27的一種感染性鳥類腺病毒,其中所述的感染性鳥類腺病毒選自包含KpnI-DC5′-HindIII、HindIII-MLP-EcoRI、EcoRI-2bld-BamHI、BamHI-GRV-PstI、PstI-p(A)SV40-XbaI和DC5′-MLP-2bld-GRV-p(A)-DC(XbaI-NotI)的集合。
29.一種感染性鳥類腺病毒重組子,該重組子通過含有以下步驟的過程產(chǎn)生
(a)制備一種質(zhì)粒、粘?;蚴删w,它們含有鳥類腺病毒DNA,所述的DNA含有
(i)至少一種轉(zhuǎn)錄和翻譯調(diào)控序列,該序列同至少一種限制性內(nèi)切酶位點相鄰,以及
(ii)來自鳥類腺病毒基因組的一個非必需區(qū)域的DNA,該DNA側(cè)生于所述的轉(zhuǎn)錄調(diào)控序列以及所述的限制性內(nèi)切酶位點;
(b)在所述的限制性內(nèi)切酶位點中插入至少一種來自外源基因的蛋白質(zhì)編碼序列,該位點鄰接于所述的轉(zhuǎn)錄和翻譯調(diào)控序列。
30.一種鳥類腺病毒重組子載體,該重組子載體通過對鳥類腺病毒DNA的體外和體內(nèi)操作而獲得。
31.權(quán)利要求30的一種鳥類腺病毒重組子載體,該重組子載體特征在于其含有
(a)左端和右端反向末端重復序列以及至少一種包裝信號序列;
(b)至少一種轉(zhuǎn)錄調(diào)控序列以及至少一種翻譯刺激物序列;
(c)至少一種蛋白質(zhì)編碼序列;
(d)至少一種鳥類腺病毒DNA的另一個區(qū)域,該區(qū)域可能含有一些修飾,例如插入和或缺失和或突變。
32.權(quán)利要求30和31的一種鳥類腺病毒重組子載體,其中所形成的質(zhì)粒屬于包含KpnI-DC5′-HindIII、HindIII-MLP-EcoRI、EcoRI-2bld-BamHI、BamHI-GRV-PstI、PstI-p(A)SV40-XbaI和XbaI-DC3′-NotI的集合其中之一。
33.權(quán)利要求30、31和32的一種鳥類腺病毒重組子載體,該載體存在于一種質(zhì)粒中,該質(zhì)??稍诩毦蛘呓湍钢袕椭撇⑶以谝胍环N鳥類的卵或者鳥類細胞之后能夠產(chǎn)生重組蛋白,該引入可能同作為輔助病毒的鳥類腺病毒DNA或者鳥類腺病毒顆粒聯(lián)合進行。
34.權(quán)利要求30、31、32和33的一種鳥類腺病毒重組子載體,該載體含有外源DNA。
35.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種編碼一種治療蛋白質(zhì)的外源DNA。
36.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種編碼一種免疫刺激性的蛋白質(zhì)的外源DNA。
37.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種外源DNA,該DNA編碼一種來自一種人類病毒或者細菌或者原生動物病原體的蛋白質(zhì)。
38.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種外源DNA,該DNA編碼一種來自一種動物病毒或者細菌或者原生動物病原體的蛋白質(zhì)。
39.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種外源DNA,該DNA編碼一種來自一種鳥類病毒或者細菌或者原生動物病原的蛋白質(zhì)。
40.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種編碼細胞因子蛋白質(zhì)的外源DNA。
41.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種編碼植物蛋白的外源DNA。
42.權(quán)利要求34的一種鳥類腺病毒重組子載體,該載體含有一種編碼腫瘤抗原蛋白或其片段的外源DNA。
43.一種用于在鳥類卵中生產(chǎn)權(quán)利要求30到40的重組蛋白質(zhì)的方法,該方法的特征在于一種含有以下步驟的過程
(a)制備一種含有鳥類腺病毒DNA的質(zhì)粒、粘?;蚴删w的載體,所述的DNA含有
(i)左端和右端反向末端重復序列以及病毒包裝信號序列;以及
(ii)至少一種轉(zhuǎn)錄調(diào)控序列以及至少一種翻譯刺激物序列;
(iii)在所述的限制性內(nèi)切酶位點中的至少一種蛋白質(zhì)編碼序列,該序列來自一種外源基因,該內(nèi)切酶位點鄰近于所述的轉(zhuǎn)錄和翻譯調(diào)控序列;以及
(b)制備所述的載體DNA同純化的腺病毒DNA或者完整的腺病毒顆粒的一種混合物;
(c)向一種具胚鳥卵中或者一種鳥類細胞培養(yǎng)物中引入所述的混合物;
(d)將經(jīng)過這樣處理的鳥卵孵育一段時期。
(e)在該時期之后從鳥卵中收集含有該特定的重組蛋白質(zhì)分子的液體,該蛋白質(zhì)由所述的載體DNA編碼。
全文摘要
我們描述了一種新的技術(shù),該技術(shù)用于產(chǎn)生含有重組蛋白質(zhì)的卵,該技術(shù)基于鳥類腺病毒(AAV)的全新應用。經(jīng)腺病毒感染的具胚卵被用作為宿主生物體。從每個卵中分離出大量的所合成的蛋白質(zhì)并且其純化省去了純化的耗時步驟。根據(jù)所知,在鳥類中的翻譯和翻譯后修飾機制與諸如人類、獸類動物和植物這樣的其它高等真核生物同一。與用于產(chǎn)生重組蛋白質(zhì)的細菌、酵母和植物宿主系統(tǒng)相比,鳥類胚實現(xiàn)了對不含內(nèi)毒素的生物活性形式的蛋白質(zhì)分離。高產(chǎn)量和獲得天然蛋白的高幾率使該系統(tǒng)成為生物技術(shù)的一個獨特的選擇,該系統(tǒng)比近來用于該目的的其它宿主更為優(yōu)越。
文檔編號C12N7/00GK1408021SQ0081589
公開日2003年4月2日 申請日期2000年9月15日 優(yōu)先權(quán)日1999年9月17日
發(fā)明者V·I·格拉布科, E·R·布萊登 申請人:坎默根公司