專利名稱::咖啡中與半乳甘露聚糖合成有關(guān)的核酸和蛋白質(zhì)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及農(nóng)業(yè)生物
技術(shù)領(lǐng)域:
。更特別的,發(fā)明涉及參與包括半乳甘露聚糖合成的多糖代謝的來自咖啡植物的酶,和編碼該酶的核酸序列。
背景技術(shù):
:多種出版物,包括專利、公開的申請和學術(shù)文章均在本說明書全文中予以引用。上述出版物的全部內(nèi)容均以其全文引用在本文中作為參考。在說明書中沒有完整闡迷的引用可參見本說明書的結(jié)尾??Х燃庸ぶ械年P(guān)鍵步驟是烘烤綠色種粒。烘烤步驟通常在170°C至230°C的范圍內(nèi)進行5至15分鐘,并負責產(chǎn)生與咖啡飲料有關(guān)的大部分香氣、風味和顏色(Yeretzian等人,2005)。根據(jù)烘烤程度,該步驟中可以降解12-40%的多糖(Redgwell等人,2002)。已經(jīng)報道過烘烤步驟改變了許多復(fù)雜多糖聚合物的長度,這可以增加它們的溶解度(Redgwell等人,2002)??Х榷嗵堑钠位徽J為有利的影響飲料的感官特性例如口感(Illy和Vianil"5)和泡沫穩(wěn)定性(Nunes等人,l997)。多糖的分解也被認為會間接的影響揮發(fā)性香氣化合物的結(jié)合,因為一些復(fù)雜糖類降解產(chǎn)物參與烘干種粒蛋白黑素的形成,所述蛋白黑素是一類未充分定義的化合物,其構(gòu)成烘干種粒干重的20%以上(Charles-Bernard等人,2005)。烘烤誘導的多糖裂解還可以增加從咖啡種粒提取的的固體量,這是對于可溶咖啡的生產(chǎn)具有關(guān)鍵性意義的性質(zhì)。此外,通過與咖啡烘焙有關(guān)的美拉反應(yīng),咖啡種粒中糖類的片段化/裂解還有助于一組重要的咖啡風味和香氣分子的產(chǎn)生(Yeretzian等人,2005)。糖類構(gòu)成了成熟的綠色咖啡種粒(綠色豆)中的很大比例。糖類組成阿拉比卡咖啡(arabica)(小果咖啡(Coffeaarabica))和羅布斯塔咖啡(robusta)(中果咖啡(C.can印hora))綠色種粒干重的約48-55%,其中一些處于復(fù)雜多糖的形式,同時其他形式包括游離單糖和二糖(CliffordM.N.,1985InCoffee:Botany,Biochemistry,andProduction,第374頁,Clifford,M.和Willson,K.編著,CroomMelmLtd,London;Fischer,等人,2001,CarbohydrateResearch,330,93-101)。已經(jīng)鑒定了咖啡種粒中的基于復(fù)雜糖類的聚合物的三種主要類型。最豐富的種粒多糖是半乳甘露聚糖,據(jù)報道其代表了成熟的綠色咖啡種粒達25%的質(zhì)量,即,約50%的種粒糖類。其次最豐富的多糖組是阿拉伯半乳聚糖,其構(gòu)成了高達35。/。的綠色種粒多糖(Oosterveld等人,2003CarbohydratePolymers52,285-2960)。阿拉比卡咖啡綠色種粒多糖剩余的約16%主要由纖維素和木糖聚糖組成(Oosterveld等人,2003)。包含半纖維素的甘露聚糖由pi-4連接的甘露糖分子的主鏈組成,雖然在植物中廣泛的發(fā)現(xiàn)它們,但已經(jīng)認為甘露聚糖在大部分植物細胞類型的壁中是相對較小的組分(Bacic、Harris和Stone1988;Fry2004;Somerville等人,2004b)。一些包含胚乳的種子,例如豆科(Leguminosae)、棕櫚科(Palmae),和商業(yè)上重要的咖啡屬(Coffea)物種的種子,在種子胚乳細胞壁中存在相當大量的半乳甘露聚糖(Matheson1990;Buckeridge等人,2000;Pettolino等人,2001;Redgwell等人,2002;Hanford等人,2003)。半乳甘露聚糖的特點在于甘露聚糖鏈具有通過(l-6)a鍵連接的單個半乳糖基分子。種子胚乳的半乳甘露聚糖似乎與胚乳細胞壁的次生細胞壁加厚有關(guān)(Pettolino等人,2001;Sunderland等人,2004;Somerville等人,2004a),并被認為構(gòu)成成熟種子能量儲備的一部分,其類似于淀粉在谷類胚乳中扮演的角色(Reid1985)。胚乳半乳甘露聚糖已經(jīng)理論化的其他功能包括促進吸漲/發(fā)芽以及保護種子胚胎免受干燥(Rdd和Bewley1979)?;诩毎诰酆衔锏钠渌饕事毒厶前ㄆ细事毒厶牵溆幸恍└事短菃卧籔-l,4-連接的葡萄糖殘基取代,和半乳葡甘露聚糖,其是具有a-l,6-連接半乳糖殘基的葡甘露聚糖。具有低水平半乳糖的半乳葡甘露聚糖是棵子植物加厚的木質(zhì)化次生細胞壁的重要成分(Lundqvist,J.等人,2002),還發(fā)現(xiàn)其存在于獼猴桃(彩色獼猴桃(J"/M,VZ/a^//c/仍fl))和組織培養(yǎng)的煙草(白花丹葉煙草(7V/co,/Vi"fl/7/"附6tfg,Vnyb/,Vi))細胞中(Schroder,R.等人,2001;Sims,I.等人,1997)。最近,研究表明甘露聚糖聚合物存在于被子植物模型擬南芥(Arabidopsisthaliana)的木質(zhì)部分子、木薄壁組織和束間纖維的加厚次生細胞壁上(Handford等人,2003)。他們還在葉和莖加厚的表皮細胞壁中檢測到甘露聚糖的顯著水平,在測試的大部分其他組織中檢測到甘露聚糖的較低水平,表明甘露聚糖廣泛存在于擬南芥中。盡管已知纖維素聚合物是在質(zhì)膜合成的,大部分非纖維素多糖都被認為是由高爾基體制造,然后運輸?shù)郊毎ね獾馁|(zhì)外體空間(Keegstra和Raikhel2001;Somerville,Bauer、Brininstool、Facette、Hamann、Milne、Osborne、Paredez、Persson、Raab、Vorwerk和Youngs2005;Liepman、Wilkerson和Keegstra2005b)。已知半乳甘露聚糖的合成涉及兩種膜結(jié)合糖基轉(zhuǎn)移酶Mg+十依賴的、GDP-Man依賴的(l,4)-p-D-甘露糖基轉(zhuǎn)移酶或甘露聚糖合酶(MS),和]\111++依賴的、UDP-Gal依賴的甘露聚糖特異性(1,6)-a-D-半乳糖基轉(zhuǎn)移酶(GMGT),并且認為上述酶非常密切的協(xié)作,從而決定半乳糖基殘基沿著甘露聚糖聚合物的統(tǒng)計分布(Edwards、Choo、Dickson、Scott、Gridley和Reid2004)。最近,利用甘露聚糖特異性的抗體在體外檢測甘露聚糖的合成,獲得了在高爾基體中合成甘露聚糖的證據(jù),該證據(jù)進一步支持整體模型,其中半纖維素類型的多糖例如半乳甘露聚糖是在高爾基體中制造的,然后運輸?shù)郊毎げ⒎置诘劫|(zhì)外體區(qū)域(Handford、Baldwin、Goube"Prime、Miles、Yu和Dupree2003;Somerville、Bauer、BrininStool、Facette、Hamann、Milne、Osborne、Paredez、Persson、Raab、Vorwerk和Youngs2005)。最近,通ii^示過表達或低表達百務(wù)M艮(Lotusjaponicus)GMGT蛋白質(zhì),導致在種子中半乳糖/甘露糖比值可預(yù)測的變化,來證明了高爾基體結(jié)合的GMGT蛋白質(zhì)在合成種子胚乳半乳甘露聚糖中的重要性,以及更確切地,在控制半乳糖修飾水平中的重要性(Edwards、Choo、Dickson、Scott、Gridley和Reid2004)。直到最近,負責植物細胞甘露聚糖合成的基因還是未知的。第一個編碼在生化上證明是甘露聚糖合酶的分離基因是瓜爾豆(C"附o/w/s似mg卵o/o^i)(guar)種子的ManS(Dhugga等人,2004)。CtManS的cDNA是從瓜爾豆的三種不同種子發(fā)育階段制備的EST文庫中分離的,所述種子產(chǎn)生非常大量半乳甘露聚糖。通過搜索與植物CelA(產(chǎn)生卩-l,3-葡聚糖的纖維素合酶)和Csl(纖維素合酶-樣蛋白質(zhì))具有強相似性的序列,鑒定CtManS相關(guān)的EST。Csl基因與CelA基因具有顯著的相似性,以前曾經(jīng)被建議作為在半纖維素如半乳甘露聚糖合成中涉及的酶的候選基因(Cutler和Somerville1997;Richmond和Somerville2000;Hazen等人,2002)。該候選甘露聚糖合酶EST在各個瓜爾豆種子文庫中的多度對應(yīng)于在各階段測量的甘露聚糖合酶生化活性的水平,提示這些EST代表甘露,合酶。當#達CtManScDNA序列時,在一般沒有可檢測的甘露聚糖合酶活性的大豆體細胞胚胎中表現(xiàn)出顯著的甘露聚螗合酶活性,表明假設(shè)的瓜爾豆甘露聚糖合酶cDNA編碼功能性的酶(Dhugga等人,2004)。發(fā)現(xiàn)功能性的重組酶位于高爾基體。在擬南芥基因組中,有25種以上的基因被標注為Csl基因,根據(jù)它們的序列同源性再分成家族。最近,已經(jīng)對來源于多種擬南芥Csl基因序列的重組蛋白質(zhì)進行了功能性評估,并確定CslA基因家族的一些成員編碼具有P-甘露聚糖合酶活性的蛋白質(zhì)(Li印man等人,2005)。只有很少的關(guān)于咖啡中甘露^t相關(guān)聚合物的新陳代謝的有效資料。已經(jīng)獲得了在咖啡種粒中發(fā)現(xiàn)的編碼a-半乳糖苷酶的一些高度相關(guān)的cDNA,該基因在發(fā)育種粒中的表達表明,該基因是在胚乳形成和擴展期間(約22-27WAF(受精后周數(shù))被誘導的,并且還在葉、花、合子胚中檢測到表達,并在根中檢測到微弱的表達(Marraccini等人,2005))??Х确N粒半乳甘露聚糖的半乳糖/甘露糖比值從種粒發(fā)育初期階段(llWAF;受精后周數(shù))的約1:2至1:7的比值降低至31WAF接近成熟時的1:7至1:40的比值(Redgwell等人,2003)。該信息,與上述a-半乳糖苷酶發(fā)育的表達數(shù)據(jù)一起產(chǎn)生理論,即,從約21-26WAF開始持續(xù)至種粒成熟的咖啡種粒半乳甘露聚糖的半乳糖含量降低中可以直接涉及該特殊的a-半乳糖苷酶基因產(chǎn)物(Redgwell等人,2003)。在山扁豆(望江南決明(&mmoc"Vfew似fc))的發(fā)育種子中發(fā)現(xiàn)了該模型的證據(jù),其中發(fā)現(xiàn)a-半乳糖苷酶活性的顯著增加與種子半乳甘露聚糖的半乳糖含量的降低相符(Edwards等人,1992)。支持半乳糖含量降低涉及a-半乳糖苷酶的其它證據(jù),是隨后在發(fā)育的瓜爾豆種子中借助種子特異性啟動子表達山扁豆a-半乳糖苷酶時(Joersbo等人,2001)獲得的。瓜爾豆種子一般有高水平的半乳甘露聚糖,其具有很高的半乳糖/甘露聚糖比值,但是,從表達山扁豆a-半乳糖普酶的植物產(chǎn)生的瓜爾豆種子卻顯示出半乳糖/甘露糖比值水平在被修飾的瓜爾豆種子中的顯著降低。從發(fā)芽的咖啡種粒中還分離出兩種編碼不同的內(nèi)-P甘露聚糖酶的cDNA(manA和manB)(Marraccini等人,2001)。其相應(yīng)的基因在發(fā)育種粒中不表達,但是在發(fā)芽期間都表達,在吸漲后10-15天開始檢測轉(zhuǎn)錄產(chǎn)物。該觀察提示,這兩個甘露聚糖酶與發(fā)芽期間半乳甘露聚糖的裂解有關(guān),導致游離糖的釋放,然后,所述糖既作為能量來源又作為發(fā)芽種子的還原性碳發(fā)揮作用。檢測manA的表達,在葉、體細胞胚、花芽或根中沒有檢測到它的表達(Marraccini舉人,2001)。除了半乳甘露聚糖在咖啡種粒中的多度,以及該酶參與半乳甘露聚糖合成的暗示的重要性,在咖啡中幾乎沒有這些基因的有效信息。因此,需要鑒別、分離和表征在咖啡半乳甘露聚糖生物合成途徑中涉及的酶、基因和遺傳調(diào)控元件。此類信息將能夠以賦予所希望的與改變半乳甘露聚糖生產(chǎn)有關(guān)的表型優(yōu)勢為目標,對半乳甘露聚糖合成進行遺傳操作。發(fā)明概述發(fā)明一個方面的特征是從咖啡屬物種分離的核酸分子,其包括編碼半乳甘露聚糖合成酶的編碼序列,其可以是半乳糖基轉(zhuǎn)移酶或甘露聚糖合酶。在一些實施方案中,甘露聚糖合酶包括具有M酸序列QHRWS的保守結(jié)構(gòu)域。在其它實施方案中,甘露聚糖合酶包括與SEQIDNO:4-6中任一項具有超過約75。/。同一性的^J^酸序列,優(yōu)選的包括SEQIDNO:4-6中任一項。具體的,編碼序列包括SEQIDNO:2或SEQIDNO:3。在其它實施方案中,酶是半乳糖基轉(zhuǎn)移酶,其具有與胡盧巴半乳糖基轉(zhuǎn)移酶或百樂M艮(1W附/'"/w"/c附)半乳糖基轉(zhuǎn)移酶至少約54%的氨基#列同一性。在其它實施方案中,半乳糖基轉(zhuǎn)移酶包括與SEQIDNO:15-18中任一項有超過約75%同一性的氨基酸序列,優(yōu)選的包括SEQIDNO:15-18中的任一項。具體的,編碼序列包括SEQIDNO:ll-14中的任一項。在一些實施方案中,編碼序列是基因的可讀框,或基因轉(zhuǎn)錄產(chǎn)生的mRNA分子,或mRNA分子逆轉(zhuǎn)錄產(chǎn)生的cDNA分子。發(fā)明另一個方面的特征是長度在8和100個#之間的寡核苷酸,其與上述核酸分子的片段是互補的。發(fā)明的另一個方面的特征是包含上述核酸分子的編碼序列的載體。載體可以是選自質(zhì)粒、噬菌粒、黏粒、桿狀病毒、桿粒、細菌載體、酵母載體和病毒栽體中的表達載體。在一些實施方案中,核酸分子的編碼序列有效的連接組成型啟動子。可選的,有效的連接誘導型啟動子。在另一個替代方案中,核酸分子的編碼序列有效的連接組織特異性啟動子,在一些實施方案中,其可以是種子特異性啟動子,更特別的是咖啡種子特異性啟動子。發(fā)明的另一個方面的特征是用上述載體轉(zhuǎn)化的宿主細胞。宿主細胞可以選自植物細胞、細菌細胞、真菌細胞、昆蟲細胞和哺乳動物細胞。還提供由轉(zhuǎn)化的植物細胞產(chǎn)生的能育植物。發(fā)明的另一個方面的特征是調(diào)節(jié)咖啡豆固體物質(zhì)的可提取性的方法,包括調(diào)節(jié)咖啡種子內(nèi)半乳甘露聚糖合成酶的產(chǎn)生或活性。具體地,酶是半乳糖基轉(zhuǎn)移酶或甘露聚糖合酶,或其組合。在一個實施方案中,增加半乳甘露聚糖合成酶的產(chǎn)生或活性,例如,通過增加編碼酶的基因的表達,或者通過引入編碼酶的轉(zhuǎn)基因。在另一個實施方案中,減少半乳甘露聚糖合成酶的產(chǎn)生或活性,例如,通過干擾編碼酶的基因的表達。發(fā)明的其它特征和優(yōu)勢將通過參考下述的附圖、詳細說明和實施例理圖l.半乳甘露聚糖聚合物的結(jié)構(gòu)示意圖。圖2.分離和表征編碼中果咖啡和小果咖啡甘露聚糖合酶的核酸的完整編碼序列。(A)鑒定中果咖啡甘露聚糖合酶-編碼CWV/朋S和小果咖啡-編碼甘露聚糖合酶CWkf朋S完整ORF序列使用的克隆的概述。獲得四個部分cDNA克隆,其覆蓋CcMfl"S的完整ORF(參見實施例)兩個5'RACE產(chǎn)物,包含CcAfaw^的5'端編碼序列的pVC2和pVC3,和兩個部分cDNA克隆(pcccs46w24c19和pcccs46wl6i11),其包含CcAf"wS剩余的3,端。cDNA克隆pVC4、pVC6和pVC7包含PCR擴增序列,其包含編碼咖啡甘露聚糖合酶的完整可讀框(注意pVC4在1118bp處包含在PCR擴增步驟期間4昔誤引入的終止密碼子,見實施例的討論)。注釋如下pcccs46wl6ill=中果咖啡的cDNA克隆cccs46wl6i11的插Ajf歹'J(克隆中去掉了兩個內(nèi)含子和3,端非編碼序列)(SEQIDNO:7);pcccs46w24c19=中果咖啡的cDNA克隆cccs46w24c19的插入序列(SEQIDNO:8);pVC2(SEQIDNO:9)=中果咖啡羅布斯塔變種(0j5^1c""印/iom,var及M"對")(BP409)的第一RACE片段,被克隆到pCR-4-Topo中;pVC3(SEQIDNO:10)-第二RACE片段,被克隆到pCR-4-Topo中;pVOI(SEQIDNO:l)=中果咖啡羅布斯塔變種(BP409)多核苷酸的甘露聚糖合酶的全長擴增,其被克隆到pCR-4-Topo中(該片段在ORF中具有終止密碼子);pVC6(SEQIDNO:2)=CcM"w5"的全長擴增,中果咖啡羅布斯塔變種(BP409)的編碼甘露聚糖合酶的多核普酸,其被克隆到pCR-4-Topo中;pVC7(SEQIDNO:3)=0lAf"/iS的全長擴增,小果咖啡阿拉比卡變種(Oy^"j,"6/ai,v狀Jm6/c")(T2308)的編碼甘露聚糖合酶的多核苷酸,其被克隆到pCR-4-Topo中。(B)j吏用CLUSTALW程序(Lasergene程序包,DNASTAR公司)進行的序列的比對,并且手動優(yōu)化。pVC4序列中圏出的核苷酸標記了在該克隆的ORF中導致終止密碼子的突變堿基。但是很明顯,其它三個編碼該區(qū)域的cDNA序列(都源自獨立的PCR反應(yīng)的),都在該位置具有導致預(yù)期蛋白質(zhì)的A取代T。因此,我們認為pVC4中的該T是由于異常的PCR或克隆導致的?;疑蛄衅ヅ鋚VC6。內(nèi)含子序列用這類序列上存在的黑線標記。在pVC3序列第325位的缺失導致可讀框的改變,并被認為是在該序列的RT-PCR克隆期間產(chǎn)生的錯誤。圖3.顯示中果咖啡的CcManS的完整蛋白質(zhì)序列(SEQIDNO:5)。該蛋白質(zhì)序列是根據(jù)pVC6(SEQIDNO:2)編碼的cDNA序列推斷的。圖4.咖啡甘露聚糖合酶序列與其它甘露聚糖合酶序列的蛋白質(zhì)序列的比對。使用CLUSTALW將從pVC4和pVC6序列推斷的CcManS蛋白質(zhì)序列(SEQIDNO:5)以及從pVC7序列推斷的CaManS蛋白質(zhì)序列(SEQIDNO:6)與NCBI數(shù)據(jù)庫中可用的其它植物甘露聚糖合酶蛋白質(zhì)進行比對,然后進行手動優(yōu)化步驟(注意用紅色圓圏標記在pVC4第345位的終止密碼子)。用*標記或者框標記報道的在P-糖基轉(zhuǎn)移酶中保守的區(qū)域(如在Dhugga等人,2004中)。用灰色匹配標記的^J^酸代表在該位置發(fā)現(xiàn)的最經(jīng)常被發(fā)現(xiàn)的氨基酸。使用的序列登錄號是生物化學表征的CtManS(瓜兒豆,AAR23313,SEQIDNO:21)、AtManS(擬南芥(爿^Wflf/w/s幼a/i"w"),CAB82941,SEQIDNO:22)和IbManS(野薯(/powo^fr,y^"),AAQ62572;SEQIDNO:23)。圖5.顯示單基因(unigeiie)122620(SEQIDNO:ll)的蛋白質(zhì)序列(SEQIDNO:15)與兩個生化表征的植物GMGT序列的序列比對。使用ClustalW將單基因122620(CcGMGTl)的部分ORF與百脈根GMGT(登錄號AJ567668,SEQIDNO:24)和胡盧巴(7Wgo""/"/^"M附-gmec"附)GMGT(登錄號AJ245478,SEQIDNO:25;注意是部分cDNA)的蛋白質(zhì)序列進行比對。在兩個或多個序列中發(fā)現(xiàn)的氨基酸是灰色的。圖6.顯示單基因122567(SEQIDNO:12)的蛋白質(zhì)序列(SEQIDNO:16)與兩個生化表征的植物GMGT序列的序列比對。使用ClustalW將單基因122567(CcGMGT2)的部分ORF與百樂M艮GMGT(登錄號AJ567668,SEQIDNO:24)和胡盧巴GMGT(登錄號AJ245478,SEQIDNO:25;注意是部分cDNA)的蛋白質(zhì)序列進行比對。在兩個或多個序列中發(fā)現(xiàn)的M^A灰色的。圖L編碼咖啡GMGTasel部分或完整ORF序列數(shù)據(jù)的三種克隆的示意圖。/7cccW6w^"(SEQIDNO:19)是中果咖啡EST文庫克隆,/7rC70(SEQIDNO:20)包含分離的5'RACE序列,/;KC77(SEQIDNO:13)包含含有阿拉比卡咖啡GMGTase1完整多肽序列的阿拉比卡咖啡基因組片段。圖8./7ccc^/6h^23(SEQIDNO:19)、/KC70(SEQIDNO:20)和尸KCW(SEQIDNO:13)的GMGTase1DNA序列與計算機芯片生成的單基因弁122620序列(SEQIDNO:ll)的比對。比對4吏用CLUSTALW并進行手動調(diào)整。圖9.CaGMGTase1蛋白質(zhì)序列(SEQIDNO:17)與GenBank公眾數(shù)據(jù)庫中發(fā)現(xiàn)的同源性最高的蛋白質(zhì)序列的比對。使用CLUSTALW進行比對。登錄號CAB52246:[胡盧巴a半乳糖基轉(zhuǎn)移酶(SEQIDNO:26);CAI11452:[馬鈴薯C^/"www,"6e/Ymiw)]a-6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:27);CAI11453:[本氏煙草(A7co"awa6e"^a附/""a)1a誦6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:28);CAI11454:[蒺藜苜蓿(M^//0^0^""cfl似/fl)]a-6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:29);ABE79594:[蒺藜苜蓿半乳糖轉(zhuǎn)移酶(SEQIDNO:30);CAI79402:[瓜兒豆]半乳甘露聚糖半乳糖基轉(zhuǎn)移酶(SEQIDNO:31);CAI79403:[望江南決明(&朋"oc"V/ew似to)半乳甘露聚糖半乳糖基轉(zhuǎn)移酶(SEQIDNO:32);CAD98924:[光葉百脈根(丄W"stw"/cw/fl似51v"尸./'fl/w"/c—半乳甘露聚糖半乳糖基轉(zhuǎn)移酵(SEQIDNO:33)。圖10.使用CLUSTALW將單基因#—122567的GMGTase2DNA序列(SEQIDNO:12)與中果咖啡GMGTase2cDNA克隆pcccl26f9的DNA序列(CcGMGTase2;SEQIDNO:14)進行比對。圖11.CcGMGTase2(SEQIDNO:18)的蛋白質(zhì)序列與CaGMGTasel(SEQIDNO:17)和GenBahk公眾數(shù)據(jù)庫中發(fā)現(xiàn)的同源性最高的蛋白質(zhì)序列進行的比對。使用CLUSTALW進行比對。登錄號CAB52246:[胡盧巴]a半乳糖基轉(zhuǎn)移酶(SEQIDNO:26);CAI11452:[馬鈴薯]a-6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:27);CAI11453:[本氏煙草a-6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:28);CAI11454:蒺藜苜蓿a-6-半乳糖基轉(zhuǎn)移酶(SEQIDNO:29);ABE79594:[蒺藜苜蓿半乳糖基轉(zhuǎn)移酶(SEQIDNO:30);CAI79402:[瓜兒豆]半乳甘露聚糖半乳糖基轉(zhuǎn)移酶(SEQIDNO:31);CAI79403:[望江南決明]半乳甘露聚糖半乳糖基轉(zhuǎn)移酶(SEQIDNO:32);CAD98924:[光葉百脈根半乳甘露聚糖半乳糖基轉(zhuǎn)移酶(SEQIDNO:33)。圖12.CaGMGTl在中果咖啡和小果咖啡的多種組織中的定量RT-PCR表達數(shù)據(jù)。例示性實施方案的詳細描述定義在說明書和權(quán)利要求書中使用了涉及本發(fā)明的生物分子及其他方面的多個術(shù)語。除非在本文中^:特殊定義,術(shù)語被認為具有它們在分子生物學和生物化學領(lǐng)域的習慣含義。"分離"意指"依靠人力"從自然狀態(tài)改變。如果組合物或物質(zhì)存在于自然界,倘若其已經(jīng)被改變或已經(jīng)從其原始環(huán)境移去,則它已被"分離"。例如,當在本文中使用該術(shù)語時,天然的存在于活的植物或動物中的多核苷酸或多肽不是"分離的",但是與它的自然狀態(tài)共存的物質(zhì)分離的相同多核苷酸或多肽是"分離的"。"多核普酸",也被稱為"核酸分子",泛指任何多聚核糖核苷酸或多聚脫氧核糖核苷酸,其可以是未修飾的RNA或DNA,或者修飾的RNA或DNA。"多核苷酸"包括,但不限于單鏈和雙鏈DNA,作為單鏈和雙鏈區(qū)域混合物的DNA,單鏈和雙鏈RNA和作為單鏈和雙鏈區(qū)域混合物的RNA,雙鏈或單鏈和雙鏈區(qū)域的混合物)。此外,"多核苷酸"指包含RNA或DNA或RNA和DNA兩者的三鏈區(qū)域。術(shù)語多核苷酸還包括,包含一個或多個修飾堿基的DNA或RNA,以及出于穩(wěn)定性或其它理由主鏈被修飾的DNA或RNA。"修飾"堿基包括,例如三苯甲基化的威基和稀有堿基如次黃苷。可以對DNA和RNA進行多種修飾;因此,多核苷酸包括在自然界中常見的多核普酸的化學的、酶促的或代謝的修飾形式,以及病毒和細胞的DNA和RNA特征的化學形式。"多核苷酸"還包括相對短的多核苷酸,通常被稱為寡核苷酸。"多肽"指任何包含兩個或多個通過肽鍵或修飾的肽鍵彼此連接的氨基酸的肽或蛋白質(zhì),即,肽等構(gòu)物。"多肽"既指短鏈,通常稱為肽、寡肽或寡聚物,又指較長的鏈,泛指蛋白質(zhì)。多肽可以包含除20種基因編碼的氛基酸以外的氨基酸。"多肽"包括通過自然過程例如翻譯后加工,或者通過本領(lǐng)域為熟知的化學修飾方法修飾的氨基酸序列。該修飾詳細的描述在基礎(chǔ)課本中,更詳細的描述在專題論文以及長篇研究文獻中。修飾可以發(fā)生在多肽任何地方,包括肽主鏈、氨基酸側(cè)鏈和氨基或M末端??梢岳斫猓诮o定多肽的一些位點可以存在相同或不同程度的同類型修飾。而且,給定多肽可以包含多種類型的修飾。由于泛素化作用,多肽可以是分支的,也可以是有或無分支的環(huán)狀的。環(huán)狀的、分支的和分支環(huán)狀的多肽可以是天然翻譯后加工的結(jié)果,或者可以是用合成方法制造的。修飾包括乙?;饔谩Ⅴ;饔?、ADP-核糖基化作用、酰胺化作用、黃素的共價連接、血紅素部分的共價連接、核苷酸或核苷酸衍生物的共價連接、脂類或脂類衍生物的共價連接、磷脂酰肌醇的共價連接、交聯(lián)、環(huán)化、二硫鍵形成、脫甲基作用、共價交聯(lián)的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化、,羧化作用、糖基化作用、GPI錨形成、羥基化、碘化作用、甲基化、豆蔻?;⒀趸?、蛋白水解的加工、磷酸化、異戊二烯化、外消旋化、硒化、硫酸鹽化作用、轉(zhuǎn)運-RNA介導的氨基酸向蛋白質(zhì)的添加例如精氨?;头核鼗?。參見例如,Proteins畫StructureandMolecularProperties,第2版,T.E.Crdghton,W.H.Freeman和Company,NewYork,1993以及Wold,F(xiàn).,PosttranslationalProteinModiilcations:PerspectivesandProspects,PosttranslationalCovalentModificationofProteins中的第1-12頁,B.C.Johnson編著,AcademicPress,NewYork,1983;Seifter等人,"AnalysisforProteinMo<|iilcationsandNonproteinCofactors",MethEnzymol(1990)182:626-646以及Rattan等人,"ProteinSynthesis:PosttranslationalModificationsandAging",AnnNYAcadSci(1992)663:48-62。在本文中使用的術(shù)語"變體",是保持了必需的性質(zhì),但分別與參照多核苷酸或多肽不同的多核苷酸或多肽。多核苷酸的典型變體與另一個參照多核苷酸在核苷酸序列上是不同的。在變體核普酸序列上的變化可以或可以不改變參照多核苷酸編碼的多肽的氨基酸序列。如下所述,核苷酸改變可以導致參照序列編碼的多肽中氨基酸的取代、添加、缺失、融合和截短。多肽的典型變體與另一個參照多肽在氨基酸序列上不同。一般,差異是有限的,因此參照多肽和變體的序列總體上是緊密相似的,在許多區(qū)域是相同的。由于以任意組合的-i個或多個取代、添加或缺失,變體和參照多肽在M酸序列上可以不同。取代或插入的氨基酸殘基可以或可以不是遺傳密碼子編碼的。多核苷酸或多肽的變體可以是天然存在的,例如等位變體,或者可以是已知非天然存在的變體。多核苷酸和多肽的非天然存在的變體可以是用誘變技術(shù)或直接合成制造的。關(guān)于突變植物,術(shù)語"無效突變體"或"失功能突變體"用于表示具有突變的生物體或基因組DNA序列,所述突變導致基因產(chǎn)物無功能或大量缺少。此類突變可以存在于基因的編碼和/或調(diào)節(jié)區(qū),可以是個別殘基的改變,或者核酸區(qū)域的插入或缺失。這類突變還可以存在于其它基因的編碼和/或調(diào)節(jié)區(qū),所述其它基因可以調(diào)節(jié)或者控制基因和/或編碼的蛋白質(zhì),從而導致蛋白質(zhì)是無功能的或者大量缺少的。術(shù)語"充分相同"指核酸或氨基酸序列具有的序列變異本質(zhì)上不影響蛋白質(zhì)的性質(zhì)(即,蛋白質(zhì)的結(jié)構(gòu)、穩(wěn)定性特征、底物特異性和/或生物活性)。特別對于核酸序列,術(shù)語"充分相同"意指編碼區(qū)和控制表達的保守序列,并主要指在編碼的多肽中的編碼相同氨基酸的簡并密碼子,或者編碼保守取代的氨基酸的備用密碼子。關(guān)于"H&酸序列,術(shù)語"充分相同"一般指在不涉及決定結(jié)構(gòu)或功能的多肽區(qū)域的保存性取代和/或變異。術(shù)語"同一性百分比"和"相似性百分比,,在本文中還用于在氨基酸和核,列之間的比較。當指M^列時,"同一性"或"同一性百分比"指通過序列分析程序,目標#^#列中與被比較的氨基i^列中相同M酸相匹配的氨基酸的百分比。"相似性百分比"指目標M酸序列中已經(jīng)匹配相同的或保守的氨基酸的氨基酸百分比。保守"H&酸是結(jié)構(gòu)不同但是物理性質(zhì)相似的氨基酸,因此彼此的互換不會明顯的改變產(chǎn)生的蛋白質(zhì)的三級結(jié)構(gòu)。Taylor(1986,J.Theor.Biol.119:205)定義了保存性取代。當關(guān)于核酸分子時,"同一性百分比"指通過序列分析程序,目標核酸序列中匹配相同的核苷酸的百分比。用已知的方法可以方便的計算"同一性,,和"相似性"。可以使用計算機義差別。在優(yōu)選的方法中,使用BLAST程序(NCBI)及其使用的M,并且使用DNAstar系統(tǒng)(Madison,WI)比對基因組DNA序列的序列片段。然而,可以使用任何標準比對軟件獲得等價比對和相似性/同一性評估。例如,可以從Madison,Wisconsin的遺傳計算公司(GeneticsComputerGroup)獲得的GCGWisconsinPackage9.1版,及該程序使用的缺省參數(shù)(空位開放罰分=12,空位延伸罰分=4)也可以用來比較序列同一性和相似性。在本文中使用的"抗體"包括多克隆和單克隆抗體、嵌合的、單鏈的和人源化抗體,以及抗體片段(例如,F(xiàn)ab、Fab'、F(ab')2和Fv),包括Fab或其它免疫球蛋白表達文庫的產(chǎn)物。關(guān)于抗體,術(shù)語"免疫特異的"或"特異的"指抗體結(jié)合目標蛋白質(zhì)的一個或多個表位,但是其本質(zhì)上不識別和結(jié)合樣品中的其它分子,所述樣品包括抗原性生物分子的混合群體。確定抗體結(jié)合特異性的篩選測定是本領(lǐng)域普遍已知并常規(guī)實踐的。對此類測定的綜合討論參見Harlow等人(編著),AntibodiesALaboratoryManual;ColdSpringHarborLaboratory;ColdSpringHarbor,NY(1988),第6章。術(shù)語"充分純的"指包含至少50-60%按重量計算的目標化合物(例如,核酸、寡核苷酸、蛋白質(zhì),等等)的制品。更優(yōu)選的,制品包含至少75%(重量),最優(yōu)選的卯-99%(重量)的目標化合物。通過適合目標化合物的方法測量純度(例如,層析法、瓊脂糖或聚丙烯酰胺凝膠電泳、HPLC分析,等等)。關(guān)于單鏈核酸分子,術(shù)語"特異的雜交"指在兩個序列足夠互補的單鏈核酸分子之間的締合作用,所述互補允許在本領(lǐng)域一般使用的預(yù)確定的條件下進行此類雜交(有時定義為"充分互補")。特別的,術(shù)語指寡核苷酸和單鏈DNA或RNA分子中包含的、充分互補的序列的雜交,本質(zhì)上排除寡核苷酸與非互補序列的單鏈核酸的雜交。"編碼序列,,或"編碼區(qū)"指當表達序列時,具有產(chǎn)生基因產(chǎn)物例如M酸或多肽所必需的序列信息的核酸分子。編碼序列可以在翻譯區(qū)域內(nèi)包含非翻譯序列(例如,內(nèi)含子或5,或3'非翻譯區(qū)),或可以缺乏此類間插非翻譯序列(例如,在cDNA中)。"內(nèi)含子"指核酸中不編碼與蛋白質(zhì)合成有關(guān)的信息的多核苷*列。此類序列^皮轉(zhuǎn)錄成mRNA,但是在mRNA翻譯成蛋白質(zhì)之前被去掉。術(shù)語"有效的連接,,或"有效的插入,,意指將表達編碼序列必需的調(diào)控序列置于核酸分子中相對于編碼序列的適當位置,從而使編碼序列能夠表達。例如,當啟動子能夠控制編碼序列的轉(zhuǎn)錄或表達時,啟動子是與編碼序列有效的連接的。編碼序列寸以在正義或反義方向與啟動子或調(diào)控序列有效的連接。術(shù)語"有效的連接,,有時也用于其它轉(zhuǎn)錄調(diào)控元件(例如增強子)在表達載體中的排布。轉(zhuǎn)錄和翻譯調(diào)控序列是DNA調(diào)節(jié)序列,例如啟動子、增強子、多聚腺苷酸化信號、終止子,等等,其用于在宿主細胞中表達編碼序列。術(shù)語"啟動子"、"啟動子區(qū)域"或"啟動子序列"一般指基因的轉(zhuǎn)錄調(diào)節(jié)區(qū),發(fā)現(xiàn)其可以在編碼區(qū)的5'或3,側(cè),或在編碼區(qū)內(nèi),或在內(nèi)含子內(nèi)。通常,啟動子是能夠結(jié)合細胞內(nèi)RNA聚合酶并起始下游(3,方向)編碼序列轉(zhuǎn)錄的DNA調(diào)節(jié)區(qū)。典型的5,啟動子序列是在其3,端由轉(zhuǎn)錄起始位點所結(jié)合,并向上游(5,方向)延伸,以包括以高于背景的可檢測水平起始轉(zhuǎn)錄所必需的最少g數(shù)或元件。轉(zhuǎn)錄起始位點(通過核酸酶Sl作圖可方便的定義),以及負責結(jié)合RNA聚合酶的蛋白質(zhì)結(jié)合結(jié)構(gòu)域(共有序歹'J)都位于啟動子序列內(nèi)。"載體,,是復(fù)制子,例如質(zhì)粒、噬菌體、黏?;虿《?,其中可以有效的插入另一個核酸片段從而復(fù)制或表達該片段。術(shù)語"核酸構(gòu)建體"或"DNA構(gòu)建體"有時用于指編碼序列或有效的連接合適調(diào)控序列并被插入到用于轉(zhuǎn)化細胞的載體中的序列。該術(shù)語可與術(shù)語"轉(zhuǎn)化的DNA,,或"轉(zhuǎn)基因"互換的使用。此類核酸構(gòu)建體可以包含目標基因產(chǎn)物的編碼序列,以及選擇性標記基因和/或才艮告基因。"標記基因"或"選擇性標記基因"是編碼基因產(chǎn)物的基因,所述基因產(chǎn)物產(chǎn)生的特征能夠使含有該基因的細胞可以從不含該基因的細胞中挑選出來。用于遺傳工程的載體一般含有一個或多個選擇性標記基因。選擇性標記基因的類型包括(l)抗生素抗性基因;(2)除草劑耐受性或抗性基因;和(3)代謝或營養(yǎng)缺陷型標記基因,其使轉(zhuǎn)化的細胞能夠合成細胞以其它方式不能產(chǎn)生的必需組分,一般是氨基酸。"報告基因"也是一類標記基因。它一般編碼用標準實驗室手段(例如,酶活性、熒光)可測定的或可檢測的基因產(chǎn)物。術(shù)語"表達"、"表達的"或基因的"表達"指基因產(chǎn)物的生物合成。過程涉及基因轉(zhuǎn)錄為mRNA,然后mRNA翻譯為一個或多個多肽,并涵蓋所有的天然發(fā)生的翻譯后修飾作用。"內(nèi)源性"指任何成分,例如基因或核酸或多肽,其可以天然的在特定的生物體內(nèi)發(fā)現(xiàn)。核酸構(gòu)建體的"異源"區(qū)域是在較大分子內(nèi)核酸分子的可識別部分(或多個部分),其未發(fā)現(xiàn)與自然界的較大分子相關(guān)。因此,當異源區(qū)域包括基因時,位于基因側(cè)面的DNA通常在來源生物體的基因組中是不位于基因組DNA側(cè)面。在另一個實施例中,異源區(qū)域是構(gòu)建體,其中未在自然界中發(fā)現(xiàn)編碼序列本身(例如,其中基因組編碼序列包含內(nèi)含子的cDNA,或具有不同于天然基因的密碼子的合成序列)。等位變異或天然發(fā)生的突變事件不產(chǎn)生本文中定義的DNA異源區(qū)域。上文定義的術(shù)語"DNA構(gòu)建體"也用于指異源區(qū)域,特別是構(gòu)建用于細胞轉(zhuǎn)化的一個異源區(qū)域。外源或異源DNA"轉(zhuǎn)化"或"轉(zhuǎn)染"細胞是當此類DNA已經(jīng)被引入細胞內(nèi)部時。轉(zhuǎn)化DNA可以或可以不必整合(共價連接的)到細胞的基因組中。例如在原核生物、酵母和哺乳動物細胞中,可以在附加型元件例如質(zhì)粒上維持轉(zhuǎn)化DNA。關(guān)于真核細胞,穩(wěn)定轉(zhuǎn)化的細胞是這樣的細胞,其中轉(zhuǎn)化DNA已經(jīng)整合到染色體中,從而通過染色體復(fù)制被子細胞遺傳。通過真核細胞建立細胞系或克隆的能力來證明該穩(wěn)定性,所述細胞系或克隆由含有轉(zhuǎn)化DNA的子細胞群體組成。"克隆"是由單個細胞或共同祖先通過有絲分裂衍生的一群細胞。"細胞系,,是初級細胞的克隆,其能夠在體外穩(wěn)定成長多代。"種粒"、"種子,,或"豆,,指開花植物的能夠發(fā)育成另一林此類植物的繁殖單位。如本文中使用的,特別是對于咖啡植物,使用的術(shù)語是同義的和可互換的。"半乳甘露聚糖合成酶"和"半乳甘露聚糖合成基因"指,在半乳甘露聚糖聚合物合成中涉及的蛋白質(zhì)或酶,和編碼其的基因。半乳甘露聚糖合成酶包括甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶。同樣地,半乳甘露聚糖合成基因包括編碼甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶的基因。如本文中使用的,術(shù)語"植物"包括涉及全林植物、植物器官(例如,葉、莖、枝條、根)、種子、花粉、植物細胞、植物細胞細胞器及其子代。在發(fā)明范圍內(nèi)理解的轉(zhuǎn)基因植物的部分包括,例如,源自轉(zhuǎn)基因植物或其子代的植物細胞、原生質(zhì)體、組織、愈傷組織、胚胎以及花、莖、種子、花粉、果實、葉或才艮。描述半乳甘露聚糖是成熟咖啡種粒中豐富的多糖和重要的組分。它在成熟咖啡種粒中的大量存在支持了它的作用是維持種粒完整性的觀點。與之一致,認為半乳甘露聚糖及咖啡種粒中的其它糖組分,在咖啡種粒在水中的提取特征中發(fā)揮重要作用,其可以影響獲得的咖啡的物理和化學特性。在該多糖的代謝中涉及的關(guān)鍵酶是半乳甘露聚糖合成酶,例如甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶。本發(fā)明一個方面的特征是來自咖啡的編碼甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶的核酸分子。來自中果咖啡的編碼完整甘露聚糖合酶的cDNA(pVC4、pVC6)在本文中分別被分別陳述為SEQIDNO:l和2,并被稱為CW/tf/^。來自小果咖啡的編碼完整甘露聚糖合酶的cDNA(pVC7)在本文中被陳述為SEQIDNO:3,并被稱為CaAf""S。部分的基因組克隆分別作為SEQIDNO:7、8、9和10陳述,如在附圖2A的描述和實施例中的討論。此外,本核酸分子包括編碼半乳甘露聚糖半乳糖基轉(zhuǎn)移酶的cDNA,其有時是與來自胡盧巴的半乳糖基轉(zhuǎn)移酶具有約54%同一性的序列,有時是與來自百糾艮(/fl/ww/c附)的半乳糖基轉(zhuǎn)移酶具有約54%同一性的序列。在一些實施方案中,'上述cDNA包括SEQIDNO:ll或13提供的序列,其被稱為CcGMG77,以及SEQIDNO:12或14提供的序列,其被稱為CcGAfGT7。發(fā)明的另一個方面涉及通過表達上述核酸分子產(chǎn)生的蛋白質(zhì)及其應(yīng)用。通過翻譯SEQIDNO:l或SEQIDNO:2產(chǎn)生的推斷的CcManS蛋白質(zhì)的M酸序列,在本文中分別作為SEQIDNO:4和5陳述。通過翻譯SEQIDNO:3產(chǎn)生的CaManS蛋白質(zhì)的推斷的^J^酸序列在本文中作為SEQIDNO:6陳述。通過翻譯SEQIDNO:ll或SEQIDNO:13產(chǎn)生的CcGMGTl蛋白質(zhì)的推斷的^&酸序列在本文中分別作為SEQIDNO:15和17陳述。通過翻譯SEQIDNO:12或SEQIDNO:14產(chǎn)生的CcGMGT2蛋白質(zhì)的推斷的^J^酸序列,本文中分別作為SEQIDNO:16和18陳述。下表列舉了上述多核苷酸和編碼蛋白質(zhì)。<table>tableseeoriginaldocumentpage22</column></row><table>^明始古而;不漲;s.拔磁公羊知竑操作、以及最終在IHt咖啡種粒性質(zhì)中的應(yīng)用。雖然在本文中描述和舉例說明了來自中果咖啡和小果咖啡的編碼半乳甘露聚糖合成酶的多核苷酸,但是本發(fā)明還意在涵蓋來自其它咖啡屬物種的核酸及其編碼的蛋白質(zhì),所述核酸和編碼的蛋白質(zhì)與中果咖啡和小果咖啡的多核苷酸和蛋白質(zhì)足夠相似,可互換的用于如下所述的目的。因此,當本文指半乳甘露聚糖合成酶"甘露聚糖合酶"和"半乳甘露聚糖半乳糖基轉(zhuǎn)移酶"(或"半乳糖基轉(zhuǎn)移酶")時,除非一些特殊的情況,這些術(shù)語意在涵蓋具有本文中描述的普遍的,理、生化和功能特征的所有咖啡屬甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶,以及編碼它們的多核苷酸。根據(jù)它們的序列考慮,發(fā)明的甘露聚糖合酶多核苷酸包括SEQIDNO:l-3的等位變體和天然突變體,其很可能在中果咖啡和小果咖啡的不同變種中發(fā)現(xiàn),并JU艮可能在不同的咖啡物種中發(fā)現(xiàn)SEQIDNO:l-3的同源物。半乳糖基轉(zhuǎn)移酶多核苷酸包括SEQIDNO:ll-14的等位變體和天然突變體,其很可能在中果咖啡和小果咖啡的不同變種中發(fā)現(xiàn),并且很可能在不同的咖啡物種中發(fā)現(xiàn)SEQIDNO:ll-14的同源物。預(yù)期此類變體和同源物在核苷酸和M酸序列中將具有一些差別,因此存在分離的編碼甘露聚糖合酶的核酸分子和編碼半乳糖基轉(zhuǎn)移酶的核酸分子,它們編碼各自的多肽,所述多肽與SEQIDNO:4、5或6編碼的多肽(就甘露聚糖合酶來說),以及與SEQIDNO:15、16、.:17或18編碼的多肽(就半乳糖基轉(zhuǎn)移酶來說),具有至少約75%(以及,以優(yōu)選性遞增順序,76%、77%、78%、79%、70%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%)的同一性。因為在不同咖啡變種和物種中甘露聚糖合酶、半乳糖基轉(zhuǎn)移酶以及編碼它們的基因之間,可能存在天然的序列變異,預(yù)期本領(lǐng)域技術(shù)人員可以發(fā)現(xiàn)變異的該水平,同時還維持本發(fā)明的多肽和多核苷酸的獨特性質(zhì)。此預(yù)期的部分是由于遺傳密碼子的簡并狀態(tài),以及保守M酸序列變異已知的進化成功,其沒有可觀的改變編碼蛋白質(zhì)的性質(zhì)。因此,認為此類變體和同源物本質(zhì)上是彼此相同的,并包括在本發(fā)明的范圍內(nèi)。以下部分闡述了本發(fā)明實踐中涉及的一般程序。對于被提到的具體物質(zhì),僅僅是出于舉例說明,并非是意在限制發(fā)明。除非另作說明,使用的是普通的生化和分子生物學程序,例如在Sambrook等人,MolecularCloning,ColdSpringHarborLaboratory(1989)或Ausubel等人(編著),CurrentProtocolsinMolecularBiology,JohnWiley&Sons(2005)中闡述的。核酸分子、蛋白質(zhì)和抗體可以用兩種普通方法制備本發(fā)明的核酸分子(i)它們可以從合適的核苷酸三磷酸中合成,或(2)可以從生物學來源中分離。兩種方法都利用本領(lǐng)域普遍已知的規(guī)程。核苷酸序列信息的可獲得性,例如具有SEQIDNO:l-3(或由SEQIDNO:7-10代表的片段)或11-14(或由SEQIDNO:19和20代表的片段)的cDNA使能夠通過寡核苷酸合成來制備本發(fā)明的分離的核酸分子??梢酝ㄟ^美國應(yīng)用生物系統(tǒng)公司(AppliedBiosystems)38ADNA合成儀或類似裝置中使用的亞磷酰胺方法制備合成的寡核苷酸??梢愿鶕?jù)本領(lǐng)域已知的方法純化所獲得的構(gòu)建體,例如高效液相層析(HPLC)。由于目前的寡核苷酸合成方法固有的尺寸限制,必須分階段合成長雙鏈多核苷酸如本發(fā)明的DNA分子。因此,例如長雙鏈分子可以作為一些具有適當互補性的較小片段合成。因此,產(chǎn)生的互補片段可以退火的,從而各片段具有連接相鄰片段的合適的粘性末端。在存在DNA連接酶的情況下,可以通過粘性末端退火連接相鄰片段,從而構(gòu)建全長的雙鏈分子。隨后可以在合適的載體中克隆和擴增所構(gòu)建的合成DNA分子。根據(jù)本發(fā)明,可以通過適當嚴格性的雜交和洗滌條件,鑒定與編碼半乳甘露聚糖合成酶的多核苷酸的部分或全部編碼和/或調(diào)節(jié)區(qū)具有適當水平序列同源性的核酸。本領(lǐng)域技術(shù)人員將理解,當上述策略應(yīng)用于基因組序列時,除能夠分離編碼多糖代謝酶的序列之外,還能夠分離與多糖代謝酶基因有關(guān)的啟動子,和其它基因調(diào)節(jié)序列,即使該調(diào)節(jié)序列本身未必具有能夠進行合適雜交的足夠的同源性。作為典型的舉例說明,可以根據(jù)Sambrook等人的方法實施雜交,使用的雜交溶液包含5xSSC、5xDenhard、t試劑、1.0%SDS、lOO^ig/ml變性的片段化的鮭精DNA、0.05%焦磷酸鈉和達到50%的甲酰胺。雜交在37-42。C進行至少六小時。在雜交后,如下所述洗滌濾膜(l)在2xSSC和1%SDS中室溫下5分鐘;(2)在2xSSC和0.1%SDS中室溫下15分鐘;(3)在2xSSC和0.1。/。SDS中37。C30分鐘-1小時;(4)在2xSSC和0.1。/。SDS中45-55。C2小時,每30分鐘更換溶液。用于計算嚴格條件的一個常用公式如下,所述嚴格條件是在指定序列同源性的核酸分子之間完成雜交所要求的(Sambrook等人,1989):Tm=81.5。C+16.6Log[Na++0.41(%G+C)-0.63(%甲酰胺)一600/雙鏈體中的弁bp'作為上述公式的舉例說明,使用[3+]=[0.368和50%甲酰胺,GC含量42%和平均探針大小200>^,Tm為57。C。同源性每下降1%,DNA雙鏈體的Tm下降l-1.5°C。因此,用42。<:的雜交溫度可以觀察到具有超過約75%序列同一性的靶。在一個實施方案中,雜交是在37。C,最終洗滌是在42。C;在另一個實施方案中,雜交是在42。C,最終洗滌是在50。C;在另一個實施方案中,雜交是在42。C,最終洗滌是在65。C,均利用上述雜交和洗滌溶液。高嚴格條件包括在上述雜交溶液中42。C雜交,和在0.1xSSC和0.1。/。SDS中65。C最終洗滌10分鐘。本發(fā)明的核酸可以作為在任何便利的克隆載體中的DNA來維持。在優(yōu)選的實施方案中,克隆維持在質(zhì)??寺?表達載體中,例如pGEM-T(普洛麥格生物才支術(shù)有P艮公司(PromegaBiotech),Madison,WI)、pBluescript(斯萊特因公司(Stratagene),LaJolla,CA)、pCR4-TOPO(英杰生命技術(shù)公司(Invitrogen),Carlsbad,CA)或pET28a+(諾華因公司(Novagen),Madison,WI),它們均可以在合適的大腸桿菌(Eco/0宿主細胞中增殖。發(fā)明的核酸分子包括cDNA、基因組DNA、RNA及其片段,其可以是單鏈、雙鏈或者甚至三鏈。因此,本發(fā)明提供寡核苷酸(正義或反義鏈的DNA或RNA),其具有能夠與本發(fā)明的核酸分子的至少一種序列雜交的序列。此類寡核苷酸可用作檢測植物組織測試樣品中的編碼半乳甘露聚糖合成酶的基因或mRNA的探針(例如,通過PCR擴增),或用于在mRNA翻譯成蛋白質(zhì)時或之前,對編碼半乳甘露聚糖合成酶的基因表達進行正調(diào)控或負調(diào)控??梢允褂闷渲芯幋a半乳甘露聚糖合成酶的寡核苷酸或多核苷酸作為探針用于此類測定的方法包括(l)原位雜交;(2)Southern雜交;(3)Northern雜交;和(4)分類擴增反應(yīng)如聚合SIM反應(yīng)(PCR,包括RT-PCR)和連接酶鏈式反應(yīng)(LCR)。具有能夠與本發(fā)明的核酸分子的至少一種序列雜交的序列的寡核苷酸包括反義寡核苷酸。反義寡核苷^A耙向可能使用的對于翻譯是關(guān)鍵的mRNA特定區(qū)域的。使用反義分子減少預(yù)定基因的表達水平是本領(lǐng)域已知的??梢酝ㄟ^用DNA構(gòu)建體轉(zhuǎn)化植物細胞原位提供反義分子,所述DNA構(gòu)建體在轉(zhuǎn)錄后產(chǎn)生反義RNA序列。此類構(gòu)建體可設(shè)計成產(chǎn)生全長或部分的反義序列??梢酝ㄟ^轉(zhuǎn)基因過量產(chǎn)生基因編碼序列的正義和反義RNA,從而產(chǎn)生大量的dsRNA,增強該基因沉默效應(yīng)(例如見Waterhouse等人,1998,PNAS95:13959-13964)。在該方面,已經(jīng)發(fā)現(xiàn)含有對應(yīng)于至少一個內(nèi)含子的部分或全部的序列的dsRNA是特別有效的。在一個實施方案中,通過轉(zhuǎn)基因表達部分或全部的編碼甘露聚糖合酶或編碼半乳糖基轉(zhuǎn)移酶的序列的反義鏈。在另一個實施方案中,轉(zhuǎn)基因表達部分或全部的編碼甘露聚糖合酶的序列或編碼半乳糖基轉(zhuǎn)移酶的序列的雜交正義和反義鏈。在另一個實施方案中,甘露聚糖合酶基因或半乳糖基轉(zhuǎn)移酶基因或兩者都可以用商業(yè)上可獲得的物質(zhì)和方法(例如,英杰生命技術(shù)有限公司(Invitrogen,Inc.),CarlsbadCA)使用小干擾RNA(siRNA;Elbashir等人,2001,GenesDev.15(2):188-200)沉默。根據(jù)已知的方法,可以用多種方法制備本發(fā)明核酸編碼的多肽。如果在原位生產(chǎn),則可以從合適的來源中純化多肽,例如種子、果皮或其它植物部分??蛇x的,編碼多肽的核酸分子的可獲得性,使能夠利用本領(lǐng)域已知的體外表達方法生產(chǎn)蛋白質(zhì)。例如,可以將cDNA或基因克隆到合適的體外轉(zhuǎn)錄載體如用于體外轉(zhuǎn)錄的pSP64或pSP65中,然后在合適的無細胞翻譯系統(tǒng)如小麥胚芽或兔網(wǎng)織紅細胞中進行無細胞翻譯。體外轉(zhuǎn)錄和翻譯系統(tǒng)是商業(yè)上可獲得的,例如、來自普洛麥格生物技術(shù)有限公司(PromegaBiotech),Madison,WI、BRL,Rockville,MD或英杰生命才支術(shù)zi^司(Invitrogen),Carlsbad,CA。根據(jù)優(yōu)選的實施方案,可以通過合適的原核或真核系統(tǒng)表達生產(chǎn)更大量的多肽。例如,部分或全部的DNA分子例如具有SEQIDNO:2或SEQIDNO:3或SEQIDNO:ll-14中任一項的cDNA,可以被插入到適于在細菌細胞(例如大腸桿菌)或酵母細胞(例如釀酒酵母(Saccharomycescerevisiae))中表達的質(zhì)粒載體中,或被插入到適于在昆蟲細胞中表達的桿狀病毒載體中。此類載體包括在宿主細胞中表達DNA所必需的調(diào)節(jié)元件,其位置的放置方式允許DNA在宿主細胞中表達。此類表達需要的調(diào)節(jié)元件包括啟動子序列、轉(zhuǎn)錄起始序列和,任選的,增強子序列??梢愿鶕?jù)本領(lǐng)域已知的方法純化在重組的原核或真核系統(tǒng)中通過基因表達生產(chǎn)的多肽。在優(yōu)選的實施方案中,可以使用商業(yè)上可獲得的表達/分泌系統(tǒng),藉此重組蛋白質(zhì)表達并之后從宿主細胞分泌,隨后從周圍培養(yǎng)基中純化。替代方案涉及通過親合分離純化重組蛋白質(zhì),例如通過與重組蛋白質(zhì)特異性結(jié)合的抗體的免疫學相互作用。可以根據(jù)標準程序分析用上述方法制備的本發(fā)明的多肽。根據(jù)已知的方法,從咖啡中純化的或重組生產(chǎn)的多肽可用于產(chǎn)生在本文中定義的多克隆或單克隆抗體、抗體片段或衍生物。除了產(chǎn)生完整重組蛋白質(zhì)的抗體之外,如果蛋白質(zhì)或Southern分析以及克隆分析(見下文)表明克隆的基因?qū)儆诙嗷蚣易?,則可以產(chǎn)生針對對應(yīng)于蛋白質(zhì)非保守區(qū)域的合成肽所制備的成員-特異性抗體。在本文中出于任何目的描述的包括本發(fā)明抗體的試劑盒也包括在本發(fā)明的范圍內(nèi)。通常,該試劑盒包括對照抗原,抗體對其是免疫特異性的。載體、細胞、組織和植物生產(chǎn)轉(zhuǎn)基因宿主細胞的載體和試劑盒也是才艮據(jù)本發(fā)明的特征,其包括編碼半乳甘露聚糖合成酶的多核普酸或寡核苷酸,或其正義或反義方向的體。合適的宿主細胞包括但不限于,植物細胞、細菌細胞、酵母及其他真菌細胞、昆蟲細胞和哺乳動物細胞。用于轉(zhuǎn)化多種上述宿主細胞的載體對本領(lǐng)域技術(shù)人員是普遍已知的。它們包括但不限于,質(zhì)粒、黏粒、桿狀病毒、桿粒、細菌人工染色體(BAC)、酵母人工染色體(YAC),以及其它細菌的、酵母和病毒的載體。通常,用于生產(chǎn)轉(zhuǎn)基因宿主細胞的試劑盒將包括一個或多個合適的載體,以及用于使用載體生產(chǎn)轉(zhuǎn)基因細胞的說明書。試劑盒還可以包括一個或多個其它組分,僅舉幾個例子如培養(yǎng)細胞的培養(yǎng)基、實施轉(zhuǎn)化細胞的試劑和檢測轉(zhuǎn)基因細胞基因表達的試劑。本發(fā)明包括轉(zhuǎn)基因植物,其含有一個或多個編碼半乳甘露聚糖合成酶的基因的拷貝,或抑制植物的內(nèi)源半乳甘露聚糖合成酶的產(chǎn)生或功能的核酸序列。這是通過用轉(zhuǎn)基因轉(zhuǎn)化植物細胞完成的,所述轉(zhuǎn)基因包含部分或全部編碼半乳甘露聚糖合成酶的序列、或其突變體、反義鏈或變體,包括RNA,如下所述,所述轉(zhuǎn)基因受到天然的或重組的調(diào)節(jié)序列的調(diào)控。轉(zhuǎn)基因^i物咖啡物種是優(yōu)選的,包括但不限于,Cfl6^/t"toe、小果咖啡(Cflm6/ca)、阿諾德氏咖啡(C."/7ioW/朋a)、C"rww附/ewsis1、C6ewgfl/ews/s1、中果咖啡(C.cflfi印/^m)、剛果咖啡(C.cwige附/s)、高產(chǎn)咖啡(C.Z)ewev/W)、埃塞爾薩咖啡(C.exce/s")、Ce"gw》'V/es和C/r"moi/j;;c、d"/7flto"、C.A:/rwVwifl、大果咖啡(C.//6m'cfl)、C柳o/oww^/ow、Cmse附as"、Cs^/va^x:、C.s^柳y/om、狹葉咖啡(C.5^"o>/^〃a)、C.fravewcwe腦's、C.w妙rifl朋和C.^""gwWanV"發(fā)明還包括任何物種的植物;其包括但不限于,煙草、擬南芥和其它"實驗室友好的"物種、禾谷類作物例如玉米、小麥、稻、大豆、大麥、黑麥、燕麥、高粱、苜蓿、車軸草等;產(chǎn)油植物例如油菜、紅花、向日葵、花生、可可樹等,蔬菜作物例如番茄、粘果酸漿(tomatillo)、馬鈴薯、胡椒、茄子、甜菜、胡蘿卜、黃瓜、萵苣、豌豆等、園藝植物例如紫菀、秋海裳、菊花、飛燕草、碧冬茄、百日草、結(jié)縷草(lawn)和草坪草等等。可以用本領(lǐng)域技術(shù)人員已知的標準植物轉(zhuǎn)化方法產(chǎn)生轉(zhuǎn)基因植物。這些包括但不限于,農(nóng)桿菌載體、原生質(zhì)體的聚乙二醇處理、生物射彈DNA遞送、UV激光微束、雙生病毒群載體或其它植物病毒載體、原生質(zhì)體的磷酸鋦處理、分離原生質(zhì)體的電穿孔、攪拌溶液中的細胞懸液與具有轉(zhuǎn)化DNA包被的微珠、攪拌溶液:中的細胞懸液與轉(zhuǎn)化DNA包被的硅纖維、直接的DNA攝入、脂質(zhì)體介導的DNA攝入,等等。此類方法已經(jīng)在本領(lǐng)域中公開。見例如,MethodsforPlantMolecularBiology(Weissbach&Weissbach,編著,1988);MethodsinPlantMolecularBiology(Schuler&Zielinski,編著,1989);PlantMolecularBiologyManual(Gelvin,Schilperoort,Verma,編著,1993》和MethodsinPlantMolecularBiology畫ALaboratoryManual(Maliga,Klessig,Cashmore,Gruissem&Varner,編著,1994)。轉(zhuǎn)化的方法取決于被轉(zhuǎn)化的植物。農(nóng)桿菌栽體常用于轉(zhuǎn)化雙子葉植物物種。農(nóng)桿菌二元載體包括但不限于,BIN19及其衍生物、pBI載體系列和二元載體pGA482、pGA492、pLH7000(GenBank登錄AY234330)以及任一合適的pCAMBIA載體之一(來自由Hajdukiewicz,Svab&Maliga構(gòu)建的pPZP載體(1994)PlantMolBiol25:989-994,可以從CAMBIA,GPOBox3200,CanberraACT2601,Australia或通過世界互聯(lián)網(wǎng)在CAMBIA.org獲得)。對于單子葉植物物種的轉(zhuǎn)化,用包被了轉(zhuǎn)化DNA的顆粒和包被了轉(zhuǎn)化DNA的硅纖維進行生物射彈轟擊對于進行核轉(zhuǎn)化通常是有效的??蛇x的,農(nóng)桿菌"超二元"載體已經(jīng)被成功地用于稻、玉米和多種其它單子葉植物物種的轉(zhuǎn)4t。用于轉(zhuǎn)化選定植物的DNA構(gòu)建體包括有效的連接合適的5'(例如,啟動子和翻譯調(diào)節(jié)序列)和3,調(diào)節(jié)序列(例如,終止子)的目標編碼序列。在一個實施方案中,可以使用將編碼半乳甘露聚糖合成酶的序列受到其自身的5'和3'調(diào)節(jié)元件的控制下。在其它實施方案中,編碼半乳甘露聚糖合成酶的序列和調(diào)節(jié)序列是,皮替換了:的,從而為了表型的改善例如生產(chǎn)的咖啡的風味、香氣或其它特征如泡沫,而改變了轉(zhuǎn)化植物的多糖語。在替代的實施方案中,將基因的編碼區(qū)置于強力的組成型啟動子下,所述啟動子例如花椰菜花葉病毒(CaMV)35S啟動子或玄參花葉病毒35S啟動子。在本發(fā)明中考慮使用的其它組成型啟動子包括但不限于T-DNA甘露堿合成酶、胭脂氨酸合成酶和章魚堿合酶啟動子。在其它實施方案中,使用的是強的單子葉植物啟動子,例如,玉米泛素啟動子、稻肌動蛋白啟動子或稻微管蛋白啟動子(Jeon等人,PlantPhysiology.123:1005-14,2000)。在誘導型啟動子下表達半乳甘露聚糖合成酶編碼序列的轉(zhuǎn)基因植物也被認為是在本發(fā)明的范圍之內(nèi)。誘導型植物啟動子僅舉幾例,包括四環(huán)素阻抑物/操縱子控制的啟動子、熱齓基因啟動子、脅迫(例如,創(chuàng)傷)-誘導型啟動子、防御應(yīng)答型基因啟動子(例如苯丙氨酸氨裂合酶基因)、創(chuàng)傷誘導型基因啟動子(例如富羥脯氨酸細胞壁蛋白質(zhì)基因),化學-誘導型基因啟動子(例如,硝酸還原酶基因、葡聚糖酶基因、殼多糖酶基因,等等)和黑暗-誘導型基因啟動子(例如,天冬酰胺合成酶基因)。在本發(fā)明中也考慮使用組織特異性和發(fā)育特異性啟動子。種子特異性啟動子的非限制性實施例包括Ciml(細胞分裂素-誘導信息)、cZ19Bl(玉米19kDa玉米醇溶蛋白)、milps(肌-肌醇-l-磷酸鹽合酶)和celA(纖維素合酶)(美國系列申請?zhí)?9/377,648)、豆p-菜豆蛋白、油菜籽蛋白、p-伴大豆球蛋白、大豆凝集素、十字花科蛋白、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蠟質(zhì)(waxy)、shrunkenl、shrunken2和球蛋白1、大豆lls豆球蛋白(Baumlein等人、1992),和中果咖啡llS種子貯藏蛋白(Marraccini等人、1999),也參見WO00/12733,其中公開了來自endl和end2基因的種子優(yōu)選的啟動子。還可以使用其它的咖啡屬種子特異性啟動子,包括但不限于在共同擁有的未決的PCT申請?zhí)朥S2006/026121中描述的油質(zhì)蛋白基因啟動子、在共同擁有的未決的PCT申請?zhí)朥S2006/026234中描述的脫水蛋白基因啟動子和在共同擁有的未決的PCT申請?zhí)朥S2006/34402中描述的9-順式-環(huán)氧類胡蘿卜素雙加氧酶基因啟動子。其它組織特異性啟動子的實施例包括但不限于為了在光合組織中表達的核酮糖二磷酸羧化酶(RuBisCo)小亞基基因啟動子(例如,被Marracini等人,2003描述的^P啡小亞基啟動子)或用于在光合組織中表達的葉綠素a/b結(jié)合蛋白(CAB)基因啟動子;和在根中表達時需要的根-特異性谷氨酰胺合成酶基因啟動子。編碼區(qū)還有效的連接合適的3'調(diào)節(jié)序列。在不使用天然3'調(diào)節(jié)序列的實施方案中,可以使用胭脂氨酸合成酶的多聚腺苷酸化區(qū)域。其它有用的3'調(diào)節(jié)區(qū)包括但不限于章魚堿合酶多聚腺苷酸化區(qū)域。在合適的調(diào)節(jié)元件的控制之下,被選定的編碼區(qū)有效的連接核抗藥性標記如卡那霉素抗性。其它有效的選擇性標記系統(tǒng)包括賦予抗生素或除草劑抗性(例如,對潮霉素、磺酰脲、草丁膦或草甘膦的抗性)的基因或賦予選擇性生長的基因(例如,磷酸甘露糖異構(gòu)酶,其使植物細胞能夠在甘露糖上生長)。選擇性標記基因包括但不限于,編碼抗生素抗性的基因,例如那些編碼新霉素磷酸轉(zhuǎn)移酶II(NEO)、二氫葉酸還原酶(DHFR)和潮霉素磷酸轉(zhuǎn)移酶(HPT)的基因,以及賦予對除草劑化合物抗性的基因,例如草甘膦-抗性的EPSPS和/或草甘膦氧化還原酶(GOX)、對溴苯腈抗性的溴苯腈腈水解酶(Bromoxynilnitrilase)(BXN)、對咪唑啉酮抗性的AHAS基因、磺酰脲抗性基因和2,4-二氯苯氧乙酸(2,4-D)抗性基因。在一些實施方案中,本發(fā)明所涵蓋的啟動子和其它表達調(diào)節(jié)序列是與報告基因有效連接的??紤]在發(fā)明中使用的報告基因包括但不限于,編碼綠色熒光蛋白(GFP)、紅色熒光蛋白(DsRed)、青色熒光蛋白(CFP)、黃色熒光蛋白(YFP)、角???Cerianthus)橙色熒光蛋白(cOFP)、堿性磷酸酶(AP)、p-內(nèi)酰胺酶、氯霉素乙酰轉(zhuǎn)移酶(CAT)、腺苷脫氨酶(ADA)、苷磷酸轉(zhuǎn)移酶(neor、G418r)、二氫葉酸還原酶(DHFR)、潮霉素-B-磷酸轉(zhuǎn)移酶(HPH)、胸苷激酶(TK)、lacZ(編碼a-半乳糖苷酶)和黃嘌呤鳥嘌呤磷酸核糖轉(zhuǎn)移酶(XGPRT)、p-葡糖醛酸糖苷酶(gus)、胎座堿性磷酸酶(PLAP)、分泌型胚胎堿性磷酸酶(SEAP),或螢火蟲或細菌的熒光素酶(LUC)的基因。使用與發(fā)明的實踐有關(guān)的許多標準方法,熟練的技術(shù)人員將了解其它可以作用為標記或報告基因的序列。增強基因在細胞宿主中表達的其它序列修飾是本領(lǐng)域已知的。這些修飾包括消除編碼多余多聚腺苷酸信號、外顯子-內(nèi)含子剪接位點信號、轉(zhuǎn)位子-樣重復(fù)的序列和其它此類被清楚表征的對基因表達不利的序列??蛇x的,根據(jù)需要,可以調(diào)節(jié)編碼序列的G/C含量到給定咖啡植物細胞宿主的平均水平,所述水平是參考在咖啡植物細胞中表達的已知基因計算的。而且,如果可能,^f務(wù)飾編碼序列從而避免預(yù)測的發(fā)夾次級mRNA結(jié)構(gòu)。增強基因表達的另一個選擇是使用5'前導序列。翻譯前導序列是本領(lǐng)域普遍已知的,并包括煙草花葉病毒的5'前導序列(co)的順式作用衍生物(co')、來自雀麥草花葉病毒、苜?;ㄈ~病毒和蕪菁黃花葉病毒的5'前導序列。轉(zhuǎn)化植物,然后就一個或多個性質(zhì)進行篩選,所述性質(zhì)包括轉(zhuǎn)基因產(chǎn)物、編碼轉(zhuǎn)基因的mRNA的存在,或與轉(zhuǎn)基因表i^目關(guān)的改變的表型。應(yīng)該認識到,在轉(zhuǎn)化植物中的表達量以及轉(zhuǎn)基因的組織—和時間—特異性的表達才莫式,可以才艮據(jù)它們在核基因組中插入的位置而變化。該位置效應(yīng)是本領(lǐng)域普遍已知的?;谠摾碛?,應(yīng)該再生一些核轉(zhuǎn)化子并對其檢測轉(zhuǎn)基因的表達。方法
技術(shù)領(lǐng)域:
:本發(fā)明的核酸和多肽可用于許多方法的任一個,藉此可以調(diào)節(jié)咖啡植物的蛋白質(zhì)產(chǎn)物的生產(chǎn),從而影響多種表型性狀,例如,增加最終由咖啡豆產(chǎn)生的咖啡飲料或咖啡產(chǎn)物的風味、泡沫(物理性質(zhì))和/或香氣,或改善咖啡豆的生產(chǎn)品質(zhì)。例如,半乳甘露聚糖含量的下降,或半乳甘露聚糖結(jié)構(gòu)的變化,預(yù)期將大大改善在制備即溶咖啡的過程中固體的回收??梢酝ㄟ^(l)傳統(tǒng)的育種或(2)遺傳工程技術(shù),以及上述兩種方法的組合獲得咖啡種粒多糖鐠或其它特征的改善。根據(jù)本發(fā)明,通過分離和表征咖啡中編碼半乳甘露聚糖合成酶的基因,已經(jīng)極大的改善了這兩種方法。例如,可以對編碼甘露聚糖合酶或半乳糖基轉(zhuǎn)移酶的基因遺傳作圖,并可以鑒定咖啡風味涉及的數(shù)量性狀基因座(QTL)。然后可能確定該QTL是否與甘露聚糖合酶或半乳糖基轉(zhuǎn)移酶相關(guān)基因的位置有關(guān)。對于影響多糖的基因,還可以鑒定和檢測等位基因(單元型),從而確定特定單元型的存在是否與半乳甘露聚糖合成強烈相關(guān)。上述標記可用作標記協(xié)助的育種方案中的優(yōu)勢。分離在半乳甘露聚糖合成中涉及的多核苷酸的第三個優(yōu)勢是,在具有半乳甘露聚糖的高水平和低水平品種中,產(chǎn)生這些基因在咖啡豆成熟期間的表達數(shù)據(jù)。該信息可用于指導對遺傳操作中使用的基因的選擇,所述遺傳操作目的在于產(chǎn)生新的轉(zhuǎn)基因咖啡植物,其在成熟的咖啡豆中具有增加或減少的半乳甘露聚糖水平。在一個方面,本發(fā)明的特征是在植物,優(yōu)選的在咖啡中改變半乳甘露聚糖i普的方法,包括增加或減少植物中一個或多個半乳甘露聚糖合成酶的量或活性。本發(fā)明的具體實施方案提供增加或減少甘露聚糖合酶生產(chǎn)的方法。在一個實施方案中,為了在咖啡的多種組織中,分別過量產(chǎn)生甘露聚糖合酶或半乳糖基轉(zhuǎn)移酶,可以用編碼甘露聚糖合酶的多核苷酸轉(zhuǎn)化咖啡植物,所述多核苷酸例如包含SEQIDNO:2或3,或11-14的cDNA。在一個實施方案中,改造咖啡植物用于普遍增加甘露聚糖合酶生產(chǎn),例如,通過使用與甘露聚糖合酶基因功能性連接的啟動子,如RuBisCo小亞基(SSU)啟動子或CaMV35S啟動子。在另一個實施方案中,改造咖啡植物用于普遍增加半乳糖基轉(zhuǎn)移酶生產(chǎn),例如,通過使用與半乳糖基轉(zhuǎn)移酶基因功能性連接的啟動子,如RuBisCo小亞基(SSU)啟動子或CaMV35S啟動子。在一些實施方案中,可以改造咖啡植物的修飾,從而增加甘露聚糖合酶和半乳糖基轉(zhuǎn)移酶的生產(chǎn)。在另一個設(shè)計成限制甘露聚糖合酶或半乳糖基轉(zhuǎn)移酶生產(chǎn)的實施方案中,僅對于目標的庫器官,即種粒,可以使用種粒特異性啟動子,特別是上述的咖啡屬種粒特異性啟動子之一??蓪Ρ憩F(xiàn)出改變的半乳甘露聚糖鐠的植物篩選甘露聚糖合酶或半乳糖基轉(zhuǎn)移酶的天然發(fā)生的變體。例如,從目前可獲得的植物突變體群體中,可以制造或選擇失功能(無效的)的突變體植物。本領(lǐng)域技術(shù)人員還了解,還可以利用本文中描述的一個或多個方法對突變的植物群體篩選低表達或過表達特定多糖代謝酶的突變體,例如半乳甘露聚糖合成酶??梢酝ㄟ^化學誘變、輻射誘變、和轉(zhuǎn)座子或T-DNA插入,或在基因組中靶向誘導局部損害來產(chǎn)生突變的群體(TILLING,參見例如Henikoff等人,2004,PlantPhysiol.135(2):630-636;Gilchrist&Haughn,2005,Curr.Opin.PlantBiol.8(2):211-215)。產(chǎn)生突變?nèi)盒莸姆椒ㄊ潜绢I(lǐng)域普遍已知的。本發(fā)明的核酸可用于鑒定多種植物物種中的半乳甘露聚糖合成酶的突變形式。在轉(zhuǎn)座子插入系是可用的物種中,例如玉米或擬南芥,可以設(shè)計寡核普酸引物篩選品系用于在半乳甘露聚糖合成酶基因中的插入。通過育種,可以培育出間斷基因的雜合或純合的植物品系。還可以將植物改造成與誘變技術(shù)產(chǎn)生的無效突變體表現(xiàn)出相似的表型。通過表達半乳甘露聚糖合成酶的突變形式可以產(chǎn)生轉(zhuǎn)基因的無效突變體,從而制造"顯性負調(diào)控效應(yīng)"。雖然發(fā)明不限于任一個機制時,該突變'蛋白質(zhì)將與野生型蛋白質(zhì)竟爭相互作用的蛋白質(zhì)或其它細胞因子。昆蟲和脊推動物系統(tǒng)中的這類"顯性負調(diào)控"效應(yīng)的實例是普遍已知的(Radke等人,1997,Genetics145:163-171;Kolch等人,1991,Nature349:426-428)。通過"轉(zhuǎn)錄后基因沉默"抑制編碼半乳甘露聚糖合成酶的mRNA的翻譯,可以產(chǎn)生另一類轉(zhuǎn)基因無效突變體。這類技術(shù)可用于下調(diào)植物種粒中的甘露聚糖合酶,從而改變多糖語。例如,源自靼向下調(diào)的物種中的編碼半乳甘露聚糖合成酶的基因或其片段,可用于控制編碼蛋白質(zhì)的生產(chǎn)。出于該目的可使用全長反義分子。可選的,可使用靶向mRNA特定區(qū)域的反義寡核苷酸,所述區(qū)域?qū)τ诜g是關(guān)鍵的。使用反義分子減少預(yù)定基因的表達水平是本領(lǐng)域已知的??梢酝ㄟ^用DNA構(gòu)建體轉(zhuǎn)化植物細胞原位提供反義分子,所述DNA構(gòu)建體在轉(zhuǎn)錄后產(chǎn)生反義RNA序列。此類構(gòu)建體可設(shè)計成產(chǎn)生全長或部分的反義序列??梢酝ㄟ^轉(zhuǎn)基因過量產(chǎn)生基因編碼序列的正義和反義RNA,從而產(chǎn)生大量的dsRNA,增強該基因沉默效應(yīng)(例如參見Waterhouse等人,1998,PNAS95:13959-13964)。在這方面,已經(jīng)發(fā)現(xiàn)包含對應(yīng)于至少一個內(nèi)含子的部分或全部的序列的dsRNA是特別有效的。在一個實施方案中,通過轉(zhuǎn)基因表達編碼甘露聚糖合酶的序列反義鏈的部分或全部。在另一個實施方案中,通過轉(zhuǎn)基因表達編碼甘露聚糖合酶的序列反義鏈的部分或全部。在另一個實施方案中,可以通過使用多種在植物系統(tǒng)中目前可用的其它轉(zhuǎn)錄后基因沉默(RNA沉默)技術(shù),沉默半乳甘露聚糖合成編碼基因。RNA沉默涉及通過基于RNaseH的酶("切酶"或"切酶-樣")將雙鏈RNA(dsRNA)加工成小的21-28個核苷酸片段。切割產(chǎn)物是siRNA(小干擾RNA)或miRNA(微小RNA),以序列-特異性方式摻入到調(diào)節(jié)基因表達的蛋白質(zhì)效應(yīng)復(fù)合物中(關(guān)于植物中RNA沉默的綜述,參見Horiguchi,2004,Differentiation22:65-73;Baulcombe,2004,Nature巡356-363;Herr,2004,Biochem.Soc.Trans,946-951)。可以化學合成或在體外轉(zhuǎn)錄和擴增小干擾RNA,然后遞送到細胞。遞送可以通過顯微注射(TuschlT等人,2002),化學轉(zhuǎn)染(AgrawalN等人,2003),電穿孔或陽離子脂質(zhì)體-介導的轉(zhuǎn)染(BrummdkampTR等人,2002;ElbashirSM等人,2002),或任一其它在本領(lǐng)域可獲得的、熟練的技術(shù)人員可理解的方法??蛇x的,可以通過在目標細胞中插入siRNA的DNA模板,在細胞內(nèi)表達siRNA,例如,通過質(zhì)粒(TuschlT等人,2002),并且可以將所述siRNA特異的靶向選定的細胞。小干擾RNA已經(jīng)被成功的引入植物(KlahreU等人,2002)。在本發(fā)明中優(yōu)選的RNA沉默的方法是利用短發(fā)夾RNA(shRNA)。通過常規(guī)方法將包含編碼特殊要求的siRNA序列的DNA序列的載體遞送到靼細胞中。一旦位于細胞內(nèi),DNA序列便連續(xù)的轉(zhuǎn)錄成RNA分子,其通過分子內(nèi)的堿基配對自身彎曲環(huán)回并形成發(fā)夾結(jié)構(gòu)。這些發(fā)夾結(jié)構(gòu),一旦被細胞加工過,就等同于siRNA分子并被細胞用于介導對所要求的蛋白質(zhì)的RNA沉默。Horiguchi,2004,如上描述了用于在植物中RNA沉默的特殊用途的多種構(gòu)建體。通常,該構(gòu)建體包含啟動子、"正義"方向的待沉默的靶基因序列、間隔區(qū)、靼基因序列的反義鏈和終止子。還可以通過"共抑制,,技術(shù)(Vaucheret等人,1998,PlantJ.16(6):651-659)制造另一種類型的合成的免效突變體。用靶向抑制的內(nèi)源基因的拷貝轉(zhuǎn)化植物細胞。在多數(shù)情況下,這導致對天然基因和轉(zhuǎn)基因的完全抑制。在一個實施方案中,來自目標植物物種的編碼半乳甘露聚糖合成酶的基因是分離的,并用于轉(zhuǎn)化該相同物種的細胞。根據(jù)本發(fā)明還表征了通過任一上述方法生產(chǎn)的突變體或轉(zhuǎn)基因植物。優(yōu)選的,植物是能育的,從而用于育種的目的。因此,表現(xiàn)出一個或多個上述所希望的表型的突變體或植物可用于植物育種,或直接在農(nóng)業(yè)或園藝中應(yīng)用。它們還可用于作為研究工具進一步闡明多糖代謝酶的參與,及其對多糖譜的影響,從而影響咖啡種子的風味、香氣和其它特征。包含一個從而生產(chǎn)具有增強的或組合的表型的植物。下列實施例提供了對發(fā)明更細節(jié)的描述。實施例是出于例證性的目的,并非意在限制發(fā)明。實施例1用于下列實施例的材料和方法植物材料:中果咖啡(BP409,2001)漿果是從印度尼西亞咖啡和可可研究中'"(IndonesianCoffeeandCacaoResearchCenter)(ICCRI)印度尼西亞田間的咖啡植物收獲的。在收獲后,漿果被立即凍存在液氮中,然后用干冰冷凍運輸?shù)竭M一步加工的場所。樣品冷凍在-25。C下運輸,然后儲藏在-80。C直到4吏用。DNA序列分才斤:對于DNA測序,根據(jù)標準方法制備并測序重組質(zhì)粒DNA。使用DNAStar(Lasergene)軟件實施計算機分析。使用BLAST程序在GenBank數(shù)據(jù)庫^E序列同源性(Altschul等人,19卯)。cDNA制備從總RNA和寡dT(18)(西格瑪公司(Sigma))按下列方法制備cDNA:ljig總RNA樣品加50ng寡dT補入DEPC處理的水至12^1終體積。然后在70。C溫育該混合物10分鐘,然后快速在冰上冷卻。隨后,加入4jd第一鏈緩沖液(5x,英杰生命技術(shù)公司(Invitrogen))、2nlDTT(0.1M,英杰生命4支術(shù)/>司(Invitrogen))和1^1dNTP混合物(每種各10mM,英杰生命才支術(shù)z^司(Iiivitrogen))。這些反應(yīng)混合物在加入lplSuperscriptIIIRnaseH-逆轉(zhuǎn)錄酶(200U/nl,英杰生命技術(shù)公司(Invitrogen))之前在42。C預(yù)溫育2分鐘。然后,將試管在25。C溫育10分鐘,再在42°C50分鐘,隨后在70。C加熱10分鐘使酶失活。然后將產(chǎn)生的cDNA樣品在無菌水中稀釋10倍,儲存在-20。C供一些下列實驗使用,例如5,RACE、分離全長cDNA克隆和QRT-PCR。5,RACE反應(yīng)(cDNA末端快速擴增)為了回收咖啡甘露聚糖合酶的5'編碼序列,進行了兩輪5,RACE。用于在5'RACE中合成cDNA的RNA是處于黃色階段的中果咖啡(BP409)種粒。進行5,RACE實驗使用的方法是嚴格遵守cDNA末端快速擴增試劑盒(英杰生命技術(shù)公司(Invitrogen))中5,RACE系統(tǒng)的試劑盒中描述的方法。簡而言之,首先純化該實驗中使用的cDNA,去掉任何未摻入的核苷酸(因為它們會干擾dC加尾反應(yīng))。精確的根據(jù)生產(chǎn)商給出的說明書,通過在S.N.A.P柱(英杰生命技術(shù)公司(Invitrogen))上純化5,RACEcDNA完成該步驟。cDNA—旦純化,就用50jil無菌水回收,并在用于5,RACEPCR以前儲存在-20。C。5,RACE實驗都始于對S.N.A.P.純化的cDNA的TdT加尾。多聚dC加尾反應(yīng)如下25nl反應(yīng)是由5jU純化的cDNA、11.5^1DEPC處理的水、5jU5xTdT加尾緩沖液(英杰生命技術(shù)公司(Invitrogen))和2.5^12mMdCTP。然后,反應(yīng)在94°C溫育3分鐘,再在冰上預(yù)冷。然后加入TdT并將反應(yīng)在37°C溫育10分鐘。通過在65°C加熱10分鐘終止反應(yīng)并再次置于冰上。在最終50pl體積中實施第一輪5,RACE反應(yīng),如下5inL每種加尾cDNA、5pl10xPCR緩沖液(ThermoPol緩沖液)、400nM基因特異性引物(GeneSpecificPrimer)l和AAP引物(參見表1和2的引物),200pM每種dNTP和2.5U的TaqDNA聚合酶(博鰲萊伯生物公司(BioLabs))。第一輪PCR循環(huán)條件是94。C2分鐘;然后進行40個循環(huán),每個循環(huán)是94。Cl分鐘,表2中標注的退火溫度1分鐘,72。C2分鐘。延伸的附加最終步驟是在72。C進行7分鐘。然后用瓊脂糖凝膠電泳并用溴化乙錠染色分析PCR產(chǎn)物。在最終50nl體積中實;k第二輪PCR反應(yīng),如下5pL1。/。的稀釋的第一輪PCR產(chǎn)物;5ji110xPCR緩沖液(加1\^++的LA緩沖液11)、200nM的基因特異性引物2和AUAP引物(使用參見表1和2的特異性引物)、200nM各dNTP、0.5U的DNA聚合酶塔卡拉(Takara)LATaq(凱姆布萊克生物科學公司(CambrexBioScience)),循環(huán)方案是94°C2分鐘;然后進行40個循環(huán),每個循環(huán)是94°Cl分鐘,表2中標注的退火溫度1分鐘和72°C1分30秒。延伸的附加最終步驟是在72°C7分鐘。然后用瓊脂糖凝膠電泳并用溴化乙錠染色分析PCR產(chǎn)物。<table>tableseeoriginaldocumentpage38</column></row><table>表2.用于不同的5,RACE實驗的引物和PCR條件給出了各種5,RACEPCR反應(yīng)下的引物、退火溫度和循環(huán)數(shù)。引物的DNA序列在上文表l中給出。用基因特異性引物從中果咖啡和小果咖啡中分離含有ManS完整編碼序列(完整ORF)的cDNA使用現(xiàn)有的cDNA序列和從5'RACE獲得的新的5'序列,在5'和3'UTR序列中設(shè)計2個基因特異性引物,以擴增ManS的完整的ORF序列(pVC4、pVC6和pVC7)。表3中標注了用于分離完整ORF序列的cDNA(種子、黃色階段、BP409;和種子、黃色階段、T2308),表4中給出了用于每種PCR反應(yīng)的特異性引物的序列。按照下迷在50nl反應(yīng)中實施PCR反應(yīng)5nL的cDNA(表3和4)、5pl10xPCR緩沖液(加1\^++的LaPCR緩沖液11)、800nM的各基因特異性引物、200jiM的各dNTP和0.5U的DNA聚合酶塔卡拉(Takara)LATaq(凱姆布萊克生物科學公司(CambrexBioScience))。在94°C變性2分鐘后,擴增由35個循環(huán)組成,每個循環(huán)是94。C1分鐘、在退火溫度(47。C)1分30秒和在72°C3分鐘。延伸的附加最終步驟是在72°C進行7分鐘。然后用瓊脂糖凝膠電泳和溴化乙錠染色分析PCR產(chǎn)物。然后,使用用于測序的TOPOTA克隆試劑盒,才艮據(jù)生產(chǎn)商給出的說明書,將預(yù)期大小的片段克隆到pCR4-TOPO中。然后完整的測序所產(chǎn)生的質(zhì)粒的插入片段?;騘DN4組織^基^型—Gen!,:^昧引物退火溫度<formula>formulaseeoriginaldocumentpage39</formula>種子,黃色階段表3.分離編碼中果咖啡甘露聚糖合酶(CcAf朋^和小果咖啡甘露聚糖合酶(CVzMff/iQ的全長蛋白質(zhì)序列的cDNA序列。給出了用于擴增完整ORF序列的特異性cDNA引物和PCR退火溫度。按方法中的描述合成這些cDNA。<table>tableseeoriginaldocumentpage39</column></row><table>表4.用于擴增編碼CdV/朋S和CVzMawS全長蛋白質(zhì)序列的cDNA序列的引物序列。使用定量RT-PCR(Q-RT-PCR)的CcManS的表達分析根據(jù)上述方法制備用于上述實驗的cDNA(羅布斯塔咖啡;中果咖啡BP4091/1000稀釋;阿拉比卡咖啡cDNA樣品;小果咖啡T-23081/1000稀釋,cDNA樣品)。根據(jù)生產(chǎn)商的推薦實施TaqMan-PCR(美國應(yīng)用生物系統(tǒng)^>司(AppliedBiosystems),伯克艾爾莫^>司(Perkin-Elmer))。簡而言之,在反應(yīng)平板(MicroAmpOptical96-孔反應(yīng)平板,美國應(yīng)用生物系統(tǒng)公司(AppliedBiosystems)ref.:N801-0560)中設(shè)置25^1的反應(yīng)。各反應(yīng)包含12.5jil的AmpliTaqGoldMaster混合物、2.5jil的兩種引物(8nM儲液、在最終反應(yīng)中800nM)、2.5nlMGBTaqMan探針(2nM儲液,在最終反應(yīng)中200nM)和5nl的DNA樣品加水。首先將水和DNA加入平板,然后加入"SpecificMix"(AmpliTaqGoldMaster混合物+引物和TaqMan探針)。反應(yīng)在室溫下進行,只有當Taq被在高溫下釋放結(jié)合的抗體所活化時才開始Taq擴增,即熱啟動(HotStart)。TaqMan緩沖液包含AmpEraseUNG(尿嘧咬-N-轉(zhuǎn)葡糖基酶),其在PCR循環(huán)開始的在50°C下前2分鐘是有活性的,然后在95°C下失活。使用的循環(huán)條件(7500實時PCR系統(tǒng)-美國應(yīng)用生物系統(tǒng)公司(AppliedBiosystems))是50。C2分鐘、95°C10分鐘,然后進行40個95°C15秒和60。C1分鐘的循環(huán)。每個反應(yīng)一式三份進行,計算三次反應(yīng)的平均Ct值。用PRIMEREXPRESS軟件(美國應(yīng)用生物系統(tǒng)/>司(AppliedBiosystems))設(shè)計使用的引物和TaqMan探針。用于Q-PCR實驗的引物和甘露聚糖合酶MGB探針是124613-F1、124613-Rl和124613MGB1(參見表5)。使用相對定量(RQ)的方法進行定量,使用組成型表達的咖啡核糖體蛋白基因CcRpl39作為參照。在這種情況下,從對各組織樣品中各基因進行的復(fù)制,計算CcManSyn(檢測基因)和CcRpl外(參照基因)基因的平均Ct。然后計算RQ值(2-8<:",8Ct-CcM朋SCt-CcRpl39Ct),其是對兩種樣品之間差值的測量。為了使用相對定量的方法,必須表明使用特定引物和探針組,檢測基因的擴增效率與參照序列077/39cDNA序列)的擴增效率是等價的(擴增效率接近l,即100%)。為了確定上勤目對等價,將包含合適cDNA序列的質(zhì)粒DNA稀釋為1/1000、1/10,000、1/100,000和1/1,000,000倍,并且使用上述Q-PCR條件,對各質(zhì)粒/引物/TaqMan探針組,計算曲線Ct=/(LogDNA的量)的斜率。產(chǎn)生曲線斜率接近3.32的質(zhì)粒/引物/TaqMan探針組,代表100%的效率,被認為是可接受的。在此使用的質(zhì)粒/引物/TaqMan探針組具有可接受的Ct=/(LogDNA的量)的值。<table>tableseeoriginaldocumentpage41</column></row><table>表5.Q-PCR實驗使用的引物列表。實施例2編碼中果咖啡甘露聚糖合酶的cDNA的鑒定從一些咖啡文庫鑒定了超過47,000種EST序列,所述文庫是用從幼葉和不同發(fā)育階段收獲的漿果的種粒和果皮組織中分離的RNA產(chǎn)生的。然后將重疊的EST"聚簇"成"單基因"(即,重疊群),并且通過針對NCBI非冗余蛋白質(zhì)數(shù)據(jù)庫中各個單獨序列的BLAST搜索來注釋單基因序列。半乳甘露聚糖對成熟咖啡種粒的干重影響纟艮大,被認為在種粒中分子例如糖的接近(access)或可提取性中扮演重要角色。方法用于分離半乳甘露聚糖合成涉及的關(guān)g因之一,即,甘露聚糖合酶,以及研究該基因在發(fā)育的咖啡種粒中的表達。使用tblastn算法(Altschul等人,19卯),使用來自瓜爾豆的生化表征的甘露聚糖合酶(CtManS,瓜兒豆,登錄號AAR23313;Dhugga等人,2004)的蛋白質(zhì)序列,搜索我們的DNA序列的',單基因"組。該搜索揭示了一個具有非常高水平的同源性的單基因(單基因#124613)。參見表6。分離并完整的測序該單基因中的兩個最長的EST:—個是pcccs46wl6i11中的插入片段,發(fā)現(xiàn)其長1779bp;而另一個是pcccs46w24c19中的插入片段,發(fā)現(xiàn)其長1349bp。在這兩個序列之間的比對分析表明,在pcccs46wl6i11的cDNA中存在兩個內(nèi)含子序列。如附圖2A中的圖解,內(nèi)含子之一是在該克隆的5'端,而發(fā)現(xiàn)另一個小得多的內(nèi)含子序列被包埋在cDNA的ORF中。當從這兩種cDNA克隆的共有序列中剪切出內(nèi)含子序列時,揭示了423個^酸的部分ORF;然而,全長瓜爾豆蛋白質(zhì)是526個氨基酸長。因此,咖啡ManScDNA不是完整的,缺乏309個以上的堿基對(即,編碼103個^J^酸加5'UTR)?;?lt;table>tableseeoriginaldocumentpage42</column></row><table>表6.咖啡甘露聚糖合酶EST的在計算機上的分布。在每個不同的中果咖啡EST文庫中發(fā)現(xiàn)的甘露^t合酶EST(單基因124613)的數(shù)目實施例3全長ManS序列克隆pcccs46wl6i11編碼咖啡ManS序列的主要部分,因此,被用于設(shè)計在已良好確立的引物輔助基因組步行技術(shù)中使用的特異性引物。第一個實驗產(chǎn)生了1084bp長的片段(pJMc2),其將內(nèi)含子區(qū)域另外延長了1000bp以上。然而,由于新的序列在下一個外顯子上沒有包含任何序列信息,該片段在ORF上沒有生產(chǎn)任何新的序列數(shù)據(jù)。其它的基因組步行實驗沒有產(chǎn)生新的上游序列。進行在實施例1中描述的5'RACEPCR來分離該基因的漏失5'編碼區(qū)。這是用基因特異性引物RNAi-Pr2-GSPl和ManSyntGWR249-GSP2完成的。結(jié)果是300磁JJt的PCR片段,其被克隆到pCR-4-TOPO載體中,然后測序。獲得的序列(pVC2;CcManSRacel)長259pb,并與cDNA克隆pcccs46wl6i11的5'端重疊(附圖2,顯示99bp的重疊序列)。然而,確定該RACE片段漏失該基因的5,端。因此,使用基因特異性引物ManSRace2與ManSRacel進行新的5'RACEPCR。這產(chǎn)生了約400對的PCR片段,其被克隆到pCR-4-TOPO載體中然后測序。獲得的序列(pVC3CcManSRace2)長340pb,并與CcManSRacel片段的5'端重疊(附圖2A,顯示38bp的重疊序列)。如附圖2A中顯示的多種克隆允許產(chǎn)生附圖2B中顯示的DNA比對,其顯示這些克隆的重疊序列。該DNA序列信息用于尋找咖啡甘露聚糖合酶CcManS的完整ORF。從新分離的咖啡5'端ManS序列(CcManSRace2)和cDNApcccs46wl6i11+接近全長的編碼序列中,設(shè)計兩種新引物(ManS-Am3和ManS-Am2,表7),其能夠使用從中果咖啡(BP-409)或小果咖啡(T2308)黃色發(fā)育階段的種粒中分離的RNA所制造的cDNA,特異性的擴增咖啡甘露聚糖合酶的完整ORF序列(表7)。該PCR擴增實驗導致產(chǎn)生cDNA序列,其分別包含在質(zhì)粒pVC4(羅布斯塔咖啡cDNA)、pVC6(羅布斯塔咖啡cDNA)和pVC7(阿拉比卡咖啡cDNA)中(附圖2B)。pVC4插入片段的序列分析表明該cDNA是1898bp,編碼530個M酸的多肽(估計的分子量是61.29kDa)。注意發(fā)現(xiàn)pVC4中插入片段的DNA序列具有堿基改變,在ORF中導致終止密碼子。如附圖2B的圖例所述,該堿基改變是PCR錯誤并且不是由相應(yīng)的基因組序列編碼的。pVC6和pVC7插入片段的序列分析表明,這些cDNA序列長1897bp,并各具有15卯bp的完整ORF,編碼530個氨基酸的多肽,其估計的分子量分別是61.3kDa和61.15kDa。引物序列SEQIDNO:ManS-Am35"CTGCTCATTGCCCTCAG3'40ManS-Am25,GACTTGCTGTACTCGTCTA3'41表7.用于擴增編碼OrAfa"S全長蛋白質(zhì)序列的cDNA序列的引物序列。然后,將這些蛋白質(zhì)序列與生化表征的瓜爾豆甘露聚糖合酶(CtManS)的蛋白質(zhì)序列、以及在GenBank數(shù)據(jù)庫中發(fā)現(xiàn)的兩種最相關(guān)的序列(其一的產(chǎn)物未^^征(即野薯))進行比對。該比對的結(jié)果(附圖4)顯示,中果咖啡ManS(CcManS;pVC6)序列分別與瓜爾豆、擬南芥和野薯序列表現(xiàn)出74.7%、65.9%和58.7%的同一性。在該比對中,擬南芥序列也被稱為AtCSLA9(擬南芥纖維素合酶樣蛋白質(zhì)家族A基因弁9),并且最近顯示,該基因編碼的蛋白質(zhì)具有甘露聚糖合成活性,以及較低程度的葡甘露聚糖合成活性(Liepman,A.,Wilkerson,C.,Keegstra,K.2005Expressionofcellulosesynthase-like(Csl)genesininsectcellsrevealstheCsIAfamilymembersencodemannansynthases.Proc.Natl.Acad.Sci.102,2221-2226)。在咖啡和瓜爾豆蛋白質(zhì)序列之間高水平的同一性支持這樣的論據(jù),即CcManS和CaMaAS序列編碼咖啡種粒中負責甘露聚糖合成的蛋白質(zhì)。還注意到中果咖啡(pVC6)和小果咖啡(pVC7)的ManS序列享有98.5%的同一性,只有12個核普酸的差異,其翻譯成8個氨基酸的差異。這些甘露聚糖合酶蛋白質(zhì)的細微差異,可以產(chǎn)生普遍已知的存在于上述兩種咖啡之間的提取率的差異。使用ClustalW進行pVC4(CcManS)、pVC6(CcManS)和pVC7(CaManS)的插入DNA序列與瓜爾豆(AAR23313)和擬南芥(CAB82941)的MansScDNA序列的比對。該DNA比對顯示上述咖啡序列是幾乎相同的。相反,瓜爾豆序列顯示了與咖啡甘露聚糖合酶序列約67%的同源性,擬南芥顯示了與咖啡甘露聚糖合酶序列(CAB82941)約55%的同源性。此外,同一性的區(qū)域在整個序列有規(guī)律的散布,因此在咖啡序列與瓜爾豆和擬南芥序列之間沒有發(fā)現(xiàn)非常長的具有連續(xù)同一性區(qū)域。實施例4CcManS表達分析為了驗證CcManS基因編碼具有甘露聚糖合酶活性的纖維素合酶-樣(Csl)家族成員,該基因被證明僅僅在表現(xiàn)出高水平的甘露聚糖和半乳甘露聚糖合成的組織中表達。使用定量RT-PCR研究了CcManS在阿拉比卡咖啡和羅布斯塔咖啡的多種組織中的表達。獲得的結(jié)果清楚的顯示甘露聚糖合酶在羅布斯塔咖啡和阿拉比卡咖啡的種粒中都有高高表達且?guī)缀鮾H在其中表達,其中阿拉比卡咖啡T2308種??磥肀攘_布斯塔咖啡BP409種粒具有略高水平的甘露聚糖合酶表達。這提示在阿拉比卡咖啡種粒中可能有比羅布斯塔咖啡種粒中更高水平的甘露聚糖合酶活性,特別是在種粒發(fā)育的晚期。這一活性上的差異可以導致在阿拉比卡咖啡種粒中發(fā)現(xiàn)的甘露聚糖/半乳甘露聚糖的更高水平和/或不同結(jié)構(gòu)。該差異通常可以解釋,與羅布斯塔咖啡種粒相比,阿拉比卡咖啡種粒在烘烤或加工的提取固體材料中所經(jīng)歷的更大的困難。使用QRT-PCR在阿拉比卡咖啡T2308或羅布斯塔咖啡BP409的莖、根、葉、果皮和花組織中,檢測到輕微的或沒有檢測到甘露聚糖合酶表達。小綠色羅布斯塔咖啡樣品是唯一沒有可檢測的甘露聚糖合酶基因表達的種粒樣品,這與更早的結(jié)果是一致的,所述結(jié)果顯示該特定的羅布斯塔咖啡階段/樣品還沒有表達其它的胚乳特異性基因例如油質(zhì)蛋白(參見,例如共同擁有的未決申請No.60/696,445)。總而言之,所有的甘露聚糖合酶表達數(shù)據(jù)都顯示,甘露聚糖合酶是專一的、或幾乎專一的在咖啡種子較晚的發(fā)育階M達,所述階段是當胚乳正在形成或發(fā)育時。與該發(fā)現(xiàn)一致,也只是在用較tt育階段的種粒提取的RNA制成文庫中檢測到甘露聚糖合酶EST,而在用早期咖啡漿果、咖啡漿果果皮組織或葉組織中提取的RNA制成的文庫中沒有檢測到(參見表6)??偟膩碚f,甘露聚糖合酶表達數(shù)據(jù)與理論一致,所述理論即在咖啡的種粒中,甘露聚糖合酶基因編碼甘露聚糖合成涉及的主要酶,并且通過結(jié)合,編碼半乳甘露聚糖合成涉及的主要酶。<table>tableseeoriginaldocumentpage46</column></row><table>ND-未檢測到表8.CcManS對CcRpl39的相對表達實施例5鑒定編碼中果咖啡中UDP-Gal依賴性甘露聚糖特異性(l,6)-a-D-半乳糖基轉(zhuǎn)移酶(GMGT)的cDNA半乳甘露聚糖合成涉及的第二種酶是依賴Mn++、UDP-Gal依賴性甘露聚糖特異性(l,6)-a-D-半乳糖基轉(zhuǎn)移酶(GMGT;(Edwards,Choo,Dickson,Scott,Gridley和Reid2004)。GMGT以及甘露聚糖合酶,皮認為以緊密的締合作用(可能作為復(fù)合物)發(fā)揮作用,以產(chǎn)生半乳甘露聚糖。使用tblastn算法將生化表征的百樂M艮GMGT蛋白質(zhì)的蛋白質(zhì)序列(登錄號AJ567668)用于搜索我們的DNA序列的',單基因"組(Altschul等人,1990)。該搜索揭示了兩個具有高水平同源性的單基因(單基因#—122567和單基因#—122620)。表9顯示在不同的中果咖啡文庫中為每個單基因發(fā)現(xiàn)的EST的數(shù)目。鑒于單基因122620的EST僅在種子中發(fā)現(xiàn),單基因122567的EST僅在葉中發(fā)現(xiàn),單基因#—122620可能代表了編碼種粒特異性咖啡GMGT的基因。在下文中,該GMGT蛋白質(zhì)(CcGMGTl)被認為與本文中描述的CcManS作用,合成大多數(shù)咖啡種粒半乳甘露聚糖。相反,單基因#—122567代表的基因可能編碼另一個咖啡GMGT蛋白質(zhì)(GMGT2),其與.其它咖啡組織例如葉中的半乳甘露聚糖合成相關(guān)。附圖5和6中顯示了每個單基因的比對。發(fā)現(xiàn)單基因122620編碼的CcGMGTlORF與胡盧巴蛋白質(zhì)序列具有54.3%的同一性,與百脈根(Japonicus)蛋白質(zhì)序列具有53.6%同一性'發(fā)現(xiàn)單基因l22567編碼的CcGMGT2ORF與胡盧巴蛋白質(zhì)序列具有62.8%同一性,與百務(wù)沐蛋白質(zhì)序列具有63.8%同一性。對于每個基因,用這些部分cDNA序列裝備的全長cDNA可以使用完善確立的5'RACE和引物輔助基因組步行技術(shù)來分離。GMGT1的全長cDNA可用于在植物組織如咖啡中和模式過表達生物體中表達活性的咖啡種粒GMGT蛋白質(zhì),以產(chǎn)生蛋白質(zhì),用于函數(shù)分析咖啡甘露聚糖合酶蛋白質(zhì)??Х菴cMansS和CcGMGT蛋白質(zhì)可以在相同的植物、酵母或細菌細胞中高水平的表達,這將導致由這些不同類型的細胞生產(chǎn)的充分量的半乳甘露聚糖的產(chǎn)生。<table>tableseeoriginaldocumentpage47</column></row><table>表9.咖啡GMGTEST的在計算機芯片上的分布。給出了在不同中果咖啡文庫中對每個單基因發(fā)現(xiàn)的GMGTEST的數(shù)目。實施例6分離編碼GMGTase1的完整多肽序列的DNA序列實施例5介紹了部分的cDNA序列的發(fā)現(xiàn),所迷序列編碼來自中果咖啡種粒的UDP-Gal依賴性甘露聚糖特異性(l,6)-a-D-半乳糖基轉(zhuǎn)移酶,CcGMGTasel(CcGMTGl)。為了!Ht在實施例5中介紹的單基因序列#—122620,完全測序了該單基因中的第二長的EST(pcccs46w8o23)。為了獲得pcccs46w8o23的部分的cDNA序列5'端上游CcGMGTase1的序列數(shù)據(jù),用引物GMGT畫30wl5ml4-RACE4和GMGT-30wl5ml4-RACE2(參見表10的序列)進行5'RACE。使用從,,黃色"階段的阿拉比卡咖啡T2308漿果的種粒分離的RNA,按之前在本申請方法部分中的描述制備cDNA。然后,使用酶TdT將多聚dC尾加到阿拉比卡咖啡cDNA上,并且在方法部分中描述的條件下用在5'RACE反應(yīng)中。第一輪5'RACE使用引物GMGT-30wl5ml4-RACE4和AAP,第二輪5'RACE使用引物GMGT-30wl5ml4-RACE2和AUAP。兩個反應(yīng)的退火溫度是60。C。產(chǎn)生約1000-1100個^i^對的片段,其被克隆到pCR-4-TOPO載體中然后測序。<table>tableseeoriginaldocumentpage48</column></row><table>表IO.用于5,RACEPCR實驗的引物列表。5'RACE產(chǎn)生包含1120bp插入片段的克隆pVC10。該5'RACE產(chǎn)物的完整序列的分析顯示它編碼咖啡GMGTase1的N-末端區(qū)域。使用一套新的PCR引物,從阿拉比卡咖啡變種T-2308的基因組DNA中,成功的PCR擴增出咖啡GMGTase1的完整ORF序列(作為單一片段),所述引物是從pVCIO的末端5'端和cDNApcccs46w8o23的3,非編碼區(qū)設(shè)計的。然后,將這些GMGTase1特異性寡核苷酸GMGT-Fwdl和GMGT-Rev(表11),用于從阿拉比卡咖啡T-2308的基因組DNA中PCR擴增包含GMGTase1的完整ORF序列的片段,所述基因組DNA是根據(jù)以前描述的方法從葉組織中純化的(Crouzillat等人1996Theor.Appl.Genet.93,205-214)。PCR反應(yīng)在50^1反應(yīng)中實施,按照下述5fil的gDNA、5^illOxPCR緩沖液(ThermoPol緩沖液)、400nM的各基因特異性引物、200pM的各dNTP和0.5U的TaqDNA聚合酶(博鰲萊伯公司(Biolabs))。在94。C變性2分鐘后,擴增由40個循環(huán)組成,每個循環(huán)是94°C1分鐘,58°C1.5分鐘和72。C3分鐘。延伸的附加最終步驟是在72。C進行7分鐘。然后用瓊脂糖凝膠電泳和溴化乙錠染色分析PCR產(chǎn)物。然后,使用用于測序的TOPOTA克隆試劑盒(英杰生命技術(shù)公司(Invitrogen)),根據(jù)生產(chǎn)商給出的說明書,將預(yù)期大小的片ISi1700pb)克隆到pCR4-TOPO中。然后完整的測序產(chǎn)生的質(zhì)粒的插入片段。對獲得的克隆(pVCll;CaGMGTasel)的序列分析顯示,在該基因的大部分編碼序列中,GMGTasel不包含任何內(nèi)含子(內(nèi)含子仍可以存在于該基因的末端5'或3'編碼區(qū))。<table>tableseeoriginaldocumentpage49</column></row><table>表11.用于擴增編碼CaGATG77全長蛋白質(zhì)序列的基因組序列的引物序列。用于獲得全長咖啡GMGTasel多肽序列的三種克隆顯示在附圖7中。使用CLUSTALW程序比對產(chǎn)生的DNA序列(附圖8)。該比對顯示在獲得的核苷酸序列中有一些差異。然而,只有兩個在氨基酸序列區(qū)域的威基差異導致氨基酸改變(第432位L對P和第445位E對G)。然后將pVCll編碼的完整M酸序列與在GenBank公眾數(shù)據(jù)庫中發(fā)現(xiàn)的最同源的DNA序列進行比對。該^J^酸序列比對的結(jié)果顯示在附圖9。CaGMGTasel序列與望江南決明(Seimaoccidentalis)半乳甘露聚糖半乳糖基轉(zhuǎn)移酶最高度相關(guān)(65%的同一性),并與附圖3中的大部分其它蛋白質(zhì)序列具有約56-57.6%的同一性,支持將CaGMGTase1的全長多肽序列注釋為半乳甘露聚糖半乳糖基轉(zhuǎn)移酶。實施例7編碼GMGTase2完整多肽序列的cDNA表征實施例5也提出了部分cDNA序列的發(fā)現(xiàn),所述序列編碼中果咖啡的葉的UDP-Gal依賴性甘露聚糖特異性(l,6)-a-D-半乳糖基轉(zhuǎn)移酶,CcGMGTase2(CcGMGT2)。使用三個同源的EST序列產(chǎn)生該單基因序列(單基因#—122567)。為了驗證單基因序列數(shù)據(jù),并延伸序列數(shù)據(jù)至覆蓋序列的3'端,測序該單基因組中最長的EST克隆(克隆pcccl26f9)。附圖10顯示pcccl26f9的完整DNA序列與單基因序列弁—122567的比對。不出所料,通過多聚A尾的存在證明,,pcccl26f9的完整序列包含CcGMGTase2的3'端。pcccl26f9編碼的ORF還包含GMGTase2的N-末端區(qū)域。pcccl26f9的5'端DNA序列幾乎與單基因的是一致的。但是,單基因序列的更詳細分析揭示,pcccl26f9序列的第一個甲硫氨酸密碼子(ATG)在單基因序列中實際上是ATC,因此,沒有看見從單基因DNA序列獲得的N-末端a酸序列。然后,比對pcccl26f9編碼的^&酸序列與公眾GenBank數(shù)據(jù)庫中發(fā)現(xiàn)的一些最緊密相關(guān)的序列(圖11)。該比對的檢測表明,雖然咖啡GMGTase1和GMGTase2序列具有顯著的同源性區(qū)域(它們具有約52%同一性),但是它們明顯是由不同基因編碼的。該比對還再次顯示,咖啡GMGTase2也與一組注釋為半乳糖基轉(zhuǎn)移酶的蛋白質(zhì)高度相關(guān)。總之,本文提出的證據(jù)強烈的表明,從咖啡葉EST文庫中分離的cDNA克隆(pcccl26f9)編碼在咖啡葉中表達的咖啡GMGTase的完整的多肽序列。實施例8咖啡GMGTasel的表達分沖斤4吏用定量RT-PCR和相對定量(相對于rpl39的表達)的方法分析GMGTase1在多種阿拉比卡咖啡和羅布斯塔咖啡組織中的表達水平。使用的方法與以前描述的測量咖啡種粒甘露聚糖合酶表達的方法相似。表12中顯示了使用的特異性引物和探針組。對引物/TaqMan探針組的擴增效率的測量,證明它們處于效率的可接受范圍內(nèi)。按照在該申請之前描述的使用SuperscriptIII(英杰生命技術(shù)公司(Invitrogen))制備cDNA。<table>tableseeoriginaldocumentpage51</column></row><table>表12.用于定量RT-PCR實驗的引物和探針序列。結(jié)果描述在附圖12中,并證明GMGTase1主要在羅布斯塔咖啡和阿拉比卡咖啡的種粒中表達。有趣的,在檢測的阿拉比卡咖啡與羅布斯塔咖啡的cDNA樣品發(fā)現(xiàn)的RQ中約有十倍差異??赡茉摫磉_差異會有助于兩個物種的種粒中半乳甘露聚糖水平和/或結(jié)構(gòu)上的一些差異。還觀察到羅布斯塔咖啡中GMGTase1的表達在黃色階段是最高的。這與阿拉比卡咖啡形成對比,在所述阿拉比卡咖啡中最高表達是在小綠色和大綠色階段中觀察到的。還在大部分測試的其它組織中檢測到低水平的GMGTase1表達,還是在阿拉比卡咖啡中檢測到比羅布斯塔咖'啡更高的表達。最后,注意到觀察的GMGTase1的表達模式反映了觀察的甘露聚糖合酶表達的表ii^式。因為提議這兩個蛋白質(zhì)在半乳甘露聚糖合成中一起作用,GMGTase1表達數(shù)據(jù)進一步支持GMGTase1是咖啡種粒半乳甘露^t合成中的關(guān)鍵參與者。參考文獻AltschulS.F.,MaddenT丄.,SchafferA.A.,ZhangJ.,ZhangZ.,MillerW.和LipmanD.J.(1997)GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms.NucleicAcidsRes,25:3389-3402BacicA,HarrisP,StoneB(1988)Structureandfunctionofplantcellwalls.InJPriess,編著,Thebiochemistryofplants;acomprehensivetreatise,第14巻,Carbohydrates,AcademicPress,NewYork,第297-371頁BuckeridgeM,PessosadosSantosH,TineM(2000)Mobilizationofstoragecellwallpolysaccharidesinseeds.PlantPhysiolBiochem38:141-156Chaiies-BernardM,KraehenbuehlK,RytzA,RobertsD(2005)Interactionsbetweenvolatileandnon-volatilecoffeecomponents.1.Screeningofnon-volatilecomponents.JAgricFoodChem53:4417-4425CrouzillatD.,LerceteauE.,PetiardV.,MoreraJ.,RodriguezH.,WalkerD.,PhilipsW.R.R.,SchnellJ.,OseiJ.和FritzP.(1996).TheobromacacaoL.:ageneticlinkagemapandquantitativetraitlocianalysis.TheorApplGenet.93:205-214.CutlerS,SomervilleC(1997)Cloninginsilico.CurrBiol7:R108-R111DhuggaKS,BarreiroR,WhittenB,SteccaK,HazebroekJ,RandhawaGS,DolanM,KinneyAJ,TomesD,NicholsS,AndersonP.(2004)Guarseedbeta曙mannansynthaseisamemberofthecellulosesynthasesupergenefamily.Science.2004Jan16;303(5656》363-6.EdwardsM,ChooT,DicksonC,ScottC,GridleyM,RddJ(2004)TheseedsofLotudjaponicuslinestransformedwithsense,antisense,andsense/antisensegalactomannangalactosyltransferaseconstructshavestructurallyalteredgalactomannansintheirendospermcellwalls.PlantPhysiol134:1153-1162EdwardsM,ScottC,GidleyM,ReidJ(1992)Controlofmannose/galactoseratioduringgalactomannanformationindevelopinglegumeseeds.Planta187:67-74FischerM,ReimannS,TrovatoV,RedgwellRJ(2001)PolysaccharidesofgreenArabicaandRobustacoffeebeans.CarbohydrateResearch330:93-101FryS(2004)Primarycellwallmetabolism:trackingthecareersofwallpolymersinlivingplantcells.NewPhytologist161:641-675HandfordM,BaldwinT,GoubetF,PrimeT,MilesJ,YuX,DupreeP(2003)LocalizationandcharacterizationofcellwallmannanpolysaccharisedinArabidopsisthaliana.Planta218:27-36HanfordM,BaldwinT,GoubetF,PrimeT,MilesJ,YuX,DupreeP(2003)LocalisationandcharacterizationofcellwallmannanpolysaccharidesinArabidopsisthaliana.Planta218:27-36HazenSP,Scott-CraigJS,WaltonJD(2002)Cellulosesynthase-likegenesofrice.PlantPhysiol128:336-340IllyA,VianiR(1995)ExpressoCoffee.Thechemistryofquality.AcademicPress,London,第5-7頁JoersboM,MarcussenJ,BrunstedtJ(2001)Invivomodificationofthecellwallpolysaccharidegalactomannanofguartransformedwithanalph-galactosidasegeneclonedfromsenna.MolecularBreeding7:211-219KeegstraK,RaikhelN(2001)Plantglycosyltransferases.CurrOpinPlantBiol4:219-224LiepmanA,WilkersonC,KeegstraK(2005a)Expressionofcellulosesynthase-like(Csl)genesininsectcellsrevealsthatCslAfamilymembersencodemannansynthases.ProcNatlAcadSci102:2221-2226Lundqvist,J"Teleman,A.,Junel,L.,Zacchi,G.,Dahlman,O.,Tjerneld,F.,Stalbrand,H(2002),Isolationandcharacterizationofgalactomannanfromspruce(Piceaabies)CarbohydrPolym48,29-39MarracciniP.,DeshayesA.,P6tiardV.和RogersW.J.1999.Molecularcloningofthecomplete11SseedstorageproteingeneofCoffeaarabicaandpromoteranalysisinthetransgenictobaccoplants.PlantPhysiol.Biochem.37:273-282.Marraccini,P.,Deshayes,A.,和Rogers,W.J.Coffeeplantwithreducedalpha誦D-galactosidase.EP1436402.2004.參考文獻類型專利MarracciniP,RogersJ,AllardC,AndreM-L,CailletV,LacosteN,LausaneF,MichauxS(2001)Molecularandbiochemicalcharacterizationofendo畫beta-mannanasesfromgerminationcoffee(Coffeaarabica)grains.Planta213:296-308MarracciniP,CourjaultC,CailletV,LausanneF,LePageB,RogersW,TessereauS和DeshayesA.(2003)RubiscosmallsubunitofCoffeaarabica:cDNAsequence,genecloningandpromoteranalysisintransgenictobaccoplants.PlantPhysiol.Biochem.41:17-25.MarracciniP,RogersJ,CailletV,DeshayesA,GranatoD,LausaneF,LechatS,PridmoreD,PetiardV(2005)Biochemicalandmolecularcharacterizationofalpha-D-galactosidasefromcoffeebeans.PlantPhysiologyandBiochemistryMathesonM(1990)Mannose-basedpolysaccharides.MethodsPlantBiochem12:371-413NunesF,CoimbraM,DuarteA,DelgadilloI(1997)JAgricFoodChem45:3238-3243OosterveldA,Harm"nJS,VoragenAGJ,ScholsHA(2003)ExtractionandcharacterizationofpolysaccharidesfromgreenandroastedCoffeaarabicabeans.CarbohydratePolymers52:285-296PettolinoF,HoogenraadN,F(xiàn)ergusonC,BadeA,JohnsonE,StoneB(2001)A(l-4)-beta-mannanspecificmonoclonalantibodyanditsuseintheimmunocytochemicallocationofgalactomaimans.Planta214:235-242RedgwellR,CurtiD,RogersJ,NicolasP,F(xiàn)ischerM(2003)Changestothegalactose/mannoseratioingalactomannansduringcoffeebean(CoffeaarabicaL)develop,pient:implicationsforinvivomodificationofgalactomannansynthesis.Planta217:316-326RedgwellRJ,TrovatoV,CurtiD,F(xiàn)ischerM(2002)EffectofroastingondegradationandstructuralfeaturesofpolysaccharisesinArabicacoffeebeans.CarbohydrateResearch337:421-431ReidJ(1985)Structureandfunctioninlegume-seedpolysaccharides.InCBrett,JHillman,編著,Biochemistryofplantcellwalls,CambridgeUniversityPress,Cambridge,第259-268頁ReidJ,BewleyJ(1979)Adualrolefortheendospermanditsgalactomannanreservesinthegerminativephysiologyoffenugreek(Trigonellafoenum誦graecumL.)anendospermicleguminousseed.Planta147:145-150RichmondTA,SomervilleCR(2000)Thecellulosesynthasesuperfamily.PlantPhysiol124:495-498Schroder,R.,Nicolas,P.,Vincent,S.,F(xiàn)ischer,M,Reymond,S.,和Redgewell,R.(2001),Purificationandcharacterizationofagalactoglucomannanfromkiwifruit(Actinidiadeliciosa)CarbohydrRes.331,291-306Sims,I.和Craik,D.,和Bade,A.(1997)Structuralcharacterizationofgalactoglucomannansecretedbysuspension-culturedcellsofNicotianaplumbaginifoliaCarbohydrRes303,79-92SomervilleC,BauerS,BrininstoolG,F(xiàn)acetteM,HamannT,MilneJ,OsborneE,ParedezA,PerssonS,RaabT,VorwerkS,YoungsH(2004a)Towardasystemsapproachtounderstandingplantcellwalls.Science306:2206-2211SomervilleC,BauerS,BrininstoolG,FacetteM,HamannT,MilneJ,OsborneE,ParedezA,PerssonS,RaabT,VorwerkS,YoungsH(2004b)Towardasystemsapproachtounderstandingplantcellwalls.Science306:2206-2211SomervilleC,BauerS,BrininstoolG,F(xiàn)acetteM,HamannT,MilneJ,OsborneE,ParedezA,PerssonS,RaabT,VorwerkS,YoungsH(2005)Towardasystemsapproachtounderstandingplantcellwalls.Science306:2206-2211SunderlandP,HalletI,MacReaE,F(xiàn)ischerM,RedgwellR(2004)CytochemistryandimmunolocalizationofpolysaccharidesandproteoglycansintheendospermofgreenArabicacoffeebeans.Protoplasma223:203-211YeretzianC,JordanA,BadoudR,LindingerW(2005)Fromthegreenbeantothecoffeecup:investigatingcoffeeroastingbyon-linemonitoringofvolatiles.EurFoodResTechnol214:92-104序列表<210>1<211>1898<212>DNA<213>中果咖啡(Coffeacanephora)<220><221>misc—feature<222>(1118)..(1118)<223>用T3于A的突變N顯示在此序列中<400>1ctgctcattgccctcagctcctaagggctctatcattttggcttcaagttcaagttcttc60ttcaccttcaaaaaagcatttcgttgctccacttccacaatcatagcctgataaaatgag120aaactcagtttctctagagtccgagccagaggtaaatttatatgatgatactggcagaag180tctcagccaagcatgggaccgtatacgagttcctataattgtgccaattctgcggtttgc240tttatatgtatgcatagcaatgtctgttatgcttttcattgaacgggcgtacatggcgat300tgtgattggatgtgtcaagtgcttgggaaggaaacgatataccaagtataatcttgatgc360cataaaagaagacctagagcaaaacagaaactatcctatggtgctggtccaaatacccat420gtttaacgaaaaagaggtctataaactctcaattggagctgcatgtgggctttcatggcc480atcagatagattaatagttcaggttcttgatgactccacgaatgaagtcctgcgggcatt540ggtggagttggagtgtcaaagatggatagagaaaggggtgaatgtggagtatgaaacaag600gaacaacaggaatggttataaagcaggtgcacttcgggatggtctaaaaaggccatatgt660tgaaggttgtgagtttgtcgtcatttttgatgcagacttccagcctgaggaggactttct720gtggagaacagtgccttatcttcttgaaaacccagagctggctttggttcaagcccgatg780gaaatttgtaaatgcaaatgaatgtttaatgacgcggcttcaggagatgtcactagacta840tcacttcagtgtggagcaagaagtaggctcgtcaacatgttcattctttgggtttaatgg900aactgccggtgtatggaggatccaagcagtaagtgatgctggtggatggaaagataggac960cacggttgaggatatggaccttgcagtaagggctagccttaagggttggaaattcatctt1020tgtgggagatttatctgtcaaaaatgaacttccaagcactttcaaggcttatagatttca1080gcagcatcgatggtcgtgtggcccagccaatctcttcngaaaaatgttcaaagaaattct1140cctttgtgagcgtgtgtccatctggaagaaattccatgtcatctatgccttcttctttgt1200gaggaagatagttgcacactgggttacttttttcttctactgcattgtgatcccagcaac1260tatcttagttcctgaagtgcatcttccaaagccaatagcagtttatctgccagcaaccat1320tacacttcttaatgcagctagcactccaaggtccttgcatctactcgtgttctggatact1380gtttgagaatgtcatgtccctccatcgatccaaagcagcaattataggacttttagaagc1440cagccgagttaacgagtggattgtgacggaaaagcttggaaacgcattgaagcaaaagta1500cagcatccccaaagtatctaagsgaccaagatcacgaattgcagaaaggatccacttttt1560ggagctgataatgggaatgtatatgctgcactgtgctttctacaacatgatctttgcaaa1620cgatcatttcttcatatacctgttaicttcaagcaggggctttcttcacaatagggcttgg1680ttacattggaacaattgtccctacttaagaagctaggcataccgai5L5iataaagcctccaa1740aaggacaagcaggctgctggaagctactgtcatttggtatatccatctagtagcatacta1800ctaagtcatggtattatttttcaatgttctttatactgagtgtcctcaagggtctctgca1860cttcgggccccccttaatatagacgagtacagcaagtc1898<210>2<211>1897<212>DNA<213>中果咖啡<400>2tgctcattgccctcagctcctaagggctctatcattttggcttcaagttcaagttcttct60tcaccttcaaaaaagcatttcgttgcttcacttccacaattatagcctgataagatgaga120aactcagtttttctagagcccgagccagaggtaaatttatatgatgatactggcagaagt180ctcagccaagcatgggaccgtatacgagttcctataattgtgccgattctgcggtttgct240ttatatgtatgcatagcaatgtctgttatgcgtttcattgaacgggtgtacatggcgatt300gtgattggatgtgtcaagtgcttgggaaggaaacgatataccaagtataatcttgatgcc360ataaaagaagacctagagcaaaacagaaactatcctatggtgctggtccaaiatacccatg420tttaiacgaaaaagaggtctataaactctcaattggagctgcatgtgggctttcatggcca480tcagatagactaatagttcaggttcttgatgactccacgaatgaagtcctgcgggcattg540gtggagttggagtgtcaaagatggatagagaaaggggtgaatgtgaagtatgaaacaagg600aacaacaggaatggttataaagcaggtgcacttcgggatggtctaaaaaagccatatgtt660gaagattgtgagttcgtcgtcatttttgatgcagacttccagcctgaggaggactttctg720tggagaacagtgccttatcttcttgaaaacccagagctggctttggttcaagcccgatgg780aaatttgtaaatgcaaatgaatgtttaatgacgcggcttcaggagatgccactagactat840cacttcagtgtggagcaagaagtaggctcgtcaacatgttcattctttgggtttaatgga900actgccggtgtatggaggatccaagcagtaagcgatgctggtggatggaaagataggacc960acggttgaggatatggaccttgcagtaagggctagccttaagggctggaaattcatcttt1020gtgggagatttatctgtcaaaaatgaacttccaagcactttcaaggcttatagatttcag1080cagcatcgatggtcgtgtggcccagccaatctcttcagaaaaatgttcaaagaaattctc1140ctttgtgagcgtgtgtccatctggaagaaattccatgtcatctatgccttctcctttgtg1200'aggaagatagttgcacactgggttacttttttcttctactgcatcgtgatcccagcaact1260atcttagttcctgaagtgcatcttccaaagccaatagcagtttatctgccagcaaccatt1320acacttcttaatgcagctagcactccaaggtccttgcatctactcgtgttctggatactg1380tttgagaatgtcatgtccctccatcgatccaaagcagcaattataggacttttagaagcc1440agccgagttaacgagtggattgtgacggaaaagcttggaaacgcattgaagcaaaagtac1500agcatccccaaagtatctaagagaccaagatcacgaattgcagaaaggatccactttttg1560gagctgataatgggaatgtatatgctgcactgtgctttctacaacatgatctttgcaaac1620gatcatttcttcatatacctgttacttcaagcaggggctttcttcataatagggcttggt1680tacattggaacaattgtccctacttaagaagctaggcataccgaaaataaagcctccaaa1740aggacaagcaggctgctggaagctactgtcatttggtatatccatcttgtagcatactac1800taagtcatggtattatttttcaatgttctttatactgtgtgtcctcaagggtctctgcac1860ttcgggccccccttaatatagacgagtacagcaagtc1897:210>3-211>1897-212>DNA=:213>小杲咖啡(Coffeaarabica)<400>3tgctcattgccctcagctcctaagggctctatcattttggcttcaagttcaagttcttct60tcaccttcaaaaaagcatttcgttgcttcacttccacaattatagcctgataagatgaga120aactcagtttttctagagcccgagccagaggtaaatttatatgatgatactggcagaagt180ctcagccaagcatgggaccgtatacgagttcctataattgtgccgattctgcggtttgct240ttatatgtatgcatagcaatgtctgttatgcttttcatcgaacgggtgtacatggcgatt3Q0gtgattggatgtgtcasgtgcttgggaaiggaaacgatataccaaigtateiatcttgaitgcc360eitaaiaaga^gacctagagcasaacagaaactatcctatggtgctggtccaaatacccatg420tttaacgaaaaagaggtctataaactctcaattggaigctgcatgtgggctttcacggcca480tcagatagactaatagttcaggttcttgatgactccacgaatgaagtcctgcgggcattg540gtggagttggagtgtcaaagatggatagagaaaggggtgaatgtgaagtatgaaacaagg600aacaacaggaatggttataaagcaggtgcacttcgggatggtctaaaaaagccatatgtt660gaagattgtgagtttgtcgtcatttttgatgcagacttccagcctgaggaggactttctg720tggagaacagtgccttatcttcttgaaaacccagagctggctttggttcaagcccgatgg780aaatttgtaaatgcaaatgaatgtttaatgacgcggcttcaggagatgtcactagactat840cacttcagtgtggagcaagaagtaggctcgtcaacatgttcattctttgggtttaatgga900actgccggtgtatggaggatccaagcagtaagtgatgctggtggatggaaagataggacc960acggttgaggatatggaccttgcagtaagggctagccttaagggttggaaattcatcttt1020gtgggagatttatctgtcaaaaaitgaacttccaagcactttcaaggcttatagatttcag1080cagcatcgatggtcgtgtggcccagccaatctcttcagaaaaatgttcaaagaaattctc1140ctttgtgagcgtgtgtccatctggaagaaattccatgtcatctatgccttcttctttgtg1200aggaagatagttgcacactgggttacttttttcttctactgcatcgtgatcccagcaact1260atcttagttcctgaagtgcatcttccaaagccaatagcagtttatccgccagcaaccatt1320acacttcttaatgcagctagcactccaaggtccttgcatctactcgtgttctggatactg1380tttgagaatgtcatgtccctccatcgatccaaagcagcaattataggacttttagaagcc1440agccgagttaacgagtggattgtgacggaaaagcttggaaacgcattgaagcaaaagtac1500agcatccccaaagtatctaagagaccaggatcacgaattgcagaaaggatccactttttg1560gagctgattaatgggaatgtatatgctgcactgtgctttctacaacctgatctttgcaaac1620gatcatttcttcatatacccgttacttcaagcaggggctttcttcataatagggcttggt1680tacaittggaacaattgtccctacttaagaagctaggcataccgaaaataaagcctccsaa1740aggacaagcaggctgctggaagctactgtcatttggtatatccatcttgtagcatactac1800taagtcatggtattatttttcaatgttctttatactgtgtgtcctcaagggtctctgcac1860ttcgggccccccttaatatagacgagtacagcaagtc1897<210>4<211>530<212>PRT<213>中果咖啡<220><221>M工SC—FEATURE<222>(335)..(335)<223>由于通過T而不是A的在核酸序列中的突變,在此生成了終止密碼子。<400>4MetArgAsnSerValSerLeuGluSerGluProGluValAsnLeuTyr151015AspAspThrGlyArgSerLeuSerGinAlaTrpAspArg工leArgVal202530Prolie工leValPro工leLeuArgPheAlaLeuTyrValCys工leAla354045MetSerValMetLeuPhelieGluArgAlaTyrMetAla工leVal工le5055602GlyCysValLysCysLeuGlyArgLysArgTyrThrLysTyrAsnLeu65707580AspAlalieLysGluAspLeuGluGinAsnArgAsnTyrProMetVal859095LeuValGin工leProMetPheAsnGluLysGluValTyrLysLeuSer100105110工leGlyAlaAlaCysGlyLeuSerTrpProSerAspArgLeu工leVal115120125GinValLeuAspAspSerThrAsnGluValLeuArgAlaLeuValGlu130135140LeuGluCysGinArgTrp工leGluLysGlyValAsnValGluTyrGlu145150155160ThrArgAsnAsnArgAsnGlyTyrLysAlaGlyAlaLeuArgAspGly165170175LeuLysArgProTyrValGluGlyCysGluPheValValliePheAsp180185190AlaAspPheGinProGluGluAspPheLeuTrpArgThrValProTyr195200205LeuLeuGluAsnProGluLeuAlaLeuValGinAlaArgTrpLysPhe210215220ValAsnAlaAsnGluCysLeuMetThrArgLeuGinGluMetSerLeu225230235240AspTyrHisPheSerValGluGinGluValGlySerSerThrCysSer245250255PhePheGlyPheAsnGlyThrAlaGlyValTrpArg工leGinAlaVal260265270SerAspAlaGlyGlyTrpLysAspArgThrThrValGluAspMetAsp275280285LeuAlaValArgAlaSerLeuLysGlyTrpLysPheIl4PheValGly290295300AspLeuSerValLysAsnGluLeuProSerThrPheLysAlaTyrArg305310315320PheGinGinHisArgTrpSerCysGlyProAlaAsnLeuPheXaaLys325330335MetPheLysGlu工leLeuLeuCysGluArgValSerlieTrpLysLys34034535QPheHisVal工leTyrAlaPhePhePheValArgLyslieValAlaHis355360365TrpValThrPhePhePheTyrCys工leVal工leProAlaThrlieLeu370375380ValProGluValHisLeuProLysPro工leAlaValTyrLeuProAla385390395400ThrlieThrLeuLeuAsnAlaAlaSerThrProArgSerLeuHisLeu405410415LeuValPheTrp工leLeuPheGluAsnValMetSerLeuHisArgSer420425430LysAlaAlalielieGlyLeuLeuGluAlaSerArgValAsnGluTrp435440445工leValThrGluLysLeuGlyAsnAlaLeuLysGinLysTyrSer工le450455460ProLysValSerLysArgProArgSerArg工leAlaGluArg工leHis465470475480PheLeuGluLeu工leMetGlyMetTyrMetLeuHisCysAlaPheTyr485490495AsnMetliePheAlaAsnAspHisPhePhe工leTyrLeuLeuLeuGin500505510AlaGlyAlaPhePheThr工leGlyLeuGlyTyr工leGlyThr工leVal515520525ProThr530<210>5<211>530<212>PRT<213>中果咖啡<400>5MetArgAsnSerValPheLeuGluProGluProGluValAsnLeuTyr151015AspAspThrGlyArgSerLeuSerGinAlaTrpAspArglieArgVal202530Pro工le工leValProlieLeuArgPheAlaLeuTyrValCys工leAla354045MetSerValMetArgPhe工leGluArgValTyrMetAla工leVal工le505560GlyCysValLysCysLeuGlyArgLysArgTyrThrLysTyrAsnLeu65707580AspAlalieLysGluAspLeuGluGinAsnArgAsnTyrProMetVal859095LeuValGin工leProMetPheAsnGluLysGluValTyrLysLeuSer100105110工leGlyAlaAlaCysGlyLeuSerTrpProSerAspArgLeulieVal115120125GinValLeuAspAspSerThrAsnGluValLeuArgAlaLeuValGlu130135140LeuGluCysGinArgTrp工leGluLysGlyValAsnValLysTyrGlu145150155160ThrArgAsnAsnArgAsnGlyTyrLysAlaGlyAlaLeuArgAspGly165170175LeuLysLysProTyrValGluAspCysGluPheValVal工lePheAsp18Q185190AlaAspPheGinProGluGluAspPheLeuTrpArgThrValProTyr195200205LeuLeuGluAsnProGluLeuAlaLeuValGinAlaArgTrpLysPhe210215220ValAsnAlaAsnGluCysLeuMetThrArgLeuGinGluMetProLeu225230235240AspTyrHisPheSerValGluGinGluValGlySerSerThrCysSer245250255PhePheGlyPheAsnGlyThrAlaGlyValTrpArg工leGinAlaVal260265270SerAspAlaGlyGlyTrpLysAspArgThrThrValGluAspMetAsp275280285LeuAlaValArgAlaSerLeuLysGlyTrpLysPhe工lePheValGly290295300AspLeuSerValLysAsnGluLeuProSerThrPheLysAlaTyrArg305310315320PheGinGinHisArgTrpSerCysGlyProAlaAsnLeuPheArgLys325330335MetPheLysGlulieLeuLeuCysGluArgValSer工leTrpLysLys340345350PheHisVallieTyrAlaPheSerPheValArgLys工leValAlaHis355360365TrpValThrPhePhePheTyrCys工leVal工leProAlaThrlieLeu370375380ValProGluValHisLeuProLysProlieAlaValTyrLeuProAla385390395400ThrlieThrLeuLeuAsnAlaAlaSerThrProArgSerLeuHisLeu405410415LeuValPheTrp工leLeuPheGluAsnValMetSerLeuHisArgSer420425430LysAlaAlalielieGlyLeuLeuGluAlaSerArgValAsnGluTrp435440445工leValThrGluLysLeuGlyAsnAlaLeuLysGinLysTyrSer工le450455460ProLysValSerLysArgProArgSerArg工leAlaGluArg工leHis465470475480PheLeuGluLeu工leMetGlyMetTyrMetLeuHisCysAlaPheTyr485490495AsnMetliePheAlaAsnAspHisPhePhe工leTyrLeuLeuLeuGin500505510AlaGlyAlaPhePhe工le工leGlyLeuGlyTyrlieGlyThr工leVal515520525ProThr530<210>6<211>530<212>PRT<213>小果咖啡<400>6MetArgAsnSerValPheLeuGluProGluProGluValAsnLeuTyr151015AspAspThrGlyArgSerLeuSerGinAlaTrpAspArg工leArgVal202530Pro工lelieValPro工leLeuArgPheAlaLeuTyrValCys工leAla354045MetSerValMetLeuPhelieGluArgValTyrMetAla工leVal工le505560GlyCysValLysCysLeuGlyArgLysArgTyrThrLysTyrAsnLeu65707580AspAla工leLysGluAspLeuGluGinAsnArgAsnTyrProMetVal859095LeuValGin工leProMetPheAsnGluLysGluValTyrLysLeuSer100105110工leGlyAlaAlaCysGlyLeuSerArgProSerAspArgLeulieVal115120125GinValLeuAspAspSerThrAsnGluValLeuArgAlaLeuValGlu130135140LeuGluCysGinArgTrplieGluLysGlyValAsnValLysTyrGlu145ThrArgLjeuLys150AsnAsnArgAsn165LysProTyrVal180155GlyTyrLysAla170GluAspCysGlu185'160GlyAlaLeuArgAspGly175PheValVal工lePheAsp190AlaAspPheGinProGluGluAspPheLeuTrpArgThrValProTyr195200205LeuLeuGluAsnProGluLeuAlaLeuValGinAlaArgTrpLysPhe210215220ValAsnAlaAsnGluCysLeuMetThrArgLeuGinGluMetSerLeu225230235240AspTyrHisPheSerValGluGinGluValGlySerSerThrCysSer245250255PhePheGlyPheAsnGlyThrAlaGlyValTrpArg工leGinAlaVal260265270SerAspAlaGlyGlyTrpLysAspArgThrThrValGluAspMetAsp275280285LeuAlaValArgAlaSerLeuLys290295AspLeuSerValLysAsnGluLeu305310PheGinGinHisArgTrpSerCys3253GlyTrpLysPheliePheValGly300ProSerThrPheLysAlaTyrArg315320GlyProAlaAsnLeuPheArgLys30335MetPheLysGlulieLeuLeuCySGluArgValSerlieTrpLysLys340345350PheHisVallieTyrAlaPhePhePheValArgLyslieValAlaHis355360365TrpValThrPhePhePheTyrCyslieVallieProAlaThr工leLeu370375380ValProGluValHisLeuProLysProlieAlaValTyrProProAla385390395400Thr工leThrLeuLeuAsnAlaAlaSerThrProArgSerLeuHisLeu405410415LeuValPheTrp工leLeuPheGluAsnValMetSerLeuHisArgSer420425430LysAlaAla工lelieGlyLeuLeliGluAlaSerArgValAsnGluTrp435440445工leValThrGluLysLeuGlyAsnAlaLeuLysGinLysTyrSer工le450455460ProLysValSerLysArgProGlySerArglieAlaGluArglieHis465470475480PheLeuGluLeu工leMetGlyMetTyrMetLeuHisCysAlaPheTyr485490495AsnLeuliePheAlaAsnAspHisPhePhe工leTyrProLeuLeuGin500505510AlaGlyAlaPhePhe工lelieGlyLeuGlyTyr工leGlyThrlieVal515520525ProThr530<210>7<211>XXXX<212>DNA<213>中果咖啡<210>8<211>xxxx<212>DNA<213>中果咖啡<210>9<211>xxxx<212>DNA<213>中果叻PP非<210>10<211>xxxx<212>DNA<213>中果咖啡SEQIDNO:11<213>生物體名中杲咖啡<400>子貞序歹'J行(PreSequenceString)atattattttgaggggtactggatggaaatgtacacggggatcgagaagcgggagaggagggagagttatggtaaggtgtgggaggagcattggaggagaccgttcatgactcacttcacccagatgtactctgggcagtcttgctgggataatcaggtgcttaggagatatgggttcgtcttgcctctgccgttcgattacccggcatcttttattctaaccaacagtttcctagtttttcatttttttttttaatctctgaaacgattttatgaaactatactactgttgctttagtaa_gtaa_gtga_ttgcatatatatattatttcgtcgtggggacgctggagaacatcaccgacgc60attgaggaggaggcatgcagagagagtggg120ccttaaggacgctgggtatgggagggggag180ggggtgtcagccttgtagcggggaccacaa240tgcgatgcaaattgctctgaattttgcaga300gcaccgggatctattggatacgtccaccgt360ggaccttgttgaaggcgcttcctagacata420gtaccatcatcggaggctttacgagtagta480agtatcatatagaaagaaggtatatcagat540gtatcattttgacggttatgggctcttagt600ttttcattttttgggcaccctggagatgta660ttttctctgttgtaagttaaagttggggg689<212>類型DNA<211>長度689序歹'J名CcGMGTl(單基因122620)序列描述常規(guī)密碼子(CustomCodon)序歹'J名CcGMGTl(單基因122620)SEQIDNO:12<213>生物體名中果咖啡<400>子貞序歹'M亍ctctctcctcgtaaaaaaaacaagaagcaacagtaaagccggccagccatctctaaagat60aaagctcagaccaaacaatcatcatatatttccagagatagcagcaggtcgtacttcctc120gctgtatttgtctccatggtactcgtctttgtcatatgttccttgacagaaactttgccc180agtttccaaaataggatttcaactaccggtgctgatacctgtaacggcgaaccaccagcc240gtaaatcgaacccacgaccctaaagaagccactttttacgacgaacccgagctaacctac300acgctaggcaaaaccatcaaagactgggacaagaagagaaagtcctggctaaaccttcat360ccctcgttcgccgcgggtgccgacacacgtattctcatcgtgacggggtctcagccttcg420ccatgcaagaatcccatcggggatcatctactcctgaggtgtttcaagaacaaggctgat480tattccagaatccacggctacgatatcttttacaacaccgcatgtttagaccccaagctg540tgcaacgtttgggctaaggtagctttaattcgggctgccatggtggcccacccggaagca600gagtggatctggtggatggactccgatgctgtctttactgacatgtactttaaagttccg660ttacagaggtacaagcagcataatctggttgttcccggctggcccgacatggtttacgag720aagaagagttgggtttctctaaataccgggagtttcttcacgagaaattgtcagtggtct780ttggattttttggatgcctgggctcgtatgagcccccgaagccctgattacaagttctgg840agtgaa_a_ctttaatgtcta859<212>類型DNA<211>長度859序歹寸名CcGMGT2(單基因122567)序列描述常規(guī)密碼子序歹'J名CcGMGT2(單基因122567)SEGIDNO:13<213>生物體名Coffeaarabica<400>予貞序歹寸4亍agacagcagccaccatgcctatagcacaacagcctcctccgcaccaaaacctcgtcgtttt60tctccagctgctttctttacgccgccggaacttccgcttcctttttgttagcctgggcct120tctggtccttcttcagtagccccgccccatctgcgaatccctctttctcgaggggcctag180cttccgaggctgccctcagctgccccgccgggaaagcgggtcacaaccggagctacgatc240cgcccgacccgactttctatgacgacccggaattgagctacaccattgagaagaccatca300agaactgggatgagaagaggcgggagtggctcgagaagcatccctcgttcgccgccggag360cagctgacaggattttaatggtcacgggttctcaggcgacgccctgcaagaacccgatcg420gggatcacttgctgttgaggttcttcaagaataaggcggactactgcaggatccacggct480acgatatcttctacaacaccgtgctgctgcagccgaagatgttctcgttttgggcaaaaa540tgcctgccgtgaaagcggtcatgttggcccatccggaggcggagtggatctggtgggtag600attcagacacagccttcaccgacatggacttcacgctgccgctggatcgctacaaggccc660ataatttagtggtccacggctggcctcacttgattcacagggagaagsigctggacggggc720tgaacgcgggagtgtttctgatgcgcaactgtcagtggtcaatggatttcatggaagaat780gggcgagcatggggcctcaagccccggagtacgacaaatggggcgtgattcagcggacga840cgttcaaggacaagacgtttccggagtcagacgatcagacggggttggcttatctgatcc900tgaaagagagagagaaatgggggaaceiaaeLtttacatggaggatgaatattattttgagg960ggtactggatggaaatcgtggggacgctggagaacatcaccgacgcgtacacggggatcg1020eigaagcgggagaggaggttgaggaggaggcaggtgtgggaggagcaccttaaggacgctgtcatgactcacttcacggggtgtcagccttgacagtcttgctgggatgcgatgcaaattgggagatatgggttcgtgcaccgggatttattcgattacccagcatcggaccttgttggagactgttaagtagttttgtaccatcatcggatgaaacggttagtatcatatagaaagaaggtacttaactagta_tca_ttttgaaggttatgtttcgtttttcatttttttgggcaccctggtcgggg<212>類型DNA<211>長度1626序列名pVCll(CaGMGTl)核酸atgcagagagagtgggggagagttatggta1080ggtatgggagggggagttggaggagaccgt1140gtagcggggaccacaaccagatgtactctg1200ctctgaattttgcagataatcaggtgctta1260tggatacgtccaccgtcccgcctctgccgt1320gcgcttcctagaaatattttattctaacca1380ggctttactagtagtsLtcattattgattta1440tatatcatatttatgaaactatactactgt1500ggctcttaatagtaagtgattgcatstgta1560agatgtattttctctgttgtaagttaaaag16201626SEGIDNO:14<213>生物體名中果咖啡<400>予貞序歹'M亍ctctctctttggcaaaaaaacaagaagcaacagtaaagccggccagccatgtctagagct60aaagctcagaccaaacaatcatcatatatttccagagatagcagcaggtcgtacttcctc120gctgtatttgtctccatggtactcgtctttgtcatatgttccttgacagaaactttgccc180agtttccaaaataggatttcaactaccggtgctgatacctgtaacggcgaaccaccagcc240gtaaatcgaaicccacgaccctaaagaagccactttttacgacgaacccgagctaacctac300sicgctaggcaaaaccatcaaagactgggacaagaagagaaagtcctggctaaaccttcat360ccctcgttcgccgcgggtgccgacacacgtattctcatcgtgacggggtctcagccttcg420ccatgcaagaatcccatcggggatcatctactcctgaggtgtttcaagaacaaggctgat480tattccagaatccacggctacgatatcttttacaacaccgcatgtttagaccccaagctg540tgcaacgtttgggctaaggtagctttaattcgggctgccatggtggcccacccggaagca600gagtggatctggtggatggactccgatgctgtctttactgacatgtactttateiagttccg660ttacagaggtacaagcagcataatctggttgttcccggctggcccgacatggtttacgag720aagaagagttgggtttctctaaataccgggagtttcttcacgagaaattgtcagtggtct780ttggattttttggatgcctgggctcgtatgagcccccgaagccctgattacaagttctgg840agtgaaactttaatgtctacgctttcggataagatgttcccgggagcagatgagcagtcg900tctttggtttatttgctgttgacagaaaagaagaaatggggggataagatttatttagag960aatcagtacgacttgagctcttattgggtaggcgtagttggaaagcttgataaatttacg1020aggacggaggctgacgcagagaagaatttgcccttgctaaggaggagaagggcggaggtg1080gtgggcgag3gcgttggtgaggtgtgggagasgtacttggaaaataataccgctagcgag1140ggtaaacggccgtttattacgcatttcacgggatgccagccctgcagcggaaaccatgac1200ccctcctacgttggaaatacctgctgggatgcaatggagaggactctgaattatgetgat1260aatcaggtccttegtaaettgggttttgtgcacagggatataagccgtggetcttaegtt1320ttacccctagcctttgattttecateggaagtgctgcaaagaaagaaatccggtgaagaa1380tataacaggtgaataaatccetcegttttagtgctgtttatagattatagcagccagcag1440gaettgggeectgaaaattcagtatctcagaaaa3aa_atgacagtgaaattgagageigcaL1500aaaatgttttcacaagcttgtcgtggtaaattcctcagtaattgagtgaatttcaagata1560cttatatttgttgccacgaaatttgttgatgctttttcctgttggtcaacaaaatcgaat1620tga_ttga_gtgtgcttttta_a_ta^aaaa^aaaa^a3aa^a^aa^aaaa^a^a_a_a_a_aia_aLa3a_1680<212>類型DNA<211>長度1695序歹'J名CcGMGT2(cccl26f9)核酸1695SEQIDNO:15<213>生物體名中果咖啡<400>予頁序歹'J《亍YYFEGYWME工VGTLEN工TDAYTG工EKRERRLRRRHAERVGESYGKVWEEHLKDAGYGRGSWRRPFMTHFTGCQPCSGDHNQMYSGQSCWDAMQ工AIjNFADNQVLRRYGFV服DLU3TSTV120'LPLPFDYPASDLVEGAS<212>類型PRT<211>長度137序列名CcGMGTl(由單基因122620編石馬)序列描述137SEGIDNO:16<213>生物體名中果咖啡<400>預(yù)序歹'M亍TFTOEPEIjTYT:LGKTIKDWDKKRKSW:LNLjHPSFAAGADTR工L工VTGSQPSPCKNPIGDHIj60LLRCFKNKADYSR工HGYD工FYNTACLDPKLCNVWAKVAL工RAAMVAHPEAEW工麗MDSDA120VFTDMYFKVPIjQRYKQHNIjVVPGWPDMVYEKKSWVSIjNTGSFFTRNCQWSLDFIiDAWARM180SPRSPDYKFWSETLMS<212>類型PRT<211>長度196序歹'J名CcGMGT2(由單基因122567編石馬)序列描述196SEQIDNO:17<213>生物體名小果咖啡<400>預(yù)序歹U行MPKHNSIiIiRTKTSSFFSSCFIiSCPAGKAGHIjMVTGSGATPAVMLAHPEAEFIiMRNCQWSMKWGNKIYMEDNRSYDPPDPTCKNPIGDHIjIiWIWWVDSDTADFMEEWASMGEYYFEGYWMEIiYAAGTSASFFYDDPELSYTIiRFFKNKADYFTDMDFTIiPIiPQAPEYDKWGIVGTLENITDIiLAWAFWSFFIEKTIKNWDECRIHGYDIFYDRYKAHNLWVIGRTTFKDKAYTGIEKRERSSPAPSANPSKRREWIjEKHPNTVTiliQPKMFHGWPHIiIHRETFPESDDGTGRIiRRRHAERVFSRGLASEAASFAAGAADRISFWAKMPAVKKSWTGLNAGVIiAYIiIIiKEREGESYGKVWEE6012018024030036074HLKDAGYGRGSWRRPFMTHFTGCQPCSGDHNQMYSGQSCWDAMQIALNFADNQVLRRYGF420VHRDLLDTSTVPPLPFDYPASDLVGGAS448<212>類型PRT<211>長度448序歹lj名pVCll(CaGMGTl)蛋白質(zhì)SEQIDNO:18<213>生物體名中果咖啡<400>預(yù)序列行MSRAKAQTKQSSYISRDSSRSYFLAVFVSMVLVFVICSLTETLPSFQNRISTTGADTCNG60EPPAVNRTHDPKEATFYDEPEI/TYTLGKTIKDWDKKRKSWLNLHPSFAAGADTRILIVTG120SQPSPCKNPIGDHLLIiRCFKNKADYSRIHGYDIFYNTACLDPKLCNVWAKVAL工RAAMVA180HPEAEWIWWMDSDAVFTDMYFKVPLQRYKQHNLWPGWPDMVYEKKSWVSLNTGSFFTRN240CQWSIiDFIiDAWARMSPRSPDYKFWSETLMSTLSDKMFPGADEQSSIiVYIiliIiTEKKKWGDK300IYIiENQYDLSSYWVGWGKLDKFTRTEADAEK肌PLLRRRRAEWGESVGTASEGKRPFITHFTGCQPCSGNHDPSYVGNTCWDAMERTLNYADNQVLRNGSYVLPIiAFDFPSEVLGRKKSGEEYNR<212>類型PRT<211>長度i447序歹!j名CcGMGT2(cccl26f9)蛋白質(zhì)EVWEKYLENNIiGFVHRDISR447360420SEQIDNO:19<213>生物體名<400>預(yù)序歹'J行中果咖啡attttgaggggtactggatggaaatcgtggggacgctggagaacatcaccgacgcgtaca60cggggatcgagaagcgggagaggagattgaggaggaggcatgcagagagagtgggggaga120gttatggtaaggtgtgggsggsgcaccttaaggacgctgggtatgggagggggagttgga180ggagaccgttcatgactcacttcacggggtgtcagccttgtagcggggaccacaaccaga240tgtactctgggcagtcttgctgggatgcgatgcaaattgctctgaattttgcagataatc300aggtgcttaggagatatgggttcgtgcaccgggatctattggatacgtccaccgtcttgc360ctctgccgttcgattacccggcatcggaccttgttgaaggcgcttcctagacatatttta420ttctaaccaacagtttcctagttttgtaccatcatcggaggctttacgagtagtatcatt480ttttttttttttttaatttctgaaacgattagtatcatatagaaagaaggtatatcagat540ttatgaaactatactactgttactttactagtatcattttgacggttatgggctctttgt600agtgagtgattgcatatatacttcgtttttcatttttttgggcaccctggagatgtattt660tctctgttgtaagttaaaeLgtcgggggtcttataaagtgttaatgcatgtactatatatg720ttgtacttgtttttttttaiaaaaaaaaatt<212>類型DNA<211>長度801序歹'J名cccs46w8023斗盆酸SEQIDNO:20<213>生物體名小果咖啡<400>預(yù)序歹'M亍agacagcagccaccatgcctaagcacaacatctccagctgctttctttacgccgccggaatctggtccttcttcagtagccccgccccatcttccgaggctgccctcagctgccccgccgcgcccgacccgactttctatgacgacccggagaactgggatgagaagaggcgggagtggccagctgacaggattttaatggtcacgggttgggatcacttgctgttgaggttcttcaagaacgatatcttctacaacaccgtgctgctgctgcctgccgtgaaagcggtcatgttggcccattcagacgcagccttcaccgacatggactataatttagtggtccacggctggcctcacttgaacgcgggagtgtttctgatgcgcaactgggcgagcatggggcctcaagcctcggagtcgttcaaggacaagacgtttccggagtcagtgaaagagagagagaaatgggggaacaaaacttttttgttgggggtttaaaaaaaaaaaa780801gcctcctccgcaccaaaacctcgtcgtttt60cttccgcttcctttttgttagcctgggcct120ctgcgaatccctctttctcgaggggcctag180ggaaaigcgggtcacaaccggagctacgatc240tattgagctacaccattgagaagaccatca300tcgagaagcatccctcgttcgccgccggag360ctcaggcgacgccctgcaagaacccgatcg420gtaaggcggactactgcaggatccacggct480agccgaggatgttctcgttttgggcaaaaa540atccggaggcggagtggatctggtgggtag600tcacgctgccgctggatcgctacaaggccc660tgattcacagggagaagagctggacggggc720gtcagtggtcaatggatttcatggaagaat780acgaceiaatggggcgtgsttcagcggacga840acgatcagacggggttggcttatctgatcc900tttacatggaggatgaatattattttgagg960ggtgctggatggaaatcgtggggacgctggagaacatcaccgacgcgtacacggggatcg1020agaagcgggagaggagattgaggaggaggcatgcagagagagtgggggagagttatggta1080aggtgtgggaggagcaccttaaggacgctgggtatgggag1120<212>類型DNA<211>長度1120序列名pVC10(GMGT-RACE13)核酸本發(fā)明不限于上述所描述和舉例的實施方案,而是能夠?qū)⒏淖兒托揎棸谒降臋?quán)利要求范圍內(nèi)。權(quán)利要求1.從咖啡屬物種中分離的核酸分子,其包含編碼半乳甘露聚糖合成酶的編碼序列。2.權(quán)利要求1的核酸分子,其中半乳甘露聚糖合成酶是半乳糖基轉(zhuǎn)移酶或甘露聚糖合酶。3.權(quán)利要求2的核酸分子,其中甘露聚糖合酶包含具有氨基酸序列QHRWS的保守結(jié)構(gòu)域。4.權(quán)利要求2的核酸分子,其中甘露聚糖合酶包含與SEQIDNO:4-6中任一項的^^列大于約75%同一的>|^,列。5.權(quán)利要求2的核酸分子,其中甘露聚糖合酶包含SEQIDNO:4-6中的任一項。6.權(quán)利要求2的核酸分子,其包含SEQIDNO:2或SEQIDNO:3。7.權(quán)利要求2的核酸分子,其中半乳糖基轉(zhuǎn)移酶與胡盧巴半乳糖基轉(zhuǎn)移酶或百樂財艮半乳糖基轉(zhuǎn)移酶具有至少約54%同一性。8.權(quán)利要求2的核酸分子,其中半乳糖基轉(zhuǎn)移酶包含與SEQIDNO:15-18中任一項大于約75%同一的氨基酸序列。9.權(quán)利要求2的核酸分子,其中半乳糖基轉(zhuǎn)移酶包含SEQIDNO:15-18的任一項。10.權(quán)利要求2的核酸分子,其包含SEQIDNO:ll-14的任一項。11.權(quán)利要求l的核酸分子,其中編碼序列是基因的可讀框。12.通過轉(zhuǎn)錄權(quán)利要求11的基因產(chǎn)生的mRNA分子。13.通過逆轉(zhuǎn)錄沖又利要求12的mRNA分子產(chǎn)生的cDNA分子。14.長度在8和100個g之間的寡核苷酸,其與權(quán)利要求1的核酸分子的片段互補。15.包含權(quán)利要求l的核酸分子的編碼序列的載體。16.權(quán)利要求15的載體,其是選自以下載體的表達載體質(zhì)粒、噬菌粒、勦粒、桿狀病毒、桿粒、細菌、酵母和病毒載體。17.權(quán)利要求15的載體,其中核酸分子的編碼序列與組成型啟動子有效的連接。18.權(quán)利要求15的載體,其中核酸分子的編碼序列與誘導型啟動子有效的連接。19.權(quán)利要求15的載體,其中核酸分子的編碼序列與組織特異性啟動子有效的連接。20.權(quán)利要求19的載體,其中組織特異性啟動子是種子特異性啟動子。21.權(quán)利要求20的載體,其中種子特異性啟動子是咖啡種子特異性啟動子。22.用權(quán)利要求15的載體轉(zhuǎn)化的宿主細胞。23.權(quán)利要求22的宿主細胞,其選自植物細胞、細菌細胞、真菌細胞、昆蟲細胞和哺乳動物細胞。24.權(quán)利要求23的宿主細胞,其為植物細胞,所述植物細胞選自下列植物咖啡、煙草、擬南芥、玉米、小麥、稻、大豆、大麥、黑麥、燕麥、高粱、苜蓿、車軸草、油菜、紅花、向日葵、花生、可可樹、粘果酸漿、馬鈴薯、胡椒、茄子、甜菜胡蘿卜、黃瓜、萵苣、豌豆、紫菀、秋海裳、菊花、飛燕草、碧冬茄、百日草和草坪草。25.由權(quán)利要求24的植物細胞產(chǎn)生的能育植物。26.調(diào)節(jié)來自咖啡豆的固體的可提取性的方法,其包括調(diào)節(jié)咖啡種子中半乳甘露聚糖合成酶的產(chǎn)生或活性。27.權(quán)利要求26的方法,其中半乳甘露聚糖合成酶是半乳糖基轉(zhuǎn)移酶或甘露聚糖合酶。28.權(quán)利要求27的方法,其包括增加半乳糖基轉(zhuǎn)移酶、甘露聚糖合酶或其組合的產(chǎn)生或活性。29.權(quán)利要求27的方法,其包括增加咖啡種子中編碼半乳糖基轉(zhuǎn)移酶、甘露聚糖合酶或其組合的基因的表達。30.權(quán)利要求27的方^,其包括向植物中引入編碼半乳糖基轉(zhuǎn)移酶的轉(zhuǎn)基因、編碼甘露聚糖合酶的轉(zhuǎn)基因或其組合。31.權(quán)利要求27的方法,其包括降低半乳糖基轉(zhuǎn)移酶、甘露聚糖合酶或其組合的產(chǎn)生或活性。全文摘要本文中公開了從咖啡(咖啡屬物種(Coffeaspp.))中分離的核酸分子,其包含編碼甘露聚糖合酶或半乳甘露聚糖半乳糖基轉(zhuǎn)移酶的序列。還公開了使用這些多核苷酸的方法,用于基因調(diào)節(jié)和操縱咖啡植物的多糖分子,從而影響咖啡豆的提取特征和其它特征。文檔編號C12N15/82GK101356277SQ200680038136公開日2009年1月28日申請日期2006年10月16日優(yōu)先權(quán)日2005年10月14日發(fā)明者J·G·麥卡錫,S·D·坦克斯雷,V·卡耶,V·帕蒂爾,林晨煒申請人:雀巢技術(shù)公司;康乃爾大學