專利名稱:分子功能網(wǎng)絡(luò)的生成方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于含有生物學(xué)事件信息的生物分子數(shù)據(jù)庫的制作方法和使用方法。
近年來,基因組的發(fā)展十分迅猛,以人為主的多種生物物種的基因組序列得到解析,關(guān)于基因和基因產(chǎn)物-蛋白質(zhì)的序列、每種臟器的蛋白質(zhì)的表達(dá)、蛋白-蛋白相互作用等基因組范圍內(nèi)的系統(tǒng)研究不斷深入。其大部分研究成果均以數(shù)據(jù)庫的形式公開供全世界使用。關(guān)于基因和蛋白質(zhì)的功能、疾病的原因以及背景基因的推測、基因多型性的關(guān)系等正在一點點闡明,人們對以遺傳信息為基礎(chǔ)的醫(yī)療和新藥開發(fā)的期望不斷升高。
一方面,遺傳信息的載體是核酸,但能量代謝、物質(zhì)交換、信號傳導(dǎo)等生命功能等大多數(shù)是依靠核酸以外的分子執(zhí)行。蛋白質(zhì)和其它種類的分子不同,它是以基因設(shè)計圖為基礎(chǔ)而直接產(chǎn)生的,其種類很多。酶、小分子的生物體內(nèi)生理活性化合物的靶標(biāo)生物分子、蛋白質(zhì)性質(zhì)的生物體內(nèi)生理活性化合物的靶標(biāo)生物分子(多數(shù)進(jìn)行了糖修飾)全部是蛋白質(zhì)。疾病的根本原因,歸根結(jié)底可以說多數(shù)疾病和癥狀是蛋白質(zhì)和小分子化合物的量之間的平衡、由于情況不同導(dǎo)致的質(zhì)(功能)的異常。大部分現(xiàn)行醫(yī)藥都是以蛋白質(zhì)為靶標(biāo)并對其功能進(jìn)行調(diào)控的化合物。和蛋白質(zhì)不同,由于核酸的立體結(jié)構(gòu)決定了它很難作為小分子藥物的靶標(biāo)而發(fā)揮其特異性作用,因此抗生素和抗菌藥或者農(nóng)藥的殺蟲劑和抗霉劑的靶標(biāo)都是蛋白質(zhì)。
因此,為了對以遺傳信息為基礎(chǔ)的醫(yī)療和新藥進(jìn)行開發(fā),必須闡明生物體內(nèi)各種蛋白質(zhì)和小分子化合物的功能和它們的分子間的特異性關(guān)系。而且,不同的酶漸次生物合成相關(guān)的必要分子,不同的分子漸次結(jié)合而傳導(dǎo)信號,這些分子在功能和生物合成上存在直接或者間接的相互關(guān)聯(lián)。這種關(guān)聯(lián)(分子功能網(wǎng)絡(luò))信息十分重要。此外,到目前的研究為止,已經(jīng)闡明了多種與各種臨床癥狀、生理現(xiàn)象以及生物反應(yīng)發(fā)生直接相關(guān)的介質(zhì)和激素等分子,與分子功能網(wǎng)絡(luò)的關(guān)系是適當(dāng)?shù)闹委煵豢扇钡?。此外,?chuàng)新藥物的戰(zhàn)略要在考慮到副作用風(fēng)險之同時設(shè)定恰當(dāng)?shù)陌袠?biāo)分子,因此必須考慮到含有靶標(biāo)分子的分子功能網(wǎng)絡(luò)。
蛋白質(zhì)相關(guān)的數(shù)據(jù)庫有SwissPort(the Swiss Institute ofBioinformatics,Europaen Bioinformatics Institute(EBI)、PIR(NationalBiomedical Research foundation(NBRF))。任何一個數(shù)據(jù)庫除了含有序列信息之外,還提供生物種類、功能、功能機制、發(fā)現(xiàn)者、文獻(xiàn)、其它注解信息。
著眼于分子關(guān)聯(lián)的分子網(wǎng)絡(luò)型的數(shù)據(jù)庫有與代謝途徑相關(guān)的有KEGG(金久等,京都大學(xué))、Biochemical Pathways(BoehringerMannheim)、WIT(Russian Academy of Sciences)、Biofrontier(吳羽化學(xué))、Protein Pathway(AxCell)、bioSCOUT(LION)、EcoCyc(DoubleTwist)、UM-BBD(Minnesota Univ)。
KEGG的PATHWAY數(shù)據(jù)庫中有新陳代謝途徑和信號傳導(dǎo)途徑,前者收集了物質(zhì)代謝、能量代謝相關(guān)的一般小分子化合物的代謝途徑,后者收集了信號傳導(dǎo)體系的蛋白質(zhì)。任何一種都以靜態(tài)Gif的格式提供事先定義的分子網(wǎng)絡(luò)。前者中,酶和配體的信息是從另外的文本形式分子數(shù)據(jù)庫LIGAND(金久等,京都大學(xué))和ENZYME(IUPAC-IUBMB)中收錄的。不包括與生理活性肽的生成相關(guān)的酶和靶標(biāo)生物分子。
EcoCyc是大腸桿菌物質(zhì)代謝的數(shù)據(jù)庫,是以每一個酶反應(yīng)相關(guān)數(shù)據(jù)和已知途徑相關(guān)數(shù)據(jù)(將屬于這種途徑的酶反應(yīng)集中在一起進(jìn)行表述)為基礎(chǔ)、用圖形的形式表示途徑。EcoCyc的檢索功能是提供根據(jù)與分子名和途徑名稱相對應(yīng)的文字列和略號的檢索方法。不能指定任意分子檢索新的途徑。
信號傳導(dǎo)相關(guān)的數(shù)據(jù)庫有CSNDB(國立醫(yī)藥食品衛(wèi)生研究所,日本)、SPAD(久原等,九州大學(xué))、Gene Net(Institute of Cytology & GeneticsNovosibrisk,Russia),GeNet(Maria G.Samsonova)。
蛋白-蛋白相互作用的數(shù)據(jù)庫有DIP(UCLA)、PathCalling(CuraGen)、ProNet(Myriad)。
基因、蛋白表達(dá)數(shù)據(jù)庫有BodyMap(東京大學(xué)、大阪大學(xué))、SWIS8-2DPAGE(Swiss Institute of Bioinformatics),Human and mouse 2D PAGEdatabase(Danish Centre for Human Genome Research),HEART-2DPAGE(GermanHeart)、PDD Protein Disease Databases(NIMH-NCI),WashingtonUniversity Inner Ear Protein Database(Washington Univ.),PMMA-2DPAGE(Purkyne Military Medical Academy),Mito-Pick(CEA,F(xiàn)rance),MolecularAnatomy Laboratory(Indiana University),Human Colon Carcinoma ProteinDatabase(Ludwig Institute for Cancer Research)。
生物反應(yīng)模擬型的分子網(wǎng)絡(luò)數(shù)據(jù)庫包括E-Cell(富田等,慶應(yīng)大學(xué))、e E.coli(B.Palsson)、Cell(D.Lauffenburger,MIT)、Virtual Cell(L.Leow,Conneticut Univ.)、Virtual patient(Entelos,Inc.)。
關(guān)于生物分子和功能的關(guān)系,除了SwissPort收集了廣泛的蛋白信息之外,COPE(University of Munich)以文本的形式公開了細(xì)胞因子的功能信息。ARIS((股份)日本電子計算)以醫(yī)學(xué)、藥學(xué)領(lǐng)域為中心從大約400多家國內(nèi)雜志和20家海外雜志中收錄了與藥品的副作用、相互作用、農(nóng)藥、化學(xué)物質(zhì)導(dǎo)致的中毒相關(guān)的文獻(xiàn)信息。但關(guān)于生物分子的生理作用和細(xì)胞水平以上的應(yīng)答方面的數(shù)據(jù)庫至今還沒有。關(guān)于基因和疾病,OMIM(NIH)對遺傳疾病和蛋白質(zhì)的氨基酸變異信息進(jìn)行了收集。任何信息都以文本形式的數(shù)據(jù)記述、用關(guān)鍵詞進(jìn)行檢索。
著眼于分子間關(guān)聯(lián)的已有數(shù)據(jù)庫存在以下幾點問題。分子網(wǎng)絡(luò)型數(shù)據(jù)庫是針對分子和分子間的關(guān)聯(lián)已經(jīng)清楚的體系制作的??梢允孪瓤紤]到分子間的關(guān)系進(jìn)行配置,并用靜態(tài)Gif等形式表現(xiàn)出來。可是,這種方式造成難以添加新的分子和分子間的關(guān)聯(lián)的后果。如果將今后明確其存在的分子也包括在內(nèi)大約有10萬以上(在KEGG中收錄的分子包括醫(yī)藥分子大約有1萬)。而且一旦這些分子間的關(guān)系通過今后的研究查清楚,可以推想分子網(wǎng)絡(luò)的復(fù)雜性正以加速度的狀態(tài)增加。為了適應(yīng)既能追加新分子又能夠保持不斷增多的分子之間關(guān)系的信息,人們需要能生成含有必要信息的部分分子網(wǎng)絡(luò)的新方法。
2001年9月7日至今,KEGG將分子間的關(guān)聯(lián)以2個分子成對信息的形式進(jìn)行保存,使用該信息,能夠探索代謝途徑中的任意2個分子間的關(guān)聯(lián)途徑??墒?,該途徑探索方法存在的問題是隨著關(guān)聯(lián)2個分子間的途徑的增長,計算時間也隨著級數(shù)地增長。
另一個方面,文本形式的數(shù)據(jù)庫中分子數(shù)據(jù)的追加沒有界限??墒牵瑥拿總€分子的數(shù)據(jù)中對功能上或者合成上相關(guān)聯(lián)的分子逐個反復(fù)檢索,導(dǎo)致難以生成表示多個分子關(guān)聯(lián)的分子網(wǎng)絡(luò)。因此需要開發(fā)一種在檢索時,能夠主動或者自動得到必要分子的關(guān)聯(lián)信息的數(shù)據(jù)的保持方法和檢索方法。此外為了在分子水平上理解疾病和病況,需要有記述生物分子及其網(wǎng)絡(luò)與生物應(yīng)答、生理作用的關(guān)系的新方法。
本發(fā)明者等人為了解決上述課題進(jìn)行了刻苦的研究,結(jié)果發(fā)現(xiàn),將直接結(jié)合的生物分子對作為部分信息而收集起耒,由此網(wǎng)羅了生物分子間的關(guān)系,針對生物分子中與生物應(yīng)答的表達(dá)直接相關(guān)的關(guān)鍵分子,在其與靶標(biāo)生物分子的對的信息中,添加了由生理作用、生物應(yīng)答、臨床癥狀等組成的生物學(xué)事件信息并加以保存,通過對包含指定的1個以上的任意生物分子以及生物學(xué)事件的關(guān)聯(lián)自動逐個探索,制成分子功能網(wǎng)絡(luò),解決了上述課題。
即,本發(fā)明提供了使用儲存了直接結(jié)合的生物分子對相關(guān)信息的生物分子連鎖數(shù)據(jù)庫生成分子功能網(wǎng)絡(luò)的方法。根據(jù)本發(fā)明的優(yōu)選方案,能夠提供使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫制成與生物學(xué)事件信息有關(guān)的分子功能網(wǎng)絡(luò)的上述方法、使用含有與生物分子自身相關(guān)信息的生物分子信息數(shù)據(jù)庫的上述方法、以及生成含有生物學(xué)事件信息相關(guān)的醫(yī)藥分子的分子功能網(wǎng)絡(luò)的上述方法。此外,根據(jù)本發(fā)明還可以提供一種推測方法,即通過使用儲存有直接結(jié)合的生物分子對的相關(guān)生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,對任意生物分子或者醫(yī)藥分子有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測的方法。并且,本發(fā)明還提供了當(dāng)生物分子是其他數(shù)據(jù)庫或者文獻(xiàn)中的基因所編碼的蛋白質(zhì)時,可以通過制成與該生物分子的分子略稱以及該基因名稱或ID或略稱相對應(yīng)的數(shù)據(jù)庫,使用分子功能網(wǎng)絡(luò)分析基因的多型性或者表達(dá)的信息的方法。
根據(jù)本發(fā)明的更優(yōu)選方案,可以提供根據(jù)網(wǎng)絡(luò)上的相互關(guān)聯(lián)、以成組的生物分子對數(shù)據(jù)為子網(wǎng)絡(luò)、之后,基于歸屬的子網(wǎng)絡(luò)以及子網(wǎng)絡(luò)間的包含關(guān)系將分子功能網(wǎng)絡(luò)層次化并且以此為特征的上述方法;還可以提供基于分子對的歸屬路徑名、歸屬子網(wǎng)絡(luò)名等把生物分子對相關(guān)信息層次化后加以保存,并且以此為特征的上述方法;基于基因群中的表達(dá)模式和到達(dá)細(xì)胞表面的模式等把生物分子自身相關(guān)信息層次化后保存,并以此為特征的上述方法;而且還能夠提供基于該生物學(xué)事件的上位概念進(jìn)行的分類和病態(tài)事件的關(guān)聯(lián)、把該事件相關(guān)信息層次化保存,并以此為特征的上述方法。并且,本發(fā)明還提供分別針對生物分子對相關(guān)的上位層次、生物分子自身相關(guān)的上位層次、生物學(xué)事件相關(guān)的上位層次的保存項目,保存項目間的關(guān)聯(lián)性和依存關(guān)系等的相關(guān)信息并以此為特征的上述方法;利用生物分子信息數(shù)據(jù)庫以及生物分子連鎖數(shù)據(jù)庫中保存的層次化信息,簡便地生成分子功能網(wǎng)絡(luò)并以此為特征的上述方法;利用生物分子信息數(shù)據(jù)庫以及生物分子連鎖數(shù)據(jù)庫中所保存的層次化信息對分子功能網(wǎng)絡(luò)所表現(xiàn)的詳細(xì)程度進(jìn)行控制并以此為特征的上述方法。
并且本發(fā)明提供如下所示的方法和數(shù)據(jù)庫。1.賦予生物學(xué)事件信息和生物分子關(guān)系的方法。2.和生物學(xué)事件信息有關(guān)系的分子功能網(wǎng)絡(luò)的生成方法。3.含有和生物學(xué)事件信息有關(guān)系的醫(yī)藥分子的功能網(wǎng)絡(luò)的生成方法。4.對任意生物分子有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測的方法。5.使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,對任意的生物分子直接或者間接相關(guān)的生物事件進(jìn)行推測的方法。6.使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,對任意的生物分子相關(guān)的分子功能網(wǎng)絡(luò)以及該分子直接或者間接相關(guān)的生物事件進(jìn)行推測的方法。7.在直接結(jié)合的生物分子對信息中補加與生物事件的發(fā)生直接相關(guān)的關(guān)鍵分子和它的靶標(biāo)生物分子對以及該生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫。8.含有源自關(guān)鍵分子的生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫。9.含有攜帶生物事件信息的關(guān)鍵分子的生物分子連鎖數(shù)據(jù)庫。10.通過生物分子連鎖數(shù)據(jù)庫的連接(connect)檢索得到的分子功能網(wǎng)絡(luò)。11.使用上述的7~9的任意一個生物分子連鎖數(shù)據(jù)庫,對任意生物分子相關(guān)的分子功能網(wǎng)絡(luò)和生物學(xué)事件進(jìn)行推測的方法。12.使用上述7~9的任意一個生物分子連鎖數(shù)據(jù)庫和醫(yī)藥分子連鎖數(shù)據(jù)庫,對任意生物分子或醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)和生物學(xué)事件進(jìn)行推測的方法。13.含有與生物學(xué)事件信息中的關(guān)鍵分子的量或者質(zhì)的變化相對應(yīng)的波動信息的上述1~12所記載的方法或者生物分子連鎖數(shù)據(jù)庫以及功能網(wǎng)絡(luò)。14.含有與生物學(xué)事件的信息中的關(guān)鍵分子的生成臟器和生物學(xué)事件的發(fā)生臟器信息的上述1~12所記載的方法或者生物分子連鎖數(shù)據(jù)庫以及功能網(wǎng)絡(luò)。15.含有與生物學(xué)事件的信息中的關(guān)鍵分子的量或者質(zhì)的變化相對應(yīng)的波動信息同時含有關(guān)鍵分子的生成臟器和生物學(xué)事件的發(fā)生臟器信息的上述1~12所記載的方法或生物分子連鎖數(shù)據(jù)庫以及功能網(wǎng)絡(luò)。16.通過保存直接結(jié)合的生物分子對和表明該結(jié)合關(guān)系的信息,制作與1個以上任意生物分子在功能上或生物合成上有直接或間接關(guān)系的分子功能網(wǎng)絡(luò)的方法。17.使用直接結(jié)合的生物分子對信息的集合,對與任意生物分子在功能上或生物合成上有直接或間接關(guān)系的關(guān)鍵分子進(jìn)行探索的方法。18.在權(quán)利要求17項中所記載的方法的基礎(chǔ)上對與任意生物分子有直接或間接關(guān)系的生物學(xué)事件進(jìn)行推測的方法。19.通過保存直接結(jié)合的生物分子對和表明該結(jié)合關(guān)系的信息,制作表示生物分子間在功能上或生物合成上的關(guān)系的分子功能網(wǎng)絡(luò)的方法。20.將直接結(jié)合的生物分子對和表明該結(jié)合關(guān)系的信息作為一部分保存起耒,通過連接檢索,制作與任意1個以上生物分子相關(guān)的分子功能網(wǎng)絡(luò)的方法。21.將直接結(jié)合的生物分子對和表明該結(jié)合關(guān)系的信息作為一部分保存起耒,通過連接檢索,找出與指定的1個以上的生物分子在生物合成上以及功能上有直接或間接關(guān)系的生物分子組的方法。22.基于與疾病相關(guān)的生物學(xué)事件群,對與該疾病相關(guān)的分子功能網(wǎng)絡(luò)進(jìn)行推測的方法。23.基于與疾病相關(guān)的生物學(xué)事件群,對與該疾病相關(guān)的分子功能網(wǎng)絡(luò)進(jìn)行推測,進(jìn)而推測可能的創(chuàng)新藥物靶點的方法。24.基于與疾病相關(guān)的生物學(xué)事件群,將與該疾病相關(guān)的分子功能網(wǎng)絡(luò)上的生物分子作為創(chuàng)新性藥物靶點時,對其副作用風(fēng)險進(jìn)行推測的方法。25.根據(jù)與某些疾病相關(guān)的分子功能網(wǎng)絡(luò)上的任意生物分子的功能調(diào)控,對生物學(xué)事件的波動進(jìn)行預(yù)測的方法。26.利用關(guān)鍵分子的量的變動和生物學(xué)事件的波動信息,輔助選定創(chuàng)新性藥物靶點的方法。27.上述26所記載的方法中所使用的生物分子連鎖數(shù)據(jù)庫。28.含有醫(yī)藥分子和靶標(biāo)生物分子對的信息的生物分子連鎖數(shù)據(jù)庫。29.添加有醫(yī)藥分子和靶標(biāo)生物分子的對信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫。30.使用添加有醫(yī)藥分子和靶標(biāo)生物分子對的信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫,對醫(yī)藥化合物的副作用風(fēng)險以及藥物間的相互作用進(jìn)行推測以及回避的方法。31.使用添加有醫(yī)藥分子和靶標(biāo)生物分子對的信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫,根據(jù)需要與基因多型的信息連接、對治療疾病的醫(yī)藥化合物進(jìn)行選擇和用量設(shè)定的方法。32.以生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)中的蛋白質(zhì)與基因數(shù)據(jù)庫連接為特征的上述1~31中所記載的方法或生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。33.以生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)和基因組序列相對應(yīng)的基因信息連接為特征的上述1~31中所記載的方法或生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。34.以生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)與每個臟器的蛋白的表達(dá)信息和相對應(yīng)的基因信息相連接為特征的上述1~31中的方法或生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。35.以生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)和與基因多型相關(guān)的基因的信息相連接為特征的上述1~31的方法以及生物分子功能網(wǎng)絡(luò)。36.以生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)與其他生物種的基因組以及基因序列相對應(yīng)的基因組或者基因信息相連接為特征的上述1~31的方法或者生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。37.利用由于使用醫(yī)藥分子而引起的特定臟器中蛋白表達(dá)的變動信息,對疾病的機制進(jìn)行推測的上述1~31的方法或者生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。38.為了分析特定疾病中常見的基因多型群的信息所使用的上述1~31的方法或生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。39.將生物分子對關(guān)系模式化,以此為特征的上述16~21的方法或生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。40.將生物學(xué)事件以模式化的形式表現(xiàn),以此為特征的上述1~31的方法或生物分子連鎖數(shù)據(jù)庫或分子功能網(wǎng)絡(luò)。41.將與關(guān)鍵分子的量變動相對應(yīng)的生物學(xué)事件的波動信息模式化,以此為特征的上述13~15的方法或生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。42.根據(jù)需要,將2個以上的生物分子作為一個假想生物分子對待,以此為特征的上述1~41所記載的方法或分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。43.將分散配置的1個以上的生物分子連鎖數(shù)據(jù)庫以通信手段加以利用,以此為特征的上述1~41所記載的方法或生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。44.以制作含有與生物學(xué)事件的表現(xiàn)直接相關(guān)的生物分子信息的數(shù)據(jù)庫,和并用不一定含有生物學(xué)事件信息的分子功能網(wǎng)絡(luò)的數(shù)據(jù)庫為特征的上述1~41的方法或生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。45.從不一定含有生物學(xué)事件信息的分子功能網(wǎng)絡(luò)數(shù)據(jù)庫中抽出與任意分子相關(guān)的部分分子功能網(wǎng)絡(luò),基于構(gòu)成該網(wǎng)絡(luò)的分子,對包含與生物學(xué)事件的表現(xiàn)直接相關(guān)的生物分子的方法的數(shù)據(jù)庫進(jìn)行檢索,以此為特征的上述1~41的方法或生物分子連鎖數(shù)據(jù)庫或者分子功能網(wǎng)絡(luò)。46.根據(jù)生成臟器或作用臟器等的信息,交叉(絞り込む)作為對象的生物分子或者生物分子對而得的生物分子連鎖數(shù)據(jù)庫或利用該數(shù)據(jù)庫作成的分子功能網(wǎng)絡(luò)或生成該分子功能網(wǎng)絡(luò)的方法。47.對生物分子功能數(shù)據(jù)庫進(jìn)行連接檢索,最終生成分子功能網(wǎng)絡(luò),根據(jù)各個網(wǎng)絡(luò)所含有的生物分子和生物學(xué)事件信息等將此網(wǎng)絡(luò)進(jìn)行再次交叉的方法或者交叉后得到的分子功能網(wǎng)絡(luò)。48.根據(jù)生成臟器以及作用臟器等的信息,使用以作為對象的生物分子或生物分子對交叉而得的生物分子連鎖數(shù)據(jù)庫,制成分子功能網(wǎng)絡(luò),根據(jù)各個網(wǎng)絡(luò)中所含有的生物分子或者生物學(xué)事件等的信息,將該網(wǎng)絡(luò)再次進(jìn)行交叉的方法或再交叉后生成的分子功能網(wǎng)絡(luò)。49.由實施上述1~48所記載方法的程序和數(shù)據(jù)庫組成的計算機系統(tǒng)。50.記錄上述1~48所記載的數(shù)據(jù)庫的計算機可以讀取的媒體。51.記錄上述1~48所記載的與分子功能網(wǎng)絡(luò)相關(guān)信息的計算機可讀取的媒體。52.記錄上述1~48所記載的數(shù)據(jù)庫和記錄實施上述1~48所記載的程序的計算機可讀取的媒體。53.使層次化的生物學(xué)事件信息和生物分子關(guān)聯(lián)的方法。54.與層次化的生物學(xué)事件信息相關(guān)聯(lián)的分子功能網(wǎng)絡(luò)的生成方法。55.以將生物分子對的信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。56.以將生物分子的集合狀態(tài)層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。57.與層次化保存的生物分子對的信息相對應(yīng)的生物學(xué)事件建立關(guān)聯(lián)的方法。58.與層次化保存的生物分子的集合狀態(tài)信息相對應(yīng)的生物學(xué)事件建立關(guān)聯(lián)的方法。59.以將基因群的轉(zhuǎn)錄信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。60.以將蛋白表達(dá)信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。61.對于數(shù)據(jù)庫中的任意數(shù)據(jù)項目,基于關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,基于該檢索結(jié)果生成分子功能網(wǎng)絡(luò)的方法。62.對于制成的分子功能網(wǎng)絡(luò),對于其中所含的生物分子、生物分子對、生物學(xué)事件的數(shù)據(jù),根據(jù)關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,從而得到該網(wǎng)絡(luò)部分集合的方法。63.對制成的分子功能網(wǎng)絡(luò),對于其中所含的生物分子、生物分子對、生物學(xué)事件的數(shù)據(jù),根據(jù)關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,強調(diào)表示該生物分子、生物分子對、生物學(xué)事件的方法。
圖的簡單說明
圖1是表示本發(fā)明方法的基本概念的圖。
圖2是表示本發(fā)明的方法用于醫(yī)藥分子連鎖數(shù)據(jù)庫時的概念的圖。
圖3是表示本發(fā)明的方法用于遺傳信息數(shù)據(jù)庫時的概念的圖。
圖4是表示在實施例1中作為對象的腎素-血管緊張素系統(tǒng)的概念的圖。
圖5表示的是實施例1中的生物分子信息數(shù)據(jù)庫內(nèi)容的圖。
圖6表示的是實施例1中的生物分子連鎖數(shù)據(jù)庫內(nèi)容的圖。
圖7表示的是通過有關(guān)實施例1中的生物分子的檢索得到的分子功能網(wǎng)絡(luò)圖。用于提問的生物分子和生物學(xué)事件用粗體表示。
圖8是表示實施例1中的醫(yī)藥分子信息數(shù)據(jù)庫的內(nèi)容的圖。
圖9是表示實施例1中的醫(yī)藥分子連鎖數(shù)據(jù)庫的內(nèi)容的圖。
圖10是表示通過有關(guān)實施例1中的醫(yī)藥分子的檢索所得到的分子功能網(wǎng)絡(luò)的圖。用于提問的醫(yī)藥分子和生物學(xué)事件用粗體表示。
圖11是表示實施例2中的分子功能網(wǎng)絡(luò)檢索·表示程序的流程圖。
圖12是表示實施例2中的連接檢索(1點指定)的輸入項目的圖。
圖13是表示實施例2中的連接檢索(2點指定)的輸入項目的圖。實施發(fā)明的最佳狀態(tài)在本說明書中用語的意思及其定義如下所釋。
“生物”其概念包含例如細(xì)胞器、細(xì)胞、組織、臟器、生物個體以及集合體等、寄生在生物上的生命體。
“生物學(xué)事件”的概念包括在生物中的內(nèi)因以及外因所表現(xiàn)的所有現(xiàn)象、應(yīng)答、反應(yīng)、癥狀。具體的例子如轉(zhuǎn)錄、細(xì)胞游走、細(xì)胞接觸附著、細(xì)胞分裂、神經(jīng)回路興奮、血管收縮、血壓上升、血糖下降、發(fā)熱、痙攣、通過異種生物以及病毒等寄生物的感染及其他。此外,對于生物外部的如光和熱等物理性刺激的反應(yīng)也包含在生物學(xué)事件的概念當(dāng)中。
“病態(tài)事件”是包含在“生物學(xué)事件”中的概念?!吧飳W(xué)事件”超過了量和質(zhì)上的某一閾值,即可判斷為到了疾病或者病態(tài)的狀態(tài)。例如血壓上升的“生物學(xué)事件”異常亢進(jìn)導(dǎo)致的“病態(tài)事件”就是高血壓或者高血壓癥,血糖不能控制在正常范圍的“病態(tài)事件”即為高血糖或者糖尿病。此外,不僅有與上述例示的單一生物學(xué)事件相關(guān)的病態(tài)事件,還有與多種生物學(xué)事件相關(guān)的病態(tài)事件。
“生物分子”指的是在生物中存在的核酸、蛋白質(zhì)、脂質(zhì)、糖、一般小分子化合物及其它結(jié)構(gòu)的有機分子以及其集合體,也包括金屬離子、水、質(zhì)子(proton)。
“關(guān)鍵分子”主要指的是在生物分子中,介質(zhì)、激素、神經(jīng)遞質(zhì)、自體有效物質(zhì)等的分子群。已知,在大多數(shù)情況下,在體內(nèi)存在特定的靶標(biāo)生物分子,與該分子之直接結(jié)合是上述“生物學(xué)事件”的導(dǎo)火索。這些分子在生物內(nèi)生成后發(fā)揮作用,一般情況下,從生物系統(tǒng)外部給予時,會發(fā)生與其量相對應(yīng)的生物學(xué)事件。具體的例子有腎上腺素、血管緊張素II、胰島素、雌激素等。
“靶標(biāo)生物分子”指的是介質(zhì)、激素、神經(jīng)遞質(zhì)、自體有效物質(zhì)等生物分子以及醫(yī)藥分子的受體這樣的特定分子。通過直接結(jié)合引發(fā)特定的生物學(xué)事件。
“生物學(xué)事件的波動信息”指的是與關(guān)鍵分子或者靶標(biāo)生物分子的量變或者質(zhì)變相對應(yīng)的生物學(xué)事件的亢進(jìn)、上升或者低下·減少等的信息。也包括當(dāng)關(guān)鍵分子的量超過一定的閾值時初次引起的該生物學(xué)事件的情況。
“分子略號”是以識別或指定分子為目的的分子名稱的代稱。它必須與各個分子單一對應(yīng)??梢允欠肿用Q縮短的略稱,也可以是和分子名稱無關(guān)的英文數(shù)字以及短的文字。對于已經(jīng)有在世界上使用的分子略號的分子,希望仍使用該分子略號。對于一個分子根據(jù)不同的方式可賦予多個略號的,可以根據(jù)結(jié)構(gòu)基團和功能等進(jìn)行層次化。
“直接結(jié)合”指的是不通過共價結(jié)合而是通過分子間的作用力形成或有可能形成穩(wěn)定的復(fù)合體的情況。有時會有少見的以共價的形式結(jié)合,這種情況也包括在這個概念中。大多數(shù)情況下稱為“相互作用”,相互作用這種稱法含有更廣的含義。
“生物分子對”指的是在生物中能夠直接結(jié)合或推測為直接結(jié)合的一對生物分子。具體的例子有雌二醇和雌激素受體、血管緊張素轉(zhuǎn)換酶和血管緊張素I等。在酶反應(yīng)中當(dāng)酶和生成物作為分子對時,不能認(rèn)為這個復(fù)合體是穩(wěn)定的,但也包括在生物分子對中。此外,例如像用雙雜交的試驗方法確定有相互作用的這樣的2個蛋白質(zhì)分子,雖然對二者的相互作用還不明確,也可以包括在生物分子對的范疇中。對于光、聲音、溫度變化、磁場、重力、壓力、振動等來自生物外部的物理化學(xué)刺激,也可以把這些刺激看作假想的生物分子,定義為與相應(yīng)的靶標(biāo)生物分子的生物分子對。
“結(jié)構(gòu)編碼”指的是生物分子表明DNA類、RNA類、蛋白質(zhì)類、肽類、一般小分子類等的結(jié)構(gòu)特征的分類編碼。
“功能編碼”是表明生物分子的分子水平功能的分類編碼。例如“結(jié)構(gòu)編碼”為“蛋白質(zhì)”這樣的生物分子時,表示膜受體、核內(nèi)受體、轉(zhuǎn)運蛋白、介質(zhì)、水解酶、磷酸化酶、脫磷酸化酶等分類。當(dāng)“結(jié)構(gòu)編碼”為小分子類的生物分子時,表示底物、生成物、前體、活性肽、代謝產(chǎn)物等分類。
“關(guān)系編碼”指的是表示構(gòu)成生物分子對的2個分子間的關(guān)系的分類編碼。例如象激動劑和受體是10,酶和底物是21,底物和生成物是22這樣進(jìn)行的類型化。例如用雙雜交的試驗方法確定有相互作用但是對于2個分子間的相互作用還不清楚的的2個蛋白,希望使用能夠區(qū)別該本質(zhì)的編碼。
“關(guān)系功能編碼”是表示和構(gòu)成生物分子對的2個分子的直接結(jié)合相伴隨產(chǎn)生的現(xiàn)象和變化的分類編碼。例如采用水解、磷酸化、脫磷酸化、活化、失活等分類。
“可靠性編碼”是表示每個生物分子對直接結(jié)合的可靠性水平和作為直接結(jié)合根據(jù)的實驗方法等的編碼。
“連接檢索”指的是指定1個以上任意生物分子或者生物學(xué)事件,對包含其的在功能上或生物合成上相關(guān)分子的關(guān)聯(lián)進(jìn)行自動搜索。
“分子功能網(wǎng)絡(luò)”指的是使用生物分子連鎖數(shù)據(jù)庫,指定1個以上任意的生物分子或者生物學(xué)事件,通過連接檢索得到的功能上或生物合成上相互關(guān)聯(lián)的分子的關(guān)系網(wǎng)。
“醫(yī)藥分子”指的是作為醫(yī)藥制造的用于治療的化合物分子。包括用于醫(yī)學(xué)、藥學(xué)研究的化合物和專利說明書及文獻(xiàn)所記載的化合物等生理活性已知的化合物。
“生物學(xué)事件信息和賦予關(guān)系”指的是某些生物學(xué)事件發(fā)生時,所呈現(xiàn)或發(fā)現(xiàn)的某些生物分子或者醫(yī)藥分子或遺傳信息或分子功能網(wǎng)的相關(guān)情況。
“模式化”指的是對生物分子、生物分子對、生物學(xué)事件等相關(guān)的信息進(jìn)行數(shù)據(jù)庫記錄時,不是原封不動的記錄所得到的信息,而是按照事先規(guī)定的種類對該信息進(jìn)行分類,用表示該種類的記號表示該信息。上述的“結(jié)構(gòu)編碼”、“功能編碼”、“關(guān)系編碼”、“關(guān)系功能編碼”所舉的例子即為模式化的例子。
“生成臟器”指的是生成生物分子的臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
“存在臟器”指的是儲存生成后的生物分子臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
“作用臟器”指的是生物分子或關(guān)鍵分子在引發(fā)生物學(xué)事件的臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
作為本發(fā)明的1個實施方案,提供了以下方法(圖1)。首先,制作儲存有直接結(jié)合的2個生物分子對相關(guān)信息的“生物分子連鎖數(shù)據(jù)庫”。生物分子分子略號的賦予等、生物分子自身相關(guān)的信息也可以包含在該數(shù)據(jù)庫中,但最好用別的數(shù)據(jù)庫-“生物分子信息數(shù)據(jù)庫”進(jìn)行。接著,從上述的“生物分子連鎖數(shù)據(jù)庫”中,指定1個以上任意分子,進(jìn)行連接檢索,由此得到表現(xiàn)1個以上生物分子的功能上或者生物合成上關(guān)聯(lián)的“分子功能網(wǎng)絡(luò)”。
通過對與生物分子對中,至少是關(guān)鍵分子和它的靶標(biāo)生物分子組成的生物分子對,相對應(yīng)的生物學(xué)事件的信息賦予關(guān)聯(lián)關(guān)系,與“分子功能網(wǎng)絡(luò)”一起,可以對分子功能網(wǎng)絡(luò)中的與該分子有直接或間接關(guān)系的生物學(xué)事件進(jìn)行推測。在此基礎(chǔ)上,補加關(guān)鍵分子的量或者質(zhì)的變動和生物學(xué)事件的波動關(guān)系的信息,對分子功能網(wǎng)絡(luò)的任意分子的量或者質(zhì)的變動引發(fā)的生物學(xué)事件的亢進(jìn)、上升或者抑制、低下等進(jìn)行推測。
“生物分子信息數(shù)據(jù)庫”的主要作用是對相應(yīng)于各個生物分子的正式名稱的分子略號或者ID進(jìn)行定義,此外保留生物分子自身的必要信息。例如對分子名稱、分子代號、結(jié)構(gòu)編碼、功能編碼、生物種類、生成臟器、存在臟器等相關(guān)的信息進(jìn)行保存。此外,即使對試驗中尚未分離和確證存在的分子,例如,也可以對從其他生物種的試驗推測存在的分子給于假定的分子略號的其他信息,并進(jìn)行定義。
“生物分子信息數(shù)據(jù)庫”也可以包含和各個生物分子的氨基酸序列和結(jié)構(gòu)相關(guān)的信息,但最好將該信息在序列數(shù)據(jù)庫和結(jié)構(gòu)數(shù)據(jù)庫中另外保存,根據(jù)需要用分子代號進(jìn)行取用。對于生物分子中的低分子量物質(zhì),根據(jù)需要為了能在分子功能網(wǎng)絡(luò)的展示中添加物質(zhì)的化學(xué)結(jié)構(gòu),不僅要把正式的分子名稱,還要把表示化學(xué)結(jié)構(gòu)的相應(yīng)數(shù)據(jù)保存在生物分子信息數(shù)據(jù)庫或者另外的數(shù)據(jù)庫中。
2個以上的生物分子的多聚體或者集合體具有活性或者功能等,將多個生物分子集中對待比較方便時,可以將其定義為1個假想的生物分子,賦以分子略號,在“生物分子信息數(shù)據(jù)庫”中登記。這種場合,在各種組成分子已知的情況下,也可以分別為其賦以分子略號進(jìn)行登記,在假想生物分子的記錄中建立記述組成分子的分子略號文件。在不明由何種生物分子構(gòu)成的情況下,也可以作為集體,對具有特定功能的假想的生物分子進(jìn)行定義,用于生物分子對的定義中。
此外,生物分子由2個以上的結(jié)構(gòu)域組成,并且由于它們各自具有不同的功能,需要對各個結(jié)構(gòu)域獨立對待更好時,也可以將各個結(jié)構(gòu)域作為獨立的分子進(jìn)行處理。例如和原始的生物分子一起,將各個結(jié)構(gòu)域賦以分子略號,在生物分子信息數(shù)據(jù)庫中登記。在最初的生物分子記錄中,建立記述分開的結(jié)構(gòu)域的分子略號文件,對1個生物分子具有2個以上不同功能進(jìn)行記述。不是基因的基因組序列上的特定序列,具有某些功能或者可以通過特定的生物分子識別時,可以將該序列部分作為獨立的生物分子對待,賦以分子略號,用于生物分子對的定義中。
生物分子對的信息保存在“生物分子連鎖數(shù)據(jù)庫”中。每個生物分子對收錄了組成該分子對的2個生物分子的分子略號、關(guān)系編碼、關(guān)系功能編碼、可靠性編碼、生物學(xué)事件、作用臟器、共作用分子以及其他附加信息等。對于關(guān)鍵分子和它的目標(biāo)生物分子的分子對,最好盡量輸入生物學(xué)事件、兩分子的量或者質(zhì)的變動引起的生物學(xué)事件波動的信息、病態(tài)事件等的信息。對于關(guān)鍵分子以外的生物分子對,當(dāng)存在與該生物分子對的表達(dá)直接相關(guān)的生物學(xué)事件或者病態(tài)事件時,要求將該生物學(xué)事件和病態(tài)事件輸入保存。作為關(guān)鍵分子的量或者質(zhì)的變動相對應(yīng)的生物學(xué)事件波動信息,可以是例如,和正常范圍相比,當(dāng)關(guān)鍵分子增加時,生物學(xué)事件產(chǎn)生單純的亢進(jìn)或者低下等的信息。1種酶催化2種以上的底物進(jìn)行反應(yīng),分別生成不同的反應(yīng)生成物時,要附加指定酶、底物和反應(yīng)生成物的關(guān)系的表現(xiàn)。
由于“生物分子信息數(shù)據(jù)庫”和“生物分子連鎖數(shù)據(jù)庫”的內(nèi)容和組成不同,在本說明書中作為概念上分別獨立的數(shù)據(jù)庫對待。從本發(fā)明的宗旨出發(fā),當(dāng)然也可以將2者合并為1個含有2種數(shù)據(jù)的數(shù)據(jù)庫?!吧锓肿有畔?shù)據(jù)庫”和“生物分子連鎖數(shù)據(jù)庫”也可分別2有個以上,此時,可以根據(jù)各個數(shù)據(jù)庫進(jìn)行適當(dāng)?shù)倪x擇或者結(jié)合使用。例如用特定的檔案進(jìn)行區(qū)別,不同生物種數(shù)據(jù)可以同時保存在“生物分子信息數(shù)據(jù)庫”和“生物分子連鎖數(shù)據(jù)庫”中,也可以將人和鼠分別制作不同的數(shù)據(jù)庫進(jìn)行保存。
“關(guān)系編碼”可以輸入成構(gòu)成該生物分子對的2個分子如拮抗劑和受體、酶和底物這樣的單詞。但最好用代表拮抗劑和受體關(guān)系的10,酶和底物關(guān)系的21、酶和生成物關(guān)系的22的方法進(jìn)行類型化輸入。此外,“關(guān)系功能編碼”可以方便的采用水解、磷酸化、脫磷酸化、活化、失活等功能分別加以保存的方法,但最好也進(jìn)行類型化輸入。
不僅有酶和底物那樣相互關(guān)系明確的情況,也有例如用雙雜交的試驗方法證明有蛋白-蛋白相互作用的2個蛋白分子,二者的相互作用機制不明確的情況。對包括這樣的生物分子對進(jìn)行連接檢索時,根據(jù)組成生物分子對的2個分子是否有方向性而區(qū)別對待比較方便。對于各個生物分子對,最好采用能區(qū)別屬于哪種情況的關(guān)系編碼。前者的情況下,對于作用方向確定的分子對的表現(xiàn)中,在進(jìn)行檢索時只要考慮2個分子的輸入順序,在后者的情況下,檢索時還要考慮作用方向不明的相反方向的關(guān)系。
直接結(jié)合的生物分子對信息包括通過試驗明確證明的和假定的生物分子對等多種情況。此外,通過試驗法,由于存在假陽性,也會產(chǎn)生錯誤的生物分子對。這時,可以附加表示各個生物分子對的信息可靠性水平和試驗方法的“可靠性編碼”。在檢索生成的分子功能網(wǎng)絡(luò)過多的情況下,可以組合使用這個編碼。
生物分子如果除了持有生成臟器的信息以外、還持有儲存生物分子的存在臟器以及作用臟器的信息,那么,生成分子功能網(wǎng)絡(luò)時,例如,很容易表現(xiàn)臟器生成的分子到達(dá)細(xì)胞外部后與其它細(xì)胞膜上的靶標(biāo)生物分子在細(xì)胞外發(fā)生作用的現(xiàn)象。最好將生物分子的生成臟器和存在臟器的信息輸入到“生物分子信息數(shù)據(jù)庫”中,將作用臟器的信息輸入到“生物分子連鎖數(shù)據(jù)庫”中。這樣,不必限定于對生成臟器、存在臟器、作用臟器的記述,也可以包括組織、臟器或者臟器內(nèi)的部位、臟器或者組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等的信息。
證實直接結(jié)合的試驗和推測的方法、生物學(xué)事件的種類、關(guān)鍵分子的量的變動相對應(yīng)的生物學(xué)事件波動、細(xì)胞內(nèi)的部位和組織、臟器、臟器內(nèi)的部位的表現(xiàn),只要簡單,任何一種都可以用。推薦使用進(jìn)行類型化、變換成短的英文數(shù)字記號等方法。如果用同義詞詞典進(jìn)行定義,可以用同義詞同時進(jìn)行處理,這樣可使輸入的錯誤最小化。
以下所示的是由“生物分子連鎖數(shù)據(jù)庫”生成“分子功能網(wǎng)絡(luò)”時進(jìn)行“連接檢索”的概念。本發(fā)明的“連接檢索”只要能夠?qū)崿F(xiàn)這個概念,使用任何方法都可以。例如可以利用Sedgewick的“運算法則C(近代科學(xué)社、1996)”的第29章中所記錄的“深入優(yōu)先探索”的運算法則等。
用分子略號a~z表示生物分子,用(n,m)的形式表示由生物分子組成的各個生物分子對,在生物分子連鎖數(shù)據(jù)庫中按照下面的表示方法表示生物分子對的集合。(a,c)(a,g)(b,f)(b,k)(c,j)(c,r)(d,v)(d,y)(e,k)(e,s)(g,u)(j,p)(k,t)(k,y)(p,q)(p,y)(x,z)用連接檢索,例如指定生成含有c和e的分子功能網(wǎng)絡(luò),會對共同擁有分子對中的一個分子的分子對(c,j)(j,p)(p,y)(y,k)(k,e)逐個搜索。得到分子c、j、p、y、k、e關(guān)聯(lián)的c j p y k e分子功能網(wǎng)絡(luò)。
在所得到的“分子功能網(wǎng)絡(luò)”的基礎(chǔ)上,按照下面的方法對生物學(xué)事件進(jìn)行推測。生物分子e是關(guān)鍵分子,當(dāng)擁有該生物學(xué)事件E的信息時,能夠推測生物分子c、j、p、y、k與發(fā)生生物學(xué)事件E的直接或間接關(guān)系。此外,例如當(dāng)分子e減少、產(chǎn)生E的表達(dá)亢進(jìn)的生物學(xué)事件的波動信息時,可以對(c,j)(j,p)(p,y)(y,k)(k,e)的關(guān)系分別加以考慮,推測c、j、p、y、k中任意分子的量或者質(zhì)的變動對生物學(xué)事件E發(fā)生的影響。
并且,在從某個生物分子到關(guān)鍵分子的分子功能網(wǎng)絡(luò)中有N個生物分子,這些生物分子對生物學(xué)事件發(fā)生量QE的影響可以通過下面的式子進(jìn)行預(yù)測。這里的Si是第i個生物分子的狀態(tài)的質(zhì)的評價值,Ri是表示第i個生物分子的量的值,Vi是表示第i個生物分子的存在環(huán)境的評價值,f是擁有3×N個輸入值的多價函數(shù)。
QE=f(S1,R1,V1,...SN,RN,VN)1個分子功能網(wǎng)絡(luò)所關(guān)聯(lián)的生物學(xué)事件不限定為1種,此外,可以推斷出1種生物分子事件所關(guān)聯(lián)的分子功能網(wǎng)絡(luò)有數(shù)個,可將與生物學(xué)事件的一方面有關(guān)聯(lián)的分子功能網(wǎng)絡(luò)交叉。例如指定1個以上的生物分子生成“分子功能網(wǎng)絡(luò)”的情況下,生成含有很多生物分子的“分子功能網(wǎng)絡(luò)”時,有可能添加生物學(xué)事件信息,“分子功能網(wǎng)絡(luò)”的范圍有所交叉。當(dāng)然,以任何一個介質(zhì)分子或和該分子的靶標(biāo)分子的關(guān)系作為條件,也可以生成“分子功能網(wǎng)絡(luò)”。
此外,對“生物分子連鎖數(shù)據(jù)庫”的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆指?,或者增加篩選程序,或者抽出部分集合,或者進(jìn)行層次化,都能生成必要范圍的分子功能網(wǎng)絡(luò)。分割和增加篩選程序和抽出部分集合可以通過對本發(fā)明數(shù)據(jù)庫特有的數(shù)據(jù)項目的檢索、采用關(guān)鍵詞的一般性文字檢索、相對于氨基酸序列、或者核酸序列的相同性檢索、化學(xué)結(jié)構(gòu)式的部分結(jié)構(gòu)檢索等檢索方法進(jìn)行。事先對“生物分子連鎖數(shù)據(jù)庫”或者“生物分子情報數(shù)據(jù)庫”進(jìn)行這些檢索,可以生成加以限定的分子功能網(wǎng)絡(luò)和賦以特征的分子功能網(wǎng)絡(luò)。例如使用生成臟器和作用臟器的信息,從在肝臟生成的生物分子,在皮膚引發(fā)生物學(xué)事件的角度出發(fā),制作交叉的部分?jǐn)?shù)據(jù)庫,采用連接檢索,可以生成限定范圍的“分子功能網(wǎng)絡(luò)”。此外,針對通過連接檢索所生成的分子功能網(wǎng)絡(luò),對其中包含的生物分子或者生物分子對進(jìn)行上述的檢索,通過分割、篩選程序和抽出部分集合,又可以生成含有所希望特征的分子功能網(wǎng)絡(luò)和所希望范圍的分子功能網(wǎng)絡(luò)。這樣限定和賦以特征,不僅方便檢索,而且在分子功能網(wǎng)絡(luò)上可以對特定的生物分子群和生物分子對進(jìn)行強調(diào)表示,有助于有效地理解分子功能網(wǎng)絡(luò)。
“生物分子連鎖數(shù)據(jù)庫”的分割、篩選程序和抽出部分集合,可根據(jù)網(wǎng)絡(luò)的關(guān)聯(lián)視情況進(jìn)行,保存并利用表示該包含關(guān)系的信息,可以使“分子功能網(wǎng)絡(luò)”進(jìn)行層次化。即使含有一部分尚未闡明的分子和分子間的關(guān)系,也可以將其整理收集作為1個假想的生物分子與其他分子作為分子對進(jìn)行定義,進(jìn)而生成假定的分子功能網(wǎng)絡(luò)。當(dāng)所含的分子數(shù)目過多,生成的網(wǎng)絡(luò)過于復(fù)雜時,可以在網(wǎng)絡(luò)上將連接的2個以上的生物分子群定義為假定的1個生物分子,實現(xiàn)網(wǎng)絡(luò)的簡化。
通過這樣利用層次化,可以實現(xiàn)連接檢索的高速化,還可以對網(wǎng)絡(luò)展示的詳細(xì)程度進(jìn)行調(diào)節(jié),適當(dāng)?shù)幕乇苓^度復(fù)雜。在本說明書中,把在網(wǎng)絡(luò)上連接的由2個以上的生物分子對組成的部分網(wǎng)絡(luò)稱為“子網(wǎng)絡(luò)”。
可以指定任意部分的網(wǎng)絡(luò)作為子網(wǎng)絡(luò),優(yōu)選代謝系統(tǒng)中的TCA循環(huán)和磷酸戊糖循環(huán)這樣研究人員所熟知的級聯(lián)反應(yīng)、途徑、循環(huán)等作為子網(wǎng)絡(luò)更為便利。此外,即使某些子網(wǎng)絡(luò)包含有其他的子網(wǎng)絡(luò)也可以,例如代謝系統(tǒng)自身可以視為是含有多個子網(wǎng)絡(luò)的上位子網(wǎng)絡(luò)。
也有把各個子網(wǎng)絡(luò)作為一個假想生物分子的處理方法,但將與構(gòu)成子網(wǎng)絡(luò)的生物分子對和子網(wǎng)絡(luò)階層相關(guān)的信息保存在“生物分子連鎖網(wǎng)絡(luò)”中更為方便。此外在“生物分子連鎖網(wǎng)絡(luò)”中建立表示子網(wǎng)絡(luò)的上位數(shù)據(jù)層,也可以在此處對該子網(wǎng)絡(luò)的信息加以保存。生物分子對的子網(wǎng)絡(luò)的層次化不限定為2層,將多個子網(wǎng)絡(luò)的集合保存為上位子網(wǎng)絡(luò)也可以。在生成分子功能網(wǎng)絡(luò)時,為了便于每個分子對的數(shù)據(jù)和上位階層的子網(wǎng)絡(luò)之間的相互參照,最好將表示每個分子對的數(shù)據(jù)與各個子網(wǎng)絡(luò)數(shù)據(jù)之間的相互關(guān)聯(lián)的信息進(jìn)行歸納。即使1個分子對與多個子網(wǎng)絡(luò)有關(guān)也沒有關(guān)系。
優(yōu)選地,層次化的“生物分子連鎖數(shù)據(jù)庫”的子網(wǎng)絡(luò)數(shù)據(jù)中,不僅要求含有和下位階層的生物分子對的關(guān)聯(lián),而且還要含有子網(wǎng)絡(luò)間的相互關(guān)聯(lián)的信息。例如在代謝體系中,糖解系統(tǒng)和TCA循環(huán)是連續(xù)作用的子網(wǎng)絡(luò),可以將這些子網(wǎng)絡(luò)間的關(guān)系在上位階層中作為“對”的關(guān)系保存起來。這種情況下,優(yōu)選地,不僅要求有子網(wǎng)絡(luò)對的信息,而且要求添加作為子網(wǎng)絡(luò)間的連接點的生物分子的信息。
此外,本發(fā)明的特征是除網(wǎng)絡(luò)可層次化外,生物分子本身也能層次化,可以將此信息保存在“生物分子信息數(shù)據(jù)庫”中而加以利用。為了快速檢索和方便多樣地展示網(wǎng)絡(luò),最好將生物分子的信息和生物分子對的信息雙方都進(jìn)行層次化。把生物分子作為層次化的對象,舉例如下。在生物分子中,多種不同的分子特異聚集后會表現(xiàn)出某些功能。很多時候分子聚集狀態(tài)的差別會控制功能展現(xiàn)的狀態(tài)和類型。此外,以免疫細(xì)胞等為例,有時,細(xì)胞表面表達(dá)的多個分子的組合,控制著和生物學(xué)事件的關(guān)聯(lián)和細(xì)胞的功能。這種情況下,可以采用將上述的分子集合狀態(tài)假定為1個假想的生物分子的處理方法。其他的方法還有,為了表示“生物分子信息數(shù)據(jù)庫”中的分子集合狀態(tài),可以建立上位數(shù)據(jù)層,并將該集合狀態(tài)的信息收集于此。優(yōu)選地,在生成分子功能網(wǎng)絡(luò)時,為了便于生物分子數(shù)據(jù)和上位階層數(shù)據(jù)進(jìn)行相互參照,可以將表示生物分子數(shù)據(jù)和上位階層數(shù)據(jù)關(guān)聯(lián)的信息分別進(jìn)行歸納。即使1個生物分子和多個上位階層數(shù)據(jù)相關(guān)也沒有關(guān)系。
有很多和特定生物分子對沒有相互關(guān)聯(lián)的生物學(xué)事件、病態(tài)事件。例如生物學(xué)事件、病態(tài)事件和某些子網(wǎng)絡(luò)的形成之間的關(guān)系已經(jīng)清楚,但該事件的直接的生物分子對尚有未知的情況。在這樣的情況下,利用上述生物分子對數(shù)據(jù)的層次化,可以將生物學(xué)事件和病態(tài)事件和生物分子對的上位階層的子網(wǎng)絡(luò)的數(shù)據(jù)聯(lián)系起來,對該事件和生物分子網(wǎng)絡(luò)的關(guān)系進(jìn)行記述。
此外,某些生物學(xué)事件、病態(tài)事件的發(fā)生和特定分子的集合狀態(tài)、到達(dá)細(xì)胞表面的特定分子的表達(dá)狀態(tài)相關(guān)的情況下,利用上述分子集合狀態(tài)和分子表達(dá)狀態(tài)的層次化,將生物學(xué)事件、病態(tài)事件和分子集合狀態(tài)以及分子表達(dá)狀態(tài)的階層數(shù)據(jù)聯(lián)系起來,可以對該事件和生物分子網(wǎng)絡(luò)的關(guān)系進(jìn)行記述。
另外,也存在某些生物學(xué)事件、病態(tài)事件和特定的生物分子對和子網(wǎng)絡(luò)沒有任何關(guān)聯(lián)的相關(guān)的情況。作為這樣的例子,炎癥性細(xì)胞因子的游離、白細(xì)胞向組織的浸潤、毛細(xì)血管的通透性提高等各種各樣的生物學(xué)事件組合在一起引起了“炎癥”這種病態(tài)事件。為了處理這樣的事件,將生物學(xué)事件、病態(tài)事件層次化,在下位階層中記述與生物分子對和子網(wǎng)絡(luò)相關(guān)的事件,最好在上位階層中對與下層事件相關(guān)而引起的事件進(jìn)行記述。這樣的層次化中,即使使用包括2個層次以上的層次構(gòu)造也沒有關(guān)系。為了便于各個階層間的事件進(jìn)行相互參照,最好在各個階層的事件數(shù)據(jù)中收集表示上下階層的數(shù)據(jù)關(guān)聯(lián)的信息。這樣,通過對生物學(xué)事件、病態(tài)事件的信息進(jìn)行層次化,也可以記述對特定的生物分子對和子網(wǎng)絡(luò)沒有直接關(guān)系的事件與分子功能網(wǎng)絡(luò)的關(guān)系。
如上所示,對“生物分子信息數(shù)據(jù)庫”以及“生物分子連鎖數(shù)據(jù)庫”的數(shù)據(jù)進(jìn)行層次化,并且保存起來,可以有效的生成多種用途的分子功能網(wǎng)絡(luò)。
為了對在糖解體系中存在的某些生物分子(分子A)和某些激酶級聯(lián)反應(yīng)中存在的某些蛋白(分子B)的關(guān)聯(lián)進(jìn)行研究,采用未層次化數(shù)據(jù)的方法時,必須要以巨大數(shù)目的分子對為對象進(jìn)行連接檢索,分子A和分子B之間的路徑很長的情況下,這種檢索事實上不可能實現(xiàn)。一方面,若采用層次化的數(shù)據(jù),對“糖解系統(tǒng)”這個子網(wǎng)絡(luò)和“某些激酶級聯(lián)”這個子網(wǎng)絡(luò)之間的關(guān)聯(lián)在子網(wǎng)絡(luò)上位階層進(jìn)行連接檢索,在發(fā)現(xiàn)上位階層的路徑時,根據(jù)需要可以在路徑上的各子網(wǎng)絡(luò)的下位階層進(jìn)行連接檢索。這樣一來,通過把路徑探索問題分割成不同階層的問題,可以生成在不采用層次化時不可能生成的分子功能網(wǎng)絡(luò)。
另外,上述利用層次化數(shù)據(jù)進(jìn)行連接檢索中,需要頻繁的參照特定的子網(wǎng)絡(luò)時,可以在該子網(wǎng)絡(luò)內(nèi)部先進(jìn)行連接檢索,將該子網(wǎng)絡(luò)內(nèi)部的分子功能網(wǎng)絡(luò)信息保存下來。通過這樣的處理,能夠更有效率的生成完整的分子功能網(wǎng)絡(luò)。
另外,例如生成和“炎癥”這樣的病態(tài)事件相關(guān)的分子功能網(wǎng)絡(luò)時,可以對“炎癥”上位階層事件相關(guān)的下位階層事件進(jìn)行探索,從該下位階層事件相關(guān)的生物分子對或者子網(wǎng)絡(luò)出發(fā),進(jìn)行連接檢索,進(jìn)而可以生成包括范圍更廣的分子功能網(wǎng)絡(luò)。
如上所述,根據(jù)本發(fā)明從生物分子間的直接結(jié)合關(guān)系信息出發(fā),可以生成和任意分子相關(guān)的分子功能網(wǎng)絡(luò)。更加容易對直接或者間接相關(guān)的生物學(xué)事件和病態(tài)事件進(jìn)行推測。此外,本發(fā)明的另外一方面,從以疾病為特征而表現(xiàn)的生物學(xué)事件和病態(tài)事件、生物分子的量變化等知識出發(fā),對和疾病關(guān)聯(lián)可能性高的分子功能網(wǎng)絡(luò)進(jìn)行選擇,將其用于推測疾病的分子機制的目的。此外,根據(jù)本發(fā)明,有可能構(gòu)成在特定的疾病和癥狀的治療中,阻斷網(wǎng)絡(luò)的哪個過程有效,網(wǎng)絡(luò)中的哪個分子作為創(chuàng)新性藥物靶點(醫(yī)藥開發(fā)中作為標(biāo)靶的蛋白質(zhì)或者其他生物分子)有希望,根據(jù)創(chuàng)新性藥物靶點可以預(yù)想到的副作用有哪些?在回避這些副作用方面用哪種檢測(assay)體系來進(jìn)行候選開發(fā)藥物的篩選等提供創(chuàng)新藥物的戰(zhàn)略。
醫(yī)藥分子通常在體內(nèi)和以蛋白質(zhì)為主的生物大分子相結(jié)合,通過調(diào)控其功能發(fā)揮藥理活性。對這些分子的作用進(jìn)行了比生物分子的作用更為詳細(xì)的研究,在對象疾病的分子機理的闡明中起作用。在這里,著眼于將允許制造的用于醫(yī)療的醫(yī)藥分子和藥理學(xué)研究等的藥物分子及其靶標(biāo)生物分子的成對關(guān)系添加到上述的生物分子以及生物分子間的信息中,由此提高本發(fā)明方法的有用性。靶標(biāo)生物分子在大多數(shù)情況下是被蛋白質(zhì)或者糖等修飾的蛋白質(zhì)。從含有靶標(biāo)生物分子的分子功能網(wǎng)絡(luò)出發(fā)可以對與副作用有關(guān)的生物學(xué)事件進(jìn)行推測。根據(jù)與并用的藥物的相關(guān)分子功能網(wǎng)絡(luò)的交叉,有可能對藥物間的相互作用進(jìn)行推測。其結(jié)果,有可能對考慮副作用的風(fēng)險和藥物間的相互作用風(fēng)險的藥物進(jìn)行選擇和用量的設(shè)定。
以下對在本發(fā)明中添加醫(yī)藥分子和靶標(biāo)生物分子對的關(guān)系的方法舉例說明。針對醫(yī)藥分子的正式名稱,對分子略號進(jìn)行定義,對該分子相關(guān)的所有信息進(jìn)行收錄,制成“醫(yī)藥分子相信數(shù)據(jù)庫”。在這里,對醫(yī)藥分子的名稱、分子略號、適用疾病、用量、靶標(biāo)分子及其它信息進(jìn)行保存。和生物分子信息數(shù)據(jù)庫的的情況一樣,醫(yī)藥分子的化學(xué)結(jié)構(gòu)、氨基酸序列(肽或蛋白質(zhì)的情況下)、立體結(jié)構(gòu)等的信息包括在“醫(yī)藥分子信息數(shù)據(jù)庫”中,但最好保存在其它的數(shù)據(jù)庫中。為了區(qū)別醫(yī)藥分子和生物分子、蛋白質(zhì)和小分子等,可以用結(jié)構(gòu)編碼等進(jìn)行區(qū)別,也可以采用第1個文字即可以進(jìn)行區(qū)別的分子略號。并且,參照醫(yī)藥的附加說明書和其他文獻(xiàn),輸入藥物的顯著副作用、和其它藥物的相互作用、代謝酶的情況等,有助于根據(jù)分子功能網(wǎng)絡(luò),對和基因多型有關(guān)的藥物進(jìn)行適當(dāng)?shù)倪x擇。
進(jìn)一步,作成含有醫(yī)藥分子和靶標(biāo)蛋白質(zhì)對之間的關(guān)系的信息的數(shù)據(jù)庫“醫(yī)藥分子連鎖數(shù)據(jù)庫”,保存醫(yī)藥分子的分子略號、靶標(biāo)生物分子的分子略號、關(guān)系編碼、藥理作用、適用疾病以及其他信息。對于靶標(biāo)生物分子的分子略號,必須采用在生物分子信息數(shù)據(jù)庫中定義的分子略號。對于關(guān)系編碼等生物分子連鎖數(shù)據(jù)庫共同的數(shù)據(jù)項目,可以按照生物分子連鎖數(shù)據(jù)庫的標(biāo)記方法使用。
制作“醫(yī)藥分子信息數(shù)據(jù)庫”和“醫(yī)藥分子連鎖數(shù)據(jù)庫”,通過摘取醫(yī)藥分子以及醫(yī)藥分子對的信息,可以按照圖2所示對本發(fā)明的方法進(jìn)行擴充。這里通過連接檢索,生成分子功能網(wǎng)絡(luò)和推測生物學(xué)事件等,采用上述只用生物分子連鎖數(shù)據(jù)庫和生物分子信息數(shù)據(jù)庫情況下相同的方法進(jìn)行,能夠同時得到以該網(wǎng)絡(luò)上的分子作為靶標(biāo)的現(xiàn)有醫(yī)藥分子的信息。此外,可以從只用生物分子連鎖數(shù)據(jù)庫和生物分子信息數(shù)據(jù)庫就作成的分子功能網(wǎng)絡(luò)中,抽取和指定醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò),有目的的加以利用。
一方面,以人類基因組分析為主的從多個角度對遺傳信息的分析正在迅速進(jìn)展?;蚪M范圍內(nèi)的cDNA分離、orf(open reading frame,可讀框)和基因序列的闡明不斷深入,各個基因在基因組上的定位也在進(jìn)行。這里,作為本發(fā)明的另一方案,可以制成對生物分子中的蛋白質(zhì)分子略號和編碼該蛋白質(zhì)基因的名稱、略稱、ID及其他信息賦以關(guān)聯(lián)的生物分子基因數(shù)據(jù)庫,并如下所示對本發(fā)明的方法進(jìn)行擴充。即,根據(jù)基因和生物分子的對應(yīng)關(guān)系,可以從分子功能網(wǎng)絡(luò)上的分子以及生物學(xué)事件關(guān)聯(lián)的方面,對疾病標(biāo)記基因和蛋白所含的意義、疾病和基因多型的關(guān)系等知識進(jìn)行理解。最好在生物分子-基因數(shù)據(jù)庫中,在含有生物種、基因組上的位置、基因序列、功能以外、還含有基因多型的氨基酸變異和略稱、功能的關(guān)聯(lián)等信息,根據(jù)需要可以生成2個以上的數(shù)據(jù)庫。
根據(jù)在基因組序列上定位的基因名稱和基因的排列,明確了通過特定的關(guān)鍵分子作用于核內(nèi)受體而轉(zhuǎn)錄產(chǎn)生的蛋白,有可能將生物分子間相互調(diào)控的關(guān)系反映到分子功能網(wǎng)絡(luò)中。此外,已經(jīng)知道臟器所表達(dá)的基因和蛋白是不同的,根據(jù)本發(fā)明的方法,將這些表達(dá)信息收取到“生物分子信息數(shù)據(jù)庫”中,可以生成各個臟器不同的“分子功能網(wǎng)絡(luò)”。例如可以對在不同的臟器中的以核內(nèi)受體為靶標(biāo)的醫(yī)藥分子的作用有差異或相反的現(xiàn)象進(jìn)行說明。此外,已經(jīng)知道,使用醫(yī)藥分子的情況下,蛋白表達(dá)發(fā)生變化的事實,根據(jù)本發(fā)明的方法,可以在與靶標(biāo)生物分子相關(guān)的分子功能網(wǎng)絡(luò)上對每個表達(dá)蛋白量的增減進(jìn)行解釋,對考慮到基因的多型性的藥物的選擇很有用處。
在保存上述的基因轉(zhuǎn)錄和蛋白表達(dá)的信息時,也可以利用層次化的概念,生成更有效并且范圍廣的分子功能網(wǎng)絡(luò)。例如針對通過特定的核內(nèi)受體而轉(zhuǎn)錄、表達(dá)的多個基因、蛋白質(zhì),在“生物分子信息數(shù)據(jù)庫”中設(shè)定表示基因群的轉(zhuǎn)錄、蛋白群的表達(dá)的上位階層,并將該基因群、該蛋白群的數(shù)據(jù)保存于此即可。在存在該基因群的轉(zhuǎn)錄和該蛋白群的表達(dá)相關(guān)的生物學(xué)事件、病態(tài)事件的情況下,通過在“生物分子連鎖數(shù)據(jù)庫”中記錄該基因群和該蛋白群的上層階層數(shù)據(jù)和該事件的關(guān)聯(lián)關(guān)系,可以生成不表示每個基因、分子和該事件之間的關(guān)聯(lián)的分子功能網(wǎng)絡(luò)。
在上述的基因轉(zhuǎn)錄和蛋白表達(dá)的信息層次化保存方法中,當(dāng)對該基因群的每個基因或者該蛋白群的每個蛋白的轉(zhuǎn)錄或者表達(dá)的量的信息清楚的情況下,將這些信息都作為數(shù)值參數(shù)在“生物分子信息數(shù)據(jù)庫”中保存即可。通過利用這些數(shù)值參數(shù),根據(jù)每個基因的轉(zhuǎn)錄量或者每個蛋白的表達(dá)量的差異,可以對相關(guān)的生物學(xué)事件、病態(tài)事件的變化情況進(jìn)行記錄。
此外,隨著對基因組和基因的個體多樣性的闡明不斷進(jìn)展,通過將這些信息和本發(fā)明的方法進(jìn)行連接,可以推動對個體差異的理解,使建立在個體差異上的治療成為可能。對于特定的生物分子(蛋白質(zhì))的功能受到損害的基因多型,通過在分子功能網(wǎng)絡(luò)上進(jìn)行說明,可以推測對生物學(xué)事件的影響。將由于1個基因的缺損或者異常引發(fā)的遺傳性疾病的癥狀,以及生物學(xué)事件異常的信息與本發(fā)明的方法連接,也有助于對其的理解。
據(jù)報道,在幾個有代表性的疾病中,存在有各個疾病的患者中高頻出現(xiàn)的多個基因、疾病背景基因。假定實際上存在易患特定疾病相關(guān)的遺傳體質(zhì)的情況下,例如與血壓調(diào)節(jié)相關(guān)的分子功能網(wǎng)絡(luò)有2個以上,因其中任何一個網(wǎng)絡(luò)中的任何分子異常,出現(xiàn)相當(dāng)數(shù)量的高血壓背景的基因,也是可以理解。為了解釋這樣的多基因問題,本發(fā)明的方法是不可缺少的。
此外,近年來,小鼠、大鼠等動物的基因組和基因的分析工作迅速進(jìn)展,并且對人的基因組和基因進(jìn)行了對應(yīng)關(guān)聯(lián)工作。雖然認(rèn)為這些動物的和人的生理功能調(diào)節(jié)相關(guān)的蛋白具有相當(dāng)大的相似性,但是由于存在相當(dāng)大的差異,妨礙了醫(yī)藥開發(fā)。在已知這些動物和人之間蛋白和蛋白功能存在很大的差異的情況下,通過與本方法連接,可以搞清楚和人的分子功能網(wǎng)絡(luò)的差異,繼而有助于醫(yī)藥開發(fā)。而且,一般,對于開發(fā)用于人的醫(yī)藥轉(zhuǎn)用到動物的很多藥物,可以根據(jù)恰當(dāng)?shù)哪康倪M(jìn)行使用。
在醫(yī)藥開發(fā)中,存在有和人的疾病以及病態(tài)相似的病態(tài)動物。以這種動物的藥理活性作為指標(biāo)進(jìn)行開發(fā)的情況很多。這樣的病態(tài)動物的基因研究也不斷深入,根據(jù)本發(fā)明的方法,可以和人的遺傳信息進(jìn)行對照,有助于對人的這種疾病的機理進(jìn)行解釋。
并且,為了明確基因功能,大多數(shù)是采用作成特定基因受到破壞的基因敲除動物和基因功能變?nèi)?、基因過度表達(dá)的轉(zhuǎn)基因動物的方法。據(jù)說這些動物,很多時候會由于產(chǎn)生致死性而無法出生或者對生理功能和行動看不出任何影響的情況,對出生的動物觀察其有何異常時,這些動物試驗的結(jié)果分析也非常困難。在這樣的試驗中,使用本發(fā)明的方法,因可以對該基因操作的影響進(jìn)行預(yù)測,而便于功能的分析。
基因相關(guān)信息和分析的進(jìn)展一起推動從序列ID角度進(jìn)行統(tǒng)一的嘗試,并且推動了在基因組的序列上對基因進(jìn)行定位的嘗試。也有人認(rèn)為考慮到和上述的“生物分子連鎖數(shù)據(jù)庫”的聯(lián)合關(guān)系,構(gòu)筑獨立的遺傳信息數(shù)據(jù)庫,可以用于上述目的,但考慮到這項信息量的擴充和公開的方向,可以根據(jù)本發(fā)明的方法隨時將將來公開的信息收錄進(jìn)來,上述方法的實施可行性很高(圖3)。
采用本發(fā)明方法的生物分子連鎖數(shù)據(jù)庫,并非一定需要在同一個場所管理、保存,可以根據(jù)統(tǒng)一分子略號,對在不同場所管理、保存的1個以上的生物分子連鎖數(shù)據(jù)庫,適當(dāng)選擇,以通信手段,使之接續(xù)使用。不僅是生物分子連鎖數(shù)據(jù)庫,使用本發(fā)明的方法的生物分子信息數(shù)據(jù)庫、醫(yī)藥分子連鎖數(shù)據(jù)庫、醫(yī)藥分子信息數(shù)據(jù)庫、遺傳信息數(shù)據(jù)庫也可以采用同樣的處理方法。
作為本發(fā)明的實施的其他方案,提供了制作含有生物學(xué)事件發(fā)生直接相關(guān)的生物分子和該生物學(xué)事件的信息的數(shù)據(jù)庫(生物學(xué)事件-生物分子數(shù)據(jù)庫),并和不一定含有生物學(xué)事件信息的分子網(wǎng)絡(luò)數(shù)據(jù)庫并用的方法。其他方案還有,提供了一種方法,該方法從不一定含有生物學(xué)事件信息的分子網(wǎng)絡(luò)數(shù)據(jù)庫中,抽出與任意分子相關(guān)的部分分子網(wǎng)絡(luò),基于構(gòu)成該網(wǎng)絡(luò)的分子,對上述生物學(xué)事件生物分子數(shù)據(jù)庫進(jìn)行檢索。
本發(fā)明的實施的其他方案還有,針對“生物分子信息數(shù)據(jù)庫”、“生物連鎖數(shù)據(jù)庫”、“醫(yī)藥分子信息數(shù)據(jù)庫”、“醫(yī)藥分子連鎖數(shù)據(jù)庫”、“生物分子-基因數(shù)據(jù)庫”等各個數(shù)據(jù)項目,進(jìn)行關(guān)鍵詞、數(shù)值參數(shù)、分子結(jié)構(gòu)、氨基酸序列、堿基序列等的檢索。提供基于該檢索結(jié)果生成分子功能網(wǎng)絡(luò)的方法。以下,舉出基于檢索生成分子功能網(wǎng)絡(luò)的例子進(jìn)行悅明,不過本發(fā)明的范圍并不僅僅限于例子中。
在各個數(shù)據(jù)庫中,分子名稱、分子略號、生物種類、生成臟器、存在臟器等各種信息以文本的形式保存。針對這些文本,基于文字序列完全一致、部分一致進(jìn)行檢索,可以得到交叉的生物分子、生物分子對、生物學(xué)事件、病態(tài)事件、醫(yī)藥分子、醫(yī)藥分子-生物分子對、基因-蛋白的相應(yīng)數(shù)據(jù)。基于這些交叉的信息,對連接檢索的起點和終點進(jìn)行設(shè)定,利用連接檢索,可以縮小作為對象的分子對的范圍,有可能生成符合使用目的的分子功能網(wǎng)絡(luò)。
對“醫(yī)藥分子信息數(shù)據(jù)庫”中的醫(yī)藥分子的化學(xué)機構(gòu)、立體結(jié)構(gòu)進(jìn)行保存時,通過基于與這些相對應(yīng)的全部結(jié)構(gòu)一致、部分結(jié)構(gòu)一致、結(jié)構(gòu)相似性等進(jìn)行檢索,可以得到交叉的醫(yī)藥分子數(shù)據(jù)?;诮徊娴尼t(yī)藥分子,生成與該醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)??梢詫υ撫t(yī)藥分子相關(guān)的生物學(xué)事件、病態(tài)事件進(jìn)行檢索。
在“生物分子信息數(shù)據(jù)庫”中,保存基因轉(zhuǎn)錄、蛋白表達(dá)等的數(shù)值參數(shù)時,基于這項數(shù)值參數(shù)進(jìn)行檢索,根據(jù)基因的轉(zhuǎn)錄量、蛋白表達(dá)量可以生成相應(yīng)的分子功能網(wǎng)絡(luò)。
將蛋白氨基酸序列保存到“生物分子信息數(shù)據(jù)”或相關(guān)聯(lián)的數(shù)據(jù)庫中時,基于相對于這些氨基酸序列的同源性和部分序列類型的一致性進(jìn)行檢索,可使生物分子交叉而能生成基于該生物分子的分子功能網(wǎng)絡(luò)。對于功能未知的蛋白質(zhì)及其部分序列信息,這個方法可以對與該蛋白質(zhì)相關(guān)的可能性高的分子功能網(wǎng)絡(luò)進(jìn)行推測,進(jìn)一步還可以推測該蛋白的功能。
將蛋白相對應(yīng)的基因的堿基序列保存到“生物分子信息數(shù)據(jù)庫”、“生物分子-基因數(shù)據(jù)庫”或關(guān)連數(shù)據(jù)庫中時,基于與這些堿基序列相對應(yīng)的序列同源性和部分序列類型的一致性進(jìn)行檢索,可使生物分子交叉,繼而生成有關(guān)該生物分子的分子功能網(wǎng)絡(luò)。對于功能未知的基因及其部分的序列信息,用這個方法,可以對與該基因翻譯得到的蛋白相關(guān)的可能性高的分子功能網(wǎng)絡(luò)進(jìn)行推測,進(jìn)一步還可以有效推測該蛋白的功能。
實施本發(fā)明的其他方案包括,提供了為了實施本發(fā)明的方法的由程序和數(shù)據(jù)庫組成的計算機系統(tǒng)、記錄為了實施本發(fā)明的方法的程序和數(shù)據(jù)的計算機可以讀取的媒體、記錄為了在本發(fā)明的方法中使用的數(shù)據(jù)庫的計算機可以讀取的媒體、記錄根據(jù)本發(fā)明的方法生成的分子功能網(wǎng)絡(luò)相關(guān)的信息的計算機可以讀取的媒體等等。
總結(jié)本發(fā)明的方法的特征,如下所示-包括生物學(xué)事件信息、通過儲存直接結(jié)合生物分子對的信息,做成生物內(nèi)的分子間的相關(guān)數(shù)據(jù)庫。
-由部分集合的上述數(shù)據(jù)庫中進(jìn)行連接檢索,作成與任意的生物分子以及生物學(xué)事件相關(guān)的分子功能網(wǎng)絡(luò)。
-基于分子功能網(wǎng)絡(luò),對任意的分子直接間接相關(guān)的生物學(xué)事件進(jìn)行推測。
-從帶有生物學(xué)事件信息的分子功能網(wǎng)絡(luò),對疾病的機理、可能的創(chuàng)新藥物作用的靶點、副作用風(fēng)險等進(jìn)行推測。
-從生物分子的量或者質(zhì)的變動中對生物學(xué)事件的波動進(jìn)行推測。
-含有生物分子的生成臟器、存在臟器以及作用臟器的信息的分子功能網(wǎng)絡(luò)。
-使用醫(yī)藥分子信息和分子功能網(wǎng)絡(luò)對副作用、藥物之間的相互作用進(jìn)行推測。
-在分子功能網(wǎng)絡(luò)上對由于使用醫(yī)藥分子導(dǎo)致的蛋白表達(dá)的變化進(jìn)行解釋。
-根據(jù)和遺傳信息的連接對基因多型對分子功能網(wǎng)絡(luò)的影響、疾病背景基因等進(jìn)行分析。
第7圖所示是以生物分子之一的“血管緊張素I”和生物學(xué)事件之一的“血壓上升”作為問題提出而生成的分子功能網(wǎng)絡(luò)。在生物分子連鎖數(shù)據(jù)庫中進(jìn)行連接檢索,得到了從“血管緊張素I”到“血壓上升”的相關(guān)生物分子,并且據(jù)此制作成分子功能網(wǎng)絡(luò)。
此外,制作具有血壓下降作用的醫(yī)藥分子相關(guān)的醫(yī)藥分子信息數(shù)據(jù)庫(第8圖)和醫(yī)藥分子連鎖數(shù)據(jù)庫(第9圖),將其與生物分子信息數(shù)據(jù)庫(第5圖)以及生物分子連鎖數(shù)據(jù)庫(第6圖)并用,進(jìn)行醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)生成的嘗試。
第10圖表示的是的以一種醫(yī)藥分子依那普利和“血壓上升”這個生物學(xué)事件作為問題提出而生成的分子功能網(wǎng)絡(luò)。因為依那普利對與其直接結(jié)合的血管緊張素轉(zhuǎn)換酶有阻礙關(guān)系,故而阻斷了和血管緊張素轉(zhuǎn)換酶有直接結(jié)合關(guān)系(酶-底物關(guān)系)的血管緊張素II的連鎖關(guān)系,所以表現(xiàn)出其下游的、網(wǎng)絡(luò)上存在的“血壓上升”事件被抑制(停止)。
本程序由以下步驟組成為了得到進(jìn)行連接檢索所必須的分子名、子網(wǎng)絡(luò)以及生物學(xué)事件名等進(jìn)行的檢索1101~1103步;進(jìn)行連接檢索、表示分子功能網(wǎng)絡(luò)的1104~1108步;以及對生成的分子功能網(wǎng)絡(luò)進(jìn)行再處理而添加的1109~1110步。
使用者首先在1101步驟中指定與分子名、分子略號、子網(wǎng)絡(luò)名、生物學(xué)事件名、病態(tài)事件名、疾病名、氨基酸序列、核酸堿基序列、外部數(shù)據(jù)庫ID、醫(yī)藥分子結(jié)構(gòu)等相關(guān)的檢索方法,輸入提問的文字。作為檢索方法,使用者可選擇使用針對上述項目進(jìn)行個別檢索的方法,和針對多個項目的采用共同的提問文字列進(jìn)行檢索的方法等。提問文字,也可以不是和數(shù)據(jù)庫中的數(shù)據(jù)項目完全一致的文字,也可以是含有表示名字的一部分的文字和所謂通配符文字等的文字。當(dāng)指定蛋白質(zhì)的氨基酸序列或者核酸堿基序列為檢索項目時,作為提問文字,使用者可以輸入表示氨基酸序列或者堿基序列的文字代碼(例丙氨酸=A、甘氨酸=G、鳥嘌呤=g、胞嘧啶=c等)的文字。指定醫(yī)藥分子結(jié)構(gòu)為檢索項目時,使用者可以輸入以MOLFILE形式表現(xiàn)提問分子結(jié)構(gòu)的數(shù)據(jù)。
對于使用者輸入的檢索項目,程序在步驟1102中對生物分子信息數(shù)據(jù)庫、生物分子連鎖數(shù)據(jù)庫以及相關(guān)的數(shù)據(jù)庫的數(shù)據(jù)項目,通過關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、序列檢索等方法進(jìn)行檢索。關(guān)鍵詞檢索不僅允許文字列完全一致、還允許和文字列部分一致,和按照通配符與多個文字列相一致。步驟1101中,當(dāng)指定氨基酸序列或者堿基序列為檢索項目時,程序針對生物分子信息數(shù)據(jù)庫以及相關(guān)的序列數(shù)據(jù)庫中的氨基酸序列、堿基序列,根據(jù)和提問文字列(序列)的一致程度和相同性進(jìn)行檢索,給出一致度和相同性高的序列的ID或者相對應(yīng)的分子名作為檢索結(jié)果。當(dāng)指定醫(yī)藥分子結(jié)構(gòu)為提問項目時,程序根據(jù)部分結(jié)構(gòu)匹配(マッチンク)的方法對部分結(jié)構(gòu)一致或者類似的醫(yī)藥分子進(jìn)行檢索,給出相應(yīng)的醫(yī)藥分子名作為檢索結(jié)果。
在步驟1102中檢索得到的命中(ヒット)項目在步驟1103中用列表的形式表示。程序根據(jù)對列表中的位置進(jìn)行區(qū)分的方法和賦予圖標(biāo)(アイコン)的方法等區(qū)別表示列表中的各個命中項目、分子名、子網(wǎng)絡(luò)、生物學(xué)事件名的每個相應(yīng)的位置。
其次,使用者在步驟1104中指定連接檢索方法和作為檢索端點的分子名、子網(wǎng)絡(luò)名以及生物分子事件名(包括病態(tài)事件)。在本實施例中,提供指定1點,并對其周邊相關(guān)的網(wǎng)絡(luò)進(jìn)行檢索的方法和指定2點檢索聯(lián)系二者的網(wǎng)絡(luò)的檢索方法。在第12圖和第13圖中分別表示了這2個檢索方法所必須輸入的項目。使用者根據(jù)從步驟1103所示的列表中選擇適當(dāng)?shù)捻椖浚斎敕肿用?、子網(wǎng)絡(luò)名以及生物學(xué)事件名。當(dāng)列表中沒有適合的項目時,使用者可以返回到步驟1101重新輸入檢索項目,重復(fù)從步驟1101到1103步驟的檢索步驟,直到找到適合的項目為止。
在步驟1105中,使用者輸入連接檢索的限定條件。限定條件可以指定生成的分子功能網(wǎng)絡(luò)中所含的分子數(shù)的上限和在2點間檢索時該2點間的相關(guān)數(shù)(路徑數(shù))的上限。在步驟1106中,使用者指定檢索得到的分子功能網(wǎng)絡(luò)的表示方法。表示方法可以選擇如對組成網(wǎng)絡(luò)的全部分子進(jìn)行明示的方法(分子網(wǎng)絡(luò)表示法),和將所屬分子在子網(wǎng)絡(luò)中進(jìn)行歸納,使之成為一個節(jié)點的表示方法(子網(wǎng)絡(luò)表示法)等,使用者可以從多種方法中進(jìn)行選擇。
根據(jù)從步驟1104到步驟1105指定的條件,程序在步驟1107對生物分子連鎖數(shù)據(jù)庫進(jìn)行連接檢索。檢索得到的分子功能網(wǎng)絡(luò),使用者根據(jù)在步驟1106中指定的表示方法,在步驟1108中表示為含有分子、子網(wǎng)絡(luò)或者生物學(xué)事件作為節(jié)點的組。
使用者在對步驟1108中所展示的分子功能網(wǎng)絡(luò)進(jìn)行視覺檢測時,根據(jù)需要有時可返回到1104變更連接檢索的條件,反復(fù)檢索,有時也可返回到步驟1101,重復(fù)進(jìn)行分子名、子網(wǎng)絡(luò)以及生物學(xué)事件名的檢索。
此外,根據(jù)本程序中附加的步驟1109以及步驟1110,可以對生成的分子功能網(wǎng)絡(luò)進(jìn)行再次處理。在步驟1109中,使用者可以進(jìn)行多個分子功能網(wǎng)絡(luò)間的理論計算。為了實施步驟1109,將進(jìn)行到步驟1108的步驟反復(fù)進(jìn)行多次是生成多個分子功能網(wǎng)絡(luò)所必須的。針對這些多個分子功能網(wǎng)絡(luò),程序可以求得網(wǎng)絡(luò)間的共同部分(AND演算)和非共同部分(XOR演算),或者得到多個網(wǎng)絡(luò)的總的集合(OR演算)。這個功能對于調(diào)查不同的生物種和臟器間的分子功能網(wǎng)絡(luò)的差異等有用。
步驟1110中,便用者針對生成的分子功能網(wǎng)絡(luò),再次進(jìn)行交叉檢索,對該分子功能網(wǎng)絡(luò)中的分子和部分網(wǎng)絡(luò)可以強調(diào)表示,或者抽出來表示。這種交叉檢索可以用在步驟1101~1103的任何一步所用的方法中。根據(jù)步驟1110,例如對于在特定的臟器表達(dá)的生物分子,可以在分子功能網(wǎng)絡(luò)中強調(diào)表示,或者從范圍廣泛的分子功能網(wǎng)絡(luò)中只抽出屬于指定的子網(wǎng)絡(luò)的進(jìn)行表示。
產(chǎn)業(yè)上利用的可能性作為包含有生物學(xué)事件的生物分子對信息的集合,本發(fā)明的生物分子連鎖數(shù)據(jù)庫,通過檢索生成該分子間在必要范圍內(nèi)的功能上或者生物合成上有關(guān)聯(lián)的分子功能網(wǎng)絡(luò),可用于對與任意生物分子的表達(dá)有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測,此外,通過與醫(yī)藥分子的信息以及遺傳信息相連接,能夠得到基于新藥開發(fā)和個體差異的醫(yī)療上必要的知識。
權(quán)利要求
1.生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò)的方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,進(jìn)行連接檢索。
2.推測方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,進(jìn)行連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò),對該網(wǎng)絡(luò)中的任意的生物分子和任意的生物學(xué)事件之間的路徑進(jìn)行推測。
3.推測方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,進(jìn)行連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò),對該網(wǎng)絡(luò)中的任意的生物分子相關(guān)的生物學(xué)事件進(jìn)行推測。
4.生成分子功能網(wǎng)絡(luò)的方法,包括使用對生物分子對的信息層次化并保存的生物分子連鎖數(shù)據(jù)庫,進(jìn)行連接檢索。
5.權(quán)利要求1~3中任意一項的方法,其特征在于將生物分子對的信息進(jìn)行層次化并保存在生物分子連鎖數(shù)據(jù)庫中。
6.權(quán)利要求1~5中任意一項的方法,其特征在于使用層次化保存生物分子和/或生物學(xué)事件信息的數(shù)據(jù)庫。
7.權(quán)利要求1~6中任意一項的方法,其特征在于針對數(shù)據(jù)庫中的項目,采用關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、以及序列相同性檢索中的任何1種或者2種以上并用進(jìn)行檢索。
8.權(quán)利要求1~6中任意一項的方法,其特征在于通過針對數(shù)據(jù)庫中的項目,采用關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、以及序列相同性檢索中的任意一種或者2種以上進(jìn)行檢索,將用于連接檢索的數(shù)據(jù)交叉,生成限定的分子功能網(wǎng)絡(luò)。
9.權(quán)利要求1~6中任意一項的方法,其特征在于針對生成的分子功能網(wǎng)絡(luò),再次進(jìn)行關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、序列相同性檢索中的任何1種或者2種以上方法并用,生成該網(wǎng)絡(luò)的部分網(wǎng)絡(luò)。
10.權(quán)利要求1~6中任意一項的方法,其特征在于在生物學(xué)事件的信息中含有與關(guān)鍵分子的量或者質(zhì)的變化相對應(yīng)的波動信息。
11.權(quán)利要求1~6中任意一項的方法,其特征在于在生物學(xué)事件中含有與疾病相關(guān)的病名、病態(tài)、診斷基準(zhǔn)以及治療藥物等信息中的任何1種或2種以上的信息。
12.權(quán)利要求1到6中任意一項的方法,其特征在于合并使用將特定的生物分子作為靶標(biāo)的醫(yī)藥分子的信息。
13.權(quán)利要求1~6中任意一項的方法,其特征在于合并使用生物分子和基因的對應(yīng)關(guān)系的信息。
14.權(quán)利要求1~6中任意一項的方法,其特征在于合并使用每種臟器的蛋白的表達(dá)信息和/或者基因表達(dá)信息。
15.權(quán)利要求1~6中任意一項的方法,其特征在于生物分子與基因多型相關(guān)的基因信息相連接。
16.權(quán)利要求1~6中任意一項的方法,其特征在于合并使用在特定的關(guān)鍵分子中表達(dá)被調(diào)控的基因或者蛋白質(zhì)的信息。
17.推測醫(yī)藥分子副作用的方法,其特征在于采用權(quán)利要求12的方法。
18.推測新藥靶點的方法,其特征在于使用權(quán)利要求1~16中任意一項的方法。
19.推測以特定的生物分子作為創(chuàng)新藥物靶點時的副作用風(fēng)險的方法,其特征在于使用權(quán)利要求1~16中任意一項的方法。
20.計算機系統(tǒng),由用于實施權(quán)利要求1~19中任意一項的方法的程序和數(shù)據(jù)庫組成。
21.計算機可以讀取的媒體,記錄有用于實施權(quán)利要求1~19中任意一項的方法的程序和/或數(shù)據(jù)庫。
全文摘要
使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫,通過連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò)的方法、以及推測該網(wǎng)絡(luò)中任意生物分子和任意生物學(xué)事件間的路徑的方法或者推測該網(wǎng)絡(luò)中的任意生物分子相關(guān)的生物學(xué)事件的方法。
文檔編號G06F19/12GK1479900SQ01818734
公開日2004年3月3日 申請日期2001年9月10日 優(yōu)先權(quán)日2000年9月12日
發(fā)明者板井昭子 申請人:株式會社醫(yī)藥分子設(shè)計研究所