專利名稱:自動生成多維結(jié)構(gòu)活性和結(jié)構(gòu)性能關(guān)系的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種自動生成多維結(jié)構(gòu)活性和結(jié)構(gòu)性能關(guān)系的方法。
背景技術(shù):
隨著高通量系統(tǒng)(High-Throughput Systems)(HTS)系統(tǒng)的發(fā)展和應(yīng)用,制藥工業(yè)面臨越來越多的需要充分分析所獲得的數(shù)據(jù)的問題。特別是,需要將源于多維數(shù)據(jù)矩陣的信息轉(zhuǎn)化為化學(xué)結(jié)構(gòu)信息。
本發(fā)明的目的是,提供一種用于自動發(fā)現(xiàn)復(fù)雜數(shù)據(jù)矩陣中潛在相關(guān)性的方法。本發(fā)明的另一目的是,為使用者提供有關(guān)潛在的多維內(nèi)聚力(cohesion)的化學(xué)結(jié)構(gòu)或化學(xué)性能信息。通過權(quán)利要求的技術(shù)特征實現(xiàn)了這些目的。
發(fā)明內(nèi)容
依據(jù)第一方面,本發(fā)明提供了一種旨在分析化學(xué)結(jié)構(gòu)的結(jié)構(gòu)片段對于至少一個生物描述符(descriptor)的影響的方法。
依據(jù)第一方面的該方法,其包括步驟a)提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù);b)提供有關(guān)至少一個生物描述符(descriptor)的數(shù)據(jù);c)計算對應(yīng)于每個化學(xué)結(jié)構(gòu)的結(jié)構(gòu)片段;d)將對應(yīng)于每個化學(xué)結(jié)構(gòu)的所述結(jié)構(gòu)片段與所述生物描述符數(shù)據(jù)聯(lián)系起來,以獲得數(shù)據(jù)矩陣;e)分析所述數(shù)據(jù)矩陣中的數(shù)據(jù),考察每個化學(xué)結(jié)構(gòu)的片段對于所述生物描述符的影響;和f)將所述分析的結(jié)果呈現(xiàn)出來。
優(yōu)選地,在步驟e)中,將每個步驟c)中所計算的片段關(guān)聯(lián)到生物描述符數(shù)據(jù)上。優(yōu)選地使用部分最小二乘方(partial-least-square)的方法來進(jìn)行這種關(guān)聯(lián)。可替代地,也可以使用神經(jīng)網(wǎng)絡(luò)、多重線性回歸、或者輔助向量機(jī)。
在本發(fā)明第一方面的方法的步驟d)中,優(yōu)選地,基于預(yù)定的支架結(jié)構(gòu)(scaffold structure)來選擇該片段。本文中,術(shù)語“預(yù)定的支架結(jié)構(gòu)”含義是,由該方法的使用者例如藥劑師所選擇的基本結(jié)構(gòu),并且這種基本結(jié)構(gòu)的片段是多樣的。也可以通過自動搜索最普通的化學(xué)亞結(jié)構(gòu)來確定預(yù)定的支架結(jié)構(gòu)。另外,本方法包括在步驟d)中,基于分子片段生成該片段。
依據(jù)第一方面的該方法的優(yōu)選實施方式,在步驟d)之后進(jìn)行步驟計算對應(yīng)于每個片段的物理-化學(xué)性能。優(yōu)選地,步驟e)分析數(shù)據(jù)矩陣中的數(shù)據(jù),考察片段和其物理-化學(xué)性能對于生物描述符的影響。優(yōu)選地,將每個片段的每個物理-化學(xué)性能與生物描述符數(shù)據(jù)關(guān)聯(lián)起來。
依據(jù)第二方面,本發(fā)明提供了一種旨在分析化學(xué)結(jié)構(gòu)的物理-化學(xué)性能對于至少一個生物描述符的影響的方法。
依據(jù)第二方面的該方法,其包括步驟A)提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù);B)提供有關(guān)至少一個生物描述符的數(shù)據(jù);C)計算每個化學(xué)結(jié)構(gòu)的物理-化學(xué)性能;D)將每個化學(xué)結(jié)構(gòu)的所述物理-化學(xué)性能與所述生物描述符數(shù)據(jù)聯(lián)系起來,以獲得數(shù)據(jù)矩陣;E)分析所述數(shù)據(jù)矩陣中的數(shù)據(jù),考察每個化學(xué)結(jié)構(gòu)的每個物理-化學(xué)性能對于所述生物描述符的影響;和F)將所述分析的結(jié)果呈現(xiàn)出來。
優(yōu)選地,在步驟E)中,將每個化學(xué)結(jié)構(gòu)的每個物理-化學(xué)性能與所述生物描述符數(shù)據(jù)關(guān)聯(lián)起來。
優(yōu)選地,所述化學(xué)結(jié)構(gòu)或片段的物理-化學(xué)性能選自于由親水性、疏水性、電性能、形狀、和兩親性組成的組。但是,本發(fā)明并不僅限于這些性能。在本文中,可以參考Todeschini,Roberto,Consonni,ViViana,Handbook of Molecular Descriptors,Methods and Principles inMedical Chemistry Vol.11,WILEY-VCH,2000。
依據(jù)第一和第二方面的方法,生物描述符數(shù)據(jù)獨立地選自于藥理學(xué)數(shù)據(jù)、毒理學(xué)數(shù)據(jù)和藥物代謝動力學(xué)數(shù)據(jù)。例如,至少一種生物描述符選自于由與受體活性、選擇性、生物利用度、和體內(nèi)活性相關(guān)的描述符所組成的組。但是,這些生物描述符僅僅只是各種優(yōu)選用于本發(fā)明的描述符的實例。下面給出了潛在描述符的其它實例。
與第一方面的方法中相同地,本發(fā)明第二方面也優(yōu)選使用部分最小二乘方的方法來分析數(shù)據(jù)矩陣中的數(shù)據(jù),考察每個化學(xué)結(jié)構(gòu)的每個物理-化學(xué)性能對于生物描述符的影響(步驟E))??商娲兀缟纤?,也可以使用神經(jīng)網(wǎng)絡(luò)、多重線性回歸、或者輔助向量機(jī)。
下面描述了第一和第二方面的優(yōu)選特征。
優(yōu)選地,使結(jié)果顯示為依賴于化學(xué)結(jié)構(gòu)和生物描述符的二維特性曲線或矩陣,其中該特性曲線代表了每個片段或每個物理-化學(xué)性能對于生物描述符的正面或負(fù)面影響。更優(yōu)選地,使代表每個片段或每個物理-化學(xué)性能對于生物描述符的正面影響的那部分特性曲線區(qū)別于代表每個片段或每個物理-化學(xué)性能對于生物描述符的負(fù)面影響的那部分特性曲線而突出顯示。最優(yōu)選地,不同部分顯示不同顏色。
第一或第二方面的方法,可以進(jìn)一步包括步驟以獨立的數(shù)據(jù)組驗證該結(jié)果。
依據(jù)另一種優(yōu)選的實施方式,該方法包括步驟自動生成具有良好多維外形(profile)的新分子。
圖1顯示了三種程序框圖,其代表了依據(jù)本發(fā)明第一和第二方面、以及兩方面相組合的方法;圖2更詳細(xì)地顯示了本發(fā)明第一方面的一種工序;圖3顯示了本發(fā)明第一方面的方法的結(jié)果的示例性顯示;
圖4顯示了依據(jù)本發(fā)明選擇模型的詳細(xì)流程圖;圖5顯示了本發(fā)明的計算機(jī)實施的輸入掩碼(input mask)的截屏圖(screenshot);圖6顯示了通過本發(fā)明的方法所計算的結(jié)果的截屏圖;圖7顯示了通過本發(fā)明計算的系數(shù)圖表的示例性截屏圖;圖8顯示了如何通過本發(fā)明獲得片段指紋(fingerprint);和圖9顯示了新產(chǎn)生的分子的等級列表實例。
具體實施例方式
下面將更詳細(xì)地描述本發(fā)明的方法步驟。本發(fā)明的方法通過數(shù)據(jù)輸入(化學(xué)結(jié)構(gòu)和一個或多個生物描述符及其活性)開始。優(yōu)選地,提供至少三個、更優(yōu)選五個化學(xué)結(jié)構(gòu)作為輸入數(shù)據(jù)。此外,提供生物參數(shù)或描述符作為輸入數(shù)據(jù)、和這種描述符的活性。對于每個生物描述符,優(yōu)選地輸入三個活性、更優(yōu)選五個活性。
基于這些輸入數(shù)據(jù),依據(jù)本發(fā)明第一方面的方法,變化化學(xué)結(jié)構(gòu)的片段,以獲得用于數(shù)據(jù)分析的各種組,并且對這些不同數(shù)據(jù)組進(jìn)行PLS。例如,依據(jù)本發(fā)明使用了下面的等式Y(jié)=a·片段A+b·片段B+...+x·片段N+z(1)其中Y代表被提供作為輸入的生物描述符的活性值,片段A到片段N代表所考慮的片段,a到x為系數(shù),且z為常數(shù)。每個參數(shù)片段I為1或0,其取決于該片段是否以特定的模型來考慮。
這種通式表明,原則上對于數(shù)據(jù)分析可以考慮多個片段。但是,實際上所期望的是僅有幾個片段,以保持必須的計算量在合理的最小值,并且更重要的是,確保使用者能夠解釋該結(jié)果并且能夠確定每個片段的影響和效果。
依據(jù)本發(fā)明第二方面的方法,也是基于這些輸入數(shù)據(jù),例如,從數(shù)據(jù)庫中計算或讀出該化學(xué)結(jié)構(gòu)的物理-化學(xué)性能,并且對于這些各種模型進(jìn)行PLS。例如,依據(jù)本發(fā)明使用了下面的等式
Y=a·性能1+b·性能2+...+x·性能N+z(2)其中Y代表被提供作為輸入的生物描述符的活性值,性能1到性能N代表所考慮的物理-化學(xué)性能,a到x為系數(shù),且z為常數(shù)。這種通式表明,原則上對于數(shù)據(jù)分析可以考慮多個性能。但是,實際上所期望的是僅有幾個性能,以保持必須的計算量在合理的最小值,并且更重要的是,確保能夠解釋該結(jié)果并且能夠確定每個性能的影響和效果。
通常,等式(1)和(2)用于求解出作為輸入數(shù)據(jù)提供的所有活性,也就是,基于可獲得的等式(對于每種活性一個等式)計算這些等式的未知系數(shù)和常數(shù)。
優(yōu)選地,將系數(shù)標(biāo)準(zhǔn)化和集中,以使得它們能夠與其它進(jìn)行比較(因為它們可以具有不同的維數(shù))。
依據(jù)本發(fā)明,三個方面表明了該模型的質(zhì)量(也就是三個質(zhì)量參數(shù))。首先是變量重要性,也就是片段或物理-化學(xué)性能的相關(guān)性。其次是所計算的系數(shù)的絕對值(當(dāng)使用PLS進(jìn)行數(shù)據(jù)分析時)。如果所計算的系數(shù)(上述等式(1)或(2)的)很小,相關(guān)變量的影響僅僅很小,即使這種變量是一種重要變量時也是如此。第三是所使用的變量(片段或物理-化學(xué)性能)的數(shù)量。基本上,如上所述,變量的數(shù)量應(yīng)盡可能小,以具有使用者可解釋的模型。
現(xiàn)在參照附圖更詳細(xì)地描述本發(fā)明,其中圖1以程序框圖的形式顯示了本發(fā)明的原理。圖1中間的程序框圖顯示了依據(jù)本發(fā)明第一方面的方法。依據(jù)這種方法,提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù)作為輸入數(shù)據(jù)。通常通過這種結(jié)構(gòu)數(shù)據(jù)的提供者的各自代碼來識別這種化學(xué)結(jié)構(gòu),例如序列字母和數(shù)字;并且將這些代碼提供為輸入數(shù)據(jù)。例如在數(shù)據(jù)庫中提供有關(guān)化學(xué)結(jié)構(gòu)的特定數(shù)據(jù),并且通過輸入代碼可以在數(shù)據(jù)庫中辨別和訪問化學(xué)結(jié)構(gòu)。此外,將有關(guān)至少一種生物描述符的數(shù)據(jù)提供為另一輸入數(shù)據(jù)?;谶@些輸入數(shù)據(jù),該方法包括兩種可替代的實施方式。這兩種可替代的實施方式由圖1中間程序框圖的兩個分支所表示。依據(jù)左邊的分支,從化學(xué)結(jié)構(gòu)出發(fā)選擇和計算分子片段。在隨后步驟中,進(jìn)行數(shù)據(jù)分析,以將對應(yīng)于每個化學(xué)結(jié)構(gòu)的分子片段與生物描述符數(shù)據(jù)聯(lián)系起來,以獲得數(shù)據(jù)矩陣。如圖1中所示,優(yōu)選使用部分最小二乘方(PLS)的方法進(jìn)行數(shù)據(jù)分析。最后,將結(jié)果顯示出來,其將在后面更詳細(xì)地描述。
在替代實施方式中,使用了基于預(yù)定支架結(jié)構(gòu)而選擇的片段代替分子片段。此外,在該步驟之后進(jìn)行數(shù)據(jù)分析,優(yōu)選為部分最小二乘方的方法。在圖1中所示的最后步驟中,將結(jié)果顯示出來。
圖1在其左邊程序框圖中也顯示了依據(jù)本發(fā)明第二方面的方法。依據(jù)該發(fā)面,提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù)和有關(guān)一種生物描述符的數(shù)據(jù)作為輸入數(shù)據(jù)?;谶@些輸入數(shù)據(jù),計算每個化學(xué)結(jié)構(gòu)的物理-化學(xué)性能。圖1中各個方框給出了這些性能的一些實例,例如疏水性、親水性、電性、形狀、兩親性等。此外,該步驟之后進(jìn)行數(shù)據(jù)分析,優(yōu)選為部分最小二乘方的方法。在圖1中所示的最后步驟中,將結(jié)果顯示出來。
為了計算物理-化學(xué)性能,可以使用標(biāo)準(zhǔn)工具。例如,這樣的標(biāo)準(zhǔn)工具為,可以從GMD(Gerber Molecular Design,Amgen,Switzerland)獲得的Msrfv1,可以從Daylight Inc.,Los Altos MissionViejo,CA,USA獲得的1D-prop或Clogp,可以從ACDLabs(AdvancedChemistry Development,Inc.),Toronto,Ontario M5H 3V9,Canada獲得的pKaDB,或者可以從Roche獲得的CAFCA。
PLS優(yōu)選使用從Umetrics,Inc.Umea,Sweden獲得的C-libraries。
圖1的右邊程序框圖中顯示了兩個方面的組合?;谳斎霐?shù)據(jù)(有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù)和有關(guān)至少一種生物描述符的數(shù)據(jù)),基于預(yù)定的支架結(jié)構(gòu)選擇片段,并且隨后計算每個片段的物理-化學(xué)性能。PLS數(shù)據(jù)分析之后,隨后再次將結(jié)果顯示出來。
如上所述,可以使用依據(jù)本發(fā)明第一方面的方法,也可以使用結(jié)合這兩個方面的方法,分析多個生物描述符。其在圖2中以示意形式顯示。原則上,對于分析可以使用n個生物描述符。圖1中給出的實例為受體活性、選擇性、生物利用度、和體內(nèi)活性。
圖3中顯示了使用了一個以上生物描述符的方法的結(jié)果的顯示實例。
圖3中所示的表格或矩陣在其第二行中顯示了用于分析的不同片段。如圖3中所示,可以明確地顯示部分化學(xué)結(jié)構(gòu)。在圖3中所示的實例中,使用了在第一行中列出的四種不同生物描述符(pGLYT1,NHP_60,phERG,Mdia_10)。為此,在矩陣中形成區(qū)組或群。更詳細(xì)地,第三到第六欄與改變描述符的第一片段相關(guān),并且隨后四欄與改變相同描述符的下一片段相關(guān)。
優(yōu)選地,第二欄顯示整個分子的化學(xué)結(jié)構(gòu)。但是,為了簡化,圖3中未顯示這些整個分子。
在片段下面的各個欄中顯示了數(shù)據(jù)分析的結(jié)果。也就是,在使用PLS進(jìn)行數(shù)據(jù)分析的情形中,在矩陣中列出了對應(yīng)于每個片段、描述符、和分子的PLS結(jié)果,也就是PLS系數(shù)。除了僅僅列出PLS系數(shù)之外,優(yōu)選地將該系數(shù)單獨突出顯示,以使得使用者可以容易地看結(jié)果中的差別,也就是該片段對于生物描述符的不同影響。例如,將具有負(fù)號系數(shù)的矩陣區(qū)域以代表對生物描述符負(fù)面影響(例如生物活性減小)的紅色(黑/白照片中為黑灰色)突出顯示。另一方面,以不同的方式,例如以不同的顏色,另外突出顯示正號。在圖3中所示的實施例中,以綠色(黑/白照片中為淺灰色)突出顯示的區(qū)域意味著對生物描述符的正面影響(如心臟安全性增加)。
矩陣中的空白區(qū)域含義是,在所測試的化學(xué)結(jié)構(gòu)中不存在這些片段。
此外,在用于特定片段的一個矩陣行中的每組區(qū)域,依據(jù)本發(fā)明其代表“片段指紋”。片段指紋代表一個片段對于可與遺傳指紋比較的“整個”生物外形的影響。其將在下面參照圖8更詳細(xì)地描述。
圖4顯示了依據(jù)本發(fā)明選擇模型的詳細(xì)流程圖,優(yōu)選地使用PLS。下表描述了在該流程圖中使用的縮寫。
表1縮寫列表
從圖4的流程圖中可以看出,將觀測項(OBSERVATIONS)輸入??赡艿纳镉^測項包括從體外/體內(nèi)藥效、體外/體內(nèi)藥物代謝動力學(xué)、體外/體內(nèi)毒理學(xué)、體外/體內(nèi)安全性或任意物理-化學(xué)參數(shù)的領(lǐng)域,任意生物觀測(Y-值);例如吸收、生物利用度、分布、清除率、穩(wěn)定性、分泌物、血腦屏障滲透、腦脊髓液(CSF)水平、對傳送裝置(如P-gp、OAT、OCT...)的親和力、藥物-藥物相互作用(DDI)、微神經(jīng)元體細(xì)胞的穩(wěn)定性、肝細(xì)胞清除率、酶活性、酶選擇性、GPCR活性、GPRC選擇性、體內(nèi)活性、體內(nèi)選擇性、離子通道相互作用、膦脂代謝障礙(phospholipidosils)、AMES活性、生殖毒性、致癌性、致畸性、肝臟毒性、光毒性、滲透性、膜粘合、logP、HLB、在不同介質(zhì)中的溶解性等。
此外,依據(jù)圖4中所示的優(yōu)選實施方式,將至少三個輸入項(ENTRIES)例如化學(xué)結(jié)構(gòu)和至少一個描述符提供為輸入數(shù)據(jù)?;谶@些輸入數(shù)據(jù),通過PLS進(jìn)行數(shù)據(jù)分析,并且最后將N種最佳模式的結(jié)果輸出給使用者。N為使用者所選擇的整數(shù)數(shù)值。
下面顯示了輸入表格的實例
表2輸入數(shù)據(jù)
圖5顯示了本發(fā)明的計算機(jī)實施的輸入掩碼(input mask)的截屏圖(screenshot)。在屏幕的左邊部分,顯示了兩個輸入或數(shù)據(jù)提交區(qū)域。在左邊的提交區(qū)域中,輸入化學(xué)結(jié)構(gòu)的代碼。優(yōu)選地,輸入至少三個化學(xué)結(jié)構(gòu)、更優(yōu)選五個化學(xué)結(jié)構(gòu)。此外,在兩個數(shù)據(jù)提交區(qū)域的左邊一個中,輸入生物參數(shù)或描述符,和這種描述符的活性。優(yōu)選地,輸入三個活性、更優(yōu)選為五個活性。圖5截屏圖的右邊部分顯示的實例,其中輸入了11個化學(xué)結(jié)構(gòu)的代碼,以及對于描述符phERG的11個不同活性。
基于這些輸入數(shù)據(jù),例如從數(shù)據(jù)庫中計算或讀取物理-化學(xué)性能,并且對于各種模型進(jìn)行PLS。在圖6中顯示了該數(shù)據(jù)分析的結(jié)果。例如,如果僅考慮兩種物理-化學(xué)性能(例如ClogP和表面積Surface),上述等式(2)變?yōu)槿缦耏=a·clogP+b·表面積(surface)+c如果使用了圖5中所示生物描述符的第一數(shù)值,并且假定clogP=3.0且表面積=3452(作為例子),等式(2)應(yīng)寫成7.04=a·3.0+b·345+c基于這個等式與對應(yīng)于其它活性值和參數(shù)值的其它等式,需要確定a、b和c。
圖6在其上面表格中顯示了五種不同模型的結(jié)果,也就是該表中所列的序號15到19。通過在PLS中所考慮的變量(如物理-化學(xué)性能)的數(shù)目(參見該表最右側(cè)欄),將這些模型彼此區(qū)別開。該表第二和第三欄顯示了PLS的所計算的回歸系數(shù)R2和所計算的交叉驗證值Q2。為了能讓使用者容易地鑒別最好的結(jié)果,優(yōu)選的是,將這些最好結(jié)果區(qū)別于其它不優(yōu)選的結(jié)果而突出顯示。在表6中所示的例子中,將模型16的回歸系數(shù)R2為0.727突出顯示。此外,將模型19的交叉驗證值Q2為0.609突出顯示。R2和Q2越高,所選擇的模型越好。在最后一欄中,將模型18和19突出顯示,因為它們由于使用了少量的變量而是優(yōu)選的。所使用的變量越多,對于使用者來說越難于鑒別哪些參數(shù)比其它參數(shù)更重要,從而使用者可以更容易地解釋該模型。
除了僅僅在表中列出數(shù)目以外,圖6還顯示了也能依據(jù)本發(fā)明的優(yōu)選實施方式獲得的圖解結(jié)果??梢詫⒛P涂偨Y(jié)以不同的圖解說明形式顯示出來(參見表6下面表格中的第二和第三欄),并且可以將回歸曲線和系數(shù)曲線顯示出來。
圖7中顯示了示例性的系數(shù)曲線。該實施例是依據(jù)本發(fā)明第一方面的方法,其中使用了四個片段,并且在表7中顯示了這些片段的所計算的系數(shù)。對于前三個(片段35、片段47和片段58)該系數(shù)為正的,并且對于后一種參數(shù)(片段60)所計算的系數(shù)為負(fù)的。
圖8中清晰地顯示了不同片段的所計算系數(shù)與數(shù)據(jù)矩陣(參見圖3)之間的關(guān)系。該圖中,顯示了四個截屏圖。最左邊的截屏圖為在圖7中更詳細(xì)顯示的那個截屏圖,也就是片段35、片段47、片段58和片段60的系數(shù)。其右邊的另一截屏圖顯示了基于片段35、片段47、片段58、片段60和片段70所計算的模型的系數(shù)。更右邊的截屏圖顯示了片段1、片段5、片段6、片段38和片段43的系數(shù)。最后,最右邊的截屏圖顯示了片段35、片段58和片段60的所計算的系數(shù)。從這些不同的系數(shù)值可以清楚地看出,這些片段的影響是不同的。
在也顯示于圖8中的數(shù)據(jù)矩陣,將所考慮的片段的計算系數(shù)輸入。右邊組的四個系數(shù)0.076、-0.10、-0.230、和0.234與片段47、片段60、片段38和片段35相關(guān)聯(lián)。
如圖9中所示,依據(jù)本發(fā)明的方法進(jìn)一步包括步驟將該結(jié)果排序。圖9顯示了所列舉的“化學(xué)12”到“化學(xué)40”的等級得分。對于這些結(jié)構(gòu),示例性地列出了描述符pGLYT1、NHP_60、phERG、和Mdia_10的計算值。
優(yōu)選地,將在對于每個化學(xué)結(jié)構(gòu)所獲得的該數(shù)據(jù)矩陣中的數(shù)據(jù)總結(jié)在一起,以獲得例如通過等式來獲得這種化學(xué)結(jié)構(gòu)的等級等級得分(Ranking_Score)=a·pGLYT+b·NHP_60+c·phERG+d·Mdia_10其中權(quán)數(shù)(weights)a=1、b=1、c=1、和d=1。該權(quán)數(shù)不是固定的,且可以調(diào)整為任意值。
這樣,對于新產(chǎn)生的分子“化學(xué)12”到“化學(xué)40”,依據(jù)本發(fā)明獲得了其等級。
權(quán)利要求
1.一種方法,其包括步驟a)提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù);b)提供有關(guān)至少一個生物描述符的數(shù)據(jù);c)計算對應(yīng)于每個化學(xué)結(jié)構(gòu)的結(jié)構(gòu)片段;d)將對應(yīng)于每個化學(xué)結(jié)構(gòu)的所述結(jié)構(gòu)片段與所述生物描述符數(shù)據(jù)聯(lián)系起來,以獲得數(shù)據(jù)矩陣;e)分析所述數(shù)據(jù)矩陣中的數(shù)據(jù),考察每個化學(xué)結(jié)構(gòu)的片段對于所述生物描述符的影響;和f)將所述分析的結(jié)果呈現(xiàn)出來。
2.權(quán)利要求1的方法,其中在步驟e)中,將步驟c)中計算的每個片段與所述生物描述符數(shù)據(jù)關(guān)聯(lián)起來。
3.權(quán)利要求1或2的方法,其中在步驟d)中,基于預(yù)定的支架結(jié)構(gòu)來選擇所述片段。
4.權(quán)利要求1或2的方法,其中在步驟d)中,基于分子片段形成所述片段。
5.權(quán)利要求3或4的方法,其中在步驟d)之后的步驟是計算對應(yīng)于每個片段的物理-化學(xué)性能。
6.權(quán)利要求5的方法,其中步驟e)分析所述數(shù)據(jù)矩陣中的數(shù)據(jù),考察片段和其物理-化學(xué)性能對于生物描述符的影響。
7.權(quán)利要求6的方法,其中在步驟e)中,將每個片段的每個物理-化學(xué)性能與所述生物描述符數(shù)據(jù)關(guān)聯(lián)起來。
8.一種方法,其包括步驟A)提供有關(guān)至少一組化學(xué)結(jié)構(gòu)的數(shù)據(jù);B)提供有關(guān)至少一個生物描述符的數(shù)據(jù);C)計算每個化學(xué)結(jié)構(gòu)的物理-化學(xué)性能;D)將每個化學(xué)結(jié)構(gòu)的所述物理-化學(xué)性能與所述生物描述符數(shù)據(jù)聯(lián)系起來,以獲得數(shù)據(jù)矩陣;E)分析所述數(shù)據(jù)矩陣中的數(shù)據(jù),考察每個化學(xué)結(jié)構(gòu)的每個物理-化學(xué)性能對于所述生物描述符的影響;和F)將所述分析的結(jié)果呈現(xiàn)出來。
9.權(quán)利要求8的方法,其中在步驟E)中,將每個化學(xué)結(jié)構(gòu)的每個物理-化學(xué)性能與所述生物描述符數(shù)據(jù)關(guān)聯(lián)起來。
10.權(quán)利要求5~9中任一項的方法,其中所述化學(xué)結(jié)構(gòu)或片段的所述物理-化學(xué)性能選自于由親水性、疏水性、電性、形狀、和兩親性組成的組。
11.權(quán)利要求1~10中任一項的方法,其中所述生物描述符數(shù)據(jù)獨立地選自于藥理學(xué)數(shù)據(jù)、毒理學(xué)數(shù)據(jù)和藥物代謝動力學(xué)數(shù)據(jù)。
12.權(quán)利要求11的方法,其中所述至少一種生物描述符選自于由與受體活性、選擇性、生物利用度、和體內(nèi)活性相關(guān)的描述符組成的組。
13.權(quán)利要求1~12中任一項的方法,其中在步驟e)或E)中使用部分最小二乘方的方法。
14.權(quán)利要求1~13中任一項的方法,其中在步驟f)中,將該結(jié)果顯示為依賴于化學(xué)結(jié)構(gòu)和生物描述符的二維特性曲線,所述特性曲線代表了每個片段或每個物理-化學(xué)性能對于生物描述符的正面或負(fù)面影響。
15.權(quán)利要求14的方法,其中使代表每個片段或每個物理-化學(xué)性對于所述生物描述符的正面影響的那部分所述特性曲線區(qū)別于代表每個片段或每個物理-化學(xué)性對于所述生物描述符的負(fù)面影響的那部分所述特性曲線而突出顯示。
16.權(quán)利要求15的方法,其中不同部分顯示不同顏色。
17.權(quán)利要求1~16中任一項的方法,其進(jìn)一步包括步驟以獨立的數(shù)據(jù)組使該結(jié)果生效。
18.權(quán)利要求14~17中任一項的方法,其進(jìn)一步包括步驟將該結(jié)果排序。
19.權(quán)利要求18的方法,其中將對于每個化學(xué)結(jié)構(gòu)獲得的數(shù)據(jù)矩陣中的數(shù)據(jù)總結(jié)在一起,以獲得這種化學(xué)結(jié)構(gòu)的等級。
20.權(quán)利要求1~18中任一項的方法,其進(jìn)一步包括步驟自動生成具有良好多維外形的新分子。
全文摘要
本發(fā)明涉及一種自動生成多維結(jié)構(gòu)活性與結(jié)構(gòu)性能關(guān)系的方法。
文檔編號G06F19/00GK1920839SQ200610108999
公開日2007年2月28日 申請日期2006年7月31日 優(yōu)先權(quán)日2005年8月1日
發(fā)明者霍爾格·費希爾, 曼弗雷德·坎西 申請人:霍夫曼-拉羅奇有限公司