專利名稱:基因表達量的歸一化方法、程序和系統(tǒng)的制作方法
技術領域:
本發(fā)明所屬的技術領域涉及采用基因表達分析板如DNA芯片獲得的 基因表達量的測量數(shù)據(jù)進行歸 一 化(normalization)或標準化 (standardization)、分析、校正等。
背景技術:
近年來,DNA芯片或DNA微陣列(本文中稱"DNA芯片")的使用已 經(jīng)變得日益普遍。DNA芯片攜帶大量不同種類的固定在一起的DNA寡糖 作為板表面的探測核酸。通過用DNA芯片檢測固定在板表面的探測核酸與 采集的細胞的樣品核酸中目標核酸之間的雜交,可以全面分析采集的細胞 中的基因表達。
在用DNA芯片進行基因表達分析時,隨著雜交檢測技術的進步,DNA 芯片不再限于檢測有無基因表達,而逐漸變得可以定量測量基因表達量。 例如,通過定量測定雜交的熒光強度來獲得指示基因表達量的定量數(shù)值的 技術,已在一定程度上投入使用。
因此,正在努力對指示基因表達量的定量數(shù)值進行歸一化。本文中術 語"歸一化,,是指,將基因表達量轉(zhuǎn)化為數(shù)值,以便可以與另一種基因表達 分析法獲得的另一基因表達量進行對比?;虮磉_量歸一化方法有,利用 標準細胞的基因表達量作為歸一化指標的方法,利用穩(wěn)定期表達的基因的 表達量作為歸一化指標的方法,以及利用DNA芯片基因表達分析中測定的 所有基因表達量之和作為歸 一化指標的方法。
首先說明利用標準細胞的基因表達量作為歸一化指標的方法。如圖9 所示,分別從標準細胞91和需要分析基因表達的細胞92獲得樣品核酸。 將具有不同特性的熒光物質(zhì)93、 94與各個樣品核酸結合,再將兩種樣品核 酸混合并加到DNA芯片的板表面。接下來,根據(jù)熒光物質(zhì)93的激發(fā),測 定固定在DNA芯片基板表面95上的探測核酸與來自標準細胞91的樣品核 酸97之間的雜交(用熒光強度表示),以獲得標準細胞的基因表達量。用該
標準細胞的基因表達量作為指標,將細胞92的基因表達量(基于焚光物質(zhì) 94的激發(fā)的熒光強度)歸一化,以備進行基因表達分析。
接下來說明用穩(wěn)定期表達的基因的表達量作為歸一化指標的方法。如 圖IO所示,探測核酸102是在穩(wěn)定期表達且將與基因雜交的核酸,將該核 酸預先固定在DNA芯片基板表面101上。測定探測核酸102和來自將進行 基因表達分析的細胞103的樣品核酸104之間的雜交水平(用熒光強度表 示),獲得將進行基因表達分析的細胞103中的基因表達量,用作進行歸一 化時的指標。
接下來說明利用DNA芯片的基因表達分析中測定的所有基因表達量 之和作為歸一化指標的方法。經(jīng)驗表明,在用DNA芯片進行的基因表達分 析中,所測定的所有基因表達量(熒光強度)之和為基本恒定的數(shù)值,因此進 行歸一化時,用DNA芯片基因表達分析中測定的所有基因表達量之和作為指標。
此外,有關DNA芯片等所得基因表達量的分析方法、校正方法等的在 先出版物包括,例如,特開2002-71688號公報,特開2002-267668號公報 和特開2003-28862號公報。北野宏明編的"遺傳算法1-4"(產(chǎn)業(yè)圖書)也 是關于遺傳算法的出版物,其與本發(fā)明部分相關。
用標準細胞的基因表達量作為歸一化指標的方法有一個問題,除了用 同樣的標準細胞進行歸一化的情況以外,不能比較基因表達量。即,例如, 用不同批次的標準細胞進行歸一化時,單獨的基因表達量不能進行對比。 另一問題是,基因表達量僅能表示為所述標準細胞的基因表達量的相對值。
用穩(wěn)定期表達的基因表達量作為歸一化指標的方法也有一個問題,它 難以發(fā)現(xiàn)始終以恒定水平表達的基因,而且實踐中,由于細胞采集時刻的 不同或由于對細胞施加外部壓力,導致基因表達量常常有變動。由于歸一 化所用指標的變動較大,很難獲得高度可靠的數(shù)值,即使用穩(wěn)定期表達的 基因表達量作為歸一化指標對基因表達量進行歸一化時也是如此。
用DNA芯片基因表達分析中測定的所有表達量之和作為歸一化指標 的方法缺乏任何理論證據(jù),并且也有指標的可靠性和精確度方面的問題。
因此,本發(fā)明的主要目的是,通過提供獲得高度可靠且高度精確的歸 一化指標的方法,來提高將單獨測定的基因表達量歸 一化的可靠性和精確 度,使得可以對比和驗證基因表達量。
發(fā)明內(nèi)容
本發(fā)明提供了基因表達量的歸一化方法,其利用為獲取指標而測定的 多個基因表達量,將為基因表達分析而測定的基因表達量歸一化,所述方
法包括得出為獲取指標而測的所述多個基因表達量之間的相關性;以及用 所得相關性作為指標,將為分析基因表達而測的所述基因表達量歸一化。
相關性可以從相關性函數(shù)中獲得,其包括為獲取指標而測的多個基因 表達量作為參數(shù)。例如,可以在兩種以上實驗條件下采集細胞,并在所述 兩種以上實驗條件下獲得多個基因表達量,以所述多個基因表達量之間的 相關性作為函數(shù)值,并選擇多個接近恒定值的函數(shù)值進行組合,獲得所述 相關性函數(shù)。可以通過例如設定兩個以上細胞采集時刻,在所述實驗條件 下獲得多個基因表達量。
此外,可以在獲取相關性函數(shù)的基礎上選出用于獲取指標的多個探測 核酸。在這種情況下,優(yōu)先選取對所述函數(shù)值具有很大貢獻的多個基因表 達量的組合。
如上所述,本發(fā)明的基因表達量歸一化方法,可以利用為獲取指標而 測的多個基因表達量、并利用相關性函數(shù),將為基因表達分析而測的基因 表達量歸一化。必須在基因表達分析之前選取探測核酸和獲取相關性函數(shù), 二者都用于獲取指標。
需指出,本發(fā)明的方法可以寫成程序來自動執(zhí)行。
此外,本發(fā)明可以釆用系統(tǒng)的形式來實施。在這種情況下,該系統(tǒng)可 以至少包括例如以下構成輸入裝置,用于輸入所測的基因表達量;輸出 裝置,用于輸出相關性函數(shù),該相關性函數(shù)包括為獲取所述指標而測的所 述多個基因表達量作為參數(shù);歸一化指標獲取裝置,其根據(jù)所述相關性函 數(shù)對所述多個基因表達量進行數(shù)學處理,以獲得所述多個基因表達量之間 的相關性,其中所述基因表達量是為獲取所述指標而測的并由所述輸入裝 置輸入;以及基因表達量歸一化裝置,其基于所述相關性將為分析基因表 達而測的所述基因表達量歸 一化。
所述系統(tǒng)可以設有相關性函數(shù)獲取裝置,其在兩種以上實驗條件下采 集細胞,并在所述兩種以上實驗條件下獲得多個基因表達量,以所述多個 基因表達量之間的相關性作為函數(shù)值,并選擇多個接近恒定值的函數(shù)值進 行組合,獲得所述相關性函數(shù)。此外,所述系統(tǒng)也可以設有組合選擇裝置, 其選取對所述函數(shù)值具有很大貢獻的所述多個基因表達量的組合,作為獲 取指標所用的多個探測核酸。
本文使用的一些技術術語將定義如下。
術語"基因表達量"指細胞中具體基因的表達量,包括固定在DNA芯
片板表面的探測核酸之間的以焚光強度形式測定的雜交水平值(測量數(shù)據(jù)), 基于數(shù)值獲得的基因表達量估計值,等等。
術語"歸一化"是指,將基因表達分析等獲得的數(shù)值如熒光強度換算 為能與其它基因表達分析所得的所有測量值進行比較的數(shù)值。
術語"兩種以上實驗條件"是指,使多個基因的表達量發(fā)生變化的實 驗條件。該術語包括,例如,設定多個樣品細胞采集時刻的情況,和對細 胞施加預定的外部刺激、導致基因表達量改變的情況。術語"細胞采集時刻" 是指,在推定基因表達量隨時間的變化已終止的條件下,設定獲取樣品細 胞的時間的情況。如果有 一定把握經(jīng)另外的方法推定基因表達量隨時間的 變化已終止的時刻,術語"細胞采集時刻"指該時刻。
術語"雜交"是指,具有互補堿基序列結構的核酸之間形成互補鏈(雙 鏈)的反應。
術語"核酸,,是指,由噪呤或嘧啶堿基組成的核苷的磷酸酯和糖通過 糖苷鍵連接而成的聚合物(核苷酸鏈),包括廣泛多種核苷酸鏈,諸如探針
DNA之類的寡核苷酸、多核苷酸、由噤呤核苷酸和嘧啶核苷酸相互聚合形 成的DNA(全長及其片段)、經(jīng)逆轉(zhuǎn)錄而得的cDNA (c-探針DNA)、 RNA以 及聚酰胺核苷酸衍生物(PNA)。
術語"探測核酸"是指,固定或游離在反應區(qū)的介質(zhì)中的核酸分子, 其作用是,作為探針,檢測具有與該核酸分子特異性相互作用的互補堿基 序列的核酸分子。典型的例子包括寡核苷酸或多核苷酸,如DNA〗果針。術 語"目標核酸"是指,從細胞獲得的樣品核酸中、能與該探測核酸雜交的 核酸。
利用本發(fā)明,可以提高基因表達量歸一化的可靠性和精確度。即在用 DNA芯片進行基因表達分析時,單獨測量的基因表達量可以根據(jù)本發(fā)明進 4亍歸 一化,/人而進4亍對比和-險i正。
附圖簡述
圖1說明基因表達量歸一化流程圖。
圖2顯示本發(fā)明DNA芯片的構造實例。
圖3描述本發(fā)明一例獲取相關性函數(shù)的方法。
圖4顯示多個細胞釆集時刻點的基因表達量擬合模型曲線的圖。
圖5顯示用于獲取指標的多個探測核酸的一例選擇方法。
圖6顯示校正DNA芯片中基因表達量的波動的方法。
圖7示一例數(shù)據(jù)驗證方法。
圖8顯示本發(fā)明一例基因表達量歸一化系統(tǒng)。
圖9顯示一種常規(guī)技術,并說明用標準細胞的基因表達量作為歸一化 指標的方法。
圖10顯示另 一種常規(guī)技術,并說明用在穩(wěn)定期(stationary state)表達的 基因的基因表達量作為歸一化指標的方法。
具體實施例方式
參照附圖描述本發(fā)明優(yōu)選實施例。需指出,下文所述實施例說明,固 定在DNA芯片板表面的探測核酸與采集的細胞的樣品核酸中目標核酸之間 的雜交水平是以熒光強度的形式獲取的,本發(fā)明的范圍不限于該實施例。
首先用圖l說明基因表達量歸一化流程。在圖1中,流程A指示RNA 處理流程,流程B代表基因組DNA處理流程。需指出,在圖1中,(s)指 示流程開始,(E)代表流程結束(這些含義將同樣應用于下文中)。
RNA處理流程A包括,制備該流程所用DNA芯片的階段(標記為Al, A2),從采集的細胞獲取樣品核酸并制備它們的階段(標記為A3, A4),測量 固定在DNA芯片板表面的探測核酸與采集的細胞的樣品核酸中目標核酸之 間的雜交水平(用熒光強度表示)、并獲取基因表達量的階段(標記為A5 , A6), 以及獲取使所測基因表達量歸一化所需的指標的階段(標記為A7)。這些階 段將下文中逐一 進行描述。
關于DNA芯片制備階段(圖1中標記為Al, A2), 一例RNA處理流程 A所用DNA芯片的構建用圖2說明。在RNA處理流程A所用DNA芯片 上,預先固定用于獲取指標的多個探測核酸(圖2中圖標21)和用于基因表達 分析的多個探測核酸(圖2中圖標21以外的核酸,例如圖標22所示)。需指
出,用于獲取指標的多個探測核酸的固定位置不局限于圖2中的位點,并 且,例如,作為對照探針的多個探測核酸可以在板表面的預定位置固定在 一起。選取用于獲取指標的多個探測核酸的方法在后文中描述。
接下來,再參照圖1,描述從采集的細胞獲取樣品核酸并制備它們的
階段(標記為A3, A4)。 在RNA處理流程A中,通過從采集的細胞中提取 RNA并用本領域已知方法合成具有與所述RNA互補的序列的cDNA ,從 而獲得樣品核酸(標記為A3)。樣品核酸可以用限制酶變?yōu)槠?標記為A4)。 接下來,描述測量固定在DNA芯片板表面的#:測核酸與采集的細胞的 樣品核酸中目標核酸之間的雜交水平(用熒光強度表示)、并獲取基因表達量 的階段(標記為A5, A6)。將樣品核酸加到固定在DNA芯片板表面的探測 核酸上,利用熒光強度等測定探測核酸與樣品核酸中目標核酸之間的雜交 水平(標記為A5)。隨后基于測量數(shù)據(jù),獲得基因表達量(歸一化前的推定量) (標記為A6)。
接下來,描述獲取使所測基因表達量歸 一化所需的指標的階段(標記為 A7)。在標記為A7的階段中,確定為獲取指標而測定的多個基因表達量之 間的相關性(標記為A6)。隨后用該相關性作為為基因分析目的而測定的基 因表達量的歸一化指標。該步驟可以寫出程序而自動執(zhí)行。本文中術語"相 關性"指從相關性函數(shù)獲得的值,其包括為獲取上述指標而測定的多個基 因表達量作為參數(shù)。獲取相關性函數(shù)的方法在后文中描述。
采用在標記為A7的階段獲得的指標(箭頭A8),將基于多個探測核酸 和樣品核酸中目標核酸之間雜交水平(測量數(shù)據(jù))的基因表達量(箭頭A9)歸 一化(標記為Cl)。該步驟可以寫出程序而自動執(zhí)行。
另一方面,基因組DNA處理流程B包括,制備該流程所用DNA芯片 的階段(標記為Bl),從采集的細胞獲取樣品核酸并制備它們的階段(標記為 B3, B4),以及測量用于獲取細胞數(shù)的探測核酸與采集的細胞的樣品核酸中 目標核酸之間的雜交水平(用熒光強度表示)、并獲取細胞采集數(shù)的階段(標 記為B5, B6)。這些階段將在下文中逐一進行描述。
首先描述制備DNA芯片的階段(標記為Bl)。在基因組DNA處理流程 B所用DNA芯片的板表面,預先固定用于獲取細胞數(shù)的探測核酸。將具有 與基因組DNA中以基本恒定百分比出現(xiàn)的重復序列或其一部分相同的序列 (如Alu序歹ij)的核酸固定,作為用于獲取細胞數(shù)的探測核酸。
需指出,用于獲取細胞數(shù)的探測核酸可以固定在DNA芯片板表面的任 何區(qū)域。例如,可以在RNA處理流程A所用DNA芯片的板表面的區(qū)域固 定用于獲取細胞數(shù)的探測核酸,或者在另外的DNA芯片上獲取細胞數(shù)。
接下來,描述從采集的細胞獲取樣品核酸并制備它們的階段(標記為 B3, B4)。在基因組DNA處理流程B中,用本領域已知方法,從采集的細 胞提取基因組DNA,獲得樣品核酸(標記為B3)。從基因組DNA提取的樣 品核酸,經(jīng)限制酶消化成片段后,投入使用(標記為B4)。
接下來,描述測量用于獲取細胞數(shù)的探測核酸與采集的細胞的樣品核 酸中目標核酸之間的雜交水平(用熒光強度表示)、并獲取細胞采集數(shù)的階段 (標記為B5, B6)。將樣品核酸加到固定在DNA芯片板表面的探測核酸上, 利用熒光強度等測定探測核酸與樣品核酸中目標核酸之間的雜交水平(標記 為B5)。通過測定目標核酸中重復序列的量(以熒光強度等表示),獲得指示 細胞采集數(shù)的指標(標記為B6)。
將基于基因表達分析所用多個探測核酸與目標核酸之間雜交水平(測 量數(shù)據(jù))獲得的基因表達量(箭頭A9),用指示細胞采集數(shù)的指標,換算為每 單位細胞數(shù)的值(箭頭B8),從而將基因表達量歸一化(標記為Cl)。需指出, 該步驟可以寫出程序而自動執(zhí)行。
將基于A7階段所得指標而歸一化的基因表達量與基于B6階段所得指 標而歸一化的基因表達量進行對比,研究對比結果,可以驗證測量數(shù)據(jù)(標 記為C1)。該步驟可以寫出程序而自動執(zhí)行。
接下來,用圖3-5說明一例獲取本發(fā)明相關性函數(shù)的方法。需指出, 該方法包括獲取指標所用多個探測核酸的選擇方法。
本發(fā)明中,從為獲取指標測定的多個基因的表達量及其相關性,可以 獲得使為基因表達分析而測定的基因表達量歸一化的指標。相關性必須在 測定基因表達量之前獲得。
在兩種以上實驗條件下采集細胞,并在所述兩種以上實驗條件下獲得 多個基因表達量,以所述多個基因表達量之間的相關性作為函數(shù)值,并選 擇多個接近恒定值的函數(shù)值進行組合,可獲得上述相關性函數(shù)。下文將詳 述一具體例。
需指出,在獲取相關性函數(shù)時使用的多個基因表達量,可以采用在線
數(shù)據(jù)庫(MGED, BodyMap等)公開的測量數(shù)據(jù),或者可以另外進行雜交以 獲取測量數(shù)據(jù)。
圖3描述本發(fā)明一例獲取相關性函數(shù)的方法。
首先,在設定的時刻t(圖3中為5個時刻)采集細胞31,從細胞31獲 得樣品核酸。接下來,將樣品核酸加到DNA芯片32各個孔33中,測定熒 光強度,以此確定固定在DNA芯片32板表面的探測核酸與樣品核酸中目 標核酸之間的雜交水平。
在圖3中,橫軸代表細胞采集時刻t,縱軸代表熒光強度(基因表達量)。 在圖3中,將在DNA芯片32上檢測到基因雜交(圖3中為g,-g4)的每一細 胞采集時刻t的熒光強度(基因表達量,g(t))作圖。
如下文所述獲得相關性函數(shù)。首先,將不同細胞采集時刻的多個基因 表達量g(t)(圖3中為grg4)組合(例如,圖3中的圖標34-38),獲得相應的 函數(shù)值f(g(t))。隨后,將圖中圖標34-38所示相應函數(shù)值f(g(t))中最接近恒 定值的基因表達量g(t)選出進行組合。用作為組合選出的多個探測核酸獲 取指標,另外利用該組合獲得相關性函數(shù)。需指出,該步驟可以寫出程序 而自動執(zhí)行。
當獲取使為基因分析而測定的基因表達量歸一化所用的上述指標時, 由上述方法選取并將用于獲取指標的多個探測核酸必須預先固定在DNA芯 片的板表面。另外還用到由上述方法獲取的相關性函數(shù)。
需指出,雖然通過圖3中設定的5個細胞采集時刻獲得了相關性函數(shù), 但本發(fā)明的相關性函數(shù)適用于同 一基因在兩種以上實驗條件下表達量發(fā)生 變化的情況。例如,不僅在設定兩個以上細胞采集時刻的情況下,而且在 細胞31受到外部刺激39致使同一基因表達量改變的情況下,所得的基因 表達量可以用作獲取本發(fā)明相關性函數(shù)的測量數(shù)據(jù)。
當用多個探測核酸獲取指標時,優(yōu)選在不同實驗條件下表達量變化的 基因。例如,因設定兩個以上細胞采集時刻致使實驗條件改變時,因細胞 采集時刻不同導致表達量不同的基因(如時鐘基因),適合作為用作對照的多 個探測核酸。
圖4說明一例使多個細胞采集時刻的基因表達量擬合模型曲線的方 法。在圖中,橫軸代表細胞采集時刻,縱軸代表細胞表達量。
例如,當多個細胞采集時刻的基因表達量擬合模型曲線時,有可能在 預定范圍內(nèi)獲得每一時刻的函數(shù)值f(g(t))。
圖4中中,圖標41指示各個細胞采集時刻t的基因表達量?;谶@些
圖標41,擬合模型曲線42。
模型曲線可以采用例如B-樣條曲線(splinecurve)。通過調(diào)整參數(shù),使各 個圖標41與模型曲線42之間的誤差43最小,從而獲得模型曲線42。 一 旦獲得模型曲線42,就可獲得具有不同的次元數(shù)的多個模型曲線。根據(jù) AIC (赤池情報基準)評價模型曲線的次元(dimension),可以獲得最佳曲線 g(t)。需指出,該步驟可以寫出程序而自動執(zhí)行。
圖5顯示用于獲取指標的多個探測核酸的一例選擇方法。需指出,該 方法可以寫出程序而自動執(zhí)行。
在獲取相關性函數(shù)時,例如,如果將預定范圍內(nèi)每一時刻t的多個基因 表達量g(t)組合,所得的組合數(shù)將會很大。因此,用圖5所示流程選取獲取 指標時使用的多個探測核酸。
如上所述,獲取指標時所用多個探測核酸經(jīng)下述方法選出。首先,將 多個基因表達量g(t)組合,獲得相應函數(shù)值f(g(t))。將函數(shù)值f(g(t))最接近 恒定值E的基因表達量g(t)組合選出,從該組合中找出相關性函數(shù)f(g(t))(圖 標51)。
在上述方法中,可以利用權重值Wn,將函數(shù)值f(g(t))設為表示權重平 均值的公式52、將恒定值E設為表示時間平均值的公式53,找出最佳方案, 從而獲得相關性函數(shù)f(g(t))。需指出,在公式52中,"gi(t)"表示,在多個 基因n的基因表達量gn中,給定基因i在預定時刻t的表達量,"A" 表示誤差容許范圍。
在最佳方案導致大量計算的情況下,可釆用遺傳算法,找出次最佳方 案(圖標54),從而獲得相關性函數(shù)f(g(t))。需指出,遺傳算法詳見例如北野 宏明編"遺傳算法1-4 ,,(產(chǎn)業(yè)圖書出版)。
在以上情況中,選取權重值Wj等于或大于閾值的多個基因作為獲取指 標時使用的多個探測核酸(圖標55)。
接下來,用圖6說明校正DNA芯片中基因表達量波動的方法。需指 出,該方法可以寫出程序而自動執(zhí)行。
首先,將上述方法選出用于獲取指標的多個探測核酸固定在DNA芯片 基板表面的多個區(qū)域61。在圖6的DNA芯片中,探測核酸分別被固定在 五個區(qū)域。
當測量雜交水平時,用上述方法獲取區(qū)域61的指標(圖6中d -C5)。 將指標CrCs擬合模型曲線,獲得校正曲面63。需指出,在圖6中部的三 維圖中,對于DNA芯片上每個孔62而言,位置在a-b平面中示出,雜交 量(熒光值)由高度表示。
曲面模型可采用例如B-樣條曲面。當獲取曲面模型時,根據(jù)AIC(赤 池情報基準)評價模型每一 曲面的次元,可獲得最佳曲面。
接下來,每個孔62的基因表達量g^(熒光值)利用校正曲面63中該孔
的位置指標Ca,b進行歸一化。
此外,各個區(qū)域61所得指標的平均值可以在數(shù)據(jù)驗證時用作歸一化指標。
接下來,用圖7說明一例用上述方法所得指標進行數(shù)據(jù)驗證的方法。 需指出,該方法可以寫出程序而自動執(zhí)行。
多次測量雜交時,每次測量的數(shù)據(jù)可用各次測量中獲得的指標(圖7中
為Ca, Cb和Ce)來驗證可靠性。
以升序排列各次測量所得指標值,當所得為圖7中部所示S形曲線時, 其顯示指標值的分布遵循高斯分布(Gaussian distribution)規(guī)律,由此驗證, 各次測量的數(shù)據(jù)可靠性高。
以升序排列各次測量所得指標值,當所得為圖7底部所示多峰形曲線 時,有可能各次測量的數(shù)據(jù)可靠性低,從而有可能作出諸如丟棄這些數(shù)據(jù) 的決定。
接下來,用圖8說明本發(fā)明一例基因表達量歸一化系統(tǒng)。 圖8所示本發(fā)明系統(tǒng)構成如下,輸入裝置81(用于輸入基因表達量測定 值),輸出裝置82(用于輸出相關性函數(shù),包括為獲取指標而測的多個基因 表達量作為參數(shù)),歸一化指標獲取裝置83(用于根據(jù)相關性函數(shù),對為獲取 指標而測定的多個基因表達量進行數(shù)學處理,以獲取所述多個基因表達量 之間的相關性),基因表達量歸一化裝置84(用于將為基因表達分析目的而 測定的基因表達量歸一化),CPU 85, RAM 86, ROM 87,和連接上述獨立 模塊的總線88。
除上述元件之外,本發(fā)明的系統(tǒng)也可以裝有相關性函數(shù)獲取裝置(未示 出)和多個基因表達量的組合選擇裝置(未示出),所述相關性函數(shù)獲取裝置 通過在兩種以上實驗條件下釆集細胞,并在所述兩種以上實驗條件下獲得 多個基因表達量,以所述多個基因表達量之間的相關性作為函數(shù)值,獲得 上述相關性函數(shù),所述多個基因表達量的組合選擇裝置將對相關性數(shù)值具 有較大貢獻的組合選出作為用于獲取指標的多個探測核酸等。
工業(yè)實用性
根據(jù)本發(fā)明,在利用基因表達分析板進行的基因表達分析中,雜交的 定量測量可以被歸一化并具有高準確性。由于雜交的測量值可以被歸一化, 可以對比來自每一基因表達分析的測量數(shù)值并以高精確度進行驗證。
本發(fā)明的方法、程序和系統(tǒng)可以很容易地結合到采用DNA芯片等的測 量系統(tǒng)中。
權利要求
1、基因表達量的歸一化方法,所述基因表達量是為分析基因表達的目的而測定的,所述方法利用了為獲取指標而測定的多個基因表達量并包括以下步驟得出為獲取指標而測的所述多個基因表達量之間的相關性;以及將所得相關性作為指標,用于將為分析基因表達而測的所述基因表達量歸一化。
2、 根據(jù)權利要求l的方法,其中,所述相關性是可從相關性函數(shù)獲得 的值,所述函數(shù)包括為獲取指標而測的所述多個基因表達量作為參數(shù)。
3、 根據(jù)權利要求2的方法,其中,在兩種以上實驗條件下采集細胞, 并在所述兩種以上實驗條件下獲得多個基因表達量,以所述多個基因表達 量之間的相關性作為函數(shù)值,并選擇多個接近恒定值的函數(shù)值進行組合, 獲得所述相關性函數(shù)。
4、 根據(jù)權利要求3的方法,其中,在所述兩種以上實驗條件下獲得的 所述多個基因表達量通過設定兩個以上細胞采集時刻而獲得。
5、 根據(jù)權利要求3的方法,其中,選取對所述函數(shù)值具有很大貢獻的 所述多個基因表達量的組合,作為獲取指標所用的多個探測核酸。
6、 根據(jù)權利要求1的方法,其中,所述基因表達量是,測量固定在 DNA芯片板表面的探測核酸和與所述探測核酸雜交的目標核酸之間的用熒 光強度表示的雜交水平而獲得的數(shù)值。
7、 基因表達量的歸一化程序,所述基因表達量是為分析基因表達的目 的而測定的,所述程序利用了為獲取指標而測定的多個基因表達量并包括 以下步驟得出為獲取指標而測的所述多個基因表達量之間的相關性;以及 將所得相關性作為指標,用于將為分析基因表達而測的所述基因表達 量歸一化。
8、 根據(jù)權利要求7的程序,其中,所述程序包括從相關性函數(shù)獲取所 述相關性的步驟,所述函數(shù)包括為獲取指標而測的所述多個基因表達量作 為參數(shù)。
9、 根據(jù)權利要求8的程序,其中,所述程序包括獲取所述相關性函數(shù) 的步驟,其是在兩種以上實驗條件下采集細胞,并在所述兩種以上實驗條 件下獲得多個基因表達量,以所述多個基因表達量之間的相關性作為函數(shù) 值,并選擇多個接近恒定值的函數(shù)值進行組合,獲得所述相關性函數(shù)。
10、 根據(jù)權利要求9的程序,其中,使用了通過設定兩個以上細胞采 集時刻而獲得的多個基因表達量。
11、 根據(jù)權利要求9的程序,其中,所述程序包括選取對所述函數(shù)值 具有很大貢獻的所述多個基因表達量的組合,作為獲取指標所用的多個探 測核酸。
12、 根據(jù)權利要求7的程序,其中,所述基因表達量是,測量固定在 DNA芯片板表面的探測核酸和與所述探測核酸雜交的目標核酸之間的用熒 光強度表示的雜交水平而獲得的數(shù)值。
13、 基因表達量的歸一化系統(tǒng),所述基因表達量是為分析基因表達的 目的而測定的,所述系統(tǒng)利用了為獲取指標而測定的多個基因表達量并至 少包括輸入裝置,用于輸入所測的基因表達量;輸出裝置,用于輸出相關性函數(shù),該相關性函數(shù)包括為獲取所述指標 而測量的所述多個基因表達量作為參數(shù);歸一化指標獲取裝置,其根據(jù)所述相關性函數(shù)對所述多個基因表達量 進行數(shù)學處理,以獲得所述多個基因表達量之間的相關性,其中所述基因 表達量是為獲取所述指標而測的并由所述輸入裝置輸入;以及基因表達量歸一化裝置,其基于所述相關性將為分析基因表達而測的 所述基因表達量歸一化。
14、 根據(jù)權利要求13的系統(tǒng),其中,所述系統(tǒng)裝有獲取所述相關性函 數(shù)的裝置,其在兩種以上實驗條件下采集細胞,并在所述兩種以上實驗條 件下獲得多個基因表達量,以所述多個基因表達量之間的相關性作為函數(shù) 值,并選擇多個接近恒定值的函數(shù)值進行組合,獲得所述相關性函數(shù)。
15、 根據(jù)權利要求14的系統(tǒng),其中,使用了通過設定兩個以上細胞采 集時刻而獲得的多個基因表達量。
16、 根據(jù)權利要求14的系統(tǒng),其中,所述系統(tǒng)裝有組合選擇裝置,其 選取對所述函數(shù)值具有很大貢獻的所述多個基因表達量的組合,作為獲取 指標所用的多個探測核酸。
17、 根據(jù)權利要求13的系統(tǒng),其中,所述基因表達量是,測量固定在 DNA芯片板表面的探測核酸和與所述探測核酸雜交的目標核酸之間的用熒 光強度表示的雜交水平而獲得的數(shù)值。
全文摘要
本發(fā)明提供了獲取高度可靠且高度精確的指標的方法,所述指標使單獨測定的基因表達量歸一化,以進行對比和驗證,所述方法旨在提高基因表達量歸一化的可靠性和精確度。本發(fā)明還提供了基因表達量的歸一化方法,其利用為獲取指標而測的基因表達量,將為基因表達分析而測的基因表達量歸一化,其中利用相關性函數(shù)來確定為獲取指標而測的基因表達量之間的相關性,并用所得相關性作指標,將為基因表達分析而測的基因表達量歸一化??梢栽趦煞N以上實驗條件下采集細胞(31),并獲得所述細胞(31)在每一實驗條件下的基因表達量gn,以所述實驗條件(圖標34-38)下的基因表達量之間的相關性作為函數(shù)值,并選擇多個接近恒定值的函數(shù)值進行組合,獲得所述相關性函數(shù)。
文檔編號C12Q1/68GK101103272SQ20058004671
公開日2008年1月9日 申請日期2005年10月17日 優(yōu)先權日2004年11月15日
發(fā)明者大戶康紀, 阿部友照 申請人:索尼株式會社