專利名稱:用于除去實(shí)時(shí)pcr熒光數(shù)據(jù)中的步長不連續(xù)的系統(tǒng)和方法
背景技術(shù):
本發(fā)明總體上涉及聚合酶鏈反應(yīng)系統(tǒng),以及更具體地涉及用于除去聚合酶鏈反應(yīng)數(shù)據(jù)中的步長不連續(xù)的系統(tǒng)和方法。
聚合酶鏈反應(yīng)(PCR)是用于酶促地合成或擴(kuò)增所定義的核酸序列的體外方法。通常,該反應(yīng)使用兩個(gè)雜交到相反鏈并在側(cè)面與模板或要擴(kuò)增的目標(biāo)DNA序列相接的低聚核苷酸引子。通過熱穩(wěn)定DNA聚合酶來催化引子的延長。包括模板變性、引子退火和由聚合酶引起的退火引子的延伸的一系列重復(fù)周期導(dǎo)致特定DNA片段的指數(shù)式積聚。通常,熒光探測器或標(biāo)記被用于促進(jìn)擴(kuò)增處理的檢測和量化的處理中。
圖1示出了典型的實(shí)時(shí)PCR曲線,其中相對于用于典型PCR處理的周期數(shù)繪出了熒光強(qiáng)度值。在該情形下,在PCR的每個(gè)處理周期中對PCR產(chǎn)品的形成進(jìn)行監(jiān)視。通常在熱循環(huán)器中對擴(kuò)增進(jìn)行測量,所述熱循環(huán)器包括用于在擴(kuò)增反應(yīng)過程中測量熒光信號的部件和裝置。這種熱循環(huán)器的例子是RocheDiagnotics LightCycler(Cat.No.20110468)。擴(kuò)增產(chǎn)品例如通過熒光標(biāo)注的雜交探測器或在某些情形下也通過結(jié)合到雙鏈DNA上的熒光染色劑得以被檢測,所述熒光標(biāo)注的雜交探測器在結(jié)合到目標(biāo)核酸上時(shí)只發(fā)射熒光信號。
用于實(shí)時(shí)PCR中的熒光染色劑對溫度是敏感的。熱循環(huán)概覽圖可以包括改變退火溫度。退火溫度的改變表現(xiàn)為熒光讀出值的不連續(xù)。圖2示出了在周期6之后能看到退火溫度的改變的說明性情形。
圖3示出了與使用圖2的概覽圖而進(jìn)行的試驗(yàn)相對應(yīng)的熒光數(shù)據(jù)讀出。在HEX通道中可以清楚地看到,不連續(xù)存在于周期5和6之間。圖3取自具有104IU/ml濃度的B19細(xì)小-病毒樣品。對溫度具有更小敏感性的FAM染色劑具有比HEX染色劑更低幅度的跳躍不連續(xù)。
但是,如果目標(biāo)的濃度增加,則不連續(xù)在熒光數(shù)據(jù)中得不到反映是可能的。例如,考慮具有2.9×1011IU/ml濃度的B19細(xì)小-病毒樣品,即使在周期5之后存在退火溫度的改變,在圖4a中也看不到不連續(xù)。
一些當(dāng)前的PCR系統(tǒng)實(shí)現(xiàn)了用于除去由于退火溫度的改變而導(dǎo)致的步長不連續(xù)的方法。通常,這樣的系統(tǒng)需要針對與退火溫度的改變相對應(yīng)的周期數(shù)和所預(yù)期的最大熒光改變而分析特定輸入?yún)?shù)。這樣的方法具有許多限制。首先,它們不能處理高滴度樣品。這可以在圖4b中看出,在圖4b中通過這樣的系統(tǒng)對2.9×1011IU/ml濃度下的B19細(xì)小樣品已經(jīng)進(jìn)行了不正確的處理。第二,這樣的方法可能只處理不連續(xù)點(diǎn)處的小的最大(例如5)的絕對熒光單元變化。已經(jīng)在多個(gè)分析中觀察到,不連續(xù)處的熒光改變的幅度廣泛地不同。建立分析特定的輸入以指示最大變化是難以最優(yōu)化的。第三,這樣的方法不能處理基線偏移較高的熒光數(shù)據(jù)。在這種情形下,所提供的校正可能是不適當(dāng)?shù)?。第四,如果發(fā)生尖峰存在于一個(gè)周期或小于與退火溫度的變化相對應(yīng)的周期數(shù)的距離處,則所提供的校正被已知將導(dǎo)致所報(bào)告的結(jié)果濃度的變化;即錯(cuò)誤的結(jié)果。
因此,期望提供用于處理S形(SIGMOID)或生長曲線(尤其是PCR曲線)的、克服上述及其它問題的系統(tǒng)和方法。具體地,所述系統(tǒng)和方法應(yīng)當(dāng)以可靠和魯棒的方式執(zhí)行溫度步長校正。
發(fā)明內(nèi)容
本發(fā)明提供用于針對PCR處理過程中可能發(fā)生的溫度偏移而校正PCR數(shù)據(jù)的系統(tǒng)和方法。
本發(fā)明的實(shí)施例消除了實(shí)時(shí)的聚合酶鏈反應(yīng)數(shù)據(jù)的熒光中的跳躍不連續(xù)。不連續(xù)的存在可以引起不正確的結(jié)果計(jì)算,因此建議將其除去。取決于目標(biāo)的初始復(fù)制數(shù),熒光中的不連續(xù)在高濃度水平下可能是不存在的。使用八參數(shù)非線性模型的可靠區(qū)域來準(zhǔn)確地估算數(shù)據(jù)。所述方法克服了之前的用于除去所有濃度水平下的不連續(xù)的方法中的困難。
在一個(gè)實(shí)施例中,通過將非線性回歸處理應(yīng)用于模擬數(shù)據(jù)集合的非線性函數(shù)以確定非線性函數(shù)的參數(shù),包括步長不連續(xù)參數(shù),來確定擬合所接收的PCR數(shù)據(jù)集合的曲線的第一近似。非線性函數(shù)的一個(gè)例子是雙S形方程。也通過將回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),包括步長不連續(xù)參數(shù),來確定擬合PCR數(shù)據(jù)集合的曲線的第二近似。之后,基于為第一近似和第二近似中的每一個(gè)所確定的信息系數(shù)而選擇第一近似和第二近似中的一個(gè)。如果針對步長不連續(xù)參數(shù)而計(jì)算的可靠區(qū)間包括零值(如可靠區(qū)間跨越包括0值的范圍(如-1至1)),則不進(jìn)行步長校正。如果可靠區(qū)間不包括零值,則進(jìn)行步長校正。如果進(jìn)行步長校正,則步長變化之前的數(shù)據(jù)曲線部分被替換為所選擇的近似的合適部分,以產(chǎn)生偏移校正后的數(shù)據(jù)集合。在某些方面中,如果近似不能滿足擬合標(biāo)準(zhǔn)優(yōu)度,則不進(jìn)行步長校正。偏移校正后的數(shù)據(jù)集合被返回,并且可以被顯示或另外用于其他處理。
根據(jù)一個(gè)實(shí)施例,提供一種用于自動地除去表示生長過程的數(shù)據(jù)中的步長不連續(xù)的方法。通常,所述方法包括接收表示生長過程的數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值,以及通過將非線性回歸過程應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似,所述參數(shù)包括步長不連續(xù)參數(shù)。通常,所述方法還包括通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù),為第一近似和第二近似中的每一個(gè)確定信息系數(shù),以及基于所述信息系數(shù)選擇所述近似中的一個(gè)。通常,所述方法還包括針對所選擇的近似確定步長不連續(xù)參數(shù)的可靠區(qū)間,以及如果可靠區(qū)間不包括零值(如可靠區(qū)間跨越不包括0值的范圍),則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似代替數(shù)據(jù)集合的一部分。
根據(jù)另一實(shí)施例,提供一種計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可讀介質(zhì)包括用于控制處理器自動地除去表示生長曲線的數(shù)據(jù)集合中的步長不連續(xù)的代碼。通常,所述代碼包括用以執(zhí)行以下處理的指令接收表示生長過程的數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值,以及通過將非線性回歸過程應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似,所述參數(shù)包括步長不連續(xù)參數(shù)。通常,所述代碼還包括用以執(zhí)行以下處理的指令通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù),為第一近似和第二近似中的每一個(gè)確定信息系數(shù),以及基于所述信息系數(shù)選擇所述近似中的一個(gè)。通常,所述代碼還包括用以執(zhí)行以下處理的指令針對所選擇的近似確定步長不連續(xù)參數(shù)的可靠區(qū)間,以及如果可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似代替數(shù)據(jù)集合的一部分。
根據(jù)另一實(shí)施例,提供動態(tài)聚合酶鏈反應(yīng)(PCR)系統(tǒng),通常所述系統(tǒng)包括動態(tài)PCR分析模塊,其生成表示動態(tài)PCR擴(kuò)增曲線的PCR數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值;以及智能模塊。通常,智能模塊被適配為通過計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似以及通過計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似來處理PCR數(shù)據(jù)集合,以自動地除去數(shù)據(jù)集合中的步長不連續(xù),計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似是通過將非線性回歸處理應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù)而實(shí)現(xiàn)的,所述參數(shù)包括步長不連續(xù)參數(shù),計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似是通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù)而實(shí)現(xiàn)的,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù)。通常,所述智能模塊還被適配為為第一近似和第二近似中的每一個(gè)確定信息系數(shù),基于所述信息系數(shù)選擇所述近似中的一個(gè),針對所選擇的近似來確定步長非連續(xù)參數(shù)的可靠區(qū)間,以及,如果可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似來代替數(shù)據(jù)集合的一部分。
參照說明書的剩余部分,包括附圖和權(quán)利要求,將認(rèn)識本發(fā)明的其它特征和優(yōu)點(diǎn)。在下面參照附圖對本發(fā)明的其它特征和優(yōu)點(diǎn)以及本發(fā)明的各個(gè)實(shí)施例的結(jié)構(gòu)和操作進(jìn)行了詳細(xì)的描述。在附圖中,相同的附圖標(biāo)記表示相同的或功能相似的元件。
圖1示出了在PCR處理的情況下擴(kuò)增曲線的例子。
圖2示出了在周期6之后可以看到退火溫度的變化的情況。
圖3示出了FEM和HEX通道中的、取自具有104IU/ml濃度的B19細(xì)小病毒樣品的PCR擴(kuò)增曲線。
圖4示出了PCR擴(kuò)增曲線,該P(yáng)CR擴(kuò)增曲線示出如果目標(biāo)的濃度增加,則不連續(xù)沒有反映在熒光數(shù)據(jù)中是可能的。
圖5示出了用于針對PCR擴(kuò)增曲線中的溫度偏移進(jìn)行校正的處理的一個(gè)實(shí)施例。
圖6A-C示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于尖峰識別和替換處理的具體處理流程。
圖7示出了包括參數(shù)a-g的雙S形方程的分解。參數(shù)a-g定義雙S形曲線的形狀和位置。
圖8示出了參數(shù)(d)對曲線的影響以及(e)的位置對拐點(diǎn)的x值的影響。圖8中所有曲線具有相同的參數(shù)(除了參數(shù)d)。
圖9示出了針對不同的參數(shù)組的三個(gè)曲線形狀的例子。
圖10示出了根據(jù)一方面的用于確定雙S形方程的參數(shù)(e)和(g)的值的處理。
圖11A-B示出了針對初始參數(shù)組的Levenberg-Marquardt回歸處理的處理流程。
圖12示出了來自CAP/CTM HIV監(jiān)測器的分析的IQS(HEX通道)熒光數(shù)據(jù);原始熒光數(shù)據(jù)如點(diǎn)所示,校正后的數(shù)據(jù)如實(shí)線所示。
圖13示出了B19細(xì)小病毒目標(biāo)通道(FAM通道)分析的熒光數(shù)據(jù)(沒有任何實(shí)際的目標(biāo)被擴(kuò)增);原始熒光數(shù)據(jù)如點(diǎn)所示,校正后的數(shù)據(jù)如實(shí)線所示。
圖14示出了HBV高純凈(FAM通道)分析的目標(biāo)的熒光數(shù)據(jù);原始熒光數(shù)據(jù)如點(diǎn)所示,校正后的數(shù)據(jù)如實(shí)線所示。該分析不具有跳躍不連續(xù),所以,不需要對不連續(xù)的校正。
圖15示出了高濃度(2.9×1011IU/ml)B19細(xì)小病毒樣品(FAM通道)分析的熒光數(shù)據(jù);原始熒光數(shù)據(jù)如點(diǎn)所示,校正后的數(shù)據(jù)如實(shí)線所示。
圖16是示出了可被用于實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)的軟件資源和硬件資源之間的關(guān)系的總體框圖的例子。
圖17是示出了熱循環(huán)器裝置和計(jì)算機(jī)系統(tǒng)之間的關(guān)系的總體框圖的例子。
具體實(shí)施例 本發(fā)明提供了用于針對在擴(kuò)增處理過程中可能發(fā)生的溫度偏移而對PCR擴(kuò)增曲線和其它生長曲線進(jìn)行校正的系統(tǒng)和方法。
溫度偏移的一個(gè)例子是分析過程中某個(gè)周期處退火溫度的可控變化。通常,該溫度偏移發(fā)生在由基線區(qū)域表示的處理部分期間。該溫度變化引起隨后的在偏移發(fā)生的周期數(shù)處的熒光信號的偏移。這里將發(fā)生溫度偏移的周期稱為CAC,即退火變化周期。
在一個(gè)實(shí)施例中,通過將非線性回歸處理應(yīng)用于模擬數(shù)據(jù)集合的非線性函數(shù)而確定非線性函數(shù)的參數(shù)(包括步長不連續(xù)參數(shù)),來確定擬合PCR數(shù)據(jù)的曲線的第一近似。非線性函數(shù)的一個(gè)例子是在下面進(jìn)行了更具體的描述的雙S形方程。還可以通過將回歸處理應(yīng)用于第二非線性函數(shù)以確定包括步長不連續(xù)參數(shù)的第二函數(shù)的參數(shù),來確定擬合PCR數(shù)據(jù)集合的曲線的第二近似。然后,基于為第一和第二近似中的每一個(gè)而確定的信息系數(shù)來選擇第一近似和第二近似中的一個(gè)。如果針對步長不連續(xù)參數(shù)所計(jì)算的可靠區(qū)間包括零值(如可靠區(qū)間跨越包括0值的范圍),則不進(jìn)行步長校正。如果可靠區(qū)間不包括零值,則進(jìn)行步長校正。如果進(jìn)行步長校正,則步長變化之前的數(shù)據(jù)曲線部分被所選擇的近似的適當(dāng)部分代替,以產(chǎn)生偏移校正后的數(shù)據(jù)集合。在某些方面中,如果近似不滿足擬合標(biāo)準(zhǔn)優(yōu)度,則不進(jìn)行步長校正。偏移校正后的數(shù)據(jù)集合被返回,并且可以被顯示或另外用于其他處理。例如,偏移校正后的數(shù)據(jù)集合可以用于確定PCR分析的Ct值。
在PCR處理的情況下的擴(kuò)增曲線10的一個(gè)例子在圖1中示出。如圖所示,曲線10包括遲滯期區(qū)域15和指數(shù)期區(qū)域25。遲滯期區(qū)域15通常被稱為基線或基線區(qū)域。這樣的曲線10包括鏈接遲滯期區(qū)域和指數(shù)期區(qū)域的受關(guān)注的過渡區(qū)域20。區(qū)域20通常被稱為肘彎或肘彎區(qū)域。通常,肘彎區(qū)域限定了基線的末端和潛在處理的生長或擴(kuò)增率的過渡。識別區(qū)域20中的特定過渡點(diǎn)對于分析潛在處理的行為可能是有用的。在典型的PCR曲線中,識別被稱為肘彎值或周期門限(Ct)值的過渡點(diǎn)對于理解PCR處理的效率特性是有用的。
可以提供的類似S形或生長曲線的其它處理包括細(xì)菌處理、酶處理和耦合(binding)處理。例如,在細(xì)菌生長曲線中,受關(guān)注的過渡點(diǎn)被稱為遲滯期中的時(shí)間λ。根據(jù)本發(fā)明的產(chǎn)生可以被分析的數(shù)據(jù)曲線的其它具體處理包括鏈置換擴(kuò)增(SDA)處理、基于核酸序列的擴(kuò)增(NASBA)處理和轉(zhuǎn)錄中介擴(kuò)增(TMA)處理。SDA和NASBA處理和數(shù)據(jù)曲線的例子可以分別在Wang,Sha-Sha等人的“Homogeneous Real-Time Detection of Signal-Nucleotide Polymorphisms by StrandDisplacement Amp lificafion on the BD ProbeTec ET System”,Clin Chem 200349(10)1599和Weusten,Jos J.A.M.等人的“Principles of Quantitation of Viral LoadsUsing Nucleic Acid Sequence-based Amplification in Combination WithHomogeneous Detection Using Molecular Beacons”,Nucleic Acids Research,200230(6)26中找到。所以,雖然本文件的剩余部分將就本發(fā)明對PCR曲線的應(yīng)用性來討論本發(fā)明的實(shí)施例和方面,但是應(yīng)當(dāng)理解的是,本發(fā)明可以應(yīng)用于與其它處理相關(guān)的數(shù)據(jù)曲線。
如圖1所示,典型PCR數(shù)據(jù)生長曲線的數(shù)據(jù)可以在二維坐標(biāo)系統(tǒng)中得以表示,例如,通過PCR周期數(shù)定義x軸而積聚的多核苷酸生長指示器定義y軸。通常,如圖1所示,積聚生長的指示器是熒光強(qiáng)度值,因?yàn)闊晒鈽?biāo)記物的使用或許是最廣泛使用的標(biāo)記方案。但是,應(yīng)當(dāng)理解的是,取決于所使用的特定標(biāo)記和/或檢測方案可以使用其它指示器。豐度或積聚信號生長的其它有用指示器的例子包括發(fā)光強(qiáng)度、化學(xué)發(fā)光強(qiáng)度、生物發(fā)光強(qiáng)度、磷光強(qiáng)度、電荷轉(zhuǎn)移、電壓、電流、功率、能量、溫度、粘性、光散射、放射強(qiáng)度、反射率、透射率和吸光率。周期的定義還可以包括時(shí)間、處理周期、單元操作周期和再生周期。
根據(jù)本發(fā)明,參照圖5對用于校正動態(tài)PCR擴(kuò)增曲線的溫度偏移的處理100的一個(gè)實(shí)施例進(jìn)行描述。在步驟110中,接收或另外獲得表示曲線的實(shí)驗(yàn)數(shù)據(jù)集合。還識別發(fā)生溫度偏移的周期。通常,該周期值為已知的先驗(yàn)值,例如由提供該數(shù)據(jù)的設(shè)備或裝置所記錄的。圖1,3和4示出了繪制的PCR數(shù)據(jù)集合的例子,其中針對PCR曲線,y軸和x軸分別表示熒光強(qiáng)度和周期數(shù)。在某些方面,數(shù)據(jù)集合應(yīng)該包括沿著軸線連續(xù)的和等間隔的數(shù)據(jù)。
在處理100在駐留在諸如熱循環(huán)器的PCR數(shù)據(jù)采集裝置中的智能模塊(例如處理器運(yùn)行指令)中被執(zhí)行的情況下,在采集數(shù)據(jù)時(shí)可以實(shí)時(shí)地將數(shù)據(jù)集合提供給智能模塊,或者可以將數(shù)據(jù)集合存儲在存儲器中或緩沖器中并在完成試驗(yàn)之后將所述數(shù)據(jù)集合提供給智能模塊。相似地,可以將數(shù)據(jù)集合經(jīng)由網(wǎng)絡(luò)連接(如LAN、VPN、企業(yè)內(nèi)部互聯(lián)網(wǎng)、國際互聯(lián)網(wǎng)等)或直接至采集系統(tǒng)的連接(如USB或其它直接有線連接或無線連接)而提供給諸如桌式計(jì)算機(jī)系統(tǒng)或其它計(jì)算機(jī)系統(tǒng)的分離的系統(tǒng),,或?qū)⑵涮峁┑街T如CD、DVD、軟盤、便攜式USB驅(qū)動等的便攜式介質(zhì)上。在某些方面,數(shù)據(jù)集合包括具有一對坐標(biāo)值(或2維向量)的數(shù)據(jù)點(diǎn)。對于PCR數(shù)據(jù),通常一對坐標(biāo)值表示周期數(shù)和熒光強(qiáng)度值。在步驟110中已經(jīng)接收或獲得數(shù)據(jù)集合之后,可以進(jìn)一步分析數(shù)據(jù)集合,用以例如在分析過程中校對溫度偏移。
在步驟120中,基于例如從周期1至末周期的數(shù)據(jù)集合計(jì)算第一近似。在該步驟過程中,在一個(gè)實(shí)施例中,使用具有通過Levenberg-Marquardt(LM)回歸處理或其它回歸處理而確定的參數(shù)的雙S形函數(shù)來發(fā)現(xiàn)表示數(shù)據(jù)集合的曲線的近似。正如下面更加詳細(xì)地描述的,在步驟120中,還基于所述數(shù)據(jù)集合計(jì)算不同于第一近似的第二近似。
根據(jù)一個(gè)實(shí)施例,使用其中包含有步長函數(shù)的非線性模型的可靠區(qū)域?;陔pS形模型進(jìn)行建立(在序列號為11/533,291、名稱為“PCR ElbowDetermination Using Curvature Analysis ofa Double Sigmoid”的美國專利申請和序列號為11/861,188、名稱為“PCR Elbow Determination Using Quadratic Test forCurvature Analysis of a Double Sigmoid”的美國專利申請中提供了該雙S形模型),根據(jù)一個(gè)實(shí)施例,使用在方程1中指定的函數(shù)用作第一非線性模型 方程1非線性模型 在方程1中,{a,b,c,d,e,f,g,h}為模型系數(shù),cac為發(fā)生退火溫度改變的周期數(shù)。cac值是已知的,并且是由系統(tǒng)提供的。系數(shù)‘h’表示跳躍不連續(xù)的幅度。使用非線性回歸方法(例如,如在下面將要詳細(xì)地描述的,Levenberg-Marquardt方法)來推導(dǎo)與非線性模型相對應(yīng)的系數(shù)。通常,非線性回歸需要用于合適的整體收斂(其是應(yīng)用特定的)的初始系數(shù)集。在下面更加詳細(xì)地描述回歸處理和參數(shù)確定的細(xì)節(jié)。
在一個(gè)實(shí)施例中,使用方程2中所定義的UnitStep(單位步長)函數(shù) 方程2UnitStep函數(shù) 根據(jù)一個(gè)實(shí)施例,在方程3中指定第二模型 a+b·x+h·(UnitStep(x)-UnitStep(x-cac)) 方程3附加非線性模型 在一方面中,使用第二非線性模型來準(zhǔn)確地表示從沒有目標(biāo)的反應(yīng)井生成的熒光數(shù)據(jù)。使用非線性回歸方法(例如最小二乘方QRD擬合或其它回歸方法)來推導(dǎo)與第二非線性模型相對應(yīng)的系數(shù)。
根據(jù)嚴(yán)格的數(shù)學(xué)觀點(diǎn),并且如從上述實(shí)施例的方程中可以看出的,可以將在本發(fā)明的方法中所執(zhí)行的第二函數(shù)指定為線性函數(shù),以代替非線性函數(shù)。但是,因?yàn)樵诒景l(fā)明方法中將該第二函數(shù)當(dāng)作非線性函數(shù),所以在本發(fā)明申請的情況下將該第二函數(shù)指定為非線性函數(shù)。
根據(jù)一個(gè)實(shí)施例,在步驟130中,在方程1中所指定的模型和方程3中所指定的模型之間進(jìn)行選擇,在某些方面,使用基于逼近法的非參數(shù)信息理論來進(jìn)行在方程1中所指定的模型和方程3中所指定的模型之間的選擇。在一個(gè)實(shí)施例中,針對每個(gè)非線性回歸模型(方程1和2)計(jì)算如在方程4中所定義的修改的Akaike信息系數(shù)(Modified Akaike Information Coefficient,aic)。在該實(shí)施例中,假定具有最低系數(shù)的回歸模型為最佳擬合。在一方面中,從由方程3所指定的模型減去偏差值。該偏差使得能夠準(zhǔn)確地檢測不具有生長的樣品。該偏差值可以在從0(無偏差)至大約50的范圍內(nèi)變化。在某些方面中,減去大約為10的偏差。
方程4修改的Akaike信息系數(shù) 在方程4中,
為預(yù)測余差,n是熒光獲得周期的數(shù)量,m是模型的自由度(例如對于方程1為8,對于方程3為3)。
根據(jù)一個(gè)實(shí)施例,在步驟140中,對擬合優(yōu)度統(tǒng)計(jì)值(例如R2)進(jìn)行計(jì)算以驗(yàn)證模型表達(dá)式真正匹配熒光數(shù)據(jù)。如果該統(tǒng)計(jì)值處于預(yù)定范圍之外,則所述模型不收斂且沒有熒光數(shù)據(jù)的不連續(xù)校正被執(zhí)行。例如,在一方面中,如果R2<0.8,則沒有實(shí)現(xiàn)收斂。
該R2值是關(guān)于原始曲線(熒光數(shù)據(jù))和所估算的模型而進(jìn)行計(jì)算的。在一方面中,給出如下所示的用以計(jì)算R2值的方程 其中y表示原始數(shù)據(jù)曲線,f(x)表示所模擬的曲線,y表示原始數(shù)據(jù)曲線平均值,n表示原始數(shù)據(jù)曲線的長度(以周期為單位)。
根據(jù)一個(gè)實(shí)施例,在步驟150中,在給定的可靠水平(例如,在90至99.9%之間,諸如95%)處,根據(jù)方程1或方程3(取決于選擇了哪個(gè))計(jì)算h系數(shù)的可靠區(qū)間。如果該可靠區(qū)間包括零值,則模型將系數(shù)h作為超定參數(shù)。在這種情況下,不識別數(shù)據(jù)中的不連續(xù)且不需要熒光的不連續(xù)校正。針對h系數(shù)的可靠區(qū)間計(jì)算取決于所選擇的模型和該模型的標(biāo)準(zhǔn)誤差。在某些方面中,以如下方程來確定可靠區(qū)間的寬度 其中1.96表示95%處的可靠度,H-1表示針對h系數(shù)的Hessian矩陣的逆矩陣,stdError表示所選擇的模型的標(biāo)準(zhǔn)誤差。以下式來計(jì)算Hessian矩陣 H=JT·J 其中J是雅克比(Jacobian)矩陣,JT是Jacobian轉(zhuǎn)置矩陣。Jacobian是每個(gè)熒光周期處的每個(gè)模型系數(shù)的第一偏導(dǎo)數(shù)的估算值。以下式來計(jì)算標(biāo)準(zhǔn)誤差 其中y表示原始曲線,f(x)表示所模擬的曲線,n表示曲線的長度。將可靠區(qū)間的較低和較高限制計(jì)算為h±ci,其中h的值是由估算模型給定的。
應(yīng)當(dāng)理解的是,步驟140和150(包括165)是可互換的,且兩者都是可選的。
根據(jù)一個(gè)實(shí)施例,在步驟170中,產(chǎn)生步長或偏移校正后的數(shù)據(jù)集合。在一方面中,通過將系數(shù)h設(shè)為等于零而使用從所選擇的模型獲得的值來替換原始熒光強(qiáng)度數(shù)據(jù)值。在一方面中,為退火溫度的變化之前所發(fā)生的周期執(zhí)行替換;這有效地消除了跳躍不連續(xù)且確保平滑的過渡。在一方面中,從第一周期開始直到并且包括發(fā)生退火溫度的變化的周期之后的周期,例如周期1至cac+1,來執(zhí)行替換。
在步驟175中,返回修改的、偏移校正后的數(shù)據(jù)集合,例如以用于顯示或其他處理。例如,可以對校正后的曲線進(jìn)行處理以確定Ct值,以及可以將結(jié)果(偏移校正后的數(shù)據(jù)和/或Ct值)返回到例如執(zhí)行分析的系統(tǒng),或返回到請求分析的分離的系統(tǒng)。可以利用諸如監(jiān)視器屏或打印機(jī)的顯示裝置來呈現(xiàn)圖形顯示,所述顯示裝置與執(zhí)行圖5的分析的系統(tǒng)相耦合,或者可以將數(shù)據(jù)提供給用于在顯示裝置上進(jìn)行呈現(xiàn)的分離的系統(tǒng)??梢允褂眯U蟮臄?shù)據(jù)集合根據(jù)各種方法來確定Ct值。例如,在一方面中,可以使用序列號為11/316315和11/349550的美國專利申請的教導(dǎo)來確定Ct值。
在一個(gè)實(shí)施例中,提供具有三個(gè)不同的開始條件的方程1以導(dǎo)出3組系數(shù),以及提供具有單一組開始條件的方程3以導(dǎo)出單一組系數(shù)。在該實(shí)施例中,使用四組導(dǎo)出的系數(shù)處理方程4以確定具有如上所述的最低aic值的模型。應(yīng)當(dāng)認(rèn)識到的是,不同的開始條件可以用于用來模擬處理的每個(gè)非線性方程。在某些方面中,開始條件是憑經(jīng)驗(yàn)而確定的。
圖6A-C的步驟502至524示出了用于近似數(shù)據(jù)集合的曲線以及確定擬合函數(shù)的參數(shù)的處理流程。在一個(gè)實(shí)施例中,使用Levenberg-Marquardt(LM)方法來計(jì)算基于曲線點(diǎn)的數(shù)據(jù)集合的魯棒曲線近似。LM方法是非線性回歸處理;其為使非線性函數(shù)和數(shù)據(jù)集合之間的距離最小化的迭代技術(shù)。該處理表現(xiàn)得像是最速下降處理和高斯-牛頓(Gauss-Newton)處理的結(jié)合在當(dāng)前近似沒有很好地?cái)M合時(shí),其表現(xiàn)得像是最速下降處理(較慢但更可靠的收斂),但是隨著當(dāng)前的近似變得更準(zhǔn)確,它則將表現(xiàn)得像是Gauss-Newton處理(較快但較不可靠的收斂)。
通常,LM回歸方法包括需要各種輸入并提供輸出的算法。在一方面中,所述輸入包括待處理的數(shù)據(jù)集合、用于擬合數(shù)據(jù)的函數(shù)以及對所述函數(shù)的參數(shù)或變量的初始推測。所述輸出包括使所述函數(shù)和所述數(shù)據(jù)集合之間的距離最小化的用于所述函數(shù)的一組參數(shù)。
根據(jù)一個(gè)實(shí)施例,擬合函數(shù)為下列形式的雙S形 選擇該方程作為擬合函數(shù)是基于其靈活性以及其能能夠擬合典型的PCR曲線或其它生長曲線可能采取的不同曲線形狀的能力。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)認(rèn)識到的是,也可以根據(jù)需要而使用上面的擬合函數(shù)的變種或其它擬合函數(shù)。例如,在一個(gè)實(shí)施例中使用方程1。
雙S形方程(5)具有7個(gè)參數(shù)a,b,c,d,e,f和g,而方程1具有8個(gè)參數(shù)a,b,c,d,e,f,g和h??梢詫⒃摲匠谭纸鉃槌?shù)、傾斜和雙S形的總和。雙S形自身是兩個(gè)S形的乘積。圖7示出了雙S形方程(5)的分解。參數(shù)d,e,f和g確定兩個(gè)S形的形狀。為了示出它們對最終曲線的影響,考慮單一S形 其中參數(shù)d確定曲線的“銳度”,參數(shù)e確定拐點(diǎn)的x值。圖8示出了參數(shù)d對曲線的影響以及參數(shù)e對拐點(diǎn)的x值的位置的影響。下面,表1描述了參數(shù)對雙S形曲線的影響。
表1雙S形參數(shù)描述 在一方面中,為了防止曲線具有不切實(shí)際的形狀,應(yīng)當(dāng)約束雙S形方程的“銳度”參數(shù)d和f。因此,在一方面中,d<-1或d>1.1時(shí)的任何迭代或者f<-1或f>1.1時(shí)的任何迭代被認(rèn)為是失敗的。在其它方面中,可以使用對參數(shù)d和f的不同約束。
因?yàn)長evenberg-Marquardt算法是迭代算法,所以通常需要對待擬合的函數(shù)的參數(shù)的初始推測。初始推測越好,則近似將越好,以及較不可能發(fā)生算法朝向局部最小值收斂。由于雙S形函數(shù)的復(fù)雜性以及PCR曲線或其它生長曲線的各種各樣的形狀,針對每個(gè)參數(shù)的一個(gè)初始推測可能不足以防止算法有時(shí)會朝向局部最小值收斂。因此,在一方面中,輸入多(例如三或更多)組初始參數(shù)并保存最佳結(jié)果。在一方面中,橫跨所使用的多組參數(shù),大多數(shù)參數(shù)保持不變;只有參數(shù)c,d和f針對多個(gè)參數(shù)組的中每一組來說可能是不同的。圖9示出了針對不同參數(shù)組的三個(gè)曲線形狀的例子。三組參數(shù)的選擇指示表示PCR數(shù)據(jù)的曲線的三個(gè)可能的不同形狀。應(yīng)當(dāng)理解的是,可以對多于三組的參數(shù)進(jìn)行處理并保存最佳結(jié)果。
如圖6A-C所示,在步驟510中對LM方法的初始輸入?yún)?shù)進(jìn)行識別??梢杂刹僮鲉T輸入這些參數(shù),或者可以計(jì)算這些參數(shù)。根據(jù)一方面,根據(jù)如下所討論的步驟502、504和506來確定或設(shè)置參數(shù)。
初始參數(shù)(a)的計(jì)算 參數(shù)(a)是基線的高度;其值對于所有的初始參數(shù)組來說是相同的。在一方面中,在步驟504中,根據(jù)數(shù)據(jù)集合將參數(shù)(a)賦值為第3低的y軸值,例如熒光值。這為魯棒計(jì)算作準(zhǔn)備。在其它方面中,當(dāng)然可以將參數(shù)(a)賦值為期望的任何其它熒光值,諸如最低的y軸值、第二低的值等。
初始參數(shù)(b)的計(jì)算 參數(shù)(b)是基線和坪的傾斜。其值對于所有的初始參數(shù)組來說是相同的。在一方面中,在步驟502中,將0.01的靜態(tài)值賦值給(b),這是因?yàn)槔硐氲夭粦?yīng)該有任何傾斜。在其它方面中,可以向參數(shù)(b)賦值不同的值,例如,在0至大約0.5的范圍內(nèi)變化的值。在一方面中,值(b)表示從CAC+1至基線末端的基線傾斜。
初始參數(shù)(c)的計(jì)算 參數(shù)(c)表示坪的高度減去基線的高度,其被表示為絕對的熒光增加,或AFI。在一方面中,對于第一組參數(shù),c=AFI+2,而對于最后兩參數(shù),c=AFI。這在圖9中被示出,其中對于最后兩組參數(shù),c=AFI。對于第一組參數(shù),c=AFI+2。該變化是由于由第一組參數(shù)所模擬的曲線的形狀,其不具有坪。
參數(shù)(d)和(f)的計(jì)算 參數(shù)(d)和(f)定義兩個(gè)S形的銳度。由于無法基于針對這些參數(shù)的曲線給出近似,因此在一方面中,在步驟502中使用三個(gè)靜態(tài)代表值。應(yīng)當(dāng)理解的是,其它靜態(tài)或非靜態(tài)值可以用于(d)和/或(f)。這些對模擬有關(guān)所遇到的PCR曲線的最常見的形狀。下面,表2示出了針對如圖9所示的不同參數(shù)組的(d)和(f)的值。
表2參數(shù)d和f的值 參數(shù)(e)和(g)的計(jì)算 在步驟506中,確定參數(shù)(e)和(g)。參數(shù)(e)和(g)定義了兩個(gè)S形的拐點(diǎn)。在一方面中,它們兩個(gè)跨越所有的初始參數(shù)組都采用相同的值。參數(shù)(e)和(g)可以具有相同的或不同的值。為了找到近似,在一方面中,使用在諸如熒光的強(qiáng)度的平均值(其不是尖峰)之上的第一個(gè)點(diǎn)的x值。圖10示出了用于根據(jù)該方面確定(e)和(g)的值的處理,且在下面對其進(jìn)行了討論。用于根據(jù)該方面確定參數(shù)(e)和(g)以及其它參數(shù)的值的處理的更詳細(xì)的描述可以在序列號為11/316315的美國專利申請中找到。
參考圖10,起初,確定曲線的平均值(例如熒光強(qiáng)度)。接下來,識別在該平均值之上的第一個(gè)數(shù)據(jù)點(diǎn),然后確定 a.該點(diǎn)是否不是位于曲線的起始部分的附近,例如前5個(gè)周期內(nèi); b.該點(diǎn)是否不是位于曲線的末端附近,例如最后5個(gè)周期內(nèi);以及 c.該點(diǎn)附近(例如圍繞該點(diǎn)半徑為2個(gè)點(diǎn)之內(nèi))的導(dǎo)數(shù)是否沒有顯示出任何符號變化。如果顯示出符號變化,則該點(diǎn)可能是尖峰,因此應(yīng)該拋棄該點(diǎn)。
在另一個(gè)實(shí)施例中,在確定系數(shù)(e)和(g)時(shí)只考慮cac周期之后的周期的熒光值。所以,為了找到近似,使用在周期cac至最后一個(gè)周期的強(qiáng)度(例如熒光)的平均值之上的第一個(gè)點(diǎn)(其不是尖峰)的x值。首先,確定(周期cac至最后一個(gè)周期的)曲線的平均值,以及確定平均值之上的第一個(gè)點(diǎn)。如果沒有找到這樣的點(diǎn),在一方面中則考慮原始曲線長度的三分之二。
下面,表3示出了根據(jù)一方面的如圖9中所使用的初始參數(shù)的例子。
表3初始參數(shù)值 回到圖6A-C,一旦在步驟510中設(shè)置了所有的參數(shù),就使用輸入的數(shù)據(jù)集合、函數(shù)和參數(shù)來執(zhí)行LM處理520。傳統(tǒng)上,Levenberg-Marquardt方法用于解決非線性最小二乘問題。傳統(tǒng)的LM方法計(jì)算定義為曲線近似和數(shù)據(jù)集合之間的誤差的平方和的距離測量。但是,當(dāng)最小化平方和時(shí),其給予異常值重要的權(quán)重(這是因?yàn)楫惓V档木嚯x大于非尖峰數(shù)據(jù)點(diǎn)的距離),從而常常導(dǎo)致不適當(dāng)?shù)那€或較不理想的曲線。因此根據(jù)本發(fā)明的一方面,通過最小化絕對誤差的總和來計(jì)算近似和數(shù)據(jù)集合之間的距離,這是因?yàn)檫@樣不會給予異常值如此多的權(quán)重。在該方面中,由下式給出近似和數(shù)據(jù)之間的距離 distance=∑|ydata-yapproximation|(7) 如上,在一方面中,如步驟522和524中所示,對多(例如3)組初始參數(shù)中的每組進(jìn)行輸入和處理,并保存最佳結(jié)果,其中最佳結(jié)果是在方程(7)中提供最小或最少距離的參數(shù)組。在一方面中,跨越多組參數(shù),大多數(shù)參數(shù)保持不變;對于每組參數(shù)只有c,d和f可能是不同的。應(yīng)當(dāng)理解的是,可以使用任意數(shù)量的初始參數(shù)組。
圖11A-B示出了根據(jù)本發(fā)明的針對參數(shù)組的LM處理520的處理流程。如上面所解釋的,Levenberg-Marquardt方法可以表現(xiàn)得像是最速下降處理或像是Gauss-Newton處理。其行為取決于阻尼因子λ。λ越大,Levenberg-Marquardt算法就表現(xiàn)得越像最速下降處理。另一方面,λ越小,Levenberg-Marquardt算法就表現(xiàn)得越像Gauss-Newton處理。在一方面中,λ是從0.001開始的。應(yīng)當(dāng)理解的是,λ可以從任何其他值處開始,諸如從約0.000001至約1.0。
如前所述,Levenberg-Marquardt方法是迭代技術(shù)。根據(jù)一方面,如圖11A-B所示,在每次迭代過程中進(jìn)行下面的處理 1.計(jì)算之前近似的Hessian矩陣(H)。
2.計(jì)算之前近似的轉(zhuǎn)置Jacobian矩陣(JT)。
3.計(jì)算之前近似的距離向量(d)。
4.以當(dāng)前的阻尼因子λ來擴(kuò)增Hessian矩陣的對角線 Haug=Hλ(8) 5.對擴(kuò)增后的方程求解 Haugx=JTd(9) 6.將擴(kuò)增后的方程的解x加到函數(shù)的參數(shù)上。
7.計(jì)算新的近似和曲線之間的距離。
8.如果在該新的參數(shù)組情況下的距離小于在先前參數(shù)組情況下的距離,則 ●認(rèn)為迭代是成功的。
●保存或存儲該新的參數(shù)組。
●減小阻尼因子λ,例如以因子10來減小。
如果在該新的參數(shù)組情況下的距離大于在先前參數(shù)組情況下的距離,則 ●認(rèn)為迭代是不成功的。
●丟棄該新的參數(shù)組。
●增大阻尼因子λ,例如以因子10來增大。
在一方面中,圖11A-B的LM處理進(jìn)行迭代,直到達(dá)到下面的標(biāo)準(zhǔn)中的一個(gè)為止 1.其已經(jīng)運(yùn)行達(dá)到了指定的迭代次數(shù)N。該第一標(biāo)準(zhǔn)防止算法無窮地迭代。例如,在一方面中,如圖10所示,默認(rèn)的迭代值N為100。對于算法來說100次迭代應(yīng)該是足以收斂的(如果它可以收斂的話)。一般地,N可以在從小于10至100或更大的范圍內(nèi)變化。
2.兩次成功的迭代之間的距離的差小于閾值,例如0.0001。當(dāng)該差變得很小時(shí),已經(jīng)達(dá)到了期望的精度,并且繼續(xù)進(jìn)行迭代是無意義的,因?yàn)榻獠粫兊蔑@著地更好。
3.阻尼因子λ超過指定值,例如大于1020。當(dāng)λ變得很大時(shí),算法不會比當(dāng)前的解更好地收斂,因此繼續(xù)進(jìn)行迭代是無意義的。一般地,該指定值可以顯著地小于或大于1020。
根據(jù)另一實(shí)施例,所使用的Levenberg-Marquardt方法等同于在下面的方程10中所指定的表達(dá)式。假設(shè)向量函數(shù)
具有初始條件z0和精度水平tol(例如默認(rèn)設(shè)置為10-3),方程10有效。函數(shù)J(z)被定義為函數(shù)f(z)的Jacobian矩陣。變量maxiter為最大的迭代次數(shù)(例如默認(rèn)設(shè)置為100)。變量λ在回歸中是阻尼因子。
方程10Levenberg-Marquardt非線性回歸 利用QR分解進(jìn)行方程10的倒置。在一方面中,QR分解類似于Anderson的DGELS方法,E.(ed),“LAPACK Users’Guide”第三版。Philadelphia,PASociety for Industrial and Applied Mathematics,1999。如果不能確定倒置,則用2(或其它值)乘以λ,并且回歸繼續(xù)。
在本發(fā)明的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,為第一近似和第二近似中的每一個(gè)確定信息系數(shù)可以包括為第一近似和第二近似中的每一個(gè)計(jì)算Akaike信息系數(shù)(AIC)值。
在某些實(shí)施例中,根據(jù)本發(fā)明的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)還可以包括從針對第二非線性函數(shù)所計(jì)算的AIC值中減去偏差值。
在本發(fā)明的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,基于信息系數(shù)選擇近似中的一個(gè)可以包括選擇具有最低AIC值的近似。
在本發(fā)明的方法和計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,數(shù)據(jù)集合可以表示動態(tài)聚合酶鏈反應(yīng)(PCR)處理的生長曲線,其中坐標(biāo)值對可以表示擴(kuò)增后的多核苷酸的積聚和周期數(shù)。
在本發(fā)明的方法和計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,擴(kuò)增后的多核苷酸的積聚可以由熒光強(qiáng)度值、發(fā)光強(qiáng)度值、化學(xué)發(fā)光強(qiáng)度值、磷光強(qiáng)度值、電荷轉(zhuǎn)移值、生物發(fā)光強(qiáng)度值或吸光率值中的一個(gè)來表示。
在本發(fā)明的方法和計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,數(shù)據(jù)集合可以表示動態(tài)聚合酶鏈反應(yīng)(PCR)處理、細(xì)菌處理、酶處理或耦合處理的生長曲線。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,所替換的數(shù)據(jù)集合部分可以包括從第一數(shù)據(jù)點(diǎn)開始直到且包括步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集合部分。
另外,智能模塊還可以被適配為在選擇之后針對所選擇的近似計(jì)算擬合值的優(yōu)度,并且僅當(dāng)擬合值的優(yōu)度超過閾值時(shí)才繼續(xù)。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,智能模塊還可以被適配為從針對第二非線性函數(shù)所計(jì)算的AIC值中減去偏差值。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,基于信息系數(shù)選擇近似中的一個(gè)可以包括選擇具有最低AIC值的近似。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,動態(tài)PCR分析模塊可以駐留在動態(tài)熱循環(huán)器裝置中,其中智能模塊可以包括可通信地耦合到分析模塊的處理器。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,智能模塊可以包括駐留在通過網(wǎng)絡(luò)連接和直接連接中的一個(gè)而耦合到分析模塊的計(jì)算機(jī)系統(tǒng)中的處理器。
在根據(jù)本發(fā)明的系統(tǒng)的某些實(shí)施例中,所替換的數(shù)據(jù)集合部分可以包括在步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)之后的數(shù)據(jù)點(diǎn)。
在根據(jù)本發(fā)明的計(jì)算機(jī)可讀介質(zhì)的某些實(shí)施例中,所替換的數(shù)據(jù)集合部分可以包括在步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)之后的數(shù)據(jù)點(diǎn)。
在根據(jù)本發(fā)明的方法的某些實(shí)施例中,所替換的數(shù)據(jù)集合部分可以包括在步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)之后的數(shù)據(jù)點(diǎn)。
在某個(gè)實(shí)施例中,可以通過使用傳統(tǒng)的個(gè)人計(jì)算機(jī)系統(tǒng)來實(shí)現(xiàn)根據(jù)本發(fā)明的方法,所述傳統(tǒng)的個(gè)人計(jì)算機(jī)系統(tǒng)包括但并不局限于用以輸入數(shù)據(jù)集合的輸入裝置,諸如鍵盤、鼠標(biāo)等;用以表現(xiàn)曲線的區(qū)域中的特定關(guān)注點(diǎn)的顯示裝置,諸如監(jiān)視器;執(zhí)行方法中的每個(gè)步驟所必需的處理裝置,諸如CPU;諸如調(diào)制解調(diào)器的網(wǎng)絡(luò)接口、用以存儲數(shù)據(jù)集合的數(shù)據(jù)存儲裝置、在處理器上運(yùn)行的計(jì)算機(jī)代碼等。此外,還可以在根據(jù)本發(fā)明的PCR裝置中實(shí)現(xiàn)所述方法。
根據(jù)本發(fā)明的系統(tǒng)的例子在圖16-17中被顯示。圖16示出了解釋可以用于實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)的軟件資源和硬件資源之間的關(guān)系的整體框圖。在圖17中示出的系統(tǒng)包括可以位于熱循環(huán)器裝置中的動態(tài)PCR分析模塊和作為計(jì)算機(jī)系統(tǒng)的一部分的智能模塊。將數(shù)據(jù)集合(PCR數(shù)據(jù)集合)從分析模塊經(jīng)由網(wǎng)絡(luò)連接或直接連接傳送至智能模塊,或反之亦然。例如,可以根據(jù)圖5、6A-B、10和11A-B所示出的流程圖來處理數(shù)據(jù)集合。例如根據(jù)圖16所描述的流程圖,可以通過存儲在計(jì)算機(jī)系統(tǒng)的硬件上的軟件來方便地實(shí)現(xiàn)這些流程圖。參照圖16,計(jì)算機(jī)系統(tǒng)(200)可以包括例如用于接收在PCR反應(yīng)過程中獲得的熒光數(shù)據(jù)的接收裝置(210)、用于根據(jù)本發(fā)明的方法處理所述數(shù)據(jù)的計(jì)算裝置(220)、用于根據(jù)由計(jì)算裝置獲得的結(jié)果來替換所述數(shù)據(jù)的一部分的應(yīng)用裝置(230)和用于將結(jié)果顯示在計(jì)算機(jī)屏幕上的顯示裝置(240)。圖17示出了熱循環(huán)器裝置和計(jì)算機(jī)系統(tǒng)之間的交互作用。該系統(tǒng)包括可以位于熱循環(huán)器裝置中的動態(tài)PCR分析模塊和作為計(jì)算機(jī)系統(tǒng)的一部分的智能模塊。將數(shù)據(jù)集合(PCR數(shù)據(jù)集合)經(jīng)由網(wǎng)絡(luò)連接或直接連接從分析模塊傳送至智能模塊,或反之亦然??梢酝ㄟ^在處理器上運(yùn)行且存儲在智能模塊的存儲裝置上的計(jì)算機(jī)代碼根據(jù)圖16來處理數(shù)據(jù)集合,并且在處理之后可以將所述數(shù)據(jù)集合傳送回分析模塊的存儲裝置,其中可以將修改后的數(shù)據(jù)顯示在顯示裝置上。
如上面所解釋的,本發(fā)明的系統(tǒng)和方法對于除去聚合酶鏈反應(yīng)數(shù)據(jù)中的步長不連續(xù)來說是有用的。例如,當(dāng)使用熒光數(shù)據(jù)來監(jiān)視聚合酶鏈反應(yīng)時(shí),本發(fā)明的系統(tǒng)和方法提供更準(zhǔn)確的數(shù)據(jù)。這樣的數(shù)據(jù)不僅對監(jiān)視反應(yīng)來說是有用的,而且還提供諸如在PCR過程中對擴(kuò)增的目標(biāo)核苷酸的量化或根據(jù)所獲得數(shù)據(jù)來適配PCR的反應(yīng)條件的技術(shù)效果。
提供下面的例子和圖形以幫助對本發(fā)明的理解,本發(fā)明的真實(shí)的范圍在所附權(quán)利要求中進(jìn)行了闡述。應(yīng)當(dāng)理解的是,在不超出本發(fā)明的精神的情況下可以對所闡述的程序作出修改。
例子 例1 這是來自CAP/CTM HIV監(jiān)視器分析的IQS(HEX通道)熒光數(shù)據(jù)。該分析圖表在周期15之后具有跳躍不連續(xù)。圖12示出了原始熒光數(shù)據(jù)(點(diǎn))和校正后的數(shù)據(jù)(實(shí)線)。下面,表4示出了所估算的系數(shù)和對應(yīng)的可靠區(qū)間。例1的R2大于0.99。
表4例1的系數(shù)圖表 例2 這是在沒有任何實(shí)際的目標(biāo)被擴(kuò)增的情況下的B19細(xì)小-病毒目標(biāo)通道(FAM通道)。該分析圖表在周期5之后具有跳躍不連續(xù)。圖13示出了原始熒光數(shù)據(jù)(點(diǎn))和校正后的數(shù)據(jù)(實(shí)線)。下面,表5示出了所估算的模型系數(shù)和它們的對應(yīng)可靠區(qū)間。例2的R2大于0.94。
表5例2的系數(shù)圖表 例3 這是HBV高純凈的目標(biāo)(FAM通道)。該分析不具有跳躍不連續(xù)。在該例子中系數(shù)h的可靠區(qū)間將包括零。所以,不需要不連續(xù)的校正。圖14示出了原始數(shù)據(jù)(點(diǎn))和校正后的數(shù)據(jù)(實(shí)線)。下面,表6示出了所估算的模型系數(shù)和它們的對應(yīng)可靠區(qū)間。例3的R2大于0.99。
表6例3的系數(shù)圖表 例4 這是高濃度(2.9×1011IU/ml)B19細(xì)小-病毒樣品(FAM通道)。雖然分析圖表在周期5之后具有跳躍不連續(xù),但是由于高復(fù)制數(shù),看不到該不連續(xù)。上面所述的方法能夠很好地處理該例子。圖15示出了原始數(shù)據(jù)(點(diǎn))和校正后的數(shù)據(jù)(實(shí)線)。在該例子中系數(shù)h的可靠區(qū)間包括零。下面,表7示出了所估算的模型系數(shù)和它們的對應(yīng)可靠區(qū)間。例4的R2大于0.99。
表7例4的系數(shù)圖表 雖然已經(jīng)通過例子并就具體實(shí)施例對本發(fā)明進(jìn)行了描述,但是應(yīng)當(dāng)理解的是,本發(fā)明并不局限于所公開的實(shí)施例。
權(quán)利要求
1.一種用于自動地除去表示生長過程的數(shù)據(jù)中的步長不連續(xù)的方法,所述方法包括
接收表示生長過程的數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值;
通過將非線性回歸處理應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似,所述參數(shù)包括步長不連續(xù)參數(shù);
通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù);
為所述第一近似和第二近似中的每一個(gè)確定信息系數(shù);
基于所述信息系數(shù)選擇所述近似中的一個(gè);
針對所選擇的近似而確定所述步長不連續(xù)參數(shù)的可靠區(qū)間;以及
如果所述可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似來替換所述數(shù)據(jù)集合的一部分。
2.如權(quán)利要求1所述的方法,其中第一非線性回歸處理是Levenberg-Marquardt(LM)回歸處理,其中第一非線性函數(shù)是雙S形函數(shù)。
3.如權(quán)利要求2所述的方法,其中所述雙S形函數(shù)是如下形式
其中UnitStep是如下形式
以及
其中計(jì)算第一近似包括迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f、g和h中的一個(gè)或多個(gè)。
4.如權(quán)利要求1所述的方法,其中第二非線性函數(shù)具有如下形式
a+b·x+h·(UnitStep(x)-UnitStep(x-cac)),其中UnitStep是如下形式
以及其中,x是周期數(shù),cac是不連續(xù)發(fā)生處的周期,其中a、b和h是所述參數(shù),h是所述步長不連續(xù)參數(shù)。
5.如權(quán)利要求1所述的方法,其中所述數(shù)據(jù)集合的被替換的部分包括從第一個(gè)數(shù)據(jù)點(diǎn)開始直到且包括步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集合部分。
6.如權(quán)利要求1所述的方法,還包括在選擇步驟之后
針對所選擇的近似而計(jì)算擬合值的優(yōu)度,以及僅當(dāng)擬合值的優(yōu)度超過閾值時(shí)才繼續(xù)。
7.一種計(jì)算機(jī)可讀介質(zhì),其包括用于控制處理器自動地除去表示生長曲線的數(shù)據(jù)集合中的步長不連續(xù)的代碼,所述代碼包括用以執(zhí)行如下處理的指令
接收表示生長過程的數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值;
通過將非線性回歸處理應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似,所述參數(shù)包括步長不連續(xù)參數(shù);
通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù);
為所述第一近似和第二近似中的每一個(gè)確定信息系數(shù);
基于所述信息系數(shù)選擇所述近似中的一個(gè);
針對所選擇的近似而確定所述步長不連續(xù)參數(shù)的可靠區(qū)間;以及
如果所述可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似來替換所述數(shù)據(jù)集合的一部分。
8.如權(quán)利要求7所述的計(jì)算機(jī)可讀介質(zhì),其中第一非線性回歸處理是Levenberg-Marquardt(LM)回歸處理,其中第一非線性函數(shù)是雙S形函數(shù)。
9.如權(quán)利要求8所述的計(jì)算機(jī)可讀介質(zhì),其中所述雙S形函數(shù)是如下形式
其中UnitStep是如下形式
以及
其中計(jì)算第一近似包括迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f、g和h中的一個(gè)或多個(gè)。
10.如權(quán)利要求7所述的計(jì)算機(jī)可讀介質(zhì),其中所述第二非線性函數(shù)具有如下形式
a+b·x+h·(UnitStep(x)-UnitStep(x-cac)),其中UnitStep是如下形式
以及其中x是周期數(shù),cac是不連續(xù)發(fā)生處的周期,其中a、b和h是所述參數(shù),h是所述步長不連續(xù)參數(shù)。
11.如權(quán)利要求7所述的計(jì)算機(jī)可讀介質(zhì),其中所述數(shù)據(jù)集合的被替換的部分包括從第一個(gè)數(shù)據(jù)點(diǎn)開始直到且包括步長不連續(xù)發(fā)生處的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集合部分。
12.一種動態(tài)聚合酶鏈反應(yīng)(PCR)系統(tǒng),包括
動態(tài)PCR分析模塊,其生成表示動態(tài)PCR擴(kuò)增曲線的PCR數(shù)據(jù)集合,所述數(shù)據(jù)集合包括多個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)具有一對坐標(biāo)值;以及
智能模塊,其被適配為通過以下操作來處理所述PCR數(shù)據(jù)集合以自動地除去所述數(shù)據(jù)集合中的步長不連續(xù)
通過將非線性回歸處理應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第一近似,所述參數(shù)包括步長不連續(xù)參數(shù);
通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合所述數(shù)據(jù)集合的曲線的第二近似,所述第二函數(shù)的參數(shù)包括步長不連續(xù)參數(shù);
為所述第一近似和第二近似中的每一個(gè)確定信息系數(shù);
基于所述信息系數(shù)選擇所述近似中的一個(gè);
針對所選擇的近似而確定所述步長不連續(xù)參數(shù)的可靠區(qū)間;以及
如果所述可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似來替換所述數(shù)據(jù)集合的一部分。
13.如權(quán)利要求12所述的系統(tǒng),其中所述第一非線性回歸處理是Levenberg-Marquardt(LM)回歸處理,其中第一非線性函數(shù)是雙S形函數(shù)。
14.如權(quán)利要求13所述的系統(tǒng),其中所述雙S形函數(shù)是如下形式
其中UnitStep是如下形式
以及
其中計(jì)算第一近似包括迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f、g和h中的一個(gè)或多個(gè)。
15.如權(quán)利要求12所述的系統(tǒng),其中所述第二非線性函數(shù)具有如下形式a+b·x+h·(UnitStep(x)-UnitStep(x-cac)),
其中UnitStep是如下形式
以及其中x是周期數(shù),cac是不連續(xù)發(fā)生處的周期,其中a、b和h是所述參數(shù),h是所述步長不連續(xù)參數(shù)。
全文摘要
本發(fā)明涉及用于除去實(shí)時(shí)PCR熒光數(shù)據(jù)中的步長不連續(xù)的系統(tǒng)和方法。所述用于自動地除去表示生長過程的數(shù)據(jù)中的步長不連續(xù)的方法,所述方法包括接收表示生長過程的數(shù)據(jù)集合;通過將非線性回歸處理應(yīng)用于第一非線性函數(shù)以確定第一函數(shù)的參數(shù),來計(jì)算擬合數(shù)據(jù)集合的曲線的第一近似;通過將第二回歸處理應(yīng)用于第二非線性函數(shù)以確定第二函數(shù)的參數(shù),來計(jì)算擬合數(shù)據(jù)集合的曲線的第二近似;為第一和第二近似中的每一個(gè)確定信息系數(shù);基于所述信息系數(shù)選擇所述近似中的一個(gè);針對所選擇的近似而確定步長不連續(xù)參數(shù)的可靠區(qū)間;以及如果可靠區(qū)間不包括零值,則用對應(yīng)的步長不連續(xù)參數(shù)被設(shè)置為零的所選擇的近似來替換所述數(shù)據(jù)集合的一部分。
文檔編號G06F19/00GK101587517SQ20091014973
公開日2009年11月25日 申請日期2009年5月12日 優(yōu)先權(quán)日2008年5月13日
發(fā)明者鮑爾丹扎 J·M, R·T·庫尼克, A·P·薩恩 申請人:霍夫曼-拉羅奇有限公司