專(zhuān)利名稱(chēng):基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及納米通道(Nanopore)技術(shù)領(lǐng)域,特別是一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,具體地說(shuō),是一種將納米通道單分子檢測(cè)系統(tǒng)所獲得的海量復(fù)雜數(shù)據(jù)進(jìn)行快速讀取、分類(lèi)、統(tǒng)計(jì)并形成圖譜的數(shù)據(jù)處理方法。
背景技術(shù):
納米通道(Nanopore)技術(shù)是一種結(jié)合生物物理、分子生物學(xué)以及生物傳感器等學(xué)科于一體的新型納米檢測(cè)技術(shù)。目前,在大多數(shù)實(shí)驗(yàn)室用于完成納米通道(Nanopore)數(shù)據(jù)采集與記錄的是膜片鉗(Patch Clamp)技術(shù)。該技術(shù)是一種通過(guò)微電極與細(xì)胞膜之間形成緊密接觸的方法,采用電壓鉗或電流鉗技術(shù)記錄生物膜上離子通道的電活動(dòng)(即記錄生物膜上離子通道的微電流信號(hào)變化)的微電極技術(shù)。實(shí)驗(yàn)信號(hào)通過(guò)Axopatch系列膜片鉗放大器輸入到Digidata系列數(shù)模轉(zhuǎn)換器中,由成熟的商業(yè)軟件Pclamp中的“單通道模式”對(duì)微電流進(jìn)行數(shù)據(jù)記錄和分析。在該技術(shù)中,事件(Event)是單通道數(shù)據(jù)記錄與分析的基本元素,通過(guò)分析事件的電流幅度與持續(xù)時(shí)間,實(shí)驗(yàn)者便可得到被檢測(cè)物質(zhì)的結(jié)構(gòu)、大小等信肩、O納米通道單分子檢測(cè)技術(shù)是一種根據(jù)分子在電場(chǎng)驅(qū)動(dòng)下穿過(guò)納米尺寸孔道時(shí)產(chǎn)生的特征信號(hào),從而研究在單分子水平上的生物分子個(gè)體行為的分析方法。該方法能在單分子水平上直接地獲取和分析生物大分子的結(jié)構(gòu)(包括構(gòu)象變化)、分子間的相互作用、分子動(dòng)力學(xué)行為、分子反應(yīng)機(jī)理等,推進(jìn)生物學(xué)、化學(xué)等進(jìn)入縱深發(fā)展,也是當(dāng)今科學(xué)發(fā)展的重大趨勢(shì)之一。這樣的一種納米通道單分子檢測(cè)系統(tǒng),一般會(huì)包括用于采集所述納米通道中微電流數(shù)據(jù)的數(shù)據(jù)采集裝置、用于處理所述微電流數(shù)據(jù)的數(shù)據(jù)處理裝置以及數(shù)據(jù)顯示裝置等,有些還會(huì)包括數(shù)據(jù)過(guò)濾裝置、數(shù)據(jù)顯示裝置、數(shù)據(jù)存儲(chǔ)與檢索裝置等等。納米通道單分子檢測(cè)技術(shù)具有裝置小巧、簡(jiǎn)單,無(wú)需擴(kuò)增、無(wú)需標(biāo)記,快速,廉價(jià)等優(yōu)點(diǎn)。由于納米通道單分子技術(shù)是捕獲單個(gè)分子的信息,所以其時(shí)間分辨率可達(dá)4微秒,電流分辨率可達(dá)100飛安,通常每秒鐘記錄25,000個(gè)數(shù)據(jù),每分鐘數(shù)據(jù)量可達(dá)百兆。由于每個(gè)電流阻斷信號(hào)反映的是每一個(gè)獨(dú)立分子通過(guò)納米通道的狀態(tài),因此實(shí)驗(yàn)所獲得的電流阻斷信號(hào)形態(tài)復(fù)雜多變。納米通道單分子技術(shù)的數(shù)據(jù)處理是基于統(tǒng)計(jì)學(xué)原理,即需要對(duì)1000個(gè)以上的獨(dú)立事件進(jìn)行統(tǒng)計(jì)分析,進(jìn)而繪制統(tǒng)計(jì)圖譜,建立單個(gè)分子行為模式。傳統(tǒng)的數(shù)據(jù)處理方法是以人工方式讀取每個(gè)獨(dú)立信號(hào)的起始時(shí)間、阻斷電流和阻斷時(shí)間,并根據(jù)各信號(hào)形態(tài)對(duì)其進(jìn)行分類(lèi)。數(shù)據(jù)處理過(guò)程中,阻斷信號(hào)中電流細(xì)微的變化往往就是反應(yīng)分子具體的運(yùn)動(dòng)狀態(tài)的關(guān)鍵,對(duì)于區(qū)分分子構(gòu)型和研究分子間相互作用十分重要?,F(xiàn)有技術(shù)中的Clampfit等軟件無(wú)法識(shí)別信號(hào)中細(xì)微電流變化并且無(wú)法實(shí)現(xiàn)復(fù)雜信號(hào)的阻斷電流及阻斷時(shí)間讀取。此外,實(shí)驗(yàn)環(huán)境中的電磁信號(hào)、儀器本身噪音、臺(tái)面微小震動(dòng)和生物孔對(duì)磷脂雙分子層膜的碰撞等都會(huì)對(duì)實(shí)驗(yàn)數(shù)據(jù)形成干擾,從而影響電流分辨?,F(xiàn)有技術(shù)的基于納米通道的單分子檢測(cè)系統(tǒng),往往會(huì)產(chǎn)生數(shù)據(jù)采集量過(guò)大、無(wú)效數(shù)據(jù)過(guò)多、數(shù)據(jù)信號(hào)形態(tài)復(fù)雜多變、數(shù)據(jù)處理 手段繁瑣且耗時(shí)較多等問(wèn)題,這些問(wèn)題阻礙了納米通道單分子檢測(cè)技術(shù)從科學(xué)研究到實(shí)際應(yīng)用的快速轉(zhuǎn)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,有效解決了現(xiàn)有技術(shù)中納米通道的單分子檢測(cè)技術(shù)在數(shù)據(jù)處理中出現(xiàn)的具有數(shù)據(jù)量大、信號(hào)形態(tài)復(fù)雜多變、處理手段繁瑣、耗時(shí)較多等問(wèn)題。為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,包括如下步驟:SI)依次獲取所述納米通道中對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù);S2)分段處理所述電流數(shù)據(jù),將所述電流數(shù)據(jù)分成兩個(gè)以上數(shù)據(jù)段;S3)從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào);S4)識(shí)別所述事件信號(hào) 的類(lèi)型;S5)獲取對(duì)應(yīng)所述事件信號(hào)的事件信息;S6)導(dǎo)出所述事件信息,形成文本文件;S7)統(tǒng)計(jì)所述事件信息,形成事件信息數(shù)據(jù)庫(kù);S8)根據(jù)所述事件信息數(shù)據(jù)庫(kù)繪制并輸出事件分布統(tǒng)計(jì)圖。所述分段處理,包括如下步驟:S21)保存彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)至一電流矩陣M中;S22)初始化所述電流矩陣M ;確定突躍系數(shù)Y,使得所述突躍系數(shù)Y為大于或等于3且小于或等于8的一定值;確定分段計(jì)數(shù)標(biāo)記i等于1,使得第I段的起始時(shí)間點(diǎn)為P1 ;其中i為自然數(shù);S23)在所述電流矩陣M中,預(yù)處理從Pi開(kāi)始的N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù);計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的均值作為第i段的基線(xiàn)電流值Ii,計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的平均誤差作為第i段的電流平均誤差e i ;其中N為自然數(shù);S24)計(jì)算第i段上突躍閾值Tui及第i段下突躍閾值Tdi ;其中,所述突躍閾值TuiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii加上電流平均誤差Si與突躍系數(shù)Y的乘積,SPTui=I^eiX y ;所述突躍閾值TdiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^與突躍系數(shù)Y的乘積,即Tdi=I1- EiX y ;S25)在所述電流矩陣M中,依次比較從時(shí)間點(diǎn)Pi開(kāi)始的每一時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)與第i段的突躍閾值Ti ;當(dāng)某一時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)值大于上突躍閾值Tui或小于下突躍閾值Tdi,執(zhí)行步驟S26);S26)暫停步驟S25)所述的比較,并對(duì)該時(shí)間點(diǎn)進(jìn)行突躍判定;若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值大于所述上突躍閾值Tui或小于所述下突躍閾值Tdi,確定該時(shí)間點(diǎn)為突躍點(diǎn),將此突躍點(diǎn)作為后一段數(shù)據(jù)的起始點(diǎn)Pi+1,確定相鄰的兩個(gè)段起始點(diǎn)Pi與Pi+1之間的數(shù)據(jù)為第i段;將第i段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣Mi中;將i的值加1,返回步驟S23);若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值小于或等于所述上突躍閾值Tui并大于或等于所述下突躍閾值Tdi,繼續(xù)進(jìn)行步驟S25)所述的比較,當(dāng)比較進(jìn)行到最后一時(shí)間點(diǎn)時(shí),將最后一時(shí)間點(diǎn)與最后的一起始點(diǎn)Pk之間的電流數(shù)據(jù)定義為第k段,將第k段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣中Mk。所述電流矩陣包括一列時(shí)間數(shù)據(jù)和一列電流數(shù)據(jù)。所述從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào),包括如下步驟:S31)計(jì)算所述數(shù)據(jù)段中電流數(shù)據(jù)的電流閾值Tci ;所述電流閾值Tci為對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^的0倍;其中,電流閾值系數(shù)P大于或等于1.2且小于或等于1.6 ;S32)生成事件信號(hào);依次比較所述數(shù)據(jù)段中每一電流數(shù)據(jù)與電流閾值Tci,取出所有小于電流閾值Tci的電流數(shù)據(jù)及其對(duì)應(yīng)的時(shí)間點(diǎn),并根據(jù)時(shí)間點(diǎn)的連續(xù)性將這些電流數(shù)據(jù)分塊存放,每一塊數(shù)據(jù)即為一個(gè)信號(hào);S33)校正所述事件信號(hào);對(duì)每一信號(hào)及該信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo);導(dǎo)數(shù)最小值處即為信號(hào)電流減小的趨勢(shì)最大處,向前尋找導(dǎo)數(shù)為該最小值0.1 0.4倍值的時(shí)間點(diǎn)為信號(hào)的初始點(diǎn);導(dǎo)數(shù)最大值點(diǎn)處即為信號(hào)電流增加趨勢(shì)最大處,向后尋找導(dǎo)數(shù)為該最大值0.1 0.4倍值的點(diǎn)即為信號(hào)的結(jié)束點(diǎn);單獨(dú)存放校正后的信號(hào)數(shù)據(jù);S34)剔除所述事件信號(hào)中的噪聲信號(hào);在信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi),比較信號(hào)電流最大值與相應(yīng)的基線(xiàn)電流之差是否大于信號(hào)電流最小值與相應(yīng)的基線(xiàn)電流之差的絕對(duì)值,若是,確定對(duì)應(yīng)該電流最大值的信號(hào)為電磁噪聲,剔除該噪聲信號(hào)。所述識(shí)別所述事件信號(hào)的類(lèi)型,包括如下步驟:S41)將所述事件信號(hào) 進(jìn)行濾波處理;S42)提取所述事件信號(hào)的特征點(diǎn);S43)根據(jù)所述特征點(diǎn)對(duì)所述事件信號(hào)進(jìn)行歸類(lèi)處理。所述事件信息包括所述事件信號(hào)各部分的阻斷電流和/或阻斷時(shí)間。所述文本文件包括導(dǎo)出信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流或始末位置中的任一種或兩種以上。統(tǒng)計(jì)所述事件信息,包括如下步驟:S71)使用者設(shè)定時(shí)間統(tǒng)計(jì)的bin值;S72)統(tǒng)計(jì)獲得兩個(gè)以上阻斷時(shí)間事件發(fā)生頻率的分布;S73)使用者設(shè)定時(shí)間與電流統(tǒng)計(jì)的bin值;S74)統(tǒng)計(jì)獲得兩個(gè)以上阻斷電流在所述阻斷時(shí)間分布的頻率。所述事件分布統(tǒng)計(jì)圖,包括事件阻斷時(shí)間分布統(tǒng)計(jì)圖、事件阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖以及事件信號(hào)疊加圖。本發(fā)明的優(yōu)點(diǎn)在于,提供一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,能夠?qū)?fù)雜龐大的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行快速讀取、處理、分類(lèi)、統(tǒng)計(jì)并形成圖譜,通過(guò)此技術(shù)所得到的數(shù)據(jù)為電流的離散時(shí)間序列,有較大的高斯白噪聲背景。被測(cè)物碰撞或通過(guò)孔道表現(xiàn)在電流一段時(shí)間內(nèi)的減少,為獲取每個(gè)事件所引起的電流減小持續(xù)時(shí)間與減小量等信息以備統(tǒng)計(jì)分析使用,需從背景中提取事件發(fā)生過(guò)程中電流變化的數(shù)據(jù)作為響應(yīng)信號(hào)。本發(fā)明有較快的數(shù)據(jù)處理速度與較高準(zhǔn)確度,解決了處理納米通道內(nèi)單分子技術(shù)大量復(fù)雜數(shù)據(jù)的問(wèn)題;本發(fā)明適用于處理此技術(shù)中各種不同環(huán)境與檢測(cè)條件下得到的數(shù)據(jù),可靈活設(shè)定處理系統(tǒng)的各項(xiàng)參數(shù)以滿(mǎn)足分析目的;本發(fā)明實(shí)現(xiàn)了對(duì)不同類(lèi)型信號(hào)的分類(lèi),便于從數(shù)據(jù)中挖掘更多信息,對(duì)納米通道單分子技術(shù)的應(yīng)用與發(fā)展有重大的積極意義。
圖1為本發(fā)明中一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法的流程圖;圖2為本發(fā)明中分段處理過(guò)程的流程圖;圖3為本發(fā)明中從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào)過(guò)程的流程圖;圖4為本發(fā)明中識(shí)別事件信號(hào)類(lèi)型的過(guò)程的流程圖;圖5為本發(fā)明中統(tǒng)計(jì)事件信息的過(guò)程的流程圖.
具體實(shí)施例方式以下結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的具體實(shí)施方式
,使本領(lǐng)域的技術(shù)人員更清楚地理解如何實(shí)踐本發(fā)明。應(yīng)當(dāng)理解,盡管結(jié)合其優(yōu)選的具體實(shí)施方案描述了本發(fā)明,但這些實(shí)施方案擬闡述,而不是限制本發(fā)明的范圍。實(shí)施例1如圖1所示,圖中包括一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,具體地說(shuō),是一種用于分析a -Hemolysin蛋白納米通道檢測(cè)DNA所得電流數(shù)據(jù)的信號(hào)處理分析方法,包括如下步驟:SI)依次采集對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù)。在人機(jī)交互界面中,點(diǎn)擊“載入數(shù)據(jù)”按鈕,在彈出框中選擇數(shù)據(jù)位置,系統(tǒng)便自動(dòng)將所需分析的數(shù)據(jù)載入。每一載入數(shù)據(jù)包括一時(shí)間點(diǎn)及與該時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)。在預(yù)覽模塊中,所有載入數(shù)據(jù)以電流-時(shí)間圖顯示出來(lái);
·
在實(shí)施例1中,采集對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù)量為10000個(gè)數(shù)據(jù)點(diǎn)。S2)將所述電流數(shù)據(jù)進(jìn)行分段處理,形成兩個(gè)以上數(shù)據(jù)段。如圖2所示,所述分段處理,包括如下步驟:S21)保存彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)至一電流矩陣M中,所述電流矩陣包括一列時(shí)間數(shù)據(jù)和一列電流數(shù)據(jù);S22)初始化所述電流矩陣M ;確定突躍系數(shù)Y,使得所述突躍系數(shù)Y為大于或等于3且小于或等于8的一定值;確定分段計(jì)數(shù)標(biāo)記i等于1,使得第I段的起始時(shí)間點(diǎn)為P1 ;其中i為自然數(shù);S23)在所述電流矩陣M中,預(yù)處理從Pi開(kāi)始的N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù);計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的均值作為第i段的基線(xiàn)電流值Ii,計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的平均誤差作為第i段的電流平均誤差e i ;其中N為自然數(shù);S24)計(jì)算第i段上突躍閾值Tui及第i段下突躍閾值Tdi ;其中,所述突躍閾值TuiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii加上電流平均誤差Si與突躍系數(shù)Y的乘積,SPTui=I^eiX y ;所述突躍閾值TdiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^與突躍系數(shù)Y的乘積,即Tdi=I1- EiX y ;S25)在所述電流矩陣M中,依次比較從時(shí)間點(diǎn)Pi開(kāi)始的每一時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)與第i段的突躍閾值Ti ;當(dāng)某一時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)值大于上突躍閾值Tui或小于下突躍閾值Tdi,執(zhí)行步驟S26);
S26)暫停步驟S25)所述的比較,并對(duì)該時(shí)間點(diǎn)進(jìn)行突躍判定;若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值大于所述上突躍閾值Tui或小于所述下突躍閾值Tdi,確定該時(shí)間點(diǎn)為突躍點(diǎn),將此突躍點(diǎn)作為后一段數(shù)據(jù)的起始點(diǎn)Pi+1,確定相鄰的兩個(gè)段起始點(diǎn)Pi與Pi+1之間的數(shù)據(jù)為第i段;將第i段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣Mi中;將i的值加1,返回步驟S23);若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值小于或等于所述上突躍閾值Tui并大于或等于所述下突躍閾值Tdi,繼續(xù)進(jìn)行步驟S25)所述的比較,當(dāng)比較進(jìn)行到最后一時(shí)間點(diǎn)時(shí),將最后一時(shí)間點(diǎn)與最后的一起始點(diǎn)Pk之間的電流數(shù)據(jù)定義為第k段,將第k段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣中Mk。在實(shí)施例1中,Y =4,設(shè)i等于1,P1等于I ;計(jì)算第i個(gè)上突躍閾值Tui和下突躍閾值Tdi ;從數(shù)據(jù)中Pi開(kāi)始,逐點(diǎn)搜索電流值大于上突躍閾值Tui或小于下突躍閾值Tdi的點(diǎn);一旦搜索到符合這種條件的點(diǎn),則暫停搜索,計(jì)算此點(diǎn)之后10000個(gè)點(diǎn)的電流平均值,若此平均值不大于上突躍閾值Tui或不小于下突躍閾值Tdi則繼續(xù)搜索;若結(jié)果相反,則將此點(diǎn)作為下一個(gè)起始點(diǎn)PwJfPi到Pi+1間的數(shù)據(jù)分為一段,單獨(dú)存放在一個(gè)矩陣中,并記錄其基線(xiàn)電流Ii,令i值加I ;繼續(xù)從此突躍點(diǎn)開(kāi)始重復(fù)之前的搜索;當(dāng)搜索到數(shù)據(jù)結(jié)尾時(shí)停止,將最后一個(gè)起始點(diǎn)Pk至結(jié)尾這部分?jǐn)?shù)據(jù)分為一段。S3)從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào)。如圖3所示,所述從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào),包括如下步驟:S31)計(jì)算所述數(shù)據(jù)段中電流數(shù)據(jù)的電流閾值Tci ;所述電流閾值Tci為對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^的0倍;其中,電流閾值系數(shù)P大于或等于1.2且小于或等于1.6。實(shí)施例1中,3等于1.4。
·
S32)生成事件信號(hào);依次比較所述數(shù)據(jù)段中每一電流數(shù)據(jù)與電流閾值Tci,取出所有小于電流閾值Tci的電流數(shù)據(jù)及其對(duì)應(yīng)的時(shí)間點(diǎn),并根據(jù)時(shí)間點(diǎn)的連續(xù)性將這些電流數(shù)據(jù)分塊存放,每一塊數(shù)據(jù)即為一個(gè)信號(hào)。實(shí)施例1中,將所有所在段基線(xiàn)電流與電流值之差小于Ti的點(diǎn)取出,并根據(jù)時(shí)間連續(xù)性將這些點(diǎn)分塊存放。S33)校正所述事件信號(hào);對(duì)每一信號(hào)及該信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo);導(dǎo)數(shù)最小值處即為信號(hào)電流減小的趨勢(shì)最大處,向前尋找導(dǎo)數(shù)為該最小值0.1 0.4倍值的時(shí)間點(diǎn)為信號(hào)的初始點(diǎn);導(dǎo)數(shù)最大值點(diǎn)處即為信號(hào)電流增加趨勢(shì)最大處,向后尋找導(dǎo)數(shù)為該最大值0.1 0.4倍值的點(diǎn)即為信號(hào)的結(jié)束點(diǎn);單獨(dú)存放校正后的信號(hào)數(shù)據(jù)。實(shí)施例1中,分別對(duì)每個(gè)信號(hào)及其兩端30個(gè)數(shù)據(jù)點(diǎn)范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo),獲取導(dǎo)數(shù)最小值處,并向前尋找導(dǎo)數(shù)為此最小值0.25倍值的點(diǎn)為信號(hào)初始點(diǎn);類(lèi)似地,獲取導(dǎo)數(shù)最大值處,向后尋找導(dǎo)數(shù)為此最大值0.25倍值的點(diǎn)為信號(hào)結(jié)束點(diǎn)。S34)剔除所述事件信號(hào)中的噪聲信號(hào);在信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi),比較信號(hào)電流最大值與相應(yīng)的基線(xiàn)電流之差是否大于信號(hào)電流最小值與相應(yīng)的基線(xiàn)電流之差的絕對(duì)值,若是,確定對(duì)應(yīng)該電流最大值的信號(hào)為電磁噪聲,剔除該噪聲信號(hào)。實(shí)施例1中,在信號(hào)電流數(shù)據(jù)兩端100個(gè)數(shù)據(jù)點(diǎn)范圍內(nèi)比較最大電流值與基線(xiàn)電流之差是否大于最小電流值與基線(xiàn)電流之差的絕對(duì)值,若是,則為電磁噪聲,將此信號(hào)剔除。S4)識(shí)別所述事件信號(hào)的類(lèi)型。如圖4所示,所述識(shí)別所述事件信號(hào)的類(lèi)型,包括如下步驟:S41)將所述事件信號(hào)進(jìn)行濾波處理;S42)提取所述事件信號(hào)的特征點(diǎn);S43)根據(jù)所述特征點(diǎn)對(duì)所述事件信號(hào)進(jìn)行歸類(lèi)處理。實(shí)施例1中,DNA通過(guò)蛋白通道信號(hào)類(lèi)型識(shí)別,其步驟如下:(I)采用dbl小波基對(duì)信號(hào)電流數(shù)據(jù)進(jìn)行小波分解,分解層次為3層;(2)提取第3層的低頻系數(shù),即為濾波后數(shù)據(jù),對(duì)濾波后的數(shù)據(jù)進(jìn)行求導(dǎo),提取導(dǎo)數(shù)絕對(duì)值小于0.1的點(diǎn)作為特征點(diǎn);(3)根據(jù)特征點(diǎn)的電流大小和特征點(diǎn)的數(shù)量將信號(hào)歸類(lèi)為“尖峰型”,“長(zhǎng)阻斷型”,“階梯型”和“W型”。S5)獲取對(duì)應(yīng)所述事件信號(hào)的事件信息。所述事件信息包括所述事件信號(hào)各部分的阻斷電流和/或阻斷時(shí)間。
實(shí)施例1中,分別計(jì)算已識(shí)別的信號(hào)前后3000個(gè)點(diǎn)的電流平均值,即為基線(xiàn)電流;“尖峰型”信號(hào)阻斷電流為電流最小值與基線(xiàn)電流差的絕對(duì)值;“長(zhǎng)阻斷型”信號(hào)阻斷電流為電流平均值與基線(xiàn)電流差的絕對(duì)值;“階梯型”和“W型”信號(hào)取各個(gè)特征點(diǎn)處的電流值和基線(xiàn)電流值之差的絕對(duì)值作為阻斷電流,因此可以獲得多個(gè)阻斷電流信息;三種信號(hào)類(lèi)型的阻斷時(shí)間都取始末點(diǎn)時(shí)間之差的絕對(duì)值。S6)導(dǎo)出所述事件信息,形成文本文件。所述文本文件包括導(dǎo)出信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流或始末位置中的任一種或兩種以上。實(shí)施例1中,導(dǎo)出上述步驟所得各個(gè)信號(hào)的信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流、始末位置等信息為文本文件或excel文件。S7)統(tǒng)計(jì)所述事件信息,形成事件信息數(shù)據(jù)庫(kù)。如圖5所示,統(tǒng)計(jì)所述事件信息,包括如下步驟:S71)使用者設(shè)定時(shí)間統(tǒng)計(jì)的bin值;S72)統(tǒng)計(jì)獲得兩個(gè)以上阻斷時(shí)間事件發(fā)生頻率的分布;S73)使用者設(shè)定時(shí)間與電流統(tǒng)計(jì)的bin值;S74)統(tǒng)計(jì)獲得兩個(gè)以上阻斷電流在所述阻斷時(shí)間分布的頻率。實(shí)施例1中,首先設(shè)定時(shí)間以0.0lms為單位分割,統(tǒng)計(jì)得出不同阻斷時(shí)間事件發(fā)生頻率分布;然后設(shè)定時(shí)間以0.0lms為單位分割與電流以IOpA為單位分割,統(tǒng)計(jì)得到不同阻斷電流在各時(shí)間頻率分布。S8)根據(jù)所述事件信息數(shù)據(jù)庫(kù)繪制事件分布統(tǒng)計(jì)圖并將其輸出。所述事件分布統(tǒng)計(jì)圖,包括事件阻斷時(shí)間分布統(tǒng)計(jì)圖、事件阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖以及事件信號(hào)疊加圖。實(shí)施例1中,阻斷時(shí)間分布統(tǒng)計(jì)圖是根據(jù)阻斷時(shí)間分布統(tǒng)計(jì)結(jié)果繪制出的柱狀圖;阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖是根據(jù)阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)繪制出的地形圖。
實(shí)施例1采用以基線(xiàn)電流為參考水平,設(shè)定電流閾值篩選信號(hào)數(shù)據(jù)。由于在多孔或陣列孔實(shí)驗(yàn)條件下,基線(xiàn)電流會(huì)在孔道堵塞時(shí)發(fā)生階躍式變化,因而在獲取事件信號(hào)時(shí)應(yīng)采用不同的基線(xiàn)電流參考,即對(duì)數(shù)據(jù)分段后處理。由于直接設(shè)置閾值的方法會(huì)使獲得的事件信號(hào)失真,丟失信號(hào)始末位置部分?jǐn)?shù)據(jù),故還需采用修正方法以獲得完整信號(hào)。再對(duì)所獲得的事件信號(hào)采取識(shí)別操作,得到信號(hào)類(lèi)型,并根據(jù)信號(hào)類(lèi)型提取信號(hào)的有用信息,數(shù)據(jù)導(dǎo)出、數(shù)據(jù)統(tǒng)計(jì)、圖形輸出操作將信號(hào)信息進(jìn)一步處理,提取被測(cè)物的有用信息。被測(cè)物碰撞或通過(guò)孔道表現(xiàn)在電流一段時(shí)間內(nèi)的減少,為獲取每個(gè)事件所引起的電流減小持續(xù)時(shí)間與減小量等信息以備統(tǒng)計(jì)分析使用,需從背景中提取事件發(fā)生過(guò)程中電流變化的數(shù)據(jù)作為響應(yīng)信號(hào)。本發(fā)明有較快的數(shù)據(jù)處理速度與較高準(zhǔn)確度,解決了處理納米通道內(nèi)單分子技術(shù)大量復(fù)雜數(shù)據(jù)的問(wèn)題;本發(fā)明適用于處理此技術(shù)中各種不同環(huán)境與檢測(cè)條件下得到的數(shù)據(jù),可靈活設(shè)定處理系統(tǒng)的各項(xiàng)參數(shù)以滿(mǎn)足分析目的;本發(fā)明實(shí)現(xiàn)了對(duì)不同類(lèi)型信號(hào)的分類(lèi),便于從數(shù)據(jù)中挖掘更多信息,對(duì)納米通道單分子技術(shù)的應(yīng)用與發(fā)展有重大的積極意義。實(shí)施例2如圖1所示, 實(shí)施例2包括一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,具體地說(shuō),是一種用于分析固體納米通道檢測(cè)納米顆粒所得電流數(shù)據(jù)的信號(hào)處理分析方法,包括如下步驟:SI)依次采集對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù)。在人機(jī)交互界面中,點(diǎn)擊“載入數(shù)據(jù)”按鈕,在彈出框中選擇數(shù)據(jù)位置,系統(tǒng)便自動(dòng)將所需分析的數(shù)據(jù)載入。每一載入數(shù)據(jù)包括一時(shí)間點(diǎn)及與該時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)。在預(yù)覽模塊中,所有載入數(shù)據(jù)以電流-時(shí)間圖顯示出來(lái)。在實(shí)施例2中,采集對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù)量為15000個(gè)數(shù)據(jù)點(diǎn)。S2)將所述電流數(shù)據(jù)進(jìn)行分段處理,形成兩個(gè)以上數(shù)據(jù)段。如圖2所示,所述分段處理,包括如下步驟:S21)保存彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)至一電流矩陣M中;S22)初始化所述電流矩陣M ;確定突躍系數(shù)Y,使得所述突躍系數(shù)Y為大于或等于3且小于或等于8的一定值;確定分段計(jì)數(shù)標(biāo)記i等于1,使得第I段的起始時(shí)間點(diǎn)為P1 ;其中i為自然數(shù);S23)在所述電流矩陣M中,預(yù)處理從Pi開(kāi)始的N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù);計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的均值作為第i段的基線(xiàn)電流值Ii,計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的平均誤差作為第i段的電流平均誤差e i ;其中N為自然數(shù);S24)計(jì)算第i段上突躍閾值Tui及第i段下突躍閾值Tdi ;其中,所述突躍閾值TuiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii加上電流平均誤差Si與突躍系數(shù)Y的乘積,SPTui=I^eiX y ;所述突躍閾值TdiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^與突躍系數(shù)Y的乘積,即Tdi=I1- EiX y ;S25)在所述電流矩陣M中,依次比較從時(shí)間點(diǎn)Pi開(kāi)始的每一時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)與第i段的突躍閾值Ti ;當(dāng)某一時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)值大于上突躍閾值Tui或小于下突躍閾值Tdi,執(zhí)行步驟S26);S26)暫停步驟S25)所述的比較,并對(duì)該時(shí)間點(diǎn)進(jìn)行突躍判定;若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值大于所述上突躍閾值Tui或小于所述下突躍閾值Tdi,確定該時(shí)間點(diǎn)為突躍點(diǎn),將此突躍點(diǎn)作為后一段數(shù)據(jù)的起始點(diǎn)Pi+1,確定相鄰的兩個(gè)段起始點(diǎn)Pi與Pi+1之間的數(shù)據(jù)為第i段;將第i段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣Mi中;將i的值加1,返回步驟S23);若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值小于或等于所述上突躍閾值Tui并大于或等于所述下突躍閾值Tdi,繼續(xù)進(jìn)行步驟S25)所述的比較,當(dāng)比較進(jìn)行到最后一時(shí)間點(diǎn)時(shí),將最后一時(shí)間點(diǎn)與最后的一起始點(diǎn)Pk之間的電流數(shù)據(jù)定義為第k段,將第k段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣中Mk。在實(shí)施例2中,Y =6,設(shè)i等于1,P1等于I ;計(jì)算第i個(gè)上突躍閾值Tui和下突躍閾值Tdi ;從數(shù)據(jù)中Pi開(kāi)始,逐點(diǎn)搜索電流值大于上突躍閾值Tui或小于下突躍閾值Tdi的點(diǎn);一旦搜索到符合這種條件的點(diǎn),則暫停搜索,計(jì)算此點(diǎn)之后15000個(gè)點(diǎn)的電流平均值,若此平均值不大于上突躍閾值Tui或不小于下突躍閾值Tdi則繼續(xù)搜索;若結(jié)果相反,則將此點(diǎn)作為下一個(gè)起始點(diǎn)PwJfPi到Pi+1間的數(shù)據(jù)分為一段,單獨(dú)存放在一個(gè)矩陣中,并記錄其基線(xiàn)電流Ii,令i值加I ;繼續(xù)從此突躍點(diǎn)開(kāi)始重復(fù)之前的搜索;當(dāng)搜索到數(shù)據(jù)結(jié)尾時(shí)停止,將最后一個(gè)起始點(diǎn)Pk至結(jié)尾這部分?jǐn)?shù)據(jù)分為一段。S3)從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào)。如圖3所示,從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào),包括如下步驟:S31)計(jì)算所述數(shù)據(jù)段中電流數(shù)據(jù)的電流閾值Tci ;所述電流閾值Tci為對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^的0倍;其中,電流閾值系數(shù)P大于或等于1.2且小于或等于1.6。實(shí)施例2中,@等于1.6。S32)生成事件信號(hào) ;依次比較所述數(shù)據(jù)段中每一電流數(shù)據(jù)與電流閾值Tci,取出所有小于電流閾值Tci的電流數(shù)據(jù)及其對(duì)應(yīng)的時(shí)間點(diǎn),并根據(jù)時(shí)間點(diǎn)的連續(xù)性將這些電流數(shù)據(jù)分塊存放,每一塊數(shù)據(jù)即為一個(gè)信號(hào)。實(shí)施例2中,將所有所在段基線(xiàn)電流與電流值之差小于Ti的點(diǎn)取出,并根據(jù)時(shí)間連續(xù)性將這些點(diǎn)分塊存放。S33)校正所述事件信號(hào);對(duì)每一信號(hào)及該信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo);導(dǎo)數(shù)最小值處即為信號(hào)電流減小的趨勢(shì)最大處,向前尋找導(dǎo)數(shù)為該最小值0.1 0.4倍值的時(shí)間點(diǎn)為信號(hào)的初始點(diǎn);導(dǎo)數(shù)最大值點(diǎn)處即為信號(hào)電流增加趨勢(shì)最大處,向后尋找導(dǎo)數(shù)為該最大值0.1 0.4倍值的點(diǎn)即為信號(hào)的結(jié)束點(diǎn);單獨(dú)存放校正后的信號(hào)數(shù)據(jù)。實(shí)施例2中,分別對(duì)每個(gè)信號(hào)及其兩端50個(gè)數(shù)據(jù)點(diǎn)范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo),獲取導(dǎo)數(shù)最小值處,并向前尋找導(dǎo)數(shù)為此最小值0.25倍值的點(diǎn)為信號(hào)初始點(diǎn);類(lèi)似地,獲取導(dǎo)數(shù)最大值處,向后尋找導(dǎo)數(shù)為此最大值0.25倍值的點(diǎn)為信號(hào)結(jié)束點(diǎn)。S34)剔除所述事件信號(hào)中的噪聲信號(hào);在信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi),比較信號(hào)電流最大值與相應(yīng)的基線(xiàn)電流之差是否大于信號(hào)電流最小值與相應(yīng)的基線(xiàn)電流之差的絕對(duì)值,若是,確定對(duì)應(yīng)該電流最大值的信號(hào)為電磁噪聲,剔除該噪聲信號(hào)。實(shí)施例2中,在信號(hào)電流數(shù)據(jù)兩端100個(gè)數(shù)據(jù)點(diǎn)范圍內(nèi)比較最大電流值與基線(xiàn)電流之差是否大于最小電流值與基線(xiàn)電流之差的絕對(duì)值,若是則為電磁噪聲,將此信號(hào)剔除。
S4)識(shí)別所述事件信號(hào)的類(lèi)型。如圖4所示,所述識(shí)別所述事件信號(hào)的類(lèi)型,包括如下步驟:S41)將所述事件信號(hào)進(jìn)行濾波處理;S42)提取所述事件信號(hào)的特征點(diǎn);S43)根據(jù)所述特征點(diǎn)對(duì)所述事件信號(hào)進(jìn)行歸類(lèi)處理。實(shí)施例2中,DNA通過(guò)蛋白通道信號(hào)類(lèi)型識(shí)別,其步驟如下:(I)采用dbl小波基對(duì)信號(hào)電流數(shù)據(jù)進(jìn)行小波分解,分解層次為3層;(2)提取第3層的低頻系數(shù),即為濾波后數(shù)據(jù),對(duì)濾波后的數(shù)據(jù)進(jìn)行求導(dǎo),提取導(dǎo)數(shù)絕對(duì)值小于0.1的點(diǎn)作為特征點(diǎn);(3)根據(jù)特征點(diǎn)的電流大小和特征點(diǎn)的數(shù)量將信號(hào)歸類(lèi)為“尖峰型”,“長(zhǎng)阻斷型”,“階梯型”和“W型”。S5)獲取對(duì)應(yīng)所述事件信號(hào)的事件信息。所述事件信息包括所述事件信號(hào)各部分的阻斷電流和/或阻斷時(shí)間。實(shí)施例2中,分別計(jì)算已識(shí)別的信號(hào)前后3000個(gè)點(diǎn)的電流平均值,即為基線(xiàn)電流;“尖峰型”信號(hào)阻斷電流為電流最小值與基線(xiàn)電流差的絕對(duì)值;“長(zhǎng)阻斷型”信號(hào)阻斷電流為電流平均值與基線(xiàn)電流差的絕對(duì)值;“階梯型”和“W型”信號(hào)取各個(gè)特征點(diǎn)處的電流值和基線(xiàn)電流值之差的絕對(duì)值作為阻斷電流,因此可以獲得多個(gè)阻斷電流信息;三種信號(hào)類(lèi)型的阻斷時(shí)間都取始末點(diǎn)時(shí)間之差的絕對(duì)值。S6)導(dǎo)出所述事件信息,形成文本文件。所述文本文件包括導(dǎo)出信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流或始末位置`中的任一種或兩種以上。實(shí)施例2中,導(dǎo)出上述步驟所得各個(gè)信號(hào)的信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流、始末位置等信息為文本文件或excel文件。S7)統(tǒng)計(jì)所述事件信息,形成事件信息數(shù)據(jù)庫(kù)。如圖5所示,統(tǒng)計(jì)所述事件信息,包括如下步驟:S71)使用者設(shè)定時(shí)間統(tǒng)計(jì)的bin值;S72)統(tǒng)計(jì)獲得兩個(gè)以上阻斷時(shí)間事件發(fā)生頻率的分布;S73)使用者設(shè)定時(shí)間與電流統(tǒng)計(jì)的bin值;S74)統(tǒng)計(jì)獲得兩個(gè)以上阻斷電流在所述阻斷時(shí)間分布的頻率。實(shí)施例2中,首先設(shè)定時(shí)間以0.0lms為單位分割,統(tǒng)計(jì)得出不同阻斷時(shí)間事件發(fā)生頻率分布;然后設(shè)定時(shí)間以0.0lms為單位分割與電流以IOpA為單位分割,統(tǒng)計(jì)得到不同阻斷電流在各時(shí)間頻率分布。S8)根據(jù)所述事件信息數(shù)據(jù)庫(kù)繪制事件分布統(tǒng)計(jì)圖并將其輸出。所述事件分布統(tǒng)計(jì)圖,包括事件阻斷時(shí)間分布統(tǒng)計(jì)圖、事件阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖以及事件信號(hào)疊加圖。實(shí)施例2中,阻斷時(shí)間分布統(tǒng)計(jì)圖是根據(jù)阻斷時(shí)間分布統(tǒng)計(jì)結(jié)果繪制出的柱狀圖;阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖是根據(jù)阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)繪制出的地形圖。實(shí)施例2采用以基線(xiàn)電流為參考水平,設(shè)定電流閾值篩選信號(hào)數(shù)據(jù)。由于在多孔或陣列孔實(shí)驗(yàn)條件下,基線(xiàn)電流會(huì)在孔道堵塞時(shí)發(fā)生階躍式變化,因而在獲取事件信號(hào)時(shí)應(yīng)采用不同的基線(xiàn)電流參考,即對(duì)數(shù)據(jù)分段后處理。由于直接設(shè)置閾值的方法會(huì)使獲得的事件信號(hào)失真,丟失信號(hào)始末位置部分?jǐn)?shù)據(jù),故還需采用修正方法以獲得完整信號(hào)。再對(duì)所獲得的事件信號(hào)采取識(shí)別操作,得到信號(hào)類(lèi)型,并根據(jù)信號(hào)類(lèi)型提取信號(hào)的有用信息,數(shù)據(jù)導(dǎo)出、數(shù)據(jù)統(tǒng)計(jì)、圖形輸出操作將信號(hào)信息進(jìn)一步處理,提取被測(cè)物的有用信息。被測(cè)物碰撞或通過(guò)孔道表現(xiàn)在電流一段時(shí)間內(nèi)的減少,為獲取每個(gè)事件所引起的電流減小持續(xù)時(shí)間與減小量等信息以備統(tǒng)計(jì)分析使用,需從背景中提取事件發(fā)生過(guò)程中電流變化的數(shù)據(jù)作為響應(yīng)信號(hào)。本發(fā)明有較快的數(shù)據(jù)處理速度與較高準(zhǔn)確度,解決了處理納米通道內(nèi)單分子技術(shù)大量復(fù)雜數(shù)據(jù)的問(wèn)題;本發(fā)明適用于處理此技術(shù)中各種不同環(huán)境與檢測(cè)條件下得到的數(shù)據(jù),可靈活設(shè)定處理系統(tǒng)的各項(xiàng)參數(shù)以滿(mǎn)足分析目的;本發(fā)明實(shí)現(xiàn)了對(duì)不同類(lèi)型信號(hào)的分類(lèi),便于從數(shù)據(jù)中挖掘更多信息,對(duì)納米通道單分子技術(shù)的應(yīng)用與發(fā)展有重大的積極意義。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的 保護(hù)范圍。
權(quán)利要求
1.一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,其特征在于,包括如下步驟: 51)依次獲取所述納米通道中對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù); 52)分段處理所述電流數(shù)據(jù),將所述電流數(shù)據(jù)分成兩個(gè)以上數(shù)據(jù)段; 53)從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào); 54)識(shí)別所述事件信號(hào)的類(lèi)型; 55)獲取對(duì)應(yīng)所述事件信號(hào)的事件信息; 56)導(dǎo)出所述事件信息,形成文本文件; 57)統(tǒng)計(jì)所述事件信息,形成事件信息數(shù)據(jù)庫(kù); 58)根據(jù)所述事件信息數(shù)據(jù)庫(kù)繪制并輸出事件分布統(tǒng)計(jì)圖。
2.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述分段處理,包括如下步驟: 521)保存彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)至一電流矩陣M中; 522)初始化所述電流矩陣M;確定突躍系數(shù)Y,使得所述突躍系數(shù)Y為大于或等于3且小于或等于8的一定值;確定分段計(jì)數(shù)標(biāo)記i等于1,使得第I段的起始時(shí)間點(diǎn)為P1 ;其中i為自然數(shù); 523)在所述電流矩陣M中,預(yù)處理從Pi開(kāi)始的N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù);計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的均值作為第i段的基線(xiàn)電流值Ii,計(jì)算所述N個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)的平均誤差作為第i段的電流平均誤差e i ;其中N為自然數(shù); 524)計(jì)算第i段上突躍閾值Tui及第i段下突躍閾值Tdi;其中,所述突躍閾值Tui為對(duì)應(yīng)第i段的基線(xiàn)電流值Ii加上電流平均誤差Si與突躍系數(shù)Y的乘積,g卩Tui=Ii+^iX Y ;所述突躍閾值TdiS對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差Si與突躍系數(shù)Y的乘積,即 Tdi=I1- EiXy ; 525)在所述電流矩陣M中,依次比較從時(shí)間點(diǎn)Pi開(kāi)始的每一時(shí)間點(diǎn)所對(duì)應(yīng)的電流數(shù)據(jù)與第i段的突躍閾值Ti ;當(dāng)某一時(shí)間點(diǎn)對(duì)應(yīng)的電流數(shù)據(jù)值大于上突躍閾值Tui或小于下突躍閾值Tdi,執(zhí)行步驟S26); 526)暫停步驟S25)所述的比較,并對(duì)該時(shí)間點(diǎn)進(jìn)行突躍判定;若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值大于所述上突躍閾值Tui或小于所述下突躍閾值Tdi,確定該時(shí)間點(diǎn)為突躍點(diǎn),將此突躍點(diǎn)作為后一段數(shù)據(jù)的起始點(diǎn)Pi+1,確定相鄰的兩個(gè)段起始點(diǎn)Pi與Pi+1之間的數(shù)據(jù)為第i段;將第i段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣Mi中;將i的值加1,返回步驟S23);若該時(shí)間點(diǎn)之后的N個(gè)起始時(shí)間點(diǎn)相對(duì)應(yīng)的電流數(shù)據(jù)的電流平均值小于或等于所述上突躍閾值Tui并大于或等于所述下突躍閾值Tdi,繼續(xù)進(jìn)行步驟S25)所述的比較,當(dāng)比較進(jìn)行到最后一時(shí)間點(diǎn)時(shí),將最后一時(shí)間點(diǎn)與最后的一起始點(diǎn)Pk之間的電流數(shù)據(jù)定義為第k段,將第k段中彼此對(duì)應(yīng)的所述離散時(shí)間點(diǎn)、所述電流數(shù)據(jù)保存至一電流矩陣中Mk。
3.如權(quán)利要求2所述的數(shù)據(jù)處理方法,其特征在于,所述電流矩陣包括一列時(shí)間數(shù)據(jù)和一列電流數(shù)據(jù)。
4.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào),包括如下步驟: S31)計(jì)算所述數(shù)據(jù)段中電流數(shù)據(jù)的電流閾值Tci ;所述電流閾值Tci為對(duì)應(yīng)第i段的基線(xiàn)電流值Ii減去電流平均誤差^的0倍;其中,電流閾值系數(shù)P大于或等于1.2且小于或等于1.6 ; 532)生成事件信號(hào);依次比較所述數(shù)據(jù)段中每一電流數(shù)據(jù)與電流閾值Tci,取出所有小于電流閾值Tci的電流數(shù)據(jù)及其對(duì)應(yīng)的時(shí)間點(diǎn),并根據(jù)時(shí)間點(diǎn)的連續(xù)性將這些電流數(shù)據(jù)分塊存放,每一塊數(shù)據(jù)即為一個(gè)信號(hào); 533)校正所述事件信號(hào);對(duì)每一信號(hào)及該信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi)的數(shù)據(jù)進(jìn)行求導(dǎo);導(dǎo)數(shù)最小值處即為信號(hào)電流減小的趨勢(shì)最大處,向前尋找導(dǎo)數(shù)為該最小值0.1 0.4倍值的時(shí)間點(diǎn)為信號(hào)的初始點(diǎn);導(dǎo)數(shù)最大值點(diǎn)處即為信號(hào)電流增加趨勢(shì)最大處,向后尋找導(dǎo)數(shù)為該最大值0.1 0.4倍值的點(diǎn)即為信號(hào)的結(jié)束點(diǎn);單獨(dú)存放校正后的信號(hào)數(shù)據(jù); 534)剔除所述事件信號(hào)中的噪聲信號(hào);在信號(hào)兩端延伸0.01 0.1ms的時(shí)間范圍內(nèi),比較信號(hào)電流最大值與相應(yīng)的基線(xiàn)電流之差是否大于信號(hào)電流最小值與相應(yīng)的基線(xiàn)電流之差的絕對(duì)值,若是,確定對(duì)應(yīng)該電流最大值的信號(hào)為電磁噪聲,剔除該噪聲信號(hào)。
5.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述識(shí)別所述事件信號(hào)的類(lèi)型,包括如下步驟: 541)將所述事件信號(hào)進(jìn)行濾波處理; 542)提取所述事件信號(hào)的特征點(diǎn); 543)根據(jù)所述特征點(diǎn)對(duì)所述事件信號(hào)進(jìn)行歸類(lèi)處理。
6.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述事件信息包括所述事件信號(hào)各部分的阻斷電流和/或阻斷時(shí)間。
7.如權(quán)利要求1 所述的數(shù)據(jù)處理方法,其特征在于,所述文本文件包括導(dǎo)出信號(hào)類(lèi)型、阻斷電流、阻斷時(shí)間、基線(xiàn)電流或始末位置中的任一種或兩種以上。
8.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,統(tǒng)計(jì)所述事件信息,包括如下步驟: 571)使用者設(shè)定時(shí)間統(tǒng)計(jì)的bin值; 572)統(tǒng)計(jì)獲得兩個(gè)以上阻斷時(shí)間事件發(fā)生頻率的分布; 573)使用者設(shè)定時(shí)間與電流統(tǒng)計(jì)的bin值; 574)統(tǒng)計(jì)獲得兩個(gè)以上阻斷電流在所述阻斷時(shí)間分布的頻率。
9.如權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述事件分布統(tǒng)計(jì)圖,包括事件阻斷時(shí)間分布統(tǒng)計(jì)圖、事件阻斷電流對(duì)阻斷時(shí)間的分布統(tǒng)計(jì)圖以及事件信號(hào)疊加圖。
全文摘要
本發(fā)明提供一種基于納米通道單分子檢測(cè)系統(tǒng)的數(shù)據(jù)處理方法,包括如下步驟依次獲取所述納米通道中對(duì)應(yīng)離散時(shí)間點(diǎn)的電流數(shù)據(jù);分段處理所述電流數(shù)據(jù),將所述電流數(shù)據(jù)分成兩個(gè)以上數(shù)據(jù)段;從每一數(shù)據(jù)段中獲取對(duì)應(yīng)該數(shù)據(jù)段的事件信號(hào);識(shí)別所述事件信號(hào)的類(lèi)型;獲取對(duì)應(yīng)所述事件信號(hào)的事件信息;導(dǎo)出所述事件信息,形成文本文件;統(tǒng)計(jì)所述事件信息,形成事件信息數(shù)據(jù)庫(kù);根據(jù)所述事件信息數(shù)據(jù)庫(kù)繪制并輸出事件分布統(tǒng)計(jì)圖。本發(fā)明的優(yōu)點(diǎn)在于,能夠?qū)?fù)雜龐大的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行快速讀取、處理、分類(lèi)、統(tǒng)計(jì)并形成圖譜,通過(guò)此技術(shù)所得到的數(shù)據(jù)為電流的離散時(shí)間序列,有較大的高斯白噪聲背景。
文檔編號(hào)G06F17/30GK103246698SQ20131010849
公開(kāi)日2013年8月14日 申請(qǐng)日期2013年3月29日 優(yōu)先權(quán)日2013年3月29日
發(fā)明者龍億濤, 李大偉, 顧震, 薩拉·里亞茲, 張星, 孟福娜 申請(qǐng)人:華東理工大學(xué)