本發(fā)明涉及轉(zhuǎn)基因植物檢測
技術(shù)領(lǐng)域:
,尤其是涉及一種轉(zhuǎn)基因玉米檢測方法及裝置。
背景技術(shù):
:轉(zhuǎn)基因技術(shù)利用DNA(deoxyribonucleicacid,脫氧核糖核酸)重組技術(shù),將外源基因轉(zhuǎn)移到受體生物中,從而可以獲得具有穩(wěn)定的表現(xiàn)特定的遺傳性狀的個(gè)體。定向改造玉米植物遺傳性狀、避免不良性狀的連鎖表達(dá)、育種周期短等優(yōu)點(diǎn)使轉(zhuǎn)基因技術(shù)在玉米育種中得到迅猛發(fā)展。在轉(zhuǎn)基因玉米的玉米育種研究中,傳統(tǒng)的轉(zhuǎn)基因玉米檢測方法主要是PCR(PolymeraseChainReaction,聚合酶鏈?zhǔn)椒磻?yīng))法。轉(zhuǎn)基因玉米的基因含有外源CaMV35S啟動(dòng)子和/或NOS終止子等公共基因元件,PCR法通過檢測該公共基因元件是否存在,來確定待檢測玉米是否為轉(zhuǎn)基因玉米,其中待檢測玉米為玉米植株的任一部分。PCR法的具體檢測過程如下:提取待檢測玉米的DNA,將提取的DNA加入引物、酶等構(gòu)成反應(yīng)液進(jìn)行PCR擴(kuò)增反應(yīng),通過反應(yīng)結(jié)果可以確定該DNA中是否含有該公共基因元件,從而確定該待檢測玉米是否為轉(zhuǎn)基因玉米。傳統(tǒng)的轉(zhuǎn)基因玉米檢測方法,主要是基于公共基因元件檢測的PCR法。由于PCR法在檢測過程中需要提取待檢測玉米的DNA,而提取DNA時(shí)會破壞待檢測玉米的蛋白質(zhì)或基因片段,因此現(xiàn)有的轉(zhuǎn)基因玉米檢測方法會損壞待檢測玉米的原有表觀性狀,使得待檢測玉米難以進(jìn)一步用于育種研究。技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明的目的在于提供一種轉(zhuǎn)基因玉米檢測方法及裝置,以解決現(xiàn)有的轉(zhuǎn)基因玉米檢測方法會損壞待檢測玉米的原有表觀性狀,使得待檢測玉米難以進(jìn)一步用于育種研究的技術(shù)問題。第一方面,本發(fā)明實(shí)施例提供了一種轉(zhuǎn)基因玉米檢測方法,包括:采集待檢測樣本的第一紅外光譜數(shù)據(jù),所述待檢測樣本包括玉米植株的任一部分;對所述第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理;根據(jù)去噪處理后的所述第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定所述待檢測樣本是否為轉(zhuǎn)基因玉米。結(jié)合第一方面,本發(fā)明實(shí)施例提供了第一方面的第一種可能的實(shí)施方式,其中,通過以下公式對所述第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理:其中,k表示所述第一紅外光譜數(shù)據(jù)中各個(gè)波長的序號,i的取值為-w至+w之間的整數(shù),w為正整數(shù),xk,smooth表示序號為k的波長對應(yīng)的去噪處理后的強(qiáng)度值,xk+i表示序號為k+i的波長對應(yīng)的去噪處理前的強(qiáng)度值,H表示歸一化因子,hi表示平滑系數(shù)。結(jié)合第一方面或者第一方面的第一種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第一方面的第二種可能的實(shí)施方式,其中,根據(jù)去噪處理后的所述第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定所述待檢測樣本是否為轉(zhuǎn)基因玉米,包括:通過所述判別模型檢測去噪處理后的所述第一紅外光譜數(shù)據(jù),得到所述待檢測樣本是否為所述轉(zhuǎn)基因玉米的檢測結(jié)果;或者,提取去噪處理后的所述第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,通過所述判別模型檢測提取出的多個(gè)所述第一特征波長,得到所述待檢測樣本是否為所述轉(zhuǎn)基因玉米的檢測結(jié)果。結(jié)合第一方面的第二種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第一方面的第三種可能的實(shí)施方式,其中,所述判別模型通過以下方法建立:選取訓(xùn)練樣本,所述訓(xùn)練樣本包括多個(gè)轉(zhuǎn)基因玉米樣本和多個(gè)非轉(zhuǎn)基因玉米樣本;采集所述訓(xùn)練樣本的第二紅外光譜數(shù)據(jù),對所述第二紅外光譜數(shù)據(jù)進(jìn)行去噪處理;根據(jù)去噪處理后的所述第二紅外光譜數(shù)據(jù)建立所述判別模型,或者,提取去噪處理后的所述第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長,根據(jù)提取出的多個(gè)所述第二特征波長建立所述判別模型。結(jié)合第一方面的第三種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第一方面的第四種可能的實(shí)施方式,其中,在建立所述判別模型之前,所述方法還包括:對所述第二紅外光譜數(shù)據(jù)進(jìn)行主成分分析,根據(jù)主成分分析的結(jié)果確定所述多個(gè)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與所述多個(gè)非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況;根據(jù)所述相對分布情況,確定是否建立所述判別模型。第二方面,本發(fā)明實(shí)施例還提供一種轉(zhuǎn)基因玉米檢測裝置,包括:采集模塊,用于采集待檢測樣本的第一紅外光譜數(shù)據(jù),所述待檢測樣本包括玉米植株的任一部分;處理模塊,用于對所述第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理;確定模塊,用于根據(jù)去噪處理后的所述第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定所述待檢測樣本是否為轉(zhuǎn)基因玉米。結(jié)合第二方面,本發(fā)明實(shí)施例提供了第二方面的第一種可能的實(shí)施方式,其中,所述處理模塊具體用于:通過以下公式對所述第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理:其中,k表示所述第一紅外光譜數(shù)據(jù)中各個(gè)波長的序號,i的取值為-w至+w之間的整數(shù),w為正整數(shù),xk,smooth表示序號為k的波長對應(yīng)的去噪處理后的強(qiáng)度值,xk+i表示序號為k+i的波長對應(yīng)的去噪處理前的強(qiáng)度值,H表示歸一化因子,hi表示平滑系數(shù)。結(jié)合第二方面或者第二方面的第一種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第二方面的第二種可能的實(shí)施方式,其中,所述確定模塊包括:第一確定單元,用于通過所述判別模型檢測去噪處理后的所述第一紅外光譜數(shù)據(jù),得到所述待檢測樣本是否為所述轉(zhuǎn)基因玉米的檢測結(jié)果;或者,第二確定單元,用于提取去噪處理后的所述第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,通過所述判別模型檢測提取出的多個(gè)所述第一特征波長,得到所述待檢測樣本是否為所述轉(zhuǎn)基因玉米的檢測結(jié)果。結(jié)合第二方面的第二種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第二方面的第三種可能的實(shí)施方式,其中,所述裝置還包括模型建立模塊,所述模型建立模塊包括:樣本選取單元,用于選取訓(xùn)練樣本,所述訓(xùn)練樣本包括多個(gè)轉(zhuǎn)基因玉米樣本和多個(gè)非轉(zhuǎn)基因玉米樣本;數(shù)據(jù)采集處理單元,用于采集所述訓(xùn)練樣本的第二紅外光譜數(shù)據(jù),對所述第二紅外光譜數(shù)據(jù)進(jìn)行去噪處理;模型建立單元,用于根據(jù)去噪處理后的所述第二紅外光譜數(shù)據(jù)建立所述判別模型,或者,提取去噪處理后的所述第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長,根據(jù)提取出的多個(gè)所述第二特征波長建立所述判別模型。結(jié)合第二方面的第三種可能的實(shí)施方式,本發(fā)明實(shí)施例提供了第二方面的第四種可能的實(shí)施方式,其中,所述模型建立模塊還包括分析單元,所述分析單元包括:分布確定子單元,用于對所述第二紅外光譜數(shù)據(jù)進(jìn)行主成分分析,根據(jù)主成分分析的結(jié)果確定所述多個(gè)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與所述多個(gè)非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況;建立確定子單元,用于根據(jù)所述相對分布情況,確定是否建立所述判別模型。本發(fā)明實(shí)施例帶來了以下有益效果:本發(fā)明實(shí)施例中,采集待檢測樣本的第一紅外光譜數(shù)據(jù),該待檢測樣本包括玉米植株的任一部分,對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理,根據(jù)去噪處理后的第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定該待檢測樣本是否為轉(zhuǎn)基因玉米。本發(fā)明實(shí)施例是通過紅外光譜對待檢測樣本進(jìn)行檢測,由于采集待檢測樣本的紅外光譜時(shí)不會破化待檢測樣本的蛋白質(zhì)及基因,因此應(yīng)用本發(fā)明實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法及裝置對待檢測樣本進(jìn)行檢測,不會損壞待檢測樣本的原有表觀性狀,檢測后的待檢測樣本可以進(jìn)一步用于育種研究。本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。附圖說明為了更清楚地說明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施方式,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明第一實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法的基本流程示意圖;圖2為本發(fā)明第一實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法中建立判別模型的流程示意圖;圖3為本發(fā)明第二實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置的基本模塊組成示意圖;圖4為本發(fā)明第二實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置中模型建立模塊的單元組成示意圖。具體實(shí)施方式為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。目前傳統(tǒng)的轉(zhuǎn)基因玉米檢測方法,主要是基于公共基因元件檢測的PCR法。PCR法在檢測過程中需要提取待檢測玉米的DNA,因而會破壞待檢測玉米的蛋白質(zhì)或基因片段,損壞待檢測玉米的原有表觀性狀,使得待檢測玉米難以進(jìn)一步用于育種研究。本發(fā)明實(shí)施例提供的一種轉(zhuǎn)基因玉米檢測方法及裝置,可以解決現(xiàn)有的轉(zhuǎn)基因玉米檢測方法會損壞待檢測玉米的原有表觀性狀,使得待檢測玉米難以進(jìn)一步用于育種研究的技術(shù)問題。為便于對本實(shí)施例進(jìn)行理解,首先對本發(fā)明實(shí)施例所公開的一種轉(zhuǎn)基因玉米檢測方法進(jìn)行詳細(xì)介紹。實(shí)施例一:導(dǎo)入轉(zhuǎn)基因玉米的外源基因表達(dá)出的蛋白質(zhì)與非轉(zhuǎn)基因玉米的基因表達(dá)出的蛋白質(zhì)不同,由于組成蛋白質(zhì)分子的各種基團(tuán)都有自己特定的紅外吸收峰,例如蛋白質(zhì)分子中含有大量的含氫基團(tuán),紅外光譜能夠反映該含氫基團(tuán)的能量吸收信息,因此紅外光譜可以捕捉到與外源基因相關(guān)的蛋白質(zhì)分子的吸收光譜信息,也即能夠通過紅外光譜判別轉(zhuǎn)基因玉米與非轉(zhuǎn)基因玉米。本發(fā)明實(shí)施例是針對轉(zhuǎn)基因玉米雙抗SK12-5(外源基因?yàn)椋篶ry1Ab/cry2Aj-G10evo)的檢測判別,本發(fā)明實(shí)施例提供的方法也適用于其他的轉(zhuǎn)基因玉米品種。圖1為本發(fā)明第一實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法的基本流程示意圖,如圖1所示,該方法包括以下步驟:步驟S110,采集待檢測樣本的第一紅外光譜數(shù)據(jù),該待檢測樣本包括玉米植株的任一部分。具體地,采用紅外光譜儀對待檢測樣本進(jìn)行掃描,采集待檢測樣本的第一紅外光譜數(shù)據(jù)。由于采集紅外光譜數(shù)據(jù)時(shí)無需復(fù)雜的樣本預(yù)處理,因此本發(fā)明實(shí)施例提供的方法具有快速、無損和精度高等優(yōu)點(diǎn)。優(yōu)選地,待檢測樣本為玉米種子或玉米葉片。本發(fā)明實(shí)施例采用便攜式近紅外光譜儀NIRez對待檢測玉米葉片進(jìn)行掃描,獲得波長范圍在900nm至1700nm之間的待檢測樣本的近紅外吸收光譜,該光譜的帶寬為10nm,共有100個(gè)波段。步驟S120,對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理。具體地,步驟S110采集的第一紅外光譜數(shù)據(jù)的前端和后端均容易受到噪聲的影響,為了獲得較好的檢測效果,將第一紅外光譜數(shù)據(jù)的前端和后端中有明顯噪聲的部分去掉,保留波長范圍在940nm至1670nm之間的第一紅外光譜數(shù)據(jù)。進(jìn)一步地,對第一紅外光譜數(shù)據(jù)進(jìn)行平滑去噪處理,可以采用算數(shù)滑動(dòng)平均法、重心法、指數(shù)平滑法、離散函數(shù)褶積滑動(dòng)變換法、傅里葉變換法和小波變換法等。優(yōu)選地,采用SG(Savitzky-Golay)濾波器對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理?;赟G濾波器的平滑濾波法是一種有效去除光譜數(shù)據(jù)中的噪聲、提高信噪比的方法。具體通過以下公式(1)和(2)對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理:其中,k表示第一紅外光譜數(shù)據(jù)中各個(gè)波長的序號,i的取值為-w至+w之間的整數(shù),w為正整數(shù),xk,smooth表示序號為k的波長對應(yīng)的去噪處理后的強(qiáng)度值,xk+i表示序號為k+i的波長對應(yīng)的去噪處理前的強(qiáng)度值,H表示歸一化因子,hi表示平滑系數(shù)。公式(1)中,多項(xiàng)式的次數(shù)和平滑點(diǎn)數(shù)對平滑效果具有決定性的影響,其中平滑點(diǎn)數(shù)為i取值的數(shù)量。本發(fā)明實(shí)施例中SG平滑濾波法采用2次多項(xiàng)式7點(diǎn)平滑,即w取值為3,i取值的數(shù)量為7。步驟S130,根據(jù)去噪處理后的第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定待檢測樣本是否為轉(zhuǎn)基因玉米。本發(fā)明實(shí)施例提供兩種檢測方式,分別是:通過預(yù)先建立的判別模型檢測去噪處理后的第一紅外光譜數(shù)據(jù),得到待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果;或者,提取去噪處理后的第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,通過預(yù)先建立的判別模型檢測提取出的多個(gè)第一特征波長,得到待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果。具體地,前一種檢測方式包括:將步驟S120去噪處理后的第一紅外光譜數(shù)據(jù)作為輸入數(shù)據(jù),輸入預(yù)先建立的判別模型中進(jìn)行檢測,該判別模型輸出待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果。后一種檢測方式包括:采用加權(quán)回歸系數(shù)法(Weightedregressioncoefficient,Bw)提取去噪處理后的第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,將提取出的多個(gè)第一特征波長作為輸入數(shù)據(jù),輸入預(yù)先建立的判別模型中進(jìn)行檢測,該判別模型輸出待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果。其中,采用加權(quán)回歸系數(shù)法提取去噪處理后的第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,具體包括:對該第一紅外光譜數(shù)據(jù)進(jìn)行PLS(partialleast-squaresregression,偏最小二乘回歸)建模,獲得各個(gè)波長對應(yīng)的Bw值,該Bw值代表與其對應(yīng)的各個(gè)波長對判別模型預(yù)測效果影響力的大小,若Bw值越大,則影響力越大。根據(jù)預(yù)設(shè)Bw閾值選取第一特征波長,具體為:比較該第一紅外光譜中各個(gè)峰谷處對應(yīng)的Bw值與預(yù)設(shè)Bw閾值,選取Bw值大于等于預(yù)設(shè)Bw閾值的波長為第一特征波長。例如預(yù)設(shè)Bw閾值為0.6,若波長為953.79nm對應(yīng)的Bw值為0.6,波長為1041.79nm對應(yīng)的Bw值為0.3,波長為1413.97nm對應(yīng)的Bw值為0.7,則選取953.79nm和1413.97nm作為第一特征波長。上述兩種檢測方式中的判別模型均包括:ELM(extremelearningmachine,極限學(xué)習(xí)機(jī))判別模型或SVM(supportvectormachine,支持向量機(jī))判別模型。本發(fā)明實(shí)施例中,采集待檢測樣本的第一紅外光譜數(shù)據(jù),該待檢測樣本包括玉米植株的任一部分,對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理,根據(jù)去噪處理后的第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定該待檢測樣本是否為轉(zhuǎn)基因玉米。本發(fā)明實(shí)施例是通過紅外光譜對待檢測樣本進(jìn)行檢測,由于采集待檢測樣本的紅外光譜時(shí)不會破化待檢測樣本的蛋白質(zhì)及基因,因此應(yīng)用本發(fā)明實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法對待檢測樣本進(jìn)行檢測,不會損壞待檢測樣本的原有表觀性狀,檢測后的待檢測樣本可以進(jìn)一步用于育種研究。圖2為本發(fā)明第一實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法中建立判別模型的流程示意圖,如圖2所示,上述判別模型通過以下三個(gè)步驟建立:步驟S210,選取訓(xùn)練樣本,該訓(xùn)練樣本包括多個(gè)轉(zhuǎn)基因玉米樣本和多個(gè)非轉(zhuǎn)基因玉米樣本。具體地,選取的訓(xùn)練樣本可以為玉米植株的任一部分,優(yōu)選地,該訓(xùn)練樣本為玉米種子或者玉米葉片。該訓(xùn)練樣本包括多個(gè)轉(zhuǎn)基因玉米樣本和多個(gè)非轉(zhuǎn)基因玉米樣本,優(yōu)選地,轉(zhuǎn)基因玉米樣本的個(gè)數(shù)與非轉(zhuǎn)基因玉米樣本的個(gè)數(shù)相同。本發(fā)明實(shí)施例選取了180個(gè)轉(zhuǎn)基因玉米葉片和180個(gè)非轉(zhuǎn)基因玉米葉片。將上述訓(xùn)練樣本劃分為建模樣本和測試樣本兩部分,其中,建模樣本用于建立判別模型,測試樣本用于檢測建立的判別模型的判別正確率。具體地,可以采用Kennard-Stone算法,按照2:1的比例分別將轉(zhuǎn)基因玉米樣本和非轉(zhuǎn)基因玉米樣本劃分為建模樣本和測試樣本。例如,將180個(gè)轉(zhuǎn)基因玉米樣本和180個(gè)非轉(zhuǎn)基因玉米樣本劃分為:120個(gè)轉(zhuǎn)基因玉米樣本和120個(gè)非轉(zhuǎn)基因玉米樣本作為建模樣本,60個(gè)轉(zhuǎn)基因玉米樣本和60個(gè)非轉(zhuǎn)基因玉米樣本作為測試樣本。步驟S220,采集上述訓(xùn)練樣本的第二紅外光譜數(shù)據(jù),對該第二紅外光譜數(shù)據(jù)進(jìn)行去噪處理。在步驟S220中,采集上述訓(xùn)練樣本的第二紅外光譜數(shù)據(jù)的具體過程與步驟S110相同,對該第二紅外光譜數(shù)據(jù)進(jìn)行去噪處理的具體過程與步驟S120相同,這里不再贅述。步驟S230,根據(jù)去噪處理后的第二紅外光譜數(shù)據(jù)建立判別模型,或者,提取去噪處理后的第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長,根據(jù)提取出的多個(gè)第二特征波長建立判別模型。下面基于建模樣本的兩種輸入數(shù)據(jù)建立判別模型,第一種是將去噪處理后的第二紅外光譜數(shù)據(jù)作為輸入數(shù)據(jù)建立判別模型,第二種是提取去噪處理后的第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長,將提取出的多個(gè)第二特征波長作為為輸入數(shù)據(jù)建立判別模型,其中,提取去噪處理后的第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長的具體過程與步驟S130中提取去噪處理后的第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長的具體過程相同,這里不再贅述。需要說明的是,上述步驟S130中的前一種檢測方式對應(yīng)于此處的第一種基于去噪處理后的第二紅外光譜數(shù)據(jù)的判別模型,步驟S130中的后一種檢測方式對應(yīng)于此處的第二種基于第二特征波長的判別模型。上述判別模型可以但不限于為ELM判別模型或SVM判別模型,這兩種判別分析模型基于不同的原理、從不同的角度對輸入數(shù)據(jù)進(jìn)行判別分析。ELM判別模型采用前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法(single-hiddenlayerfeedforwardneuralnetworks,SLFNs),原理是:可以在隱層節(jié)參數(shù)中隨機(jī)初始化輸入權(quán)重和偏置并得到相應(yīng)的輸出權(quán)重。前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法執(zhí)行過程中不需要調(diào)整學(xué)習(xí)參數(shù),因而具有學(xué)習(xí)速度快、泛化性能好的特點(diǎn)。SVM判別模型,是使用公式:y=sign(f(x))來推斷任一輸入x所對應(yīng)的類別,輸出值只允許取類別值,比如包括兩個(gè)類別,對應(yīng)的代碼分別為1、2,則輸出值為1或2。本發(fā)明實(shí)施例在SVM建模中,采用徑向基函數(shù)(Radialbasisfunction,RBF)作為核函數(shù),參數(shù)懲罰系數(shù)c的尋優(yōu)范圍為2-8到28。步驟S230建立判別模型之后,將建模樣本和測試樣本的數(shù)據(jù)分別輸入建立的判別模型中進(jìn)行檢測,分別檢測建模樣本和測試樣本的判別正確率。具體的檢測方法與步驟S110至步驟S130相同,其中,步驟S130中的前一種檢測方式對應(yīng)于步驟S230中的第一種基于去噪處理后的第二紅外光譜數(shù)據(jù)的判別模型,步驟S130中的后一種檢測方式對應(yīng)于步驟S230中的第二種基于第二特征波長的判別模型。本發(fā)明實(shí)施例的實(shí)驗(yàn)結(jié)果如下:基于去噪處理后的第二紅外光譜數(shù)據(jù)的判別模型中,ELM判別模型的檢測效果優(yōu)于SVM判別模型的檢測效果。ELM判別模型中建模樣本和測試樣本對應(yīng)的正確率分別達(dá)到了100%和95.23%?;诘诙卣鞑ㄩL的判別模型中,對于轉(zhuǎn)基因玉米雙抗SK12-5,本發(fā)明實(shí)施例中共提取了9個(gè)第二特征波長,分別為:953.79nm、992.6nm、1125.6nm、1167.55nm、1309.37nm、1413.97nm、1444.34nm、1520.78nm和1644nm。ELM判別模型和SVM判別模型的正確率如表1所示,其中,ELM判別模型中隱含層節(jié)點(diǎn)數(shù)為102,SVM判別模型中參數(shù)懲罰系數(shù)c為256,參數(shù)gamma為3.0314。表1判別模型建模樣本對應(yīng)的正確率測試樣本對應(yīng)的正確率ELM90.83%86.90%SVM80.00%82.14%由表1可知,基于第二特征波長的判別模型中,ELM判別模型和SVM判別模型的檢測效果都較好,其中ELM判別模型的檢測效果優(yōu)于SVM判別模型的檢測效果。ELM判別模型對轉(zhuǎn)基因玉米雙抗SK12-5的判別正確率,建模集和預(yù)測集分別達(dá)到了90.83%和86.90%。上述實(shí)驗(yàn)結(jié)果說明應(yīng)用本發(fā)明實(shí)施例的轉(zhuǎn)基因玉米檢測方法能夠快速有效的識別轉(zhuǎn)基因玉米雙抗SK12-5,該方法具有良好的應(yīng)用前景和可觀的市場價(jià)值??紤]到與某些外源基因相關(guān)的蛋白質(zhì)的紅外光譜可能與非轉(zhuǎn)基因?qū)?yīng)的紅外光譜差別不大,不適宜應(yīng)用上述方法,因此在步驟S230建立上述判別模型之前,本發(fā)明實(shí)施例提供的方法還包括以下步驟:1.對上述第二紅外光譜數(shù)據(jù)進(jìn)行主成分分析,根據(jù)主成分分析的結(jié)果確定多個(gè)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與多個(gè)非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況。2.根據(jù)該相對分布情況,確定是否建立判別模型。具體地,主成分分析是通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量為主成分。本發(fā)明實(shí)施例中對訓(xùn)練樣本中的所有轉(zhuǎn)基因樣本和非轉(zhuǎn)基因樣本均選取6個(gè)主成分,分別記為:pc1、pc2、pc3、pc4、pc5、pc6,經(jīng)過主成分分析,獲得各個(gè)訓(xùn)練樣本中各個(gè)主成分對應(yīng)的得分。表2和表3分別示出了訓(xùn)練樣本中的10個(gè)轉(zhuǎn)基因樣本和10個(gè)非轉(zhuǎn)基因樣本對應(yīng)的主成分及得分。在表2和表3中,可以根據(jù)樣品編號查找到各個(gè)訓(xùn)練樣本的主成分對應(yīng)的得分。表2表3根據(jù)上述主成分分析的結(jié)果,繪制多個(gè)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與多個(gè)非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況圖??梢赃x取上述6個(gè)主成分中任意兩個(gè)主成分的得分作為橫縱坐標(biāo),根據(jù)同一個(gè)訓(xùn)練樣本的兩個(gè)主成分的得分確定該訓(xùn)練樣本在圖中的坐標(biāo)點(diǎn),由各個(gè)坐標(biāo)點(diǎn)組成相對分布情況圖。例如選取pc5的得分作為橫坐標(biāo)和pc6的得分作為縱坐標(biāo),則編號為1-1的轉(zhuǎn)基因樣本的坐標(biāo)為(-0.00302,0.005946),編號為2-1的非轉(zhuǎn)基因樣本的坐標(biāo)為(-0.00313,0.006264)等,由這些坐標(biāo)點(diǎn)可以組成相對分布情況圖。6個(gè)主成分一共可以繪制出30張相對分布情況圖。由于同樣的兩個(gè)主成分根據(jù)橫縱坐標(biāo)的不同,可以繪制出2張相似的相對分布情況圖,因此只需要考慮15張不相似的相對分布情況圖。根據(jù)上述相對分布情況圖中的相對分布情況,確定是否建立判別模型。具體地,可以根據(jù)該相對分布圖中非重疊區(qū)域的占比大小是否大于等于預(yù)設(shè)的占比閾值,確定是否建立判別模型。例如,預(yù)設(shè)的占比閾值為30%,由pc5和pc6繪制的相對分布情況圖中非重疊區(qū)域的占比為40%,則確定建立判別模型。若上述15張不相似的相對分布情況圖中任意一張相對分布情況圖的相對分布情況滿足預(yù)設(shè)的占比閾值要求,則確定建立判別模型,否則確定不適合建立判別模型。本發(fā)明實(shí)施例中通過對上述第二紅外光譜數(shù)據(jù)進(jìn)行主成分分析,再根據(jù)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況,可以確定本發(fā)明實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法是否適用于某一特定的轉(zhuǎn)基因玉米的檢測,避免了盲目使用該方法檢測各個(gè)轉(zhuǎn)基因玉米品種,卻無法獲得預(yù)想的效果。綜上可知,本發(fā)明實(shí)施例應(yīng)用紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對轉(zhuǎn)基因玉米進(jìn)行檢測,識別的精度高,可以為高效的轉(zhuǎn)基因育種篩查提供切實(shí)有效的檢測手段。本發(fā)明實(shí)施例將生物技術(shù)和信息技術(shù)有機(jī)的結(jié)合起來,采用紅外光譜技術(shù)進(jìn)行轉(zhuǎn)雙價(jià)基因(cry1Ab/cry2Aj-G10evo)玉米雙抗SK12-5的育種篩選鑒定,以縮短育種進(jìn)程,節(jié)約人力和物力,提高育種效率,指導(dǎo)育種向高質(zhì)量、功能化和專業(yè)化方向發(fā)展。在不同光譜技術(shù)數(shù)據(jù)分析中進(jìn)行方法創(chuàng)新,建立轉(zhuǎn)基因玉米植株快速無損的判別模型,為轉(zhuǎn)基因玉米及其他轉(zhuǎn)基因作物的快速無損鑒別研究提供理論依據(jù)和技術(shù)支持。實(shí)施例二:圖3為本發(fā)明第二實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置的基本模塊組成示意圖,如圖3所示,該裝置包括:采集模塊11,用于采集待檢測樣本的第一紅外光譜數(shù)據(jù),該待檢測樣本包括玉米植株的任一部分;處理模塊12,用于對該第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理;確定模塊13,用于根據(jù)去噪處理后的第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定該待檢測樣本是否為轉(zhuǎn)基因玉米。其中,上述處理模塊12具體用于:通過以下公式對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理:其中,k表示第一紅外光譜數(shù)據(jù)中各個(gè)波長的序號,i的取值為-w至+w之間的整數(shù),w為正整數(shù),xk,smooth表示序號為k的波長對應(yīng)的去噪處理后的強(qiáng)度值,xk+i表示序號為k+i的波長對應(yīng)的去噪處理前的強(qiáng)度值,H表示歸一化因子,hi表示平滑系數(shù)。上述確定模塊13包括:第一確定單元,用于通過判別模型檢測去噪處理后的第一紅外光譜數(shù)據(jù),得到待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果;或者,第二確定單元,用于提取去噪處理后的第一紅外光譜數(shù)據(jù)的多個(gè)第一特征波長,通過判別模型檢測提取出的多個(gè)第一特征波長,得到待檢測樣本是否為轉(zhuǎn)基因玉米的檢測結(jié)果。本發(fā)明實(shí)施例中,采集模塊11采集待檢測樣本的第一紅外光譜數(shù)據(jù),該待檢測樣本包括玉米植株的任一部分,處理模塊12對第一紅外光譜數(shù)據(jù)進(jìn)行去噪處理,確定模塊13根據(jù)去噪處理后的第一紅外光譜數(shù)據(jù)和預(yù)先建立的判別模型,確定該待檢測樣本是否為轉(zhuǎn)基因玉米。本發(fā)明實(shí)施例是通過紅外光譜對待檢測樣本進(jìn)行檢測,由于采集待檢測樣本的紅外光譜時(shí)不會破化待檢測樣本的蛋白質(zhì)及基因,因此應(yīng)用本發(fā)明實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置對待檢測樣本進(jìn)行檢測,不會損壞待檢測樣本的原有表觀性狀,檢測后的待檢測樣本可以進(jìn)一步用于育種研究。圖4為本發(fā)明第二實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置中模型建立模塊的單元組成示意圖,如圖4所示,該裝置還包括模型建立模塊,該模型建立模塊包括:樣本選取單元21,用于選取訓(xùn)練樣本,該訓(xùn)練樣本包括多個(gè)轉(zhuǎn)基因玉米樣本和多個(gè)非轉(zhuǎn)基因玉米樣本;數(shù)據(jù)采集處理單元22,用于采集訓(xùn)練樣本的第二紅外光譜數(shù)據(jù),對該第二紅外光譜數(shù)據(jù)進(jìn)行去噪處理;模型建立單元23,用于根據(jù)去噪處理后的第二紅外光譜數(shù)據(jù)建立判別模型,或者,提取去噪處理后的第二紅外光譜數(shù)據(jù)的多個(gè)第二特征波長,根據(jù)提取出的多個(gè)第二特征波長建立判別模型??紤]到與某些外源基因相關(guān)的蛋白質(zhì)的紅外光譜可能與非轉(zhuǎn)基因?qū)?yīng)的紅外光譜差別不大,不適宜應(yīng)用上述方法,上述模型建立模塊還包括分析單元,該分析單元包括:分布確定子單元,用于對第二紅外光譜數(shù)據(jù)進(jìn)行主成分分析,根據(jù)主成分分析的結(jié)果確定多個(gè)轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分與多個(gè)非轉(zhuǎn)基因玉米樣本的紅外光譜數(shù)據(jù)的主成分之間的相對分布情況;建立確定子單元,用于根據(jù)該相對分布情況,確定是否建立判別模型。本發(fā)明實(shí)施例提供的轉(zhuǎn)基因玉米檢測裝置,與上述實(shí)施例提供的轉(zhuǎn)基因玉米檢測方法具有相同的技術(shù)特征,所以也能解決相同的技術(shù)問題,達(dá)到相同的技術(shù)效果。本發(fā)明實(shí)施例所提供的轉(zhuǎn)基因玉米檢測方法及裝置的計(jì)算機(jī)程序產(chǎn)品,包括存儲了程序代碼的計(jì)算機(jī)可讀存儲介質(zhì),所述程序代碼包括的指令可用于執(zhí)行前面方法實(shí)施例中所述的方法,具體實(shí)現(xiàn)可參見方法實(shí)施例,在此不再贅述。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的裝置的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。在本發(fā)明的描述中,需要說明的是,術(shù)語“中心”、“上”、“下”、“左”、“右”、“豎直”、“水平”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。此外,術(shù)語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性。最后應(yīng)說明的是:以上所述實(shí)施例,僅為本發(fā)明的具體實(shí)施方式,用以說明本發(fā)明的技術(shù)方案,而非對其限制,本發(fā)明的保護(hù)范圍并不局限于此,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:任何熟悉本
技術(shù)領(lǐng)域:
的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),其依然可以對前述實(shí)施例所記載的技術(shù)方案進(jìn)行修改或可輕易想到變化,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改、變化或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實(shí)施例技術(shù)方案的精神和范圍,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。當(dāng)前第1頁1 2 3