基于高光譜數(shù)據(jù)的紅木鑒別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及高光譜數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種基于高光譜數(shù)據(jù)的紅木鑒別 方法及系統(tǒng)。
【背景技術(shù)】
[0002] 高光譜成像技術(shù)可以獲得比傳統(tǒng)成像技術(shù)更多的信息,利用這些信息可以完成傳 統(tǒng)成像數(shù)據(jù)無法處理的問題。當(dāng)前大多數(shù)成像攝影技術(shù)都是基于紅、綠、藍(lán)三色信息對于場 景影像進(jìn)行記錄的,雖然三色傳感成像技術(shù)符合人類視覺系統(tǒng)的成像需求,但是從物理原 理的角度出發(fā),現(xiàn)實(shí)場景并非只有三色信息這么簡單。從光源發(fā)出或經(jīng)物體反射的光線具 有豐富的波長,其中可見光覆蓋從390nm直至780nm的廣泛區(qū)域,包含了大量的信息。場景 光線光譜正是指在這段波長范圍內(nèi)光線光強(qiáng)的分布,這種光譜信息能夠反應(yīng)出光源、物體 以及場景的自然屬性,因此光譜采集技術(shù)已成為了進(jìn)行科學(xué)研究與工程應(yīng)用的有效工具。
[0003] 而紅木分類是一個比較新的領(lǐng)域,市場上對其分類也是憑借經(jīng)驗(yàn)知識或者有損的 檢驗(yàn)方式,可以說這是一個亟待標(biāo)準(zhǔn)化和提供無損檢驗(yàn)技術(shù)的市場領(lǐng)域。近幾年高光譜數(shù) 據(jù)的發(fā)展給實(shí)現(xiàn)紅木的無損檢驗(yàn)提供了可行性。通過建立一個已知類別的訓(xùn)練樣本,利用 高光譜數(shù)據(jù)對未知紅木進(jìn)行類別判斷,利用不同紅木之間高光譜數(shù)據(jù)的不同實(shí)現(xiàn)紅木類別 的鑒定。
[0004] 但是高光譜數(shù)據(jù)存在大量的數(shù)據(jù)冗余性,直接對原始光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)處理和分 類會造成處理速度不夠快的現(xiàn)象,所以在對數(shù)據(jù)進(jìn)行分類和分析之前,對數(shù)據(jù)進(jìn)行一些預(yù) 處理是非常必要的。然而傳統(tǒng)的數(shù)據(jù)挖掘和數(shù)據(jù)降維(如PCA,LDP)方法,大多是利用特征 矩陣對原數(shù)據(jù)進(jìn)行特征變換,從根本上講也是對原數(shù)據(jù)進(jìn)行操作,還是會用到全譜信息,并 且特征變換以后的矩陣與原數(shù)據(jù)沒有明顯的一一對照關(guān)系。因此,目前的分類方法的分類 準(zhǔn)確率較低。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明旨在至少在一定程度上解決上述相關(guān)技術(shù)中的技術(shù)問題之一。
[0006] 為此,本發(fā)明的一個目的在于提出一種基于高光譜數(shù)據(jù)的紅木鑒別方法,該方法 能夠提高數(shù)據(jù)分類的準(zhǔn)確率。
[0007] 本發(fā)明的第二個目的在于提供一種基于高光譜數(shù)據(jù)的紅木鑒別系統(tǒng)。
[0008] 為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面的實(shí)施例提出了一種基于高光譜數(shù)據(jù)的紅木 鑒別方法,包括以下步驟:獲取訓(xùn)練樣本和測試樣本,其中,所述訓(xùn)練樣本和測試樣本都為 η維的光譜數(shù)據(jù),且所述訓(xùn)練樣本的類別已知;根據(jù)所述訓(xùn)練樣本對所述η維的光譜數(shù)據(jù)中 的每一維的光譜數(shù)據(jù)進(jìn)行分類,并抽取分類正確率最高的m維光譜數(shù)據(jù),其中,所述m小于 所述η ;得到維度為η的特征點(diǎn)集合S,集合S中的特征點(diǎn)作為以后分類的特征選擇波段,根 據(jù)K最近鄰分類算法對所述m維的光譜數(shù)據(jù)進(jìn)行分類,以確定紅木的類別。
[0009] 根據(jù)本發(fā)明實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別方法,首先獲取訓(xùn)練樣本和測試 樣本,并根據(jù)訓(xùn)練樣本對η維的光譜數(shù)據(jù)中的每一維的光譜數(shù)據(jù)進(jìn)行分類,并抽取分類正 確率最高的m維光譜數(shù)據(jù),然后根據(jù)K最近鄰分類算法對m維的光譜數(shù)據(jù)進(jìn)行分類,以確定 紅木的類別。因此,該方法在數(shù)據(jù)降維的同時提取出對分類的貢獻(xiàn)最大維度,并據(jù)此選取算 法中對分類貢獻(xiàn)最大的維度進(jìn)行分類,提高數(shù)據(jù)分類的準(zhǔn)確率。
[0010] 另外,根據(jù)本發(fā)明上述實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別方法還可以具有如下 附加的技術(shù)特征:
[0011] 在一些示例中,根據(jù)所述訓(xùn)練樣本對所述η維的光譜數(shù)據(jù)中的每一維的光譜數(shù)據(jù) 進(jìn)行分類,并抽取分類正確率最高的m維光譜數(shù)據(jù),進(jìn)一步包括:對所述η維的光譜數(shù)據(jù)中 的任意一維數(shù)據(jù)進(jìn)行分類,并查看分類的準(zhǔn)確率;將分類準(zhǔn)確率最高的那一維的光譜數(shù)據(jù) 加入到數(shù)據(jù)集S中;對剩下的η-1維的光譜數(shù)據(jù)進(jìn)行同樣的分類處理直至所述數(shù)據(jù)集S中 的譜段達(dá)到m。
[0012] 在一些示例中,在所述K最近鄰分類算法中,所述K為1、2或3。
[0013] 本發(fā)明第二方面的實(shí)施例還提供了一種基于高光譜數(shù)據(jù)的紅木鑒別系統(tǒng),包括: 獲取模塊,所述獲取模塊用于獲取訓(xùn)練樣本和測試樣本,其中,所述訓(xùn)練樣本和測試樣本都 為η維的光譜數(shù)據(jù),且所述訓(xùn)練樣本的類別已知;測試模塊,所述測試模塊用于據(jù)所述訓(xùn)練 樣本對所述η維的光譜數(shù)據(jù)中的每一維的光譜數(shù)據(jù)進(jìn)行分類,并抽取分類正確率最高的m 維光譜數(shù)據(jù),其中,所述m小于所述η ;分類模塊,所述分類模塊用于根據(jù)K最近鄰分類算法 對所述m維的光譜數(shù)據(jù)進(jìn)行分類,以確定紅木的類別。
[0014] 根據(jù)本發(fā)明實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別系統(tǒng),首先獲取訓(xùn)練樣本和測試 樣本,并根據(jù)訓(xùn)練樣本對η維的光譜數(shù)據(jù)中的每一維的光譜數(shù)據(jù)進(jìn)行分類,并抽取分類正 確率最高的m維光譜數(shù)據(jù),然后根據(jù)K最近鄰分類算法對m維的光譜數(shù)據(jù)進(jìn)行分類,以確定 紅木的類別。因此,該系統(tǒng)在數(shù)據(jù)降維的同時提取出對分類的貢獻(xiàn)最大維度,并據(jù)此選取算 法中對分類貢獻(xiàn)最大的維度進(jìn)行分類,提高數(shù)據(jù)分類的準(zhǔn)確率。
[0015] 另外,根據(jù)本發(fā)明上述實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別系統(tǒng)還可以具有如下 附加的技術(shù)特征:
[0016] 在一些示例中,所述測試模塊用于對所述η維的光譜數(shù)據(jù)中的任意一維數(shù)據(jù)進(jìn)行 分類,并查看分類的準(zhǔn)確率,并將分類準(zhǔn)確率最高的那一維的光譜數(shù)據(jù)加入到數(shù)據(jù)集S中, 并對剩下的η-1維的光譜數(shù)據(jù)進(jìn)行同樣的分類處理直至所述數(shù)據(jù)集S中的譜段達(dá)到m。
[0017] 在一些示例中,在所述K最近鄰分類算法中,所述K為1、2或3。
[0018] 本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0019] 本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0020] 圖1是根據(jù)本發(fā)明一個實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別方法的流程圖;
[0021] 圖2是根據(jù)本發(fā)明一個實(shí)施例的采集的部分紅木圖片示意圖;
[0022] 圖3是根據(jù)本發(fā)明一個實(shí)施例的部分采樣點(diǎn)的全譜數(shù)據(jù)曲線圖;
[0023] 圖4是根據(jù)本發(fā)明一個實(shí)施例的對η維數(shù)據(jù)進(jìn)行分類的結(jié)構(gòu)示意圖;以及
[0024] 圖5是根據(jù)本發(fā)明一個實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0025] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0026] 以下結(jié)合附圖描述根據(jù)本發(fā)明實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別方法及系統(tǒng)。
[0027] 圖1是根據(jù)本發(fā)明一個實(shí)施例的基于高光譜數(shù)據(jù)的紅木鑒別方法的流程圖。如圖 1所示,該方法包括以下步驟:
[0028] 步驟S101,獲取訓(xùn)練樣本和測試樣本,其中,訓(xùn)練樣本和測試樣本都為η維的光譜 數(shù)據(jù),且訓(xùn)練樣本的類別已知。測試樣本即采集到的待鑒別類型紅木的η維的光譜數(shù)據(jù)。換 言之,即將數(shù)據(jù)分為兩類,一類是已知類別的數(shù)據(jù)組(即訓(xùn)練樣本)。一類是未知類別的數(shù) 據(jù)組(即測試樣本)。
[0029] 步驟S102,根據(jù)訓(xùn)練樣本對η維的光譜數(shù)據(jù)中的每一維的光譜數(shù)據(jù)進(jìn)行分類,并 抽取分類正確率最高的m維光譜數(shù)據(jù),其中,m小于η。
[0030] 在本發(fā)明的一個實(shí)施例中,步驟S102進(jìn)一步包括:
[0031] 步驟1 :對η維的光譜數(shù)據(jù)中的任意一維數(shù)據(jù)進(jìn)行分類,并查看分類的準(zhǔn)確率;
[0032] 步驟2 :將分類準(zhǔn)確率最高的那一維的光譜數(shù)據(jù)加入到數(shù)據(jù)集S中;
[0033] 步驟3 :對剩下的η-1維的光譜數(shù)據(jù)進(jìn)行同樣的分類處理(即步驟1至步驟2)直 至數(shù)據(jù)集S中的譜段達(dá)到m。
[0034] 步驟S103,根據(jù)K最近鄰分類算法對m維的光譜數(shù)據(jù)進(jìn)行分類,以確定紅木的類 另|J。其中,在一些示例中,K最近鄰分類算法中的K的取值為1、2或3。
[0035] 作為具體地示例,以下結(jié)合附圖2-4對本發(fā)明上述實(shí)施例的方法進(jìn)行更為詳細(xì)、 具體地描述。
[0036] 例如,本發(fā)明上述實(shí)施例中使用的高光譜數(shù)據(jù)是用ASD公司的光譜儀采集的如圖 2所示的紅木數(shù)據(jù),每一個像素都是一個采樣點(diǎn),每個采樣點(diǎn)都有一個η維的光譜數(shù)據(jù),直 接使用全譜信息進(jìn)行紅木的分類不一定是最準(zhǔn)確的,因?yàn)槿V信息有些維度的數(shù)據(jù)是利于 紅木分類的,有些維度是不利于紅木分類的,可以稱之為噪音。例如圖3所示,相同顏色的 曲線表示這些數(shù)據(jù)來自同一個類紅木,而且直接使用全譜信息另外一個最大的缺點(diǎn)是處理 速度慢,用ASD的光譜儀的400nm到2500nm的范圍,數(shù)據(jù)量非常龐大,處理速度比較慢,而 且如果以后想將算法應(yīng)用到嵌入式的設(shè)備中,在保證分類效果的基礎(chǔ)上應(yīng)該減少數(shù)據(jù)維數(shù) 的使用。
[0037] 在具體示例中,本發(fā)明的實(shí)施例將經(jīng)典的貪婪算法應(yīng)用在紅木數(shù)據(jù)的數(shù)據(jù)選擇方 面。假設(shè)采集到的紅木數(shù)據(jù)總共有η維,需要選取對分類貢獻(xiàn)最大的m維。具體實(shí)施過程 中,首先建立一個訓(xùn)練樣本集和測試樣本集。進(jìn)一步地,使用η維數(shù)據(jù)中的任意一維進(jìn)行分 類,查看分類的正確率,選取分類正確率最高的那一維數(shù)據(jù)加入到數(shù)據(jù)集S中,那么,此時S 集中只有一個譜段,然后繼續(xù)對剩下的η-1個維度進(jìn)行同樣的處理,在η-1個剩余譜段中選 取一個譜段使得組成的新的S集的分類正確率最高,此時S集中有兩個譜段,依次操作,當(dāng)S 集中的譜段等于m時,貪婪算法就實(shí)現(xiàn)了本發(fā)明需要的特征選擇。相比于貪婪算法最簡單 的數(shù)據(jù)降維選取方法就是等距離采樣。
[0040] 表 1
[0041] 作為具體的示例,表1展示了本發(fā)明一個具體示例中對分辨率為lnm,波長范圍為 400-1700nm的全譜數(shù)據(jù)進(jìn)行等距離(從5~50nm不等)采樣時得到的數(shù)據(jù)分