本發(fā)明涉及一種煙葉分級方法,特別涉及一種基于高光譜圖像和深度學(xué)習(xí)算法的煙葉分級方法。
背景技術(shù):
目前,大多數(shù)人利用紅外或近紅外光譜來進行煙葉分級,但是還沒有見過利用高光譜圖像結(jié)合深度學(xué)習(xí)的方法來進行煙葉分級技術(shù)的研究。
在《計算機應(yīng)用研究》劉建偉等的文獻中,我們知道深度學(xué)習(xí)架構(gòu)由多層非線性運算單元組成,每個較低層的輸出作為更高層的輸入,可以從大量輸入數(shù)據(jù)中學(xué)習(xí)有效的特征表示,學(xué)習(xí)到的高階表示中包含輸入數(shù)據(jù)的許多結(jié)構(gòu)信息,是一種從數(shù)據(jù)中提取表示的好方法,能夠用于分類、回歸和信息檢索等特定問題中?;谶@種思想,我們嘗試用深度學(xué)習(xí)方法進行煙葉分級。
深度學(xué)習(xí)的概念由Hinton等人于2006年提出。在文獻《A Fast Learning Algorithm for Deep Belief Nets》中,基于深度信念網(wǎng)絡(luò)(DBN),提出非監(jiān)督貪婪逐層訓(xùn)練算法,為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來希望。本文就采用這種方法進行特征提取。
同機器學(xué)習(xí)方法一樣,深度機器學(xué)習(xí)方法也有監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之分,不同的學(xué)習(xí)框架下建立的學(xué)習(xí)模型很是不同。深度信念網(wǎng)絡(luò)(Deep Belief Nets,簡稱DBNs)就是一種無監(jiān)督學(xué)習(xí)下的機器學(xué)習(xí)模型。
一個典型的深度信念網(wǎng)絡(luò)就是一個高度復(fù)雜的有向無環(huán)圖,它是由一系列的限制性玻爾茲曼機(RBM)堆疊組成。訓(xùn)練深度信念網(wǎng)絡(luò)需要通過自下而上的逐層訓(xùn)練這些限制玻爾茲曼機來實現(xiàn),因為限制玻爾茲曼機可以采用分層對比散度算法進行快速訓(xùn)練,所以通過訓(xùn)練限制玻爾茲曼機可以避免從整體上訓(xùn)練深度信念網(wǎng)絡(luò)的高度復(fù)雜性,簡化為逐個訓(xùn)練限制玻爾茲曼機的過程。大量研究證明,深度信念網(wǎng)絡(luò)可以解決傳統(tǒng)反向傳播算法訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)收斂速度慢,容易陷入局部最優(yōu)等問題。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明的目的是提供一種利用高光譜圖像技術(shù),并聯(lián)合深度學(xué)習(xí)對煙葉進行智能化、無損分組、分色和分級的方法。
本發(fā)明的目的是以下述方式實現(xiàn)的:
一種基于高光譜圖像和深度學(xué)習(xí)算法的煙葉分級方法,所述方法包括以下步驟:
步驟1、獲取待測煙葉樣本的高光譜圖像數(shù)據(jù);高光譜成像系統(tǒng)的硬件平臺包括光源、分光模組、面陣CCD偵測器和裝有圖像采集卡的計算機;利用成像系統(tǒng)進行圖像信息采集的時候可同時獲得光譜信息,不用分開采集,縮短時間;
步驟2、對圖像進行高層特征提取,對數(shù)據(jù)進行降維,本步驟中先利用卷積神經(jīng)網(wǎng)絡(luò)進行預(yù)處理,然后利用深度信念網(wǎng)絡(luò)進行特征提?。?/p>
步驟3、對獲取的圖像信息和光譜信息進行分類:然后在其頂層添加一個Softmax層,將得到的特征輸入softmax回歸分類器實現(xiàn)分類。
所述步驟1中的高光譜圖像數(shù)據(jù)包括圖像與光譜。
所述步驟2中利用BP算法對網(wǎng)絡(luò)進行微調(diào)。
所述步驟2具體包括如下步驟:
201、先利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分割(2層的神經(jīng)網(wǎng)絡(luò));
202、分割之后,繼續(xù)利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像去噪(2層的神經(jīng)網(wǎng)絡(luò));
203、去噪后的圖像作為輸入,賦給深度信念網(wǎng)的第一個RBM(限制性玻爾茲曼機)的可見層(6層);深度信念網(wǎng)由3個RBM(限制性玻爾茲曼機)組成,每層RBM有1個隱藏層,1個可見層,總共6層,輸入層(可見層)的維度為m維,隱藏層維度分別為n1,n2,n3,深度信念網(wǎng)絡(luò)的訓(xùn)練流程如下:
(a)初次提取特征:訓(xùn)練第一個RBM網(wǎng)絡(luò),即用輸入層m維和第一個隱藏層n1維構(gòu)成的RBM網(wǎng)絡(luò)。輸入為原始的輸入數(shù)據(jù),訓(xùn)練第一個RBM,并得到訓(xùn)練樣本在隱藏層的輸出值(看作初次提取的特征),以及相應(yīng)的權(quán)值和偏置。
(b)去相關(guān),進行特征篩選:利用步驟(a)中隱藏層的輸出值作為第2個RBM網(wǎng)絡(luò)訓(xùn)練的輸入值,用第一個RBM的輸出與第二層隱藏層構(gòu)成輸入層為n1維和隱藏層為n2維的RBM網(wǎng)絡(luò),但是固定步驟(a)的權(quán)值和偏置不變。同步驟(a)中的方法,計算出隱藏層的輸出值、權(quán)值和偏置。依次類推,用同樣的方法訓(xùn)練接下來的第3個RBM網(wǎng)絡(luò)。第3個RBM的輸出作為優(yōu)化以后的特征。
204、優(yōu)化:利用BP算法(反向傳播算法)對網(wǎng)絡(luò)參數(shù)進行微調(diào),從而使模型收斂到局部最優(yōu)點,保證最后取到的特征是最優(yōu)的。
205、優(yōu)化過后,將最終得到的網(wǎng)絡(luò)的權(quán)值和偏置,賦給從卷積神經(jīng)網(wǎng)絡(luò)開始的原始輸入數(shù)據(jù)到深度信念網(wǎng)的最后一個RBM網(wǎng)絡(luò)構(gòu)成的網(wǎng)絡(luò)中,這樣便完成了特征的提取過程,深度信念網(wǎng)中最后一個RBM的輸出便為最優(yōu)提取的特征。
所述步驟(a)中對于一個RBM網(wǎng)絡(luò),只有輸入輸出,在訓(xùn)練RBM時,可見單元的個數(shù)為原始的輸入數(shù)據(jù),RBM的訓(xùn)練過程以及權(quán)值的更新如下:
(1)隨機初始化權(quán)值矩陣w和可見層的偏置向量a,隱藏層的偏置向量b;
(2)將原始的輸入數(shù)據(jù)輸入到可見層單元,輸入矩陣x正向傳播,利用公式:
計算出隱藏層單元的二值狀態(tài);
(3)在所有隱層單元的狀態(tài)確定以后,按反方向傳播,利用公式:
其中,激活函數(shù)計算出可見層矩陣x'的激活概率,x'是可見層的一個重構(gòu);
(5)再對x'進行正向傳播,根據(jù)公式(1)(2)計算出隱藏層的矩陣h'的二值狀態(tài)、h'的激活概率,h'為隱藏層的一個重構(gòu);
(6)用步驟(2)中得到的隱藏層h的激活概率p(h|x)減去步驟(5)中得到h'的激活概率,其結(jié)果作為隱藏層h對應(yīng)的偏置b的增量,用可見層x的激活概率減去x'的激活概率,其結(jié)果作為可見層x對應(yīng)的偏置a,用步驟(2)中得到的正向傳播的概率向量減去步驟(5)中得到的反向傳播的概率向量,其結(jié)果作為輸入層和輸出層之間的權(quán)值增量。每次迭代中,權(quán)值的更新和偏置的更新都是同時進行的,所以應(yīng)該是同時收斂的。結(jié)合其對應(yīng)的學(xué)習(xí)率,根據(jù)公式更新權(quán)值和偏置:
Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))
bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))
at=at-1+ε(x·p(h|x)-x'·p(h'|x'))
其中,ε為學(xué)習(xí)率;
(7)重復(fù)計算步驟(2)到(6),直至收斂或者達到最大迭代次數(shù)。如此,便完成了一個RBM的訓(xùn)練。
相對于現(xiàn)有技術(shù),本發(fā)明:
1、提出基于深度信念網(wǎng)絡(luò)的特征提取方法,嘗試用深度學(xué)習(xí)的方法來進行煙葉分級,相對于之前很多人所用的淺層學(xué)習(xí)的方法有了很大的改進。
2、提出基于圖像特征的煙葉智能分級的算法和模型。算法模型致力于提高分組分色分級速度和正確識別率(吻合率)。
3、采用或部分采用深度學(xué)習(xí)的無監(jiān)督算法,以提高系統(tǒng)的推廣泛化能力。
采用上述技術(shù)方案的本發(fā)明,能最大限度的做到無損分級、能準確的劃分煙葉等級,確保收購的各方利益不受損失。
附圖說明
圖1為深度信念網(wǎng)的原理框圖。
圖2為高光譜成像系統(tǒng)通用結(jié)構(gòu)圖。
圖3為RBM的結(jié)構(gòu)示意圖。
圖4是一個煙葉等級B1K光譜圖像實施例示意圖。
具體實施方式
本實施例中,高光譜圖像聯(lián)合深度學(xué)習(xí)進行煙葉分級的方法,包括以下步驟:
步驟1、實時獲取待測煙葉的圖像信息和光譜信息。如圖2所示,高光譜成像系統(tǒng)的硬件平臺包括光源、分光模組、面陣CCD偵測器和裝有圖像采集卡的計算機;利用成像系統(tǒng)進行圖像信息采集的時候可同時獲得光譜信息,不用分開采集,縮短時間。本實施例中利用光譜儀完成圖像信息采集,存儲于計算機,上述的圖像信息指的是煙葉為整片煙葉的圖像;且采集的煙葉圖像既可以同時利用煙葉的透射和反射兩種圖像,或者也可以僅利用透射圖像。需要指出的是,本實施例中可以利用圖像采集卡的二次開發(fā)功能,實時控制采集的圖像信息并存儲于計算機,便于實時識別分組(分部位)、分色和分級和再次學(xué)習(xí)。并且,本實施例中利用高光譜儀進行光譜信息采集,其采集范圍可以為200-2500nm或其中任意部分。一個煙葉等級B1K光譜圖像示意圖如圖4所示。
步驟2、對獲取的圖像信息和光譜信息進行特征提?。?假設(shè)使用10層神經(jīng)網(wǎng)絡(luò))
201、先利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分割(使用2層的神經(jīng)網(wǎng)絡(luò));
202、分割之后,繼續(xù)利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像去噪(使用2層的神經(jīng)網(wǎng)絡(luò));
203、去噪后的圖像作為輸入,賦給深度信念網(wǎng)的第一個RBM(限制性玻爾茲曼機)的可見層(一共為6層);
深度信念網(wǎng)由3個RBM(限制性玻爾茲曼機)組成,每層RBM有1個隱藏層,1個可見層,總共6層,輸入層(可見層)的維度為m維,隱藏層維度分別為n1,n2,n3,深度信念網(wǎng)絡(luò)的訓(xùn)練流程如下:
(a)初次提取特征:訓(xùn)練第一個RBM網(wǎng)絡(luò),(每個RBM的形式如圖3所示)即用輸入層m維和第一個隱藏層n1維構(gòu)成的RBM網(wǎng)絡(luò)。輸入為原始的輸入數(shù)據(jù),訓(xùn)練第一個RBM,并得到訓(xùn)練樣本在隱藏層的輸出值(看作初次提取的特征),以及相應(yīng)的權(quán)值和偏置。
一個RBM的訓(xùn)練過程如下:
對于一個RBM(限制性玻爾茲曼機)網(wǎng)絡(luò),只有輸入輸出,在訓(xùn)練RBM時,可見單元的個數(shù)也就是原始的輸入數(shù)據(jù)的個數(shù),即圖像的像素。RBM的訓(xùn)練過程以及權(quán)值的更新如下:
(1)隨機初始化權(quán)值矩陣w和可見層的偏置向量a,隱藏層的偏置向量b。
(2)將原始的輸入數(shù)據(jù)輸入到可見層單元,輸入矩陣x正向傳播,利用公式:
計算出隱藏層單元的二值狀態(tài)。
(3)在所有隱層單元的狀態(tài)確定以后,按反方向傳播,利用公式:
其中,激活函數(shù)計算出可見層矩陣x'的激活概率,x'也是可見層的一個重構(gòu)。
(5)再對x'進行正向傳播,根據(jù)公式(1)(2)計算出隱藏層的矩陣h'(隱藏層的一個重構(gòu))的二值狀態(tài)、h'的激活概率。
(6)用步驟(2)中得到的隱藏層h的激活概率p(h|x)減去步驟(5)中得到h'的激活概率,其結(jié)果作為隱藏層h對應(yīng)的偏置b的增量,用可見層x的激活概率減去x'的激活概率,其結(jié)果作為可見層x對應(yīng)的偏置a,用步驟(2)中得到的正向傳播的概率向量減去步驟(5)中得到的反向傳播的概率向量,其結(jié)果作為輸入層和輸出層之間的權(quán)值增量。每次迭代中,權(quán)值的更新和偏置的更新都是同時進行的,所以應(yīng)該是同時收斂的。結(jié)合其對應(yīng)的學(xué)習(xí)率,根據(jù)公式更新權(quán)值和偏置:
Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))
bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))
at=at-1+ε(x·p(h|x)-x'·p(h'|x'))
其中,ε為學(xué)習(xí)率。
(7)重復(fù)計算步驟(2)到(6),直至收斂或者達到最大迭代次數(shù)。如此,便完成了一個RBM的訓(xùn)練。
(b)去相關(guān),進行特征篩選:利用步驟(a)中隱藏層的輸出值作為第2個RBM網(wǎng)絡(luò)訓(xùn)練的輸入值,用第一個RBM的輸出與第二層隱藏層構(gòu)成輸入層為n1維和隱藏層為n2維的RBM網(wǎng)絡(luò),但是固定步驟(a)的權(quán)值和偏置不變。同步驟(a)中的方法,計算出隱藏層的輸出值、權(quán)值和偏置。依次類推,用同樣的方法訓(xùn)練接下來的第3個RBM網(wǎng)絡(luò)。第3個RBM的輸出作為優(yōu)化以后的特征。
204、優(yōu)化:利用BP算法(反向傳播算法)對網(wǎng)絡(luò)參數(shù)進行微調(diào),從而使模型收斂到局部最優(yōu)點,保證最后取到的特征是最優(yōu)的。
205、優(yōu)化過后,將最終得到的網(wǎng)絡(luò)的權(quán)值和偏置,賦給從卷積神經(jīng)網(wǎng)絡(luò)開始的原始輸入數(shù)據(jù)到深度信念網(wǎng)的最后一個RBM網(wǎng)絡(luò)構(gòu)成的網(wǎng)絡(luò)中,至此,完成了煙葉圖像的特征提取過程,深度信念網(wǎng)中最后一個RBM的輸出就是煙葉圖像中用于分類的最優(yōu)特征。
步驟3、對獲取的圖像信息和光譜信息進行分類:特征提取之后,進行分類時,在其頂層添加一個Softmax層,將得到的特征輸入到softmax回歸分類器來進行分類。
以上所述的僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本領(lǐng)域的技術(shù)人員來說,在不脫離本發(fā)明整體構(gòu)思前提下,還可以作出若干改變和改進,這些也應(yīng)該視為本發(fā)明的保護范圍。