一種混合k調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,其包括以下步驟:(1)蘋(píng)果樣本近紅外光譜采集;(2)對(duì)蘋(píng)果樣本近紅外光譜進(jìn)行降維處理;(3)用混合K調(diào)和聚類(lèi)方法進(jìn)行蘋(píng)果品種的分類(lèi)。本發(fā)明具有檢測(cè)速度快,分類(lèi)準(zhǔn)確率高,分類(lèi)效率高,對(duì)蘋(píng)果不造成損壞等優(yōu)點(diǎn)??蓪?shí)現(xiàn)蘋(píng)果品種的正確分類(lèi)。
【專(zhuān)利說(shuō)明】一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種蘋(píng)果品種分類(lèi)方法,具體涉及一種基于混合K調(diào)和聚類(lèi)方法和近紅外光譜技術(shù)的蘋(píng)果品種分類(lèi)方法。
【背景技術(shù)】
[0002]蘋(píng)果是人們經(jīng)常食用的水果之一。蘋(píng)果果實(shí)里包含了一些與健康和感官有關(guān)的成分,包括單糖、礦物質(zhì)、膳食纖維和各種生活性物質(zhì),如維生素C和酚類(lèi)化合物。不同品種的蘋(píng)果其內(nèi)部的糖度,酸度和可溶性固形物等是不相同的。即蘋(píng)果品種不同,其內(nèi)部品質(zhì)是不同的。所以,優(yōu)選好的品種的蘋(píng)果是農(nóng)業(yè)科技人員的重要任務(wù)。
[0003]近紅外光譜技術(shù)是利用物質(zhì)對(duì)光的吸收、散射、反射和透射等特性來(lái)確定其成分含量的一種非破壞性檢測(cè)技術(shù)。近紅外光譜技術(shù)具有非破壞性檢測(cè),檢測(cè)速度快,可同時(shí)檢測(cè)多種成分等優(yōu)點(diǎn)。近紅外光譜射向蘋(píng)果后得到漫反射光譜,在不同品種的蘋(píng)果上獲得的漫反射光譜是不同的,利用這個(gè)原理,可以將不同品種的蘋(píng)果區(qū)分開(kāi)來(lái),即實(shí)現(xiàn)不同品種蘋(píng)果的分類(lèi)。
[0004]K調(diào)和均值聚類(lèi)是一種無(wú)監(jiān)督的學(xué)習(xí)方法,是一種基于中心的迭代聚類(lèi)方法。K調(diào)和均值聚類(lèi)將所有數(shù)據(jù)點(diǎn)到每個(gè)聚類(lèi)中心的調(diào)和平均值的和作為聚類(lèi)的目標(biāo)函數(shù)。K均值聚類(lèi)對(duì)初始聚類(lèi)中心敏感,而由于提升函數(shù)的作用使K調(diào)和均值聚類(lèi)對(duì)初始聚類(lèi)中心不敏感。另外一方面,K調(diào)和均 值聚類(lèi)容易陷入局部極小點(diǎn)。為了解決這個(gè)問(wèn)題,一些學(xué)者提出了一些改進(jìn)算法,比如=Yang等人提出一種粒子群優(yōu)化的K調(diào)和均值聚類(lèi)方法(PS0KHM),PSOKHM能避免局部極小點(diǎn),并且解決了粒子群優(yōu)化收斂速度慢問(wèn)題。Jiang等人提出一種基于蟻群聚類(lèi)的K調(diào)和均值聚類(lèi)方法。在給定初始溫度值后模擬退火用來(lái)搜尋一些空間分子的平衡狀態(tài),它是一種求解組合優(yōu)化問(wèn)題的方法。GUng^r和Onler在模擬退火和K調(diào)和均值聚類(lèi)基礎(chǔ)上提出一種新的聚類(lèi)算法以求得K調(diào)和均值聚類(lèi)的全局最優(yōu)解。Gilng0r和Cnler利用禁忌搜索方法提出禁忌K調(diào)和均值聚類(lèi)方法,該方法解決了 K調(diào)和均值聚類(lèi)的局部極小點(diǎn)問(wèn)題。但是,K調(diào)和均值聚類(lèi)還存在著對(duì)噪聲敏感的問(wèn)題。因?yàn)镵調(diào)和均值聚類(lèi)建立在可能性約束條件基礎(chǔ)上,K調(diào)和均值聚類(lèi)使數(shù)據(jù)點(diǎn)在所有類(lèi)中的隸屬度之和為I??赡苄约s束條件避免了所有隸屬度為O的平凡解,但是造成了 K調(diào)和均值聚類(lèi)對(duì)噪聲敏感。為了解決K調(diào)和均值聚類(lèi)對(duì)噪聲敏感的問(wèn)題,本發(fā)明提出一種混合調(diào)和聚類(lèi)方法。
[0005]近紅外光譜技術(shù)作為一種無(wú)損、快速的檢測(cè)方法,已被廣泛用于農(nóng)產(chǎn)品和食品檢測(cè)領(lǐng)域。目前,在應(yīng)用近紅外光譜技術(shù)分類(lèi)水果時(shí)對(duì)近紅外光譜的分類(lèi)方法主要有軟獨(dú)立模式分類(lèi)(SMCA),偏最小二乘判別分析(PLSDA),人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、K-近鄰法(KNN)等方法。這些方法屬于有監(jiān)督的學(xué)習(xí)方法,即它們需要學(xué)習(xí)樣本來(lái)獲取先驗(yàn)知識(shí)。在沒(méi)有學(xué)習(xí)樣本,或者學(xué)習(xí)樣本比較少的情況下運(yùn)用以上方法進(jìn)行水果分類(lèi)時(shí)會(huì)導(dǎo)致分類(lèi)準(zhǔn)確率低而難以實(shí)現(xiàn)水果的正確分類(lèi)。為解決這個(gè)問(wèn)題,本發(fā)明應(yīng)用提出的一種混合調(diào)和聚類(lèi)方法進(jìn)行蘋(píng)果品種的分類(lèi),屬于無(wú)監(jiān)督的蘋(píng)果品種分類(lèi)方法。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是在于克服現(xiàn)有技術(shù)存在的上述缺陷,提供一種運(yùn)用近紅外漫反射光譜技術(shù)和一種混合K調(diào)和聚類(lèi)方法的蘋(píng)果品種分類(lèi)方法,具有檢測(cè)速度快,分類(lèi)準(zhǔn)確率高,無(wú)需學(xué)習(xí)樣本,對(duì)蘋(píng)果不造成損壞等優(yōu)點(diǎn)。
[0007]本發(fā)明依據(jù)的原理:研究表明,蘋(píng)果的近紅外漫反射光譜包含了蘋(píng)果內(nèi)部的糖度,酸度和可溶性固形物等內(nèi)部品種信息,不同品種的蘋(píng)果所對(duì)應(yīng)的近紅外漫反射光譜也不同。運(yùn)用主成分分析壓縮不同品種蘋(píng)果的近紅外光譜數(shù)據(jù)。再根據(jù)一種混合調(diào)和聚類(lèi)方法將不同品種蘋(píng)果進(jìn)行分類(lèi)。
[0008]根據(jù)上述原理,采用的技術(shù)方案包括以下步驟:
步驟一、蘋(píng)果樣本近紅外光譜采集:針對(duì)不同品種的蘋(píng)果樣本,用近紅外光譜儀對(duì)這些蘋(píng)果樣本投射近紅外,獲取蘋(píng)果樣本的近紅外漫反射光譜信息,將光譜信息存儲(chǔ)在計(jì)算機(jī)里。實(shí)驗(yàn)過(guò)程中,盡量保持室內(nèi)的溫度和濕度基本一致。
[0009]步驟二、對(duì)蘋(píng)果樣本近紅外光譜數(shù)據(jù)進(jìn)行壓縮:將蘋(píng)果樣本近紅外光譜采用主成分分析方法(PCA)進(jìn)行壓縮。
[0010]步驟三、用一種混合K調(diào)和聚類(lèi)方法進(jìn)行蘋(píng)果品種的分類(lèi):運(yùn)行一種混合K調(diào)和聚類(lèi)方法得到模糊隸屬度和典型值,根據(jù)模糊隸屬度和典型值可將不同品種蘋(píng)果進(jìn)行分類(lèi)。
[0011]所述步驟一中近紅外漫反射光譜信息是指光譜的波數(shù)范圍為lOOOOlOOOcnT1,采集到每個(gè)蘋(píng)果樣本的光譜是1557維的數(shù)據(jù)。
[0012]所述步驟二中用主成分分析方法進(jìn)行降維時(shí),在滿足主成分的累計(jì)可信度≥98%條件下選取主成分個(gè)數(shù)。
[0013]所述步驟三中的一種混合K調(diào)和聚類(lèi)方法方法如下:
1.初始化
(1)確定類(lèi)別數(shù)樣本數(shù)/7和權(quán)重指數(shù)》和『的值,且滿足n>k>l,+ OO ym, ;設(shè)置迭代次數(shù)初始值r =0和最大迭代次數(shù)為rmax ;設(shè)置迭代最大誤差參數(shù)ε ;
(2)確定聚類(lèi)的初始類(lèi)中心;
(3)計(jì)算樣本的協(xié)方差¥:
【權(quán)利要求】
1.一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,具體包括如下步驟: (1)蘋(píng)果樣本近紅外光譜采集:針對(duì)不同品種的蘋(píng)果樣本,用近紅外光譜儀對(duì)這些蘋(píng)果樣本投射近紅外,獲取蘋(píng)果樣本的近紅外漫反射光譜信息,將光譜信息存儲(chǔ)在計(jì)算機(jī)里; (2)對(duì)蘋(píng)果樣本近紅外光譜數(shù)據(jù)進(jìn)行壓縮:將蘋(píng)果樣本近紅外光譜采用主成分分析方法進(jìn)行壓縮; (3)用一種混合K調(diào)和聚類(lèi)方法進(jìn)行蘋(píng)果品種的分類(lèi):運(yùn)行一種混合K調(diào)和聚類(lèi)方法得到模糊隸屬度和典型值,根據(jù)模糊隸屬度和典型值將不同品種蘋(píng)果進(jìn)行分類(lèi)。
2.根據(jù)權(quán)利要求1所述的一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,其特征在于:所述步驟(1)中,保持室內(nèi)的溫度和濕度一致。
3.根據(jù)權(quán)利要求1所述的一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,其特征在于:所述步驟(1)中,近紅外漫反射光譜信息是指光譜的波數(shù)范圍為lOOOOlOOOcnT1,采集到每個(gè)蘋(píng)果樣本的光譜是1557維的數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,其特征在于:所述步驟(2)中,用主成分分析方法進(jìn)行降維時(shí),在滿足主成分的累計(jì)可信度≥98%條件下選取主成分個(gè)數(shù)。
5.根據(jù)權(quán)利要求1所述的一種混合K調(diào)和聚類(lèi)的蘋(píng)果品種近紅外光譜分類(lèi)方法,其特征在于:所述步驟(3)中,所述一種混合K調(diào)和聚類(lèi)方法的具體步驟為: A、初始化: a、確定類(lèi)別數(shù)I樣本數(shù)/?和權(quán)重指數(shù)》和PF的值,且滿足/?>左>1,+00 >m,w>l ;設(shè)置迭代次數(shù)初始值r =0和最大迭代次數(shù)為rmax ;設(shè)置迭代最大誤差參數(shù)ε ; b、確定聚類(lèi)的初始類(lèi)中心; C、計(jì)算樣本的協(xié)方差滬:
【文檔編號(hào)】G01N21/359GK103954582SQ201410143595
【公開(kāi)日】2014年7月30日 申請(qǐng)日期:2014年4月11日 優(yōu)先權(quán)日:2014年4月11日
【發(fā)明者】武小紅, 武斌, 孫俊, 李敏 申請(qǐng)人:江蘇大學(xué)