本發(fā)明屬于智慧農(nóng)業(yè),特別是涉及一種基于機(jī)器學(xué)習(xí)的甘蔗產(chǎn)量預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù):
1、隨著農(nóng)業(yè)信息化的發(fā)展,精準(zhǔn)農(nóng)業(yè)已成為現(xiàn)代農(nóng)業(yè)的重要趨勢(shì)。甘蔗作為重要的糖料作物,其產(chǎn)量及品質(zhì)的預(yù)測(cè)對(duì)于糖業(yè)生產(chǎn)具有重要意義。甘蔗作為我國(guó)南方地區(qū)重要的經(jīng)濟(jì)作物之一,在飲料、制糖等行業(yè)具有廣泛的應(yīng)用。然而,甘蔗生長(zhǎng)過(guò)程中受多種因素影響,如氣象條件、土壤環(huán)境、作物基因型等,導(dǎo)致甘蔗產(chǎn)量難以準(zhǔn)確預(yù)測(cè)。傳統(tǒng)預(yù)測(cè)方法多依賴于人工經(jīng)驗(yàn)和簡(jiǎn)單統(tǒng)計(jì),難以滿足現(xiàn)代農(nóng)業(yè)生產(chǎn)的高精度需求。近年來(lái),機(jī)器學(xué)習(xí)(ml)和深度學(xué)習(xí)(dl)技術(shù)因其能夠識(shí)別海量數(shù)據(jù)集中的非線性模式而被廣泛應(yīng)用于作物產(chǎn)量預(yù)測(cè)。然而,現(xiàn)有技術(shù)中針對(duì)甘蔗產(chǎn)量及品質(zhì)預(yù)測(cè)的方法大多側(cè)重于單一數(shù)據(jù)源或算法,缺乏綜合性和系統(tǒng)性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在提供一種基于機(jī)器學(xué)習(xí)的甘蔗產(chǎn)量預(yù)測(cè)方法及系統(tǒng),通過(guò)收集多源數(shù)據(jù)、提取關(guān)鍵特征、構(gòu)建與優(yōu)化預(yù)測(cè)模型,實(shí)現(xiàn)甘蔗產(chǎn)量的精準(zhǔn)預(yù)測(cè),并為農(nóng)業(yè)生產(chǎn)管理提供決策支持。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
3、本發(fā)明為一種基于機(jī)器學(xué)習(xí)的甘蔗產(chǎn)量預(yù)測(cè)方法,包括以下步驟:
4、步驟一、數(shù)據(jù)收集與預(yù)處理:收集甘蔗生長(zhǎng)周期內(nèi)的作物基因數(shù)據(jù)、無(wú)人機(jī)高光譜影像數(shù)據(jù)、衛(wèi)星遙感數(shù)據(jù)、地面觀測(cè)數(shù)、氣象數(shù)據(jù)以及歷史產(chǎn)量數(shù)據(jù),對(duì)采集到的數(shù)據(jù)進(jìn)行分類存儲(chǔ),同時(shí)對(duì)相關(guān)數(shù)據(jù)一一進(jìn)行預(yù)處理操作,將多源數(shù)據(jù)進(jìn)行融合,形成多維數(shù)據(jù)集;
5、步驟二、特征提?。簭念A(yù)處理后的數(shù)據(jù)中提取與甘蔗產(chǎn)量及品質(zhì)密切相關(guān)的關(guān)鍵特征,利用特征選擇算法進(jìn)一步篩選出對(duì)預(yù)測(cè)結(jié)果貢獻(xiàn)度大的特征子集并進(jìn)行降維處理;
6、步驟三、模型選擇與構(gòu)建:根據(jù)不同的預(yù)測(cè)目標(biāo)選擇不同的特征子集采用合適的機(jī)器學(xué)習(xí)算法或算法組合,構(gòu)建預(yù)測(cè)模型,所述機(jī)器學(xué)習(xí)算法包括但是不限于:梯度提升回歸樹(shù)、偏最小二乘回歸、支持向量機(jī)回歸、bp神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)、深度極限學(xué)習(xí)機(jī)、多元線性回歸、逐步多元回歸、廣義線性模型、廣義增強(qiáng)模型和隨機(jī)森林算法;
7、步驟四、模型訓(xùn)練與調(diào)優(yōu):使用歷史數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,并通過(guò)交叉驗(yàn)證對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu);
8、步驟五、模型預(yù)測(cè)、集成與融合:利用訓(xùn)練好的預(yù)測(cè)模型對(duì)甘蔗產(chǎn)量進(jìn)行預(yù)測(cè)、采用集成學(xué)習(xí)或模型融合的方法,對(duì)多個(gè)不同的預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行集成,以提高預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性;
9、步驟六:預(yù)測(cè)報(bào)告生成:根據(jù)選定的集成策略,計(jì)算出最終的甘蔗產(chǎn)量預(yù)測(cè)值,根據(jù)預(yù)測(cè)結(jié)果和影響因素分析,提出相應(yīng)的農(nóng)業(yè)管理建議和優(yōu)化措施;
10、步驟七、結(jié)果驗(yàn)證與評(píng)估:通過(guò)與實(shí)際產(chǎn)量數(shù)據(jù)進(jìn)行對(duì)比驗(yàn)證,采用多種評(píng)估指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行驗(yàn)證和評(píng)估,評(píng)估預(yù)測(cè)模型的準(zhǔn)確性和可靠性;
11、步驟八、持續(xù)優(yōu)化與改進(jìn):建立反饋機(jī)制,收集用戶對(duì)預(yù)測(cè)結(jié)果的反饋意見(jiàn),并根據(jù)反饋對(duì)模型進(jìn)行持續(xù)優(yōu)化和改進(jìn),同時(shí)跟蹤新技術(shù)和新方法的發(fā)展動(dòng)態(tài),及時(shí)將新技術(shù)引入預(yù)測(cè)模型中以提高性能。
12、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述數(shù)據(jù)收集與預(yù)處理步驟具體包括:
13、無(wú)人機(jī)高光譜影像數(shù)據(jù)的采集:在甘蔗生長(zhǎng)周期內(nèi),通過(guò)無(wú)人機(jī)搭載高光譜相機(jī)獲取甘蔗田的高光譜影像數(shù)據(jù),以捕捉甘蔗生長(zhǎng)過(guò)程中的光譜信息,無(wú)人機(jī)高光譜影像數(shù)據(jù)包括但不限于冠層覆蓋度、冠層高度、歸一化植被指數(shù)、過(guò)綠指數(shù);
14、衛(wèi)星遙感數(shù)據(jù)的獲?。豪眯l(wèi)星遙感技術(shù),定期收集甘蔗田的遙感影像數(shù)據(jù),以獲取更大范圍的甘蔗生長(zhǎng)信息;
15、地面觀測(cè)數(shù)據(jù)的收集:通過(guò)在甘蔗田采集甘蔗關(guān)鍵表型的實(shí)際測(cè)量值包括但不限于甘蔗生長(zhǎng)參數(shù)、產(chǎn)量相關(guān)指標(biāo)以及土壤和環(huán)境參數(shù);
16、氣象數(shù)據(jù)的采集:收集甘蔗生長(zhǎng)周期內(nèi)的氣象數(shù)據(jù),包括但不限于溫度、降水以及光照,以分析氣象因素對(duì)甘蔗產(chǎn)量的影響;
17、數(shù)據(jù)分類存儲(chǔ):將采集到的各類數(shù)據(jù)進(jìn)行分類存儲(chǔ),以便后續(xù)處理;
18、數(shù)據(jù)預(yù)處理:對(duì)收集到的數(shù)據(jù)進(jìn)行清洗、去除異常值、填充缺失值等預(yù)處理操作,以提高數(shù)據(jù)質(zhì)量;
19、多源數(shù)據(jù)融合:將經(jīng)過(guò)預(yù)處理的多源數(shù)據(jù)進(jìn)行融合,形成包含多種信息的多維數(shù)據(jù)集,為后續(xù)特征提取和模型構(gòu)建提供數(shù)據(jù)支持,同時(shí)采用高級(jí)時(shí)空插值方法對(duì)時(shí)空數(shù)據(jù)進(jìn)行深度融合,以捕捉甘蔗生長(zhǎng)過(guò)程中空間分布與時(shí)間演變的復(fù)雜關(guān)系。
20、作為本發(fā)明的一種優(yōu)選技術(shù)方案,數(shù)據(jù)預(yù)處理階段選擇以下機(jī)器學(xué)習(xí)算法對(duì)不同采集方式采集到的數(shù)據(jù)進(jìn)行處理:
21、對(duì)于無(wú)人機(jī)高光譜影像數(shù)據(jù),采用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合深度學(xué)習(xí)框架進(jìn)行特征提取,以充分利用高光譜影像中的光譜和空間信息,提高對(duì)甘蔗生長(zhǎng)狀態(tài)識(shí)別的準(zhǔn)確性;
22、對(duì)于衛(wèi)星遙感數(shù)據(jù),采用長(zhǎng)短期記憶網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合注意力機(jī)制,以捕捉時(shí)間序列數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系和重要時(shí)間點(diǎn)的變化,準(zhǔn)確預(yù)測(cè)甘蔗生長(zhǎng)趨勢(shì);
23、對(duì)于地面觀測(cè)數(shù)據(jù)中的連續(xù)變量,包括但不限于土壤濕度以及養(yǎng)分含量,采用支持向量機(jī)回歸或隨機(jī)森林回歸,以處理這些數(shù)據(jù)的非線性和交互作用,提高產(chǎn)量預(yù)測(cè)的精度;
24、對(duì)于氣象數(shù)據(jù)中的分類變量包括但不限于降雨類型以及風(fēng)向,采用決策樹(shù)或梯度提升樹(shù)進(jìn)行分類處理,以準(zhǔn)確判斷氣象條件對(duì)甘蔗產(chǎn)量的影響;
25、對(duì)于時(shí)間序列的氣象數(shù)據(jù),包括但不限于日降雨量以及日平均溫度,采用時(shí)間序列分析算法arima或季節(jié)性分解時(shí)間序列預(yù)測(cè)模型sari?ma結(jié)合深度學(xué)習(xí)模型,以捕捉氣象數(shù)據(jù)的季節(jié)性和周期性變化,提高預(yù)測(cè)的準(zhǔn)確性。
26、作為本發(fā)明的一種優(yōu)選技術(shù)方案,在特征提取階段,針對(duì)時(shí)空數(shù)據(jù)的特性,采用了卷積神經(jīng)網(wǎng)絡(luò)(cnn)與循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)的組合模型(convlstm)用于對(duì)時(shí)空特征進(jìn)行提取,以有效提取甘蔗生長(zhǎng)過(guò)程中的時(shí)空特征。
27、作為本發(fā)明的一種優(yōu)選技術(shù)方案,在特征提取階段,采用無(wú)監(jiān)督學(xué)習(xí)方法對(duì)特征進(jìn)行進(jìn)一步降維,以減少計(jì)算復(fù)雜度并保留關(guān)鍵信息,同時(shí)探索數(shù)據(jù)中的潛在結(jié)構(gòu)和模式。
28、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述模型選擇與構(gòu)建步驟中,針對(duì)不同的特征子集,選擇以下機(jī)器學(xué)習(xí)算法進(jìn)行一一對(duì)應(yīng)限定:
29、對(duì)于光譜特征,選擇梯度提升回歸樹(shù)構(gòu)建預(yù)測(cè)模型;
30、對(duì)于空間特征,選擇支持向量機(jī)回歸構(gòu)建預(yù)測(cè)模型;
31、對(duì)于環(huán)境特征,選擇多元線性回歸構(gòu)建預(yù)測(cè)模型。
32、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述模型訓(xùn)練步驟中,采用歷史數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,并通過(guò)交叉驗(yàn)證對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu),具體包括:
33、將歷史數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,比例為70%:15%:15%;
34、使用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練;
35、利用驗(yàn)證集對(duì)訓(xùn)練好的模型進(jìn)行驗(yàn)證,并根據(jù)驗(yàn)證結(jié)果調(diào)整模型參數(shù);
36、使用與訓(xùn)練集獨(dú)立的測(cè)試集對(duì)模型進(jìn)行驗(yàn)證,以評(píng)估模型在實(shí)際應(yīng)用中的性能
37、重復(fù)上述過(guò)程,直至模型性能達(dá)到最優(yōu)。
38、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括,對(duì)特定區(qū)域的甘蔗產(chǎn)量預(yù)測(cè),采用遷移學(xué)習(xí)策略,利用在其他相似區(qū)域訓(xùn)練好的模型作為預(yù)訓(xùn)練模型,通過(guò)少量本地?cái)?shù)據(jù)微調(diào),快速適應(yīng)新區(qū)域的預(yù)測(cè)需求,提高預(yù)測(cè)效率和準(zhǔn)確性。
39、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述模型預(yù)測(cè)、集成與融合步驟中,集成學(xué)習(xí)方法包括但不限于堆疊、提升和裝袋;
40、結(jié)果驗(yàn)證與評(píng)估步驟中,評(píng)估指標(biāo)包括均方誤差、均方根誤差、決定系數(shù)和絕對(duì)百分比誤差。
41、本發(fā)明還提供了一種基于機(jī)器學(xué)習(xí)的甘蔗產(chǎn)量預(yù)測(cè)系統(tǒng),用于實(shí)現(xiàn)上述的方法,該系統(tǒng)包括:
42、數(shù)據(jù)采集模塊:負(fù)責(zé)在甘蔗生長(zhǎng)周期內(nèi),自動(dòng)收集相關(guān)數(shù)據(jù);
43、數(shù)據(jù)預(yù)處理模塊:接收來(lái)自數(shù)據(jù)采集模塊的數(shù)據(jù),執(zhí)行預(yù)處理操作,并將多源數(shù)據(jù)進(jìn)行融合,形成包含作物基因信息、生長(zhǎng)狀態(tài)以及環(huán)境參數(shù)的多維度信息的數(shù)據(jù)集,為后續(xù)分析提供高質(zhì)量的數(shù)據(jù)基礎(chǔ);
44、特征提取與模型選擇模塊:用于采用先進(jìn)的機(jī)器學(xué)習(xí)算法從預(yù)處理后的數(shù)據(jù)中自動(dòng)提取關(guān)鍵特征,根據(jù)特征提取結(jié)果,選擇合適的機(jī)器學(xué)習(xí)算法或算法組合構(gòu)建預(yù)測(cè)模型;
45、模型訓(xùn)練與優(yōu)化模塊:利用歷史數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,并通過(guò)交叉驗(yàn)證、網(wǎng)格搜索策略對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu);
46、預(yù)測(cè)與決策支持模塊:利用訓(xùn)練好的模型對(duì)甘蔗產(chǎn)量進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果和影響因素分析,生成詳細(xì)的預(yù)測(cè)報(bào)告,并提出相應(yīng)的農(nóng)業(yè)管理建議和優(yōu)化措施,并支持集成學(xué)習(xí)和模型融合策略以提高預(yù)測(cè)結(jié)果的準(zhǔn)確性和穩(wěn)定性;
47、用戶交互與反饋模塊:提供友好的用戶界面,允許用戶輸入查詢條件、查看預(yù)測(cè)結(jié)果及接收農(nóng)業(yè)管理建議,同時(shí)該模塊還負(fù)責(zé)收集用戶對(duì)預(yù)測(cè)結(jié)果的反饋意見(jiàn),通過(guò)建立反饋機(jī)制,持續(xù)改進(jìn)和優(yōu)化預(yù)測(cè)模型。
48、本發(fā)明具有以下有益效果:
49、本發(fā)明利針對(duì)甘蔗產(chǎn)量預(yù)測(cè)的復(fù)雜性和傳統(tǒng)方法的局限性,提出了一種基于機(jī)器學(xué)習(xí)的甘蔗產(chǎn)量預(yù)測(cè)方法及其系統(tǒng)。該方法通過(guò)綜合應(yīng)用多種數(shù)據(jù)源和先進(jìn)的機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)了對(duì)甘蔗產(chǎn)量的高精度預(yù)測(cè)。具體而言,該方法首先融合了作物基因數(shù)據(jù)、無(wú)人機(jī)高光譜影像數(shù)據(jù)等多維度信息,有效提升了預(yù)測(cè)的全面性和準(zhǔn)確性;其次,采用特征提取和模型選擇構(gòu)建技術(shù),篩選出與甘蔗產(chǎn)量密切相關(guān)的關(guān)鍵特征,并構(gòu)建合適的預(yù)測(cè)模型;最后,通過(guò)模型訓(xùn)練與優(yōu)化、預(yù)測(cè)與決策支持等步驟,顯著提高了預(yù)測(cè)結(jié)果的穩(wěn)定性和可靠性。此外,該系統(tǒng)還支持持續(xù)優(yōu)化與改進(jìn),能夠根據(jù)用戶反饋和新數(shù)據(jù)動(dòng)態(tài)調(diào)整模型參數(shù),適應(yīng)不斷變化的農(nóng)業(yè)生產(chǎn)需求。綜上所述,該專利不僅提高了甘蔗產(chǎn)量預(yù)測(cè)的精度和效率,還為農(nóng)業(yè)生產(chǎn)提供了科學(xué)決策支持,具有重要的應(yīng)用價(jià)值和社會(huì)效益。
50、當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。