本發(fā)明涉及井下安全領域,特別涉及一種礦井救災探測機器人的智能控制方法。
背景技術(shù):
井下作業(yè)環(huán)境復雜,在生產(chǎn)過程中往往受到瓦斯、礦塵、火、水、頂板等災害的威脅。由于我國礦井自然條件差,加上技術(shù)和管理等諸多方位的不到位,以及近年來國家對礦產(chǎn)資源需求量不斷增大,使得井下安全事故頻繁發(fā)生,人員傷亡十分慘重。井下安全事故發(fā)生后,環(huán)境的復雜性和危險性使得救援人員無法接近現(xiàn)場進行偵查或施救。因此,研發(fā)礦井救災機器人對井下安全生產(chǎn),減少國家和人民生命財產(chǎn)的損失具有十分重要的意義。
現(xiàn)有井下救災機器人檢測信息較為單一,不能綜合各個因素來判斷是否發(fā)生事故,經(jīng)常出現(xiàn)誤動作。
技術(shù)實現(xiàn)要素:
本發(fā)明目的為針對現(xiàn)有技術(shù)的問題,提出了能夠根據(jù)井下多方面的環(huán)境判斷是否存在事故、快速做出反應的礦井救災探測機器人的智能控制方法。
為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案,一種礦井救災探測機器人的智能控制方法,包括以下步驟:
步驟一:采用瓦斯?jié)舛葌鞲衅?、一氧化碳傳感器、溫度傳感器對巷道中的環(huán)境參數(shù)進行檢測;礦井救災探測機器人根據(jù)視覺傳感器、超聲波傳感器、紅外傳感器信息進行避障;利用GPS定位模塊、生命探測儀對井下被困人員進行定位及生命探測。
步驟二:利用卡爾曼濾波對步驟一中的巷道環(huán)境信息傳感器信息進行濾波處理,根據(jù)上一時刻傳感器的狀態(tài)值遞推得到下一時刻的估計值。
步驟三:采用Elman神經(jīng)網(wǎng)絡對礦井救災探測機器人智能控制系統(tǒng)進行映射,以經(jīng)卡爾曼濾波處理后的各傳感器數(shù)據(jù)作為Elman神經(jīng)網(wǎng)絡的輸入,以井下安全等級為Elman神經(jīng)網(wǎng)絡輸出,對Elman神經(jīng)網(wǎng)絡進行訓練,其網(wǎng)絡狀態(tài)表達式為:
yt=f([Yt, It, Dt]T)
式中,以經(jīng)KF處理后的巷道環(huán)境監(jiān)測數(shù)據(jù)為輸入It=[i(t-1),i(t-2),...,i(t-m)];以安全等級為輸出Yt=[y(t-1),y(t-2),...,y(t-n)];系統(tǒng)的噪聲向量為Dt=[d(t-1),d(t-2),...,d(t-m)];f(.)為非線性映射函數(shù);n、m分別為系統(tǒng)的輸出及輸入階次。
步驟3.1:對Elman神經(jīng)網(wǎng)絡進行隨機初始化,確定網(wǎng)絡結(jié)構(gòu),設置網(wǎng)絡參數(shù)為初始權(quán)值、閾值、網(wǎng)絡約束條件、最大迭代次數(shù),初始化網(wǎng)絡權(quán)值、閾值,并計算Elman神經(jīng)網(wǎng)絡初始網(wǎng)絡誤差。
步驟3.2:利用果蠅算法確定最優(yōu)的Elman神經(jīng)網(wǎng)絡的權(quán)值、閾值。
步驟3.3:計算Elman網(wǎng)絡實際輸出與樣本輸出值之間的訓練誤差,并更新Elman神經(jīng)網(wǎng)絡的權(quán)值、閾值。
步驟3.4:當達到最大迭代次數(shù)或網(wǎng)絡誤差達到設定值時,Elman神經(jīng)網(wǎng)絡停止計算,由此得到最優(yōu)的礦井巷道環(huán)境安全評價模型,輸出當前的巷道環(huán)境安全等級。
步驟四:將井下巷道的環(huán)境安全等級及井下被困人員的位置經(jīng)無線傳感網(wǎng)絡傳輸?shù)降孛姹O(jiān)控中心,并發(fā)出提醒警報。
優(yōu)選地,步驟二所述的卡爾曼濾波計算過程為:
利用卡爾曼濾波對步驟一中的各傳感器信息進行濾波處理,根據(jù)上一時刻傳感器的狀態(tài)值及其相應的協(xié)方差矩陣Pk-1遞推得到下一時刻的估計值:
Pk- =APk-1AT+Q
式中,A為狀態(tài)變換矩陣,B為輸入控制矩陣,uk-1為過程觀測噪聲,Q為激勵噪聲協(xié)方差矩陣。
計算卡爾曼增益Kk,并由觀測變量與估計值的殘差計算狀態(tài)后驗估計值,最后得到后驗協(xié)方差矩陣Pk::
Kk=Pk-HT(HPk-HT+R)-1
Pk=(1—KkH)Pk-
式中,H為觀測模型矩陣,R為測量噪聲協(xié)方差矩陣。
重復上述步驟,不斷調(diào)整更新步驟中的相關參數(shù),由此利用卡爾曼濾波實現(xiàn)對傳感器采集的巷道環(huán)境參數(shù)數(shù)據(jù)流進行估計,并實時適應數(shù)據(jù)流變化,從而達到使采集的傳感器數(shù)據(jù)更準確的目的。
進一步優(yōu)選地,所述的狀態(tài)變換矩陣A、過程觀測噪聲矩陣uk-1為單位矩陣,激勵噪聲協(xié)方差矩陣Q為0.01倍的單位矩陣。
進一步優(yōu)選地,步驟三所述的果蠅優(yōu)化方法Elman神經(jīng)網(wǎng)絡參數(shù)過程為:
以ENN的網(wǎng)絡參數(shù)組成果蠅種群,進行初始化訓練,設置相關參數(shù):種群規(guī)模、迭代次數(shù)為、果蠅個體的初始位置、果蠅遍歷次數(shù);
設置果蠅個體初始搜索時的方向及距離為:Xi=X1+Rand,Yi=Y1+Rand,并估計初始果蠅與食物原點位置的距離Di=(Xi2+Yi2)1/2,且以距離的倒數(shù)作為食物味道濃度的判定值Si=Di-1;
將Si代入果蠅的味道濃度評價函數(shù)Fi中,求出該位置的濃度Ti=Fi(Si)并找出味道最濃的果蠅個體[aF,aI]=minFi(Si);
取最佳味道濃度值Fbest=aF,并保留X、Y位置坐標,X1=X(aI),Y1=Y(aI),此時果蠅群體均向該位置聚集;
對上述步驟~進行迭代運算,當果蠅位置的味道濃度優(yōu)于前一次迭代時的味道濃度,則執(zhí)行,否則繼續(xù)迭代,直到達到設定的最大迭代次數(shù);
將運算出的最優(yōu)果蠅個體位置X*、Y*根據(jù)公式Cxn+1=(xn—ai)/(bi—ai),轉(zhuǎn)換成混沌變量CX*、CY*[0,1],然后再根據(jù)混沌變換公式進行計算Cxn+1=4Cxn(1—Cxn),最后重新轉(zhuǎn)換回搜索空間,生成新變量為X*′、Y*′;
將X*′、Y*′按照步驟~重新進行計算,生成新的味道濃度值,并與前一代相比較,如優(yōu)于前一代,則保留其濃度值及相應位置,否則執(zhí)行步驟;
重復執(zhí)行~,進行迭代尋優(yōu)運算,當滿足W值或達到精度要求時,停止迭代,輸出味道濃度最優(yōu)值及相應的位置信息,以此作為ENN的網(wǎng)絡權(quán)值及閾值的最優(yōu)值。
進一步優(yōu)選地,所述果蠅算法適應度函數(shù)為:
式中,、分別為系統(tǒng)在t時刻的Elman神經(jīng)網(wǎng)絡輸出值與實際值;N為采集的數(shù)據(jù)樣本個數(shù);T為Elman神經(jīng)網(wǎng)絡輸出節(jié)點個數(shù)。
進一步優(yōu)選地,所述方法適用于非線性、強耦合、時變性的礦井救災機器人自適應動態(tài)控制過程。
有益效果
本發(fā)明技術(shù)方案通過應用果蠅優(yōu)化方法耦合Elman神經(jīng)網(wǎng)絡對礦井救災探測機器人控制系統(tǒng)進行建模,結(jié)合多種傳感器進行信息融合,實現(xiàn)了對其進行智能控制。該方法收斂速度快、精度高且具有較好的穩(wěn)定性及可靠性,為礦井安全研究領域提供了新的思路。
附圖說明
圖1為本發(fā)明的流程圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖1,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明采用如下技術(shù)方案,一種礦井救災探測機器人的智能控制方法,包括以下步驟:
步驟一:采用瓦斯?jié)舛葌鞲衅?、一氧化碳傳感器、溫度傳感器對巷道中的環(huán)境參數(shù)進行檢測;礦井救災探測機器人根據(jù)視覺傳感器、超聲波傳感器、紅外傳感器信息進行避障;利用GPS定位模塊、生命探測儀對井下被困人員進行定位及生命探測。
步驟二:利用卡爾曼濾波對步驟一中的巷道環(huán)境信息傳感器信息進行濾波處理,根據(jù)上一時刻傳感器的狀態(tài)值遞推得到下一時刻的估計值。
步驟三:采用Elman神經(jīng)網(wǎng)絡對礦井救災探測機器人智能控制系統(tǒng)進行映射,以經(jīng)卡爾曼濾波處理后的各傳感器數(shù)據(jù)作為Elman神經(jīng)網(wǎng)絡的輸入,以井下安全等級為Elman神經(jīng)網(wǎng)絡輸出,對Elman神經(jīng)網(wǎng)絡進行訓練,其網(wǎng)絡狀態(tài)表達式為:
yt=f([Yt, It, Dt]T)
式中,以經(jīng)KF處理后的巷道環(huán)境監(jiān)測數(shù)據(jù)為輸入It=[i(t-1),i(t-2),...,i(t-m)];以安全等級為輸出Yt=[y(t-1),y(t-2),...,y(t-n)];系統(tǒng)的噪聲向量為Dt=[d(t-1),d(t-2),...,d(t-m)];f(.)為非線性映射函數(shù);n、m分別為系統(tǒng)的輸出及輸入階次。
步驟3.1:對Elman神經(jīng)網(wǎng)絡進行隨機初始化,確定網(wǎng)絡結(jié)構(gòu),設置網(wǎng)絡參數(shù)為初始權(quán)值、閾值、網(wǎng)絡約束條件、最大迭代次數(shù),初始化網(wǎng)絡權(quán)值、閾值,并計算Elman神經(jīng)網(wǎng)絡初始網(wǎng)絡誤差。
步驟3.2:利用果蠅算法確定最優(yōu)的Elman神經(jīng)網(wǎng)絡的權(quán)值、閾值。
步驟3.3:計算Elman網(wǎng)絡實際輸出與樣本輸出值之間的訓練誤差,并更新Elman神經(jīng)網(wǎng)絡的權(quán)值、閾值。
步驟3.4:當達到最大迭代次數(shù)或網(wǎng)絡誤差達到設定值時,Elman神經(jīng)網(wǎng)絡停止計算,由此得到最優(yōu)的礦井巷道環(huán)境安全評價模型,輸出當前的巷道環(huán)境安全等級。
步驟四:將井下巷道的環(huán)境安全等級及井下被困人員的位置經(jīng)無線傳感網(wǎng)絡傳輸?shù)降孛姹O(jiān)控中心,并發(fā)出提醒警報。
優(yōu)選地,步驟二所述的卡爾曼濾波計算過程為:
利用卡爾曼濾波對步驟一中的各傳感器信息進行濾波處理,根據(jù)上一時刻傳感器的狀態(tài)值及其相應的協(xié)方差矩陣Pk-1遞推得到下一時刻的估計值:
Pk- =APk-1AT+Q
式中,A為狀態(tài)變換矩陣,B為輸入控制矩陣,uk-1為過程觀測噪聲,Q為激勵噪聲協(xié)方差矩陣。
計算卡爾曼增益Kk,并由觀測變量與估計值的殘差計算狀態(tài)后驗估計值,最后得到后驗協(xié)方差矩陣Pk:
Kk=Pk-HT(HPk-HT+R)-1
Pk=(1—KkH)Pk-
式中,H為觀測模型矩陣,R為測量噪聲協(xié)方差矩陣。
重復上述步驟,不斷調(diào)整更新步驟中的相關參數(shù),由此利用卡爾曼濾波實現(xiàn)對傳感器采集的巷道環(huán)境參數(shù)數(shù)據(jù)流進行估計,并實時適應數(shù)據(jù)流變化,從而達到使采集的傳感器數(shù)據(jù)更準確的目的。
進一步優(yōu)選地,所述的狀態(tài)變換矩陣A、過程觀測噪聲矩陣uk-1為單位矩陣,激勵噪聲協(xié)方差矩陣Q為0.01倍的單位矩陣。
進一步優(yōu)選地,步驟三所述的果蠅優(yōu)化方法Elman神經(jīng)網(wǎng)絡參數(shù)過程為:
以ENN的網(wǎng)絡參數(shù)組成果蠅種群,進行初始化訓練,設置相關參數(shù):種群規(guī)模、迭代次數(shù)為、果蠅個體的初始位置、果蠅遍歷次數(shù);
設置果蠅個體初始搜索時的方向及距離為:Xi= X1+Rand,Yi= Y1+Rand,并估計初始果蠅與食物原點位置的距離Di=(Xi2+Yi2)1/2,且以距離的倒數(shù)作為食物味道濃度的判定值Si=Di-1;
將Si代入果蠅的味道濃度評價函數(shù)Fi中,求出該位置的濃度Ti=Fi(Si)并找出味道最濃的果蠅個體[aF,aI]=minFi(Si);
取最佳味道濃度值Fbest=aF,并保留X、Y位置坐標,X1=X(aI),Y1=Y(aI),此時果蠅群體均向該位置聚集;
對上述步驟~進行迭代運算,當果蠅位置的味道濃度優(yōu)于前一次迭代時的味道濃度,則執(zhí)行,否則繼續(xù)迭代,直到達到設定的最大迭代次數(shù);
將運算出的最優(yōu)果蠅個體位置X*、Y*根據(jù)公式Cxn+1=(xn—ai)/(bi—ai),轉(zhuǎn)換成混沌變量CX*、CY*[0,1],然后再根據(jù)混沌變換公式進行計算Cxn+1=4Cxn(1—Cxn),最后重新轉(zhuǎn)換回搜索空間,生成新變量為X*′、Y*′;
將X*′、Y*′按照步驟~重新進行計算,生成新的味道濃度值,并與前一代相比較,如優(yōu)于前一代,則保留其濃度值及相應位置,否則執(zhí)行步驟;
重復執(zhí)行~,進行迭代尋優(yōu)運算,當滿足W值或達到精度要求時,停止迭代,輸出味道濃度最優(yōu)值及相應的位置信息,以此作為ENN的網(wǎng)絡權(quán)值及閾值的最優(yōu)值。
進一步優(yōu)選地,所述果蠅算法適應度函數(shù)為:
式中,、分別為系統(tǒng)在t時刻的Elman神經(jīng)網(wǎng)絡輸出值與實際值;N為采集的數(shù)據(jù)樣本個數(shù);T為Elman神經(jīng)網(wǎng)絡輸出節(jié)點個數(shù)。
進一步優(yōu)選地,所述方法適用于非線性、強耦合、時變性的礦井救災機器人自適應動態(tài)控制過程。
本發(fā)明技術(shù)方案通過應用果蠅優(yōu)化方法耦合Elman神經(jīng)網(wǎng)絡對礦井救災探測機器人控制系統(tǒng)進行建模,結(jié)合多種傳感器進行信息融合,實現(xiàn)了對其進行智能控制。該方法收斂速度快、精度高且具有較好的穩(wěn)定性及可靠性,為礦井安全研究領域提供了新的思路。
以上所述的具體實施方式,對本發(fā)明的目的、技術(shù)方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的具體實施方式而已,并不用于限定本發(fā)明的保護范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。