基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機(jī)的自適應(yīng)逆控制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于無人機(jī)技術(shù)領(lǐng)域,設(shè)及一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機(jī)的自適應(yīng)逆控 制方法。
【背景技術(shù)】
[0002] 旋翼無人機(jī)是一種能夠垂直起降、W若干個(gè)旋翼作為動(dòng)力裝置、不載操作人員的 一種飛行器。它W能夠垂直起降,任意懸停等靈活的控制方式W及結(jié)構(gòu)簡單噪聲小等特點(diǎn), 近年來逐步成為了一個(gè)研究熱點(diǎn)。由于旋翼無人機(jī)動(dòng)力學(xué)模型具有強(qiáng)禪合、欠驅(qū)動(dòng)W及強(qiáng) 非線性等特點(diǎn),設(shè)計(jì)出一個(gè)有效的旋翼無人機(jī)控制器是非常不易的,尤其是在對(duì)象模型參 數(shù)變化W及外界有干擾的情況下。在現(xiàn)有的技術(shù)中,一般的做法是將旋翼無人機(jī)動(dòng)力學(xué)模 型進(jìn)行簡化,W降低其控制器設(shè)計(jì)的復(fù)雜程度,進(jìn)而利用傳統(tǒng)或現(xiàn)代控制方法對(duì)該簡化模 型進(jìn)行控制器設(shè)計(jì)。
[0003] 在現(xiàn)有技術(shù)對(duì)旋翼無人機(jī)控制器設(shè)計(jì)方法中,一般的做法是將旋翼無人機(jī)動(dòng)力學(xué) 模型進(jìn)行簡化處理,來減低其控制器設(shè)計(jì)難度。但是,簡化動(dòng)力學(xué)模型進(jìn)行控制器設(shè)計(jì)也必 將導(dǎo)致系統(tǒng)模型不匹配的問題,進(jìn)而使得在實(shí)際控制中,所設(shè)計(jì)的控制器達(dá)不到理想的控 制效果。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是提供一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機(jī)的自適應(yīng)逆控制方法,解決 了現(xiàn)有技術(shù)中存在的問題,利用兩個(gè)神經(jīng)網(wǎng)絡(luò)分別建立旋翼無人機(jī)系統(tǒng)模型的正向模型 和逆向模型,從而實(shí)現(xiàn)對(duì)完整旋翼無人機(jī)的控制和辨識(shí)。
[0005] 本發(fā)明所采用的技術(shù)方案是,一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機(jī)的自適應(yīng)逆控制方 法,按照下式進(jìn)行控制:
[000引其中;n是學(xué)習(xí)率,巧:+|和町;分別是隱含層中第P個(gè)神經(jīng)元與輸出層中第t個(gè)神 經(jīng)元第n+l次和第n次訓(xùn)練后的值,C1和C分別是輸入層中第m個(gè)神經(jīng)元與隱含層中第 P個(gè)神經(jīng)元第n+1次和第n次訓(xùn)練后的值,?
分別表示能力函數(shù)Ec對(duì)變量 Wtp和Vpm的負(fù)梯度方向。
[0009] 本發(fā)明的有益效果是,利用神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力,對(duì)旋翼無人機(jī) 完整模型進(jìn)行控制器設(shè)計(jì)。利用兩個(gè)神經(jīng)網(wǎng)絡(luò)分別建立旋翼無人機(jī)系統(tǒng)模型的正向模型和 逆向模型,從而實(shí)現(xiàn)對(duì)完整旋翼無人機(jī)的控制和辨識(shí)。系統(tǒng)辨識(shí)器(正向模型)的作用是 為系統(tǒng)逆控制器提供學(xué)習(xí)信號(hào),進(jìn)而實(shí)現(xiàn)逆控制器對(duì)外界干擾和旋翼無人機(jī)自身參數(shù)變化 具有良好的魯椿性。沒有對(duì)旋翼無人機(jī)系統(tǒng)模型進(jìn)行任何簡化處理,而直接對(duì)完整的旋翼 無人機(jī)模型進(jìn)行控制器設(shè)計(jì)。由于完整旋翼無人機(jī)系統(tǒng)模型與真實(shí)旋翼無人機(jī)系統(tǒng)具有更 好的一致性,因此本發(fā)明設(shè)計(jì)的控制器在實(shí)際旋翼無人機(jī)飛行中,具有更好的控制效果。
【附圖說明】
[0010] 圖1是本發(fā)明中控制系統(tǒng)框架圖。
[0011] 圖2是處理后的樣本集對(duì)系統(tǒng)辨識(shí)器的訓(xùn)練方法圖。
[0012] 圖3是處理后的樣本集對(duì)逆系統(tǒng)控制器的訓(xùn)練方法圖。
【具體實(shí)施方式】
[0013] 下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行詳細(xì)說明。
[0014] 建立旋翼無人機(jī)理想系統(tǒng)模型情況下的系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器,W達(dá)到系統(tǒng) 辨識(shí)器反映理想系統(tǒng)模型的輸入輸出關(guān)系,逆系統(tǒng)控制器反映理想逆系統(tǒng)模型的輸入輸出 關(guān)系。當(dāng)目標(biāo)信號(hào)值輸入到如圖1所示的控制系統(tǒng)時(shí),由于外界干擾、載重變化等原因使得 系統(tǒng)模型輸出與目標(biāo)輸出產(chǎn)生誤差,通過自適應(yīng)算法對(duì)系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器做反饋 校正已使得控制系統(tǒng)對(duì)外界干擾和載重變化具有良好的魯椿性。在本發(fā)明中,系統(tǒng)辨識(shí)器 的作用是建立一個(gè)等效于系統(tǒng)對(duì)象輸入輸出之間的映射關(guān)系,為逆系統(tǒng)控制器提供學(xué)習(xí)信 息。
[0015] 本發(fā)明一種基于神經(jīng)網(wǎng)絡(luò)的旋翼無人機(jī)的自適應(yīng)逆控制方法,具體按照W下步驟 進(jìn)行:
[0016] 1.訓(xùn)練樣本集采集
[0017] 白噪聲信號(hào)可W激勵(lì)出系統(tǒng)的全部特征。因此用幅值一定的白噪聲信號(hào)作為樣本 采集時(shí)的系統(tǒng)激勵(lì)信號(hào),并用該激勵(lì)信號(hào)激勵(lì)旋翼無人機(jī)對(duì)象,得到該激勵(lì)下對(duì)象的對(duì)應(yīng) 輸出。循環(huán)該操作,得到一個(gè)合適大小的訓(xùn)練樣本集。
[001引 2.樣本處理
[0019] 對(duì)樣本集進(jìn)行篩選處理。由于旋翼無人機(jī)在正常飛行過程中姿態(tài)角變化不大,因 此在本發(fā)明中總是限定姿態(tài)角大小在-10°~10°,并W此為標(biāo)準(zhǔn)對(duì)輸出超過該范圍的樣 本進(jìn)行篩選處理。雖然經(jīng)過處理的樣本弱化了所映射的非線性強(qiáng)度,但是該種處理大大簡 化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練時(shí)間,并且符合旋翼無人機(jī)的實(shí)際飛行情況。
[0020] 3.確定系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
[0021] 神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層的神經(jīng)元數(shù)目是由所需擬合的非線性函數(shù)決定的,而 隱含層的神經(jīng)元數(shù)目是由經(jīng)驗(yàn)得到的。根據(jù)圖2和圖3所示的基于BP原理的訓(xùn)練方法,可 W確定系統(tǒng)控制器網(wǎng)絡(luò)和系統(tǒng)辨識(shí)器網(wǎng)絡(luò)的輸入層神經(jīng)元和輸出層神經(jīng)元數(shù)目都為9個(gè) 和3個(gè)。根據(jù)確定隱含層的經(jīng)驗(yàn)公式:^ = ^*^ + 〇,其中,111表示隱含層神經(jīng)元數(shù)目,11 表示輸入層神經(jīng)元數(shù)目,1表示輸出層神經(jīng)元數(shù)目,a為1-10之間的常數(shù)。因此,可W把隱 含層神經(jīng)元的數(shù)目確定為10個(gè)。在本方案中,可W確定系統(tǒng)控制器和系統(tǒng)辨識(shí)器采用相同 結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò);神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元數(shù)采用9X10X3的結(jié)構(gòu)且隱含層激活函數(shù)采用S型對(duì)數(shù)函數(shù),即/W=>(其中,X表示隱含層中各神經(jīng)元的輸入,f(x)表示隱含層 中各神經(jīng)元的輸出)。
[0022] 4.系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器訓(xùn)練
[002引根據(jù)已確定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用處理后的樣本集對(duì)系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器 進(jìn)行訓(xùn)練,訓(xùn)練方法如圖2、圖3所示。系統(tǒng)辨識(shí)器是利用樣本集中白噪聲信號(hào)作為輸入信 號(hào),對(duì)應(yīng)對(duì)象輸出信號(hào)作為系統(tǒng)辨識(shí)器的訓(xùn)練目標(biāo)信號(hào)進(jìn)行訓(xùn)練。逆系統(tǒng)控制器是利用樣 本集中對(duì)象輸出信號(hào)作為輸入信號(hào),對(duì)應(yīng)的白噪聲信號(hào)作為系統(tǒng)控制器的訓(xùn)練目標(biāo)信號(hào) 進(jìn)行訓(xùn)練。
[0024] 5.自適應(yīng)算法設(shè)計(jì)
[0025] 根據(jù)BP算法原理,設(shè)計(jì)系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器的自適應(yīng)算法。自適應(yīng)算法的 具體設(shè)計(jì)過程在下文給出。
[0026] 6.在線調(diào)整
[0027] 當(dāng)對(duì)象實(shí)際輸出與目標(biāo)輸出有誤差時(shí),將該誤差作為反饋信號(hào),利用自適應(yīng)算法 對(duì)系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器的網(wǎng)絡(luò)權(quán)值做反饋調(diào)整。
[002引其中,控制系統(tǒng)的自適應(yīng)算法設(shè)計(jì)是本發(fā)明中的核屯、內(nèi)容。W下給出基于BP原理 自適應(yīng)算法設(shè)計(jì)過程。為了方便后續(xù)工作的闡述,給出W下定義和說明:
[0029] 系統(tǒng)辨識(shí)器和逆系統(tǒng)控制器的網(wǎng)絡(luò)結(jié)構(gòu)都為MXPXT,即輸入層神經(jīng)元數(shù)目為M 個(gè),隱含層神經(jīng)元數(shù)目為P個(gè),輸出層神經(jīng)元數(shù)目為T個(gè)。
[0030] 對(duì)于逆系統(tǒng)控制器,V= (Vpm)pxM,W= (Wtp)TxP分別表示輸入層與隱含層之間、隱含 層與輸出層之間的連接權(quán)值矩陣(Vpm和Wtp分別表式輸入層第m個(gè)神經(jīng)元到隱含層第P個(gè) 神經(jīng)元的連接權(quán)值和隱含層第P個(gè)神經(jīng)元到輸出層第t個(gè)神經(jīng)元的連接權(quán)值)。并且,為方 便敘述,定義Vp: = (Vpi,Vp2,…,VpM),P= 1,2,…P;Wt: = (Wti,V口,…,Vtp),t= 1,2,…T, 分別表示第一層權(quán)值矩陣中與隱含層第P個(gè)神經(jīng)元相關(guān)聯(lián)的的權(quán)值向量和第二層權(quán)值矩 陣中與輸出層第t個(gè)神經(jīng)元相關(guān)聯(lián)的的權(quán)值向量。
[0031] 與上述逆控制器對(duì)應(yīng),在系統(tǒng)辨識(shí)器中,Q=(Qpm)pxM,U=扣tp)TXP分別表示輸入 層與隱含層之間、隱含層與輸出層之間的連接權(quán)值矩陣(Qpm和Utp分別表式輸入層第m個(gè) 神經(jīng)元到隱含層第P個(gè)神經(jīng)元的連接權(quán)值和隱含層第P個(gè)神經(jīng)元到輸出層第t個(gè)神經(jīng)元的 連接權(quán)值)。用HI=化Ip)pxi,冊(cè)二化〇p)p>a分別表示系統(tǒng)控制器中隱含層的輸入、輸出向 量化Ip和冊(cè)P分別表示隱含層中第P個(gè)神經(jīng)元的輸入、輸出),XI,而分別表示系統(tǒng)辨識(shí)器 和逆系統(tǒng)控制器的輸入向量。
[003引ya=(4d,白d,ih),y= (4,日,110,少二從例分別為系統(tǒng)目標(biāo)輸出,系統(tǒng)對(duì) 象實(shí)際