專利名稱:基于卡爾曼濾波的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)傳輸噪聲抑制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于卡爾曼濾波的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)傳輸噪聲抑制方法,可用于保障加性信道噪聲下的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)對預(yù)期軌跡的高精度跟蹤。
背景技術(shù):
遠(yuǎn)程控制系統(tǒng)是控制領(lǐng)域的一類重要控制系統(tǒng),隨著“物聯(lián)網(wǎng)”概念的深入,該類系統(tǒng)正越來越受到人們的關(guān)注。此類系統(tǒng)實(shí)質(zhì)上是一類通過遠(yuǎn)程無線通信信道進(jìn)行的反饋控制環(huán)路。相比一般的有線控制系統(tǒng)主要特點(diǎn)在于控制系統(tǒng)內(nèi)部信號(hào)的傳輸是通過各類無線信號(hào)傳輸技術(shù)在無線信道中所進(jìn)行的。該類控制系統(tǒng)的架構(gòu)可以用說明書附圖中的
圖1表不。目前工業(yè)上被廣泛應(yīng)用的遠(yuǎn)程控制器主要是PID控制器。該類控制器的設(shè)計(jì)基于控制系統(tǒng)數(shù)學(xué)模型,運(yùn)用嚴(yán)格的控制系統(tǒng)理論,可以做到使控制系統(tǒng)在保證一定收斂速度的要求下實(shí)現(xiàn)軌跡跟蹤。該類控制器的優(yōu)點(diǎn)在于可以簡單的實(shí)現(xiàn)一般控制系統(tǒng)對軌跡跟蹤精度的要求,且擁有良好的魯棒性,可以抵御系統(tǒng)內(nèi)部噪聲以及其他不可避免的干擾。但是,在一類需要高精度跟蹤的控制系統(tǒng)中,該類控制器并不能達(dá)到預(yù)期的效果。限制該類系統(tǒng)跟蹤精度的本質(zhì)原因在于該類控制器的設(shè)計(jì)總是基于對控制系統(tǒng)模型的準(zhǔn)確建立的基礎(chǔ)上的,而在現(xiàn)實(shí)中,模型的建立總是一種近似。因此,針對一類具有強(qiáng)非線性耦合特性導(dǎo)致難以精確建模并同時(shí)需要高精度、高速度軌跡跟蹤的控制系統(tǒng),經(jīng)典的控制器已經(jīng)無能為力。正是在這樣的背景下,人們在研究高速運(yùn)動(dòng)的工業(yè)機(jī)械手的控制問題時(shí),提出了這樣一個(gè)思想不斷重復(fù)一個(gè)同樣軌線的控制嘗試,并以此修正控制率,可能可以得到非常好的控制效果。Arimoto等人于1984年正式提出迭代學(xué)習(xí)控制(ILC)方法,將上述思想加以完善,建立了實(shí)用的算法,并從理論上證明了這種算法的可行性,開創(chuàng)了一個(gè)新的研究方向。該類迭代學(xué)習(xí)控制技術(shù)的適用對象是諸如工業(yè)機(jī)器人那樣的具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控系統(tǒng),它的目標(biāo)是實(shí)現(xiàn)有限時(shí)間區(qū)間上的完全跟蹤任務(wù)。迭代學(xué)習(xí)控制采用“在重復(fù)中學(xué)習(xí)”的學(xué)習(xí)策略,具有記憶和修正機(jī)制。它通過對被控系統(tǒng)進(jìn)行控制嘗試,以輸出軌跡與給定軌跡的偏差修正不理想的控制信號(hào),產(chǎn)生新的控制信號(hào),使得系統(tǒng)的跟蹤性能得以提高。 迭代學(xué)習(xí)控制技術(shù)具有“智能學(xué)習(xí)”的特性使得它能夠被運(yùn)用于建模不夠精確、先驗(yàn)知識(shí)不足的具有重復(fù)運(yùn)動(dòng)特性的控制系統(tǒng)中,并取得高精度的跟蹤效果。因此,將迭代學(xué)習(xí)控制技術(shù)應(yīng)用于遠(yuǎn)程控制系統(tǒng)中而產(chǎn)生的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)會(huì)具有如下兩大明顯的優(yōu)勢
1.該類控制系統(tǒng)的控制器與執(zhí)行器是分離的,其控制回路是通過實(shí)時(shí)通信信道傳輸?shù)膫鞲衅髋c控制器之間、控制器與執(zhí)行器之間的信號(hào)進(jìn)行連接的。因此該類系統(tǒng)具有執(zhí)行器重量輕、成本低、動(dòng)力需求少、易于維護(hù)等諸多優(yōu)點(diǎn)。這對于空間軌道跟蹤系統(tǒng)具有重大的實(shí)用價(jià)值。
3
2.該類控制系統(tǒng)的控制器運(yùn)用了迭代學(xué)習(xí)控制技術(shù),該類控制技術(shù)控制方式簡單,需要的先驗(yàn)知識(shí)較少,即便是針對不確定程度較高的動(dòng)態(tài)系統(tǒng),也能使快速重復(fù)運(yùn)動(dòng)的被控對象實(shí)現(xiàn)給定期望軌跡的完全跟蹤。因此,遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)作為一類很有應(yīng)用前景的系統(tǒng),正受到國內(nèi)外越來越多學(xué)者的關(guān)注。但是,當(dāng)信號(hào)傳輸媒介由有線變?yōu)闊o線時(shí),也會(huì)帶來有線控制系統(tǒng)中所沒有的新問題,尤其是無線信道中的信道噪聲,會(huì)對控制系統(tǒng)的性能產(chǎn)生很大的影響。為了闡釋無線信道噪聲影響遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)的原理,考慮一類離散線性時(shí)不變控制系統(tǒng),其執(zhí)行器模型可以由(1)表示
rXi (k + 1) = Ax; (k) - - Eu, (k)
< Jj(Ar+1) = Cxj(k+1)(ι)
k =
其中λ代表某一次迭代過程的時(shí)間階,是執(zhí)行器的狀態(tài)向量,是輸入控制向量,力(幻是該類執(zhí)行器的輸出向量,下標(biāo)y代表迭代次數(shù)。A,B,C是通過先驗(yàn)知識(shí)所估計(jì)的執(zhí)行器系統(tǒng)矩陣,并不準(zhǔn)確。我們的控制目標(biāo)是尋求合適的控制輸入向量^^ ,使該
控制系統(tǒng)的執(zhí)行器的輸出能準(zhǔn)確跟蹤預(yù)期軌跡&。經(jīng)典迭代學(xué)習(xí)控制器的數(shù)學(xué)模型用式( 表示 Uj+l (.t) = Uf- (.t) + Γ^·(務(wù))(2)
其中= yAk)-yAk),表示第次迭代第k時(shí)刻的執(zhí)行器輸出與預(yù)期軌跡的
誤差向量,Γ為可調(diào)增益矩陣。通過合理選取增益矩陣,已經(jīng)可以證實(shí)由(1),(2)組成的迭代學(xué)習(xí)控制系統(tǒng)可以對預(yù)期軌跡達(dá)到快速,高精度的跟蹤。在遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)中,由于傳輸媒介由有線變?yōu)榱藷o線信道,而無線信道中的信道噪聲是不可避免的。因此,迭代學(xué)習(xí)控制器會(huì)受到信道噪聲的干擾。為了保證該類控制系統(tǒng)的執(zhí)行器具有重量輕、成本低、動(dòng)力需求少、易于維護(hù)等優(yōu)點(diǎn),遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)中的信號(hào)傳輸方式為模擬信號(hào)傳輸方式(本發(fā)明中選用設(shè)備復(fù)雜度最低的雙邊帶模擬調(diào)制方式)。此時(shí)信道噪聲干擾過程為加性干擾過程。遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)的結(jié)構(gòu)(包括信號(hào)傳輸,噪聲引入過程).見說明書附圖2。從圖2可以看到,存在于遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)的執(zhí)行器與控制器之間的信道噪聲(以符號(hào)表示)會(huì)干擾誤差信號(hào),從而影響迭代學(xué)習(xí)控制器。因此,引入信道噪聲后的迭代學(xué)習(xí)控制器數(shù)學(xué)模型變?yōu)槭?3)。
權(quán)利要求
1. 一種基于卡爾曼濾波的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)傳輸噪聲抑制方法,其特征在于操作步驟如下1)、遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)控制緩存加入初始控制向量,初始控制向量設(shè)置為零向量;2)、在第j次迭代去噪后的控制向量的作用下,執(zhí)行器產(chǎn)生相應(yīng)的第j次迭代的輸出, j=l代表初始控制;如果該輸出與預(yù)期跟蹤軌跡的誤差小于預(yù)先設(shè)置的閾值,則迭代學(xué)習(xí)過程結(jié)束,系統(tǒng)跟蹤成功;若未能達(dá)到跟蹤要求,則首先對迭代次數(shù)進(jìn)行判斷;如果迭代次數(shù)已經(jīng)達(dá)到預(yù)先設(shè)置的迭代次數(shù)上限值,迭代過程停止,將該次的執(zhí)行器輸出作為控制系統(tǒng)的最終輸出;如果迭代次數(shù)小于預(yù)先設(shè)置的迭代次數(shù)上限,則首先將執(zhí)行器第j次運(yùn)行所產(chǎn)生的輸出軌跡與預(yù)期軌跡之間的誤差向量進(jìn)行雙邊帶調(diào)制,然后將已調(diào)信號(hào)通過天線發(fā)射至無線信道中,接著通過無線信號(hào)接收模塊將該信號(hào)從無線信道中接收,最后將該無線信號(hào)進(jìn)行解調(diào),恢復(fù)誤差信號(hào)并傳送至式C3)所表示的迭代學(xué)習(xí)控制器內(nèi),即{k、= u- (^) + Γ[氣,.(k) + (於)] 式中HjJJc)代表控制器產(chǎn)生的第j+l次受噪聲污染的控制向量,u.(k)代表第j次迭代的控制向量,為可調(diào)的增益矩陣,ej{k)代表第j次迭代的系統(tǒng)輸出與預(yù)期軌跡的誤差向量,^.(k)代表執(zhí)行器與控制器之間的信道噪聲;3)、式C3)所表示的迭代學(xué)習(xí)控制器產(chǎn)生了第(j+l)次迭代的控制向量,更新后的迭代學(xué)習(xí)控制向量經(jīng)過雙邊帶模擬信號(hào)傳輸方式通過迭代學(xué)習(xí)控制器與控制緩存之間的無線信道傳輸至執(zhí)行器前端的控制緩存中;4)、在控制緩存中進(jìn)行基于卡爾曼濾波的控制信號(hào)處理過程該處理過程分為如下七個(gè)步驟(1)通過第j-i次迭代的濾波后的執(zhí)行器輸出誤差向量估計(jì)第j次迭代的執(zhí)行器輸出誤差向量,j=i時(shí),第ο次迭代的輸出誤差向量為零;(2)計(jì)算單步預(yù)測以第j-i次迭代執(zhí)行器輸出誤差向量協(xié)方差矩陣預(yù)測第j次迭代執(zhí)行器輸出誤差向量先驗(yàn)協(xié)方差矩陣;(3)計(jì)算卡爾曼增益;(4)將控制緩存收到的迭代學(xué)習(xí)控制器產(chǎn)生的第j+l次迭代控制向量與緩存中記錄的第j次迭代的控制向量進(jìn)行相減操作,得到第j次迭代過程中的帶噪誤差觀測向量;(5)根據(jù)步驟(1)、(3)和步驟(4)計(jì)算第j次迭代過程的去噪誤差向量;將該去噪后的誤差向量記錄在緩存中用于下一次濾波處理過程;(6)根據(jù)步驟0),(3)更新步驟( 所得到的協(xié)方差矩陣,用以下一次迭代過程;(7)將步驟(5)中得到的第j次迭代過程的去噪誤差向量與第j次迭代的控制向量進(jìn)行相加操作,得到第j+l次迭代過程中所用的去噪后的控制向量;將該控制向量記錄在緩存中用于下一次濾波處理過程;5)、迭代次數(shù)j變?yōu)閖+l,重復(fù)步驟2)-5)。
全文摘要
本發(fā)明涉及一種基于卡爾曼濾波的遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)傳輸噪聲抑制方法。本方法通過將遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)的誤差傳遞過程等效為卡爾曼濾波器適用的狀態(tài)方程組,給出了卡爾曼濾波方法的實(shí)施步驟。采用本方法,可以保障遠(yuǎn)程迭代學(xué)習(xí)控制系統(tǒng)在受到信道噪聲影響時(shí)的跟蹤效果。
文檔編號(hào)H03H21/00GK102427341SQ20111037184
公開日2012年4月25日 申請日期2011年11月22日 優(yōu)先權(quán)日2011年11月22日
發(fā)明者方勇, 顏華超 申請人:上海大學(xué)