本發(fā)明涉及慣性導(dǎo)航單元領(lǐng)域。
本發(fā)明更特別地涉及一種用于使用擴(kuò)展卡爾曼濾波器(在文獻(xiàn)中通??s寫為ekf)來估計(jì)移動(dòng)載體的導(dǎo)航狀態(tài)的方法,以及適于執(zhí)行該方法的慣性單元。
背景技術(shù):
慣性導(dǎo)航單元(ins)是被設(shè)計(jì)成實(shí)時(shí)提供關(guān)于載體設(shè)備的狀態(tài)的信息的裝置:載體設(shè)備的位置、載體設(shè)備的速度、載體設(shè)備的方向等等。該信息可以用來引導(dǎo)載體。
已知的用于估計(jì)上述狀態(tài)的方法包括在慣性單元中操作擴(kuò)展卡爾曼濾波器,該擴(kuò)展卡爾曼濾波器通過將來自慣性傳感器(加速度計(jì)、陀螺儀)和適于載體的類型的非慣性傳感器(里程表、氣壓-高度表、多普勒雷達(dá)、gps接收機(jī)等)的數(shù)據(jù)進(jìn)行結(jié)合來提供載體的估計(jì)狀態(tài)。慣性數(shù)據(jù)起到控制的作用,而非慣性數(shù)據(jù)起觀測的作用。
卡爾曼濾波器為一種典型地包括隨時(shí)間推移重復(fù)的預(yù)測步驟和更新步驟的算法:預(yù)測步驟根據(jù)先前的狀態(tài)和輸入的命令計(jì)算當(dāng)前狀態(tài);更新步驟通過觀測來細(xì)化當(dāng)前狀態(tài)。預(yù)測計(jì)算基于傳播方程,該傳播方程根據(jù)狀態(tài)和命令對狀態(tài)的動(dòng)態(tài)(dynamique)進(jìn)行建模。更新計(jì)算基于觀測方程,該觀測方程根據(jù)狀態(tài)對觀測進(jìn)行建模。
在卡爾曼濾波器中,傳播方程和觀測方程是線性的,并且假設(shè)矩陣的形式不依賴于估計(jì)的狀態(tài)。
在擴(kuò)展卡爾曼濾波器中,這些方程中的至少一個(gè)是非線性的。通過采用傳播步驟和更新步驟使這些函數(shù)線性化來實(shí)現(xiàn)數(shù)據(jù)融合。因此,該計(jì)算通過使用取決于所估計(jì)的狀態(tài)的矩陣來進(jìn)行。
擴(kuò)展卡爾曼濾波器可以被認(rèn)為是在擴(kuò)展卡爾曼濾波器內(nèi)進(jìn)行非線性計(jì)算以及在卡爾曼濾波器中執(zhí)行的線性計(jì)算兩者的算法。在下文中,將通過非線性傳播方程產(chǎn)生的狀態(tài)將稱為“總體狀態(tài)”。將通過卡爾曼濾波器估計(jì)的狀態(tài)稱為“線性化狀態(tài)”??梢允褂迷跁r(shí)間同步步驟期間被線性化的狀態(tài)承載的信息來校正總體狀態(tài)。
(擴(kuò)展或不擴(kuò)展)卡爾曼濾波器還通過考慮對由許多因素(諸如所使用的慣性傳感器的初始誤差和噪聲)造成的統(tǒng)計(jì)誤差的估計(jì)來計(jì)算與對狀態(tài)的估計(jì)相關(guān)聯(lián)的誤差裕度。在任何給定時(shí)刻的統(tǒng)計(jì)誤差可以是狀態(tài)空間中的點(diǎn)云的形式,每個(gè)點(diǎn)與可能的實(shí)現(xiàn)(réalisation)對應(yīng)。為了估計(jì)該誤差裕度,該單元具有任何時(shí)間以零平均值和協(xié)方差矩陣表征的誤差的高斯統(tǒng)計(jì)模型。協(xié)方差矩陣在狀態(tài)空間中限定了橢圓體積的包絡(luò),該包絡(luò)以零誤差為中心,并且包含在狀態(tài)空間的各方向上估計(jì)的99.97%誤差。該包絡(luò)在下文中被稱為“3sigma包絡(luò)”。
真實(shí)的誤差統(tǒng)計(jì)律是未知的并且由另一3sigma包絡(luò)來表征。通常,該包絡(luò)不以零為中心,并且其形狀是非橢圓形的。
圖1示出了在卡爾曼濾波器的不同迭代處的估計(jì)3sigma包絡(luò)和真實(shí)3sigma包絡(luò)的演變。真實(shí)3sigma包絡(luò)必須被包含在估計(jì)3sigma包絡(luò)中。這構(gòu)成了任何時(shí)候都要遵守的并針對系統(tǒng)的隨機(jī)變量的全部實(shí)現(xiàn)的連續(xù)性準(zhǔn)則。
一般來說,卡爾曼濾波器通過觀測而隨時(shí)間推移改善其誤差,并且如圖2中所示,3sigma包絡(luò)沿狀態(tài)空間的被稱為“可觀測的”某些軸趨于平坦。與“可觀測的”軸正交的軸被稱為是“不可觀測的”。該估計(jì)3sigma包絡(luò)具有根據(jù)不可觀測軸伸長的形式,這創(chuàng)建了估計(jì)誤差之間的相關(guān)性。
盡管濾波器所使用的模型的不完整可能起主要作用,但是已經(jīng)注意到,當(dāng)使用擴(kuò)展卡爾曼濾波器時(shí),系統(tǒng)的非線性和噪聲常常阻礙上文中描述連續(xù)性準(zhǔn)則得到遵守(例如,在圖2的t3時(shí)刻,真實(shí)3sigma包絡(luò)不再局限于沿不可觀測軸的估計(jì)3sigma包絡(luò)內(nèi)側(cè))。
從長遠(yuǎn)來看,這些不連續(xù)性(incohérence)可以變得很大并擴(kuò)散到待估計(jì)的狀態(tài)的向量空間的其它軸。
這些不連續(xù)性通常僅出現(xiàn)在取決于例如載體的軌跡和初始條件的特別條件中。這些條件特定于觀測并且可能很難預(yù)見。它們都是更強(qiáng)的,這是由于觀測是非線性的。
不連續(xù)性的原因是已知的:擴(kuò)展卡爾曼濾波器固有的線性化步驟受到估計(jì)誤差的噪聲干擾。實(shí)際上,通過濾波器在所產(chǎn)生的最后的估計(jì)處執(zhí)行該線性化,根據(jù)定義,估計(jì)是不準(zhǔn)確的數(shù)據(jù)(datum)。根據(jù)通過該估計(jì)噪聲線性化的函數(shù)產(chǎn)生的二階變化修改觀測結(jié)果,并且該二階變化是不連續(xù)的原因。
在第一種情況中,可觀測變量可以被不可觀測濾波器考慮到,但是這種情況是不太可能的;而在第二種情況中,可以認(rèn)為不可觀測變量可以被濾波器觀測到。這減小了沿不可觀測軸的估計(jì)3sigma包絡(luò),同時(shí)應(yīng)該保持其初始值。目前,這并未減小沿這些相同軸的真實(shí)云誤差,這是由于這些相同軸實(shí)際上是不可觀測的。當(dāng)估計(jì)3sigma包絡(luò)開始減小時(shí),真實(shí)云誤差中越來越多的部分則可能不再位于估計(jì)3sigma包絡(luò)內(nèi)。該不連續(xù)性的后果可以重要并且取決于沿不可觀測的默認(rèn)軸的初始包絡(luò)。
在多數(shù)情況下對估計(jì)3sigma包絡(luò)的減小進(jìn)行補(bǔ)償?shù)默F(xiàn)有技術(shù)的解決方案包括應(yīng)用模型噪聲。實(shí)際上,算法ekf包括以下操作:在預(yù)測階段中通過模型噪聲矩陣增加協(xié)方差,以考慮那些尚未在濾波器中建模的變量及其動(dòng)態(tài)。在該連續(xù)性問題中,由于估計(jì)包絡(luò)的減少不是由建模問題而是由能觀測性問題引起的,所以噪聲矩陣偏離其功能。此外,由于架構(gòu)和數(shù)字計(jì)算精度的原因,常常將噪聲施加到模型噪聲矩陣的對角線上:對于協(xié)方差矩陣,該矩陣的對角線與線性化狀態(tài)(其后是濾波器)的分量對應(yīng)。因此,并不是僅沿不可觀測軸的方向施加噪聲。結(jié)果是連續(xù)性問題可能無法被完全解決,并且還損害了估計(jì)的精度。
實(shí)際上,所施加的噪聲包括不可觀測軸上的投影和可觀測軸上的投影,這些投影能夠根據(jù)不可觀測軸的演變而隨時(shí)間演變。根據(jù)可觀測軸的投影越大,并且根據(jù)這些方向的誤差的漸近值越大,則估計(jì)越不精確。
如此待施加的噪聲的值是未知的。經(jīng)驗(yàn)值通常選擇的比較大,以考慮造成問題的全部已知的情況。這加重了精度問題。
另一方面,由于未沿正確的方向施加模型噪聲,所以估計(jì)包絡(luò)根據(jù)遠(yuǎn)離真實(shí)的不可觀測軸的方向而伸長。因此,根據(jù)包絡(luò)的主軸肯定會(huì)變大的該橢圓包絡(luò)具有不再覆蓋真實(shí)云誤差的風(fēng)險(xiǎn)。因此,不連續(xù)性的風(fēng)險(xiǎn)仍然存在。
因此,根據(jù)現(xiàn)有技術(shù)通過解決方案對能觀測性問題進(jìn)行處理,這不但并沒有完全解決問題,而且還損害了估計(jì)的精度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在通過使引言中所限定的不連續(xù)性表現(xiàn)最小化來估計(jì)由非線性模型管理的移動(dòng)載體的總體狀態(tài)。
因此,提出了一種用于根據(jù)可擴(kuò)展卡爾曼濾波的方法來對移動(dòng)載體的具有多個(gè)變量的導(dǎo)航狀態(tài)進(jìn)行估計(jì)的方法,該方法包括以下步驟:
-采集變量中的至少一個(gè)變量的測量值,
-根據(jù)先前的估計(jì)狀態(tài)、觀測矩陣、轉(zhuǎn)移矩陣和所采集的測量值進(jìn)行擴(kuò)展卡爾曼濾波以產(chǎn)生當(dāng)前估計(jì)狀態(tài)和協(xié)方差矩陣,該協(xié)方差矩陣在導(dǎo)航狀態(tài)的空間中界定了誤差的區(qū)域,
該處理方法的特征在于包括在所述轉(zhuǎn)移矩陣和所述觀察矩陣在被用于所述擴(kuò)展卡爾曼濾波之前,對所述轉(zhuǎn)移矩陣和所述觀察矩陣進(jìn)行調(diào)整,以使得調(diào)整后的矩陣驗(yàn)證能觀測性條件,該能觀測性條件取決于載體的狀態(tài)變量中的至少一個(gè),能觀測性條件適于防止卡爾曼濾波器減小區(qū)域沿狀態(tài)空間的至少一個(gè)不能觀測軸的尺寸,其中,待通過調(diào)整后的轉(zhuǎn)移矩陣和觀測矩陣驗(yàn)證的能觀測性條件為與所述轉(zhuǎn)移矩陣和所述觀測矩陣相關(guān)聯(lián)的能觀測性矩陣的核的零維數(shù)(nullityofthekernel),以及
其中,調(diào)整包括以下步驟:
-根據(jù)先前的估計(jì)狀態(tài)計(jì)算觀測變量的至少一個(gè)初級(jí)基(primarybase),
-針對待調(diào)整的每個(gè)矩陣,根據(jù)向量的初級(jí)基計(jì)算與矩陣相關(guān)聯(lián)的至少一個(gè)矩陣差,
-根據(jù)與每個(gè)待調(diào)整的矩陣相關(guān)聯(lián)的矩陣差,對每個(gè)待調(diào)整的矩陣進(jìn)行偏移以驗(yàn)證能觀測性條件。
由于根據(jù)用于解決能觀測性問題的現(xiàn)有技術(shù)所使用的模型噪聲的一部分可以被刪除,所以根據(jù)本發(fā)明的方法不僅改進(jìn)了估計(jì)的連續(xù)性,而且提高了估計(jì)的精度。
此外,該方法僅稍微修改了ekf濾波器的軟件架構(gòu),并且能夠以在已經(jīng)運(yùn)行中的設(shè)備上最小軟件更新的形式來執(zhí)行。該更新包括添加2個(gè)矩陣的調(diào)整函數(shù),以及減少模型噪聲調(diào)整。
本發(fā)明還可以通過以下單獨(dú)地或以任何技術(shù)上可能的組合的特征來完成。
擴(kuò)展卡爾曼濾波的步驟包括以下子步驟:
-通過調(diào)整后的轉(zhuǎn)移矩陣將先前的估計(jì)狀態(tài)傳播到預(yù)測狀態(tài),
-在預(yù)測狀態(tài)中使非線性模型線性化以在調(diào)整之前產(chǎn)生觀測矩陣,
-對通過線性化產(chǎn)生的觀測矩陣進(jìn)行調(diào)整。
在傳播步驟后執(zhí)行線性化確保了該線性化在向量空間的更可能的點(diǎn)處被執(zhí)行:通過傳播步驟產(chǎn)生的預(yù)測狀態(tài)。因此,對觀測矩陣的調(diào)整將該傳播考慮在內(nèi),并且提供了比在先前的估計(jì)狀態(tài)中在傳播步驟之前執(zhí)行線性化的情況更精確的結(jié)果。
調(diào)整還可以包括將次級(jí)基正交化為向量的初級(jí)基的正交化步驟,向量的次級(jí)基從一個(gè)循環(huán)保存到另一循環(huán),并且與觀測矩陣相關(guān)聯(lián)的矩陣差根據(jù)向量的次級(jí)基來計(jì)算。
與觀測矩陣相關(guān)聯(lián)的矩陣差可以是幾個(gè)獨(dú)立矩陣差的和,每個(gè)矩陣差根據(jù)其特定于的次級(jí)基的向量來計(jì)算。
可以連續(xù)循環(huán)地重復(fù)進(jìn)行該方法的上述步驟。被稱為當(dāng)前循環(huán)的給定循環(huán)可以包括以下步驟:
-存儲(chǔ)向量的次級(jí)基和同樣通過正交化步驟產(chǎn)生的正交化系數(shù),以及
-通過在前一循環(huán)期間存儲(chǔ)的正交化系數(shù)將向量的初級(jí)基轉(zhuǎn)換成向量的第三級(jí)基,
-根據(jù)在前一循環(huán)期間存儲(chǔ)的次級(jí)基和在當(dāng)前的循環(huán)期間計(jì)算的第三級(jí)基來執(zhí)行與轉(zhuǎn)移矩陣相關(guān)聯(lián)的矩陣差。
與轉(zhuǎn)移矩陣相關(guān)聯(lián)的矩陣差還可以是幾個(gè)獨(dú)立的基本矩陣差的和,每個(gè)矩陣差根據(jù)在前一循環(huán)期間存儲(chǔ)的次級(jí)基的次級(jí)向量和在當(dāng)前的循環(huán)期間計(jì)算的第三級(jí)基的第三級(jí)向量來計(jì)算,該次級(jí)向量和第三級(jí)向量特定于基本矩陣差。
針對至少一個(gè)待調(diào)整的矩陣,還可以計(jì)算以下:
-多個(gè)矩陣差備選,每個(gè)矩陣差備選根據(jù)各不可觀測向量的初級(jí)基來計(jì)算,以及
-多個(gè)度量,每個(gè)度量表示各矩陣差備選所導(dǎo)致的調(diào)整幅度,
依據(jù)計(jì)算的度量,根據(jù)從矩陣差備選中選擇的矩陣差來執(zhí)行待調(diào)整的矩陣的偏移步驟。
所選擇的矩陣差可以是與表示最小調(diào)整幅度的度量相關(guān)聯(lián)的矩陣差備選。
僅當(dāng)所選擇的矩陣差的度量小于預(yù)定閾值時(shí),可以執(zhí)行偏移。
根據(jù)本發(fā)明的另一方面,提出了一種慣性單元,包括多個(gè)傳感器和估計(jì)模塊,估計(jì)模塊配置成用于通過執(zhí)行根據(jù)本發(fā)明的第一方面的方法來估計(jì)具有多個(gè)變量的慣性單元的導(dǎo)航狀態(tài)。
附圖說明
根據(jù)以下純粹說明性而非限制性的、并且必須結(jié)合附圖來考慮的描述,本發(fā)明的其他特征、目的及優(yōu)點(diǎn)將呈現(xiàn)出來,在附圖中:
-圖1和圖2(已討論的)示出了3sigma包絡(luò)在布置擴(kuò)展卡爾曼濾波器期間隨時(shí)間而發(fā)生的演變;
-圖3示意地示出了嵌入根據(jù)本發(fā)明的實(shí)施例的慣性單元的載體;
-圖4為根據(jù)實(shí)施例的估計(jì)器的功能圖;
-圖5為包括在圖2的估計(jì)器中的線性化和調(diào)整塊的功能圖;
-圖6為圖5中的子塊的功能圖;
-圖7示出了對卡爾曼濾波器所使用的矩陣的調(diào)整的幾何證明;
-圖8示出了與執(zhí)行圖3中示出的步驟對應(yīng)的數(shù)據(jù)流;
在所有圖中,類似的元件具有相同的附圖標(biāo)記。
具體實(shí)施方式
參照圖3,慣性單元in被嵌入諸如陸地車輛、直升機(jī)或飛機(jī)之類的移動(dòng)載體設(shè)備p上。
慣性單元in包括多個(gè)部件:慣性傳感器ci、互補(bǔ)傳感器cc及用于執(zhí)行估計(jì)計(jì)算的裝置e。這些部件可以物理地彼此分離。
慣性傳感器ci典型地為加速度計(jì)和/或陀螺儀,分別測量載體相對于慣性基準(zhǔn)承受的比力和轉(zhuǎn)速。該比力對應(yīng)于源于非重力的加速度。當(dāng)這些傳感器相對于載體固定時(shí),該單元被稱為“捷聯(lián)”(strapdown)類型的。
另外的傳感器cc是根據(jù)載體的類型、載體的動(dòng)態(tài)及具體的應(yīng)用可變的。慣性單元典型地使用接收機(jī)gnss(例如gps)。對于陸地車輛,慣性單元也可以是一個(gè)或多個(gè)里程表。對于船,慣性單元可以是給出了船相對于水或海底的速度的“計(jì)程儀”(loch)。攝像頭形成傳感器的另一示例。
在下文中將以“估計(jì)器”指代導(dǎo)航估計(jì)裝置e。裝置e典型地包括一個(gè)或多個(gè)處理器。
估計(jì)器e的輸出數(shù)據(jù)為載體的導(dǎo)航狀態(tài)并且可選地為慣性單元的內(nèi)部狀態(tài)。
估計(jì)器e尤其包括擴(kuò)展卡爾曼濾波器ekf,擴(kuò)展卡爾曼濾波器ekf配置成將互補(bǔ)傳感器和慣性傳感器提供的信息數(shù)據(jù)進(jìn)行結(jié)合,以提供對導(dǎo)航信息的最優(yōu)估計(jì)。
依據(jù)作為通過非線性傳播函數(shù)f隨時(shí)預(yù)測狀態(tài)以及通過觀測函數(shù)h預(yù)測觀測者的方式的模型的連續(xù)動(dòng)態(tài)系統(tǒng)來完成融合,觀測函數(shù)h可以非線性的(見附錄5,其中強(qiáng)調(diào)了關(guān)于動(dòng)態(tài)系統(tǒng)的一些原則),該函數(shù)取決于所使用的傳感器cc的類型:
其中,u(t)示出了由比力和角速度構(gòu)成的輸入命令。傳感器c1根據(jù)周期t1隨時(shí)間離散地測量這兩個(gè)量值。
總體狀態(tài)x(t)特別包括采用一個(gè)或多個(gè)旋轉(zhuǎn)形式的載體的位置坐標(biāo)、速度和方向,其中的每一個(gè)例如由矩陣或姿態(tài)四元素來表示。
估計(jì)器e在根據(jù)現(xiàn)有技術(shù)的規(guī)則獲得的連續(xù)時(shí)間處利用這些方程的離散版本:
ekf濾波器根據(jù)將傳感器ci的測量值考慮在內(nèi)的預(yù)測步驟及將傳感器cc的測量值考慮在內(nèi)的更新步驟來進(jìn)行迭代運(yùn)算:
預(yù)測步驟包括預(yù)測估計(jì)的總體狀態(tài),以及預(yù)測相關(guān)聯(lián)的協(xié)方差。
預(yù)測估計(jì)的總體狀態(tài):
預(yù)測相關(guān)聯(lián)的協(xié)方差:
其中,φk-1→k與取決于傳播函數(shù)f的轉(zhuǎn)移矩陣對應(yīng),并且q為模型噪聲的矩陣。
更新步驟使用了以下變量:
新息:
協(xié)方差新息:
其中,hk對應(yīng)于觀測矩陣。
卡爾曼增益:
如下執(zhí)行更新:
估計(jì)的總體狀態(tài)更新:
相關(guān)聯(lián)的協(xié)方差更新:
理論上的轉(zhuǎn)移矩陣:
其中:
觀測矩陣:
雖然估計(jì)器接近于該算法,但是估計(jì)器e與該算法不同。總體狀態(tài)的更新不能完全通過相加得到,尤其是為了保持旋轉(zhuǎn)矩陣的屬性,并且還尤其是為了考慮傳感器ci的測量值的較快的速率。對估計(jì)的總體狀態(tài)的預(yù)測可以以比其它操作更快的速率來進(jìn)行。速率差取決于載體的動(dòng)態(tài)。其它差是可能的。例如,可以在轉(zhuǎn)移矩陣上進(jìn)行近似。
圖4示出了根據(jù)實(shí)施例的包括與其執(zhí)行的各個(gè)步驟對應(yīng)的不同的功能塊的估計(jì)器e。
在連續(xù)迭代中執(zhí)行估計(jì),每次迭代由索引k標(biāo)識(shí)。
在步驟100中根據(jù)速率1來預(yù)測估計(jì)的總體狀態(tài)。
1次循環(huán)中的存儲(chǔ)以及時(shí)間同步步驟功能以相同的速率進(jìn)行。該時(shí)間同步步驟考慮了以更緩慢的速率2更新的數(shù)據(jù)。
所有其他處理以速率2進(jìn)行。步驟200將速率1的狀態(tài)轉(zhuǎn)化成速率2的狀態(tài)。在速率2處,
在線性化步驟300中計(jì)算轉(zhuǎn)移矩陣和觀測矩陣。特定于本發(fā)明以及稍后更詳細(xì)描述的子調(diào)整步驟被添加到該步驟300。
根據(jù)預(yù)測的總體狀態(tài)以及在圖4中示出的傳感器cc的觀測值來計(jì)算新息。
將kef的其他步驟組合到步驟400中,步驟400通過矩陣并且構(gòu)成卡爾曼濾波來執(zhí)行估計(jì),這些估計(jì)指的是線性化速率1處并入步驟100中的對線性化狀態(tài)的預(yù)測。
步驟401包括預(yù)測與預(yù)測的總體狀態(tài)相關(guān)聯(lián)的協(xié)方差,并且利用轉(zhuǎn)移矩陣。步驟402包括計(jì)算新息的協(xié)方差、卡爾曼增益,更新總體狀態(tài)的協(xié)方差以及更新線性化狀態(tài)。該步驟利用觀測矩陣。
步驟300中的線性化點(diǎn)可以根據(jù)
在步驟300中,第一線性化點(diǎn)
在步驟300中,第二線性化點(diǎn)
為了簡化符號(hào),轉(zhuǎn)移矩陣
如前所述,以速率2(卡爾曼濾波器的速率)在時(shí)刻k+1的后續(xù)迭代處遞歸地重復(fù)上述步驟。
調(diào)整轉(zhuǎn)移矩陣和觀測矩陣
每次卡爾曼循環(huán)中采用的線性化步驟構(gòu)成了估計(jì)器e的弱點(diǎn)。
因此,估計(jì)過程包括在步驟300中根據(jù)能觀測性條件的附加的調(diào)整步驟,該附加的調(diào)整步驟在生成的矩陣被卡爾曼濾波器使用之前調(diào)整通過線性化步驟生成的矩陣:轉(zhuǎn)移矩陣(用來傳播協(xié)方差矩陣)和觀測矩陣。
能觀測性條件包括通過對轉(zhuǎn)移矩陣和觀測矩陣的調(diào)整施加在能觀測性矩陣(該矩陣的定義在附錄6中指出)的核上的約束,以在核中包括子向量的不可觀測空間的預(yù)定模型。該非能觀測性的模型包括根據(jù)總體狀態(tài)在通過基表示的子向量空間的狀態(tài)空間中的方程,其中,該子向量空間在每次循環(huán)時(shí)進(jìn)行更新。將該子空間包括在能觀測性矩陣的核中使該子空間不可觀測,并且當(dāng)模型恰當(dāng)(pertinent)時(shí)降低了不連續(xù)性的風(fēng)險(xiǎn)。
計(jì)算不可觀測的子向量空間所依據(jù)的總體狀態(tài)與觀測函數(shù)的線性化點(diǎn)對應(yīng)(見附錄6)。事實(shí)上,不可觀測向量具有通過觀測矩陣的零象點(diǎn),并且該向量與線性化狀態(tài)對應(yīng),該線性化狀態(tài)接近與觀測函數(shù)的線性化點(diǎn)對應(yīng)的總體狀態(tài)。
在調(diào)整步驟期間,針對轉(zhuǎn)移矩陣和觀測矩陣兩者的每一個(gè)來計(jì)算對應(yīng)的矩陣差。
按照慣例,在下文中將使用星號(hào)標(biāo)記來指代通過調(diào)整步驟輸出的轉(zhuǎn)移矩陣和觀測矩陣。
圖8中示意地示出了用于調(diào)整計(jì)算的數(shù)據(jù)流,其揭示了以下事實(shí):對觀測矩陣的調(diào)整取決于觀測函數(shù)在當(dāng)前卡爾曼循環(huán)中的線性化點(diǎn),而對轉(zhuǎn)移矩陣的調(diào)整取決于觀測函數(shù)在當(dāng)前循環(huán)和前一循環(huán)中的線性化點(diǎn)。
因此,有必要利用基bk和基bk-1,基bk在循環(huán)k中生成子向量的不可觀察空間,基bk-1在循環(huán)k-1中生成子向量不可觀察空間。
如圖x中所示,在卡爾曼循環(huán)時(shí),能夠存儲(chǔ)線性化點(diǎn)并每次循環(huán)兩次生成不可觀測基。同樣地,在卡爾曼循環(huán)時(shí),能夠存儲(chǔ)不可觀測基以每次循環(huán)僅一次生成不可觀測基。該第二種選擇與圖6的原理圖對應(yīng)。圖6的原理圖詳細(xì)說明了圖5中所描述的調(diào)整功能。
圖6詳細(xì)說明了導(dǎo)致在卡爾曼循環(huán)的時(shí)刻k處關(guān)于轉(zhuǎn)移矩陣和觀測矩陣獲得兩個(gè)矩陣差。
在循環(huán)k-1和循環(huán)k處使用總體狀態(tài)向量
附錄1中描述了可以根據(jù)本發(fā)明的方法進(jìn)行處理的兩種處于風(fēng)險(xiǎn)中的情形示例。在附錄2中研究了特定于靜態(tài)校準(zhǔn)的不可觀測基的模型。
由于無法使用包含有限數(shù)量的變量的方程來代表現(xiàn)實(shí)世界,所以必須在設(shè)計(jì)階段期間簡化假設(shè)以制定出該模型。真實(shí)誤差云能夠在狀態(tài)空間的所有方向上緩慢減小,但是由于非線性和估計(jì)噪聲,ekf估計(jì)到沿某些軸更快減小,這導(dǎo)致了不連續(xù)性。能夠通過一段時(shí)間內(nèi)的零減小來對該沿某些軸的緩慢減小進(jìn)行建模,并且考慮該不可觀測軸以對其施加限制。這種簡化略微降低了精度,但保證了估計(jì)的連續(xù)性。但是由于不再有必要使用模型噪聲來防止估計(jì)的3sigma包絡(luò)沿不可觀測軸減小,所以精度增益是最終結(jié)果。
附錄1中描述的靜態(tài)校準(zhǔn)是模型不考慮最小無法察覺的運(yùn)動(dòng)的情形的示例,該運(yùn)動(dòng)在短期來看不會(huì)有影響,但是長遠(yuǎn)來看該運(yùn)動(dòng)是可以被觀測到的,從而導(dǎo)致真實(shí)3sigma包絡(luò)沿某些軸緩慢減小。為了簡化模型,建議不考慮或者認(rèn)為這些較小的運(yùn)動(dòng)為零來建模不可觀測基,這是簡化的一個(gè)示例。在附錄1的第二個(gè)示例中,輕微運(yùn)動(dòng)還可以被忽略以建模不可觀測基。
如果基
在正交化步驟302中,使初級(jí)基
使q為初級(jí)不可觀測基的向量的數(shù)目。
在循環(huán)k中,正交化步驟可以進(jìn)行以下計(jì)算:
在卡爾曼循環(huán)期間,在步驟303中存儲(chǔ)該基
在步驟308中,基
能夠?qū)⑴c觀測矩陣hk有關(guān)的將矩陣差δhk分解成q個(gè)基本矩陣差。
該分解使得能夠并行進(jìn)行基本矩陣差的計(jì)算,而且縮短了步驟308的計(jì)算時(shí)間。
根據(jù)附錄3,每個(gè)基本矩陣差可以如下來計(jì)算:對于介于1和q之間的i而言,
此外,在循環(huán)k中,基
在循環(huán)k中,重構(gòu)步驟可以進(jìn)行以下計(jì)算:
在標(biāo)記為306的步驟中,計(jì)算關(guān)于轉(zhuǎn)移矩陣的矩陣差。
能夠?qū)⑾鄬τ谵D(zhuǎn)移矩陣
根據(jù)附錄3,每個(gè)基本矩陣差可以如下來計(jì)算:
對于介于1和q之間的i,
該分解使得能夠并行進(jìn)行各基本矩陣差的計(jì)算,而且能夠縮短步驟306的計(jì)算時(shí)間。
為了減少內(nèi)存使用和計(jì)算,可以將轉(zhuǎn)移矩陣的單個(gè)子矩陣視為:與不可觀測向量的非零值對應(yīng)的子矩陣。
所得到的該兩個(gè)矩陣差驗(yàn)證重要的能觀測性條件,即附錄7中詳細(xì)說明的條件。
此外,附錄3解釋了計(jì)算方法的起源,而附錄8給出了該計(jì)算方法的數(shù)學(xué)證明。
計(jì)算步驟306還產(chǎn)生了表示對由關(guān)于轉(zhuǎn)移矩陣的矩陣差導(dǎo)致的調(diào)整幅度的度量。
計(jì)算步驟308還產(chǎn)生了表示對由關(guān)于觀測矩陣的矩陣差導(dǎo)致的調(diào)整幅度的度量。
可以針對轉(zhuǎn)移矩陣和觀測矩陣來執(zhí)行相同類型的度量計(jì)算。例如,針對轉(zhuǎn)移矩陣分別計(jì)算矩陣差的范數(shù)的平方及轉(zhuǎn)移矩陣的范數(shù)的平方。該度量與這兩個(gè)量值的比或者這兩個(gè)量值的比的平方根對應(yīng)。
范數(shù)可選擇地使用加權(quán)系數(shù)來使?fàn)顟B(tài)向量中出現(xiàn)的量值標(biāo)準(zhǔn)化。例如,位置誤差可以具有數(shù)米的量級(jí),而姿態(tài)誤差可以具有數(shù)毫米弧度的量級(jí)。矩陣范數(shù)可以與通過將矩陣的所有項(xiàng)置于向量列的形式而形成的向量的范數(shù)(弗羅貝尼烏斯范數(shù))對應(yīng)。
附錄4解釋了如何在度量的計(jì)算中利用加權(quán)系數(shù)。
度量的計(jì)算可選地使用了加權(quán)函數(shù)
再一次參照圖5,在偏移步驟330中,對轉(zhuǎn)移矩陣及相關(guān)聯(lián)的矩陣差進(jìn)行求和以獲得經(jīng)調(diào)整的轉(zhuǎn)移矩陣;除此之外,對觀測矩陣及相關(guān)聯(lián)的矩陣差進(jìn)行求和以獲得徑調(diào)整的觀測矩陣。
圖6中示出的產(chǎn)生一對矩陣差和一對度量的順序310可以并行進(jìn)行n次。
可以假設(shè)對連續(xù)場中的n個(gè)預(yù)定情形而言,不可觀測基模型是已知的。該模型來自表示各自的觀測類型及可選地各自的狀態(tài)向量的軌跡的方程系統(tǒng)的解決方案,在附錄6中給出了該解決方案的方法。
在決策步驟320中,選擇n對矩陣差中的一對(例如,通過與情形i對應(yīng)的調(diào)整獲得的一對矩陣差),并且僅使用該對矩陣來執(zhí)行偏移步驟以產(chǎn)生調(diào)整的矩陣。
決策步驟320通過檢查對應(yīng)的度量值針對每對矩陣差運(yùn)行概率測試。該測試決定識(shí)別出如此這般的情形。
所選擇的矩陣差是與表示最小調(diào)整幅度的度量相關(guān)聯(lián)的矩陣差備選。因此,采用最“可能的”矩陣差來進(jìn)行調(diào)整。概率準(zhǔn)則可以指對轉(zhuǎn)移矩陣和/或觀測矩陣的調(diào)整。
此外,僅當(dāng)所選擇的矩陣差的度量小于預(yù)定閾值時(shí),執(zhí)行偏移:事實(shí)上,如果該偏移被認(rèn)為不足夠可靠而且給系統(tǒng)引入了額外的噪聲而不是校正了系統(tǒng),則可以優(yōu)選地不進(jìn)行對轉(zhuǎn)移矩陣和觀測矩陣的偏移。
前面的估計(jì)過程可以通過由慣性單元in的計(jì)算裝置執(zhí)行的計(jì)算機(jī)程序來執(zhí)行。此外,標(biāo)識(shí)卡1包括計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括用于當(dāng)該程序被標(biāo)識(shí)卡1執(zhí)行時(shí)執(zhí)行所描述的處理步驟的程序代碼指令。
附錄1:利用ekf濾波器的慣性導(dǎo)航單元的風(fēng)險(xiǎn)情形的示例
第一示例關(guān)于在地面上的靜態(tài)校準(zhǔn)階段中的慣性導(dǎo)航單元。在該階段中,借助于加速度計(jì)測量重力向量來估計(jì)本地垂線,并且借助于陀螺儀通過地球旋轉(zhuǎn)的角速度來估計(jì)單元的方向。該階段中使用的觀測典型地為對指示載體相對于地的速度為零的虛擬傳感器的觀測的zupt(零速修正技術(shù))。通過白噪聲來對測量誤差進(jìn)行建模。不過,歸結(jié)為慣性傳感器記錄由于例如風(fēng)或由于熱引起的熱膨脹的影響引起的較小的非隨機(jī)運(yùn)動(dòng)。這與產(chǎn)生觀測zupt的非慣性傳感器模型中未考慮的決定性測量誤差對應(yīng)。在動(dòng)態(tài)真實(shí)系統(tǒng)和動(dòng)態(tài)建模系統(tǒng)之間存在不連續(xù)性。因?yàn)殪o態(tài)校準(zhǔn)的時(shí)長較短,所以不連續(xù)性可忽略不計(jì)。相比之下,存在許多需要數(shù)小時(shí)、或數(shù)天、數(shù)周或者數(shù)個(gè)月的校準(zhǔn)。在這種情況中,不連續(xù)性則可能變得很突出。
第二示例關(guān)于安裝在帆船上的、利用在標(biāo)記船中的投影的速度觀測值的慣性導(dǎo)航單元。該非慣性測量通常借助于“計(jì)程儀”傳感器來進(jìn)行,并且該非慣性測量也可以是相對于水的相對測量。在標(biāo)記船上進(jìn)行投影創(chuàng)建了測量值與船的姿態(tài)的依賴關(guān)系。假設(shè)單獨(dú)使用該觀測值,則在kef濾波器的估計(jì)和現(xiàn)實(shí)世界之間可能表現(xiàn)出不連續(xù)性,并且如果船在恒定航向上航行數(shù)小時(shí)后,這種不連續(xù)性可能產(chǎn)生重大誤差。
附錄2:在靜態(tài)校準(zhǔn)中對不可觀測軸進(jìn)行建模
該附錄提出了對通過所提出的處理方法解決附錄1的第一示例的不連續(xù)性的不可觀測基的建模。
假設(shè):卡爾曼濾波器利用phi誤差模型以及自由方位的機(jī)械化功能。
使用了以下符號(hào):
方程中出現(xiàn)的狀態(tài)分量以如下任意順序呈現(xiàn),具體如下:
所需的測量值是速度。假設(shè)載體完全沒有平移運(yùn)動(dòng)或旋轉(zhuǎn)運(yùn)動(dòng)。假設(shè)傳感器默認(rèn)值是隨時(shí)間而始終不變的。
這些方程形成以下形式的靜態(tài)系統(tǒng):
不可觀測向量的搜索方法:
不可觀測軸如下:
附錄3:濾波器的限制
依據(jù)在卡爾曼周期中在每次循環(huán)k時(shí)根據(jù)與觀測矩陣的線性化點(diǎn)對應(yīng)的總體狀態(tài)的函數(shù)
將
方程1:
將
公式2:
正在討論的矩陣范數(shù)為弗羅貝尼烏斯范數(shù)。
矩陣
從現(xiàn)在起將采用下面的符號(hào):
在建模的不可觀測向量
轉(zhuǎn)移矩陣的總矩陣差與q個(gè)獨(dú)立的矩陣差的總和對應(yīng)。上述解決方案同樣應(yīng)用于觀察矩陣的矩陣差。
而且,對介于1和q之間的i而言:
在附錄8中根據(jù)幾何方法給出了對這些關(guān)系式的證明。
針對非正交基并且針對任何q,對方程1和方程2求解:
該基限定了不可觀測向量空間的模型:基向量的任何線性組合是不可觀測的。
通過這些向量的任何線性組合調(diào)整的觀測矩陣的像因此為零。因此,能夠使該基正交化,然后應(yīng)用前面的方法來計(jì)算觀測矩陣的矩陣差。
另一方面,不可觀測向量的線性組合的調(diào)整后的轉(zhuǎn)移矩陣的像與應(yīng)用到不可觀測的開始向量中的每一個(gè)的同一轉(zhuǎn)移矩陣的像的該相同的線性組合對應(yīng)。因此,能夠在循環(huán)k-1時(shí)確定用于使不可觀測向量的基正交化的線性組合,并能夠在循環(huán)k時(shí)使用該相同的組合來變換不可觀測基的模型。這應(yīng)用了前面的用于計(jì)算轉(zhuǎn)移矩陣的矩陣差的方法。
附錄4:加權(quán)的度量
被稱為“度量”的標(biāo)量
不同的方法能夠?qū)?imgfile="bda0001306438140000242.gif"wi="270"he="71"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>和
示例如下給出:
變量能夠使用加權(quán)函數(shù)
例如:
這些加權(quán)函數(shù)的可能的實(shí)現(xiàn)方式包括首先構(gòu)造狀態(tài)向量的加權(quán)函數(shù)f,然后推導(dǎo)出
因此,通過這種方法,通過加權(quán)函數(shù)f相關(guān)聯(lián)的向量u=[u1u2…ul]t是向量u′=f(u)=[a1a2…al]u=[a1u1a2u2…alul]t,其中,實(shí)系數(shù)a1a2…al形成加權(quán)系數(shù)。向量u′=f(u)=[a1a2…al]u=[a1u1a2u2…alul]t如下對轉(zhuǎn)移矩陣進(jìn)行加權(quán):
因?yàn)槿绻?imgfile="bda0001306438140000252.gif"wi="210"he="55"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>則
實(shí)際上,通過使
即
因此
因此
類似地
附錄5:動(dòng)態(tài)系統(tǒng)的概念及應(yīng)用于導(dǎo)航
這是決定性方程系統(tǒng),包括演化方程和觀測方程。演化方程根據(jù)狀態(tài)向量前一狀態(tài)及命令描述狀態(tài)向量。觀測方程提供了取決于狀態(tài)向量的標(biāo)量或向量。這些方程可以是非線性的。存在具有連續(xù)時(shí)間的系統(tǒng)和具有離散時(shí)間的系統(tǒng)。
連續(xù)時(shí)間系統(tǒng):
離散時(shí)間系統(tǒng):
其中,x(t)和xk指代系統(tǒng)的狀態(tài),u(t)和uk指代輸入命令,z(t)和zk指代根據(jù)呈現(xiàn)的連續(xù)模式在連續(xù)時(shí)刻t的觀測值或離散模式在離散時(shí)刻k的觀測值。
經(jīng)典牛頓力學(xué)的方程根據(jù)移動(dòng)標(biāo)記在任何時(shí)間的加速度及其角速度描述了移動(dòng)標(biāo)記的狀態(tài)。這些方程構(gòu)成了連續(xù)演化方程的示例,狀態(tài)向量將有關(guān)移動(dòng)標(biāo)記的位置、速度及方向的信息進(jìn)行組合,并且命令向量包括加速度和角速度。
在慣性導(dǎo)航單元的現(xiàn)有技術(shù)中,僅可以離散地進(jìn)行計(jì)算。結(jié)果是該連續(xù)演化方程以離散演化方程的形式進(jìn)行建模。不同的已知方法將連續(xù)演化方程轉(zhuǎn)化為離散演化方程。
在慣性單元的具有離散時(shí)間的動(dòng)態(tài)系統(tǒng)中進(jìn)行建模的觀測函數(shù)描述了通過特別的非慣性傳感器進(jìn)行的測量。根據(jù)所使用的傳感器可以隨時(shí)間推移連續(xù)地執(zhí)行多個(gè)觀測函數(shù)。
因此,在慣性導(dǎo)航單元中使用的具有離散時(shí)間的動(dòng)態(tài)系統(tǒng)是盡可能忠于與現(xiàn)實(shí)世界對應(yīng)的具有連續(xù)時(shí)間的動(dòng)態(tài)系統(tǒng)的模型。這兩個(gè)系統(tǒng)的能觀測性屬性因此是不同的。
動(dòng)態(tài)系統(tǒng)的能觀測性屬性表征在任何給定時(shí)刻有關(guān)系統(tǒng)的狀態(tài)的信息,該信息可以通過將稍后進(jìn)行的觀測以及演化函數(shù)和觀測函數(shù)考慮在內(nèi)來獲得。這些屬性尤其取決于命令,即,在慣性導(dǎo)航單元的情況下載體的運(yùn)動(dòng)。
附錄6:具有連續(xù)時(shí)間的系統(tǒng)的能觀測性
考慮在時(shí)刻0處于狀態(tài)x(0)的動(dòng)態(tài)非線性系統(tǒng)。在下文中,傳播函數(shù)和輸入命令將系統(tǒng)轉(zhuǎn)入狀態(tài)x(t),從而在狀態(tài)空間中限定特定軌跡。
由于該軌跡已知,所以可以假設(shè)目前初始狀態(tài)與x(0)相差被稱為線性化狀態(tài)的較小值δx(0),而輸入命令與前面的情況相同。后續(xù)的狀態(tài)為x(t)+δx(t)。在每個(gè)步驟,觀測函數(shù)收集有關(guān)當(dāng)前狀態(tài)的信息。此處的問題在于知道所考慮的場景的自始至終的這些信息是否使得能夠了解δx(0)。在時(shí)刻0線性化的狀態(tài)空間由可觀測子空間和不可觀測子空間組成。在時(shí)刻0處的由狀態(tài)δx(0)表征的不可觀測空間可以通過已知軌跡x(t)根據(jù)用于描述線性化狀態(tài)的新穎動(dòng)態(tài)系統(tǒng)來推導(dǎo):
其中,f和h是與針對給定軌跡線性化的動(dòng)態(tài)系統(tǒng)的演化矩陣和觀測矩陣對應(yīng)的可隨時(shí)間變化的矩陣。
不可觀測空間包括線性化狀態(tài)δx(t),諸如
該解形成線性化狀態(tài)的向量空間。該空間存在在時(shí)刻0形成不可觀測向量b(0)=(δx1(0),δx2(0),…,δxq(0))的基b(0)。
附錄7:離散時(shí)間系統(tǒng)的能觀測性
考慮在時(shí)刻0處于狀態(tài)x(0)的離散非線性動(dòng)態(tài)系統(tǒng)。在不同的連續(xù)離散時(shí)刻,傳播函數(shù)和輸入命令將系統(tǒng)轉(zhuǎn)入狀態(tài)x1,x2,…。在已知這些連續(xù)狀態(tài)的情況下,假設(shè)目前初始狀態(tài)與x0相差被稱為線性狀態(tài)的較小值δx0,而輸入命令與的面前情況相同。后續(xù)的連續(xù)狀態(tài)為x1+δx1、x2+δx2…。在每個(gè)步驟,觀測函數(shù)收集有關(guān)當(dāng)前狀態(tài)的信息。問題在于如何根據(jù)正在討論情況由始至終的情況確定該信息是否使得能夠知道δx0。在時(shí)刻0的線性化狀態(tài)空間由可觀測子空間和不可觀測子空間組成?;谥T如ekf之類的線性化原理進(jìn)行操作的觀察者永遠(yuǎn)無法估計(jì)線性化狀態(tài)的不可觀測空間中的誤差。
在時(shí)刻0由狀態(tài)x0表征的不可觀測空間可以通過考慮在不同狀態(tài)x0、x1、x2…中執(zhí)行演化函數(shù)和觀測函數(shù)的線性化狀態(tài)δxk的動(dòng)態(tài)系統(tǒng)得到。在時(shí)刻k線性化的演化函數(shù)被稱為“轉(zhuǎn)移矩陣”,記為
通過與在x0中線性化的觀測函數(shù)對應(yīng)的觀測矩陣h0(x0)來對關(guān)于x0的差δx0的進(jìn)行第一次觀測。通過與在x0中線性化的演化函數(shù)對應(yīng)的轉(zhuǎn)移矩陣
已知的是,系統(tǒng)的描述擾動(dòng)的不可觀測空間為矩陣的核。
因此,不可觀測空間和可觀測空間取決于初始參考狀態(tài)x0、輸入命令(在慣性單元的情況中,為慣性數(shù)據(jù))、演化方程及觀測方程。
可以假設(shè)向量v0x0形成mx0的核的一部分。
假設(shè):
在給定時(shí)間,通過以下系統(tǒng)方程針對不可觀測方向形成能觀測性條件:
其中,vkxk在離散時(shí)刻k形成特別的不可觀測向量。
該條件適于任何時(shí)間并且與軌跡x0、x1、x2…相關(guān)。
在ekf中,該軌跡受到估計(jì)誤差的噪聲干擾。該噪聲趨于減少觀測矩陣的核,從而減少不可觀測空間的維度。
此外,轉(zhuǎn)移函數(shù)和觀測函數(shù)未在同一點(diǎn)被線性化。該一組x0、x1、x2…替換為一組
并且:
能觀測性條件被寫為:
附錄8:用于向量的正交基的矩陣調(diào)整公式的證明
假設(shè):p維矩陣列ui諸如:
令p維矩陣列為與ui具有相同維度的vi。
令矩陣為a。
問題:此處的目的在于找到具有最小范數(shù)的矩陣δa,以使:
矩陣a+δa可以以如按列的行的p維矩陣的形式,并且向量vk可以以q個(gè)按列的標(biāo)量的形式:
因此,目的在于找到具有最小范數(shù)的矩陣δlk,以使:
對問題的幾何解釋:行矩陣和列矩陣與維度大于q的向量空間中的向量相關(guān)聯(lián)。通過在變量上方添加箭頭來保持相同的符號(hào)。
條件(1)導(dǎo)致:
條件(2)導(dǎo)致下面的標(biāo)量積:
向量
此處的目的在于
因此,
圖7示出了存在無限數(shù)量的解
根據(jù)該圖,其給出了:
因此,其給出了
矩陣符號(hào)因此再一次給出了:
在一些操作之后,對矩陣a和δa進(jìn)行重整給出了以下關(guān)系: