專利名稱:用于同時套合多維地形點的方法和系統(tǒng)的制作方法
技術領域:
在生成諸如各種地理地形這樣的多維物體的完全數(shù)字模型時,需要組合從不同視點拍取的幾個交迭的測距圖像(也稱為數(shù)據(jù)點的圖框(frame)或集合(volume))。使用稱為套合(register)的處理來拼湊這些圖框,以產(chǎn)生該物體的多維模型。在套合處理中,確定不同圖框的所需平移和旋轉。該處理使用六個參數(shù)Δx、Δy、Δz、Δω、Δκ和Δ,其中前三個參數(shù)涉及相應的x、y和z坐標的平移,后三個參數(shù)分別涉及在所述三個相應的x、y和z軸中各個軸上的旋轉。套合包括來自物體的不同且交迭的視點的大量數(shù)據(jù)點在內的圖框的已知方法需要大量計算,因而耗費時間。然而,許多套合技術應用要求從獲取這些圖框的時間起的快速響應。因此,需要一種用于套合多維數(shù)據(jù)點的更快且更健壯的系統(tǒng)。
已知的地形點收集方法包括成像激光雷達(LIDAR)和IFSAR(干涉式合成孔徑雷達)。參照圖1,示出了空載LIDAR系統(tǒng)100的示例。系統(tǒng)100包括安裝在飛機104底部上的LIDAR儀器102。在飛機之下是包括被樹和其它植被形成的遮罩所部分遮蔽的地表面在內的區(qū)域,所述樹和其它植被使得無法從空中看到地面(大地)。LIDAR儀器102發(fā)出指向地面的多個激光脈沖。該儀器102包括傳感器103,其檢測脈沖的反射/散射。LIDAR儀器102提供包括來自單個圖像的高程對位置信息的數(shù)據(jù)。然而,應當注意,使用來自不同視點的該區(qū)域的多個圖框或多個部分來生成該圖像。該地形上面的樹的遮罩還將使得目標(如坦克106)被顯著遮蔽在該樹的遮罩之下。由此,儀器102的傳感器103從地面和目標106接收的點將很稀少。因此,需要一種用于處理這些點的健壯系統(tǒng),來生成精確的三維圖像。此外,作為最為重要的戰(zhàn)術和戰(zhàn)略價值,必須能夠快速獲得其中可以觀測到目標106的地面圖像。
發(fā)明內容
根據(jù)本發(fā)明的實施例,一種套合多維地形數(shù)據(jù)點的方法,包括以下步驟接收多個數(shù)字高程模型點,這些點表征地理區(qū)域的多個交迭的圖框;對于第一圖框中的多個點中的各點,在多個后續(xù)圖框中查找對應的最接近點;確定各圖框的旋轉和平移變換;確定進行每次旋轉和平移變換的代價;以及對于另外的圖框迭代以上處理多次,或者直到到達中止判決,以優(yōu)化套合這些圖框的代價。上述方法還可以通過專用或者可編程信息處理系統(tǒng)來執(zhí)行,或者作為諸如CD ROM或DVD等的計算機可讀介質中的一組指令而被執(zhí)行。
圖1是用于處理隱藏了目標的被樹覆蓋地形的圖像的空載LIDAR儀器的示意圖。
圖2是示出了根據(jù)本發(fā)明實施例的信息處理系統(tǒng)的高級框圖。
圖3是一圖框(諸如多個LIDAR點的圖框)的、表征一表面的一組二維點。
圖4是用于搜索最接近點的k-D樹的示意圖。
圖5是例示了統(tǒng)計距離相對于歐幾里得距離的優(yōu)點的多個點的曲線圖。
具體實施例方式
參照圖2,示出了表示利用本發(fā)明實施例的信息處理系統(tǒng)200的高級框圖。該系統(tǒng)200包括地形數(shù)據(jù)點的源202。這些點優(yōu)選的是由參照圖1所討論的LIDAR儀器102所提供的多個三維(3D)地形點值。
LIDAR儀器202按照傳統(tǒng)方式創(chuàng)建多個圖框(或集合)的點圖像。各個圖框包括隨著飛機104在地形上移動而由傳感器103在給定時間段上(曝光)收集的點。在優(yōu)選實施例中,該時間段是三分之一秒,并且利用現(xiàn)有儀器,該曝光得到LIDAR傳感器103收集的幾十萬個點。各個點由一組三維坐標(x,y,z)定義。
使本系統(tǒng)比現(xiàn)有技術性能有所提高的一種方式是至少部分地使用表征地表面和目標106(如果存在)的數(shù)據(jù)點,而不使用高出地面的高度大于預定閾值(諸如六英尺)的遮蔽物。只使用地面點大大減少了要下行傳輸(downlink)和處理的點的數(shù)目,并且由此減少了產(chǎn)生該地形的模型所需的時間。
LIDAR儀器102提供的數(shù)據(jù)可能包括稱為環(huán)邊(ringing)的效應(或反應邊(corona)效應)。環(huán)邊是由于目標區(qū)域產(chǎn)生的光的散射而引起的,該散射導致錯誤的返回結果。環(huán)邊去除過濾器(電路或程序邏輯)204用于過濾所接收的3D地形點,以去除該環(huán)邊。并不是所有地形數(shù)據(jù)都包括環(huán)邊。因此,并不總是需要過濾器204。通過略去超出所選方位角設置的所有數(shù)據(jù)來去除該環(huán)邊,由此刪除任何錯誤的圖像。方位角的選擇由統(tǒng)計數(shù)據(jù)控制,或者被啟發(fā)式地(heuristically)確定。在系統(tǒng)200中使用環(huán)邊去除過濾器204增大了過濾器204輸出中的信噪比。在與本申請同時提交的卷號為GCSD-1526的專利申請中討論了環(huán)邊過濾器的具體示例。
環(huán)邊噪聲去除過濾器204所提供的輸出被地面探測器206接收。地面探測器206用于使用多個未加工的地形點(如,來自LIDAR儀器102)及其坐標來查找地表面,并且提供表征了多個圖框的多個地面點,這些圖框表征了多片地表面和目標106。地面探測器206通過從其輸入中提取地面點并且濾除地面上的遮擋物點(諸如來自樹頂?shù)狞c),來查找地面。如所期望的,穿過樹和其它植被到達地面的LIDAR脈沖的數(shù)目比LIDAR源(發(fā)射器)發(fā)射的LIDAR脈沖的數(shù)目少很多。因此,在LIDAR傳感器處檢測到的來自地面的光點(地面點)比從飛機104下面的整個地形接收的總點數(shù)少很多。
由此,地面探測器206從環(huán)邊去除過濾器204的輸出中所提供的地形數(shù)據(jù)中提取地表面的殼(shell)(定義了三維表面的一組點)。地面探測器206的輸出包括一組數(shù)據(jù),該組數(shù)據(jù)表征包括目標106的地表面。通過將地面點與由樹和其它植被提供的地面上遮擋物分離開,來確定地面點。
地面探測器206還進行操作來確定地面是連續(xù)的,從而地形沒有較大變化。這是通過創(chuàng)建地表面的二維(2D)網(wǎng)格并且確定各網(wǎng)格單元中的地面高度來完成的。各網(wǎng)格單元優(yōu)選地表征各邊長為一米的正方形地面部分。一旦對于整個網(wǎng)格收集到該數(shù)據(jù),則地面探測器206將刪除看起來不合適的點,或者基于不足數(shù)據(jù)的點。判定要刪除哪些點是基于編程到地面探測器206中的工具(artifact)。地面探測器206進一步被編程為當計算地表面的等高線時略去高于預定高度(如人的高度,諸如六英尺)的任何點。該預定高度是由基于規(guī)則的統(tǒng)計而確定的。進行此操作來刪除不可能是地面的一部分的任何結構。由此,地面探測器206的輸出提供比使用樹頂數(shù)據(jù)的系統(tǒng)更為可靠的實際地表面的表征。
地面探測器206的輸出被提供給競爭過濾器208。競爭過濾器208用于對地面探測器206提供的地表面數(shù)據(jù)(地面點)進行操作。使用競爭過濾器來過濾地面點,以獲得多個數(shù)字高程模型(DEM)點的3D殼。競爭過濾器208過濾與地球坐標無關的地表面數(shù)據(jù),諸如LIDAR儀器202收集的數(shù)據(jù)。過濾器208通過對點的各個圖框進行預定階的多項式匹配來進行操作。這是通過確定哪個多項式最佳地表征了該圖框中的一組點來完成的。一個示例是一階多項式(傾斜平面),另一示例是數(shù)值平均(零階)。在優(yōu)選實施例中,該平均值和傾斜平面(分別是零階和一階多項式)競爭與點的任何給定圖框的最佳匹配。其它實施例可能使用更高階的多項式。在序列號為09/827,305的美國專利申請中討論了使多項式與圖框匹配的方法,在此通過引用將該申請的公開完全并入。
由此,對于點的每個圖框,過濾器208確定與該圖框中的點匹配的傾斜平面。各圖框是微圖框,其覆蓋構成了由套合產(chǎn)生的全部區(qū)域中的一小部分的一片。競爭過濾器208的輸出是包括多個(如三十個)平面的等高線,一個平面針對獲取的各圖框。地表面的最佳估計考慮到樹和植被的遮擋,來產(chǎn)生被局部遮擋的目標的圖像。一旦各圖框被過濾器208處理,則輸出是一組未套合的DEM表面。在本實施例中,各表面是地表面;然而,應當理解,本發(fā)明的方法和系統(tǒng)可以用于目標物體的任何表面上。
競爭過濾器208產(chǎn)生的數(shù)據(jù)DEM并不適合于呈現(xiàn)對于系統(tǒng)200的用戶有用的圖像。為了產(chǎn)生可查看的圖像,我們首先完成套合處理。在優(yōu)選實施例中,通過塊210(套合引擎)和212(剛體(rigid)轉換引擎)進行的迭代處理,來進行套合。在本實施例中,為了獲得地表面的3D表征,將幾組數(shù)據(jù)(圖框)自動拼湊在一起,以創(chuàng)建整個目標區(qū)域或表面的圖像。從提供了不同的表面特征視圖的不同視點拍取一組數(shù)據(jù)(或圖框)。套合確定隨著傳感器103在表面上移動,表征該表面的各點的相對位置。由此,通過平移和旋轉各圖框來與相鄰的一個圖框或多個圖框匹配,來使該表面區(qū)域的不同視圖相互對準。
塊210將相鄰圖框中的點對準。塊210通過在第二圖框中查找與第一圖框中的多個點中的各點最接近的點來完成該操作。一旦找到最接近的點,則將這兩點對準,以使得對這些圖框進行良好的匹配,該匹配表征經(jīng)套合的模型或圖像。此操作被稱為成對處理。該處理的每次迭代都產(chǎn)生更好的匹配,并且處理繼續(xù),直到實現(xiàn)了最佳對準。這是通過確定與各圖框的、為了與其它圖框匹配而進行的各次旋轉和平移相關聯(lián)的計算代價來完成的。通過使用在各次迭代中收集的信息(相鄰圖框之間的匹配),后續(xù)的迭代校正該對準,直到到達中止判決。該判決可以是完成了一定次數(shù)的迭代,或者實現(xiàn)了預定目的。在本實施例中,我們通過將來自各次迭代的觀測值(observation)輸入一矩陣,然后立刻解該矩陣以使得大致同時地進行所有轉換,來對于第一圖框中的各點進行最接近點搜索,以定位多于一個的其它圖框中的最接近點(即,基于n的處理)。
塊212接收與各次迭代過程中在塊210處產(chǎn)生的點的對準有關的信息。塊212中的處理器邏輯使用塊210提供的信息,來確定在將這些圖框匹配到一起時對于各圖框的轉換(即,角度和位移)。由此,塊212的輸出是對于要拼湊到一起的圖框的一組角度和位移(Δx、Δy、Δz、Δω、Δκ和Δ)。
圖框整合器塊214接收剛體轉換塊212的輸出,并且根據(jù)剛體轉換信息對競爭過濾器208產(chǎn)生的所有DEM點進行整合。
在優(yōu)選實施例中,多次(如五次)重復該迭代處理,以確定這些圖框的最佳旋轉和平移。優(yōu)選的,我們使用在J.A.Williams和M.Bennamoun,“Simultaneous Registration of Multiple Point Sets UsingOrthonormal Matrices”Proc.IEEE Int.Conf.on Acoustics,Speechand Signal Processing(ICASSP Jun.2000),2199到2202頁中提出的算法,在此通過引用并入該文獻的公開。
在塊212處進行上述的迭代的轉換。各次轉換都是剛體轉換。如果一轉換保持對應點之間的距離,則該轉換稱為剛體的。
在圖框整合器塊214中,進行塊212產(chǎn)生的多個所套合的集合的整合,并且將結果裁剪成適于呈現(xiàn)的尺寸和形狀,然后在塊216中對其進行視覺上的應用,以表示目標的結構。所得結果是被快速顯示的3D模型。在本文中討論的實施例中,在不存在坦克106上的樹的遮罩的遮擋效應的情況下,示出了諸如在圖1中示出的隱藏在樹頂之下的坦克106這樣的物體。
如上所述,在許多應用中,諸如在戰(zhàn)爭環(huán)境中定位諸如坦克106的隱藏目標時,套合處理的速度是關鍵的。加快該處理的速度的一種方式是提高搜索圖框間的對應點的速度。這可以通過使用幾個公知的k-D樹算法來完成。由此,來自各圖框的數(shù)據(jù)點被映射到樹結構中,以使得不必搜索相鄰圖框中的整組的點來查找對于第一圖框中的給定點的最接近點。k-D樹算法的示例可以在位于以下地址的網(wǎng)站中找到http://www.rolemaker.dk/nonRoleMaker/uni/algogem/kdtree.htm。
參照圖3,示出了一圖框(諸如多個LIDAR點的圖框)的、表征一表面的一組點(P1-P10)。在各個步驟中,區(qū)域被分成兩個區(qū)域,各個區(qū)域包含一半的點。重復該處理,直到各點單獨在其自己的區(qū)域中。作為示例,如果以8個點開始,尋找特定點,則通過查詢該特定點位于哪一半中將8個點削減到四個點,然后削減到兩個點,最終削減到一個點。這只是三個步驟,這比詢問所有八個點簡單。當有更多點時,差別會特別大。如果有256個點,則通常通過八次嘗試而不是256次來查找一點。
套合引擎210生成直線L1-L8。這些直線用于建立k-D樹,并且在圖4中示出。k-D樹是通過在x和y方向上遞歸地劃分點P1-P10而創(chuàng)建的。在k-D樹中,圖3的各條直線由一節(jié)點(圓圈)來表征,并且各點(矩形)鏈接到一節(jié)點。該樹用于減少查找與任何給定點最接近的點所需的搜索時間。例如,如果搜索與P10最接近的點,則可以遍歷節(jié)點L1到L3,然后到L7,并且只考慮點P9而不考慮P1。注意,該示例是2D的,但是我們的應用使用3D點。
圖5是例示了統(tǒng)計距離相對于歐幾里得距離的優(yōu)點的多個點的曲線圖。示為O的點是來自LIDAR產(chǎn)生的圖框A,示為X的點是來自LIDAR產(chǎn)生的圖框B。假設這些圖框或集合是交迭的。我們自始就不知道圖框A中的哪個點與圖框B中的哪個點對準。我們開始于比較要對準的各對點的坐標。對于圖框A中的任何給定點,我們考慮圖框B中的一區(qū)域內的其它點。任何給定對的點之間的距離由圓圈或者橢圓表征。這些圓圈表征歐幾里得距離,橢圓表征Mahalanobis距離。等式r2=(x-mx)1Cx-1(x-mx)中的量r稱為從特征向量x到平均值向量mx的Mahalanobis距離,其中Cx是x的協(xié)方差矩陣??梢钥闯?,r為常量的表面是以平均值mx為中心的橢圓。Mahalanobis距離用于向上和向下(即,沿著z軸)對準多點。該處理識別出以下觀測到的事實這些點在z方向上看起來比它們實際上更遠。通過使用橢圓區(qū)域來定位其它圖框中的對應點來對準這些點,我們實現(xiàn)比只使用圓圈表征的歐幾里得距離更為精確的模型。
權利要求
1.一種用于套合對多維物體進行表征的多維數(shù)字高程模型地形點的系統(tǒng),該系統(tǒng)包括套合引擎,用于對于第一圖框中的各點,在多個后續(xù)圖框中的各圖框中查找對應的最接近點;處理器,用于確定所述多個后續(xù)圖框中的各圖框的旋轉和平移變換,并且用于確定進行每次旋轉和平移變換的代價;以及邏輯例程,用于對于另外的圖框重復確定旋轉和平移以及代價的操作,直到到達中止判決。
2.根據(jù)權利要求1所述的系統(tǒng),進一步包括地面探測器,用于接收對被局部遮擋的地表面進行表征的數(shù)據(jù)點的多個圖框,并且產(chǎn)生只對該地表面進行表征的多組數(shù)據(jù)點的多個圖框。
3.根據(jù)權利要求1所述的系統(tǒng),進一步包括用于使用由處理器確定的代價將剛體轉換應用于所述圖框的邏輯。
4.根據(jù)權利要求1所述的系統(tǒng),進一步包括表征各圖框中的點的k-D樹,以用于在后續(xù)圖框中搜索與第一圖框中的各個點最接近的點。
5.根據(jù)權利要求1所述的系統(tǒng),進一步包括圖框整合器,用于整合所述圖框以提供對所述多維物體進行表征的經(jīng)整合表面。
6.根據(jù)權利要求1所述的系統(tǒng),進一步包括顯示器,用于顯示所述多維物體。
全文摘要
一種用于套合對多維物體進行表征的多維地形數(shù)據(jù)點的方法,包括a)接收多個點,這些點表征該多維物體的表面的多個交迭的圖框;b)對于第一圖框中的各點,在多個后續(xù)圖框中的各圖框中查找對應的最接近點;c)確定所述多個圖框中的各圖框的旋轉和平移變換,以使得對應的最接近點被對準;d)確定進行每次旋轉和平移變換的代價;以及e)對于另外的圖框重復步驟b)到d),以提供最佳變換。
文檔編號G06K9/00GK1985264SQ200580023894
公開日2007年6月20日 申請日期2005年7月7日 優(yōu)先權日2004年7月15日
發(fā)明者湯姆·麥克道爾, 杰克·奧克希爾, 馬克·拉赫姆斯, 雷·弗爾姆 申請人:哈里公司