本發(fā)明涉及側(cè)掃聲吶技術(shù)領(lǐng)域,具體是一種基于擴散映射的側(cè)掃聲吶圖像目標非監(jiān)督探測方法。
背景技術(shù):
側(cè)掃聲吶(sidescansonar,sss)圖像在似雷物體、海底冷泉等水下目標的探測和識別方面具有重要的應(yīng)用價值。基于時域ping斷面數(shù)據(jù)可實現(xiàn)目標探測,但精度受復雜海洋噪聲影響顯著;基于空域圖像數(shù)據(jù)的目標探測方法主要有兩種:基于監(jiān)督學習的方法,其通過提取已知圖像庫中參考圖像目標的形狀、紋理、灰度等特征,通過構(gòu)建分類識別模型實現(xiàn)待檢測圖像中目標的探測。側(cè)掃聲吶作為一種水下聲學設(shè)備,應(yīng)用于復雜變化的海洋環(huán)境中,決定了沒有足夠的專家圖像庫可供選擇,且將不同海況下得到的圖像提取目標特征用于陌生海況進行目標探測時精度難以保證;基于非監(jiān)督學習的方法,通常需借助一定的數(shù)學模型,這些模型應(yīng)用于數(shù)據(jù)量大的側(cè)掃聲吶圖像時,往往存在計算效率不高的缺陷,因此很多情況下,在保證目標與背景有足夠分離度的基礎(chǔ)上需要先對原始數(shù)據(jù)進行降維操作。擴散映射(diffusionmap)作為流形(manifolds)學習算法的一種,是一種非線性的數(shù)據(jù)降維方法,可以有效降低圖像數(shù)據(jù)維數(shù);而擴散映射下定義的擴散距離為尋找數(shù)據(jù)中有意義的幾何結(jié)構(gòu)提供了一種有效的方法,為側(cè)掃聲吶圖像中異常區(qū)域(目標)的探測提供了一種新思路。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于擴散映射的側(cè)掃聲吶圖像目標非監(jiān)督探測方法,以解決上述背景技術(shù)中提出的問題。
為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于擴散映射的側(cè)掃聲吶圖像目標非監(jiān)督探測方法,包括以下步驟:
第一步:計算sss圖像的灰度直方圖,統(tǒng)計得到其第一個波峰的灰度g,將sss圖像中灰度小于g的像素的位置標記為陰影區(qū)域,并記錄陰影的位置;
第二步:構(gòu)建高斯金字塔圖像(gl)ll=0,其中g(shù)0為原始sss圖像;隨機采樣時,忽略陰影區(qū)域的像素;在低尺度的金字塔圖像采用較高的采樣率,而在高尺度的金字塔圖像采用較低的采樣率;
第三步:對采樣數(shù)據(jù)進行擴散映射計算,得到采樣數(shù)據(jù)的擴散坐標及其特征向量;
第四步:應(yīng)用第三步的特征向量根據(jù)數(shù)據(jù)擴展方法將采樣數(shù)據(jù)擴展至原始數(shù)據(jù),得到原始數(shù)據(jù)的擴散坐標y;
第五步:再計算擴散坐標y的擴散距離d;
第六步:根據(jù)擴散距離d在sss圖像的像素鄰域內(nèi)計算目標得分,目標得分的公式如下:
式中,dposition為歐幾里得距離,d為擴散距離,σk為d的k近鄰個值的方差;根據(jù)目標得分c給定一個閾值τl,實現(xiàn)目標探測;當l>0時,τl取目標得分95%的置信區(qū)間;當l=0時,取一硬閾值τ對探測結(jié)果進行平滑處理;
第七步:當l<l時,對每層sss圖像重復第二步-第六步;當l=0時,輸出目標探測結(jié)果。
作為本發(fā)明進一步的方案:第三步中,擴散映射計算中包括權(quán)矩陣的計算,權(quán)矩陣由高斯函數(shù)得到:
w(xi,xj)=exp(-||xi-xj||2/δ2)
式中δ為尺度參數(shù),距離||xi-xj||采用歐幾里得距離,xi,xj為數(shù)據(jù)集合x的行向量。
作為本發(fā)明進一步的方案:第四步中,數(shù)據(jù)擴展方法采用nystrom擴展方法。
作為本發(fā)明進一步的方案:第五步中,擴散距離d的計算公式為:
式中:
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
本發(fā)明提出了一種基于擴散映射的側(cè)掃聲吶圖像目標非監(jiān)督探測方法。顧及擴散映射計算效率低的缺陷,通過構(gòu)建高斯金字塔圖像,對每層sss圖像隨機采樣進行擴散映射計算,提高了計算效率;通過擴散距離定義鄰域內(nèi)目標得分,有效實現(xiàn)了側(cè)掃聲吶圖像中目標的探測。考慮到側(cè)掃聲吶圖像存在陰影的特點,首先對陰影進行單閾值簡單探測,隨機采樣時不考慮陰影位置,提高了目標探測的精度;且通過多層sss圖像的探測彌補了隨機采樣可能造成目標探測失敗的缺陷。試驗驗證了方法的有效性,為側(cè)掃聲吶圖像提供了一種新的非監(jiān)督探測方法。
附圖說明
圖1是基于擴散映射的側(cè)掃聲吶圖像目標探測流程圖;
圖2:(a)單目標聲吶圖像,(b)擴散坐標前三維數(shù)據(jù)圖像顯示;
圖3是擴散坐標前三維數(shù)據(jù)成圖;
圖4是平滑前后的目標得分情況圖;
圖5是目標及其陰影的最終探測結(jié)果圖;
圖6是顧及陰影位置的目標得分及探測結(jié)果圖;
圖7是不顧及陰影的目標得分及目標探測結(jié)果圖;
圖8是顧及陰影的目標得分及多目標探測結(jié)果圖;
圖9是沙坡紋理中聲吶圖像目標探測結(jié)果圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
實施例1
1:擴散映射基本原理
擴散映射的框架來源于動力系統(tǒng)。在數(shù)據(jù)圖上定義一個markov隨機游走,通過若干時間步長的隨機游走,得到數(shù)據(jù)點之間接近度的一種度量關(guān)系,有了這種度量,可定義擴散距離,且在數(shù)據(jù)的低維表示中,擴散距離也能得到保留。如果令x=(x1,x2,...,xn)為n組高維的數(shù)據(jù)集合,可構(gòu)建權(quán)重矩陣來度量相鄰兩個數(shù)據(jù)結(jié)點之間的相似性,標準的擴散映射算法中,權(quán)矩陣由高斯函數(shù)得到:
w(xi,xj)=exp(-||xi-xj||2/δ2)式(1)
式(1)中δ為尺度參數(shù),距離||xi-xj||可采用歐幾里得距離,xi,xj為數(shù)據(jù)集合x的行向量。
對x構(gòu)建一個核映射k:x×x→r,該映射滿足kij=kji,且kij≧0,如果基于w構(gòu)造k=wtw,可知核映射k滿足前述兩個條件。若將(x,k)視為一個圖,那么根據(jù)核映射k的性質(zhì),可以構(gòu)造出數(shù)據(jù)集合x上的一個馬爾科夫(markov)鏈,如此引入幾個概念和符號。
(1)數(shù)據(jù)點x的度
它呈現(xiàn)了數(shù)據(jù)點x的“局部信息”。
(2)轉(zhuǎn)移概率
p(x,y)=k(x,y)/d(x)式(3)
此時轉(zhuǎn)移概率p(x,y)為一個正矩陣,但不滿足對稱的性質(zhì)。但其滿足:
如此構(gòu)建得到了數(shù)據(jù)集合x上的一個markov鏈,其包含了原始數(shù)據(jù)集的局部幾何信息,轉(zhuǎn)移概率p(x,y)反映了數(shù)據(jù)從一個點運動到另一個點的概率,可定義pt(x,y)為第t次轉(zhuǎn)移概率。該markov鏈有一個重要的性質(zhì),即其為可逆矩陣,這個性質(zhì)決定了,當x為有限集的情況下對p進行特征分解,可得到正交的左、右特征向量ψj、
l為特征值個數(shù);由于λ0為一常數(shù),根據(jù)mishne等(2014)的研究可將擴散映射表示為,
(3)擴散距離
針對擴散映射可以定義擴散距離:
式(6)中pt(x,y)是pt中的元素,z為數(shù)據(jù)集合x中的數(shù)據(jù);dt(x,y)為在給定時刻t、數(shù)據(jù)(x,y)之間的擴散距離。它反映了數(shù)據(jù)(x,y)間的局部結(jié)構(gòu),更為重要的是它從宏觀上給出了數(shù)據(jù)(x,y)之間的聯(lián)系,如果數(shù)據(jù)(x,y)與很多短邊相連接,那么,直觀上它們之間的距離也應(yīng)該很?。贿@個距離包括了銜接數(shù)據(jù)(x,y)的所有路徑,所以其抗干擾能力很強,一個點的微小擾動對距離的改變不大。
根據(jù)擴散映射后得到的擴散坐標,dt(x,y)可以按下式計算:
根據(jù)前述基本原理,可以將圖像數(shù)據(jù)降維得到擴散坐標,解決側(cè)掃聲吶圖像數(shù)據(jù)量大而導致目標探測效率低的缺陷;將擴散距離作為擴散坐標的度量標準,在含異常的側(cè)掃聲吶圖像中計算擴散距離,目標和背景、背景內(nèi)部間的擴散距離差別很大,據(jù)此可以進行目標探測。
2:基于擴散映射的側(cè)掃聲吶目標探測方法
根據(jù)上述基本原理,可知基于擴散映射的目標探測存在如下幾個問題:
(1)參數(shù)取值
式(1)中尺度參數(shù)δ的取值對權(quán)矩陣的影響很大,如果尺度參數(shù)δ很小,會導致很多點僅與自己連接;反之,尺度參數(shù)δ太大,全部數(shù)據(jù)可能都被連接。這對側(cè)掃聲吶圖像目標探測不利,比如尺度參數(shù)δ過大時,目標和背景區(qū)域被連接在一起,導致目標探測失敗??刹捎镁植砍叨葏?shù)δ的自適應(yīng)確定方法:
w(xi,xj)=exp(-||xi-xj||2/δiδj)式(8)
δi,δj為xi,xj的局部尺度參數(shù),距離為歐幾里得距離,δi可以根據(jù)xi的k-鄰域統(tǒng)計得到:
δi=||xi-xk||2式(9)
基于局部尺度參數(shù)δi,δj構(gòu)建權(quán)重矩陣,可以有效的區(qū)分出數(shù)據(jù)點之間的密度關(guān)系。
(2)計算效率
擴散映射雖然實現(xiàn)圖像數(shù)據(jù)降維,由于側(cè)掃聲吶圖像數(shù)據(jù)量巨大,在進行擴散映射、擴散坐標計算時,效率仍然非常低??刹捎秒S機采樣進行擴散映射計算,然后擴展至原圖。
(3)數(shù)據(jù)擴展方法
問題(2)引入數(shù)據(jù)擴展的問題。其數(shù)學描述如下,假設(shè)г,г'為rn空間的一組尺度可比較的數(shù)據(jù)集合且г∈г',ψ為г經(jīng)過擴散映射后的低維數(shù)據(jù),數(shù)據(jù)擴展就是尋找一組新的ψ'使其對應(yīng)于數(shù)據(jù)г'。目前常用的方法為nystrom擴展方法,它通過局部數(shù)據(jù)的特征向量推導出整個數(shù)據(jù)集的特征向量的近似值,進而完成數(shù)據(jù)擴展。
(4)探測精度
隨機采樣造成目標探測可能失敗,據(jù)此可構(gòu)建高斯金字塔圖像,在多層sss圖像中實施目標探測,且在低尺度目標探測完成后,可將可疑位置的像素繼續(xù)作為下一尺度的采樣點,保證目標探測的可靠性;側(cè)掃聲吶受其機理限制,sss圖像目標常存在陰影,陰影和背景、陰影和目標及背景內(nèi)部區(qū)域間的擴散距離也很大,導致目標探測失敗。據(jù)此可考慮將目標陰影簡單提取出來并記錄其位置,隨機采樣時不考慮陰影位置,提高目標探測精度。
基于上述缺陷及改正方法,本發(fā)明提出了一種基于擴散映射的側(cè)掃聲吶圖像目標非監(jiān)督探測方法(流程如圖1所示),具體實施步驟如下:
第一步:計算sss圖像的灰度直方圖,統(tǒng)計得到其第一個波峰的灰度g,將sss圖像中灰度小于g的像素的位置標記為陰影區(qū)域,并記錄陰影的位置;
第二步:構(gòu)建高斯金字塔圖像(gl)ll=0,其中g(shù)0為原始圖像,l為高斯圖像層數(shù),0≤l≤l。隨機采樣時,可在低尺度的金字塔圖像采用較高的采樣率(甚至為全部數(shù)據(jù)),而在高尺度的金字塔圖像采用較低的采樣率(采樣時忽略陰影位置)。例如l=3,則l=0時為最高尺度的圖像,可在g0采樣率低些(諸如30%采樣率);l=3時為最低尺度的圖像,g3采用全部圖像數(shù)據(jù)(采樣率100%)。
第三步:對采樣數(shù)據(jù)進行擴散映射計算,得到采樣數(shù)據(jù)的擴散坐標及其特征向量。計算權(quán)矩陣時,式(1)中尺度參數(shù)δ根據(jù)公式(9)確定。
第四步:應(yīng)用第三步的特征向量根據(jù)前述數(shù)據(jù)擴展方法將采樣數(shù)據(jù)擴展至原始數(shù)據(jù),得到原始數(shù)據(jù)的擴散坐標y。
第五步:根據(jù)公式(7),計算擴散坐標y的擴散距離d。
第六步:根據(jù)擴散距離d在sss圖像的像素鄰域內(nèi)計算目標得分,目標得分的公式如下:
式(10)中,dposition為歐幾里得距離,d為擴散距離,σk為擴散距離d的k近鄰個值的方差,k取8時,表示取前8組擴散距離。根據(jù)目標得分c給定一個閾值τl,可實現(xiàn)目標探測。當l>0時,τl可取目標得分95%的置信區(qū)間;當l=0時,可取一硬閾值τ(目標區(qū)域的c接近于1)對探測結(jié)果進行平滑處理。
第七步:當l<l時,對每層sss圖像重復第二步-第六步;當l=0時,輸出目標探測結(jié)果。
3:試驗及分析
為驗證本發(fā)明方法的有效性,采用含陰影的單一目標的側(cè)掃聲吶圖像進行目標探測試驗,原始側(cè)掃聲吶圖像如圖2(a)所示。首先對圖2(a)進行擴散映射計算(當sss圖像大小為96×96時,式(1)中擴散距離需計算一個9216×9216的矩陣,計算效率很低),得到其擴散坐標,為了顯示擴散坐標展現(xiàn)的原始sss圖像的像素與其周圍像素的關(guān)系,提取擴散坐標前三維數(shù)據(jù)進行成圖顯示,其中對應(yīng)sss圖像像素的三維坐標圖像如圖2(b)所示,sss圖像中的顏色僅為了對比顯示,并無其它實際意義。但通過分析兩幅sss圖像,可以看出sss圖像中的異常(目標、陰影區(qū)域)的擴散坐標與其鄰域像素存在一定的差異;擴散映射前三維坐標如圖3所示,也可看出坐標存在離散程度的不同。因此可基于擴散映射下擴散坐標的離散程度進行側(cè)掃聲吶圖像中異常目標的探測。
采用本發(fā)明方法(先不考慮陰影),l取3,三層的采樣率設(shè)置為[0.4,0.6,1],公式(9)中k取7,公式(10)(10)中k取64進行目標探測試驗??紤]到目標區(qū)域的得分會很高,可以采用簡單的硬閾值(諸如當c(i,j)<0.3時將c賦值為0)及中值濾波對最終目標得分進行平滑處理。目標得分及其平滑后得分如圖4所示??梢钥闯鼋?jīng)平滑后的目標得分有效標注出目標的位置。
根據(jù)上述目標得分,進行聯(lián)通區(qū)域提取及目標輪廓連接,最終結(jié)果如圖5所示。可見在實現(xiàn)目標探測的同時將陰影也探測出來,影響后續(xù)的目標識別。
顧及陰影時計算目標得分及目標探測結(jié)果如圖6所示,此時提取目標輪廓的質(zhì)心進行顯示??梢钥闯鲱櫦瓣幱暗哪繕颂綔y方法雖然在計算目標得分時會出現(xiàn)陰影的部分輪廓,但通過連通區(qū)域提取及輪廓質(zhì)心提取后,可以有效將陰影舍棄,只實現(xiàn)了目標的探測。
上述實驗說明了本發(fā)明方法在探測含單一目標的sss圖像的可行性,下面采用含多目標物體的sss圖像進行試驗,統(tǒng)計原始圖像含11個目標物體。不顧及陰影和顧及陰影的多目標得分及探測結(jié)果分別如圖7和圖8所示,不顧及陰影時,探測出目標10個,且存在2個誤探測和3個遺漏探測;而顧及陰影時探測目標11個,不存在誤探測和漏探測。分析認為,側(cè)掃聲吶圖像的陰影與其鄰域擴散距離也很大,在進行目標得分計算時,陰影得分很高,而側(cè)掃聲吶圖像目標和陰影往往成對存在,當存在緊鄰的目標時,在進行聯(lián)通區(qū)域提取時多個目標及其陰影被當成一個目標,導致目標探測失敗。而顧及陰影位置時,由于不考慮陰影所在位置,盡管陰影輪廓區(qū)域目標得分很高,但其不連續(xù),后續(xù)聯(lián)通區(qū)域提取及目標探測時有效將其舍棄,僅得到目標探測結(jié)果。
sss圖像目標探測的難點之一為含有陰影的沙坡地形中目標的探測,因此采用含沙坡地形的sss圖像進行目標探測。采用本發(fā)明方法的目標得分及探測結(jié)果如圖9所示,可見本發(fā)明方法有效的實現(xiàn)了含不同沙坡紋理特征的sss圖像中的目標探測。
對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。
此外,應(yīng)當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當將說明書作為一個整體,各實施例中的技術(shù)方案也可以經(jīng)適當組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。