本發(fā)明涉及人工智能、地理空間場景、相似性度量等方面,屬地理信息科學(xué)領(lǐng)域。
背景技術(shù):
在某些研究領(lǐng)域如地理信息系統(tǒng)(GIS)、圖像檢索或時空數(shù)據(jù)庫中,一組較重要的空間關(guān)系為拓?fù)潢P(guān)系。拓?fù)潢P(guān)系描述了空間場景的本質(zhì),并保持了平移、縮放和旋轉(zhuǎn)不變性。當(dāng)前區(qū)對象的拓?fù)潢P(guān)系模型主要分為兩類,(1)針對簡單區(qū):基于演算方法,點(diǎn)集拓?fù)洌?-交模型、衍生的9-交模型及區(qū)域連接演算(RCC-8)等;(2)針對復(fù)雜區(qū):如RCC-8組合表,4交模型的擴(kuò)展,組合區(qū)的拓?fù)潢P(guān)系模型(TRCR),基于演算方法的派生(CBM)及帶洞區(qū)域模型等。這些方法精確地描述了對象組合里兩個對象實體間的相互關(guān)系,并充分記錄了空間場景中的二元拓?fù)潢P(guān)系。然而當(dāng)發(fā)生復(fù)雜的邊界交互時,在純粹的拓?fù)浠A(chǔ)上,上述方法難以辨識拓?fù)涞葍r性。
技術(shù)實現(xiàn)要素:
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于邊界交互的區(qū)組合拓?fù)湎嗨菩远攘糠椒ā?/p>
為實現(xiàn)以上發(fā)明目的,本發(fā)明提供以下技術(shù)方案:
基于邊界交互的區(qū)組合拓?fù)湎嗨菩远攘糠椒?其不同在于:其包括以下步驟:在區(qū)邊界交互的拓?fù)潢P(guān)系基礎(chǔ)上,通過分析復(fù)雜實體間的拓?fù)潢P(guān)系得到它們的邊界交互記錄,并將交互記錄轉(zhuǎn)換成為二進(jìn)制序列,從而實現(xiàn)將相似性評估轉(zhuǎn)換為序列校準(zhǔn)過程,在校準(zhǔn)過程中分成初始匹配和精確匹配兩個部分;使用CR和CP分別代表參照區(qū)組合和候選區(qū)組合,設(shè)參照區(qū)組合CR和候選區(qū)組合CP間的維數(shù)序列及細(xì)節(jié)序列相似度分別為simdim(CR,CP)和Simdet(CR,CP),維數(shù)序列和細(xì)節(jié)序列相似度的權(quán)重分別為γ和ε,則參照區(qū)組合CR和候選區(qū)組合CP的拓?fù)湎嗨贫葹镾imtop(CR,CP)=γ×Simdim(CR,CP)+ε×Simdet(CR,CP)。
進(jìn)一步的,在初始匹配步驟中,對區(qū)組合間的O標(biāo)記式進(jìn)行評估,以確認(rèn)是否需要執(zhí)行準(zhǔn)確匹配步驟,若在該步驟中發(fā)現(xiàn)兩個區(qū)組合極不相似,則不需執(zhí)行準(zhǔn)確匹配步驟;
參照區(qū)組合CR和候選區(qū)組合CP中的區(qū)對象表示為RRi和RRj,以此進(jìn)行說明;先使用初始匹配步驟來搜索與CR相似的區(qū)組合;在兩個相似的區(qū)組合間,相互匹配的區(qū)應(yīng)具有相似的邊界交互,其中一個因素是邊界交集數(shù)量;一個區(qū)邊界與其它區(qū)邊界間會存在若干交集;
對比每兩個O標(biāo)記式間的交集數(shù)量對區(qū)對象進(jìn)行評估,在此過程中,某個區(qū)在其他O標(biāo)記式中出現(xiàn)的總次數(shù)稱為標(biāo)記頻率,并用來識別可能相似的區(qū),包含了節(jié)點(diǎn)和邊的關(guān)聯(lián)圖被用于描述區(qū)組合間的對應(yīng)關(guān)系;如果兩個O標(biāo)記式間具有同樣數(shù)量的邊界交集,則對應(yīng)的區(qū)存在相似的可能性,從而可進(jìn)行后繼的對比工作;使用集合InterR和InterP來記錄組合CR和CP中O標(biāo)記式的交集數(shù)量,并對每個集合中的交集值進(jìn)行從低到高的排序,從而實現(xiàn)對InterR和InterP的對比;假設(shè)存在m對具有相等交集數(shù)量的O標(biāo)記式,使用式計算基于交集數(shù)量的初始相似度;
假設(shè)CR和CP間存在p對相等的標(biāo)記頻率,則組合CR和CP在標(biāo)記頻率下的相似度為
在初始匹配階段對區(qū)組合CR和CP的相似度評估稱為初始相似度;假設(shè)交集數(shù)量準(zhǔn)則和標(biāo)記頻率準(zhǔn)則的權(quán)重分別為α和β,那么CR和CP的初始相似度為:Simpre(CR,CP)=αSiminter(CR,CP)+βSimfre(CR,CP);
所述區(qū)組合間的O標(biāo)記式具體如下描述,,其中符號Acomp代表了區(qū)域A的邊界,s是當(dāng)前邊界在A外的區(qū)的集合,并使用符號O進(jìn)行表示,維數(shù)dimension描述了交集的定性長度(0或1),T是與A有相接交集的區(qū)集合,而C代表的是與A有相交交集的區(qū)集合。
進(jìn)一步的,在精確匹配步驟中,對從初始匹配中得到的粗糙評估執(zhí)行精確度量,詳細(xì)對比從初始匹配步驟中得到的每對匹配區(qū)的O標(biāo)記式;在這個步驟中,將O標(biāo)記式分解為兩個部分:1)維數(shù)序列,包含了每個交集中的維度;2)細(xì)節(jié)序列,描述O標(biāo)記式中的細(xì)節(jié);采用生物信息學(xué)范疇中的序列校準(zhǔn)方法對兩個序列進(jìn)行度量分析;序列校準(zhǔn)是生物信息學(xué)中用來處理DNA、RNA或蛋白質(zhì)序列的方法,以識別出序列中功能、結(jié)構(gòu)或進(jìn)化的信息;
O標(biāo)記式記錄了交集維數(shù)、與當(dāng)前區(qū)具有相交或相接交集的區(qū),將O標(biāo)記式中的項Os,T和C進(jìn)行二進(jìn)制編碼,所得結(jié)果稱為細(xì)節(jié)序列,分別記錄著邊界在當(dāng)前區(qū)外部的區(qū),與當(dāng)前區(qū)相接及相交的區(qū);假設(shè)組合CR和CP有m對匹配區(qū),則其細(xì)節(jié)序列的相似度為其中tm表示組合CR和CP的序列校準(zhǔn)中存在tm對相互對準(zhǔn)的元素,又因為每對匹配區(qū)交集中有三個項,所以每對匹配區(qū)的相似度為(tm/3nm)。
對比現(xiàn)有技術(shù),本發(fā)明具有以下有益特點(diǎn):
1)、對于復(fù)合空間對象,初始匹配和精確匹配法能夠較好的區(qū)分復(fù)合空間對象之間的拓?fù)潢P(guān)系及其相似性的差異。
2)、基于空間拓?fù)潢P(guān)系相似性的空間場景匹配方法能夠較好的處理存?zhèn)€多個可能匹配的目標(biāo)場景的情況,并對不同的匹配結(jié)果進(jìn)行量化的表示,更加直觀地為用戶提供多種可能的結(jié)果。
3)、該算法簡便容易操作,不僅易于對復(fù)雜空間場景的拓?fù)潢P(guān)系進(jìn)行定性描述,也可方便進(jìn)行定量計算。
附圖說明
圖1是本發(fā)明實施例目標(biāo)1的場景圖和其手繪草圖;
圖2是本發(fā)明實施例目標(biāo)2的場景圖和其手繪草圖;
圖3是本發(fā)明實施例目標(biāo)3的場景圖和其手繪草圖;
圖4是本發(fā)明實施例目標(biāo)4的場景圖和其手繪草圖;
圖5是本發(fā)明實施例目標(biāo)5的場景圖和其手繪草圖;
圖6是本發(fā)明實施例目標(biāo)6的場景圖和其手繪草圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,下面結(jié)合附圖和具體實施例對本發(fā)明作進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
在區(qū)邊界交互的拓?fù)潢P(guān)系基礎(chǔ)上,針對復(fù)雜的拓?fù)潢P(guān)系采用基于邊界交互的區(qū)組合拓?fù)湎嗨菩远攘磕P?,該模型通過分析復(fù)雜實體間的拓?fù)潢P(guān)系得到它們的邊界交互記錄,并將交互記錄轉(zhuǎn)換成為二進(jìn)制序列,從而實現(xiàn)將相似性評估轉(zhuǎn)換為序列校準(zhǔn)過程,在校準(zhǔn)過程中分成初始匹配和精確匹配兩個部分,以提高相似性評估的效率;
若兩條線段交互于一點(diǎn),將其稱為0-維交集,若線段交互于一段弧線,將其稱為1-維交集;線段交集的主要類型為相交和相接,因此兩條線段間存在4種可能的交集類型:0-維相接、0-維相交、1-維相接和1-維相交;在這4種交集類型及韋恩圖基礎(chǔ)上,使用O標(biāo)記法進(jìn)行描述,其中符號Acomp代表了區(qū)域A的邊界,s是當(dāng)前邊界在A外的區(qū)的集合,并使用符號O進(jìn)行表示,維數(shù)dimension描述了交集的定性長度(0或1),T是與A有相接交集的區(qū)集合,而C代表的是與A有相交交集的區(qū)集合。
基于邊界交互的區(qū)組合拓?fù)湎嗨菩远攘糠椒?其特征在于:在初始匹配步驟中,對區(qū)組合間的O標(biāo)記式進(jìn)行評估,以確認(rèn)是否需要執(zhí)行準(zhǔn)確匹配步驟,若在該步驟中發(fā)現(xiàn)兩個區(qū)組合極不相似,則不需執(zhí)行準(zhǔn)確匹配步驟;
使用CR和CP分別代表參照區(qū)組合和候選區(qū)組合,CR和CP中的區(qū)對象表示為RRi和RRj,以此進(jìn)行說明;先使用初始匹配步驟來搜索與CR相似的區(qū)組合;在兩個相似的區(qū)組合間,相互匹配的區(qū)應(yīng)具有相似的邊界交互,其中一個因素是邊界交集數(shù)量。一個區(qū)邊界與其它區(qū)邊界間會存在若干交集;同時,由于空間對象的任意幾何形狀及隨機(jī)分布屬性,不同的區(qū)有不同的邊界交集;基于這個客觀事實,可通過對比每兩個O標(biāo)記式間的交集數(shù)量對區(qū)對象進(jìn)行評估。在此過程中,某個區(qū)在其他O標(biāo)記式中出現(xiàn)的總次數(shù)稱為標(biāo)記頻率,并用來識別可能相似的區(qū),包含了節(jié)點(diǎn)和邊的關(guān)聯(lián)圖被用于描述區(qū)組合間的對應(yīng)關(guān)系。如果兩個O標(biāo)記式間具有同樣數(shù)量的邊界交集,則對應(yīng)的區(qū)存在相似的可能性,從而可進(jìn)行后繼的對比工作。使用集合InterR和InterP來記錄組合CR和CP中O標(biāo)記式的交集數(shù)量,并對每個集合中的交集值進(jìn)行從低到高的排序,從而實現(xiàn)對InterR和TnterP的對比。假設(shè)存在m對具有相等交集數(shù)量的O標(biāo)記式,使用式可計算基于交集數(shù)量的初始相似度;
假設(shè)CR和CP間存在p對相等的標(biāo)記頻率,則組合CR和CP在標(biāo)記頻率下的相似度為
在初始匹配階段對區(qū)組合CR和CP的相似度評估稱為初始相似度。初始相似度粗略描述了CR和CP的對應(yīng)情況,并提供了是否需要進(jìn)行精確匹配的理由。假設(shè)交集數(shù)量準(zhǔn)則和標(biāo)記頻率準(zhǔn)則的權(quán)重分別為α和β,那么CR和CP的初始相似度為:Simpre(CR,CP)=αSiminter(CR,CP)+βSimfre(CR,CP)。
在精確匹配步驟中,對從初始匹配中得到的粗糙評估執(zhí)行精確度量,詳細(xì)對比從初始匹配步驟中得到的每對匹配區(qū)的O標(biāo)記式。在這個步驟中,將O標(biāo)記式分解為兩個部分:1)維數(shù)序列,包含了每個交集中的維度;2)細(xì)節(jié)序列,描述O標(biāo)記式中的細(xì)節(jié);采用生物信息學(xué)范疇中的序列校準(zhǔn)方法對兩個序列進(jìn)行度量分析;
序列校準(zhǔn)是生物信息學(xué)中用來處理DNA、RNA或蛋白質(zhì)序列的方法,以識別出序列中功能、結(jié)構(gòu)或進(jìn)化的信息;
邊界交集主要分為兩種類型-邊界交互于點(diǎn)或弧段,這兩種類型的維度分別為0和1;因此,O標(biāo)記式中的維數(shù)序列粗略描述了某個區(qū)邊界的總體交互情況,即維數(shù)序列校準(zhǔn)可以為區(qū)組合間的相似度提供一個準(zhǔn)確度量;假設(shè)n對維數(shù)元素中有q對可相互匹配,則區(qū)R1和R2的維數(shù)相似度為(q/n);假設(shè)區(qū)組合CR和CP間有m對相互匹配的區(qū),則CR和CP間的維數(shù)相似度為
作為邊界交互記錄的一部分,維數(shù)序列描述了區(qū)邊界交互的總體情況;為了對兩個區(qū)組合進(jìn)行精確度量,需要對O標(biāo)記式中的細(xì)節(jié)序列進(jìn)行對比;除了交集維數(shù),O標(biāo)記式記錄了與當(dāng)前區(qū)具有相交或相接交集的區(qū),由于每個區(qū)組合中區(qū)的標(biāo)記都不同,無法對O標(biāo)記式進(jìn)行直接對比;為了實現(xiàn)O標(biāo)記式的可比性,須將O標(biāo)記式中的項Os,T和C進(jìn)行二進(jìn)制編碼,所得結(jié)果稱為細(xì)節(jié)序列,分別記錄著邊界在當(dāng)前區(qū)外部的區(qū),與當(dāng)前區(qū)相接及相交的區(qū);假設(shè)組合CR和CP有m對匹配區(qū),則其細(xì)節(jié)序列的相似度為
拓?fù)湎嗨贫攘堪ㄒ韵虏襟E:維數(shù)序列和細(xì)節(jié)序列覆蓋了區(qū)邊界交互信息的各個方面,通過設(shè)置維數(shù)序列和細(xì)節(jié)序列相似度的權(quán)重可以計算出兩個區(qū)組合間的拓?fù)湎嗨贫?。設(shè)區(qū)組合CR和CP間的維數(shù)序列及細(xì)節(jié)序列相似度分別為Simdim(CR,CP)和Simdet(CR,CP),維數(shù)序列和細(xì)節(jié)序列相似度的權(quán)重分別為γ和ε,則CR和CP的拓?fù)湎嗨贫葹镾imtop(CR,CP)=γ×Simdim(CR,CP)+ε×Simdet(CR,CP)。
上述的算法可應(yīng)用到基于手繪草圖的空間場景的搜索中,為了保證真實場景的代表性和復(fù)雜性,目標(biāo)場景選擇了中國地質(zhì)大學(xué)(武漢)校園地圖,如圖1(1)所示。輸入手繪草圖如圖1(2)所示。通過空間場景匹配需要確認(rèn)輸入圖中的空間實體S1,S2,S3,S4,S5,S6與目標(biāo)場景中的空間實體的對應(yīng)關(guān)系。
運(yùn)用初始匹配和精確匹配算法,得到在S1對應(yīng)N1的前提下的所有匹配關(guān)系相似度排序如表1所示。
通過表1,可以發(fā)現(xiàn)當(dāng)S5對應(yīng)N2時,有最高的匹配度。在輸入圖中S5包含S1的一部分,在目標(biāo)場景中N2包含N1,這個匹配結(jié)果也符合人的直觀認(rèn)知。
同樣采用初始和精確匹配法可以對余下的目標(biāo)場景進(jìn)行分析,可以得到余下的目標(biāo)場景各自最高的相似度及其對應(yīng)的匹配情況:
(1)荷池:最高相似度491.67%,見表2;
(2)柳池:最高相似度441.89%,見表3;
(3)游泳池:最高相似度484.25%,見表4;
(4)翠池:最高相似度500%,見表5;
對所有結(jié)果進(jìn)行統(tǒng)計,得到最后排序的結(jié)果如表6所示。
通過觀察原始輸入圖和目標(biāo)場景發(fā)現(xiàn),在第一個目標(biāo)場景中只有一個空間實體與輸入圖中的空間實體拓?fù)潢P(guān)系相似,包含湖泊區(qū)域的N2;在第二個目標(biāo)場景中有兩個空間實體與輸入圖中的空間實體拓?fù)潢P(guān)系相似,包含湖泊區(qū)域的W8,與湖泊相接的W4;在第三個目標(biāo)場景中只有一個空間實體與輸入圖中的空間實體拓?fù)潢P(guān)系相似,包含湖泊區(qū)域的L2,而且它的基準(zhǔn)空間實體并不是分開的區(qū)域,只是一個簡單區(qū)域;在第四個目標(biāo)場景中只有一個空間實體與輸入圖中的空間實體拓?fù)潢P(guān)系相似,與湖泊區(qū)域相接的P2;在第五個目標(biāo)場景中有多個空間實體與輸入圖中的空間實體拓?fù)潢P(guān)系一致,覆蓋湖泊區(qū)域的C2,C7,與湖泊區(qū)域相接的C6。而從表6中可以看出,這五個目標(biāo)場景相似度的大小排序是:第五個(翠池)、第二個(荷池)、第一個(北區(qū)湖泊)、第四個(游泳池)、第三個(柳池)。這個排序結(jié)果正好符合原始輸入圖和目標(biāo)場景中相似性的排序結(jié)果。
通過本次實驗,可以總結(jié)如下結(jié)論:
1)、對于復(fù)合空間對象,初始匹配和精確匹配法能夠較好的區(qū)分復(fù)合空間對象之間的拓?fù)潢P(guān)系及其相似性的差異。
2)、基于空間拓?fù)潢P(guān)系相似性的空間場景匹配方法能夠較好的處理存?zhèn)€多個可能匹配的目標(biāo)場景的情況,并對不同的匹配結(jié)果進(jìn)行量化的表示,更加直觀地為用戶提供多種可能的結(jié)果。
3)、在空間場景匹配方法中,并不允許多個空間實體對應(yīng)同一個空間實體,但在實際的空間場景匹配問題中,用戶繪制草圖時可能把空間數(shù)據(jù)庫中的一個空間實體繪制成多個空間實體,這也就導(dǎo)致了多個空間實體需要對應(yīng)同一個空間實體,即多尺度空間場景匹配。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。