一種基于概念格的異構(gòu)空間信息服務(wù)分類的語(yǔ)義匹配方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于空間信息服務(wù)語(yǔ)義技術(shù)領(lǐng)域,特別的,涉及了一種新型的異構(gòu)空間信 息服務(wù)分類的語(yǔ)義匹配方法。
【背景技術(shù)】
[0002] 隨著語(yǔ)義網(wǎng)技術(shù)的發(fā)展,大量空間信息資源和空間數(shù)據(jù)處理功能都以服務(wù)的形式 提供給用戶。面對(duì)數(shù)量如此龐大的互聯(lián)網(wǎng)信息資源,用戶如何快速發(fā)現(xiàn)自己所需要的空間 信息服務(wù),是空間信息服務(wù)領(lǐng)域亟待解決的問(wèn)題??臻g信息服務(wù)分類的語(yǔ)義匹配則是解決 這一問(wèn)題的首當(dāng)其出、至關(guān)重要的一步。
[0003] 圍繞這一問(wèn)題,國(guó)內(nèi)學(xué)者開(kāi)展了相關(guān)研宄,并已經(jīng)取得了一定的進(jìn)展。從服務(wù)的角 度提出功能的分類,可以追溯到TsouMing-HsIang提出的面向任務(wù)的分布式地理信息服務(wù) 組件分類方式,它將GIS任務(wù)分為六大類。為了將服務(wù)分類與用戶需求的匹配聯(lián)系起來(lái),張 霞首次將用戶分類和服務(wù)分類聯(lián)系起來(lái)。詹勤通過(guò)分析遙感信息服務(wù)的領(lǐng)域特征及其概念 的時(shí)間名詞特點(diǎn),結(jié)合框架語(yǔ)義學(xué)理論,提出了基于事件框架提取遙感信息服務(wù)概念的語(yǔ) 義特征,并在此基礎(chǔ)上利用形式概念分析構(gòu)建遙感信息服務(wù)分類本體。
[0004] 目前空間信息服務(wù)分類匹配,大多數(shù)是要求請(qǐng)求服務(wù)具有統(tǒng)一的規(guī)范服務(wù)分類語(yǔ) 義描述,并且要求服務(wù)發(fā)布者和請(qǐng)求者在對(duì)服務(wù)分類進(jìn)行描述時(shí)都必須采用同一種空間信 息服務(wù)分類體系,同時(shí)還要建立在他們對(duì)服務(wù)的分類認(rèn)識(shí)完全相同的條件下,這樣描述的 服務(wù)分類才能進(jìn)行有效的語(yǔ)義匹配。這些都是一種假設(shè),這種假設(shè)在現(xiàn)實(shí)中是無(wú)法滿足的, 其原因如下:其一,服務(wù)請(qǐng)求者并不一定都是行業(yè)用戶,隨著空間信息服務(wù)的越來(lái)越普及, 普通老百姓已經(jīng)開(kāi)始成為空間信息服務(wù)的對(duì)象,而他們對(duì)空間信息服務(wù)的分類一無(wú)所知, 就不可能在請(qǐng)求服務(wù)時(shí)對(duì)服務(wù)的類型進(jìn)行有效地描述;其二,空間信息服務(wù)的分類體系多 種多樣,為了促進(jìn)了空間信息服務(wù)進(jìn)一步共享和互操作,各種標(biāo)準(zhǔn)化組織,如國(guó)際標(biāo)準(zhǔn)化組 織(ISO)、開(kāi)放地理空間信息聯(lián)盟(OpenGeospatialConsortium,0GC)和其他標(biāo)準(zhǔn)化組織, 都針對(duì)空間信息服務(wù)的應(yīng)用和實(shí)現(xiàn),提出了相關(guān)的空間信息服務(wù)分類規(guī)范。這些空間信息 服務(wù)分類體系各有優(yōu)缺點(diǎn),并且現(xiàn)階段也還不存在一種被行業(yè)人士完全認(rèn)可并適合服務(wù)發(fā) 現(xiàn)匹配和互操作的空間信息服務(wù)分類體系。
[0005] 因此,可以說(shuō)現(xiàn)階段空間信息服務(wù)分類的語(yǔ)義匹配,受到服務(wù)分類所采用分類體 系的限制,只能對(duì)采用相同分類體系的空間信息服務(wù)進(jìn)行語(yǔ)義匹配,無(wú)法實(shí)現(xiàn)不同分類體 系的異構(gòu)空間信息服務(wù)分類匹配。從而使得各個(gè)組織或研宄機(jī)構(gòu)在利用互聯(lián)網(wǎng)上的空間信 息服務(wù)時(shí),不能直接利用互聯(lián)網(wǎng)上已有的語(yǔ)義描述空間信息服務(wù),需要使用自己的服務(wù)分 類標(biāo)準(zhǔn)/體系對(duì)服務(wù)信息重新進(jìn)行語(yǔ)義描述,并將其注冊(cè)到自己構(gòu)建的空間信息服務(wù)注冊(cè) 中心。
【發(fā)明內(nèi)容】
[0006] 針對(duì)上述問(wèn)題,本發(fā)明將語(yǔ)義異構(gòu)互操作中的概念格引入到空間信息服務(wù)領(lǐng)域, 提出了一種基于概念格的異構(gòu)空間信息服務(wù)分類語(yǔ)義融合與匹配方法,利用構(gòu)造服務(wù)概念 格的方式來(lái)計(jì)算服務(wù)之間的語(yǔ)義相似度,有效解決采用不同分類體系描述的請(qǐng)求空間信息 服務(wù)和廣告服務(wù)來(lái)之間的語(yǔ)義匹配,并通過(guò)注冊(cè)中心目錄服務(wù)的語(yǔ)義層次關(guān)系來(lái)提高最優(yōu) 服務(wù)遍歷和選擇效率。
[0007] 為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:
[0008] 一種基于概念格的異構(gòu)空間信息服務(wù)分類的語(yǔ)義匹配方法,包括如下步驟:
[0009] 步驟一、從空間信息服務(wù)的描述原始信息中,提取空間信息服務(wù)的分類相關(guān)信 息;
[0010] 步驟二、根據(jù)步驟一中提取的空間信息服務(wù)的分類信息,追蹤到其采用的服務(wù)分 類體系,并從中提取與該服務(wù)相關(guān)的語(yǔ)義因子;
[0011] 步驟三、根據(jù)提取的語(yǔ)義因子與空間信息服務(wù)的語(yǔ)義關(guān)聯(lián)關(guān)系,建立空間信息服 務(wù)分類模型;
[0012] 步驟四、從空間信息服務(wù)的描述信息和所對(duì)應(yīng)分類體系的描述信息中,提取與服 務(wù)類型相關(guān)的特征屬性,形成與服務(wù)類型相關(guān)的特征屬性集;
[0013] 步驟五、將步驟三的空間信息服務(wù)分類模型與步驟四的服務(wù)類型相關(guān)的特征屬性 集分別作為概念格的內(nèi)涵和外延,構(gòu)建空間信息服務(wù)分類的概念格,形成相應(yīng)的服務(wù)概念 格S= (U,D),S表示服務(wù)概念格,U表示服務(wù)的內(nèi)涵,D則表示服務(wù)的外延;
[0014] 步驟六、對(duì)概念格的內(nèi)涵部分與指定分類體系中的各個(gè)類型概念格的內(nèi)涵部分進(jìn) 行融合匹配,根據(jù)從服務(wù)分類體系中獲取的服務(wù)分類模型的原子屬性,構(gòu)建服務(wù)語(yǔ)義因子 的形式化背景矩陣,形成空間信息服務(wù)語(yǔ)義信息的形式化知識(shí)表達(dá);
[0015] 步驟七、根據(jù)所述形式化概念背景矩陣,通過(guò)將有效的服務(wù)語(yǔ)義因子進(jìn)行重新排 列和組合,并排除一些不可能作為服務(wù)模型的節(jié)點(diǎn),融合并生成新的服務(wù)語(yǔ)義模型;
[0016] 步驟八、根據(jù)步驟七融合生成的服務(wù)語(yǔ)義模型之間的語(yǔ)義因子關(guān)系,構(gòu)建服務(wù)模 型的語(yǔ)義距離樹(shù);
[0017] 步驟九.分別計(jì)算語(yǔ)義距離樹(shù)相似度及特征屬性集的集合相似度,通過(guò)統(tǒng)一的服 務(wù)概念格計(jì)算方法,計(jì)算得到服務(wù)概念格之間的相似度,最終實(shí)現(xiàn)異構(gòu)空間信息服務(wù)分類 的語(yǔ)義匹配。
[0018] 優(yōu)選地,在步驟一中,所述分類相關(guān)信息為服務(wù)分類類別、分類體系的名稱和分類 體系URL地址。
[0019] 優(yōu)選地,在步驟二中,提取語(yǔ)義因子的方法為:
[0020] 若兩個(gè)原子服務(wù)概念之間是無(wú)交集關(guān)系,則二者同時(shí)成為服務(wù)概念語(yǔ)義因子;
[0021] 若兩個(gè)原子服務(wù)概念之間是包含關(guān)系,則子概念直接成為服務(wù)概念語(yǔ)義因子,同 時(shí)創(chuàng)建一個(gè)新的服務(wù)概念語(yǔ)義因子,其范圍為子概念相對(duì)于父概念的補(bǔ)集;
[0022] 若兩個(gè)原子服務(wù)概念之間是等價(jià)關(guān)系,則將二者融合為一個(gè)服務(wù)概念語(yǔ)義因子;
[0023] 若兩個(gè)原子服務(wù)概念之間是交叉關(guān)系,則可以分為三個(gè)服務(wù)概念語(yǔ)義因子,一個(gè) 為兩個(gè)服務(wù)概念之間的交集,另外兩個(gè)為兩個(gè)原子服務(wù)概念的相互補(bǔ)集。
[0024] 優(yōu)選地,在步驟三中,所述服務(wù)分類模型能夠以樹(shù)狀的形狀表型出來(lái),其根節(jié)點(diǎn)的 類別是一個(gè)涵蓋待分類的所有服務(wù)的總分類類型,葉子節(jié)點(diǎn)則是分類體系中不可再分的原 子分類,其它節(jié)點(diǎn)是根據(jù)某種分類標(biāo)準(zhǔn)對(duì)根節(jié)點(diǎn)細(xì)分類型。
[0025] 優(yōu)選地,在步驟四中,所述與服務(wù)類型相關(guān)的特征屬性包括:
[0026] 功能分類信息相關(guān)的服務(wù)概念屬性:指的是能夠代表服務(wù)功能特征的屬性信息;
[0027] 依賴于IO參數(shù)類型的屬性,指的是以空間數(shù)據(jù)為核心來(lái)定義描述服務(wù)模型所需 要的IO相關(guān)屬性,包括數(shù)據(jù)、空間、時(shí)間、幾何、屬性、單位和數(shù)據(jù)質(zhì)量;
[0028] 與IO參數(shù)類型相關(guān)的屬性,指的是描述空間數(shù)據(jù)的輔助性概念,包括角度、文本、 單位和查詢方式。
[0029] 優(yōu)選地,在步驟八中,建立語(yǔ)義距離樹(shù)的方法為:首先將語(yǔ)義因子獨(dú)立出來(lái),然后 根據(jù)每個(gè)空間信息服務(wù)包含語(yǔ)義因子的情況進(jìn)行逐聚類,如果兩個(gè)服務(wù)的語(yǔ)義因子具有共 同的部分,則將共同的部分作為一個(gè)語(yǔ)義距離