本發(fā)明涉及計算機應用中的數據挖掘和信息可視化領域,具體來說涉及一種面向本體的時空信息挖掘及可視化展示方法。
背景技術:
:本體(Ontology)是對客觀世界概念化和結構化的明確描述,揭示知識本身含義和知識之間的聯系,以還原世界本來面目。本體研究特定領域知識的對象分類、對象屬性和對象間的關系,其最著名的定義是由Gruber提出的“本體是概念模型的明確的規(guī)范說明”。本體通常被看作是一個領域的知識基礎,它使得應用程序可以方便地獲取,并促進領域知識的共享。目前,本體已廣泛應用于語義web、智能信息檢索、信息集成、問答系統(tǒng)等領域。隨著本體研究的發(fā)展,可視化成為反映本體的直觀而簡潔的方式,本體的特點使得它易于用可視化的方法來描述,本體可視化能夠從圖示中清晰地看到概念的層次結構、屬性關系、實例等內容,并可以直觀、簡便地進行正確性檢查。本體可視化的工具主要分兩種,一種是基于Protégé的可視化插件;另一種是獨立于本體領域的通用可視化工具。第一種方便快捷,如TGViz、Jambalaya、OntoViz等,第二種易于擴展,如Piccolo、Processing、TheVisualizationToolkit(VTK)、JUNG等。時間和空間是人類永恒的話題,任何事物都與時間和空間密切相關,時空問題普遍存在于各領域中。對本體的時空信息挖掘及可視化呈現對于解決不同領域之間的信息交互、信息集成、資源共享、資源重用等問題有著重要的意義,從而更好地服務于語義web、智能信息檢索、信息集成、智能問答系統(tǒng)等應用。然而,當前本體的可視化僅從本體的組織體系和內容定義層面進行展示,尚未對本體隱含的深層信息,尤其是時空信息,進行分析及顯示。有鑒于此,特提出本發(fā)明。技術實現要素:針對上述現有技術存在的不足,本發(fā)明提供一種面向本體的時空信息挖掘及可視化展示方法,以解決如何實現對本體隱含的時空信息進行挖掘并給予可視化呈現的技術問題。為了實現上述目的,提供以下技術方案:一種面向本體的時空信息挖掘及可視化展示方法,該方法包括:對本體的概念進行分類;將分類后的本體中的概念在時空特征上進行關聯;針對分類后的概念,以圖層的形式對本體進行時空可視化展示。優(yōu)選地,對本體的概念進行分類具體包括:將本體的概念分為人物概念、事件概念和其他概念。優(yōu)選地,將分類后的本體中的概念在時空特征上進行關聯,具體包括:分別對分類后的本體進行時間信息挖掘和空間信息挖掘,將分類后的本體中的概念在時空特征上進行關聯。優(yōu)選地,對分類后的本體進行時間信息挖掘的步驟具體包括:建立分類后的本體的時間同義詞集合,將本體中的非規(guī)范時間描述信息關聯起來;針對分類后的本體,抽取出同一時間范圍內的概念。優(yōu)選地,針對分類后的本體,抽取出同一時間范圍內的概念,具體包括:對于每一時間同義詞集合,根據所有概念的屬性值,按照時間度量,抽取出同一時間范圍內的概念。優(yōu)選地,對分類后的本體進行空間信息挖掘的步驟具體包括:建立分類后的本體的空間同義詞集合,將本體中的非規(guī)范空間描述信息關聯起來;針對分類后的本體,抽取出同一空間范圍內的概念。優(yōu)選地,針對分類后的本體,抽取出同一空間范圍內的概念,具體包括:對每一空間同義詞集合,根據所有概念的屬性值,按照空間度量,抽取出同一空間范圍內的概念。優(yōu)選地,針對分類后的概念,以圖層的形式對本體進行時空可視化展示,具體包括:基于二維GIS地理信息系統(tǒng),針對分類后的概念,建立可視化界面;以圖層表示分類后的概念,并用圖標進行區(qū)別;在可視化界面上,以橫向滑動的形式顯示時間信息;在可視化界面上,以不同填充顏色的形式顯示空間信息。優(yōu)選地,方法還包括:當定位到可視化界面上任一概念時,以文本形式顯示概念的屬性、關系及公理信息。本發(fā)明實施例提供一種面向本體的時空信息挖掘及可視化展示方法。其中,該方法包括對本體的概念進行分類;將分類后的本體中的概念在時空特征上進行關聯;針對分類后的所述概念,以圖層的形式對本體進行時空可視化展示。本發(fā)明實施例通過將本體中的概念在時空特征上關聯起來,并且以概念圖層的形式實現信息可視化展示。由此,解決了如何實現對本體隱含的時空信息進行挖掘并給予可視化呈現的技術問題。通過對本體隱含的時空信息進行抽取、關聯和可視化呈現,具有語義深度,能夠實現對本體深層信息的挖掘與描述。附圖說明圖1是根據本發(fā)明實施例的面向本體的時空信息挖掘及可視化展示方法的流程示意圖;圖2是根據本發(fā)明實施例的本體為“絲綢之路著名史實”的組織示意圖;圖3是根據本發(fā)明實施例的示例本體的時空信息可視化展示示意圖。具體實施方式下面參照附圖來描述本發(fā)明的優(yōu)選實施方式。本領域技術人員應當理解的是,這些實施方式僅僅用于解釋本發(fā)明的技術原理,并非旨在限制本發(fā)明的保護范圍。在實際應用中,為了解決了如何實現對本體隱含的時空信息進行挖掘并給予可視化呈現的技術問題,本發(fā)明實施例提供一種面向本體的時空信息挖掘及可視化展示方法。如圖1所示,該方法可以包括:S100:對本體的概念進行分類。其中,本體的概念包括但不限于層級概念集和概念屬性。其中,概念屬性可以用屬性名和屬性值構成的二元組{屬性名:屬性值}來表示。具體地,步驟S100對本體定義的概念進行二次分類,以重新進行組織。將本體概念可以分為但不限于人物概念、事件概念和其他概念。其中,其他概念可以為文物概念。圖2示例性地示出了本體為“絲綢之路著名史實”的組織示意圖。如圖2所示,將該本體定義的概念分為著名人物、著名事件以及著名文物三大類。其中,著名人物包括“張騫”、“玄奘”、“鄭和”等概念;著名事件包括“張騫出使西域”、“玄奘西天取經”、“鄭和下西洋”等概念;著名文物包括“三彩釉陶載樂駱駝”、“越窯青瓷摩羯紋虎枕”、“胡人備馬圖壁畫”等概念。其中,每個概念都有其屬性定義。例如,人物概念“玄奘”的屬性包括“{譯典著作:《大般若經》、《心經》、《解深密經》、《瑜伽師地論》、《成唯識論》等}”,“{所屬年代:唐朝}”,“{身份:唐代著名高僧、法相宗創(chuàng)始人、佛學翻譯家}”,“{籍貫:河南洛州緱氏}”,“{別名:唐僧、唐三藏、陳祎}”,“{出生日期:仁壽二年(公元602年)}”和“{逝世日期:麟德元年(公元664年)}”等。S110:將分類后的本體中的概念在時空特征上進行關聯。具體地,本步驟可以包括:分別對分類后的本體進行時間信息挖掘和空間信息挖掘,將分類后的本體中的概念在時空特征上進行關聯。進一步地,對本體進行時間信息挖掘的步驟可以通過步驟S111至步驟S112來實現。S111:建立分類后的本體的時間同義詞集合,將本體中的非規(guī)范時間描述信息關聯起來。舉例來說,本步驟可以將本體中的各種非規(guī)范時間描述信息關聯起來,為每個時間同義詞集合設置標識。例如:以“ST”開頭,并在其后加上具體數字,以此來設置標識。表1示例性地示出了示例本體的時間同義詞集合。其中包括ST1“唐、唐代、唐朝、大唐、貞觀”、ST2“漢、漢朝、大漢、大漢王朝、大漢帝國”、ST3“公元前XX年、前XX年、約前XX年”、ST4“公元607年、607年、約607年”等時間同義詞集合。表1:標識時間同義詞集ST1唐、唐代、唐朝、大唐、貞觀ST2漢、漢朝、大漢、大漢王朝、大漢帝國ST3公元前XX年、前XX年、約前XX年ST4公元627年、627年、約627年…………S112:針對分類后的本體,抽取出同一時間范圍內的概念。進一步地,本步驟可以包括:對于每一個時間同義詞集合,根據所有概念的屬性值,按照時間度量,抽取出同一時間范圍內的概念。本步驟對每個時間同義詞集合ST,在所有概念的屬性值范圍內進行其集合成員的檢索,判斷屬性值中涉及到時間的信息的時間跨度(時間最大值和時間最小值)是否包含了被檢索的時間同義詞集合成員,并把檢索所得概念以某一時間度量進行分類,從而抽取出同一時間范圍內的概念。其中,時間跨度也即時間度量,其包括但不限于年、月、日等度量單位。例如,沿用表1示例,時間同義詞集合ST4的集合成員為“公元627年、627年、約627年”;人物概念“玄奘”的屬性值中涉及到時間的信息為“麟德元年(公元664年)”和“仁壽二年(公元602年)”;集合成員“公元627年”包含在人物概念“玄奘”的屬性值時間跨度內。表2沿用表1示例,其示例性地示出了時間同義詞集合在時間度量為627年時的概念。其中描述了時間同義詞集合ST4在同一時間范圍內的概念特征示意情況,表2中列出了示例本體“絲綢之路著名史實”在時間度量為627年時檢索得到的人物概念、事件概念以及文物概念。表2:具體地,對本體進行空間信息挖掘的步驟可以進一步通過步驟S113至步驟S114來實現。S113:建立分類后的本體的空間同義詞集合,將本體中的非規(guī)范空間描述信息關聯起來。舉例來說,本步驟可以將本體中的各種非規(guī)范空間描述信息關聯起來,并為每個空間同義詞集合設置特定的標識,例如,以“SS”開頭,并在其后加上具體數字,以為每個空間同義詞集合設置標識。表3示例性地示出了示例本體的空間同義詞集合。如表3所示,其中包括SS1“長安、西安、鎬京、西京、大興、寶雞、陳倉、咸陽……”、SS2“蘭州、金城、陸都、酒泉、平涼……”、SS3“太原、并、并州……”等空間同義詞集合。表3:S114:針對分類后的本體,抽取出同一空間范圍內的概念。具體地,本步驟可以進一步包括:對每個空間同義詞集合,根據所有概念的屬性值,按照空間度量,抽取出同一空間范圍內的概念。本步驟對每個空間同義詞集合SS,在所有概念的屬性值范圍內進行其集合成員的檢索,判斷其屬性值中涉及到空間的信息的地域范圍是否包含了被檢索的空間同義詞集合成員,并把檢索所得概念以某一具體空間度量進行分類,從而抽取出同一空間范圍內的概念。在本發(fā)明實施例中,空間度量包括但不限于省/直轄市、市、縣/鄉(xiāng)等度量單位。下面沿用表3示例,以空間同義詞集合SS1為例進行詳細說明??臻g同義詞集合SS1的成員為“長安、西安、鎬京、西京、大興、寶雞、陳倉、咸陽……”;人物概念“班超”的屬性值中涉及到空間的信息為“陜西咸陽東北”;成員“咸陽”包含在人物概念“班超”的屬性值地域范圍內。表4示例性地示出了抽取出同一空間范圍內的概念。表4中列出了示例本體“絲綢之路著名史實”在空間度量為陜西省時檢索得到的人物概念、事件概念以及文物概念。表4:本發(fā)明實施例通過對本體隱含的時空信息進行抽取、關聯和可視化呈現,具有語義深度,能夠實現對本體深層信息的挖掘與描述。S120:針對分類后的概念,以圖層的形式對本體進行時空可視化展示。具體地,本步驟可以通過步驟S121至步驟S124來實現。S121:基于二維GIS地理信息系統(tǒng),建立可視化界面。S122:以圖層表示分類后的概念,并用圖標進行區(qū)別。例如:可以分為人物概念層、事件概念層及其他概念層,從而使得可視化界面包括三個圖層,然后,不同圖層的概念用不同的圖標進行區(qū)別。S123:在可視化界面上,以橫向滑動的形式顯示時間信息。S124:在可視化界面上,以不同填充顏色的形式顯示空間信息。舉例來說,在實際應用中可以使用不同省或直轄市用不同顏色進行填充,以進行可視化顯示。在本發(fā)明的一優(yōu)選實施例中,在具體應用過程中,當定位到可視化界面上某個概念時,還可以用文本形式自動顯示此概念的屬性、關系及公理等描述信息。圖3示例性地示出了示例本體的時空信息可視化展示示意圖。本發(fā)明實施例解決了如何實現對本體隱含的時空信息進行挖掘并給予可視化呈現的技術問題。通過對本體隱含的時空信息進行抽取、關聯和可視化呈現,能夠實現對本體深層信息的挖掘與描述;具有語義深度,能夠實現對本體深層信息的挖掘與描述,還對本
技術領域:
內或領域間的信息交互、信息集成、知識獲取、知識重用及知識共享等問題有著重要的意義。上述實施例中雖然將各個步驟按照上述先后次序的方式進行了描述,但是本領域技術人員可以理解,為了實現本實施例的效果,不同的步驟之間不必按照這樣的次序執(zhí)行,其可以同時(并行)執(zhí)行或以顛倒的次序執(zhí)行,這些簡單的變化都在本發(fā)明的保護范圍之內。本發(fā)明實施例通過的方法既可以在個人計算機、工控機及服務器上以軟件的形式安裝并執(zhí)行,也可將方法做成嵌入式芯片以硬件的形式來體現。本發(fā)明實施例提供的方法還可以實施為計算機程序軟件或程序模塊(其包括執(zhí)行特定任務或實現特定抽象數據類型的例程、程序、對象、組件或數據結構等等),例如根據本發(fā)明的實施例可以是一種計算機程序產品,運行該計算機程序產品使計算機執(zhí)行用于所示范的方法。所述計算機程序產品包括計算機可讀存儲介質,該介質上包含計算機程序邏輯或代碼部分,用于實現所述方法。所述計算機可讀存儲介質可以是被安裝在計算機中的內置介質或者可以從計算機主體上拆卸下來的可移動介質(例如:采用熱插拔技術的存儲設備)。所述內置介質包括但不限于可重寫的非易失性存儲器,例如:RAM、ROM、快閃存儲器和硬盤。所述可移動介質包括但不限于:光存儲介質(例如:CD-ROM和DVD)、磁光存儲介質(例如:MO)、磁存儲介質(例如:磁帶或移動硬盤)、具有內置的可重寫非易失性存儲器的媒體(例如:存儲卡)和具有內置ROM的媒體(例如:ROM盒)。至此,已經結合附圖所示的優(yōu)選實施方式描述了本發(fā)明的技術方案,但是,本領域技術人員容易理解的是,以上所述的具體實施例,對本發(fā)明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。當前第1頁1 2 3