亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架的制作方法

文檔序號:11950887閱讀:629來源:國知局
一種基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架的制作方法與工藝

本發(fā)明涉及數(shù)據(jù)搜索技術(shù)領(lǐng)域,特別涉及一種基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架。



背景技術(shù):

本體的概念在上世紀(jì)90年代一經(jīng)提出就引起了計(jì)算機(jī)各個(gè)領(lǐng)域激烈討論與研究。本體是一套得到大多數(shù)人認(rèn)同的、關(guān)于概念體系的明確的、形式化的規(guī)范說明。本體的描述語言沒有一致的標(biāo)準(zhǔn),不同領(lǐng)域中構(gòu)建的本體也存在很大的區(qū)別,不同本體的構(gòu)建過程也相互不同。

在信息檢索領(lǐng)域中,可以分為以下各個(gè)流程:首先構(gòu)建應(yīng)用領(lǐng)域的本體;收集信息源中的數(shù)據(jù),并參照已經(jīng)建立的本體,把收集來的數(shù)據(jù)按規(guī)定的格式進(jìn)行本體實(shí)例的構(gòu)建;對用戶檢索界面獲取的查詢請求,進(jìn)行對本體實(shí)例以及相關(guān)關(guān)系的查詢,經(jīng)過對查詢到的數(shù)據(jù)進(jìn)行重新組織;按照一定的格式對查詢的結(jié)果進(jìn)行數(shù)據(jù)返回并顯示。

語義網(wǎng)的實(shí)現(xiàn)是本體應(yīng)用的終極目標(biāo),經(jīng)過多年的研究與演化,語義網(wǎng)也有以前的定義:把web數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可理解的數(shù)據(jù),轉(zhuǎn)變?yōu)楦右话愕母拍睿罕倔w以及本體之間關(guān)系的表現(xiàn)形式。在構(gòu)建好的本體上層再添加對本體之間關(guān)系的信息,從而把孤立的本體數(shù)據(jù)聯(lián)系起來,從而實(shí)現(xiàn)更加廣泛、新穎的應(yīng)用。

本體經(jīng)過20多年的研究,已經(jīng)形成了很多構(gòu)建方法以及本體描述方式。本體的描述可以有:非形式化語言、半非形式化語言、半形式化語言、形式化語言這四種方式。本體的構(gòu)建也有最耗時(shí)耗力的人工構(gòu)建,經(jīng)由半自動構(gòu)建,發(fā)展到了自動化構(gòu)建。本體的構(gòu)建速度越來越快,構(gòu)建效果也越來越好。但是本體構(gòu)建過程還有很多難點(diǎn)不易攻克,如:本體的構(gòu)建過程是個(gè)費(fèi)時(shí)費(fèi)力的過程,需要完整的工程化、系統(tǒng)化的方法來支持,目前特定的領(lǐng)域本體還需要專家進(jìn)行參與;通用的大規(guī)模本體很少,大多本體只是針對某個(gè)具體應(yīng)用領(lǐng)域或應(yīng)用而構(gòu)造的;在實(shí)際應(yīng)用中,不同本體之間常常需要進(jìn)行映射、擴(kuò)充與合并處理,以及根據(jù)特定的需要從一個(gè)大的本體中提取滿足要求的小的本體等操作;此外,當(dāng)現(xiàn)實(shí)的知識體系發(fā)生變化時(shí),先前構(gòu)造的本體必須作出相應(yīng)的演化以保持本體與現(xiàn)實(shí)的一致性,這都是本體工程所需研究的問題。

語義網(wǎng)在發(fā)展過程中已逐步演化為知識圖譜,知識圖譜的描述與構(gòu)建亦有很多方式。描述可用本體論語言(OWL Web Ontology Language),亦可用資源描述框架RDF(Resource Description Framework)來進(jìn)行描述。

傳統(tǒng)的搜索引擎只能搜索出現(xiàn)關(guān)鍵詞的文檔或者可以搜索一些簡單的關(guān)系(如百度百科中的親屬信息),很難在搜索過程中對搜索的結(jié)果再進(jìn)行相應(yīng)的關(guān)系信息處理。基于此,本發(fā)明設(shè)計(jì)了一種基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架。該方法基于自定義本體描述Schema來進(jìn)行本體定義,并結(jié)合ElasticSearch中基本數(shù)據(jù)結(jié)構(gòu)Document,手動創(chuàng)建對應(yīng)關(guān)系,保證數(shù)據(jù)的完備性;并通過手動或半自動方式構(gòu)建本體與本體或?qū)傩耘c屬性的關(guān)系數(shù)據(jù)結(jié)構(gòu),最終生成三元組(本體1,關(guān)系,本體2)或者(屬性1,關(guān)系,屬性2)的形式,這樣的三元組即表示一條關(guān)系。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明為了彌補(bǔ)現(xiàn)有技術(shù)的缺陷,提供了一種簡單高效的基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架。

本發(fā)明是通過如下技術(shù)方案實(shí)現(xiàn)的:

一種基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架,其特征在于包括以下步驟:

(1)對本體以及關(guān)系的描述進(jìn)行確定,本體描述Schema的確定標(biāo)志著本體可以被更加精確的描述,描述Schema是本體構(gòu)建的基礎(chǔ);

(2)從原始數(shù)據(jù)中進(jìn)行本體以及關(guān)系的構(gòu)建,原始數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),采用自動與人工結(jié)合的方式來實(shí)現(xiàn)本體以及關(guān)系的構(gòu)建,人工再對構(gòu)建好的本體數(shù)據(jù)進(jìn)行校正,保證數(shù)據(jù)的高質(zhì)量;

(3)通過人工構(gòu)建ElasticSearch中數(shù)據(jù)Schema的形式導(dǎo)入構(gòu)建好的本體數(shù)據(jù),把已經(jīng)建立好的本體描述以及結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入到ES框架中,并對其建立索引,保存數(shù)據(jù);

(4)用ElasticSearch工具進(jìn)行數(shù)據(jù)搜索,并最終展示。

所述步驟(2)中,結(jié)構(gòu)化數(shù)據(jù)包括人,事,物,地點(diǎn)和機(jī)構(gòu)數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)包括網(wǎng)頁文檔和圖片數(shù)據(jù)。

所述步驟(3)中,在ES框架中保存本體的Schema與所述步驟(1)中本體描述Schema相一致。

本發(fā)明的有益效果是:該基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架,通過對本體建模完成了本體的構(gòu)建,通過對ES中數(shù)據(jù)Schema的建模實(shí)現(xiàn)了數(shù)據(jù)在ES中的存儲,最終通過本體搜索算法以及關(guān)系計(jì)算算法實(shí)現(xiàn)了本體以及關(guān)系數(shù)據(jù)的搜索,進(jìn)而實(shí)現(xiàn)了多維度、全息化、動態(tài)化的信息檢索、關(guān)聯(lián)、整合、統(tǒng)計(jì)和分析。

附圖說明

附圖1為本發(fā)明基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架結(jié)構(gòu)示意圖。

附圖2為本發(fā)明基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架方法示意圖。

具體實(shí)施方式

為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚明白,以下結(jié)合附圖和實(shí)施例,對本發(fā)明進(jìn)行詳細(xì)的說明。應(yīng)當(dāng)說明的是,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

該基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架,包括以下步驟:

(1)對本體以及關(guān)系的描述進(jìn)行確定,本體描述Schema的確定標(biāo)志著本體可以被更加精確的描述,描述Schema是本體構(gòu)建的基礎(chǔ);

(2)從原始數(shù)據(jù)中進(jìn)行本體以及關(guān)系的構(gòu)建,原始數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),采用自動與人工結(jié)合的方式來實(shí)現(xiàn)本體以及關(guān)系的構(gòu)建,人工再對構(gòu)建好的本體數(shù)據(jù)進(jìn)行校正,保證數(shù)據(jù)的高質(zhì)量,這樣可以把人的價(jià)值發(fā)揮到最大,使得工作更加智能;

所述步驟(2)中,結(jié)構(gòu)化數(shù)據(jù)包括人,事,物,地點(diǎn)和機(jī)構(gòu)數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)包括網(wǎng)頁文檔和圖片數(shù)據(jù)。

(3)通過人工構(gòu)建ElasticSearch中數(shù)據(jù)Schema的形式導(dǎo)入構(gòu)建好的本體數(shù)據(jù),把已經(jīng)建立好的本體描述以及結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入到ES框架中,并對其建立索引,保存數(shù)據(jù);

所述步驟(3)中,在ES框架中保存本體的Schema與所述步驟(1)中本體描述Schema相一致。

(4)用ElasticSearch工具進(jìn)行數(shù)據(jù)搜索,并最終展示。

下面以公安行業(yè)中的人、案、物、單位等概念為例進(jìn)行說明。

1、確定本體描述Schema:在領(lǐng)域內(nèi)專家的幫助下,針對公安行業(yè)中的人、案、物、單位等概念進(jìn)行抽象,并通過描述Schema的形式對不同的本體進(jìn)行描述,具體如下:

(1)人本體主要包括:姓名、性別、出生日期、民族、學(xué)歷、行政區(qū)劃、證件號(身份證、軍官證等)籍貫等;

(2)案本體主要包括:案件類型、案件說明、時(shí)間、地址、當(dāng)事人名、單位、警號、警員名、警情單號、主要線索(關(guān)鍵詞)等;

(3)物本體主要包括:物品名稱、物品種類、物品顏色、物品所有人、物品購買路徑等;

(4)單位本體主要包括:單位名稱、單位編號、法人代表、法人代表證件號、單位所在地區(qū)、詳細(xì)地址、聯(lián)系電話等。

2、確定ElasticSearch框架Schema:通過人工構(gòu)建ElasticSearch中數(shù)據(jù)Schema的形式導(dǎo)入構(gòu)建好的本體數(shù)據(jù),把已經(jīng)建立好的本體描述以及結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入到ES框架中,并對其建立索引,保存數(shù)據(jù),在ES中保存本體的Schema通常與本體描述Schema相一致。

(1)人本體主要包括:姓名(Name)、性別(Gender)、出生日期(Birthday)、民族(Nation)、學(xué)歷(Education)、行政區(qū)劃(Address)、證件號(ID)籍貫(Birthplace)等;

(2)案本體主要包括:案件類型(CaseType)、案件說明(Content)、時(shí)間(Time)、地址(Address)、當(dāng)事人名(PName)、單位(Organization)、警號(PoliceID)、警員名(PoliceName)、警情單號(CaseID)、主要線索(KeyWord)等;

(3)物本體主要包括:物品名稱(Name)、物品種類(Type)、物品顏色(Color)、物品所有人(Owner)、物品購買路徑(BuyBy)等;

(4)單位本體主要包括:單位名稱(Name)、單位編號(ID)、法人代表(Representative)、法人代表證件號(RepID)、單位所在地區(qū)(State)、詳細(xì)地址(Address)、聯(lián)系電話(Telephone)等。

該基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架,通過底層的數(shù)據(jù)構(gòu)建可以把感興趣的東西抽象成本體,通過對本體的建立、導(dǎo)入、關(guān)聯(lián)關(guān)系建立、圖關(guān)系計(jì)算等功能對搜索過程進(jìn)行技術(shù)實(shí)現(xiàn),并對展示進(jìn)行統(tǒng)一化標(biāo)準(zhǔn)建立。

由于該基于ElasticSearch的本體關(guān)系數(shù)據(jù)搜索框架把整個(gè)流程都進(jìn)行了把控,每個(gè)功能流程分離,可以實(shí)現(xiàn)功能的重用,并通過技術(shù)的支持不僅可以實(shí)現(xiàn)實(shí)體的查詢,還可以實(shí)現(xiàn)對關(guān)系的查詢,最終對整個(gè)查詢進(jìn)行了實(shí)現(xiàn),從而對數(shù)據(jù)的整個(gè)描述更加豐滿,提供給用戶更加詳細(xì)的信息,有著廣闊的應(yīng)用前景。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1