專利名稱:一種基于owl的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)及其匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng),屬于計算機(jī)技術(shù)領(lǐng)域。
背景技術(shù):
在互聯(lián)網(wǎng)上有很多種成對的互動信息,比如供求信息、求職與招聘信息,等等。大部分這樣成對信息的匹配是人工處理的,即通過軟件本身設(shè)置的供求區(qū)或跟貼區(qū)來實(shí)現(xiàn)自然的配對。如果是在海量的互聯(lián)網(wǎng)信息中自動配對,則往往還是靠關(guān)鍵詞匹配,匹配準(zhǔn)確性差。OffL (Web Ontology Language)是W3C開發(fā)的一種網(wǎng)絡(luò)本體語言,用于對本體進(jìn)行語義描述。如果按OffL創(chuàng)建互聯(lián)網(wǎng),互聯(lián)網(wǎng)本身就成為一個計算機(jī)可以在一定程度上“理解”的知識結(jié)構(gòu)。在這個基礎(chǔ)上軟件工程師們可以為計算機(jī)設(shè)計一系列推理規(guī)則和引擎,在 OffL語義網(wǎng)絡(luò)上讓計算機(jī)自己“理解”互聯(lián)網(wǎng)信息內(nèi)容,并做出正確的判斷和操作。OWL可以用來處理資訊的內(nèi)容而不是僅僅向人類呈現(xiàn)信息的應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng),采用基于OWL的檢索方法來實(shí)現(xiàn)互聯(lián)網(wǎng)海量供求信息的自動配對,信息匹配準(zhǔn)確性高。為解決上述技術(shù)問題,本發(fā)明提供一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng),其特征是,包含
保存互聯(lián)網(wǎng)海量需求或供應(yīng)信息的原始文檔數(shù)據(jù)庫,
OffL本體實(shí)例轉(zhuǎn)換模塊,將需求或供應(yīng)信息轉(zhuǎn)換為OWL本體實(shí)例存入OWL本體實(shí)例數(shù)據(jù)庫,
倒排索引數(shù)據(jù)庫,將本體元倒排索引,
OffL查詢規(guī)則庫,由OWL知識模型對倒排索引進(jìn)行校對,并產(chǎn)生查詢規(guī)則存入OWL查詢規(guī)則庫。還包含
OffL本體辭典,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換; OffL本體模型庫,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換; OffL本體實(shí)例轉(zhuǎn)換模塊,負(fù)責(zé)從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換; OffL查詢條件預(yù)處理模塊,負(fù)責(zé)OWL查詢條件的延展推理,獲取更多相關(guān)查詢條件,同時對所有查詢條件進(jìn)行本體元化,從所有查詢條件中提取本體元;
OffL本體搜索匹配模塊,負(fù)責(zé)完成查詢條件本體元與OWL本體元倒排索引表中的搜索和匹配;
待匹配供求條件及其分析模塊,負(fù)責(zé)人機(jī)交互,包括查詢條件的輸入和配對結(jié)果的顯示;同時負(fù)責(zé)對準(zhǔn)自然語言的查詢條件做初步的分析,以便做OffL本體的轉(zhuǎn)換。一種基于OffL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)的供求信息匹配方法,其特征是,包含以下步驟
1)用戶通過用戶界面輸入準(zhǔn)自然語言的供應(yīng)或需求信息;
2)待匹配供求條件及其分析模塊對用戶的輸入信息進(jìn)行預(yù)處理;
3)OffL本體實(shí)例轉(zhuǎn)換模塊在OWL辭典和OWL知識模型的幫助下將查詢語句轉(zhuǎn)換為OWL 本體實(shí)例;
4)OffL查詢條件預(yù)處理模塊利用OWL推理引擎對查詢條件做知識延伸擴(kuò)展,獲取額外的相關(guān)查詢本體實(shí)例;
5)OffL查詢條件預(yù)處理模塊將核心的和外延的查詢條件本體實(shí)例進(jìn)行本體元化處理, 提取出所有的本體元,作為最終的查詢條件集;
6)OffL本體搜索匹配模塊把查詢條件集中的每一個本體元與本體元倒排列表中的所有項(xiàng)進(jìn)行匹配,并將獲得所有的查詢結(jié)果輸出給原始文檔管理系統(tǒng)和原始文檔結(jié)果排序系統(tǒng);
7)原始文檔管理系統(tǒng)根據(jù)查詢結(jié)果與OWL本體實(shí)例數(shù)據(jù)庫的對應(yīng)關(guān)系,映射到原始文檔數(shù)據(jù)庫中相應(yīng)的文件,提取出相應(yīng)的原始文檔集作為輸出;
8)當(dāng)有多個結(jié)果對應(yīng)一個供應(yīng)或需求問題時,配對結(jié)果排序模塊根據(jù)基于知識的查詢規(guī)則和知識比較算法判斷結(jié)果與條件的知識吻合度,并根據(jù)這種吻合度對結(jié)果進(jìn)行排序;
9)排序結(jié)果輸出到用戶界面做結(jié)果顯示;
選擇另外一個供應(yīng)或需求信息,重復(fù)步驟1)到9),循環(huán)往復(fù),直到遍歷所有的供應(yīng)或需求。步驟1)中所述的準(zhǔn)自然語言為采用自然語言的格式,所使用的語法和詞匯在一個有限的或事先規(guī)定好的范圍內(nèi)。步驟2)中所述預(yù)處理至少包含識別、有效性檢測、詞性標(biāo)注。步驟6)中OWL本體搜索匹配模塊進(jìn)行匹配的步驟為
a)利用遍歷算法快速定位本體元在列表中的位置;
b)利用知識比較算法判定查詢條件中的本體元是否與倒排列表中的本體元相同或相
似;
往復(fù)循環(huán),直到遍歷每一個本體元查詢條件,并獲得所有的查詢結(jié)果,輸出給原始文檔管理系統(tǒng)和原始文檔結(jié)果排序系統(tǒng)。本發(fā)明所達(dá)到的有益效果
本發(fā)明的基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)及其信息匹配方法,利用基于OWL檢索的互聯(lián)網(wǎng)內(nèi)容的配對,既可以由一個供應(yīng)信息去在海量的需求信息中尋找合適的需求,也可以從一個需求信息在海量的供應(yīng)信息中尋找與之對應(yīng)的供應(yīng),大大提高了信息匹配的準(zhǔn)確性。
圖1是基于OWL的互動供求信息匹配系統(tǒng)示意圖。
具體實(shí)施例方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明的保護(hù)范圍。利用基于OffL檢索的互聯(lián)網(wǎng)內(nèi)容的配對,既可以由一個供應(yīng)信息去在海量的需求信息中尋找合適的需求,也可以從一個需求信息在海量的供應(yīng)信息中尋找與之對應(yīng)的供應(yīng)。以由供應(yīng)信息找需求信息為例,互動匹配系統(tǒng)如圖一所示。本例子是從供應(yīng)去尋找需求,如果是從需求找供應(yīng),則整個過程需要反過來。其中,假定已經(jīng)獲得了海量的需求信息,此信息存在原始文檔數(shù)據(jù)庫內(nèi),并由OWL 本體實(shí)例轉(zhuǎn)換把它轉(zhuǎn)換為OffL本體實(shí)例存入本體實(shí)例數(shù)據(jù)庫,已經(jīng)對本體實(shí)例數(shù)據(jù)庫做好了本體元倒排索引,并通過OWL知識模型對倒排索引進(jìn)行了校對,產(chǎn)生了查詢規(guī)則,存入 OffL查詢規(guī)則庫。除上述基本模塊外,該系統(tǒng)還包括
UOffL本體辭典,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;
2、OWL本體模型庫,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;
3、OffL本體實(shí)例轉(zhuǎn)換模塊,負(fù)責(zé)從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;
4、OffL查詢條件預(yù)處理模塊,負(fù)責(zé)OWL查詢條件的延展推理,獲取更多相關(guān)查詢條件, 同時對所有查詢條件進(jìn)行本體元化,即從所有查詢條件中提取本體元;
5、OffL本體搜索匹配模塊,即本發(fā)明的核心模塊,負(fù)責(zé)完成查詢條件本體元(集)與 OffL本體元倒排索引表中的搜索和匹配。其關(guān)鍵技術(shù)是
a)本體元倒排索引表的遍歷算法,即如何高效、快速地搜索到倒排索引表的每一個節(jié)點(diǎn)的方法;
b)知識比較算法,即如何判斷兩個本體元所描述的知識相同或相似的方法,并非簡單的字符串匹配,這里基于知識模型的OffL本體查詢規(guī)則起重要作用;
6、待匹配供求條件及其分析模塊,負(fù)責(zé)人機(jī)交互,包括查詢條件的輸入和配對結(jié)果的顯示。同時負(fù)責(zé)對準(zhǔn)自然語言的查詢條件做初步的分析,以便做OffL本體的轉(zhuǎn)換。基于上述系統(tǒng)的主流程如下
1、用戶通過用戶界面輸入準(zhǔn)自然語言的供應(yīng)信息。準(zhǔn)自然語言,即采用自然語言的格式,但所使用的語法和詞匯都在一個有限的、或事先規(guī)定好的范圍內(nèi);
2、待匹配供求條件及其分析模塊對用戶的問題進(jìn)行識別、有效性檢測、詞性標(biāo)注等預(yù)處理;是對查詢條件的預(yù)處理,這時輸入的查詢條件是“供應(yīng)”信息。3、OffL本體轉(zhuǎn)換模塊在OWL辭典和OWL知識模型的幫助下將查詢語句轉(zhuǎn)換為OWL 本體實(shí)例;
4、OffL查詢條件預(yù)處理模塊利用OWL推理引擎對查詢條件做知識延伸擴(kuò)展,獲取額外的相關(guān)查詢本體實(shí)例;
5、OffL查詢條件預(yù)處理模塊將核心的和外延的查詢條件本體實(shí)例進(jìn)行本體元化處理, 即提取出所有的本體元,作為最終的查詢條件集;
6>OffL本體搜索匹配模塊把查詢條件集中的每一個本體元與本體元倒排列表中的所有項(xiàng)進(jìn)行匹配
a)利用遍歷算法快速定位本體元在列表中的位置;
b)利用知識比較算法判定查詢條件中的本體元是否與倒排列表中的本體元相同或相
似;
往復(fù)循環(huán),直到遍歷每一個本體元查詢條件,并獲得所有的查詢結(jié)果,輸出給原始文檔管理系統(tǒng)和原始文檔結(jié)果排序系統(tǒng);
7、原始文檔管理系統(tǒng)根據(jù)查詢結(jié)果與OWL本體實(shí)例數(shù)據(jù)庫的對應(yīng)關(guān)系,映射到原始文檔數(shù)據(jù)庫中相應(yīng)的文件,提取出相應(yīng)的原始文檔集作為輸出;
8、當(dāng)有多個需求結(jié)果對應(yīng)一個供應(yīng)問題時,配對結(jié)果排序模塊會根據(jù)基于知識的查詢規(guī)則和知識比較算法判斷結(jié)果與條件的知識吻合度,并根據(jù)這種吻合度對結(jié)果進(jìn)行排序;
9、排序結(jié)果輸出到用戶界面做結(jié)果顯示。選擇另外一個問題,重復(fù)步驟1到9,循環(huán)往復(fù),直到遍歷所有的供應(yīng)。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和變形,這些改進(jìn)和變形也應(yīng)視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng),其特征是,包含以下模塊保存互聯(lián)網(wǎng)海量需求或供應(yīng)信息的原始文檔數(shù)據(jù)庫,OffL本體實(shí)例轉(zhuǎn)換模塊,將需求或供應(yīng)信息轉(zhuǎn)換為OWL本體實(shí)例存入 OWL本體實(shí)例數(shù)據(jù)庫,倒排索引數(shù)據(jù)庫,將本體元倒排索引,OffL查詢規(guī)則庫,由OWL知識模型對倒排索引進(jìn)行校對,并產(chǎn)生查詢規(guī)則存入OWL查詢規(guī)則庫。
2.根據(jù)權(quán)利要求1所述的一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng),其特征是,還包含下列模塊OffL本體辭典,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;OffL本體模型庫,用于從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;OffL本體實(shí)例轉(zhuǎn)換模塊,負(fù)責(zé)從文本格式查詢條件向OWL本體實(shí)例的轉(zhuǎn)換;OffL查詢條件預(yù)處理模塊,負(fù)責(zé)OWL查詢條件的延展推理,獲取更多相關(guān)查詢條件,同時對所有查詢條件進(jìn)行本體元化,從所有查詢條件中提取本體元;OffL本體搜索匹配模塊,負(fù)責(zé)完成查詢條件本體元與OWL本體元倒排索引表中的搜索和匹配;待匹配供求條件及其分析模塊,負(fù)責(zé)人機(jī)交互,包括查詢條件的輸入和配對結(jié)果的顯示;同時負(fù)責(zé)對準(zhǔn)自然語言的查詢條件做初步的分析,以便做OffL本體的轉(zhuǎn)換。
3.一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)的供求信息匹配方法,其特征是,包含以下步驟1)用戶通過用戶界面輸入準(zhǔn)自然語言的供應(yīng)或需求信息;2)待匹配供求條件及其分析模塊對用戶的輸入信息進(jìn)行預(yù)處理;3)OffL本體實(shí)例轉(zhuǎn)換模塊在OWL辭典和OWL知識模型的幫助下將查詢語句轉(zhuǎn)換為OWL 本體實(shí)例;4)OffL查詢條件預(yù)處理模塊利用OWL推理引擎對查詢條件做知識延伸擴(kuò)展,獲取額外的相關(guān)查詢本體實(shí)例;5)OffL查詢條件預(yù)處理模塊將核心的和外延的查詢條件本體實(shí)例進(jìn)行本體元化處理, 提取出所有的本體元,作為最終的查詢條件集;6)OffL本體搜索匹配模塊把查詢條件集中的每一個本體元與本體元倒排列表中的所有項(xiàng)進(jìn)行匹配,并將獲得所有的查詢結(jié)果輸出給原始文檔管理系統(tǒng)和原始文檔結(jié)果排序系統(tǒng);7)原始文檔管理系統(tǒng)根據(jù)查詢結(jié)果與OWL本體實(shí)例數(shù)據(jù)庫的對應(yīng)關(guān)系,映射到原始文檔數(shù)據(jù)庫中相應(yīng)的文件,提取出相應(yīng)的原始文檔集作為輸出;8)當(dāng)有多個結(jié)果對應(yīng)一個供應(yīng)或需求問題時,配對結(jié)果排序模塊根據(jù)基于知識的查詢規(guī)則和知識比較算法判斷結(jié)果與條件的知識吻合度,并根據(jù)這種吻合度對結(jié)果進(jìn)行排序;9)排序結(jié)果輸出到用戶界面做結(jié)果顯示;選擇另外一個供應(yīng)或需求信息,重復(fù)步驟1)到9),循環(huán)往復(fù),直到遍歷所有的供應(yīng)或需求。
4.根據(jù)權(quán)利要求3所述的基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)的供求信息匹配方法,其特征是,步驟1)中所述的準(zhǔn)自然語言為采用自然語言的格式,所使用的語法和詞匯在一個有限的或事先規(guī)定好的范圍內(nèi)。
5.根據(jù)權(quán)利要求3所述的基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)的供求信息匹配方法, 其特征是,步驟2)中所述預(yù)處理至少包含識別、有效性檢測、詞性標(biāo)注。
6.根據(jù)權(quán)利要求3所述的基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)的供求信息匹配方法, 其特征是,步驟6)中OffL本體搜索匹配模塊進(jìn)行匹配的步驟為a)利用遍歷算法快速定位本體元在列表中的位置;b)利用知識比較算法判定查詢條件中的本體元是否與倒排列表中的本體元相同或相似;往復(fù)循環(huán),直到遍歷每一個本體元查詢條件,并獲得所有的查詢結(jié)果,輸出給原始文檔管理系統(tǒng)和原始文檔結(jié)果排序系統(tǒng)。
全文摘要
本發(fā)明公開了一種基于OWL的互聯(lián)網(wǎng)供求信息匹配系統(tǒng)和供求信息匹配方法,用戶輸入供應(yīng)或需求后進(jìn)行預(yù)處理;OWL本體實(shí)例轉(zhuǎn)換模塊將查詢語句轉(zhuǎn)換為OWL本體實(shí)例;OWL查詢條件預(yù)處理模塊將核心的和外延的查詢條件本體實(shí)例進(jìn)行本體元化處理,OWL本體搜索匹配模塊把查詢條件集中的每一個本體元與本體元倒排列表中的所有項(xiàng)進(jìn)行匹配,原始文檔管理系統(tǒng)提取出相應(yīng)的原始文檔集作為結(jié)果輸出;由配對結(jié)果排序模塊對多個結(jié)果進(jìn)行排序;排序結(jié)果輸出到用戶界面做結(jié)果顯示;循環(huán)往復(fù),直到遍歷所有的供應(yīng)或需求。本發(fā)明采用基于OWL的檢索方法來實(shí)現(xiàn)互聯(lián)網(wǎng)海量供求信息的自動配對,大大提高了信息匹配的準(zhǔn)確性。
文檔編號G06F17/30GK102521240SQ20111035760
公開日2012年6月27日 申請日期2011年11月14日 優(yōu)先權(quán)日2011年11月14日
發(fā)明者王楠 申請人:江蘇聯(lián)著實(shí)業(yè)有限公司