亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法及系統(tǒng)與流程

文檔序號(hào):12598317閱讀:547來(lái)源:國(guó)知局
一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法及系統(tǒng)與流程

本發(fā)明涉及信息檢索技術(shù)領(lǐng)域,特別是涉及一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法及系統(tǒng)。



背景技術(shù):

隨著網(wǎng)絡(luò)技術(shù)在人民生活中的廣泛普及,社會(huì)信息化程度的廣泛提高,各個(gè)領(lǐng)域所積累的信息資源在飛速增長(zhǎng)。對(duì)于食品安全領(lǐng)域來(lái)說(shuō),食品安全監(jiān)管部門產(chǎn)生大量的食品安全檢測(cè)數(shù)據(jù),單個(gè)數(shù)據(jù)都只說(shuō)明被檢測(cè)的樣品中某個(gè)元素(危害物)的情況,但是大量數(shù)據(jù)的集合蘊(yùn)含了豐富的食品安全信息。

現(xiàn)如今,搜索引擎的主要搜索方法為索引關(guān)鍵字的方式,用戶是通過(guò)索引關(guān)鍵字來(lái)查詢食品安全信息。

在發(fā)明人應(yīng)用在先技術(shù)時(shí),發(fā)現(xiàn)在先技術(shù)在食品安全信息查準(zhǔn)率方面有很大的欠缺,互聯(lián)網(wǎng)數(shù)據(jù)信息雖然多,但是這些信息之間缺乏聯(lián)系,信息結(jié)構(gòu)松散,且由于用戶查詢食品安全數(shù)據(jù)的形式多樣化,計(jì)算機(jī)難以識(shí)別復(fù)雜的自然語(yǔ)言等原因,導(dǎo)致用戶無(wú)法精確地查找到與需求相關(guān)的資源。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法和相應(yīng)的基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的系統(tǒng)。

依據(jù)本發(fā)明的一個(gè)方面,提供了一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法,包括:

構(gòu)建食品安全知識(shí)本體庫(kù);所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);

接收客戶端輸入的查詢串;

判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞組合、還是自然語(yǔ)言;

如果所述查詢串是關(guān)鍵詞,則將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;

如果所述查詢串是關(guān)鍵詞的組合時(shí),則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

如果所述查詢串是自然語(yǔ)言,則對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;

將所述查詢結(jié)果返回給客戶端。

可選地,所述構(gòu)建食品安全知識(shí)本體庫(kù)的步驟之后,還包括:

接收用戶對(duì)食品安全知識(shí)本體庫(kù)的更新操作;所述更新操作包括:對(duì)所述食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或食品知識(shí)本體之間存在的關(guān)系對(duì)象的添加、修改和刪除。

可選地,所述對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合,包括:

對(duì)所述查詢串進(jìn)行分詞,并利用概念類詞典和關(guān)系類詞典確定分詞結(jié)果中各分詞的詞性;所述詞性包括食品知識(shí)本體詞性和關(guān)系對(duì)象詞性;

將食品知識(shí)本體詞性的分詞和關(guān)系對(duì)象詞性的分詞,組合為所述食品知識(shí)本體和關(guān)系對(duì)象的組合。

可選地,所述基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,包括:

將查詢串中的食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與查詢串中對(duì)應(yīng)食品知識(shí)本體相應(yīng)的關(guān)系對(duì)象之間的第二相似度;

將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象。

可選地,所述基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,還包括:

如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則對(duì)所述分詞結(jié)果進(jìn)行擴(kuò)展,得到對(duì)應(yīng)各食品知識(shí)本體的擴(kuò)展集合,所述擴(kuò)展集合包括至少一個(gè)擴(kuò)展的食品知識(shí)本體;

將每個(gè)擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與具有關(guān)系對(duì)象的分詞之間的第二相似度;

將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象。

可選地,所述將所述查詢結(jié)果返回給客戶端的步驟,包括:

將總相似度排序靠前的N個(gè)食品知識(shí)本體與關(guān)系對(duì)象的組合所關(guān)聯(lián)的另外一個(gè)食品知識(shí)本體的信息返回給客戶端。

可選地,所述計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度的步驟,包括:

利用公式(1)

<mrow> <mi>S</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&delta;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>&theta;</mi> <mi>i</mi> </msub> <mo>...</mo> <mo>...</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;其中,所述t1是匹配上的食品知識(shí)本體,t2是食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體,n是t1和t2在食品安全知識(shí)本體庫(kù)中的層級(jí)關(guān)系中的層級(jí)深度;δi(t1,t2)是在層級(jí)深度為i時(shí),t1和t2之間的父類關(guān)系值,其中θi是權(quán)重。

依據(jù)本發(fā)明的另一個(gè)方面,提供了一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的系統(tǒng),包括:

構(gòu)建模塊,用于構(gòu)建食品安全知識(shí)本體庫(kù);所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);

輸入模塊,用于接收客戶端輸入的查詢串;

判斷模塊,用于判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞的組合、還是自然語(yǔ)言;

如果所述查詢串是關(guān)鍵詞,則將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;

如果所述查詢串是關(guān)鍵詞的組合時(shí),則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

分詞模塊,用于如果所述查詢串是自然語(yǔ)言,則對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

語(yǔ)義分析模塊,用于基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;

返回模塊,用于將與所述查詢結(jié)果返回給客戶端。

可選地,所述用于構(gòu)建食品安全知識(shí)本體庫(kù)的構(gòu)建模塊之后,還包括:

更新模塊,用于接收用戶對(duì)食品安全知識(shí)本體庫(kù)的更新操作;所述更新操作包括:對(duì)所述食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或食品知識(shí)本體之間存在的關(guān)系對(duì)象的添加、修改和刪除。

可選地,所述對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合,包括:

分詞模塊,用于對(duì)所述查詢串進(jìn)行分詞,并利用概念類詞典和關(guān)系類詞典確定分詞結(jié)果中各分詞的詞性;所述詞性包括食品知識(shí)本體詞性和關(guān)系對(duì)象詞性;

將食品知識(shí)本體詞性的分詞和關(guān)系對(duì)象詞性的分詞,組合為所述食品知識(shí)本體和關(guān)系對(duì)象的組合。

可選地,所述基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,包括:

匹配模塊,用于將查詢串中的食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

第一相似度計(jì)算模塊,用于如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

第二相似度計(jì)算模塊,用于對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與查詢串中對(duì)應(yīng)食品知識(shí)本體相應(yīng)的關(guān)系對(duì)象之間的第二相似度;

總相似度計(jì)算模塊,用于將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇查詢對(duì)象模塊,用于選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象。

可選地,所述基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,還包括:

擴(kuò)展模塊,用于如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則對(duì)所述分詞結(jié)果進(jìn)行擴(kuò)展,得到對(duì)應(yīng)各食品知識(shí)本體的擴(kuò)展集合,所述擴(kuò)展集合包括至少一個(gè)擴(kuò)展的食品知識(shí)本體;

匹配模塊,用于將每個(gè)擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

第一相似度計(jì)算模塊,用于如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

第二相似度計(jì)算模塊,用于對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與具有關(guān)系對(duì)象的分詞之間的第二相似度;

總相似度計(jì)算模塊,用于將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇查詢對(duì)象模塊,用于選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象。

可選地,所述將所述查詢結(jié)果返回給客戶端的返回模塊,包括:

返回模塊,用于將總相似度排序靠前的N個(gè)食品知識(shí)本體與關(guān)系對(duì)象的組合所關(guān)聯(lián)的另外一個(gè)食品知識(shí)本體的信息返回給客戶端。

可選地,所述計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度的步驟,包括:

利用公式(1)

<mrow> <mi>S</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&delta;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>&theta;</mi> <mi>i</mi> </msub> <mo>...</mo> <mo>...</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;其中,所述t1是匹配上的食品知識(shí)本體,t2是食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體,n是t1和t2在食品安全知識(shí)本體庫(kù)中的層級(jí)關(guān)系中的層級(jí)深度;δi(t1,t2)是在層級(jí)深度為i時(shí),t1和t2之間的父類關(guān)系值,其中θi是權(quán)重。

針對(duì)在先技術(shù),本發(fā)明實(shí)施例具備如下優(yōu)點(diǎn):

根據(jù)本發(fā)明中基于食品安全知識(shí)本體庫(kù),提出了一種食品安全數(shù)據(jù)信息檢索的方法及系統(tǒng),首先構(gòu)建食品安全知識(shí)本體庫(kù),所所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);然后根據(jù)用戶輸入的查詢串,判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞的組合、還是自然語(yǔ)言,對(duì)于單個(gè)關(guān)鍵詞,將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;對(duì)于關(guān)鍵詞的組合,則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;對(duì)于自然語(yǔ)言,進(jìn)行分詞并得到分詞結(jié)果,根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;最后將查詢結(jié)果返回給用戶。構(gòu)建的食品安全知識(shí)本體庫(kù)中食品知識(shí)本體具有層級(jí)結(jié)構(gòu),且層級(jí)之間通過(guò)關(guān)系對(duì)象關(guān)聯(lián),食品知識(shí)本體之間關(guān)系邏輯嚴(yán)密,對(duì)于用戶查詢的食品安全數(shù)據(jù)的形式進(jìn)行劃分,針對(duì)不同情況分別處理,且對(duì)于復(fù)雜的自然語(yǔ)言可以進(jìn)行分詞處理,由此解決了用戶無(wú)法精確地查找到與需求相關(guān)的資源的問(wèn)題,使得用戶可以比較精確地查找到與需求相關(guān)的資源。

上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。

附圖說(shuō)明

通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:

圖1示出了本發(fā)明的食品安全數(shù)據(jù)信息檢索方法的步驟流程圖;

圖1A示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖;

圖1B示出了本發(fā)明的查詢串分詞流程圖;

圖1C示出了本發(fā)明的食品安全知識(shí)本體庫(kù)部分結(jié)構(gòu)示意圖;

圖2示出了本發(fā)明的食品安全數(shù)據(jù)信息檢索系統(tǒng)的結(jié)構(gòu)框圖。

具體實(shí)施方式

下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

知識(shí)本體是領(lǐng)域概念及概念之間關(guān)系的規(guī)范化描述,這種描述是規(guī)范的、明確的、形式化的,可共享的。知識(shí)本體的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯和詞匯間相互關(guān)系的明確定義。

實(shí)施例一

參照?qǐng)D1,示出了根據(jù)本發(fā)明的一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:

步驟100,構(gòu)建食品安全知識(shí)本體庫(kù);所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);

參照?qǐng)D1A,示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖,包括構(gòu)建食品安全知識(shí)本體庫(kù),其中所述構(gòu)建食品安全知識(shí)本體庫(kù)的步驟包括:對(duì)食品知識(shí)本體及其關(guān)系對(duì)象的整理;對(duì)食品知識(shí)本體及其關(guān)系對(duì)象的機(jī)器化描述。

其中,所述食品安全知識(shí)本體庫(kù)中的食品安全數(shù)據(jù)包括:食品名稱、有毒物質(zhì)、中毒事件;對(duì)于食品安全數(shù)據(jù)的整理方式包括:類、屬性、關(guān)系。類是關(guān)于食品名稱、有毒物質(zhì)、中毒事件的所有食品知識(shí)本體的集合化的整理;屬性如中毒事件發(fā)生的時(shí)間、地點(diǎn)、發(fā)生的單位,有毒物質(zhì)的簡(jiǎn)介、類別、危害,食品的生產(chǎn)、加工、運(yùn)輸方式等;關(guān)系如等價(jià)、包含、導(dǎo)致等。

構(gòu)建食品安全知識(shí)本體庫(kù)的主要數(shù)據(jù)來(lái)源包括:

從目前已有的食品安全數(shù)據(jù)庫(kù)中導(dǎo)入食品安全事件,人為整理食品安全事件中涉及到的食品知識(shí)本體,并分析食品知識(shí)本體之間存在的關(guān)系對(duì)象,然后加入到食品安全知識(shí)本體庫(kù)中;

利用各種與食品安全相關(guān)的報(bào)紙、期刊、專業(yè)網(wǎng)站中獲得食品安全領(lǐng)域的食品知識(shí)本體和食品知識(shí)本體之間的關(guān)系對(duì)象,加入到食品安全知識(shí)本體庫(kù)中。

所述食品安全知識(shí)本體庫(kù)包含3個(gè)元素{C,R,H},C代表一組同類食品知識(shí)本體集合;R代表食品知識(shí)本體之間關(guān)系的集合;H代表由對(duì)象所派生的食品知識(shí)本體層次體系集合。舉例來(lái)講:

C={事物、食物、食品、動(dòng)物性食品、植物性食品、干制食品、腌制品、烘焙食品、罐藏食品、天然食品、嬰幼兒食品、膨化食品、速凍食品、食品添加劑、……}

R={加工情況(食品,加工食品|半成品|未加工食品),類別(食品,肉類|植物類|復(fù)合類|人工合成類),植物性食品類別(食品,根|莖|葉|花|果|籽|皮|汁),肉性食品類別(食品,豬肉|牛肉|羊肉|魚(yú)肉|雞肉),致癌物質(zhì)(食品,亞硝酸類|黃曲霉素|苯并芘|瘦肉精|地溝油|甲醛),……}

H={(事物),(事物,食品),(事物,食物),(食品),(食物),(食品,食材),(食品,問(wèn)題食品)……}

其中,元素C代表同類食品知識(shí)本體集合,也可稱為概念集合,可以按照類別不同分為食品名稱、有毒物質(zhì)、中毒事件,上例主要是食品名稱類的集合。元素R是食品知識(shí)本體之間關(guān)系對(duì)象的集合,由上例可以看出,括號(hào)內(nèi)為兩個(gè)食品知識(shí)本體的列舉(分隔符代表并列關(guān)系),括號(hào)外的對(duì)象為兩個(gè)食品知識(shí)本體之間的關(guān)系對(duì)象。元素H是由對(duì)象所派生的食品知識(shí)本體層次體系集合,由上例可以看出,“事物”可以派生出“食品”和“食物”兩個(gè)食品知識(shí)本體,派生出的“食品”和“食物”兩個(gè)食品知識(shí)本體,可以作為新的派生“母體”,進(jìn)而派生新的食品知識(shí)本體,如:“食材”、“問(wèn)題食品”等,元素H可以使得食品安全知識(shí)本體庫(kù)進(jìn)行擴(kuò)充,對(duì)于食品安全知識(shí)本體庫(kù)的更新有重要意義。

建立的食品安全知識(shí)本體庫(kù)描述了食品知識(shí)本體之間的語(yǔ)義關(guān)系,食品知識(shí)本體間關(guān)系邏輯嚴(yán)密,支持語(yǔ)義邏輯上的推理,可擴(kuò)展性強(qiáng)。

對(duì)食品安全領(lǐng)域的各種數(shù)據(jù)進(jìn)行整理,確定食品知識(shí)本體以及食品知識(shí)本體之間的關(guān)系對(duì)象,構(gòu)建食品安全知識(shí)本體庫(kù)。所述食品安全知識(shí)本體庫(kù)構(gòu)建之后,采用一種機(jī)器可讀的文法,比如XML(Extensible Markup Language,可拓展標(biāo)記語(yǔ)言),和機(jī)器可以理解的資源描述框架,比如RDF(Resource Description Framework,資源描述框架)對(duì)食品安全知識(shí)本體庫(kù)進(jìn)行描述、序列化以方便信息的存儲(chǔ)、傳輸和處理。其中,XML格式的序列化表示是將對(duì)象狀態(tài)轉(zhuǎn)換為可保持或傳輸?shù)母袷降倪^(guò)程,提供了一種描述結(jié)構(gòu)數(shù)據(jù)的格式。

可選地,在步驟100之后,還包括:

步驟105,所述構(gòu)建食品安全知識(shí)本體庫(kù)的步驟之后,還包括:

接收用戶對(duì)食品安全知識(shí)本體庫(kù)的更新操作;所述更新操作包括:對(duì)所述食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或食品知識(shí)本體之間存在的關(guān)系對(duì)象的添加、修改和刪除。

參照?qǐng)D1A,示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖,包括對(duì)食品安全知識(shí)本體庫(kù)的更新:對(duì)食品安全數(shù)據(jù)進(jìn)行整理,并對(duì)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或關(guān)系對(duì)象進(jìn)行添加、修改和刪除。

根據(jù)獲得的食品安全數(shù)據(jù)進(jìn)行人為分析食品知識(shí)本體以及食品知識(shí)本體之間存在的關(guān)系對(duì)象,對(duì)所述食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或食品知識(shí)本體之間存在的關(guān)系對(duì)象進(jìn)行更新操作,包括添加食品知識(shí)本體和/或食品知識(shí)本體之間的關(guān)系對(duì)象,修改食品知識(shí)本體和/或食品知識(shí)本體之間的關(guān)系對(duì)象,刪除食品知識(shí)本體和/或食品知識(shí)本體之間的關(guān)系對(duì)象。

在所述食品安全知識(shí)本體庫(kù)構(gòu)建之后,用戶可以對(duì)食品安全數(shù)據(jù)進(jìn)行信息檢索。

步驟110、接收用戶輸入的查詢串;

參照?qǐng)D1A,示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖,在語(yǔ)義查詢過(guò)程中,首先要接收用戶輸入的查詢串。

步驟120、判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞組合、還是自然語(yǔ)言;

其中,用戶輸入的查詢串存在三種情況:

(1)單個(gè)關(guān)鍵詞;

(2)多個(gè)關(guān)鍵詞構(gòu)成的組合;

(3)自然語(yǔ)言構(gòu)成的句子等。

例如,用戶輸入的“哪些物質(zhì)導(dǎo)致肉制品致癌?”這個(gè)自然語(yǔ)言構(gòu)成的句子。

步驟130、如果所述查詢串是關(guān)鍵詞,則將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果。

步驟140、如果所述查詢串是關(guān)鍵詞的組合時(shí),則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合。

步驟150、如果所述查詢串是自然語(yǔ)言,則對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

參照?qǐng)D1B,示出了本發(fā)明的查詢串分詞流程圖:

當(dāng)用戶輸入的查詢串是自然語(yǔ)言構(gòu)成的句子時(shí),需要應(yīng)用分詞,對(duì)用戶輸入的查詢串進(jìn)行預(yù)處理,生成詞組,轉(zhuǎn)化為前兩種情況。

對(duì)所述查詢串進(jìn)行分詞,并利用概念類詞典和關(guān)系類詞典確定分詞結(jié)果中各分詞的詞性;所述詞性包括食品知識(shí)本體詞性和關(guān)系對(duì)象詞性。

將食品知識(shí)本體詞性的分詞和關(guān)系對(duì)象詞性的分詞,組合為所述食品知識(shí)本體和關(guān)系對(duì)象的組合。

以用戶輸入的“哪些物質(zhì)導(dǎo)致肉制品致癌?”這個(gè)自然語(yǔ)言構(gòu)成的句子為例,對(duì)其進(jìn)行分詞,生成詞組:“肉制品”,“導(dǎo)致……致癌”,“哪些物質(zhì)”,之后對(duì)這些詞組進(jìn)行分析,“肉制品”是食品知識(shí)本體,“導(dǎo)致……致癌”是關(guān)系對(duì)象。

步驟160、基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果。

參照?qǐng)D1A,示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖,在語(yǔ)義查詢中過(guò)程中要計(jì)算相似度,包括:

將查詢串中的食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

一方面,如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與查詢串中對(duì)應(yīng)食品知識(shí)本體相應(yīng)的關(guān)系對(duì)象之間的第二相似度;

將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象;

并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果。

另一方面,如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則對(duì)所述分詞結(jié)果進(jìn)行擴(kuò)展,得到對(duì)應(yīng)各食品知識(shí)本體的擴(kuò)展集合,所述擴(kuò)展集合包括至少一個(gè)擴(kuò)展的食品知識(shí)本體;

將每個(gè)擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與具有關(guān)系對(duì)象的分詞之間的第二相似度;

將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象;

并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果。

如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則返回空值。

本發(fā)明中相似度分析方法借鑒了語(yǔ)言學(xué)中的語(yǔ)義距離的計(jì)算與感知。

相似度定義:設(shè)t1和t2是食品安全知識(shí)本體中的兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象,S(t1,t2)表示這兩個(gè)食品知識(shí)本體或關(guān)系對(duì)象之間的相似程度,則有公式:

<mrow> <mi>S</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&delta;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>2</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>&theta;</mi> <mi>i</mi> </msub> </mrow>

其中,n是食品知識(shí)本體或關(guān)系對(duì)象t1和t2在食品安全知識(shí)本體庫(kù)中食品知識(shí)本體所具有的最大深度。例如:t1和t2兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象在食品安全知識(shí)本體庫(kù)中分屬于第j層和第k層。此時(shí),n=max(j,k)。θi是權(quán)重(可取)。δi(t1,t2)的取值定義如下:

根據(jù)實(shí)際需要,可以對(duì)上述公式中的權(quán)值θi進(jìn)行調(diào)整。

下面,對(duì)公式進(jìn)行進(jìn)一步說(shuō)明。當(dāng)t1,t2兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象在“同一支”上,且其在食品安全知識(shí)本體庫(kù)中分屬于第j層和第k層,則存在前min(j,k)個(gè)父類相同,0<S≤1,當(dāng)且僅當(dāng)t1,t2兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象所在深度相同時(shí),S=1;當(dāng)t1,t2兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象在“不同支”上,則無(wú)相同父類,則S=0,表示相似程度為0。

可以看出,S的范圍為0~1,當(dāng)S的值較大時(shí),兩個(gè)食品知識(shí)本體或者關(guān)系對(duì)象之間的相似程度越大。

參照?qǐng)D1C示出了本發(fā)明的食品安全知識(shí)本體庫(kù)部分結(jié)構(gòu)示意圖:

以用戶輸入的“哪些物質(zhì)導(dǎo)致肉制品致癌?”這個(gè)自然語(yǔ)言構(gòu)成的句子為例,分詞后得到“肉制品”和“導(dǎo)致……致癌”;

若食品安全知識(shí)本體庫(kù)中存在“肉制品”“導(dǎo)致……致癌”,則在運(yùn)用相似度公式時(shí),可以得到相似度為1的結(jié)果,直接確定查詢對(duì)象;

若知識(shí)本體庫(kù)中不同時(shí)直接存在“肉制品”和“導(dǎo)致……致癌”,且“肉制品”這個(gè)食品知識(shí)本體沒(méi)有“致癌物質(zhì)”這個(gè)關(guān)系對(duì)象,當(dāng)運(yùn)用相似度列表進(jìn)行搜索時(shí),“肉制品”的相似度列表中,“肉類”的相似度強(qiáng),“食品”的相似度弱;“導(dǎo)致……致癌”這一食品知識(shí)本體之間的關(guān)系對(duì)象,與兩部分中的關(guān)系對(duì)象“致癌物質(zhì)”相似度相同。綜上,服務(wù)器會(huì)選擇“肉類”和“致癌物質(zhì)”這個(gè)組合確定查詢對(duì)象,而不是“食品”和“致癌物質(zhì)”這個(gè)組合,選取“肉類”和“致癌物質(zhì)”這個(gè)組合對(duì)應(yīng)的“亞硝酸鹽”和“瘦肉精”。

步驟170、將所述查詢結(jié)果返回給客戶端;

參照?qǐng)D1A,示出了本發(fā)明的系統(tǒng)基本功能結(jié)構(gòu)劃分圖,在語(yǔ)義查詢過(guò)程中,計(jì)算相似度之后要進(jìn)行信息檢索,將查詢結(jié)果返回給客戶端。

參照?qǐng)D1C示出了本發(fā)明的食品安全知識(shí)本體庫(kù)部分結(jié)構(gòu)示意圖:

以用戶輸入的“哪些物質(zhì)導(dǎo)致肉制品致癌?”這個(gè)自然語(yǔ)言構(gòu)成的句子為例,最后將“亞硝酸鹽”和“瘦肉精”返回給用戶。

針對(duì)在先技術(shù),本發(fā)明實(shí)施例具備如下優(yōu)點(diǎn):

根據(jù)本發(fā)明中基于食品安全知識(shí)本體庫(kù),提出了一種食品安全數(shù)據(jù)信息檢索的方法,首先構(gòu)建食品安全知識(shí)本體庫(kù),所所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);然后根據(jù)用戶輸入的查詢串,判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞的組合、還是自然語(yǔ)言,對(duì)于單個(gè)關(guān)鍵詞,將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;對(duì)于關(guān)鍵詞的組合,則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;對(duì)于自然語(yǔ)言,進(jìn)行分詞并得到分詞結(jié)果,根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;最后將查詢結(jié)果返回給用戶。構(gòu)建的食品安全知識(shí)本體庫(kù)中食品知識(shí)本體具有層級(jí)結(jié)構(gòu),且層級(jí)之間通過(guò)關(guān)系對(duì)象關(guān)聯(lián),食品知識(shí)本體之間關(guān)系邏輯嚴(yán)密,對(duì)于用戶查詢的食品安全數(shù)據(jù)的形式進(jìn)行劃分,針對(duì)不同情況分別處理,且對(duì)于復(fù)雜的自然語(yǔ)言可以進(jìn)行分詞處理,由此解決了用戶無(wú)法精確地查找到與需求相關(guān)的資源的問(wèn)題,使得用戶可以比較精確地查找到與需求相關(guān)的資源。

對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。

實(shí)施例二

參照?qǐng)D2,示出了根據(jù)本發(fā)明的一種基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的系統(tǒng)實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:

步驟200,構(gòu)建模塊,用于構(gòu)建食品安全知識(shí)本體庫(kù);所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);

可選地,在步驟200之后,還包括:

步驟205,更新模塊,用于接收用戶對(duì)食品安全知識(shí)本體庫(kù)的更新操作;所述更新操作包括:對(duì)所述食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和/或食品知識(shí)本體之間存在的關(guān)系對(duì)象的添加、修改和刪除。

在所述食品安全知識(shí)本體庫(kù)構(gòu)建之后,用戶可以對(duì)食品安全數(shù)據(jù)進(jìn)行信息檢索。

步驟210,輸入模塊,用于接收客戶端輸入的查詢串;

步驟220,判斷模塊,用于判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞的組合、還是自然語(yǔ)言;

步驟230,關(guān)鍵詞匹配模塊,用于如果所述查詢串是關(guān)鍵詞,則將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;

步驟240,關(guān)鍵詞組合確定模塊,用于如果所述查詢串是關(guān)鍵詞的組合時(shí),則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;

步驟250,分詞模塊,用于如果所述查詢串是自然語(yǔ)言,則對(duì)所述查詢串進(jìn)行分詞,得到分詞結(jié)果,并根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合。

對(duì)所述查詢串進(jìn)行分詞,并利用概念類詞典和關(guān)系類詞典確定分詞結(jié)果中各分詞的詞性;所述詞性包括食品知識(shí)本體詞性和關(guān)系對(duì)象詞性;

將食品知識(shí)本體詞性的分詞和關(guān)系對(duì)象詞性的分詞,組合為所述食品知識(shí)本體和關(guān)系對(duì)象的組合。

步驟260,語(yǔ)義分析模塊,基于所述食品知識(shí)本體和關(guān)系對(duì)象的組合,根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;

一方面,如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體能匹配上:

匹配模塊,用于將查詢串中的食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

第一相似度計(jì)算模塊,用于如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

第二相似度計(jì)算模塊,用于對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與查詢串中對(duì)應(yīng)食品知識(shí)本體相應(yīng)的關(guān)系對(duì)象之間的第二相似度;

總相似度計(jì)算模塊,用于將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇查詢對(duì)象模塊,用于選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象;

查詢結(jié)果獲取模塊,用于根據(jù)所述查詢對(duì)象獲得查詢結(jié)果。

另一方面,如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未能匹配上:

擴(kuò)展模塊,用于如果食品知識(shí)本體的分詞與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則對(duì)所述分詞結(jié)果進(jìn)行擴(kuò)展,得到對(duì)應(yīng)各食品知識(shí)本體的擴(kuò)展集合,所述擴(kuò)展集合包括至少一個(gè)擴(kuò)展的食品知識(shí)本體;

匹配模塊,用于將每個(gè)擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體進(jìn)行匹配;

第一相似度計(jì)算模塊,用于如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體匹配上,則記錄匹配上的食品知識(shí)本體為最高相似度,并計(jì)算該食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的其他的食品知識(shí)本體之間的第一相似度;

第二相似度計(jì)算模塊,用于對(duì)于每個(gè)食品知識(shí)本體所關(guān)聯(lián)的關(guān)系對(duì)象,計(jì)算其與具有關(guān)系對(duì)象的分詞之間的第二相似度;

總相似度計(jì)算模塊,用于將食品知識(shí)本體的第一相似度與關(guān)系該食品知識(shí)本體的關(guān)系對(duì)象的第二相似度相乘,獲得食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度;

選擇查詢對(duì)象模塊,用于選擇食品知識(shí)本體與關(guān)系對(duì)象組合的總相似度排序靠前的N個(gè)組合,查找其查詢對(duì)象;

查詢結(jié)果獲取模塊,用于根據(jù)所述查詢對(duì)象獲得查詢結(jié)果。

如果擴(kuò)展的食品知識(shí)本體與食品安全知識(shí)本體庫(kù)的食品知識(shí)本體未匹配上,則返回空值。

步驟270,返回模塊,用于將所述查詢結(jié)果返回給客戶端。

針對(duì)在先技術(shù),本發(fā)明實(shí)施例具備如下優(yōu)點(diǎn):

根據(jù)本發(fā)明中基于食品安全知識(shí)本體庫(kù),提出了一種食品安全數(shù)據(jù)信息檢索的系統(tǒng),首先構(gòu)建食品安全知識(shí)本體庫(kù),所所述食品安全知識(shí)本體庫(kù)包括食品知識(shí)本體和關(guān)系對(duì)象;所述關(guān)系對(duì)象將至少一對(duì)食品知識(shí)本體關(guān)聯(lián);其中,所述關(guān)系對(duì)象包括類別關(guān)系對(duì)象,所述類別關(guān)系對(duì)象將同類別的食品知識(shí)本體中具有父子層級(jí)關(guān)系的食品知識(shí)本體關(guān)聯(lián);不同類別食品知識(shí)本體之間采用非類別關(guān)系對(duì)象進(jìn)行關(guān)聯(lián);然后根據(jù)用戶輸入的查詢串,判斷所述查詢串是關(guān)鍵詞、關(guān)鍵詞的組合、還是自然語(yǔ)言,對(duì)于單個(gè)關(guān)鍵詞,將所述關(guān)鍵詞與食品安全知識(shí)本體庫(kù)進(jìn)行匹配,獲得查詢結(jié)果;對(duì)于關(guān)鍵詞的組合,則根據(jù)該關(guān)鍵詞的組合確定食品知識(shí)本體和關(guān)系對(duì)象的組合;對(duì)于自然語(yǔ)言,進(jìn)行分詞并得到分詞結(jié)果,根據(jù)分詞結(jié)果確定食品知識(shí)本體和關(guān)系對(duì)象的組合;根據(jù)食品安全知識(shí)本體庫(kù)中的食品知識(shí)本體和關(guān)系對(duì)象的組合,確定查詢對(duì)象,并根據(jù)所述查詢對(duì)象獲得查詢結(jié)果;最后將查詢結(jié)果返回給用戶。構(gòu)建的食品安全知識(shí)本體庫(kù)中食品知識(shí)本體具有層級(jí)結(jié)構(gòu),且層級(jí)之間通過(guò)關(guān)系對(duì)象關(guān)聯(lián),食品知識(shí)本體之間關(guān)系邏輯嚴(yán)密,對(duì)于用戶查詢的食品安全數(shù)據(jù)的形式進(jìn)行劃分,針對(duì)不同情況分別處理,且對(duì)于復(fù)雜的自然語(yǔ)言可以進(jìn)行分詞處理,由此解決了用戶無(wú)法精確地查找到與需求相關(guān)的資源的問(wèn)題,使得用戶可以比較精確地查找到與需求相關(guān)的資源。

對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。

在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。

在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。

類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。

本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的基于知識(shí)本體的食品安全數(shù)據(jù)信息檢索的方法及系統(tǒng)設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。

應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1