本發(fā)明涉及數(shù)據(jù)檢索,尤其涉及一種基于知識圖譜的專利文本檢索方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、隨著科學(xué)技術(shù)的爆發(fā)式發(fā)展,海量的數(shù)據(jù)在社會(huì)的各個(gè)領(lǐng)域產(chǎn)生,從海量數(shù)據(jù)中挖掘出跟自身相關(guān)的有效信息成為了一個(gè)研究熱點(diǎn),而專利作為記錄人類成果的載體,包含了大量的科技成果和創(chuàng)新技術(shù)。
2、科學(xué)技術(shù)的快速發(fā)展使得每年的專利申請量急劇增加,專利檢索的需求也相應(yīng)增加,現(xiàn)有的檢索方式中沒有考慮檢索文庫中專利文本本身技術(shù)方案信息的特點(diǎn),僅根據(jù)用戶輸入的較少的關(guān)鍵字進(jìn)行檢索,關(guān)鍵字較少導(dǎo)致的檢索范圍過大,沒有對關(guān)鍵字進(jìn)行上位和下位概念進(jìn)行檢索,導(dǎo)致檢索結(jié)果不精確,造成查全和查準(zhǔn)率低,檢索不方便等問題。
3、因此,亟需提出一種基于知識圖譜的專利文本檢索方法以解決現(xiàn)有技術(shù)中關(guān)鍵字較少導(dǎo)致的檢索范圍過大,檢索結(jié)果不精確的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、為克服相關(guān)技術(shù)中存在的問題,本公開提一種基于知識圖譜的專利文本檢索方法、裝置、設(shè)備和介質(zhì),以解決相關(guān)技術(shù)中關(guān)鍵字較少導(dǎo)致的檢索范圍過大,檢索結(jié)果不精確的技術(shù)問題。
2、本說明書一個(gè)或多個(gè)實(shí)施例提供了一種基于知識圖譜的專利文本檢索方法,包括以下步驟:
3、獲取專利文本中的關(guān)鍵技術(shù)方案信息,使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中的關(guān)鍵詞組和對應(yīng)權(quán)重;
4、根據(jù)所述關(guān)鍵詞組和對應(yīng)權(quán)重構(gòu)建知識圖譜;
5、獲取待檢索詞,獲取待檢索詞,對比所述待檢索詞與所述知識圖譜中的關(guān)鍵詞組,獲取對應(yīng)的檢索關(guān)鍵詞,將所述檢索關(guān)鍵詞按照匹配參數(shù)進(jìn)行排列,以所述檢索關(guān)鍵詞為索引在知識圖譜中進(jìn)行檢索,得到檢索專利集。
6、優(yōu)選地,所述使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中的關(guān)鍵詞組和對應(yīng)權(quán)重,包括步驟:
7、使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中描述技術(shù)方案的詞語組和對應(yīng)的第一權(quán)重;
8、查找所述詞語組中各個(gè)詞語的專利分類號、上位詞語、下位詞語和近似詞語構(gòu)成關(guān)鍵詞組和各個(gè)詞語的專利分類號、上位詞語、下位詞語和近似詞語的對應(yīng)第二權(quán)重;
9、根據(jù)所述關(guān)鍵詞組、所述第一權(quán)重和第二權(quán)重構(gòu)建知識圖譜。
10、優(yōu)選地,還包括步驟:
11、采用自適應(yīng)權(quán)重調(diào)整方法通過第二權(quán)重調(diào)整所述檢索關(guān)鍵詞的排列順序,將所述檢索專利集排序處理并顯示。
12、優(yōu)選地,所述獲取專利文本中的關(guān)鍵技術(shù)方案信息,還包括步驟:
13、獲取所述專利文本的相似專利文本中的關(guān)鍵技術(shù)方案信息。
14、本說明書一個(gè)或多個(gè)實(shí)施例提供了一種基于知識圖譜的專利文本檢索裝置,包括:
15、關(guān)鍵詞組獲取模塊,用于獲取專利文本中的關(guān)鍵技術(shù)方案信息,使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中的關(guān)鍵詞組和對應(yīng)權(quán)重;
16、知識圖譜模塊,用于根據(jù)所述關(guān)鍵詞組和對應(yīng)權(quán)重構(gòu)建知識圖譜;
17、檢索模塊,獲取待檢索詞,對比所述待檢索詞與所述知識圖譜中的關(guān)鍵詞組,獲取對應(yīng)的檢索關(guān)鍵詞,將所述檢索關(guān)鍵詞按照匹配參數(shù)進(jìn)行排列,以所述檢索關(guān)鍵詞為索引在知識圖譜中進(jìn)行檢索,得到檢索專利集。
18、優(yōu)選地,所述關(guān)鍵詞組獲取模塊,具體配置為:
19、使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中描述技術(shù)方案的詞語組和對應(yīng)的第一權(quán)重;
20、查找所述詞語組中各個(gè)詞語的專利分類號、上位詞語、下位詞語和近似詞語構(gòu)成關(guān)鍵詞組和各個(gè)詞語的專利分類號、上位詞語、下位詞語和近似詞語的對應(yīng)第二權(quán)重;
21、根據(jù)所述關(guān)鍵詞組、所述第一權(quán)重和第二權(quán)重構(gòu)建知識圖譜。
22、優(yōu)選地,還包括:顯示模塊,用于采用自適應(yīng)權(quán)重調(diào)整方法通過第二權(quán)重調(diào)整所述檢索關(guān)鍵詞的排列順序,將所述檢索專利集排序處理并顯示。
23、優(yōu)選地,所述關(guān)鍵詞組獲取模塊,還用于獲取所述專利文本的相似專利文本中的關(guān)鍵技術(shù)方案信息。
24、本說明書一個(gè)或多個(gè)實(shí)施例提供了一種計(jì)算機(jī)設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述基于知識圖譜的專利文本檢索方法。
25、本說明書一個(gè)或多個(gè)實(shí)施例提供了一種存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述基于知識圖譜的專利文本檢索方法的步驟。
26、本公開提供的一種基于知識圖譜的專利文本檢索方法、裝置、設(shè)備及介質(zhì),優(yōu)點(diǎn)在于,通過獲取專利文本中的關(guān)鍵技術(shù)方案信息,使用關(guān)鍵詞提取工具提取關(guān)鍵技術(shù)方案信息中的關(guān)鍵詞組和對應(yīng)權(quán)重,將專利文本中與技術(shù)方案相關(guān)的關(guān)鍵詞提取出來并獲取對應(yīng)的權(quán)重,根據(jù)關(guān)鍵詞組和對應(yīng)權(quán)重構(gòu)建知識圖譜,能夠建立跟專利文本內(nèi)容相關(guān)的知識圖譜,獲取待檢索詞,將待檢索詞與知識圖譜中的關(guān)鍵詞進(jìn)行對比分析,獲取對應(yīng)的檢索關(guān)鍵詞,能夠得到更貼近于專利文本內(nèi)容的檢索關(guān)鍵詞,同時(shí)將所述檢索關(guān)鍵詞按照匹配參數(shù)進(jìn)行排列,匹配參數(shù)越大,對應(yīng)的關(guān)鍵詞則越靠前,以所述檢索關(guān)鍵詞為索引在知識圖譜中進(jìn)行檢索,得到檢索專利集,提高檢索的準(zhǔn)確率和效率。
1.一種基于知識圖譜的專利文本檢索方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于知識圖譜的專利文本檢索方法,其特征在于,所述使用關(guān)鍵詞提取工具提取所述關(guān)鍵技術(shù)方案信息中的關(guān)鍵詞組和對應(yīng)權(quán)重,包括步驟:
3.如權(quán)利要求2所述的基于知識圖譜的專利文本檢索方法,其特征在于,還包括步驟:
4.如權(quán)利要求1所述的基于知識圖譜的專利文本檢索方法,其特征在于,所述獲取專利文本中的關(guān)鍵技術(shù)方案信息,還包括步驟:
5.一種基于知識圖譜的專利文本檢索裝置,其特征在于,包括:
6.如權(quán)利要求5所述的基于知識圖譜的專利文本檢索裝置,其特征在于,所述關(guān)鍵詞組獲取模塊,具體配置為:
7.如權(quán)利要求6所述的基于知識圖譜的專利文本檢索裝置,其特征在于,還包括:顯示模塊,用于采用自適應(yīng)權(quán)重調(diào)整方法通過第二權(quán)重調(diào)整所述檢索關(guān)鍵詞的排列順序,將所述檢索專利集排序處理并顯示。
8.如權(quán)利要求5所述的基于知識圖譜的專利文本檢索裝置,其特征在于,所述關(guān)鍵詞組獲取模塊,還用于獲取所述專利文本的相似專利文本中的關(guān)鍵技術(shù)方案信息。
9.計(jì)算機(jī)設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任一項(xiàng)所述基于知識圖譜的專利文本檢索方法。
10.計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任一項(xiàng)所述基于知識圖譜的專利文本檢索方法的步驟。