一種知識查詢方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及知識查詢領(lǐng)域,尤其涉及一種知識查詢方法。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)上的數(shù)據(jù)量大、分布存儲、異構(gòu)和非結(jié)構(gòu)化使得發(fā)現(xiàn)知識的盲目性變高。數(shù)據(jù)龐大的知識信息查詢速度較慢,且準(zhǔn)確率較差,由于每次查詢時都要將待查詢的知識信息進(jìn)行存儲,造成系統(tǒng)內(nèi)存的負(fù)擔(dān)較大,影響了查詢速度。且查詢時需要通過多級檢索才能查詢到符合要求的知識信息,整個過程復(fù)雜,流程較多。
【發(fā)明內(nèi)容】
[0003]針對上述技術(shù)問題,本發(fā)明設(shè)計開發(fā)了一種知識查詢方法,目的在于提高知識查詢的效率和準(zhǔn)確度,同時及時釋放內(nèi)存空間,減小系統(tǒng)壓力。
[0004]本發(fā)明提供的技術(shù)方案為:
[0005]一種知識查詢方法,包括以下步驟:
[0006]步驟一、構(gòu)建知識庫,并將所述知識庫中的每個詞匯按照預(yù)定的標(biāo)號規(guī)則標(biāo)號,且按照預(yù)定的編碼規(guī)則編碼存儲所述詞匯及其關(guān)聯(lián)的信息;
[0007]步驟二、從數(shù)據(jù)源中調(diào)取待查詢的數(shù)據(jù)包,并緩存到解壓縮單元進(jìn)行解壓縮,讀取從所述數(shù)據(jù)包中解壓出來的每個文件中的詳細(xì)信息,并查找出每個文件中出現(xiàn)頻率大于預(yù)定個數(shù)的關(guān)鍵詞,將該關(guān)鍵詞以預(yù)定的標(biāo)號規(guī)則標(biāo)號,且同時以預(yù)定的編碼規(guī)則將該關(guān)鍵詞編碼,并存儲到所述步驟一的知識庫的臨時存儲區(qū)中,按照預(yù)定的編碼規(guī)則查詢所述臨時存儲區(qū)中的關(guān)鍵詞與所述知識庫中預(yù)先存儲的詞匯是否相同,若相同,則將所述臨時存儲區(qū)中的關(guān)鍵詞清空,并將查找到的所述知識庫中的詞匯及其關(guān)聯(lián)的信息復(fù)制存儲到讀取區(qū),若不相同,則將所述臨時存儲區(qū)中的關(guān)鍵詞移動到所述知識庫中,同時將該關(guān)鍵詞復(fù)制存儲到讀取區(qū);
[0008]其中,按照預(yù)定的編碼規(guī)則查詢所述臨時存儲區(qū)中的關(guān)鍵詞與所述知識庫中預(yù)先存儲的詞匯是否相同的方法為:依次比較每一個關(guān)鍵詞的編碼與所述知識庫中預(yù)先存儲的詞匯的編碼的重復(fù)率,若重復(fù)率大于90%,則判定二者相同,若重復(fù)率為80?90%,則將所述知識庫中預(yù)先存儲的該詞匯關(guān)聯(lián)的信息與所述臨時存儲區(qū)中的關(guān)鍵詞建立關(guān)聯(lián),作為該關(guān)鍵詞的最接近的關(guān)聯(lián)信息,與該關(guān)鍵詞同時復(fù)制存儲到讀取區(qū),若重復(fù)率小于80%,則判定二者不相同。
[0009]優(yōu)選的是,所述的知識查詢方法中,所述步驟二中還包括:
[0010]在按照預(yù)定的編碼規(guī)則查詢之前,按照所述臨時存儲區(qū)中的關(guān)鍵詞的標(biāo)號依次查詢所述知識庫中預(yù)先存儲的詞匯的標(biāo)號,若存在標(biāo)號相同的詞匯,則判定二者相同,查詢結(jié)束,將所述臨時存儲區(qū)中的關(guān)鍵詞清空,并將查找到的所述知識庫中的詞匯及其關(guān)聯(lián)的信息復(fù)制存儲到讀取區(qū);若不存在標(biāo)號相同的詞匯,則按照預(yù)定的編碼規(guī)則繼續(xù)查詢。
[0011]優(yōu)選的是,所述的知識查詢方法中,所述步驟一中利用可視化建模工具構(gòu)建知識庫。
[0012]優(yōu)選的是,所述的知識查詢方法中,所述步驟二中的數(shù)據(jù)包經(jīng)壓縮后存儲在所述數(shù)據(jù)源中。
[0013]優(yōu)選的是,所述的知識查詢方法中,所述關(guān)鍵詞的預(yù)定個數(shù)為10?15個。
[0014]優(yōu)選的是,所述的知識查詢方法中,所述預(yù)定的標(biāo)號規(guī)則為:標(biāo)號首位按照詞匯首字母的排序標(biāo)號,標(biāo)號次位按照該詞匯的第二個字母的排序標(biāo)號,依次類推完成標(biāo)號。
[0015]本發(fā)明所述的知識查詢方法中,首先在解壓縮后的數(shù)據(jù)包中查找關(guān)鍵詞,然后按照關(guān)鍵詞的標(biāo)號在所述知識庫中進(jìn)行查詢,相比于直接查詢關(guān)鍵詞,提高了查詢效率。若不存在標(biāo)號相同的詞匯,則按照預(yù)定的編碼規(guī)則繼續(xù)查詢,通過依次比較每一個關(guān)鍵詞的編碼與所述知識庫中預(yù)先存儲的詞匯的編碼的重復(fù)率進(jìn)行查詢,簡化了查詢步驟,同時提高了查詢的準(zhǔn)確度,且在查詢到相應(yīng)的信息后,及時釋放臨時存儲區(qū)的空間,減小了整個系統(tǒng)的壓力。
【附圖說明】
[0016]圖1是本發(fā)明所述的知識查詢方法的流程示意圖。
【具體實施方式】
[0017]下面結(jié)合附圖對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實施。
[0018]如圖1所示,本發(fā)明提供一種知識查詢方法,包括以下步驟:
[0019]步驟一、構(gòu)建知識庫,并將所述知識庫中的每個詞匯按照預(yù)定的標(biāo)號規(guī)則標(biāo)號,以方便通過標(biāo)號快速查詢,且按照預(yù)定的編碼規(guī)則編碼存儲所述詞匯及其關(guān)聯(lián)的信息,以減小占用空間。知識庫中包含各個領(lǐng)域的所有詞匯及其關(guān)聯(lián)的信息,每個領(lǐng)域的詞匯構(gòu)成其特有的知識庫。
[0020]步驟二、從數(shù)據(jù)源中調(diào)取待查詢的數(shù)據(jù)包,并緩存到解壓縮單元進(jìn)行解壓縮,讀取從所述數(shù)據(jù)包中解壓出來的每個文件中的詳細(xì)信息,并查找出每個文件中出現(xiàn)頻率大于預(yù)定個數(shù)的關(guān)鍵詞,該關(guān)鍵詞因在該文件中出現(xiàn)的頻率較高,因此作為該文件的重要詞頻,即查詢時的目標(biāo)對象。將該關(guān)鍵詞以預(yù)定的標(biāo)號規(guī)則標(biāo)號,該預(yù)定的標(biāo)號規(guī)則與知識庫中的詞匯的預(yù)定的標(biāo)號規(guī)則相同,使用同一標(biāo)號規(guī)則,便于在知識庫中進(jìn)行快速查詢。且同時以預(yù)定的編碼規(guī)則將該關(guān)鍵詞編碼,該預(yù)定的編碼規(guī)則與知識庫中詞匯的編碼規(guī)則相同,使用同一編碼規(guī)則,使得查詢時不需解碼即可快速判定兩個詞匯是否相同,節(jié)省占用空間的同時,簡化了查詢程序。將編碼后的關(guān)鍵詞存儲到所述步驟一的知識庫的臨時存儲區(qū)中,按照預(yù)定的編碼規(guī)則查詢所述臨時存儲區(qū)中的關(guān)鍵詞與所述知識庫中預(yù)先存儲的詞匯是否相同,即編碼是否相同,若相同,則表明已在現(xiàn)有知識庫中查詢到該關(guān)鍵詞,將所述臨時存儲區(qū)中的關(guān)鍵詞清空,并將查找到的所述知識庫中的詞匯及其關(guān)聯(lián)的信息復(fù)制存儲到讀取區(qū),供查詢者閱讀參考;若不相同,則表明在現(xiàn)有知識庫中沒有存儲該關(guān)鍵詞,將所述臨時存儲區(qū)中的關(guān)鍵詞移動到所述知識庫中,以更新知識庫,同時將該關(guān)鍵詞復(fù)制存儲到讀取區(qū),供查詢者閱讀參考。
[0021]其中,按照預(yù)定的編碼規(guī)則查