專利名稱:一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法,尤其是一種對(duì)電子文檔的內(nèi)容進(jìn)行關(guān) 聯(lián)檢索的方法。
背景技術(shù):
近幾年,辦公自動(dòng)化應(yīng)用在國內(nèi)取得了長(zhǎng)足的進(jìn)步,很多企業(yè)已經(jīng)開始逐步實(shí)施 了辦公自動(dòng)化,所以,日常辦公事務(wù)中產(chǎn)生的電子文檔取代了傳統(tǒng)的紙質(zhì)文檔。和傳統(tǒng)的紙 質(zhì)文檔相比,電子文檔具有便于檢索和統(tǒng)計(jì),久存不壞,修改簡(jiǎn)便,環(huán)保等顯著優(yōu)勢(shì)。對(duì)于文檔的檢索技術(shù),目前使用的是關(guān)鍵字匹配檢索,即查找目標(biāo)文本中是否包 含有要檢索的關(guān)鍵字這種方式進(jìn)行查找,但隨著信息社會(huì)逐步發(fā)展,以內(nèi)容匹配為檢索的 智能檢索方式將更能提高檢索效率,檢索的內(nèi)容也更加全面。所謂以內(nèi)容為匹配檢索就是 查找目標(biāo)文本中是否包含有和要檢索的內(nèi)容有相互聯(lián)系的檢索方式。隨著辦公自動(dòng)化應(yīng)用的進(jìn)一步深入,信息社會(huì)的進(jìn)一步發(fā)展,信息的復(fù)雜程度在 提高。在對(duì)文本檢索時(shí),僅靠關(guān)鍵字檢索出的內(nèi)容并不全面,因?yàn)橛械膬?nèi)容和被檢索內(nèi)容存 在相關(guān)性但字面不同所以不會(huì)被檢索到。因此檢索技術(shù)能對(duì)所搜索的內(nèi)容進(jìn)行人工智能想 象,檢索到和被檢索內(nèi)容相關(guān)的內(nèi)容成了一種需要。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)以上現(xiàn)有技術(shù)存在的不足,提出一種內(nèi)容關(guān)聯(lián)檢索的實(shí) 現(xiàn)方法,從而更好的滿足使用者的需求。本方法的實(shí)現(xiàn)方法主要包括確定檢索關(guān)系圖,關(guān)聯(lián)檢索兩個(gè)階段。確定檢索關(guān)系圖確定搜索關(guān)聯(lián)的路徑及檢索結(jié)果,檢索關(guān)系圖需要人工手動(dòng)輸 入每個(gè)關(guān)鍵字的內(nèi)容及其關(guān)聯(lián)關(guān)系,關(guān)聯(lián)關(guān)系指的是確定該關(guān)鍵字和哪些關(guān)鍵字之間存在 內(nèi)容關(guān)聯(lián)關(guān)系。每個(gè)關(guān)鍵字在圖中以結(jié)點(diǎn)為表現(xiàn)形式,而相互之間的關(guān)系用連接結(jié)點(diǎn)的線 來表示,如此形成了一個(gè)復(fù)雜的檢索關(guān)系圖。關(guān)聯(lián)檢索按照指定的關(guān)鍵字在確定的檢索關(guān)系圖中進(jìn)行關(guān)聯(lián)檢索。先搜索指定 的關(guān)鍵字在圖中有無該節(jié)點(diǎn)定義,如沒有則退出檢索,結(jié)果顯示沒有檢索到內(nèi)容,如檢索到 關(guān)鍵字后,從該節(jié)點(diǎn)出發(fā)沿著連接該結(jié)點(diǎn)的線條檢索到一級(jí)關(guān)聯(lián)內(nèi)容并全部顯示,如用戶 仍需要繼續(xù)檢索更多內(nèi)容,則以第一次檢索到的所有內(nèi)容為集合,對(duì)每個(gè)關(guān)鍵字再進(jìn)行一 次關(guān)聯(lián)檢索搜索到更多內(nèi)容,直到遍歷到圖中所有結(jié)點(diǎn)為止,檢索結(jié)束。如此可實(shí)現(xiàn)文檔內(nèi)容的智能關(guān)聯(lián)檢索。
具體實(shí)施例方式實(shí)施例一 本實(shí)施例是一款具有文檔管理功能的計(jì)算機(jī)軟件,其對(duì)于文檔檢索的方式采用的 是內(nèi)容智能關(guān)聯(lián)檢索。
確定檢索關(guān)系圖確定的結(jié)點(diǎn)是知識(shí)產(chǎn)權(quán),專利,專利名一,專利名二,軟件著作 權(quán),商標(biāo),李處長(zhǎng)(某市申報(bào)專利的聯(lián)系人),某代理事務(wù)所(代理商標(biāo),著作權(quán)申報(bào)等)。其 中的關(guān)系為知識(shí)產(chǎn)權(quán)關(guān)聯(lián)專利,商標(biāo)和軟件著作權(quán),以及專利名一,專利名二,專利關(guān)聯(lián)李 處長(zhǎng),專利名一和專利名二,某代理事務(wù)所,商標(biāo)和軟件著作權(quán)關(guān)聯(lián)某代理事務(wù)所。關(guān)聯(lián)檢索用戶通過系統(tǒng)輸入“知識(shí)產(chǎn)權(quán)”,然后進(jìn)行內(nèi)容關(guān)聯(lián)檢索,第一遍檢索出 的內(nèi)容包括專利,軟件著作權(quán),商標(biāo),專利名一,專利名二,如用戶再提交擴(kuò)大搜索的請(qǐng)求, 則第二次檢索的內(nèi)容為李處長(zhǎng),某代理事務(wù)所。如用戶通過系統(tǒng)輸入“專利”進(jìn)行檢索,則可 以檢索到的結(jié)果為知識(shí)產(chǎn)權(quán),李處長(zhǎng),專利名一,專利名二,如用戶再提交擴(kuò)大搜索的請(qǐng)求, 則第二次檢索的內(nèi)容為商標(biāo),軟件著作權(quán),某代理事務(wù)所三個(gè)內(nèi)容。除上述實(shí)施例外,本發(fā)明還可以有其他實(shí)施方式。凡采用等同替換或等效變換形 成的技術(shù)方案,均落在本發(fā)明要求的保護(hù)范圍。
權(quán)利要求
一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法,其特征在于該檢索方法可以按照檢索內(nèi)容的關(guān)聯(lián)性進(jìn)行檢索。
2.根據(jù)權(quán)利要求1所述一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法,其特征在于這種檢索方法主 要用于電子文檔的檢索。
3.根據(jù)權(quán)利要求2所述一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法,其特征在于這種方法是建立 在一種名為檢索關(guān)系圖的數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上的。全文摘要
本發(fā)明涉及一種內(nèi)容關(guān)聯(lián)檢索的實(shí)現(xiàn)方法,尤其是一種應(yīng)用于電子文檔檢索領(lǐng)域的內(nèi)容關(guān)聯(lián)檢索方法。隨著辦公自動(dòng)化應(yīng)用的進(jìn)一步深入,信息社會(huì)的進(jìn)一步發(fā)展,信息的復(fù)雜程度在提高。在對(duì)文本檢索時(shí),僅靠關(guān)鍵字檢索出的內(nèi)容并不全面,因?yàn)橛械膬?nèi)容和被檢索內(nèi)容存在相關(guān)性但字面不同所以不會(huì)被檢索到。本發(fā)明突破了傳統(tǒng)的限制,可以對(duì)所搜索的內(nèi)容進(jìn)行人工智能想象,依據(jù)檢索關(guān)系圖,檢索到和被檢索內(nèi)容相關(guān)的內(nèi)容。
文檔編號(hào)G06F17/30GK101894103SQ20091002779
公開日2010年11月24日 申請(qǐng)日期2009年5月22日 優(yōu)先權(quán)日2009年5月22日
發(fā)明者李驍淳 申請(qǐng)人:鎮(zhèn)江雅迅軟件有限責(zé)任公司