專利名稱::一種建立文檔間關(guān)聯(lián)關(guān)系的方法和裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及建立文檔間關(guān)聯(lián)關(guān)系的方法和裝置,并且本發(fā)明特別涉及基于用戶對檢索結(jié)果的操作歷史建立文檔間關(guān)聯(lián)關(guān)系的方法和裝置。
背景技術(shù):
:在個人電腦或者網(wǎng)絡(luò)存儲器中通常都存儲有大量的文檔,從形式上看,這些文檔是相互獨立的,而從內(nèi)容上,很多文檔間都存在著直接或者間接的關(guān)聯(lián)關(guān)系。而這些文檔間的關(guān)聯(lián)關(guān)系對于文檔的使用者或者訪問者而言,可能是相當(dāng)重要的信息。比如,某一技術(shù)研發(fā)人員可能想通過查找一篇文檔的其它相關(guān)文檔,從而了解該領(lǐng)域的技術(shù)動態(tài)。然而,現(xiàn)有技術(shù)中并沒有提供文檔為入口,查詢相關(guān)文檔的技術(shù)方案。目前的做法是,用戶必須親自閱讀每個文檔的內(nèi)容,并通過判斷確定文檔間的關(guān)聯(lián)關(guān)系,然后把含有相關(guān)內(nèi)容的文檔存儲在相同的目錄下,從而建立文檔間的關(guān)聯(lián)關(guān)系。通常情況下,用戶會通過樹形目錄(Tree-baseddirectory)的方式對文檔進4亍分類。然而這種記錄文檔間關(guān)系的方法存在明顯的缺陷,其無法記錄不同層次、甚至不同目錄間文檔的關(guān)聯(lián)關(guān)系。比如文檔1講述了如何進行動畫制作的方法,因此該篇文檔被編入名為《指導(dǎo)手冊》的目錄中,然而實際上該篇文在這種情況下,除非用戶事先了解,否則他很難發(fā)現(xiàn)在不同目錄中的文檔間的關(guān)聯(lián)關(guān)系。另外,上述方法需要用戶定期的對樹形目錄進行整理,而目錄整理對于擁有大量數(shù)據(jù)的用戶而言,是一項十分耗時和復(fù)雜的工作?,F(xiàn)有技術(shù)中僅僅提供了建立檢索條件與文檔間相關(guān)程度的判斷方法。該方法特別被應(yīng)用在基于Internet的網(wǎng)絡(luò)搜索中,比如www.delphion.com。在這樣的網(wǎng)絡(luò)搜索中,當(dāng)用戶輸入某一關(guān)鍵詞,如某一專利號時,將會返回一個結(jié)果列表,列表中包括一系列超級鏈接(Hyperlinks),用以連接到對應(yīng)的檢索結(jié)果上,并且所述結(jié)果列表按照與關(guān)鍵詞相關(guān)的程度進行由高到低的排序。相關(guān)程度最高的文檔通常用100%表示。當(dāng)網(wǎng)站在對所述相關(guān)程度進行判斷時,通??紤]的因素是,所述關(guān)鍵詞是否在文章的特定位置出現(xiàn)(如,專利號的位置),以及關(guān)4建詞在整篇文章中出現(xiàn)的個凄t。也就是i兌如果關(guān)4定詞在搜索結(jié)果的特定位置出現(xiàn),或者關(guān)鍵詞在文章中的出現(xiàn)次數(shù)最多,就可以認(rèn)為檢索結(jié)果與所述關(guān)鍵詞最相關(guān)。然而上述方法并不能用于解決本發(fā)明的問題,因為該方法僅僅幫助確定檢索條件與文檔之間的相關(guān)程度,而并不用于確定文檔與文檔之間的關(guān)聯(lián)關(guān)系。如果用戶想要了解與某一文檔相關(guān)的其它文檔時,需要自己閱讀文檔內(nèi)容、總結(jié)關(guān)鍵詞、并輸入搜索引擎進行搜索。這種手工的方法容易出錯,且耗時、費力。并且,該方法對文檔的相關(guān)性沒有任何記憶,當(dāng)用戶無法回憶起兩天前根據(jù)某一關(guān)鍵詞檢索出的相關(guān)文檔時,不得不再次輸入相同的關(guān)鍵詞,進行重新搜索和閱讀。另外,這一方法所反映的相關(guān)關(guān)系是靜態(tài)的,而不是隨著用戶使用體驗可以自動更新的動態(tài)相關(guān)關(guān)系。也就是說雖然某篇文章包含大量的關(guān)鍵詞,但是該文章并不一定是用戶最需要看到的,特別是當(dāng)用戶所選擇的關(guān)鍵詞存在二義性時,搜索引擎檢索出的結(jié)果就經(jīng)常會出現(xiàn)所查非所問的情況,比如當(dāng)用戶輸入檢索詞為"windows"時,包含"窗戶"和視窗軟件的文檔將共同出現(xiàn)在檢索結(jié)果中。因此,需要有一種簡便、動態(tài)的方法,以幫助用戶查找和確定文檔間的相關(guān)關(guān)系。
發(fā)明內(nèi)容為了解決現(xiàn)有技術(shù)的上述問題,本發(fā)明提出了一種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的方法和裝置。當(dāng)用戶使用搜索引擎在存儲器中搜索符合預(yù)定檢索條件(query)的文檔時,搜索引擎會返回一組經(jīng)排序的文檔,作為檢索結(jié)果,這些文檔之間依所述檢索條件彼此相關(guān)。如果用戶進一步點擊檢索結(jié)果中的文檔,并且所述點擊滿足一定的條件,比如超過一定長時間,則可以在一定程度上認(rèn)為該文檔與所述檢索條件確實相關(guān),進而可以推導(dǎo)出,用戶點擊過的檢索結(jié)果文檔之間存在關(guān)聯(lián)關(guān)系。本發(fā)明記錄在用戶檢索過程中所產(chǎn)生的文檔關(guān)聯(lián)關(guān)系,并且在需要的時候?qū)⑦@種關(guān)聯(lián)關(guān)系呈現(xiàn)給用戶。因此,本發(fā)明提供了一種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的方法,其中所述文檔檢索結(jié)果是按照檢索條件進行檢索而得到的文檔結(jié)果,該方法包括監(jiān)測用戶對文檔檢索結(jié)果的操作,并根據(jù)所述操作,獲取用戶選中的文檔;根據(jù)所述用戶選中的文檔,存儲相關(guān)文檔列表;根據(jù)所述相關(guān)文檔列表,獲取文檔間的關(guān)聯(lián)關(guān)系,其中,用至少所述檢索條件來描述所述文檔間的關(guān)聯(lián)關(guān)系。本發(fā)明還提供了一種根據(jù)文檔間的關(guān)聯(lián)關(guān)系查詢相關(guān)文檔的方法,該方法包括接收用戶選擇的入口文檔;查詢與所述入口文檔存在關(guān)聯(lián)關(guān)系的相關(guān)文檔;以及將包含所述相關(guān)文檔的查詢結(jié)果返回給用戶。本發(fā)明還提供了一種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的裝置,其中所述文檔檢索結(jié)果是按照檢索條件進行檢索而得到的文檔結(jié)果,該裝置包括監(jiān)測用戶對文檔檢索結(jié)果的操作,并根據(jù)所述操作,獲取用戶選中的文檔的部件;根據(jù)用戶選中的文檔,存儲存相關(guān)文檔列表的部件;根據(jù)所述相關(guān)文檔列表,獲取文檔間的關(guān)聯(lián)關(guān)系的部件,其中,用至少所述檢索條件來描述所述文檔間的關(guān)聯(lián)關(guān)系。本發(fā)明還提供了一種根據(jù)文檔間的關(guān)聯(lián)關(guān)系查詢相關(guān)文檔的裝置,該裝置包括接收用戶選擇的入口文檔的部件;查詢與所述入口文檔存在關(guān)聯(lián)關(guān)系的相關(guān)文檔的部件;以及將包含所述相關(guān)文檔的查詢結(jié)果返回給用戶的部件。本發(fā)明可以帶來如下優(yōu)點1)確保建立關(guān)系的至少兩個文檔間存在一定的相關(guān)性,由于文檔關(guān)系的建立是基于用戶對檢索結(jié)杲的搡作的,因此本發(fā)明巧妙的利用了用戶的閱讀和判斷能力,通常情況下,只有用戶閱讀超過一定長時間的檢索結(jié)果才會被認(rèn)為是準(zhǔn)確的檢索結(jié)果,從而與其它文檔存在實質(zhì)的聯(lián)系,由此可以減小由于檢索條件的二義性而產(chǎn)生的檢索結(jié)果不穩(wěn)定的問題;2)本發(fā)明文檔間相關(guān)關(guān)系的建立是動態(tài)變化的,由于所述文檔關(guān)系是基于用戶的檢索習(xí)慣不斷更新的,因此其能夠不斷修正以充分的貼近用戶所認(rèn)可的相關(guān)關(guān)系;此外,3)本發(fā)明所建立的文檔間相關(guān)關(guān)系是用戶個性化的,并且4)相關(guān)關(guān)系的建立與查詢都是自動實現(xiàn)的,無需用戶進行額外的操作,本發(fā)明也不涉及復(fù)雜的運算,僅僅利用簡單的計算和存儲方法,不會給系統(tǒng)造成過多的開銷。上述描述大致列舉了本發(fā)明的優(yōu)越之處,通過結(jié)合附圖與本發(fā)明最佳實施例的詳細說明,本發(fā)明的這些以及其它優(yōu)點將更加明顯。本說明中所參考的附圖只用于示例本發(fā)明的典型實施例,不應(yīng)該認(rèn)為是對本發(fā)明范圍的限制。圖1A為現(xiàn)有技術(shù)中用戶檢索程序的界面示意圖。圖1B為現(xiàn)有技術(shù)中搜索引擎返回檢索結(jié)果的界面示意圖。圖2為現(xiàn)有技術(shù)中搜索引擎系統(tǒng)的結(jié)構(gòu)框圖。圖3A為帶有日志收集器的桌面搜索引擎結(jié)構(gòu)框圖。圖3B為針對不同用戶建立不同日志收集器的網(wǎng)絡(luò)搜索引擎結(jié)構(gòu)框圖。圖3C為針對不同用戶建立相同日志收集器的網(wǎng)絡(luò)搜索引擎結(jié)構(gòu)框圖。圖4A為用于建立文檔間關(guān)聯(lián)關(guān)系的桌面搜索引擎系統(tǒng)示意圖。圖4B為用于建立文檔間關(guān)聯(lián)關(guān)系的網(wǎng)絡(luò)搜索引擎系統(tǒng)示意圖。圖5為相關(guān)文檔查詢系統(tǒng)結(jié)構(gòu)框圖。圖6A為根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的流程圖。圖6B為判斷是否需要更新文檔間關(guān)聯(lián)關(guān)系表的流程圖。圖6C為生成/更新文檔間關(guān)聯(lián)關(guān)系表的流程圖。圖7A為根據(jù)已經(jīng)建立的文檔間的關(guān)聯(lián)關(guān)系,查詢與入口文檔相關(guān)的相關(guān)文檔的流程圖。圖7B為先確定檢索條件的排序方式,再確定以所述檢索條件為索引的相關(guān)文檔的排序方式的流程圖。圖7C為先確定相關(guān)文檔的排序方式,再確定以所述相關(guān)文檔為索引的檢索條件的排序方式的流程圖。圖7D為僅確定相關(guān)文檔的排序方式的流程圖。圖8為用戶選擇檢索條件的排列方式的界面示意圖。圖9A-9D為用戶查詢相關(guān)文檔的界面示意圖。圖10A-10C為用戶查詢相關(guān)文檔的結(jié)果的樹形展開圖。具體實施例方式下列討論中,提供大量具體的細節(jié)以幫助徹底了解本發(fā)明。然而,很顯然對于本領(lǐng)域技術(shù)人員來說,即使沒有這些具體細節(jié),并不影響對本發(fā)明的理解。并且應(yīng)該認(rèn)識到,使用如下的任何具體術(shù)語僅僅是為了方便描述,因此,本發(fā)明不應(yīng)當(dāng)局限于只用在這樣的術(shù)語所標(biāo)識和/或暗示的任何特定應(yīng)用中。除非另有說明,本發(fā)明所述的功能可用硬件或軟件或它們的結(jié)合來運行。然而,在一優(yōu)選實施列中,除非另有說明,這些功能是由處理器,如計算機或電子數(shù)據(jù)處理器,按照編碼,如計算機程序編碼,的集成電路來執(zhí)行的。一般來說,為了實現(xiàn)本發(fā)明的實施例而執(zhí)行的方法可以是操作系統(tǒng)或特定應(yīng)用程序的一部分、程序、模塊、對象或指令序列。本發(fā)明的軟件通常包括將由本地計算機呈現(xiàn)成機器可讀格式的眾多指令,因此是可執(zhí)行指令。此外,程序包括相對于程序來說駐留在本地或在存儲器中找到的變量和數(shù)據(jù)結(jié)構(gòu)。另外,下文描述的識別。當(dāng)攜帶指向本發(fā)明的功能的計算機可讀指令時,這樣的信號承載媒體代表本發(fā)明的實施例。首先對本發(fā)明中所涉及的一些術(shù)語進行如下解釋文檔本發(fā)明中所稱的文檔并不限于文本格式的文檔,如doc、ppt、pdf格式的文檔,而可能是任何形式的文檔,包括聲音,視頻、甚至其它可"^丸行文件。檢索條件指搜索引擎系統(tǒng)中用戶輸入的供檢索用的所有條件,包括關(guān)鍵詞、關(guān)鍵詞的領(lǐng)域、檢索文檔的類型、檢索文檔的最近修改時間、檢索文檔的作者,以及其它可能使用的高級選項。文檔檢索結(jié)果列表指利用搜索引擎進行檢索后,返回給用戶的所有文檔的列表。下面參照附圖對本發(fā)明的實施方式進行說明圖1A為現(xiàn)有技術(shù)中用戶檢索程序的界面100示意圖。一般來說,在用戶檢索界面100中,包括若千檢索條件(query)輸入框,用戶可以在這些輸入框中填寫相應(yīng)的檢索式。圖中列出了一些常見的檢索項目,其中關(guān)鍵詞欄110并不表示搜索引擎將嚴(yán)格按照用戶輸入的關(guān)鍵詞lll進行檢索,本領(lǐng)域的普通技術(shù)人員了解,搜索引擎還可以利用模糊搜索技術(shù)對關(guān)鍵詞加以擴展。比如具備一定知識儲備庫(圖中未示出)的搜索引擎,當(dāng)用戶輸入的關(guān)鍵詞111為"貓熊"時,能夠一并搜索含有"熊貓"和"貓熊"的文檔。關(guān)鍵詞領(lǐng)域欄112表示用戶輸入的關(guān)鍵詞111的上位概念,搜索引擎可以提供這一功能以擴展搜索能力。比如具備一定知識儲備庫(圖中未示出)的搜索引擎,當(dāng)用戶輸入的關(guān)鍵詞領(lǐng)域113為"動物"時,搜索引擎能夠?qū)υ撦斎脒M行語義分析,從而檢索出包含各種動物種類的文檔返回給用戶。這類搜索引擎將比較多地應(yīng)用在關(guān)注某一或某些領(lǐng)域的專業(yè)搜索引擎程序中。檢索文檔的類型欄114表示文檔存儲形式,包括doc、txt、pdf、ppt等。檢索條件還可以包括檢索文檔的最近修改時間116和檢索文檔的作者118,以及其它高級選項120。圖中所示的檢索條件可以通過"與"、"或"、"非"的關(guān)系進行組合。因此下文中所述的檢索條件既可以是一個檢索條件,如一個關(guān)鍵詞,也可以是一串檢索式,如若千關(guān)鍵詞的"與""或""非"的邏輯關(guān)系。下述檢索條件的內(nèi)容也并不限于圖中描述的若干示例,而是可以根據(jù)搜索引擎的需要,使用各種特殊的檢索項目。本說明書中所描述的很多實施例都以關(guān)鍵詞為例進行說明,這并不表示其它的檢索條件不能應(yīng)用于本發(fā)明。圖1B為現(xiàn)有技術(shù)中搜索引擎返回檢索結(jié)果的界面100示意圖。所有的檢索結(jié)果134將被顯示在結(jié)果顯示欄132中,盡管圖中未示出,本領(lǐng)域的普通技術(shù)人員可以理解,搜索顯示欄132可以呈現(xiàn)更豐富的檢索結(jié)果134信息,包括檢索結(jié)果134與用戶輸入的關(guān)鍵詞111的相關(guān)程度、檢索結(jié)果134的文檔類型、最近修改日期、作者,還可以包括文檔片斷(snippet),所述片斷信息通常包含與關(guān)鍵詞lll相關(guān)的一段內(nèi)容,以幫助用戶快速了解該檢索結(jié)果134的內(nèi)容。當(dāng)然,用戶可以通過點擊每個檢索結(jié)果查看結(jié)果顯示欄132中文檔的內(nèi)容。圖2為現(xiàn)有技術(shù)中搜索引擎系統(tǒng)200的結(jié)構(gòu)框圖。文檔系統(tǒng)監(jiān)視模塊(FileSystemWatcher)210將從操作系統(tǒng)(圖中未示出)獲取文檔數(shù)據(jù)的變化信息(如生成了一篇新的文檔,或原有文檔被修改),并將所有變化信息傳輸?shù)脚佬心K(crawler)212。爬行模塊用以對文檔進行提取然后交給分析器(Parser)214。分析器214對提取到的文檔內(nèi)容進行分析以用于索引,具體包括分詞、過濾、轉(zhuǎn)換等工作,并將分析結(jié)果存儲到爬行數(shù)據(jù)存儲器(CrawledDataRepository)216。索引器通常用于將文檔表示為一種便于檢索的方式并存儲在索引數(shù)據(jù)庫中,一般采用的方法有矢量空間模型、倒排文檔、概率模型等。圖2中的索引建立模塊(IndexingComponent)218從爬行數(shù)據(jù)存儲器216獲取文檔,首先送到自然語言處理組件(NLP組件Component,NatureLanguageProcess)220,該組件用于對句子、篇章,進行句法分析(如斷句)、語義分析、語用分析等。所述分析結(jié)果將被保存到與之相連的詞匯庫(lexicon)224,如保存一種哈希表(hashtable),其中包含關(guān)鍵詞的列表和指針列表,用于與倒排檔文檔相連接。索引編輯器(Indexer)222與自然語言處理組件220相連,用于對文檔建立索引,并存儲在倒排索引存儲器(InvertedIndexRepository)226中,為用戶檢索所用。檢索排序模塊(RankingSystem)228用于實現(xiàn)用戶檢索關(guān)鍵詞和目標(biāo)文檔匹配度的計算,根據(jù)計算結(jié)果所有符合檢索要求的文檔可以按照相關(guān)度遞減/遞增的順序排列,并返回給用戶。圖2中的檢索排序模塊228包括檢索條件分析器(QueryParser)230、分類器(Sorter)234、組合器(Merger)232,所述檢索條件分析器230用于對從用戶接口236接收到的檢索條件的若干關(guān)鍵詞進行分析,而后在詞匯庫和倒排索引存儲器中進行搜索,通?,F(xiàn)有的搜索引擎都能夠提供基于模糊查找技術(shù)進行的關(guān)鍵詞分析;所述分類器234可以用于對搜索出的文檔進行排序;所述組合器232用于對存儲在不同存儲器中的文檔進行組合。用戶接口(SearchUI)236與用戶輸入輸出裝置(圖中未示出)相連,用于接收用戶輸入的檢索請求,以及接收用戶定制的返回檢索結(jié)果的界面100,并將檢索排序模塊228所排序的檢索結(jié)果,按照用戶定制的界面100進行格式化,最后返回給用戶。圖3A為帶有日志收集器(LogCollector)250的桌面搜索引擎301結(jié)構(gòu)框圖。所謂桌面搜索引擎(desktopsearchengine)是專門用于對本地存儲設(shè)備內(nèi)的數(shù)據(jù)按照用戶需求進行搜索的工具。其與現(xiàn)有技術(shù)的主要不同在于在檢索排序模塊228與用戶接口236之間,增加了一個日志收集器350。收集器350的主要功能是收集用戶對檢索結(jié)果134的操作,并從這些操作中整理出文檔間的相關(guān)關(guān)系。具體而言,曰志收集器350包括日志檢測器(logWatcher)352、日志存儲器(LogRepository)354、日志分析器(LogAnalyzer)356,并且日志收集器350與文牙當(dāng)關(guān)系存^f諸器(DocumentRelationshipRepository)3584目連。當(dāng)用戶向搜索引擎提交檢索條件后,搜索引擎會返回經(jīng)排序的文檔檢索結(jié)果列表(DocumentsList),然后用戶可能根據(jù)檢索結(jié)果的名稱、或者其摘要信息等判斷是否需要打開閱讀該文檔。一般來說,如果用戶打開閱讀某一文檔超過一定長時間(比如5分鐘),就可以判斷該文檔是否是與用戶輸入的關(guān)鍵詞比較相關(guān)的文檔,即相關(guān)文檔,后文將對相關(guān)文檔的判斷方法展開詳細介紹,此處作示例性說明。可以理解,所述的"一定長時間",作為查看時間閥值,可能基于不同的文檔類型有所不同,比如word文檔和pdf格式文檔的查看時間閥值就應(yīng)當(dāng)相對較長,因為用戶閱讀這些文檔并判斷其相關(guān)性通常都要花費比較長的時間,然而如果是html文檔或者圖片文檔,其判斷時間就不需要很長。日志檢測器352可以用于監(jiān)視用戶的檢索行為,以及用戶對檢索結(jié)果134的點擊操作,并把相應(yīng)的信息存儲到日志存儲器354的表1中。<table>tableseeoriginaldocumentpage15</column></row><table>表1檢索結(jié)果用戶操作記錄表在表1的例子中,"文檔檢索結(jié)果"列表存儲的是針對同一檢索條件,所檢索出的IO篇檢索結(jié)果134文檔。"相關(guān)文檔"列表存儲的是,基于用戶對檢索結(jié)果的操作,建立相互之間關(guān)聯(lián)關(guān)系的文檔所組成的列表,如被用戶打開,并且超過合理長時間(如5分鐘)的文檔列表。"其它信息"中存儲的是用戶查看所述相關(guān)文檔的其它信息,如打開文檔進行閱讀的時間,打開文檔進行閱讀的次數(shù)信息,或者用戶點擊某篇文檔時的時間或次序信息等等。注意,表l中所列舉的以一個檢索條件Q1為索引的一行信息,既可以表示在一次檢索行動中、用戶的點擊操作,也可以是用戶在不同時間按照同一檢索條件Ql進行檢索、并對檢索結(jié)果進行的點擊操作,如用戶先后兩次輸入同一關(guān)鍵詞進行檢索,在兩次檢索中,用戶分別選擇了不同的文章打開閱讀。此外,可以理解的是,表l中也可以不保存"文檔檢索結(jié)果,,列表信息,因為產(chǎn)生"相關(guān)文檔列表"后,檢索結(jié)果134中的信息對于本發(fā)明的后續(xù)操作而言就不再重要了。并且,表1中也可以不保存"其它信息",因為這些信息的目的主要是為了后續(xù)步驟中計算相關(guān)程度使用,如果無需對相關(guān)程度進行詳細地計算,而籠統(tǒng)地認(rèn)為所有被用戶點擊超過合理長時間的檢索結(jié)果文檔間都引用相同的相關(guān)程度,那么簡單起見,這一列的信息也可以被忽略。在考慮多種情況時,表l中的"其它信息,,也可以被充分?jǐn)U展,其可以包含用戶打開某一篇文檔進行閱讀的次數(shù)信息,用戶點擊某篇文檔時的時間或次序信息等。通常情況下,我們認(rèn)為,如果一篇檢索結(jié)果134文檔被用戶反復(fù)多次打開閱讀過,那么該篇文檔很可能是與檢索條件密切相關(guān)的文檔;或者也可以認(rèn)為用戶首先打開的某一篇或幾篇文檔可能是與檢索條件存在密切關(guān)系的文檔;當(dāng)然,在另外一些檢索環(huán)境中,也可以認(rèn)為用戶最后打開查看的某一篇或幾篇文檔是與檢索條件存在密切關(guān)系的文檔??偠灾?,這里的"其它信息"所包含的內(nèi)容可以是在后續(xù)步驟中有助于計算相關(guān)程度的,與用戶對檢索結(jié)果的操作有關(guān)的任何信息。日志分析器356將獲取日志存儲器354中表1的信息進行分析,從而計算出文檔之間的相關(guān)性,并保存于文檔關(guān)系存儲器358中的表2。對于表1中的每一個檢索條件下的相關(guān)文檔,表2將以所述檢索條件和相關(guān)程度為參考,為其建立與其它相關(guān)文檔間的關(guān)系。<table>tableseeoriginaldocumentpage17</column></row><table>表2文檔間關(guān)聯(lián)關(guān)系表表2中的行數(shù)據(jù)與列數(shù)據(jù)是從表1中抽取的相關(guān)文檔,行和列的交點對應(yīng)的是一對相關(guān)文檔的相關(guān)關(guān)系數(shù)據(jù)。相關(guān)關(guān)系數(shù)據(jù)包括與表2中一對相關(guān)文檔所正交的檢索條件數(shù)據(jù)以及相關(guān)程度數(shù)據(jù)等。所述相關(guān)程度既可以是基于檢索條件的文檔相關(guān)程度,也可以是文檔間平均相關(guān)程度。所述基于檢索條件的文檔相關(guān)程度表示相對于一個檢索條件而言,兩篇文檔的相關(guān)程度;所述平均相關(guān)程度表示相對于多個檢索條件而言,兩篇文檔間的平均的相關(guān)程度。例如,表中Q1和Q2分別表示兩個檢索條件,100%表示在以Ql為關(guān)鍵詞的檢索結(jié)果操作中,所計算出的文檔1與文檔2的相關(guān)程度,80%表示的是在以Q2為關(guān)鍵詞的檢索結(jié)果操作中,所計算出的文檔1與文檔2的相關(guān)程度,90%表示的是綜合以不同關(guān)鍵詞得出的相關(guān)程度所計算出的兩篇文檔的平均相關(guān)程度。在本例中,90%=(100%+80%)/2。基于同一檢索條件的文檔間的相關(guān)程度的計算可以依據(jù)這樣一種基本假設(shè),即如果某兩篇文檔都與用戶所輸入的關(guān)鍵詞存在密切的關(guān)系,那么這些文檔之間也存在密切關(guān)系,相反如果兩篇文檔中,只有一篇與用戶所輸入的關(guān)鍵詞存在密切的關(guān)系,或者二者與用戶所輸入的關(guān)鍵詞都不相關(guān),那么就不能據(jù)此認(rèn)定兩篇文檔間存在密切關(guān)系。因此,這里所說的相關(guān)程度的計算在很大程度上依賴于表1中所提供的"其它信息"的內(nèi)容。對于文檔間平均相關(guān)程度的計算,應(yīng)當(dāng)由上述的基于不同檢索條件的相關(guān)程度推導(dǎo)出來。當(dāng)然,所述推導(dǎo)通常可以通過加權(quán)平均的形式進行,如下平均相關(guān)程度=(基于Q1的相關(guān)程度x權(quán)重l+基于Q2的相關(guān)程度x權(quán)重2+...+基于QN的相關(guān)程度x權(quán)重N)/N所述每個檢索條件對應(yīng)的權(quán)重,可以通過任何簡單或復(fù)雜的計算實現(xiàn),比如當(dāng)某一關(guān)鍵詞(即檢索條件)在兩篇文章中出現(xiàn)的次數(shù)較多時,可以i人為該關(guān)4建詞相對重要,從而增加其權(quán)重值。為簡單起見,本發(fā)明可以進行若干變形,比如本發(fā)明也可以不記均的相關(guān)程度),而僅僅記錄將一對文相互關(guān)聯(lián)的檢索條件,如下表2A所示。這樣在后續(xù)步驟中,將文檔相關(guān)關(guān)系呈現(xiàn)給用戶時,就不再按照相關(guān)程度進行任何排序,而是可以不分先后順序的將文檔相關(guān)關(guān)系進行顯示。<table>tableseeoriginaldocumentpage18</column></row><table>表2A不記錄相關(guān)程度的文檔間關(guān)聯(lián)關(guān)系表可以理解,表2中的檢索條件,以及基于檢索條件的相關(guān)文檔的相關(guān)程度,也是可以省略的項目(即僅僅記錄文檔間的平均相關(guān)程度),如下表2B所示。這樣在后續(xù)步驟中,將文檔相關(guān)關(guān)系呈現(xiàn)給用戶時,就僅僅顯示與某一文檔存在關(guān)聯(lián)關(guān)系的其它相關(guān)文檔本身,而不能呈現(xiàn)出將二者相關(guān)聯(lián)的檢索條件。<table>tableseeoriginaldocumentpage19</column></row><table>表2B不記錄檢索條件的文檔間關(guān)聯(lián)關(guān)系表此外,表2中的平均相關(guān)程度也是可以忽略的項目,這樣在后續(xù)步驟中,將文檔相關(guān)關(guān)系呈現(xiàn)給用戶時,就不再按照文檔間的平均相關(guān)程度進行排序。在考慮復(fù)雜情況時,表2中的項目也可以進一步擴充,比如表2中還可以記錄某一文檔與某一檢索條件間的相關(guān)程度。所述相關(guān)程度的計算方法是本領(lǐng)域的普通技術(shù)人員能夠理解的,本發(fā)明不再進行詳細描述。同時,搜索引擎系統(tǒng)還可以對表2按照需要進行其它的處理,比如對其所存儲的內(nèi)容進行刪減,以壓縮存儲容量,或者對其所存儲的內(nèi)容進行排序,以為后續(xù)操作之方便??傊?,記錄表2的基本目的在于把表l中"檢索條件到文檔"(querytodocument)的表述4爭4奐為"文檔到文檔,,(documenttodocument)的表述,從而建立文檔間的相關(guān)關(guān)系。圖3A描述了桌面搜索引擎結(jié)構(gòu)框圖,而本發(fā)明并不限于應(yīng)用在如圖4A所示的桌面搜索引擎系統(tǒng)中。而是還可以應(yīng)用到如圖4B的網(wǎng)絡(luò)搜索引擎上。所述網(wǎng)絡(luò)搜索引擎422是指用戶370與服務(wù)器422通過網(wǎng)絡(luò)420連接,而搜索引擎被配置在服務(wù)器上的搜索系統(tǒng)。圖3B為針對不同用戶270建立不同日志收集器350的網(wǎng)絡(luò)搜索引擎302結(jié)構(gòu)框圖。在該結(jié)構(gòu)中服務(wù)器為每一用戶370單獨建立一個曰志收集器350,并針對每一用戶370配置一個與其檢索歷史相對應(yīng)的文檔關(guān)系存儲器358(圖中未示出)。由此服務(wù)器可以向用戶370提供服務(wù),允許用戶370查詢與服務(wù)器上的某一文檔相關(guān)的其它文檔,正是因為服務(wù)器為每一個用戶370建立一個單獨的日志收集器350,本實施例可以保證所述查詢結(jié)果#:充分個性化。圖3C為針對不同用戶370建立相同日志收集器350的網(wǎng)絡(luò)搜索引擎303結(jié)構(gòu)框圖。該結(jié)構(gòu)中服務(wù)器為多個用戶370建立一個共同的日志收集器350,并針對不同用戶370配置一個共享的文檔關(guān)系存儲器358(圖中未示出)。在這一實施例中,可以認(rèn)為不同用戶370相對于日志收集器而言是不加區(qū)分的,或者說視為同一用戶370。這樣做的好處在于,任何一個用戶370對檢索結(jié)果的操作,都可能導(dǎo)致文檔間關(guān)聯(lián)關(guān)系的更新,從而使所述關(guān)聯(lián)關(guān)系能夠充分、全面地反映文檔間的真實相關(guān)狀態(tài)。由此,任何一個用戶370日后訪問所述服務(wù)器時,都可以借鑒基于其它用戶370的檢索歷史(searchhistory)和行為(activity)所建立起來的文檔間的關(guān)聯(lián)關(guān)系。圖5為相關(guān)文檔查詢系統(tǒng)500結(jié)構(gòu)框圖。當(dāng)前述文檔關(guān)系存儲器358中的文檔間關(guān)聯(lián)關(guān)系表(表2)準(zhǔn)備好后,可以使用相關(guān)文檔查詢系統(tǒng)500為用戶4是供相關(guān)文檔查詢服務(wù),用于當(dāng)用戶輸入某一文檔作為查詢?nèi)肟跁r,-使用相關(guān)文檔查詢系統(tǒng)計算與該入口文檔相關(guān)的其它文檔,并將相關(guān)文檔結(jié)果返回給用戶。用戶接口502接收用戶選擇的待查詢文檔,并將其傳送給入口文檔監(jiān)視器504,入口文檔表示用戶以某一文檔為入口,查詢與之存在關(guān)聯(lián)關(guān)系的其它相關(guān)文檔時,所選擇的文檔;入口文檔監(jiān)視器504監(jiān)視用戶所輸入的入口文檔;以此為入口,相關(guān)文檔獲取器506將從文檔關(guān)系存儲器358中獲取與入口文檔相關(guān)的其它文檔;查詢結(jié)果處理器510對相關(guān)文檔獲取器506獲取的相關(guān)文檔進行處理,即對相關(guān)文檔進行排序和篩選;查詢結(jié)果的排序方式存儲器512中存儲著缺省的查詢結(jié)果排序方式,或者通過排序方式控制器516,從用戶接口502獲得的用戶定制的排序方式;最后,經(jīng)過篩選和排序的相關(guān)文檔,通過查詢結(jié)果傳輸器514返回用戶接口502。下面按照方法流程對本發(fā)明進行描述。圖6A為根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的流程圖。首先,在步604,檢測到用戶輸入的檢索條件后,搜索引擎將在步驟606將文檔檢索結(jié)果返回給用戶,并同時生成/更新文檔檢索結(jié)果列表。然后,系統(tǒng)在步驟608監(jiān)測用戶在檢索結(jié)果中逸中的文檔,并且在步驟610判斷該選中文檔是否滿足成為相關(guān)文檔的條件。通常情況下,用戶通過點擊方式選中一篇文檔,本領(lǐng)域的普通技術(shù)人員理解,用戶還可以通過其它方式選中,包括將文檔"另存為",使用快捷鍵等。用戶選中的文檔是否能夠成為相關(guān)文檔,搜索引擎將會有一定的判斷標(biāo)準(zhǔn),通常情況下,用戶打開文檔超過一定長時間,就被認(rèn)為該篇文檔滿足了成為相關(guān)文檔的條件;簡單起見,也可以不進行相關(guān)文檔的判斷,即認(rèn)為只要用戶打開文檔,無論多長時間,都是相關(guān)文檔;在其它情況中,還可以考慮用戶打開某篇文檔進行閱讀的次數(shù)信息,用戶點擊某篇文檔時的時間或次序信息等作為單獨或者相互結(jié)合的判斷標(biāo)準(zhǔn)。在步驟612,當(dāng)判斷用戶選中的文檔滿足成為相關(guān)文檔的條件時,搜索引擎系統(tǒng)生成/更新檢索結(jié)果用戶操作記錄表(表1)的相關(guān)文檔列表和其它信息。至此,檢索結(jié)果用戶操作記錄表被填寫完畢。然而,通常情況下,盡管理論上可以,但實際才乘作中我們并不急于實時的將表l中的內(nèi)容進行分析、整理以生成/更新表2。因為出于節(jié)省系統(tǒng)資源的目的,分析、整理的步驟可以等到系統(tǒng)空閑時進行,或者周期性的進行。因此,在步驟614中,進行判斷,確定是否已經(jīng)達到用戶設(shè)定的表2的更新條件。圖6B描述了這一過程的流程圖。步驟632中,系統(tǒng)檢查表2的更新周期,此更新周期可以被設(shè)定為一天、一周或一個月等,取決于系統(tǒng)配置和用戶需求。在步驟634中,系統(tǒng)檢查當(dāng)前時間是否已經(jīng)到達了所述更新周期,如果已經(jīng)到達,則在步驟636中進一步判斷當(dāng)前的系統(tǒng)是否空閑,如果空閑,并且表1中有新的檢索產(chǎn)生(步驟638),則可以開始生成/更新表2?;氐綀D6A,系統(tǒng)將根據(jù)所述相關(guān)文檔列表,和/或表1中的其它信息,記錄文檔間的關(guān)聯(lián)關(guān)系。在步驟616中,系統(tǒng)計算文檔間的相關(guān)程度,并生成/更新表2。圖6C為生成/更新文檔間關(guān)聯(lián)關(guān)系表的流程圖。在步驟652中,系統(tǒng)確定表1的每一個新檢索條目;并且確定該條目中相關(guān)文檔列表中的每一個文檔作為分析對象(步驟654);以其為行索引,建立表2中的一行(步驟656);并且,以表l中所述被分析文檔的相關(guān)文檔為列索引,建立表2中的一個或多個列(步驟658);然后,存儲所述行索引與列索引所對應(yīng)的檢索條件(步驟660);通過表1中的其它662);最后,生成/更新兩個文檔間的平均相關(guān)程度(步驟664)?;氐綀D6A,在步驟618中,作為優(yōu)選的方式,系統(tǒng)還可以對表2進行處理,比如對表2進行刪減,只有當(dāng)所述相關(guān)程度超過預(yù)定閥值時,才記錄文檔間的相關(guān)關(guān)系。存儲處理后的表2(步驟620)。至此,從"文檔到文檔"的關(guān)系描述建立完畢。下面對相關(guān)文檔的查詢流程進行描述。圖7A為根據(jù)已經(jīng)建立的文檔間的關(guān)聯(lián)關(guān)系,查詢與入口文檔相關(guān)的文檔的流程圖。首先,系統(tǒng)準(zhǔn)備接收用戶將要查詢的入口文檔,在步驟704,系統(tǒng)對用戶的操作界面進行監(jiān)測,確定用戶是否選擇了入口文檔(步驟706)。本領(lǐng)域的普通技術(shù)人員理解,確定用戶的選擇可以以各種方式實現(xiàn),比如圖9A中,通過右鍵點擊文檔"Innovation_matters.pdf,的方式進行選擇,或者圖9B中,通過單擊文檔"AGeneralandFlexibleAccessControlSystem…"的方式進4亍選擇,或者圖9C中,通過輸入文件名的方式進行選擇,或者圖9D中,通過雙擊文檔的圖標(biāo)或鏈接,從而打開文檔,以及其相關(guān)文檔進行查看。當(dāng)接收到用戶選擇的入口文檔后,系統(tǒng)將查詢與所述入口文檔存在關(guān)聯(lián)關(guān)系的相關(guān)文檔。具體而言,在步驟708中,系統(tǒng)查詢表2的行索引,并讀取該行所對應(yīng)的列數(shù)據(jù)和相關(guān)關(guān)系數(shù)據(jù)。在將查詢結(jié)果返回給用戶之前,優(yōu)選的,系統(tǒng)還可以對檢索條件和相關(guān)文檔進行排序。在步驟710中,系統(tǒng)將確定待執(zhí)行的排序方式。總體而言,至少存在三種排序可能,其一、首先對入口文檔相關(guān)的檢索條件進行排序,然后按照每一檢索條件所對應(yīng)的相關(guān)文檔進行排序(其排序結(jié)果參見圖10A);其二、首先對入口文檔的相關(guān)文檔進行排序,然后按照每一相關(guān)文檔所對應(yīng)的檢索條件進行排序(其排序結(jié)果參見圖10B);其三、不對檢索條件進行排序,而是僅僅針對相關(guān)文檔進行整體排序(其排序結(jié)果參見圖10C)。這三種排序方式可以應(yīng)用在圖9A-9D的任何一種查詢界面中,并且這三種排序方式可以單獨或者混合使用,如圖9A中既包含先按照檢索條件的排序方式也同時包含按照相關(guān)文檔的排序方式。與上述三種排序可能相對應(yīng),圖7B給出了與圖IOA相對應(yīng)的流程圖。步驟722中,系統(tǒng)確認(rèn)是否先按照檢索條件進行排序;然后,系統(tǒng)查詢用戶預(yù)定的檢索條件的排序方式(步驟724),如果存在,則以此為待執(zhí)行的排序方式(步驟728),否則以系統(tǒng)缺省的檢索條件的排序方式為待執(zhí)行的排序方式(步驟726);接著,系統(tǒng)查詢以每個檢索條件為索引的相關(guān)文檔的排序方式(步驟730),同樣的,如果存在,則以此為待執(zhí)行的排序方式(步驟734),否則以系統(tǒng)缺省的相關(guān)文檔的排序方式為待執(zhí)行的排序方式(步驟732);最后,返回所確定的兩種排序方式(步驟736和738)。圖7C對應(yīng)于圖IOB。步驟742中,系統(tǒng)確認(rèn)是否先按照相關(guān)文檔進行排序;然后,系統(tǒng)查詢用戶預(yù)定的相關(guān)文檔的排序方式(步驟744),如果存在,則以此為待執(zhí)行的排序方式(步驟748),否則以接著,系統(tǒng)查詢以每個相關(guān)文:當(dāng)為索引的檢索條件^排序方i式(步驟750),同樣的,如果存在,則以此為待執(zhí)行的排序方式(步驟754),否則以系統(tǒng)缺省的檢索條件的排序方式為待執(zhí)行的排序方式(步驟752),最后,返回所確定的兩種排序方式(步驟756和758)。圖7D對應(yīng)于圖IOC。步驟772中,系統(tǒng)確認(rèn)是否僅按照相關(guān)文檔進行排序;然后,系統(tǒng)查詢用戶預(yù)定的相關(guān)文檔的排序方式(步驟774),如果存在,則以此為待執(zhí)行的排序方式(步驟778),否則以系統(tǒng)缺省的相關(guān)文檔的排序方式為待執(zhí)行的排序方式(步驟776);最后,返回所確定的排序方式(步驟780和782)。需要說明的是,所謂排序方式不僅僅表示被排序內(nèi)容的排列順序,還可能包括是否將排序內(nèi)容進行顯示的排列條件。比如在先按照檢索條件進行排序的圖7B和圖IOA所示的例子中,查詢系統(tǒng)必須先要確定返回給用戶的檢索條件的類型,如圖8所示,系統(tǒng)將確定將"關(guān)鍵詞"和"最近修改時間"作為待顯示的檢索條件;而后系統(tǒng)需要確定"關(guān)鍵詞"和"最近修改時間"的先后順序,同時系統(tǒng)還需要確定表2中的多個"關(guān)鍵詞"應(yīng)當(dāng)按照什么方式進行排列,通常情況下,檢索條件都是按照其與入口文檔的相關(guān)程度進行排序的(上文描述過,在表2中可能記錄了檢索條件與文檔間的相關(guān)程度),當(dāng)然,本發(fā)明并不排除其它的排序方式;優(yōu)選的,系統(tǒng)還可以設(shè)定一些閥值,從而僅將那些相關(guān)程度高的檢索條件進行排序。而后系統(tǒng)根據(jù)每一檢索條件,確定與之相關(guān)的相關(guān)文檔的排序方式,同樣優(yōu)選的,盡管理論上可以,實際上系統(tǒng)不必顯示表2中針對一個檢索條件的所有相關(guān)文檔,而是可以設(shè)定一些閥值,從而僅將那些相關(guān)程度高的相關(guān)文檔進行排序顯示,通常情況下,相關(guān)文檔的排序可以是按照基于檢索條件的相關(guān)程度進行的(如表2中的100%和80%)。在圖7C、IOB、7D、IOC的例子中,首先要對相關(guān)文檔進行排序,排序(i文中描述了表2所保;的平均相關(guān)程i):當(dāng)然本發(fā)日;也并不排除其它可能的排列順序。回到圖7A,步驟712中,系統(tǒng)^換照確定的相關(guān)文檔和/或^r索條件的排序方式對入口文檔的相關(guān)文檔進行排序,并將其結(jié)果返回給用戶(步驟714)。返回結(jié)果可以按照各種方式進行,如圖9A中的彈出窗口,或者圖9B、圖9D中的列表,或者圖9C中的樹形結(jié)構(gòu),當(dāng)然也可以通過其它的上文中沒有提到的方式返回結(jié)果。返回結(jié)果后,用戶可能需要點擊查看相關(guān)文檔的內(nèi)容,因此,可以進一步使用日志收集器350查看用戶的操作,并且按照上文所述的方式進一步更新表2中入口文檔與被用戶打開查看的文檔之間的相關(guān)程度。從而確保表2中所記錄的文檔相關(guān)關(guān)系數(shù)據(jù)盡量及時、準(zhǔn)確的反應(yīng)文檔間的真實相關(guān)狀態(tài)。另外,上述各個操作過程可以由存儲在計算機程序產(chǎn)品中的可執(zhí)行程序?qū)崿F(xiàn)。該程序產(chǎn)品定義各實施例的功能,并承載各種信號,包括(但不局限于)1)永久存儲在不可擦寫存儲媒體上的信息;2)存儲在可擦寫存儲媒體上的信息;或3)通過包括無線通信在內(nèi)的通信媒體(如,通過計算機網(wǎng)絡(luò)或電話網(wǎng)絡(luò))傳送到計算機上的信息,特別是包括從因特網(wǎng)和其它網(wǎng)絡(luò)下載的信息。本發(fā)明的各種實施例可以提供許多優(yōu)點,包括已經(jīng)在
發(fā)明內(nèi)容中列舉的,和能夠從技術(shù)方案本身推導(dǎo)出來的。但是無論一個實施例是否取得全部優(yōu)點,并且也無論這樣的優(yōu)點是否被認(rèn)為是取得實質(zhì)性提高,都不應(yīng)構(gòu)成對本發(fā)明的限制。同時,上文中提到的各種實施方式,僅僅是出于說明的目的,本領(lǐng)域的普通技術(shù)人員可以對上述實施方式做出各種修改和變更,而不偏離本發(fā)明的實質(zhì)。本發(fā)明的范圍完全由所附權(quán)利要求書限定。權(quán)利要求1.一種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的方法,其中所述文檔檢索結(jié)果是按照檢索條件進行檢索而得到的文檔結(jié)果,該方法包括監(jiān)測用戶對文檔檢索結(jié)果的操作,并根據(jù)所述操作,獲取用戶選中的文檔;根據(jù)所述用戶選中的文檔,存儲相關(guān)文檔列表;根據(jù)所述相關(guān)文檔列表,獲取文檔間的關(guān)聯(lián)關(guān)系,其中,用至少所述檢索條件來描述所述文檔間的關(guān)聯(lián)關(guān)系。2.如權(quán)利要求1所述的方法,其中所述用戶選中的文檔是在所述檢索結(jié)果中用戶打開瀏覽的文檔。3.如權(quán)利要求2所述的方法,還包括判斷所述用戶選中的文檔是否滿足成為所述相關(guān)文檔的條件,當(dāng)滿足成為所述相關(guān)文檔的條件時,則存儲所述選中的文檔作為相關(guān)文檔;當(dāng)不滿足成為所述相關(guān)文檔的條件時,則不存儲所述選中的文檔作為相關(guān)文檔。4.如權(quán)利要求3所述的方法,其中滿足成為所述相關(guān)文檔的條件開所述選中文檔的次數(shù)超過預(yù)定打開次數(shù),或用戶選中文檔是在預(yù)定時間內(nèi)打開的,或者用戶選中文檔是在預(yù)定打開次序內(nèi)打開的。5.如權(quán)利要求2所述的方法,還包括檢測、并存儲所述相關(guān)文檔的其它信息;以及根據(jù)所述相關(guān)文檔列表和所述其它信息,記錄文檔間的關(guān)聯(lián)關(guān)系。6.如權(quán)利要求5所述的方法,其中所述其它信息包括用戶打開文檔后的持續(xù)時間,或用戶打開同一文檔的次數(shù),或用戶選中文檔的打開時間,或用戶選中文檔的打開次序。7.如權(quán)利要求5所述的方法,其中所述記錄文檔間的關(guān)聯(lián)關(guān)系的步驟還包括根據(jù)至少所述其它信息計算基于至少一個檢索條件的文檔間的相關(guān)程度,并且通過至少所述檢索條件和文檔間的相關(guān)程度來描述所述文檔間的關(guān)聯(lián)關(guān)系。8.如權(quán)利要求5、6或7所述的方法,其中所述記錄文檔間的關(guān)聯(lián)關(guān)系的步驟還包括根據(jù)至少所述其它信息計算文檔間的平均相關(guān)程度,并且通過至少所述檢索條件和文檔間的平均相關(guān)程度來描述所述文檔間的關(guān)聯(lián)關(guān)系。9.如權(quán)利要求1-7中任一權(quán)利要求所述的方法,其中所述記錄文檔間關(guān)聯(lián)關(guān)系的步驟是在系統(tǒng)空閑時進行的。10.根據(jù)權(quán)利要求1-9中任一權(quán)利要求所確定的文檔間的關(guān)聯(lián)關(guān)系查詢相關(guān)文檔的方法,該方法包括接收用戶選擇的入口文檔;查詢與所述入口文檔存在關(guān)聯(lián)關(guān)系的相關(guān)文檔;以及將包含所述相關(guān)文檔的查詢結(jié)果返回給用戶。11.如權(quán)利要求10所述的方法,所述將查詢結(jié)果返回給用戶的步驟進一步包括將與所述入口文檔相關(guān)聯(lián)的檢索條件,以及與所述入口文檔相關(guān)聯(lián)的相關(guān)文檔返回給用戶,其中所述相關(guān)文檔是以所述檢索條件為索引的。12.如權(quán)利要求10所述的方法,所述將查詢結(jié)果返回給用戶的步驟進一步包括將與所述入口文檔相關(guān)聯(lián)的相關(guān)文檔,以及與所述入口文檔相關(guān)聯(lián)的檢索條件返回給用戶,其中所述檢索條件是以所述相關(guān)文檔為索引的。13.如權(quán)利要求11或12所述的方法,還包括確定返回給用戶的檢索條件的排序方式;以及確定返回給用戶的相關(guān)文檔的排序方式。14.如權(quán)利要求10所述的方法,還包括確定返回給用戶的相關(guān)文檔的排序方式。15.如權(quán)利要求10-14中任何一個權(quán)利要求所迷的方法,還包括根據(jù)在所述查詢結(jié)果中用戶選中的相關(guān)文檔,進一步記錄或更新所述相關(guān)文檔與所述入口文檔的相關(guān)程度。16.—種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的裝置,其中所述文檔檢索結(jié)果是按照檢索條件進行檢索而得到的文檔結(jié)果,該裝置包括監(jiān)測用戶對文檔檢索結(jié)果的操作,并根據(jù)所述操作,獲取用戶選中的文檔的部件;根據(jù)用戶選中的文檔,存儲存相關(guān)文檔列表的部件;根據(jù)所述相關(guān)文檔列表,獲取文檔間的關(guān)聯(lián)關(guān)系的部件,其中,用至少所述檢索條件來描述所述文檔間的關(guān)聯(lián)關(guān)系。17.如權(quán)利要求16所述的裝置,其中所述用戶選中的文檔是在所述檢索結(jié)果中用戶打開瀏覽的文檔。18.如權(quán)利要求17所述的裝置,還包括判斷所述用戶選中的文檔是否滿足成為所述相關(guān)文檔的條件的部件,當(dāng)滿足成為所述相關(guān)文檔的條件時,則存儲所述選中的文檔作為相關(guān)文檔;當(dāng)不滿足成為所述相關(guān)文檔的條件時,則不存儲所述選中的文檔作為相關(guān)文檔。19.如權(quán)利要求18所述的裝置,其中滿足成為所述相關(guān)文檔的條件包括用戶打開所述選中文檔的持續(xù)時間超過預(yù)定持續(xù)時間,或用戶打開所述選中文檔的次數(shù)超過預(yù)定打開次數(shù),或用戶選中文檔是在預(yù)定時間內(nèi)打開的,或者用戶選中文檔是在預(yù)定打開次序內(nèi)打開的。20.如權(quán)利要求17所述的裝置,還包括檢測、并存儲所述相關(guān)文檔的其它信息的部件;以及根據(jù)所述相關(guān)文檔列表和所述其它信息,記錄文檔間的關(guān)聯(lián)關(guān)系的部件。21.如權(quán)利要求20所述的裝置,其中所述其它信息包括用戶打開文檔后的持續(xù)時間,或用戶打開同一文檔的次數(shù),或用戶選中文檔的打開時間,或用戶選中文檔的打開次序。22.如權(quán)利要求20或21所述的裝置,其中所述記錄文檔間的關(guān)聯(lián)關(guān)系的部件還包括根據(jù)至少所述其它信息計算基于至少一個檢索條件的文檔間的相關(guān)程度,并且通過至少所述檢索條件和文檔間的相關(guān)程度來描述所述文檔間的關(guān)聯(lián)關(guān)系的部件。23.如權(quán)利要求20、21或22所述的裝置,其中所述記錄文檔間的關(guān)聯(lián)關(guān)系的步驟還包括根據(jù)至少所述其它信息計算文檔間的平均相關(guān)程度,并且通過至少所述檢索條件和文檔間的平均相關(guān)程度來描述所述文檔間的關(guān)聯(lián)關(guān)系的部件。24.根據(jù)權(quán)利要求16-23中任一權(quán)利要求所確定的文檔間的關(guān)聯(lián)關(guān)系查詢相關(guān)文檔的裝置,該裝置包括接收用戶選擇的入口文檔的部件;查詢與所述入口文檔存在關(guān)聯(lián)關(guān)系的相關(guān)文檔的部件;以及將包含所述相關(guān)文檔的查詢結(jié)果返回給用戶的部件。25.如權(quán)利要求24所述的裝置,所述將查詢結(jié)果返回給用戶的部件進一步包括將與所述入口文檔相關(guān)聯(lián)的檢索條件,以及與所述入口文檔相關(guān)聯(lián)的相關(guān)文檔返回給用戶的部件,其中所述相關(guān)文檔是以所述檢索條件為索引的。26.如權(quán)利要求24所述的裝置,所述將查詢結(jié)果返回給用戶的裝置進一步包括將與所述入口文檔相關(guān)聯(lián)的相關(guān)文檔,以及與所述入口文檔相關(guān)聯(lián)的檢索條件返回給用戶的部件,其中所述檢索條件是以所述相關(guān)文檔為索引的。27.如權(quán)利要求25或26所述的裝置,還包括確定返回給用戶的檢索條件的排序方式的部件;以及確定返回給用戶的相關(guān)文檔的排序方式的部件。28.如權(quán)利要求24所迷的裝置,還包括確定返回給用戶的相關(guān)文檔的排序方式的部件。29.如權(quán)利要求24-28中任何一個權(quán)利要求所述的裝置,還包括根據(jù)在所述查詢結(jié)果中用戶選中的相關(guān)文檔,進一步記錄或更新30.—種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括存儲在計算機可讀存儲介質(zhì)中的程序代碼,所述程序代碼用于完成權(quán)利要求1-15中任何一個權(quán)利要求的方法的操作。全文摘要本發(fā)明提出了一種用于根據(jù)用戶對文檔檢索結(jié)果的操作建立文檔間關(guān)聯(lián)關(guān)系的方法和裝置。當(dāng)用戶使用搜索引擎在存儲器中搜索符合預(yù)定檢索條件的文檔時,搜索引擎會返回一組經(jīng)排序的文檔,作為檢索結(jié)果,這些文檔之間依所述檢索條件彼此相關(guān)。如果用戶進一步點擊檢索結(jié)果中的文檔,并且所述點擊滿足一定的條件,比如超過一定長時間,則可以在一定程度上認(rèn)為該文檔與所述檢索條件確實相關(guān),進而可以推導(dǎo)出,用戶點擊過的檢索結(jié)果文檔之間存在關(guān)聯(lián)關(guān)系。本發(fā)明根據(jù)用戶的檢索歷史,和對檢索結(jié)果的操作,記錄文檔間存在的關(guān)聯(lián)關(guān)系,并且在需要的時候?qū)⑦@種關(guān)聯(lián)關(guān)系呈現(xiàn)給用戶。文檔編號G06F17/30GK101097574SQ200610094219公開日2008年1月2日申請日期2006年6月27日優(yōu)先權(quán)日2006年6月27日發(fā)明者王慶波,中蘇,奔費,陳偉柱申請人:國際商業(yè)機器公司