用于搜索信息的設(shè)備和方法
【專利摘要】本發(fā)明提供一種搜索信息的方法和設(shè)備,該方法用于響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;以及基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。通過該方法,可以充分利用搜索用戶、信息項及其創(chuàng)建者之間的客觀存在的內(nèi)在關(guān)系,從而提高了搜索的準(zhǔn)確度。
【專利說明】用于搜索信息的設(shè)備和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實施方式涉及信息搜索領(lǐng)域,更具體地,涉及一種用于搜索信息的設(shè)備和方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)以及數(shù)據(jù)庫技術(shù)的快速發(fā)展,對信息的搜索已經(jīng)成為廣泛存在的需求,由此引發(fā)了對信息搜索方法的深入研究。
[0003]現(xiàn)有技術(shù)中對信息的搜索往往是針對關(guān)鍵字進(jìn)行的。也即用戶輸入待搜索的關(guān)鍵字,搜素引擎在信息庫中搜索該關(guān)鍵字,并返回相應(yīng)結(jié)果。這些搜索技術(shù)的共同點或者不足在于,它們沒有考慮到搜索所涉及到的各個實體(例如搜索者、所搜索的信息項、以及信息項的創(chuàng)建者等等)之間的可能存在的客觀的、內(nèi)在的聯(lián)系,因此這種搜索是“平面的”,在搜索者、信息項以及其創(chuàng)建者存在其他內(nèi)在關(guān)系時,不能加以利用,從而準(zhǔn)確度較低。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有技術(shù)中存在的上述問題,本說明書提出如下方案。
[0005]根據(jù)本發(fā)明的第一方面,提供一種搜索信息的方法,包括:響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;以及基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。
[0006]在本發(fā)明的可選實現(xiàn)中,所述每個信息項的重要度與以下中的一個或多個相關(guān)聯(lián):所述每個信息項的創(chuàng)建者權(quán)重、所述創(chuàng)建者與所述搜索用戶的相關(guān)性、所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性、所述一個或多個信息項之間的相關(guān)性、所述多個用戶對所述一個或多個信息項的歷史興趣、以及所述創(chuàng)建者對所創(chuàng)建的信息項的影響度。
[0007]在本發(fā)明的可選實現(xiàn)中,所述創(chuàng)建者權(quán)重基于以下中的一個或多個確定:所述創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、所述創(chuàng)建者所創(chuàng)建的各信息項的點擊率、所述創(chuàng)建者所創(chuàng)建的各信息項的歷史評價。
[0008]在本發(fā)明的可選實現(xiàn)中,所述創(chuàng)建者與所述搜索用戶的相關(guān)性基于以下中的一個或多個建立:所述創(chuàng)建者與所述搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識相關(guān)性、地理位置相關(guān)性。
[0009]在本發(fā)明的可選實現(xiàn)中,其中,所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性基于所述搜索用戶與所述其它用戶之間的搜索歷史關(guān)系建立。
[0010]在本發(fā)明的可選實現(xiàn)中,所述多個用戶對所述一個或多個信息項的歷史興趣基于所述多個用戶對所述信息項的點擊歷史和/或所述多個用戶對所述信息項的評價歷史建立。在本發(fā)明的進(jìn)一步可選實現(xiàn)中,在所述歷史興趣的建立過程中,將對彼此具有相關(guān)性的信息項集合中一個信息項的歷史興趣確定為對所述信息項集合中其它信息項的歷史興趣。
[0011]在本發(fā)明的可選實現(xiàn)中,所述創(chuàng)建者對所創(chuàng)建的各信息項的影響度基于所述創(chuàng)建者為創(chuàng)建信息項所耗費的時間和/或所述創(chuàng)建者對所創(chuàng)建的各信息項的評價建立。[0012]在本發(fā)明的可選實現(xiàn)中,所述一個或多個信息項之間的相關(guān)性基于所述一個或多個信息項之間的內(nèi)容相關(guān)性建立。在本發(fā)明的進(jìn)一步可選實現(xiàn)中,所述內(nèi)容相關(guān)性通過用戶、機(jī)器學(xué)習(xí)、和/或分類工具確定。
[0013]在本發(fā)明的可選實現(xiàn)中,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項進(jìn)一步包括:將針對所述關(guān)鍵字的全部搜索結(jié)果中與所述關(guān)鍵字最為關(guān)聯(lián)的部分搜索結(jié)果作為待返回的所述一個或多個信息項。
[0014]在本發(fā)明的可選實現(xiàn)中,在向所述用戶返回所述信息項時,還向所述用戶返回所述信息項的創(chuàng)建者信息。
[0015]在本發(fā)明的可選實現(xiàn)中,所述信息庫包括用于組織內(nèi)部的信息庫,和/或所述信息項包括文檔。
[0016]根據(jù)本發(fā)明的第二方面,提供一種搜索信息的設(shè)備,包括:搜索裝置,被配置為響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;以及篩選裝置,被配置為基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。
[0017]在本發(fā)明的可選實現(xiàn)中,所述每個信息項的重要度與以下中的一個或多個相關(guān)聯(lián):所述每個信息項的創(chuàng)建者權(quán)重、所述創(chuàng)建者與所述搜索用戶的相關(guān)性、所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性、所述一個或多個信息項之間的相關(guān)性、所述多個用戶對所述一個或多個信息項的歷史興趣、以及所述創(chuàng)建者對所創(chuàng)建的信息項的影響度。
[0018]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括創(chuàng)建者權(quán)重確定裝置,被配置為基于以下中的一個或多個確定所述創(chuàng)建者權(quán)重:所述創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、所述創(chuàng)建者所創(chuàng)建的各信息項的點擊率、所述創(chuàng)建者所創(chuàng)建的各信息項的歷史評價。
[0019]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括創(chuàng)建者-用戶相關(guān)性建立裝置,被配置為基于以下中的一個或多個建立所述創(chuàng)建者與所述搜索用戶的相關(guān)性:所述創(chuàng)建者與所述搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識相關(guān)性、地理位置相關(guān)性。
[0020]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括用戶間相關(guān)性建立裝置,被配置為基于所述搜索用戶與所述其它用戶之間的搜索歷史關(guān)系建立所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性。
[0021]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括用戶歷史興趣建立裝置,被配置為基于所述多個用戶對所述信息項的點擊歷史和/或所述多個用戶對所述信息項的評價歷史建立所述多個用戶對所述一個或多個信息項的歷史興趣。在本發(fā)明的進(jìn)一步可選實現(xiàn)中,所述用戶歷史興趣建立裝置可以包括:關(guān)聯(lián)興趣建立裝置,被配置為在所述歷史興趣的建立過程中,將對彼此具有相關(guān)性的信息項集合中一個信息項的歷史興趣確定為對所述信息項集合中其它信息項的歷史興趣。
[0022]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括創(chuàng)建者-信息項影響度建立裝置,被配置為基于所述創(chuàng)建者為創(chuàng)建信息項所耗費的時間和/或所述創(chuàng)建者對所創(chuàng)建的各信息項的評價建立所述創(chuàng)建者對所創(chuàng)建的各信息項的影響度。
[0023]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括信息項間關(guān)系建立裝置,被配置為基于所述一個或多個信息項之間的內(nèi)容相關(guān)性建立所述一個或多個信息項之間的相關(guān)性。在本發(fā)明的進(jìn)一步可選實現(xiàn)中,所述內(nèi)容相關(guān)性通過用戶、機(jī)器學(xué)習(xí)、和/或分類工具確定。[0024]在本發(fā)明的可選實現(xiàn)中,所述設(shè)備還包括部分結(jié)果選取裝置,被配置為將針對所述關(guān)鍵字的全部搜索結(jié)果中與所述關(guān)鍵字最為關(guān)聯(lián)的部分搜索結(jié)果作為待返回的所述一個或多個信息項。
[0025]在本發(fā)明的可選實現(xiàn)中,所述篩選裝置進(jìn)一步被配置為在向所述用戶返回所述信息項時,還向所述用戶返回所述信息項的創(chuàng)建者信息。
[0026]在本發(fā)明的可選實現(xiàn)中,所述信息庫包括用于組織內(nèi)部的信息庫,和/或所述信息項包括文檔。
[0027]通過上述各種實現(xiàn),可以充分利用信息庫中所客觀存在的各種內(nèi)在關(guān)系,從而提高搜索的準(zhǔn)確度。
【專利附圖】
【附圖說明】
[0028]通過結(jié)合附圖對本公開示例性實施方式進(jìn)行更詳細(xì)的描述,本公開的上述以及其它目的、特征和優(yōu)勢將變得更加明顯,其中,在本公開示例性實施方式中,相同的參考標(biāo)號通常代表相同部件。
[0029]圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)100的框圖。
[0030]圖2示出了根據(jù)本發(fā)明示例性實施方式的、用于搜索信息的方法200的流程圖;
[0031]圖3示出了根 據(jù)本發(fā)明示例性實施方式的用戶、信息項以及創(chuàng)建者之間的示例性關(guān)系300的不意圖;
[0032]圖4是示出根據(jù)本發(fā)明實施方式、在例如企業(yè)的組織中,創(chuàng)建者的關(guān)系如何影響?目息項關(guān)系的不意圖400 ;
[0033]圖5示出了根據(jù)本發(fā)明實施方式的高級數(shù)據(jù)流500的示意圖;
[0034]圖6示出了根據(jù)本發(fā)明的用于搜索信息的設(shè)備600的框圖。
【具體實施方式】
[0035]下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實施方式。雖然附圖中顯示了本公開的優(yōu)選實施方式,然而應(yīng)該理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施方式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0036]圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)100的框圖。如圖1所示,計算機(jī)系統(tǒng)100可以包括:CPU(中央處理單元)101、RAM(隨機(jī)存取存儲器)102、ROM(只讀存儲器)103、系統(tǒng)總線104、硬盤控制器105、鍵盤控制器106、串行接口控制器107、并行接口控制器108、顯示控制器109、硬盤110、鍵盤111、串行外部設(shè)備112、并行外部設(shè)備113和顯示器114。在這些設(shè)備中,與系統(tǒng)總線104耦合的有CPU 101、RAM 102、ROM103、硬盤控制器105、鍵盤控制器106、串行控制器107、并行控制器108和顯示控制器109。硬盤110與硬盤控制器105耦合,鍵盤111與鍵盤控制器106耦合,串行外部設(shè)備112與串行接口控制器107耦合,并行外部設(shè)備113與并行接口控制器108耦合,以及顯示器114與顯示控制器109耦合。應(yīng)當(dāng)理解,圖1所述的結(jié)構(gòu)框圖僅僅是為了示例的目的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況增加或減少某些設(shè)備。
[0037]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明可以實現(xiàn)為系統(tǒng)、方法或計算機(jī)程序產(chǎn)品。因此,本公開可以具體實現(xiàn)為以下形式,即:可以是完全的硬件、也可以是完全的軟件(包括固件、駐留軟件、微代碼等),還可以是硬件和軟件結(jié)合的形式,本文一般稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實施例中,本發(fā)明還可以實現(xiàn)為在一個或多個計算機(jī)可讀介質(zhì)中的計算機(jī)程序產(chǎn)品的形式,該計算機(jī)可讀介質(zhì)中包含計算機(jī)可讀的程序代碼。
[0038]可以采用一個或多個計算機(jī)可讀的介質(zhì)的任意組合。計算機(jī)可讀介質(zhì)可以是計算機(jī)可讀信號介質(zhì)或者計算機(jī)可讀存儲介質(zhì)。計算機(jī)可讀存儲介質(zhì)例如可以是一但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式計算機(jī)磁盤、硬盤、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0039]計算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機(jī)可讀的信號介質(zhì)還可以是計算機(jī)可讀存儲介質(zhì)以外的任何計算機(jī)可讀介質(zhì),該計算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0040]計算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限于一無線、電線、光纜、RF等等,或者上述的任意合適的組合。
[0041]可以以一種或多種程序設(shè)計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機(jī)程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言-諸如Java、Smalltalk、C++,還包括常規(guī)的過程式程序設(shè)計語言-諸如”C”語言或類似的程序設(shè)計語言。程序代碼可以完全地在用戶計算機(jī)上執(zhí)行、部分地在用戶計算機(jī)上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機(jī)上部分在遠(yuǎn)程計算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計算機(jī)的情形中,遠(yuǎn)程計算機(jī)可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)-連接到用戶計算機(jī),或者,可以連接到外部計算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
[0042]下面將參照本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機(jī)程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機(jī)程序指令實現(xiàn)。這些計算機(jī)程序指令可以提供給通用計算機(jī)、專用計算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,這些計算機(jī)程序指令通過計算機(jī)或其它可編程數(shù)據(jù)處理裝置執(zhí)行,產(chǎn)生了實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。
[0043]也可以把這些計算機(jī)程序指令存儲在能使得計算機(jī)或其它可編程數(shù)據(jù)處理裝置以特定方式工作的計算機(jī)可讀介質(zhì)中,這樣,存儲在計算機(jī)可讀介質(zhì)中的指令就產(chǎn)生出一個包括實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instructionmeans)的制造品(manufacture)。
[0044]也可以把計算機(jī)程序指令加載到計算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上,使得在計算機(jī)、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計算機(jī)實現(xiàn)的過程,從而使得在計算機(jī)或其它可編程裝置上執(zhí)行的指令能夠提供實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的過程。
[0045]現(xiàn)在參看圖2,圖2示出了根據(jù)本發(fā)明示例性實施方式的、用于搜索信息的方法200的流程圖。根據(jù)方法200,當(dāng)從多個用戶中的搜索用戶接收到關(guān)鍵字時,方法首先進(jìn)到步驟S202,在信息庫中針對該來自于搜索用戶的關(guān)鍵字進(jìn)行搜索,以獲得待返回的一個或多個信息項。本領(lǐng)域技術(shù)人員應(yīng)理解,術(shù)語“信息庫”的范圍是廣義的,其可以包括諸如用于組織(如企業(yè))內(nèi)部的信息庫(或數(shù)據(jù)庫)、對公眾開放的搜索平臺所涉及的信息庫、以及各種網(wǎng)絡(luò)信息庫等。術(shù)語“信息項”的范圍同樣是廣義的。除包括以上所提及的信息庫中的各類信息外,其還可以包括各種文件格式的文檔。文檔的示例可以包括ECM系統(tǒng)或者wikis/eRooms中的文檔,word格式的文檔或者企業(yè)內(nèi)部的各種文檔,但并不局限于此。步驟S202中所進(jìn)行的搜索,可以采用現(xiàn)有技術(shù)中針對關(guān)鍵字進(jìn)行搜索的各種方法來進(jìn)行,所獲得的搜索結(jié)果也是在搜索過程中對關(guān)鍵字進(jìn)行匹配之后所獲得的通常意義的搜索結(jié)果。并且,步驟S202中待返回的一個或多個信息項可以是針對關(guān)鍵字的全部搜索結(jié)果,也可以是經(jīng)篩選的(在搜索結(jié)果數(shù)量巨大時,例如選取與該關(guān)鍵字最為關(guān)聯(lián)的)部分搜索結(jié)果,通常,(作為部分或全部搜索結(jié)果)所返回的信息項的數(shù)目仍然是極大的,具體哪些信息項才是客觀上與搜索用戶的關(guān)系最為密切的信息項,需要進(jìn)一步深入發(fā)掘確定。因此接下來,方法200進(jìn)到步驟S204,基于待返回的一個或多個信息項中每個信息項的重要度,向用戶返回該信息項。至此,方法200結(jié)束。這里,術(shù)語“重要度”也即信息項相對于搜索用戶的重要程度,實際上,針對特定的信息庫而言,搜索獲得的信息項除與搜索針對的關(guān)鍵字相關(guān)之夕卜,通常還隱含了在特定信息庫中所存儲的諸多客觀存在的內(nèi)在聯(lián)系,這些聯(lián)系例如建立于搜索用戶、信息項本身、以及信息項的創(chuàng)建者(以下簡稱為“創(chuàng)建者”,在信息項為文檔的示例中,創(chuàng)建者也可以稱為作者)之間,但是并不局限于此。它們均可能影響到信息項對于搜索用戶的重要程度,從而影響到向用戶返回的搜索結(jié)果。以下參照圖3詳細(xì)說明。
[0046]圖3示出了根據(jù)本發(fā)明示例性實施方式的用戶、信息項以及創(chuàng)建者之間的示例性關(guān)系300的示意圖。示例性關(guān)系300涉及到用戶301、信息項302以及創(chuàng)建者303。它們之間存在如下關(guān)系在現(xiàn)有的搜索技術(shù)中并沒有加以利用:
[0047]1.不同的創(chuàng)建者303之間的關(guān)系
[0048]2.創(chuàng)建者303和用戶301之間的關(guān)系
[0049]3.不同的用戶301之間的關(guān)系
[0050]4.用戶301和信息項302之間的關(guān)系
[0051]5.不同的信息項302之間的關(guān)系
[0052]6.創(chuàng)建者303和信息項302之間的關(guān)系
[0053]不同的創(chuàng)建者303之間的關(guān)系
[0054]不同的信息項創(chuàng)建者303之間的關(guān)系例如涉及創(chuàng)建者之間的部門關(guān)系、職務(wù)關(guān)系、領(lǐng)域知識(domain expertise)關(guān)系、地理位置關(guān)系等。在信息庫是企業(yè)或公司等組織內(nèi)部的信息庫的示例中,可以非常容易地獲知內(nèi)部資源的創(chuàng)建者(例如文檔的作者),并且也可以從組織的簡檔中得到諸如上下級關(guān)系、職銜等身份關(guān)系或者領(lǐng)域知識等等。多個創(chuàng)建者303可能位于相同或不同的地理位置群組或者【技術(shù)領(lǐng)域】群組中,這類信息也可以容易地獲得。此外,創(chuàng)建者還能夠基于興趣將自己注冊到虛擬群組中,或者這類虛擬群組也可以由系統(tǒng)管理員進(jìn)行分配。由于不同創(chuàng)建者在組織(例如企業(yè)或公司)內(nèi)的上述關(guān)系,他們各自的相應(yīng)角色會影響到所創(chuàng)建信息項的重要度,例如,架構(gòu)師所撰寫的規(guī)范在重要度方面應(yīng)當(dāng)高于初級工程師所撰寫的規(guī)范。因此,每個信息項的重要度可能與信息項的創(chuàng)建者本身的權(quán)重相關(guān)聯(lián),該權(quán)重可以基于以下中的一個或多個確定:創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、創(chuàng)建者所創(chuàng)建的各信息項的點擊率以及創(chuàng)建者所創(chuàng)建的各信息項的歷史評價,但是不限于此。其中,創(chuàng)建者所創(chuàng)建的各信息項的點擊率以及創(chuàng)建者所創(chuàng)建的各信息項的歷史評價反映了創(chuàng)建者的歷史行為對創(chuàng)建者權(quán)重的動態(tài)影響。作為對創(chuàng)建者關(guān)系的附帶利用,例如可以在向搜索用戶301返回信息項時,也返回信息項的創(chuàng)建者信息,進(jìn)而可以啟動過程來在有疑問時找到則最可能的咨詢?nèi)航M,該群組的郵件列表或首要聯(lián)系信息也可以同時返回。
[0055]創(chuàng)律者303和用戶301之間的關(guān)系
[0056]與前述類似,信息項的創(chuàng)建者303和用戶301之間的關(guān)系例如涉及創(chuàng)建者與搜索用戶之間的部門關(guān)系、職務(wù)關(guān)系、合作關(guān)系、領(lǐng)域知識關(guān)系以及地理位置關(guān)系等。因此,信息項的重要度也可以與創(chuàng)建者和搜索用戶之間的相關(guān)性關(guān)聯(lián)。該相關(guān)性可以基于創(chuàng)建者與搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識關(guān)系以及地理位置相關(guān)性中的一個或多個建立,但并不局限于此。例如,由與搜索用戶具有相同業(yè)務(wù)單元或功能群組或相同地區(qū)或相同虛擬群組的創(chuàng)建者所生成的這些信息項將具有更高的重要性,由此可以向用戶返回更為準(zhǔn)確的結(jié)果。
[0057]不同的用戶301之間的關(guān)系
[0058]與前述類似,不同的用戶301之間的關(guān)系例如涉及不同用戶301之間的搜索歷史關(guān)系。用戶搜索關(guān)鍵字的歷史可以存儲在系統(tǒng)中以便進(jìn)一步分析,共享最常見事項的搜索用戶會作為相關(guān)的用戶加以對待,而相關(guān)用戶所評價的信息項(將在下文中描述)往往具有更高的重要性。換而言之,針對特定的搜索用戶而言,信息項的重要度可以與該搜索用戶和其他用戶之間的相關(guān)性關(guān)聯(lián)。這里所稱的相關(guān)性包括但不限于用戶的搜索歷史關(guān)系。
[0059]用戶301和信息項302之間的關(guān)系
[0060]用戶301和信息項302之間的關(guān)系可以涉及作為搜索用戶的用戶與搜索返回的信息項之間的交互關(guān)系,例如對信息項的點擊和/或?qū)π畔㈨椀脑u價。通常,搜索用戶301將點擊所返回的結(jié)果以獲得更多詳細(xì)內(nèi)容,因此對結(jié)果的“點擊”意味著創(chuàng)建了用戶和信息項之間的關(guān)系。這是搜索用戶和文檔之間的最簡單關(guān)系。更加高級的關(guān)系包括用戶提升(promote)/削弱(depromote)某結(jié)果的重要度。例如用戶向結(jié)果中的某個信息項添加評論。這類關(guān)系將被利用以作為其它搜索結(jié)果重要度的參考。因此,信息項的重要度可以與用戶對信息項的歷史興趣相關(guān)聯(lián),該歷史興趣例如可以基于用戶對信息項的點擊歷史或評價歷史而建立。從另一角度而言,如在不同的創(chuàng)建者303之間的關(guān)系中所提及的,當(dāng)眾多搜索用戶301都查看/提升某信息項302時,該信息項的創(chuàng)建者303所創(chuàng)建的其它各信息項302的重要性也將能夠提升,也即用戶和信息項之間的關(guān)系又反過來影響了不同創(chuàng)建者之間的關(guān)系。
[0061]不同的信息項302之間的關(guān)系
[0062]不同的信息項302之間也存在有待發(fā)掘的關(guān)系,例如信息項之間的內(nèi)容相關(guān)性或相似度。當(dāng)包括一個或多個信息項的搜索結(jié)果被返回給搜索用戶301時,用戶301可以向結(jié)果例如添加標(biāo)簽,并且他們還可以將不同的結(jié)果進(jìn)行鏈接,鏈接頁面的默認(rèn)的值可以是“相關(guān)”。用戶還可以指定更為準(zhǔn)確的一個結(jié)果,比如用于進(jìn)一步復(fù)制的副本。在本發(fā)明的可選實施方式中,該內(nèi)容相關(guān)性的確定通過與終端用戶的交互來完成,或者可以通過機(jī)器學(xué)習(xí)或基于(例如公司優(yōu)化分類學(xué)的)分類工具來完成。不同信息項之間的關(guān)系對某一信息項的重要度的影響可能并非是直接的,例如其可以通過如下方式進(jìn)行:將具有相關(guān)性的信息項進(jìn)行聚類或形成集合,在如前所述建立用戶對信息項的歷史興趣時,將對集合中一個信息項具有歷史興趣也認(rèn)為對該集合中的其他信息項也具有興趣。而具有相同興趣的用戶例如可以視為前述的“相關(guān)用戶”,這轉(zhuǎn)而影響了用戶之間的關(guān)系。
[0063]創(chuàng)律者303和信息項302之間的關(guān)系
[0064]創(chuàng)建者303和信息項302之間的關(guān)系例如涉及一個創(chuàng)建者為創(chuàng)建某一信息項所耗費的時間和/或該創(chuàng)建者對其所創(chuàng)建的某一信息項的評價,在本文中也將這些因素稱為創(chuàng)建者對所創(chuàng)建的信息項的影響度。同一創(chuàng)建者所創(chuàng)建的信息項的重要度并不等同,它們具有不同的意義,例如花費了作者一年心血的文檔對于整個公司來說應(yīng)當(dāng)具有更高的價值,并且其最終得分應(yīng)當(dāng)比普通文檔要高。對于那些作者最為推薦的文檔來說也是一樣。因此,信息項的重要度還可與信息項的創(chuàng)建者對所創(chuàng)建的信息項的影響度相關(guān)聯(lián)。
[0065]以上參照圖3詳細(xì)說明了用戶、信息項以及創(chuàng)建者三者之間的內(nèi)在關(guān)系。要注意的是,在本發(fā)明的可選實施方式中,可以在初始時,使得信息項(例如文檔)僅具有來自于創(chuàng)建者(例如作者)對重要度的影響,例如,由作者的職務(wù)、領(lǐng)域關(guān)系、作者所耗費的時間或者作者本人的評價等對文檔重要度的影響。隨著系統(tǒng)的不斷演進(jìn),更多的影響因子將起作用,這些影響因子可以基于與用戶交互來進(jìn)行和優(yōu)化,最終反映諸如文檔之類的信息項的真實價值。
[0066]此外,如前文所述,在搜索結(jié)果中對信息項的重要度的應(yīng)用可以僅針對搜索結(jié)果的一部分進(jìn)行。例如僅針對通過搜索關(guān)鍵字所過濾出的比如前500位小型結(jié)果集進(jìn)行,因此工作量并不大。而且,優(yōu)選的,諸如用戶的權(quán)重之類的一些信息并非在運行時計算,而是在離線時計算,并且最終權(quán)重的總信息量并不大,其可以在存儲器中高速緩存,對它們進(jìn)行計算不會花費太長時間。
[0067]還需說明的是,如前所述,上述六個關(guān)系可以相互影響,比如搜索用戶和信息項之間的關(guān)系將影響不同創(chuàng)建者之間的關(guān)系。最終這些關(guān)系的“生態(tài)系統(tǒng)”將達(dá)到平衡狀態(tài)。例如,圖4是示出根據(jù)本發(fā)明實施方式、在例如企業(yè)的組織中,創(chuàng)建者的關(guān)系如何影響信息項關(guān)系的示意圖400。在企業(yè)的組織結(jié)構(gòu)表中,架構(gòu)師(圖4中A)具有若干個報告給他的高級工程師(例如圖4中B和C),這些高級工程師可能也有向其報告的初級工程師(例如圖4中D和E)。架構(gòu)師例如負(fù)責(zé)建筑架構(gòu),工程師們負(fù)責(zé)子組件,那么架構(gòu)師所撰寫的建筑學(xué)文檔(即,信息項)應(yīng)當(dāng)與工程師所撰寫的組件級文檔(即,信息項)具有對應(yīng)的強(qiáng)關(guān)系,如圖4所示。
[0068]圖5示出了根據(jù)本發(fā)明實施方式的高級數(shù)據(jù)流的示意圖。
[0069]如圖所示,在搜索之前,諸如組織機(jī)構(gòu)層級結(jié)構(gòu)(比如信息項創(chuàng)建者之間的關(guān)系等)之類的企業(yè)框架501被映射到關(guān)系存儲庫502中,而由例如全文索引引擎503根據(jù)索引所分析的關(guān)系也被同步到關(guān)系存儲庫502中,并且這些離線演進(jìn)和優(yōu)化的關(guān)系可以被放置到計算系統(tǒng)504的例如搜索結(jié)果處理器的高速緩存中以便使用,這樣,當(dāng)用戶進(jìn)行搜索時,在全文索引引擎503中由例如關(guān)鍵字之類的搜索標(biāo)準(zhǔn)所命中的結(jié)果將不會立即返回給搜索用戶,而是會基于高速緩存中所存儲的相關(guān)內(nèi)容,根據(jù)結(jié)果的重要度來向用戶接口 505返回信息項。并且,搜索用戶與結(jié)果之間交互(包括點擊/提升等)的行為也將被放置到關(guān)系存儲庫502中,用于動態(tài)演進(jìn)整個系統(tǒng)。
[0070]接下來參照圖6進(jìn)一步描述根據(jù)本發(fā)明實施方式的用于搜索信息的設(shè)備600的框圖。
[0071]如圖所示,設(shè)備600包括:搜索裝置601和篩選裝置602,其中搜索裝置601被配置為響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;而篩選裝置602被配置為基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。
[0072]在本發(fā)明的可選實施方式中,每個信息項的重要度可以與以下中的一個或多個相關(guān)聯(lián):所述每個信息項的創(chuàng)建者權(quán)重、所述創(chuàng)建者與所述搜索用戶的相關(guān)性、所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性、所述一個或多個信息項之間的相關(guān)性、所述多個用戶對所述一個或多個信息項的歷史興趣、以及所述創(chuàng)建者對所創(chuàng)建的信息項的影響度。
[0073]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:創(chuàng)建者權(quán)重確定裝置603,被配置為基于以下中的一個或多個確定所述創(chuàng)建者權(quán)重:所述創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、所述創(chuàng)建者所創(chuàng)建的各信息項的點擊率、所述創(chuàng)建者所創(chuàng)建的各信息項的歷史評價。
[0074]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:創(chuàng)建者-用戶相關(guān)性建立裝置604,被配置為基于以下中的一個或多個建立所述創(chuàng)建者與所述搜索用戶的相關(guān)性:所述創(chuàng)建者與所述搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識相關(guān)性、地理位置相關(guān)性。
[0075]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:用戶間相關(guān)性建立裝置605,被配置為基于所述搜索用戶與所述其它用戶之間的搜索歷史關(guān)系建立所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性。
[0076]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:用戶歷史興趣建立裝置606,被配置為基于所述多個用戶對所述信息項的點擊歷史和/或所述多個用戶對所述信息項的評價歷史建立所述多個用戶對所述一個或多個信息項的歷史興趣。在本發(fā)明的進(jìn)一步可選實施方式中,用戶歷史興趣建立裝置606可以包括關(guān)聯(lián)興趣建立裝置610,被配置為在所述歷史興趣的建立過程中,將對彼此具有相關(guān)性的信息項集合中一個信息項的歷史興趣確定為對所述信息項集合中其它信息項的歷史興趣。
[0077]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:創(chuàng)建者-信息項影響度建立裝置607,被配置為基于所述創(chuàng)建者為創(chuàng)建信息項所耗費的時間和/或所述創(chuàng)建者對所創(chuàng)建的各信息項的評價建立所述創(chuàng)建者對所創(chuàng)建的各信息項的影響度。
[0078]在本發(fā)明的可選實施方式中,設(shè)備600還可以包括:信息項間關(guān)系建立裝置608,被配置為基于所述一個或多個信息項之間的內(nèi)容相關(guān)性建立所述一個或多個信息項之間的相關(guān)性。
[0079]在本發(fā)明的可選實施方式中,內(nèi)容相關(guān)性可以通過用戶、機(jī)器學(xué)習(xí)、和/或分類工具確定。[0080]在本發(fā)明的可選實施方式中,搜索裝置601進(jìn)一步包括:部分結(jié)果選取裝置609,被配置為將針對所述關(guān)鍵字的全部搜索結(jié)果中與所述關(guān)鍵字最為關(guān)聯(lián)的部分搜索結(jié)果作為待返回的所述一個或多個信息項。
[0081 ] 在本發(fā)明的可選實施方式中,篩選裝置602進(jìn)一步被配置為在向所述用戶返回所述信息項時,還向所述用戶返回所述信息項的創(chuàng)建者信息。
[0082]在本發(fā)明的可選實施方式中,信息庫611包括用于組織內(nèi)部的信息庫,和/或所述信息項包括文檔。
[0083]至此已經(jīng)描述了本發(fā)明的各種實施方式。通過上述描述可以看出,根據(jù)本發(fā)明的搜索方法和設(shè)備深入挖掘了信息項、信息項創(chuàng)建者以及搜索用戶之間的內(nèi)在的、客觀存在的關(guān)系,并且將這些關(guān)系應(yīng)用于對信息項的搜索之中,使得能夠基于信息項的重要度來返回該信息項,提高了搜索的準(zhǔn)確度。同時,根據(jù)本發(fā)明的方法和設(shè)備還可以是動態(tài)演進(jìn)的,從而使得該方法和設(shè)備還具有自我學(xué)習(xí)和完善的技術(shù)效果。
[0084]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的系統(tǒng)、方法和計算機(jī)程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機(jī)指令的組合來實現(xiàn)。
[0085]以上已經(jīng)描述了本發(fā)明的各實施例,上述說明是示例性的,并非窮盡性的,并且也不限于所披露的各實施例。在不偏離所說明的各實施例的范圍和精神的情況下,對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說許多修改和變更都是顯而易見的。本文中所用術(shù)語的選擇,旨在最好地解釋各實施例的原理、實際應(yīng)用或?qū)κ袌鲋械募夹g(shù)的技術(shù)改進(jìn),或者使本【技術(shù)領(lǐng)域】的其它普通技術(shù)人員能理解本文披露的各實施例。
【權(quán)利要求】
1.一種搜索信息的方法,包括: 響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;以及 基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述每個信息項的重要度與以下中的一個或多個相關(guān)聯(lián):所述每個信息項的創(chuàng)建者權(quán)重、所述創(chuàng)建者與所述搜索用戶的相關(guān)性、所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性、所述一個或多個信息項之間的相關(guān)性、所述多個用戶對所述一個或多個信息項的歷史興趣、以及所述創(chuàng)建者對所創(chuàng)建的信息項的影響度。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述創(chuàng)建者權(quán)重基于以下中的一個或多個確定:所述創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、所述創(chuàng)建者所創(chuàng)建的各信息項的點擊率、所述創(chuàng)建者所創(chuàng)建的各信息項的歷史評價。
4.根據(jù)權(quán)利要求2所述的方法,其中,所述創(chuàng)建者與所述搜索用戶的相關(guān)性基于以下中的一個或多個建立:所述創(chuàng)建者與所述搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識相關(guān)性、地理位置相關(guān)性。
5.根據(jù)權(quán)利要求2所述的方法,其中,所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性基于所述搜索用戶與所述其它用戶之間的搜索歷史關(guān)系建立。
6.根據(jù)權(quán)利要求2所述的方法,其中,所述多個用戶對所述一個或多個信息項的歷史興趣基于所述多個用戶對所述信息項的點擊歷史和/或所述多個用戶對所述信息項的評價歷史建立。
7.根據(jù)權(quán)利要求6所述的方法,其中,在所述歷史興趣的建立過程中,將對彼此具有相關(guān)性的信息項集合中一個信息項的歷史興趣確定為對所述信息項集合中其它信息項的歷史興趣。
8.根據(jù)權(quán)利要求2所述的方法,其中,所述創(chuàng)建者對所創(chuàng)建的各信息項的影響度基于所述創(chuàng)建者為創(chuàng)建信息項所耗費的時間和/或所述創(chuàng)建者對所創(chuàng)建的各信息項的評價建立。
9.根據(jù)權(quán)利要求2所述的方法,其中,所述一個或多個信息項之間的相關(guān)性基于所述一個或多個信息項之間的內(nèi)容相關(guān)性建立。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述內(nèi)容相關(guān)性通過用戶、機(jī)器學(xué)習(xí)、和/或分類工具確定。
11.根據(jù)權(quán)利要求1所述的方法,其中,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項進(jìn)一步包括: 將針對所述關(guān)鍵字的全部搜索結(jié)果中與所述關(guān)鍵字最為關(guān)聯(lián)的部分搜索結(jié)果作為待返回的所述一個或多個信息項。
12.根據(jù)權(quán)利要求1所述的方法,其中,在向所述用戶返回所述信息項時,還向所述用戶返回所述信息項的創(chuàng)建者信息。
13.根據(jù)權(quán)利要求1所述的方法,其中,所述信息庫包括用于組織內(nèi)部的信息庫,和/或所述信息項包括文檔。
14.一種搜索信息的設(shè)備,包括: 搜索裝置,被配置為響應(yīng)于從多個用戶中的搜索用戶接收關(guān)鍵字,在信息庫中進(jìn)行搜索以便獲得待返回的一個或多個信息項;以及 篩選裝置,被配置為基于所述一個或多個信息項中每個信息項的重要度,向所述搜索用戶返回所述信息項。
15.根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述每個信息項的重要度與以下中的一個或多個相關(guān)聯(lián):所述每個信息項的創(chuàng)建者權(quán)重、所述創(chuàng)建者與所述搜索用戶的相關(guān)性、所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性、所述一個或多個信息項之間的相關(guān)性、所述多個用戶對所述一個或多個信息項的歷史興趣、以及所述創(chuàng)建者對所創(chuàng)建的信息項的影響度。
16.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 創(chuàng)建者權(quán)重確定裝置,被配置為基于以下中的一個或多個確定所述創(chuàng)建者權(quán)重:所述創(chuàng)建者的部門、職務(wù)、領(lǐng)域知識、所處的地理位置、所述創(chuàng)建者所創(chuàng)建的各信息項的點擊率、所述創(chuàng)建者所創(chuàng)建的各信息項的歷史評價。
17.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 創(chuàng)建者-用戶相關(guān)性建立裝置,被配置為基于以下中的一個或多個建立所述創(chuàng)建者與所述搜索用戶的相關(guān)性:所述創(chuàng)建者與所述搜索用戶之間的部門相關(guān)性、職務(wù)相關(guān)性、合作關(guān)系、領(lǐng)域知識相關(guān)性、地理位置相關(guān)性。
18.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 用戶間相關(guān)性建立裝置`,被配置為基于所述搜索用戶與所述其它用戶之間的搜索歷史關(guān)系建立所述搜索用戶與所述多個用戶中的其它用戶的相關(guān)性。
19.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 用戶歷史興趣建立裝置,被配置為基于所述多個用戶對所述信息項的點擊歷史和/或所述多個用戶對所述信息項的評價歷史建立所述多個用戶對所述一個或多個信息項的歷史興趣。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中,所述用戶歷史興趣建立裝置進(jìn)一步包括: 關(guān)聯(lián)興趣建立裝置,被配置為在所述歷史興趣的建立過程中,將對彼此具有相關(guān)性的信息項集合中一個信息項的歷史興趣確定為對所述信息項集合中其它信息項的歷史興趣。
21.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 創(chuàng)建者-信息項影響度建立裝置,被配置為基于所述創(chuàng)建者為創(chuàng)建信息項所耗費的時間和/或所述創(chuàng)建者對所創(chuàng)建的各信息項的評價建立所述創(chuàng)建者對所創(chuàng)建的各信息項的影響度。
22.根據(jù)權(quán)利要求15所述的設(shè)備,還包括: 信息項間關(guān)系建立裝置,被配置為基于所述一個或多個信息項之間的內(nèi)容相關(guān)性建立所述一個或多個信息項之間的相關(guān)性。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中,所述內(nèi)容相關(guān)性通過用戶、機(jī)器學(xué)習(xí)、和/或分類工具確定。
24.根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述搜索裝置進(jìn)一步包括: 部分結(jié)果選取裝置,被配置為將針對所述關(guān)鍵字的全部搜索結(jié)果中與所述關(guān)鍵字最為關(guān)聯(lián)的部分搜索結(jié)果作為待返回的所述一個或多個信息項。
25.根據(jù)權(quán)利要求14所述的設(shè)備,其中,篩選裝置進(jìn)一步被配置為在向所述用戶返回所述信息項時,還向所述用戶返回所述信息項的創(chuàng)建者信息。
26.根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述信息庫包括用于組織內(nèi)部的信息庫,和/或所述信息項包括 文檔。
【文檔編號】G06F17/30GK103870520SQ201210571064
【公開日】2014年6月18日 申請日期:2012年12月12日 優(yōu)先權(quán)日:2012年12月12日
【發(fā)明者】陳超, 鐘錢杰, 郭峰, 陳齊彥, 劉晶晶 申請人:伊姆西公司