本申請是申請日為2009年7月23日,申請?zhí)枮?00980128749.1,名稱為“聯(lián)合團體搜索”的發(fā)明專利申請的分案申請。
相關申請
本申請要求2008年7月28日提交的美國正式專利申請第12/181,268號的優(yōu)先權(quán),其全部內(nèi)容通過引用被結(jié)合于此。
背景技術:
1.技術領域:
在此公開的主題涉及網(wǎng)絡搜索協(xié)議。
2.信息
在諸如google之類的傳統(tǒng)互聯(lián)網(wǎng)搜索引擎中,僅僅是通過搜索引擎的爬蟲(crawler)技術已搜索和索引(index)的數(shù)據(jù)源可被用戶搜索、獲取和訪問。當用戶查詢傳統(tǒng)的搜索引擎時,用戶通常不是搜索整個互聯(lián)網(wǎng),而實際上是搜索搜索引擎的索引來找到查詢的匹配并隨后訪問數(shù)據(jù)源。數(shù)據(jù)源的示例包括網(wǎng)頁和數(shù)據(jù)庫,但是不限于此。從這樣的所謂基于爬蟲的搜索得到的搜索結(jié)果有很多限制。例如,依賴于搜索引擎的爬蟲技術用來更新具體網(wǎng)站的索引的時間表和時間,搜索結(jié)果可能明顯過期。此外,大量數(shù)據(jù)被包含在由于爬蟲技術的限制和訪問約束而不能被傳統(tǒng)互聯(lián)網(wǎng)搜索引擎訪問的數(shù)據(jù)庫和網(wǎng)頁中。
聯(lián)合搜索(federatedsearch)與傳統(tǒng)的基于爬蟲的搜索不同。聯(lián)合搜索可以由其創(chuàng)建者限定以在預定一組數(shù)據(jù)源中搜索數(shù)據(jù)。聯(lián)合搜索允許用戶利用來自單個用戶界面的單個查詢來搜索多個數(shù)據(jù)源。用戶可以在界面的搜索框中輸入搜索查詢并且該查詢可以被發(fā)送給聯(lián)合搜索中所限定的每個數(shù)據(jù)源。由于聯(lián)合搜索通常包括作為目標的一組數(shù)據(jù)源,所以對于給定查詢,可以提高各個搜索的準確度和關聯(lián)度。此外,相比由基于爬蟲的搜索引擎提供的那些搜索,可以減少搜索目標數(shù)據(jù)源所需要的時間量。所產(chǎn)生的搜索結(jié)果的關聯(lián)度通常依賴于具體的聯(lián)合搜索中所包括的數(shù)據(jù)源的關聯(lián)度。另外,聯(lián)合搜索通常固有地作為各個數(shù)據(jù)源的當前數(shù)據(jù),這是因為它們是被實時地搜索的。
附圖說明
將參考以下附圖來描述非限制性和非窮盡性實施例,其中,若非另外指明,在各個附圖中,類似的標號表示類似的部分。
圖1是能夠通過網(wǎng)絡在客戶端和一個或多個服務器之間建立會話的系統(tǒng)的示意圖;
圖2圖示出根據(jù)一個實施例如顯示裝置上所顯示的網(wǎng)絡瀏覽器;
圖3是圖示出根據(jù)一個實施例的聯(lián)合搜索庫的示例的示圖;
圖4是用于處理聯(lián)合搜索的方法的實施例的流程圖;
圖5是提供用于處理聯(lián)合搜索的方法的實施例的可能的圖形表示的實施例的示圖;
圖6是用于處理聯(lián)合搜索的方法的實施例的流程圖;
圖7是提供用于處理聯(lián)合搜索的方法的實施例的可能的圖形表示的實施例的示圖;
圖8是用于處理聯(lián)合搜索的方法的實施例的流程圖;
圖9是提供用于處理聯(lián)合搜索的方法的實施例的圖形表示的實施例的示圖;
圖10是提供用于處理聯(lián)合搜索的系統(tǒng)的實施例的圖形表示的示圖;以及
圖11是圖示出可以實現(xiàn)實施例的計算機系統(tǒng)的框圖。
具體實施方式
貫穿本說明書,對“一個實施例”或“實施例”的提及是指與該實施例關聯(lián)地描述的具體特征、結(jié)構(gòu)或特點被包括在要求保護的主題的至少一個實施例中。因此,貫穿本說明書的各個地方出現(xiàn)的短語“在一個實施例中”或“實施例”不一定都是指同一實施例。此外,具體的特征、結(jié)構(gòu)或特點可以在一個或多個實施例中被組合。
除非以其他方式特別指明,從以下討論中顯見,可以理解,貫穿本說明書,利用例如諸如“處理”、“計算”、“選擇”、“形成”、“使能”、“抑制”、“識別”、“開始”、“獲取”、“托管(host)”、“維護”、“呈現(xiàn)”、“修改”、“接收”、“發(fā)送”、“建立”、“確定”等的術語進行的討論是指可以通過計算平臺執(zhí)行的動作和/或處理,所述計算平臺例如是計算機或類似的電子計算裝置,其操縱和/或變換在計算平臺的處理器、存儲器、寄存器和/或其他信息存儲、發(fā)送、接收和/或顯示裝置內(nèi)被表示為物理電子量和/或磁量和/或其他物理量的數(shù)據(jù)。這樣的動作和/或處理可以在被存儲在存儲介質(zhì)中的機器可讀指令的控制下由計算平臺執(zhí)行。此外,除非以其他方式特別指明,在此參考流程圖或其他方式描述的處理也可以全部或部分由這樣的計算平臺執(zhí)行和/或控制。
圖1是能夠通過網(wǎng)絡104在客戶端104和一個或多個服務器106之間建立會話的系統(tǒng)100的示意圖。網(wǎng)絡104可以采用包括一個或多個數(shù)據(jù)傳輸介質(zhì)的數(shù)據(jù)鏈路(未示出),例如線纜(例如,光纖、雙絞線、同軸線)、衛(wèi)星傳輸鏈路或地面無線傳輸鏈路。然而,這些僅僅是可以用于在網(wǎng)絡中傳輸信息的數(shù)據(jù)傳輸介質(zhì)的示例,并且所要求保護的主題在這方面不受限制。另外,網(wǎng)絡104可以采用用于在源和目的地之間傳輸信息的一個或多個通信協(xié)議,例如,互聯(lián)網(wǎng)協(xié)議(ip)、異步傳輸模式(atm)和/或適于在無線傳輸鏈路上使用的通信協(xié)議。然而,這些僅僅是可以用于在網(wǎng)絡中的源和目的地之間傳輸信息的通信協(xié)議的示例,并且所要求保護的主題在這些方面不受限制。在具體實施例中,網(wǎng)絡104可以包括一個或多種網(wǎng)絡技術和/或配置,例如舉幾個例子,例如一個或多個局域網(wǎng)、一個或多個企業(yè)內(nèi)部網(wǎng)、互聯(lián)網(wǎng)、與企業(yè)內(nèi)部網(wǎng)相對的無線載波基礎架構(gòu)互聯(lián)網(wǎng)和/或無線載波基礎架構(gòu)。盡管在此提供的具體示例在客戶端和服務器之間建立會話,但是應當理解,這樣的實現(xiàn)方式僅僅是為了說明的目的而提供的示例,并且所要求保護的主題不限于這樣的實現(xiàn)方式。例如,也可以通過網(wǎng)絡104在對等的裝置和/或處理之間建立會話。
客戶端102可以包括被托管在計算平臺上的一個或多個處理,該計算平臺通過通信適配器(未示出)可通信地耦接到網(wǎng)絡104。類似地,服務器106可以包括被托管在一個或多個計算平臺上的處理,這些計算平臺通過相關聯(lián)的通信適配器連接到網(wǎng)絡104。在具體實施例中,每個服務器106可以被托管在其自己的關聯(lián)計算平臺上,其自己的關聯(lián)計算平臺與托管其他服務器106的計算平臺不同??商鎿Q地,兩個或多個服務器可以被托管在單個計算平臺上。
客戶端102可以發(fā)起與服務器106的會話,以通過例如建立客戶端102和服務器106可經(jīng)其通過網(wǎng)絡104進行通信的會話來提供服務。客戶端102可以包括被托管在計算平臺上的若干應用程序中的任意一個,例如,電子郵件應用、網(wǎng)絡瀏覽器、文檔處理程序、媒體播放器等。這里,應當理解,客戶端102可被托管在能夠利用網(wǎng)絡進行通信的若干裝置中的任一裝置上和/或在其上被執(zhí)行,例如,舉幾個例子,所述裝置例如是個人計算機、移動電話、個人數(shù)字助理。在具體實施例中,盡管所要求保護的主題在這方面不受限制,但是服務器可以包括適于處理打印任務的打印機、網(wǎng)絡服務器、電子郵件服務器、適于(例如通過流傳輸)分發(fā)音頻或視頻內(nèi)容的內(nèi)容服務器。在具體實施例中,服務器106可以通過單個套接字(socket)地址來尋址。套接字地址可以包括例如組合了ip地址和udp端口號的信息。
這里提及的基于爬蟲的搜索引擎涉及利用爬蟲技術來搜索網(wǎng)絡可訪問數(shù)據(jù)源并索引搜索結(jié)果的搜索引擎。作為對查詢的應答的搜索結(jié)果是從被索引的內(nèi)容中而不是整個網(wǎng)絡中提取的。搜索結(jié)果可以包括鏈接的列表,所述鏈接鏈接到包含被認為與該查詢相關的信息的網(wǎng)頁?;谂老x的搜索引擎可以,在用戶已經(jīng)在查詢字段中輸入查詢并且通過點擊“搜索(search)”、“輸入(enter)”、“開始(go)”或另一開始輸入命令而發(fā)出了查詢之后,提供搜索結(jié)果。這樣的查詢可被與之前通過爬蟲技術收集的搜索結(jié)果的索引相比較。以這種方式獲得的搜索結(jié)果可能包括可能與該查詢的目的并不完全相關的大量“命中(hit)”(例如,網(wǎng)頁鏈接)。
圖2圖示出根據(jù)一個實施例的如顯示裝置220上所顯示的網(wǎng)絡瀏覽器200。顯示裝置220例如可以是托管客戶端的計算平臺的組件,但是不限于此。用戶可以經(jīng)由網(wǎng)絡瀏覽器200在查詢字段202中輸入構(gòu)成查詢208的字符??梢赃x定搜索按鈕206以將查詢208傳送給搜索引擎(未示出)以進行處理。這樣的搜索引擎例如可以在服務器上實現(xiàn),但是不限于此。這里,這樣的搜索引擎可以基于基于爬蟲的被索引的搜索的內(nèi)容來編制與查詢208的主題相關的搜索結(jié)果212。然后,搜索引擎可以將搜索結(jié)果212傳送給顯示裝置220。在顯示裝置220上,搜索結(jié)果212可被呈現(xiàn)在網(wǎng)絡瀏覽器200的結(jié)果頁面210中。
在一個實施例中,搜索者可以找到他認為對于具體的查詢主題提供高度相關的有用搜索結(jié)果的數(shù)據(jù)源。舉幾個例子,這樣的搜索結(jié)果可以包括到網(wǎng)站、網(wǎng)頁或數(shù)據(jù)庫的鏈接。搜索者可以創(chuàng)建所謂的“聯(lián)合搜索”,“聯(lián)合搜索”可操作用于搜索其中所包含的那些具體數(shù)據(jù)源。聯(lián)合搜索可以被保存在電子文件中,該電子文件可用于將來對與該查詢主題相關的主題的搜索。
由搜索者創(chuàng)建的聯(lián)合搜索可以不僅包含使用爬蟲型搜索結(jié)果發(fā)現(xiàn)的搜索結(jié)果,還可以包括未被爬取的搜索結(jié)果。聯(lián)合搜索的創(chuàng)建者可能有權(quán)使用公眾不一定能使用的或不一定可通過爬蟲搜索或索引的數(shù)據(jù)庫。在一個實施例中,搜索者可以將這些數(shù)據(jù)庫包括在聯(lián)合搜索中。為了方便對以其它方式不可受訪問的數(shù)據(jù)庫具有許可權(quán)的搜索者,聯(lián)合搜索可以提供到那樣的數(shù)據(jù)庫的鏈接。聯(lián)合搜索還可以包含用于提供對具體的受訪問限制的數(shù)據(jù)庫的使用權(quán)的相關語法。
圖3是圖示出根據(jù)一個實施例的聯(lián)合搜索庫300的示例的示圖。聯(lián)合搜索庫300是包含一個或多個聯(lián)合搜索310a-d的電子庫。第一聯(lián)合搜索310a包括多個數(shù)據(jù)源,包括網(wǎng)站312和數(shù)據(jù)庫314。作為說明和示例,而非限制于此,第一聯(lián)合搜索310a可以與釣魚的主題相關。數(shù)據(jù)源可以包括與釣魚的主題有關的網(wǎng)站312并且數(shù)據(jù)庫314可以包括由用戶捕到的所有魚種的個人日志。其他聯(lián)合搜索310b-d可以轉(zhuǎn)到與搜索者感興趣的其他主題。
再次參考圖2,根據(jù)一個實施例,網(wǎng)絡瀏覽器200可被使能以用于搜索聯(lián)合搜索。用戶經(jīng)由網(wǎng)絡瀏覽器200將構(gòu)成查詢208的字符輸入查詢字段202中。搜索按鈕206可被用來選擇針對該搜索所要使用的特定聯(lián)合搜索?;诓樵?08的搜索可在聯(lián)合搜索中所包含的數(shù)據(jù)源中的任一數(shù)據(jù)源處被執(zhí)行。例如,搜索結(jié)果212可在顯示裝置220上被呈現(xiàn)為結(jié)果頁面210。
根據(jù)一個實施例,聯(lián)合搜索的創(chuàng)建者可以公布聯(lián)合搜索以供其他人使用。用戶的聯(lián)合搜索中的每個聯(lián)合搜索都可以被上載到例如可由其他用戶訪問的服務器。這樣,聯(lián)合搜索可被共享,并且提供聯(lián)合搜索團體庫的聯(lián)合搜索提供者團體可被建立。另外,某些聯(lián)合搜索創(chuàng)建者可以由于是具體查詢主題的專家并且已經(jīng)在那個領域中提供了特別相關和可信的聯(lián)合搜索而發(fā)展在團體內(nèi)的信譽。這樣,搜索者可以找出針對給定查詢主題的具體聯(lián)合搜索的具體聯(lián)合搜索創(chuàng)建者。
根據(jù)一個實施例,聯(lián)合搜索庫可以被網(wǎng)絡搜索引擎存儲并可由其訪問。庫內(nèi)的聯(lián)合搜索可被網(wǎng)絡搜索引擎索引,以變得對搜索者而言更易訪問。
圖4是用于處理聯(lián)合搜索的方法的實施例400的流程圖。每個聯(lián)合搜索可被提供給搜索引擎402,與一個或多個相關聯(lián)的關鍵字一起404。關鍵字例如可以由聯(lián)合搜索提供者提供。每個聯(lián)合搜索可以根據(jù)相關聯(lián)的關鍵字中的每一個關鍵字被索引406。
根據(jù)用于聯(lián)合搜索的搜索的實現(xiàn)方式,查詢可被與一個或多個關鍵字比較和匹配408。與一個或多個關鍵字相關聯(lián)的一個或多個聯(lián)合搜索可被提供作為針對該查詢的搜索結(jié)果410。
圖5是提供用于處理聯(lián)合搜索的方法的實施例400的示例圖形表示的實施例500的示圖。每個聯(lián)合搜索301a-c可以分別與一個或多個關鍵字520a-c相關聯(lián)。每個聯(lián)合搜索310a-c可以被傳送并被存儲在聯(lián)合搜索庫530中。每個聯(lián)合搜索可以根據(jù)每個關鍵字被索引到關鍵字關聯(lián)532a-c中。每個關鍵字關聯(lián)532a-c可以包括關鍵字和與該關鍵字相關聯(lián)的一個或多個聯(lián)合搜索。
查詢508可以被傳送給搜索引擎(未示出)并且可以與每個關鍵字關聯(lián)532a-c中的關鍵字相比較和相匹配。與匹配的關鍵字相關聯(lián)的聯(lián)合搜索534a-b可以作為搜索結(jié)果被提供給結(jié)果頁面504,以由搜索者用來使用所提供的聯(lián)合搜索534a-b中的一個或多個來執(zhí)行聯(lián)合搜索。
再次參考圖2,結(jié)果頁面210可以向用戶呈現(xiàn)包括聯(lián)合搜索534a-d搜索結(jié)果104。用戶可以選擇感興趣的聯(lián)合搜索534a-d。在選擇聯(lián)合搜索534a-d之后,聯(lián)合搜索請求利用查詢208被傳送給搜索引擎。這里,這樣的搜索引擎可以使用該查詢來在與所選擇的聯(lián)合搜索534a-d相關聯(lián)的數(shù)據(jù)源中執(zhí)行搜索。搜索引擎可以將聯(lián)合搜索結(jié)果212傳送給瀏覽器200以用于在顯示裝置220上開始顯示。例如,搜索結(jié)果212可以被呈現(xiàn)在在瀏覽器200上的結(jié)果頁面210中。
查詢208與關鍵字的匹配可以使用適合于從聯(lián)合搜索庫中選擇相關的聯(lián)合搜索的任意處理來執(zhí)行。例如,在一個實施例中,可以利用準確匹配處理,其中該查詢必需準確匹配關鍵字或者其最接近推導。根據(jù)另一實施例,查詢208可被與關鍵字的同義詞相比較,反之亦然。以下描述其他匹配處理。然而,這些僅僅是示例,并且實現(xiàn)方式不限于此。
圖6是用于處理聯(lián)合搜索的方法的實施例600的流程圖。每個聯(lián)合搜索可被提供給搜索引擎602。每個聯(lián)合搜索可以根據(jù)一個或多個索引標準被索引404。索引標準可以包括適于索引聯(lián)合搜索的任意標準。索引標準可以包括關鍵字、主題、標題和/或數(shù)據(jù)源的任意一者或其組合,并且不限于此。
此外,與具體索引標準相關聯(lián)的每個聯(lián)合搜索可以根據(jù)有用性度量被排名606。有用性度量可以包括可用來給每個聯(lián)合搜索排名的任意度量。有用性度量例如可以與聯(lián)合搜索對于所意圖的主題的關聯(lián)度和/或質(zhì)量有關。
作為一個示例,關聯(lián)度度量可以包括可測量的指示符以用于確定聯(lián)合搜索對于具體索引標準的關聯(lián)度水平。在索引標準可以是關鍵字的具體示例中,關聯(lián)度度量可以包括在與相同或類似關鍵字有關聯(lián)的聯(lián)合搜索中識別的數(shù)據(jù)源的數(shù)目。然而,這僅僅是一個示例,并且實現(xiàn)方式不限于此。
作為另一示例,有用性度量可以與用戶等級相關聯(lián)。根據(jù)一個實施例,用戶等級例如可以包括:針對具體索引標準,基于具體的聯(lián)合搜索被感知到的有用性而給與該聯(lián)合搜索的平均等級。這樣的用戶等級可以提供對具體聯(lián)合搜索的質(zhì)量的指示??梢园l(fā)現(xiàn)某些聯(lián)合搜索對于處理與具體索引標準相關聯(lián)的查詢特別有用。這些特別有用的聯(lián)合搜索可以和指示符一起被呈現(xiàn)給用戶。然而,這僅僅是一個示例,并且實現(xiàn)方式不限于此。
在一個實施例中,根據(jù)有用性度量的排名606可與指示符一起被提供給搜索者。排名的指示符可以是呈現(xiàn)相關聯(lián)的聯(lián)合搜索的列表的形式,其中在列表的頂部呈現(xiàn)最高排名的聯(lián)合搜索。在另一個示例中,每個聯(lián)合搜索設有指示符,例如關聯(lián)度百分比值和/或星級排名,其中五顆星可以指示高排名而一顆星指示低排名。然而,這些僅僅是示例并且實現(xiàn)方式不限于此。
根據(jù)用于聯(lián)合搜索的搜索的實現(xiàn)方式,查詢可被與一個或多個索引標準608比較和匹配。與一個或多個索引標準相關聯(lián)的一個或多個聯(lián)合搜索可被選為針對該查詢的搜索結(jié)果610。所選擇的聯(lián)合搜索可以根據(jù)一個或多個有用性度量被排名。每個排名的聯(lián)合搜索可被提供給用戶,每個排名的聯(lián)合搜索具有排名的指示符。
圖7是提供用于處理聯(lián)合搜索的方法的實施例600的示例圖形表示的實施例700的示意圖。每個聯(lián)合搜索310a-c可以被傳送并被存儲在聯(lián)合搜索庫730中。每個聯(lián)合搜索可以根據(jù)索引標準被索引到索引關聯(lián)732a-c中。每個索引關聯(lián)732a-c可以包括一個或多個索引標準和與這一個或多個索引標準相關聯(lián)的一個或多個聯(lián)合搜索。
查詢708可以被傳送給搜索引擎并且可被與每個索引關聯(lián)732a-c中的索引標準相比較和相匹配。與匹配的索引標準相關聯(lián)的聯(lián)合搜索可以由排名引擎740根據(jù)一個或多個有用性度量來排名。被索引并被排名的聯(lián)合搜索734a-c可被提供作為結(jié)果頁面704中的搜索結(jié)果,以由搜索者用來使用所提供的聯(lián)合搜索734a-c中的一個或多個來執(zhí)行聯(lián)合搜索。每個聯(lián)合搜索734a-c可被提供給用戶,每個聯(lián)合搜索734a-c具有排名的指示符。
查詢708與索引標準的匹配可以使用適合于索引和匹配聯(lián)合搜索庫730中相關的聯(lián)合搜索的任意處理。如上所述,索引和匹配可以基于索引標準,所述索引標準包括適合于索引和匹配聯(lián)合搜索的任意標準。索引標準可以包括關鍵字、主題、標題和/或數(shù)據(jù)源的任一者或組合,但是不限于此。作為另一示例,基于爬蟲的搜索中找到的域(domain)可被與聯(lián)合搜索中的域相匹配。作為另一示例,基于爬蟲的搜索中找到的域可被與返回分類路徑(categorypath)的搜索引擎目錄中的域相匹配,該分類路徑又可被與從基于爬蟲的搜索獲得的分類路徑相匹配。作為又一示例,匹配可以至少部分地基于聯(lián)合搜索中的域與查詢所限定的域的匹配??梢悦靼?,索引標準和匹配可被單獨使用或結(jié)合使用。然而,這些僅僅是示例,并且實現(xiàn)方式不限于此。
如果用戶對基于所選擇的聯(lián)合搜索的搜索結(jié)果不感興趣,則用戶可以選擇具有更低排名的另一聯(lián)合搜索。如果用戶選擇與搜索結(jié)果不同的聯(lián)合搜索,則之后,搜索結(jié)果被更新來在結(jié)果頁面中顯示與不同的聯(lián)合搜索有關的搜索結(jié)果。
圖8是用于處理聯(lián)合搜索的方法的實施例800的流程圖。每個聯(lián)合搜索可被提供給搜索引擎802。搜索可以使用每個聯(lián)合搜索中所包括的數(shù)據(jù)源來執(zhí)行804。數(shù)據(jù)源的搜索可以是用于從數(shù)據(jù)源中提取數(shù)據(jù)的任意合適的方法。作為示例,多個查詢可被用來搜索數(shù)據(jù)源以提取與每個查詢有關的數(shù)據(jù)。然而,這僅僅是示例實現(xiàn)方式,并且所要求保護的主題不限于此。
可以從與聯(lián)合搜索相關聯(lián)的數(shù)據(jù)源獲取數(shù)據(jù)806??梢詮目赡苓m于索引的這樣的數(shù)據(jù)中解析加權(quán)因子。作為示例,但不限于此,加權(quán)因子可以包括關鍵字和/或域。可以定義一個或多個簽名,簽名將聯(lián)合搜索和與通過搜索聯(lián)合搜索的數(shù)據(jù)源得到的數(shù)據(jù)相關聯(lián)的加權(quán)因子相關聯(lián)810。
每個簽名可以根據(jù)一個或多個索引標準被索引812。索引標準可以包括適合于索引聯(lián)合搜索的任意標準。舉幾個例子,索引標準可以包括關鍵字、主題、標題和/或數(shù)據(jù)源的任意一者或組合。
根據(jù)用于聯(lián)合搜索的搜索的實現(xiàn)方式,查詢可被與和簽名相關聯(lián)的一個或多個索引標準608相比較814。這樣的查詢可被與一個或多個簽名相匹配816。與一個或多個簽名相關聯(lián)的一個或多個聯(lián)合搜索可被提供給用戶818。
可以明白,在上述實施例中,所選擇的聯(lián)合搜索在被呈現(xiàn)給用戶之前,可如上所述根據(jù)一個或多個有用性度量被排名。
圖9是提供用于處理聯(lián)合搜索的方法的實施例800的示例圖形表示的實施例900的示圖。每個聯(lián)合搜索910a-c可被傳送并被存儲在聯(lián)合搜索庫930中。每個聯(lián)合搜索910a-c的數(shù)據(jù)源中的每一個可被搜索,提供與聯(lián)合搜索910a-c相關聯(lián)的搜索數(shù)據(jù)932a-c。在一個實施例中,作為示例但不是限制,每個數(shù)據(jù)源可基于初始查詢907被搜索。聯(lián)合搜索910a-c和相關聯(lián)的搜索數(shù)據(jù)932a-c可被傳送給搜索結(jié)果庫950并被存儲在其中。從搜索數(shù)據(jù)932a-c中可提取出加權(quán)因子。通過將加權(quán)因子與各個聯(lián)合搜索910a-c相關聯(lián)可以定義簽名942a-n。簽名942a-c可以使用簽名庫940中的索引標準被索引。
每個簽名942a-c可根據(jù)索引標準被索引到索引關聯(lián)942a-c中。每個索引關聯(lián)942a-c可以包括一個或多個索引標準以及與這一個或多個索引標準相關聯(lián)的一個或多個簽名942a-c。
查詢908可被傳送給搜索引擎并且可被與每個索引關聯(lián)934a-c中的索引標準相比較和相匹配。根據(jù)一個實施例,與匹配的索引標準相關聯(lián)的對應簽名942a-c可由排名引擎(未示出)根據(jù)一個或多個有用性度量來排名。對應于和匹配的索引標準相關聯(lián)的簽名942a-c的聯(lián)合搜索934a-c被確定。聯(lián)合搜索934a-c可被提供作為結(jié)果頁面904中的搜索結(jié)果,以由搜索者用來使用所提供的聯(lián)合搜索934a-c中的一個或多個來執(zhí)行聯(lián)合搜索。
查詢908與索引標準的匹配可以使用適合于索引和匹配簽名庫930中的相關簽名和對應聯(lián)合搜索的任意處理,如上所述。
根據(jù)一個實施例,除了由搜索引擎提供的基于爬蟲的搜索結(jié)果以外或作為其替換,搜索引擎可以向搜索者提供相關的聯(lián)合搜索。如果用戶對基于聯(lián)合搜索的搜索結(jié)果不感興趣,則用戶可以選擇具有更低排名的另一聯(lián)合搜索或者可以選擇查看通過基于爬蟲的搜索提供的搜索結(jié)果。如果用戶選擇列表中的不同聯(lián)合搜索,則之后,搜索結(jié)果被更新以顯示與該不同聯(lián)合搜索有關的搜索結(jié)果。
圖10是提供用于處理聯(lián)合搜索的系統(tǒng)的實施例1001的示例圖形表示的示圖。實施例1001包括可操作用于提供基于聯(lián)合搜索和/或基于爬蟲的搜索的搜索結(jié)果的瀏覽器1006。用戶可以在客戶端1000上的網(wǎng)絡瀏覽器1002中輸入查詢1012。查詢1012可通過網(wǎng)絡1050被傳送給前端服務器1004。前端服務器1004和網(wǎng)路1050可以不是任意實施例中都需要的元件,而僅僅被圖示出來示出可以實現(xiàn)實施例1001的一種途徑。網(wǎng)絡1050可以是局域網(wǎng)(lan)、廣域網(wǎng)(wan)或互聯(lián)網(wǎng),但不限于此。前端服務器1004可操作用于將查詢1012傳送給搜索引擎1006,搜索引擎1006可操作用于處理查詢1012。
搜索引擎1006可以包括基于爬蟲的搜索引擎1007和聯(lián)合搜索引擎1010?;谂老x的搜索引擎1007可以操作用于提供如上所述的基于爬蟲的搜索結(jié)果。基于爬蟲的搜索引擎1007可操作用于將搜索結(jié)果傳送給前端服務器1004以用于與客戶端1000通信。
前端服務器1004和搜索引擎1006可以在相同或不同裝置上實現(xiàn)。然而,為了說明的目的,它們被示出駐留在不同裝置上。
聯(lián)合搜索引擎1010可以包括具有一個或多個被索引的聯(lián)合搜索的數(shù)據(jù)庫。聯(lián)合搜索引擎1010可操作用于基于查詢1012來確定一組一個或多個被索引的聯(lián)合搜索。聯(lián)合搜索引擎1010可操作用于將這一組被索引的聯(lián)合搜索傳送給前端服務器1004。根據(jù)一個實施例,除了這組被索引的聯(lián)合搜索以外,搜索引擎1006還可操作用于傳送附加數(shù)據(jù),所述附加數(shù)據(jù)指示這些被索引的聯(lián)合搜索中的哪些是最相關的。
前端服務器1004可操作用于通過網(wǎng)絡1050向客戶端1000傳送相關的被索引的聯(lián)合搜索的列表和關聯(lián)度數(shù)據(jù),以用于開始在網(wǎng)絡瀏覽器1002上顯示。前端服務器1004可操作用于通過網(wǎng)絡1050向客戶端1000傳送基于基于爬蟲的搜索的搜索結(jié)果以用于在網(wǎng)絡瀏覽器1002上顯示。
根據(jù)一個實施例,可向用戶呈現(xiàn)這樣的選項,其用于選擇基于基于爬蟲的搜索或被索引的聯(lián)合搜索之一的搜索結(jié)果。
在選擇用戶感興趣的被索引的聯(lián)合搜索之后,網(wǎng)絡瀏覽器1002可操作用于將所選擇的被索引的聯(lián)合搜索通過網(wǎng)絡1050傳送給前端服務器1004,前端服務器1004可操作用于將所選擇的被索引的聯(lián)合搜索傳送給搜索引擎1008。搜索引擎1008可操作用于處理所選擇的被索引的聯(lián)合搜索來獲得聯(lián)合搜索結(jié)果。聯(lián)合搜索結(jié)果可被傳送給前端服務器1004。前端服務器1004可操作用于將聯(lián)合搜索結(jié)果1018通過網(wǎng)絡1050傳送給客戶端1000以用于開始在網(wǎng)絡瀏覽器1002中顯示。
以上實現(xiàn)方式的一個優(yōu)點是:相關的被索引的聯(lián)合搜索的列表和標準的爬蟲搜索結(jié)果一起被傳送給用戶,并且被提供作為標準的爬蟲結(jié)果的替換。然而,該實現(xiàn)方式也說明了這樣的可能性:對于輸入網(wǎng)絡瀏覽器1002的查詢字段1012的每個查詢,搜索請求不得不在客戶端1000和前端服務器1004之間進行兩次完整的往返。
根據(jù)另一實現(xiàn)方式,基于查詢的最高排名的被索引的聯(lián)合搜索的聯(lián)合搜索結(jié)果可被默認地傳送給網(wǎng)絡瀏覽器1002。在該實現(xiàn)方式中,用戶可以在查詢僅進行一次往返的情況下接收相關搜索結(jié)果。
根據(jù)另一實施例,搜索引擎1006可操作用于處理所選擇的被索引的聯(lián)合搜索來獲得聯(lián)合搜索結(jié)果。這些聯(lián)合搜索結(jié)果可被傳送給前端服務器1004。前端服務器1004可操作用于通過網(wǎng)絡1050向客戶端1000傳送以下兩者:聯(lián)合搜索的列表以及,或者基于被索引的聯(lián)合搜索或者基于標準的基于爬蟲的搜索的搜索結(jié)果。
在沒有前端服務器1004時,網(wǎng)絡瀏覽器1002可操作用于將聯(lián)合搜索傳送給網(wǎng)絡1008,隨后,萬維網(wǎng)1008可操作用于通過網(wǎng)絡1050向客戶端1000返回聯(lián)合搜索結(jié)果。
該實現(xiàn)方式的另一優(yōu)點在于,客戶端1000和前端服務器1004之間的通信(即流量)更少。然而,搜索結(jié)果可以和在之前的實施例中一樣快地傳送給客戶端1000,這是因為在聯(lián)合搜索的列表被傳送給客戶端1000之前,被索引的聯(lián)合搜索的列表必需“等待”搜索結(jié)果產(chǎn)生并被傳送給前端服務器1004。
在另一實施例中,如圖2中所示,用戶界面包括查詢字段102、下拉框104、搜索結(jié)果頁面110和“搜索”按鈕106。查詢字段102可以操作使得用戶可以輸入構(gòu)成查詢的字符。下拉框104可操作用于提供一組一個或多個索引的聯(lián)合搜索的列表。
搜索按鈕106可以是如果用戶對由相應聯(lián)合搜索提供的初始聯(lián)合搜索結(jié)果不滿意,則允許用戶選擇用戶輸入的索引的聯(lián)合搜索的任意機構(gòu)的形式。下拉框104中列出的聯(lián)合搜索的列表可以在其他類型的用戶界面元件中呈現(xiàn),這些用戶界面元件包括但不限于文本框、列表框、菜單或上下文菜單。用戶界面可以使用網(wǎng)絡瀏覽器302來瀏覽,網(wǎng)絡瀏覽器302例如但不限于是intemetexplorer或mozillafirefox。
圖11是圖示出可以實現(xiàn)實施例的計算機系統(tǒng)1100的框圖。計算機系統(tǒng)1100包括用于傳輸信息的總線1102或其他通信機構(gòu),和用于處理信息的耦接到總線1102的處理器1104。計算機系統(tǒng)1100還包括用于存儲信息和由處理器1104執(zhí)行的指令的耦接到總線1102的主存儲器1106,例如隨機存取存儲器(ram)或其他動態(tài)存儲裝置。主存儲器1106也可以用于存儲在由處理器1104執(zhí)行的指令的執(zhí)行期間的臨時變量或其他中間信息。計算機系統(tǒng)1100還包括用于存儲靜態(tài)信息和用于處理器1104的指令地耦接到總線1102的只讀存儲器(rom)1108或其他靜態(tài)存儲裝置。用于存儲信息和指令的諸如磁盤或光盤之類的存儲裝置1110被提供并耦接到總線1102。
計算機系統(tǒng)1100可經(jīng)由總線1102耦接到顯示器1112,顯示器1112例如是液晶顯示器(lcd),用于向計算機用戶顯示信息。輸入裝置1114包括數(shù)字字母和其它鍵,其可以耦接到總線1102,以用于向處理器1104傳送信息和命令選擇。其他類型的用戶輸入裝置可以是光標控制器1116,例如,鼠標、跟蹤球或光標方向鍵,用于向處理器404傳送方向信息和命令選擇以及用于控制顯示器1112上的光標移動。該輸入裝置通常在允許裝置指定平面中的位置的兩軸(例如,第一軸(例如,x)和第二軸(例如,y))上具有自由度。
本主題與用于實現(xiàn)在此描述的技術的計算機系統(tǒng)1100的使用有關。根據(jù)一個實施例,計算機系統(tǒng)1100,響應于處理器1104執(zhí)行被包含在主存儲器1106中的一個或多個指令的一個或多個序列,來執(zhí)行那些技術。這樣的指令可以從機器可讀介質(zhì),例如存儲裝置1110,讀入主存儲器1106中。主存儲器1106中所包含的指令的序列的執(zhí)行使得處理器1104執(zhí)行在此描述的處理步驟。在可替換實施例中,可以使用硬連線電路來替換軟件指令或與之結(jié)合來實現(xiàn)本發(fā)明。因此,本發(fā)明的實施例不限于硬件電路和軟件的任何特定組合。
在此使用的術語“機器可讀介質(zhì)”是指參與提供使得機器以特定方式操作的數(shù)據(jù)的任意介質(zhì)。在使用計算機系統(tǒng)1100實現(xiàn)的一個實施例中,例如,在向處理器1104提供用于執(zhí)行的指令時,涉及各種機器可讀介質(zhì)。這樣的介質(zhì)可以采取許多形式,包括但不限于,非易失性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì)。非易失性介質(zhì)例如包括光盤或磁盤,例如存儲裝置1110。易失性介質(zhì)包括動態(tài)儲存區(qū),例如主存儲器1106。傳輸介質(zhì)包括同軸電纜、銅線和光纖,包括包含總線1102的電線。傳輸介質(zhì)還可以采取聲波或光波的形式,例如在無線電和紅外數(shù)據(jù)通信期間生成的那些。
機器可讀介質(zhì)的通常形式例如包括閃盤、軟盤、硬盤、磁盤或任意其它磁介質(zhì)、cd-rom、任意其它光介質(zhì)、打孔卡、紙帶、帶有孔的圖案的任意其它物理介質(zhì)、ram、prom和eprom、flash-eprom、任意其它存儲芯片或存儲盒、如下所述的載波或計算機可讀的任意其它介質(zhì)。
在向處理器1104攜帶用于執(zhí)行的一個或多個指令的一個或多個序列時,涉及機器可讀介質(zhì)的各種形式。例如,指令可能一開始被攜帶在遠程計算機的磁盤上。遠程計算機可以將指令裝載到其動態(tài)儲存器中并使用調(diào)制解調(diào)器通過電話線發(fā)送指令。計算機系統(tǒng)1100本地的調(diào)制解調(diào)器可以接收電話線上的數(shù)據(jù)并使用紅外發(fā)射器將數(shù)據(jù)轉(zhuǎn)換成紅外信號。紅外檢測器可以接收紅外信號中所攜帶的數(shù)據(jù)并且合適的電路可以將這些數(shù)據(jù)置于總線1102上。總線1102將這些數(shù)據(jù)攜帶至主存儲器1106,處理器1104可以從主存儲器1106獲取指令并執(zhí)行指令??蛇x地,由主存儲器1106接收到的指令可以在處理器1104的執(zhí)行之前或之后被存儲在存儲裝置1110上。
計算機系統(tǒng)1100還包括耦接到總線1102的通信接口418。通信接口1118提供耦接到與本地網(wǎng)絡1122連接的網(wǎng)絡鏈路1120的雙向數(shù)據(jù)通信。例如,通信接口1118可以是用于提供到對應類型的電話線的數(shù)據(jù)通信連接的綜合業(yè)務數(shù)字網(wǎng)絡(isdn)卡或調(diào)制解調(diào)器。作為另一示例,通信接口1118可以是用于提供到可兼容的lan的數(shù)據(jù)通信連接的局域網(wǎng)(lan)。也可以實現(xiàn)無線鏈路。在任意這樣的實現(xiàn)方式中,通信接口1118發(fā)送和接收攜帶表示各種信息的數(shù)字數(shù)據(jù)流的光的、電磁的或光學的信號。
網(wǎng)絡鏈路1120通常通過一個或多個網(wǎng)絡來提供到其他數(shù)據(jù)裝置的數(shù)據(jù)通信。例如,網(wǎng)絡鏈路1120可以通過本地網(wǎng)絡1122來提供到托管計算機1124或到由互聯(lián)網(wǎng)服務提供商(isp)1126操作的數(shù)據(jù)設備的連接。isp1126進而通過全球分組數(shù)據(jù)通信網(wǎng)絡(現(xiàn)在常稱為“互聯(lián)網(wǎng)”)1128來提供數(shù)據(jù)通信服務。本地網(wǎng)絡1122和互聯(lián)網(wǎng)1128兩者都使用攜帶數(shù)字數(shù)據(jù)流的電磁信號或光信號。通過各種網(wǎng)絡的信號以及在網(wǎng)絡鏈路1120上和通過通信接口1118的信號攜帶來自和去往計算機系統(tǒng)1100的數(shù)字數(shù)據(jù),并且是傳送信息的載波的示例形式。
計算機系統(tǒng)1100可以通過(一個或多個)網(wǎng)絡、網(wǎng)絡鏈路1120和通信接口1118來發(fā)送消息和接收數(shù)據(jù),包括程序代碼。在互聯(lián)網(wǎng)示例中,服務器1130可以通過互聯(lián)網(wǎng)1128、isp1126、本地網(wǎng)絡1122和通信接口1118來傳送所請求的應用程序代碼。
接收的代碼在其被接收到時可由處理器404執(zhí)行,和/或被存儲在存儲裝置1110或其他非易失性存儲器中以用于稍后執(zhí)行。以這種方式,計算機系統(tǒng)1100可以獲得載波形式的應用代碼。
盡管已經(jīng)圖示和描述了當前所想到的示例實施例,但是本領域技術人員應當理解,在不偏離所要求保護的主題的情況下,可以做出各種其他修改例,并且可以取代等同例。另外,在不偏離在此描述的中心思想的情況下,可以進行許多修改來使得特定情形適應所要求保護的主題的教導。因此,所要求保護的主題不希望被限制于所公開的具體實施例,而是,這樣的所要求保護的主題也可以包括落在所附權(quán)利要求的范圍內(nèi)的所有實施例,以及其等同例。