亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

分析來自搜索系統(tǒng)的操作數(shù)據(jù)和其它數(shù)據(jù)的制作方法

文檔序號(hào):6649828閱讀:215來源:國知局

專利名稱::分析來自搜索系統(tǒng)的操作數(shù)據(jù)和其它數(shù)據(jù)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及用于分析數(shù)據(jù)的系統(tǒng)和方法,該數(shù)據(jù)包括在諸如用于響應(yīng)搜索請(qǐng)求的系統(tǒng)的系統(tǒng)操作期間編譯的數(shù)據(jù)。本發(fā)明尤其涉及為了包括改進(jìn)響應(yīng)和維持系統(tǒng)性能的目的而分析相對(duì)較大量的數(shù)據(jù)的系統(tǒng)和方法。
背景技術(shù)
:結(jié)合諸如典型的搜索引擎,訪問該典型搜索引擎的用戶通過輸入包含一個(gè)或多個(gè)搜索項(xiàng)的可能帶有布爾操作符的搜索串等來請(qǐng)求搜索。作為響應(yīng),搜索引擎基于該搜索串來搜索一個(gè)或多個(gè)數(shù)據(jù)庫,生成一個(gè)搜索結(jié)果集,并可能以用戶可查看的信息頁面或信息鏈接的形式將這些搜索結(jié)果返回給請(qǐng)求用戶。特別是在信息鏈接形式的情形中,用戶可訪問一個(gè)或多個(gè)鏈接,以查看與特定搜索結(jié)果相關(guān)的內(nèi)容,且如果與搜索結(jié)果的一個(gè)或多個(gè)鏈接相關(guān)聯(lián)的內(nèi)容對(duì)用戶而言是可接受的,則該用戶通常繼續(xù)以任何看起來適當(dāng)?shù)姆绞絹聿捎眠@種可接受的內(nèi)容。然而,可能是相反的情形,因?yàn)樗阉鹘Y(jié)果中沒有內(nèi)容滿足所請(qǐng)求的搜索,搜索結(jié)果對(duì)用戶而言是不可接受的(至少從該用戶的角度看來)。在這種情形中,用戶可決定輸入新的搜索串或修改先前輸入的搜索串,并查看基于該新的或經(jīng)修改的搜索串的來自搜索引擎的搜索結(jié)果??梢岳斫?,這樣的過程可以搜索對(duì)話的形式反復(fù)多次直到用戶找到可接受的搜索結(jié)果或放棄為止。一般而言,在諸如前述搜索引擎的高質(zhì)量系統(tǒng)中,來自用戶的如在搜索串中提出的每個(gè)查詢應(yīng)當(dāng)準(zhǔn)確地映射到表示回答該查詢的內(nèi)容的搜索結(jié)果。這種目標(biāo)對(duì)提供好的搜索體驗(yàn)是重要的,并且實(shí)際上符合這種目標(biāo)可顯示出以下兩者之間的差異將以新的搜索對(duì)話返回該搜索引擎的快樂的滿意的用戶,和將相反訪問另一搜索引擎的憤怒的不滿意的用戶。為了實(shí)現(xiàn)該目標(biāo),已經(jīng)認(rèn)識(shí)到系統(tǒng)本身應(yīng)當(dāng)進(jìn)行調(diào)整或“調(diào)諧”以改進(jìn)響應(yīng)并保持系統(tǒng)性能。如可以理解的那樣,這種調(diào)整可主要(但不是只)基于系統(tǒng)操作期間編譯的操作數(shù)據(jù)和其它數(shù)據(jù)來進(jìn)行。然而,如果系統(tǒng)特別大,具有較高的通信量等,可用于分析的這種數(shù)據(jù)量會(huì)特別大,因而不易使用并以其它方式顯現(xiàn)為難以工作。因此,需要用于分析大量數(shù)據(jù),特別是來自搜索系統(tǒng)的大量數(shù)據(jù)的系統(tǒng)和方法。
發(fā)明內(nèi)容前述需要至少部分地通過本發(fā)明得到了滿足,在本發(fā)明中提供用于分析來自搜索引擎的數(shù)據(jù)的系統(tǒng)。該搜索引擎基于從請(qǐng)求用戶處接收的查詢串來生成一個(gè)搜索結(jié)果集,其中查詢串和搜索結(jié)果一起組成用戶搜索。搜索結(jié)果包括至少一個(gè)結(jié)果,其中每個(gè)結(jié)果指向相信與查詢串相關(guān)的特定內(nèi)容項(xiàng)。一系列相關(guān)用戶搜索組成一個(gè)對(duì)話,并且搜索引擎存儲(chǔ)每個(gè)用戶搜索及相關(guān)信息。在該系統(tǒng)中,用戶搜索打包器(USB)分析用戶搜索,以找出這些用戶搜索中相似的用戶搜索,并將這些相似的用戶搜索組成用戶搜索包,而意圖處理器(IP)基于來自USB的用戶搜索包產(chǎn)生意圖。每個(gè)意圖是被認(rèn)為是彼此相關(guān)的一個(gè)或多個(gè)對(duì)話的組合。因素發(fā)生器(FG)考慮用戶搜索及相關(guān)信息以產(chǎn)生因素,其中每個(gè)因素關(guān)于來自一個(gè)搜索結(jié)果集的一個(gè)特定結(jié)果。每個(gè)因素涉及一個(gè)或多個(gè)事件,其中,每個(gè)事件是與查詢用戶進(jìn)行的動(dòng)作有關(guān)的一段信息。相關(guān)性分類器(RC)接收FG為每個(gè)結(jié)果生成的因素,并基于它們操作以產(chǎn)生對(duì)結(jié)果的判斷,其中該判斷表示對(duì)在用戶決定訪問來自各搜索結(jié)果的結(jié)果之后用戶如何判斷該結(jié)果的確定。度量發(fā)生器(MG)基于由FG生成的因素和由RC生成的判斷來產(chǎn)生度量,其中每個(gè)度量是有關(guān)結(jié)果、用戶搜索或?qū)υ挼亩攘?。最后,?shù)據(jù)合成器(DS)提取由USB、IP、FG、RC和MG生成的數(shù)據(jù),將已提取數(shù)據(jù)格式化到一個(gè)或多個(gè)數(shù)據(jù)庫,并將各數(shù)據(jù)庫存儲(chǔ)到庫中,借此,可查看并聚集數(shù)據(jù)以提供反饋或生成報(bào)告。結(jié)合附圖閱讀前面的
發(fā)明內(nèi)容和以下本發(fā)明各實(shí)施例的詳細(xì)描述,能得到更好的理解。為了說明本發(fā)明,在附圖中示出當(dāng)前優(yōu)選的各實(shí)施例;然而,應(yīng)理解本發(fā)明并不限于所示的精確排列和裝置。在附圖中圖1是示出其中可組合本發(fā)明各方面和/或各部分的通用計(jì)算機(jī)系統(tǒng)的框圖,以及圖2是根據(jù)本發(fā)明各實(shí)施例示出用于分析來自諸如搜索引擎之類的較大系統(tǒng)的數(shù)據(jù)的數(shù)據(jù)分析流水線的框圖。具體實(shí)施例方式計(jì)算機(jī)環(huán)境圖1和以下討論旨在提供一種本發(fā)明和/或其部分可在其中實(shí)現(xiàn)的適當(dāng)計(jì)算環(huán)境的簡要一般說明。盡管不是必需的,本發(fā)明將在由諸如客戶機(jī)工作站或服務(wù)器的計(jì)算機(jī)執(zhí)行的諸如程序模塊的計(jì)算機(jī)可執(zhí)行指令的一般環(huán)境中進(jìn)行說明。通常,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)具體抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。此外,本領(lǐng)域技術(shù)人員將理解,本發(fā)明和/或其部分可在其它計(jì)算機(jī)系統(tǒng)配置中實(shí)踐,包括手持式裝置、多處理器系統(tǒng)、基于微處理器的或可編程的電器消費(fèi)品、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)等等。本發(fā)明還可在任務(wù)由經(jīng)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理裝置執(zhí)行的分布式計(jì)算環(huán)境中實(shí)踐。在分布式計(jì)算環(huán)境中,程序模塊可被置于本地和遠(yuǎn)程存儲(chǔ)器存儲(chǔ)設(shè)備中。如圖1所示,示例性通用計(jì)算系統(tǒng)具有常規(guī)個(gè)人計(jì)算機(jī)120等,包括處理單元121、系統(tǒng)存儲(chǔ)器122以及把包括系統(tǒng)存儲(chǔ)器的各種系統(tǒng)組件耦合到處理單元121的系統(tǒng)總線123。系統(tǒng)總線123可能是若干總線結(jié)構(gòu)類型中的任何一種,包括存儲(chǔ)器總線或存儲(chǔ)器控制器、外圍總線、以及使用多種總線體系結(jié)構(gòu)的任一種的局部總線。系統(tǒng)存儲(chǔ)器包括只讀存儲(chǔ)器(ROM)124和隨機(jī)存儲(chǔ)器(RAM)125。含有幫助如啟動(dòng)期間在個(gè)人計(jì)算機(jī)120中元件之間傳遞信息的基本例程的基本輸入/輸出系統(tǒng)(BIOS)126被存儲(chǔ)在ROM124中。個(gè)人計(jì)算機(jī)120還包括讀取和寫入硬盤(未示出)的硬盤驅(qū)動(dòng)器127、讀取或?qū)懭肟梢苿?dòng)磁盤129的磁盤驅(qū)動(dòng)器128、以及讀取或?qū)懭胫T如CDROM或其它光學(xué)介質(zhì)等可移動(dòng)光盤131的光盤驅(qū)動(dòng)器130。硬盤驅(qū)動(dòng)器127、磁盤驅(qū)動(dòng)器128和光盤驅(qū)動(dòng)器130分別通過硬盤驅(qū)動(dòng)器接口132、磁盤驅(qū)動(dòng)器接口133和光盤驅(qū)動(dòng)器接口134連接至系統(tǒng)總線123。諸驅(qū)動(dòng)器及其相關(guān)聯(lián)計(jì)算機(jī)可讀介質(zhì)為計(jì)算機(jī)120提供計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的非易失性儲(chǔ)存。盡管在此所述示例性環(huán)境采用了硬盤、可移動(dòng)磁盤129和可移動(dòng)光盤131,但本領(lǐng)域技術(shù)人員應(yīng)理解也可在示例性操作環(huán)境中使用其它類型計(jì)算機(jī)可訪問的能夠存儲(chǔ)數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)。這樣的其它類型的介質(zhì)包括諸如磁帶盒、閃存卡、數(shù)字視頻盤、Bernoulli卡式磁帶、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)等等。包括操作系統(tǒng)135、一個(gè)或多個(gè)應(yīng)用程序136、其它程序模塊137和程序數(shù)據(jù)138的眾多程序模塊,可存儲(chǔ)在硬盤、磁盤129、光盤131、ROM124或RAM125中。用戶可通過諸如鍵盤140和定位裝置142的輸入裝置把指令和信息輸入個(gè)人計(jì)算機(jī)120。其它輸入裝置(未示出)可包括諸如話筒、操縱桿、游戲墊、衛(wèi)星接收器、掃描儀等等。這些和其它輸入裝置常常通過與系統(tǒng)總線相耦合的串行端口接口146連接到處理單元121,但是它也可通過其它接口相連,如并行端口、游戲端口或通用串行總線(USB)。監(jiān)視器147或其它類型的顯示裝置也通過諸如視頻適配器148的接口和系統(tǒng)總線123相連。除了顯示器147,個(gè)人計(jì)算機(jī)通常包括其它外圍輸出裝置(未示出),如揚(yáng)聲器和打印機(jī)。圖1的示例性系統(tǒng)還包括主機(jī)適配器155、小型計(jì)算機(jī)系統(tǒng)接口(SCSI)總線156、以及與SCSI總線156相連的外部存儲(chǔ)裝置162。個(gè)人計(jì)算機(jī)120可以在使用與一臺(tái)或多臺(tái)遠(yuǎn)程計(jì)算機(jī),諸如遠(yuǎn)程計(jì)算機(jī)149的邏輯連接的網(wǎng)絡(luò)化環(huán)境中運(yùn)行。遠(yuǎn)程計(jì)算機(jī)149可以是另一臺(tái)個(gè)人計(jì)算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對(duì)等裝置或其它公共網(wǎng)絡(luò)節(jié)點(diǎn),而且通常包括上述與個(gè)人計(jì)算機(jī)120相關(guān)的許多或全部元件,盡管在圖1中僅顯示了存儲(chǔ)器存儲(chǔ)裝置150。圖1中所描繪的邏輯連接包括局域網(wǎng)(LAN)151和廣域網(wǎng)(WAN)152。這樣的網(wǎng)絡(luò)化環(huán)境在辦公室、企業(yè)范圍計(jì)算機(jī)網(wǎng)絡(luò)、企業(yè)內(nèi)聯(lián)網(wǎng)和因特網(wǎng)上是常見的。當(dāng)用于LAN網(wǎng)絡(luò)環(huán)境中時(shí),個(gè)人計(jì)算機(jī)120通過網(wǎng)絡(luò)接口或適配器153與LAN151連接。當(dāng)用于WAN網(wǎng)絡(luò)環(huán)境中時(shí),個(gè)人計(jì)算機(jī)120通常包括調(diào)制解調(diào)器154或其它用于在諸如因特網(wǎng)的廣域網(wǎng)152上建立通信的裝置??梢允莾?nèi)置式或外置式的調(diào)制解調(diào)器154,與系統(tǒng)總線123通過串行端口接口146相連接。在網(wǎng)絡(luò)化環(huán)境中,所述與個(gè)人計(jì)算機(jī)120相關(guān)的程序模塊或其一部分,可以存儲(chǔ)在遠(yuǎn)程存儲(chǔ)器存儲(chǔ)裝置中。可以理解,所示網(wǎng)絡(luò)連接是示例性的,也可以使用其它在計(jì)算機(jī)之間建立通信連接的裝置。數(shù)據(jù)分析流水線作為準(zhǔn)備并作為術(shù)語,可以理解,結(jié)合諸如可結(jié)合本發(fā)明采用的搜索引擎,每個(gè)訪問該搜索引擎的用戶通過輸入包括具有一個(gè)或多個(gè)搜索項(xiàng)的可能具有布爾算子的搜索串的查詢來請(qǐng)求搜索。作為響應(yīng),搜索引擎基于該搜索串生成一個(gè)搜索結(jié)果集(假設(shè)這些搜索結(jié)果實(shí)際上可用的),并將這些搜索結(jié)果返回給請(qǐng)求用戶。所返回的搜索結(jié)果可包括被認(rèn)為是與搜索請(qǐng)求相關(guān)的特定內(nèi)容項(xiàng)或結(jié)果,盡管更可能是相反每個(gè)特定結(jié)果是通過搜索結(jié)果中的相應(yīng)鏈接來訪問的。特別地,如果所返回的搜索結(jié)果是不可接受的,則用戶可用新的搜索串或先前輸入的搜索串的修改來輸入另一查詢串,從而基于該另一查詢來產(chǎn)生另一個(gè)搜索結(jié)果集。然后一系列相關(guān)查詢組成整個(gè)搜索對(duì)話,并且該對(duì)話有望在用戶在搜索結(jié)果中找到可接受的結(jié)果時(shí)結(jié)束。在用戶輸入查詢串并查看搜索結(jié)果的過程中,搜索引擎或相關(guān)實(shí)體可以并常常標(biāo)識(shí)并存儲(chǔ)與該對(duì)話相關(guān)的數(shù)據(jù)。具體地,除標(biāo)識(shí)該對(duì)話之外,搜索引擎或相關(guān)實(shí)體(此后稱為“搜索分析器”)可標(biāo)識(shí)并存儲(chǔ)該對(duì)話的每個(gè)查詢串、以及對(duì)每個(gè)查詢串返回的搜索結(jié)果等。此外,搜索分析器可對(duì)搜索結(jié)果的每個(gè)返回結(jié)果的每個(gè)鏈接標(biāo)識(shí)并存儲(chǔ)用戶是否借此訪問了該結(jié)果,以及因此用戶花了多長時(shí)間來查看該結(jié)果等等。因而應(yīng)當(dāng)理解,搜索分析器或具有這種信息的另一實(shí)體可導(dǎo)出關(guān)于用戶對(duì)每個(gè)來自對(duì)話的返回搜索結(jié)果集有多滿意或“愉悅”的定性的(即使是非定量的)度量。注意,執(zhí)行前述功能的搜索分析器是眾所周知的,或應(yīng)當(dāng)對(duì)相關(guān)人群是顯而易見的,因此無需作任何詳細(xì)闡述。因此,可結(jié)合本發(fā)明采用任何適當(dāng)?shù)乃阉鞣治銎?。作為形成?duì)話的查詢串的組合的一個(gè)示例,考慮以下查詢串“Cars”(汽車)、“Fords”(福特)、“FordEdsel”(福特埃德塞爾)、“CheapVacations”(便宜的旅行)、和“Londontripprices”(倫敦旅行價(jià)格)。應(yīng)當(dāng)理解,每個(gè)查詢串是用戶在搜索時(shí)輸入的實(shí)際文本。此外,每個(gè)查詢串產(chǎn)生具有對(duì)結(jié)果的鏈接的一個(gè)搜索結(jié)果集,并可通過搜索分析器使相關(guān)數(shù)據(jù)與之相關(guān)聯(lián),這些相關(guān)數(shù)據(jù)諸如是否選擇了每個(gè)鏈接、查看該結(jié)果所花的停頓時(shí)間、對(duì)于該結(jié)果采取的滾動(dòng)和其它動(dòng)作、以及其它類似用戶動(dòng)作?;谒星笆鲂畔?,應(yīng)當(dāng)理解前三個(gè)查詢串(即“Cars”、“Fords”、“FordEdsel”)是第一個(gè)對(duì)話部分,而后兩個(gè)查詢串(即“CheapVacations”、“Londontripprices”)是第二個(gè)對(duì)話部分,因?yàn)橛脩麸@得具有兩個(gè)不同的意圖。這樣就應(yīng)當(dāng)理解,對(duì)話是一組由單個(gè)用戶在時(shí)間上連續(xù)作出的具有相同意圖或目的的查詢串及其相應(yīng)搜索結(jié)果(即用戶搜索)。現(xiàn)在參看圖2,可看到本發(fā)明假定諸如搜索引擎10的系統(tǒng)用于執(zhí)行來自冷酷的請(qǐng)求者的請(qǐng)求搜索,并用適當(dāng)?shù)乃阉鹘Y(jié)果來響應(yīng)。該搜索引擎10當(dāng)然可以是任何適當(dāng)?shù)乃阉饕?,而不背離本發(fā)明的精神和范圍。該搜索引擎10的操作通常是眾所周知的或應(yīng)當(dāng)對(duì)相關(guān)人群是顯而易見的,因此除非另外提出,否則無需作任何詳細(xì)闡述。更一般地,系統(tǒng)可以是與搜索引擎10不同的系統(tǒng),這也不背離本發(fā)明的精神和范圍。如在圖2中所見,假設(shè)與系統(tǒng)/搜索引擎10相連,維護(hù)有數(shù)據(jù)倉庫12??梢岳斫?,數(shù)據(jù)倉庫12結(jié)合搜索引擎10的操作存儲(chǔ)數(shù)據(jù),可能包括但不限于由搜索分析器生成的前述數(shù)據(jù)??捎稍摂?shù)據(jù)倉庫12存儲(chǔ)的這種數(shù)據(jù)當(dāng)然可以是任何其它適當(dāng)?shù)臄?shù)據(jù)而不背離本發(fā)明的精神和范圍,且類似地?cái)?shù)據(jù)倉庫12及其組織可以是任何適當(dāng)?shù)臄?shù)據(jù)倉庫和組織而不背離本發(fā)明的精神和范圍。可以理解,數(shù)據(jù)倉庫12內(nèi)的數(shù)據(jù)可無限增長或可周期性地過期并刪除。因而,在本發(fā)明中,流水線14被用來分析該數(shù)據(jù),并且如以下詳述,可分析數(shù)據(jù)倉庫12內(nèi)數(shù)據(jù)的任何部分,包括全部數(shù)據(jù)或數(shù)據(jù)的滑動(dòng)窗口??梢钥吹?,由流水線14執(zhí)行的這種數(shù)據(jù)分析可包括若干組件,每個(gè)組件從倉庫中取得數(shù)據(jù)的一部分并在其上操作。在本發(fā)明一實(shí)施例中,流水線14的輸出被置于庫16中,同時(shí)輸出數(shù)據(jù)組織成諸如關(guān)系數(shù)據(jù)庫、多維表格等的形式。因而,用適當(dāng)?shù)目刂?,web瀏覽器上的用戶可查看這種經(jīng)組織的數(shù)據(jù)并可能還對(duì)其進(jìn)行分析??梢岳斫?,由流水線14執(zhí)行的處理提供有關(guān)如何使用搜索引擎10的統(tǒng)計(jì)數(shù)據(jù)。此外,并在本發(fā)明一實(shí)施例中,這種執(zhí)行過程用來標(biāo)識(shí)用戶如何使用搜索引擎10的模式,特別是可提供真正有價(jià)值信息的如此之多的模式。注意倉庫12中的數(shù)據(jù)可高度規(guī)格化,特別是因?yàn)榭梢岳斫庖?guī)格化這種數(shù)據(jù)使新數(shù)據(jù)能以有效方式添加。然而,這種規(guī)格化數(shù)據(jù)在分析之前必須進(jìn)行解規(guī)格化,且相應(yīng)地?cái)?shù)據(jù)流水線14可包括解規(guī)格器18作為其輸入。這種解規(guī)格器18可以是任何適當(dāng)?shù)慕庖?guī)格器并可以任何適當(dāng)方式操作。這種解規(guī)格器18的操作是眾所周知的或應(yīng)對(duì)相關(guān)人群是顯而易見的,因此無需在此作任何詳細(xì)闡述。在本發(fā)明的流水線14中采用的解規(guī)格器18解規(guī)格倉庫12中的數(shù)據(jù),并還可創(chuàng)建解規(guī)格化的批數(shù)據(jù)用于后來的處理。批處理可根據(jù)任何適當(dāng)標(biāo)準(zhǔn)來執(zhí)行。例如,批數(shù)據(jù)可以是從上個(gè)批數(shù)據(jù)到達(dá)之后的所有數(shù)據(jù),其中如果解規(guī)格器18每天運(yùn)行一次則批數(shù)據(jù)可以是一天的數(shù)據(jù)。類似地,解規(guī)格器18可每周運(yùn)行一次,但被設(shè)置成生成該周內(nèi)每一小時(shí)的批數(shù)據(jù)??梢?,解規(guī)格器18的批數(shù)據(jù)輸出被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器20中,用于由流水線14的其它組件作進(jìn)一步處理。這種數(shù)據(jù)存儲(chǔ)器20和其中批數(shù)據(jù)的組織可以是任何適當(dāng)?shù)拇鎯?chǔ)器和組織,而不背離本發(fā)明的精神和范圍。如圖2所示,采用數(shù)據(jù)存儲(chǔ)器20中批數(shù)據(jù)的組件可包括用戶搜索打包器(USB)、相關(guān)性處理器(RP)、意圖處理器(IP)、數(shù)據(jù)合成器(DS)等等。數(shù)據(jù)流水線14的用戶搜索打包器(USB)分析用戶搜索,每個(gè)用戶搜索是用戶在搜索引擎10上調(diào)用查詢的一個(gè)實(shí)例,并包括有關(guān)查詢串和返回搜索結(jié)果等的信息。兩個(gè)調(diào)用相同查詢串的用戶產(chǎn)生兩個(gè)用戶搜索,而調(diào)用同一查詢串兩次的一個(gè)用戶也可導(dǎo)致兩個(gè)用戶搜索。在本發(fā)明一實(shí)施例中,USB嘗試找出“看起來相像”并因此相似的用戶搜索,并將這種相似的用戶搜索組合成用戶搜索包。USB可用任何適當(dāng)?shù)姆绞讲僮鞫槐畴x本發(fā)明的精神和范圍。操作USB的方法是眾所周知的或?qū)ο嚓P(guān)人群是顯而易見的,因此無需在此作任何詳細(xì)描述。例如,USB可采用分析查詢串的“相似”(LookAlike)算法。例如,如果兩個(gè)用戶都調(diào)用“Wilkes-Barre,PA”的搜索,則那些查詢串看起來相像。更有趣的是,如果一個(gè)用戶搜索“duck”而另一個(gè)搜索“ducks”(一個(gè)復(fù)數(shù)一個(gè)單數(shù)),則那兩個(gè)查詢串也因?yàn)樗惴ú捎迷~干化、案例規(guī)格化、以及其它類似查詢壓縮技術(shù)而“相似”。然而,USB并不限于分析查詢串的相似性。相反,在本發(fā)明一實(shí)施例中,USB還可采用返回搜索結(jié)果分析算法。例如,USB可基于所返回的搜索結(jié)果分析算法來推斷,即使相應(yīng)的查詢串并非都類似,如果每個(gè)用戶搜索產(chǎn)生一組類似的搜索結(jié)果,則兩個(gè)用戶搜索相似。此外或作為替代,USB可根據(jù)內(nèi)容滿意分析算法來推斷,如果每個(gè)用戶搜索產(chǎn)生用戶確定為滿意的特定片段的內(nèi)容或結(jié)果,則兩個(gè)用戶搜索相似。類似地,USB可基于內(nèi)容不滿分析算法來推斷,如果每個(gè)用戶搜索產(chǎn)生用戶確定為不滿意的特定內(nèi)容或結(jié)果,則兩個(gè)用戶搜索不相似。USB的輸出可存儲(chǔ)在作為打包的用戶搜索的數(shù)據(jù)庫的庫16中。或者,這種輸出可存儲(chǔ)回?cái)?shù)據(jù)存儲(chǔ)器20中,以對(duì)流水線14的其它組件可用。本發(fā)明的相關(guān)性處理器(RP)可再劃分成因素發(fā)生器(FG)、相關(guān)性分類器(RC)和度量發(fā)生器(MG)。但是注意,RP的這種再分元件還可獨(dú)立呈現(xiàn)在本發(fā)明的流水線14中,而不組合成RP。因素發(fā)生器(FG)考慮有關(guān)用戶搜索的信息,并產(chǎn)生因素,其中這些因素作為輸入應(yīng)用于相關(guān)性分類器(RC)。每個(gè)因素與來自搜索結(jié)果集的特定結(jié)果相關(guān)。因素常常但并非總是通過考慮若干事件而產(chǎn)生,其中每個(gè)事件通常是與查詢用戶執(zhí)行的動(dòng)作相關(guān)的一段信息。例如,選擇特定結(jié)果可以是一事件,像結(jié)果可被顯示、關(guān)閉、打印、添加到特定列表、重新打開等。事件還可包括顯式的用戶反饋(如果有的話)。然后在本發(fā)明一實(shí)施例中,F(xiàn)G基于事件計(jì)算值。例如,F(xiàn)G可計(jì)算作為因素的“停頓時(shí)間”,它表示用戶查看結(jié)果的時(shí)間長度,并可基于用戶開始和結(jié)束查看該結(jié)果的時(shí)間差來計(jì)算,每個(gè)時(shí)間都由相應(yīng)的時(shí)間標(biāo)記事件來表示。但是注意,在產(chǎn)生停留時(shí)間因素時(shí),F(xiàn)G也可考慮其它事件,包括用戶在查看結(jié)果時(shí)是否被打斷,如由其它適當(dāng)時(shí)間標(biāo)記事件所表示。由FG生成的另一因素可以是用戶是否將結(jié)果添加到諸如喜愛列表之類的特定列表的因素。在這種情形中,這種“喜愛”因素被設(shè)置為真值??梢岳斫?,基于事件的因素類型可以是任何適當(dāng)因素而不背離本發(fā)明的精神和范圍。這種因素是眾所周知的,或應(yīng)當(dāng)對(duì)相關(guān)人群是顯而易見的,因此無需在此作任何詳細(xì)闡述。注意,因素也可來自不同于事件的東西。例如,因素可以是制作該結(jié)果的用戶的標(biāo)識(shí)符。因而,因素可以是結(jié)果的屬性。其它因素可包括查詢串的所屬地區(qū)(例如美式英語、加拿大英語、巴西葡萄牙語),并可從用戶搜索中的信息中導(dǎo)出。更一般地,因素可由FG或另一元件從可用的任何信息片段中導(dǎo)出,而不背離本發(fā)明的精神和范圍。由FG或可能其它地方生成的因素可存儲(chǔ)在適當(dāng)數(shù)據(jù)庫內(nèi)的庫16中?;蛘撸@種因素可存儲(chǔ)回?cái)?shù)據(jù)存儲(chǔ)器20以對(duì)流水線14的其它組件可用,或可直接傳送到這些組件中。相關(guān)性處理器(RP)的相關(guān)性分類器(RC)接收由FG和可能其它地方生成的因素。RC是機(jī)器生成的決策樹,它基于作為輸入的接收因素進(jìn)行操作。在由RP起動(dòng)之后,RC從數(shù)據(jù)存儲(chǔ)器20或其它地方讀取結(jié)果的因素,并生成對(duì)該結(jié)果的判斷。一般而言,這種判斷是在決定訪問來自搜索結(jié)果集的結(jié)果之后對(duì)用戶如何判斷該結(jié)果的確定。判斷可根據(jù)任何適當(dāng)?shù)呐袛嘞到y(tǒng)來表達(dá),而不背離本發(fā)明的精神和范圍。例如,判斷可以是數(shù)字或字母分級(jí)記分,可以是“接受”(即用戶對(duì)結(jié)果滿意)、“瀏覽”(即用戶對(duì)結(jié)果既不是滿意也不是不滿意)、以及“拒絕”(即用戶對(duì)結(jié)果不滿意)等。此外,對(duì)特定結(jié)果的判斷還可包括表示該判斷有多正確的置信度的值,由RC來確定。RC和可能其它地方生成的判斷可存儲(chǔ)在適當(dāng)數(shù)據(jù)庫內(nèi)的庫16中?;蛘撸@種因素可存儲(chǔ)回?cái)?shù)據(jù)存儲(chǔ)器20以對(duì)流水線14的其它組件可用,或可直接傳送到這些組件中。為了機(jī)器生成RC的決策樹,可以是如下情形RP考慮具有顯式判斷因素的每個(gè)結(jié)果。顯式判斷是表示來自用戶的有關(guān)結(jié)果的顯式反饋的一類因素。通過取具有顯式判斷因素的每個(gè)結(jié)果并分析該結(jié)果的其它可用因素,RP或其它地方的相關(guān)性分類器訓(xùn)練器(RCT)能夠“學(xué)習(xí)”什么因素暗示哪些判斷并基于這個(gè)構(gòu)建RC。學(xué)習(xí)因素暗示什么并從中構(gòu)建RC可用任何適當(dāng)方式完成,而不背離本發(fā)明的精神和范圍。這樣做是眾所周知的,或?qū)ο嚓P(guān)人群顯而易見的,因此無需在此作任何詳細(xì)闡述。RP的度量發(fā)生器(MG)產(chǎn)生度量,其中度量是有關(guān)結(jié)果、用戶搜索、對(duì)話等的度量。一般而言,MG基于由FG和可能其它地方生成的因素、RC生成的判斷、以及其它可用的相關(guān)信息來產(chǎn)生這種度量。生成這種度量可用任何適當(dāng)方式完成,而不背離本發(fā)明的精神和范圍。這樣做是眾所周知的,或?qū)ο嚓P(guān)人群顯而易見的,因此無需在此作任何詳細(xì)闡述。MG可生成以下有關(guān)結(jié)果的度量-接受、瀏覽、拒絕每一個(gè)都從結(jié)果的判斷中導(dǎo)出并可包括置信度。-錯(cuò)誤排序結(jié)果對(duì)結(jié)果距離應(yīng)當(dāng)所在的位置有多“遠(yuǎn)”的度量,這是基于結(jié)果在搜索結(jié)果內(nèi)如何放置以及判斷用戶如何已對(duì)該結(jié)果排序。-位置判斷用戶如何已對(duì)結(jié)果排序。-相關(guān)性位置結(jié)果如何在各搜索結(jié)果內(nèi)放置。MG可生成以下有關(guān)用戶搜索的度量-結(jié)果集排序記分類似于對(duì)每個(gè)結(jié)果生成的錯(cuò)誤排序結(jié)果度量,但與用戶搜索的所有結(jié)果相關(guān)。該值嘗試反映結(jié)果集距離應(yīng)當(dāng)所在位置有多遠(yuǎn)。-經(jīng)歸納的接受、瀏覽、拒絕分別歸納用戶搜索中每個(gè)結(jié)果的所有接受、瀏覽、拒絕度量。MG可生成以下有關(guān)對(duì)話的度量-內(nèi)容量對(duì)話是否顯示缺乏用戶在搜索什么的可用信息。-意圖確定對(duì)話是否顯示出不能確定用戶在搜索什么。由MG和可能其它地方生成的度量可存儲(chǔ)在適當(dāng)數(shù)據(jù)庫內(nèi)的庫16中?;蛘撸@種因素可存儲(chǔ)回?cái)?shù)據(jù)存儲(chǔ)器20以對(duì)流水線14的其它組件可用,或可直接傳送到這些組件中。流水線14的意圖處理器(IP)生成意圖,其中每個(gè)意圖是被認(rèn)為是因?yàn)橛脩粼诿總€(gè)實(shí)例中查尋相同搜索結(jié)果而彼此相關(guān)的一個(gè)或多個(gè)對(duì)話的組合。即,意圖是一組共享共同目的的對(duì)話。IP通過考慮每個(gè)對(duì)話、每個(gè)對(duì)話的每個(gè)用戶搜索、以及每個(gè)用戶搜索的每個(gè)結(jié)果來生成意圖。在本發(fā)明一實(shí)施例中,并記住具有共同結(jié)果的對(duì)話可能是相關(guān)的,只有具有判斷“接受”(JudgementofAccept)的結(jié)果才進(jìn)行研究。然而,也可采用具有其它判斷的結(jié)果,而不背離本發(fā)明的精神和范圍。一般而言,通過基于所查看的用戶搜索包在對(duì)話上定位共同結(jié)果和共同查詢項(xiàng),并確定所發(fā)現(xiàn)的共性的強(qiáng)度,IP確定對(duì)話之間的關(guān)系值。這種強(qiáng)度表示通過具有共同的目的,兩個(gè)對(duì)話有多大可能彼此相關(guān)。具有在某一確定閾值之上強(qiáng)度的對(duì)話對(duì)可由IP打包到一個(gè)意圖中。由IP和可能其它地方生成的意圖可存儲(chǔ)在適當(dāng)數(shù)據(jù)庫內(nèi)的庫16中?;蛘撸@種因素可存儲(chǔ)回?cái)?shù)據(jù)存儲(chǔ)器20以對(duì)流水線14的其它組件可用,或可直接傳送到這些組件中。最后,用所有迄今為止生成的數(shù)據(jù),流水線14包括從數(shù)據(jù)存儲(chǔ)器12、庫20、或其它地方中提取這些數(shù)據(jù),并將這些數(shù)據(jù)格式化到要存儲(chǔ)在庫20中的一個(gè)或多個(gè)數(shù)據(jù)庫的數(shù)據(jù)合成器(DS)。特別是如果不同的組件將數(shù)據(jù)寫入不同的表格、數(shù)據(jù)庫等,這種格式化是必需的。例如,USB可將有關(guān)每個(gè)用戶搜索的數(shù)據(jù)添加到用戶搜索打包表格,且MG可能已經(jīng)將數(shù)據(jù)添加到度量表格。因而,DS在適當(dāng)時(shí)將這些表格和其它結(jié)合到有意義的表格中,從中可對(duì)這些數(shù)據(jù)進(jìn)行搜索、聚集、呈現(xiàn)等等。注意DS可編程為只按需格式化數(shù)據(jù)的一部分。例如,如果一部分存儲(chǔ)數(shù)據(jù)被認(rèn)為是沒有用的,DS可略去這些數(shù)據(jù)?;蛘?,DS可將相同的數(shù)據(jù)復(fù)制到多個(gè)表格或?qū)?shù)據(jù)分到多個(gè)表格中。更一般地,DS可編程為將來自流水線14的數(shù)據(jù)格式化成任何適當(dāng)格式,而不背離本發(fā)明的精神和范圍。在本發(fā)明一實(shí)施例中,DS將數(shù)據(jù)格式化到諸如SQL數(shù)據(jù)庫等的關(guān)系數(shù)據(jù)庫中。這樣,數(shù)據(jù)可表示為“星”形,其中事實(shí)表(facttable)在中間而維表(dimensiontable)在四周??梢岳斫?,通過這樣做,事實(shí)表和維表可建成諸如OLAP立方體等的數(shù)據(jù)立方體,它使搜索引擎10的管理員能基于不同標(biāo)準(zhǔn)有效地聚集數(shù)據(jù)。例如,該管理員可請(qǐng)求該立方體找出存在于某日期范圍中的每個(gè)對(duì)話根據(jù)意圖來聚集對(duì)話的意圖確定度量的平均值。類似地,報(bào)告可根據(jù)該立方體來運(yùn)行,且其結(jié)果可被轉(zhuǎn)發(fā)給管理員等。當(dāng)然,該管理員還可根據(jù)該立方體布置大多數(shù)任何其它適當(dāng)?shù)牟樵?,或接收根?jù)該立方體運(yùn)行的任何其它報(bào)告。結(jié)論本發(fā)明可實(shí)踐關(guān)于分析來自搜索引擎10的大多數(shù)任何適當(dāng)系統(tǒng)的數(shù)據(jù)。應(yīng)理解,使用在此闡述的本發(fā)明,可為任何目的分析系統(tǒng)的數(shù)據(jù)表示,包括調(diào)整或“調(diào)節(jié)”系統(tǒng)以改進(jìn)響應(yīng)、維護(hù)系統(tǒng)性能、并以其它方式確保系統(tǒng)在令人滿意地運(yùn)行。實(shí)現(xiàn)結(jié)合本發(fā)明執(zhí)行的過程所需的編程是相對(duì)簡單的,且應(yīng)當(dāng)對(duì)相關(guān)編程人員顯而易見。因此,這些程序未附于此。任何具體的編程可用來實(shí)現(xiàn)本發(fā)明而不背其精神和范圍。在前面的描述中,可以看到本發(fā)明包括分析大量數(shù)據(jù)尤其是來自搜索引擎10等的大量數(shù)據(jù)的新穎和有用的裝置。這種裝置在以下情形特別有用搜索引擎10特別大、具有較高通信量等,且可用來分析的這種數(shù)據(jù)量特別大,因此不易使用并在其它方面難以工作。應(yīng)理解,可對(duì)上述實(shí)施例作改變而不背離其中發(fā)明概念。因此,應(yīng)理解,本發(fā)明并不限于所揭示的特定實(shí)施例,而旨在涵蓋由所附權(quán)利要求定義的本發(fā)明精神和范圍內(nèi)的更改。權(quán)利要求1.一種用于分析來自搜索引擎的數(shù)據(jù)的系統(tǒng),所述搜索引擎基于從請(qǐng)求用戶接收的查詢串生成一組搜索結(jié)果,所述查詢串和所述搜索結(jié)果共同包括用戶搜索,所述搜索結(jié)果包括至少一個(gè)結(jié)果,每個(gè)結(jié)果指向被認(rèn)為是與所述查詢串相關(guān)的特定內(nèi)容項(xiàng),從而一系列相關(guān)用戶搜索包括一對(duì)話,所述搜索引擎存儲(chǔ)每個(gè)用戶搜索和相關(guān)信息,所述系統(tǒng)包括用戶搜索打包器(USB),分析用戶搜索以找出這些用戶搜索中的相似搜索,并將這些相似用戶搜索組合成用戶搜索包,意圖處理器(IP),基于來自所述USB的用戶搜索包生成意圖,每個(gè)意圖是被認(rèn)為是彼此相關(guān)的一個(gè)或多個(gè)對(duì)話的組合,因素發(fā)生器(FG),考慮用戶搜索和相關(guān)信息來產(chǎn)生因素,每個(gè)因素與來自一組搜索結(jié)果的特定結(jié)果相關(guān),每個(gè)因素與一個(gè)或多個(gè)事件相關(guān),每個(gè)事件是與查詢用戶所執(zhí)行的動(dòng)作相關(guān)的一段信息,相關(guān)性分類器(RC),接收由所述FG對(duì)每個(gè)結(jié)果生成的因素,并基于所述因素操作以生成對(duì)所述結(jié)果的判斷,所述判斷表示對(duì)在用戶決定訪問來自各搜索結(jié)果的結(jié)果時(shí),用戶如何判斷該結(jié)果的確定,度量發(fā)生器(MG),基于由FG生成的因素和由RC生成的判斷來產(chǎn)生度量,每個(gè)度量是有關(guān)結(jié)果、用戶搜索或?qū)υ挼亩攘浚约皵?shù)據(jù)合成器(DS),提取由所述USB、IP、FG、RC和MG生成的數(shù)據(jù),將所述已提取數(shù)據(jù)格式化到一個(gè)或多個(gè)數(shù)據(jù)庫,并將所述數(shù)據(jù)庫存儲(chǔ)到庫中,從而可查看并聚集數(shù)據(jù)以提供反饋或生成報(bào)告。2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述搜索引擎將每個(gè)查詢串以及相應(yīng)搜索結(jié)果和相關(guān)信息以規(guī)格化形式存儲(chǔ)在數(shù)據(jù)倉庫中,所述系統(tǒng)還包括一解規(guī)格器,它從所述數(shù)據(jù)倉庫檢索所述規(guī)格化數(shù)據(jù)、規(guī)格化所述數(shù)據(jù)、并將所述已規(guī)格化的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器中。3.如權(quán)利要求1所述的系統(tǒng),其特征在于,為了查詢串的相似性和搜索結(jié)果的相似性的至少之一,所述USB分析所述用戶搜索。4.如權(quán)利要求1所述的系統(tǒng),其特征在于,每個(gè)事件包括當(dāng)用戶執(zhí)行選擇和關(guān)閉特定結(jié)果的至少之一動(dòng)作時(shí)的時(shí)間,且其中所述FG計(jì)算表示用戶查看結(jié)果的時(shí)間長度的“停頓時(shí)間”因素,所述停頓時(shí)間因素基于用戶選擇和關(guān)閉所述結(jié)果之間的時(shí)間差值,每個(gè)時(shí)間都由相應(yīng)的時(shí)間標(biāo)記事件來表示。5.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述RC生成一判斷,包括“接受”判斷、“瀏覽”判斷、以及“拒絕”判斷以及表示該判斷正確有多大可能的置信度的相應(yīng)值。6.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括相關(guān)性分類器訓(xùn)練器,它接收來自所述FG的顯式判斷因素并基于這些因素生成所述RC,每個(gè)顯式判斷因素表示來自用戶的有關(guān)所述相應(yīng)結(jié)果的顯式反饋,所述RCT從所述顯式判斷因素學(xué)習(xí)什么因素暗示哪些判斷并基于這個(gè)生成RC。7.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述MG生成有關(guān)結(jié)果的以下至少之一位置度量,有關(guān)判斷用戶如何已對(duì)所述結(jié)果排序,相關(guān)性位置度量,有關(guān)結(jié)果如何在各搜索結(jié)果內(nèi)放置,以及錯(cuò)誤排序結(jié)果度量,有關(guān)對(duì)結(jié)果距離應(yīng)當(dāng)所在的位置有多“遠(yuǎn)”的度量,這是基于所述位置度量和相關(guān)性位置度量的。8.如權(quán)利要求1所述的系統(tǒng),其特征在于,通過基于所查看的用戶搜索包在各對(duì)話上定位共同結(jié)果和共同查詢項(xiàng),所述IP確定對(duì)話之間的關(guān)系值并確定所發(fā)現(xiàn)的共性的強(qiáng)度,這種共性的強(qiáng)度表示通過具有共同的目的兩個(gè)對(duì)話有多大可能彼此相關(guān),所述IP將具有在某些確定閾值之上強(qiáng)度的所述對(duì)話對(duì)打包到一個(gè)意圖中。9.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述DS將所述已抽取數(shù)據(jù)格式化到關(guān)系數(shù)據(jù)庫中。10.一種用于分析來自搜索引擎的數(shù)據(jù)的方法,所述搜索引擎基于從請(qǐng)求用戶接收的查詢串生成一組搜索結(jié)果,所述查詢字符串和所述搜索結(jié)果共同包括用戶搜索,搜索結(jié)果包括至少一個(gè)結(jié)果,每個(gè)結(jié)果指向被認(rèn)為是與所述查詢串相關(guān)的特定內(nèi)容項(xiàng),從而一系列相關(guān)用戶搜索包括一對(duì)話,所述搜索引擎存儲(chǔ)每個(gè)用戶搜索和相關(guān)信息,所述方法包括分析用戶搜索以找出這些用戶搜索中的相似搜索,并將這些相似用戶搜索組合成用戶搜索包,基于來自所述USB的用戶搜索包生成意圖,每個(gè)意圖是被認(rèn)為是彼此相關(guān)的一個(gè)或多個(gè)對(duì)話的組合,考慮用戶搜索和相關(guān)信息來產(chǎn)生因素,每個(gè)因素與來自一組搜索結(jié)果的特定結(jié)果相關(guān),每個(gè)因素與一個(gè)或多個(gè)事件相關(guān),每個(gè)事件是與查詢用戶所執(zhí)行的動(dòng)作相關(guān)的一段信息,接收由所述FG對(duì)每個(gè)結(jié)果生成的所述因素,并基于所述因素操作以生成對(duì)所述結(jié)果的判斷,所述判斷表示對(duì)在用戶決定訪問來自搜索結(jié)果的結(jié)果時(shí)用戶如何判斷該結(jié)果的確定,基于由FG生成的因素和由RC生成的判斷來產(chǎn)生度量,每個(gè)度量是有關(guān)結(jié)果、用戶搜索或?qū)υ挼亩攘?,以及提取由所述USB、IP、FG、RC和MG生成的數(shù)據(jù),將所述已提取數(shù)據(jù)格式化到一個(gè)或多個(gè)數(shù)據(jù)庫,并將所述數(shù)據(jù)庫存儲(chǔ)到庫中,從而可查看并聚集數(shù)據(jù)以提供反饋或生成報(bào)告。11.如權(quán)利要求10所述的方法,其特征在于,包括將每個(gè)查詢串以及所述相應(yīng)搜索結(jié)果和相關(guān)信息以規(guī)格化形式存儲(chǔ)在數(shù)據(jù)倉庫中,并且還包括從所述數(shù)據(jù)倉庫檢索所述規(guī)格化數(shù)據(jù)、規(guī)格化所述數(shù)據(jù)、并將所述已規(guī)格化的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器中。12.如權(quán)利要求10所述的方法,其特征在于,為了查詢串的相似性和搜索結(jié)果的相似性的至少之一,分析所述用戶搜索。13.如權(quán)利要求10所述的方法,其特征在于,每個(gè)事件包括當(dāng)用戶執(zhí)行選擇和關(guān)閉特定結(jié)果的至少之一動(dòng)作時(shí)的時(shí)間、且其中所述FG計(jì)算表示用戶查看結(jié)果的時(shí)間長度的“停頓時(shí)間”因素,所述停頓時(shí)間因素基于用戶選擇和關(guān)閉所述結(jié)果之間的時(shí)間差值,每個(gè)時(shí)間都由相應(yīng)的時(shí)間標(biāo)記事件來表示。14.如權(quán)利要求10所述的方法,其特征在于,包括生成一判斷,它包括“接受”判斷、“瀏覽”判斷、以及“拒絕”判斷以及表示該判斷正確有多大可能的置信度的相應(yīng)值。15.如權(quán)利要求10所述的方法,其特征在于,還包括接收顯式判斷因素并基于這些因素生成相關(guān)性分類器(RC),所述RC接收對(duì)每個(gè)結(jié)果生成的因素并基于這些因素操作以生成對(duì)所述結(jié)果的判斷,每個(gè)顯式判斷因素表示來自用戶的有關(guān)所述相應(yīng)結(jié)果的顯式反饋,從而可基于這些顯式判斷因素來學(xué)習(xí)什么因素暗示哪些判斷。16.如權(quán)利要求10所述的方法,其特征在于,包括生成有關(guān)結(jié)果的以下至少之一位置度量,有關(guān)判斷用戶如何已對(duì)所述結(jié)果排序,相關(guān)性位置度量,有關(guān)結(jié)果如何在各搜索結(jié)果內(nèi)放置,以及錯(cuò)誤排序結(jié)果度量,有關(guān)對(duì)結(jié)果距離應(yīng)當(dāng)所在的位置有多“遠(yuǎn)”的度量,這是基于所述位置度量和相關(guān)性位置度量的。17.如權(quán)利要求10所述的方法,其特征在于,包括通過基于所查看的用戶搜索包在各對(duì)話上定位共同結(jié)果和共同查詢項(xiàng),確定對(duì)話之間的關(guān)系值,并確定所發(fā)現(xiàn)的共性的強(qiáng)度,這種共性的強(qiáng)度表示通過具有共同的目的兩個(gè)對(duì)話有多大可能彼此相關(guān),具有在某些確定閾值之上強(qiáng)度的所述對(duì)話對(duì)被打包到一個(gè)意圖中。18.如權(quán)利要求10所述的方法,其特征在于,包括將所述已抽取數(shù)據(jù)格式化到關(guān)系數(shù)據(jù)庫中。全文摘要一種系統(tǒng)分析來自搜索引擎的數(shù)據(jù)。用戶搜索打包器分析用戶搜索,將相似的用戶搜索組合成用戶搜索包。因子發(fā)生器考慮用戶搜索和相關(guān)信息以生成各因子,其中每個(gè)因子與來自搜索結(jié)果集的特定結(jié)果相關(guān)。相關(guān)性分類器接收各因子并基于各個(gè)因子操作以產(chǎn)生對(duì)每個(gè)結(jié)果的判斷。度量發(fā)生器基于各個(gè)因子和各個(gè)判斷生成度量,且數(shù)據(jù)合成器將已提取數(shù)據(jù)格式化到數(shù)據(jù)庫中。文檔編號(hào)G06F17/30GK1763749SQ20051011331公開日2006年4月26日申請(qǐng)日期2005年9月20日優(yōu)先權(quán)日2004年10月20日發(fā)明者B·E·安德森,小F·H·貝爾,J·C·芬格,J·J·馬爾斯曼,K·卡那瓦特,M·B·米德蘭,P·M·瑪羅萊普斯,清水剛,T·D·懷特,Y·張申請(qǐng)人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1