許多軟件產(chǎn)品提供了相對大量的內(nèi)部功能以供在使用軟件產(chǎn)品執(zhí)行各種任務(wù)的同時(shí)利用。例如,文字處理器內(nèi)的拼寫檢查功能、電子表格應(yīng)用內(nèi)的算法功能以及用于改變公布應(yīng)用中的文本的圖形功能相對常見。然而,大量的用戶不熟悉在一些軟件產(chǎn)品中所提供的許多其它特征、功能和工具。為了解決上述問題,一些軟件產(chǎn)品提供了“幫助”或“查詢”工具,其允許用戶輸入與期望任務(wù)相關(guān)的表達(dá),以及接收根據(jù)由該幫助或查詢工具采用的特定算法的結(jié)果。例如,可允許用戶利用對用戶期望在底層的軟件產(chǎn)品中使用的功能進(jìn)行描述的自然語言來輸入短語或輸入詞語的群組。為了從短語推斷出有關(guān)的功能并隨后返回給用戶,幫助或查詢工具必須確定在由用戶供給的短語與對可用功能的預(yù)定義描述之間存在什么匹配(如果有)。此外,與生成底層軟件產(chǎn)品和對相關(guān)聯(lián)的功能的描述的軟件編程者所使用的詞語的小群組相比,由任意數(shù)量的用戶創(chuàng)建的自然表達(dá)必須被考慮在內(nèi)。因此,將用于描述期望的軟件功能的自然語言表達(dá)與期望的軟件功能的實(shí)際的內(nèi)部命名規(guī)約相比較,兩者之間可能存在大的差距。本公開正是基于這些考慮以及其它考慮而做出的。技術(shù)實(shí)現(xiàn)要素:本文描述了基于查詢來識別查詢意圖以便發(fā)現(xiàn)由軟件產(chǎn)品或軟件產(chǎn)品的群組所提供的功能的技術(shù)。特別地,可以基于一組對于自然語言詞語的基于規(guī)則的置換將自然語言表達(dá)反復(fù)地分割且合并成基于由軟件產(chǎn)品提供的功能的預(yù)定命名規(guī)約的一個(gè)或多個(gè)定義的詞語。此后,可以識別與定義的詞語相關(guān)的先前搜索詞語的聚類(cluster),并且可以將所述自然語言表達(dá)與所識別的聚類相關(guān)聯(lián)以創(chuàng)建基于意圖的聚類信息。根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例,一種用于識別查詢意圖的方法包括:接收指向由計(jì)算機(jī)中可用的軟件產(chǎn)品提供的至少一個(gè)功能的原始查詢。該原始查詢包括與至少一個(gè)功能相關(guān)的自然語言表達(dá)。該方法還包括:基于一組對于自然語言詞語的基于規(guī)則的置換將自然語言表達(dá)的詞語反復(fù)地分割且合并成一個(gè)或多個(gè)定義的詞語,一個(gè)或多個(gè)定義的詞語是基于至少一個(gè)功能的預(yù)定命名規(guī)約的。一個(gè)或多個(gè)定義的詞語可以指代至少一個(gè)功能。此后該方法包括:識別與一個(gè)或多個(gè)定義的詞語相關(guān)的先前搜索詞語的聚類,以及將自然語言表達(dá)與所識別的聚類相關(guān)聯(lián)以創(chuàng)建一組基于意圖的聚類信息。該查詢意圖由一個(gè)或多個(gè)定義的詞語來表示。根據(jù)本文呈現(xiàn)的另一實(shí)施例,一種聚類系統(tǒng)被配置為從接收自多個(gè)客戶端計(jì)算機(jī)的原始查詢中識別意圖,用于發(fā)現(xiàn)由在客戶端計(jì)算機(jī)上執(zhí)行的軟件產(chǎn)品提供的功能。聚類系統(tǒng)包括至少一個(gè)計(jì)算機(jī),其執(zhí)行原始查詢處理服務(wù),原始查詢處理服務(wù)被配置為:接收來自多個(gè)客戶端計(jì)算機(jī)中的至少一個(gè)客戶端計(jì)算機(jī)的原始查詢,校正在該原始查詢中所包含的單詞拼寫以創(chuàng)建已校正拼寫的查詢,覆蓋(override)所述已校正拼寫的查詢中的單詞的一部分的已校正拼寫以創(chuàng)建與至少一個(gè)功能相關(guān)的初始群(initialgrouping),以及基于自然語言表達(dá)中的修飾詞語,將初始群的和已校正拼寫的查詢的詞語(termsoftheinitialgroupingandthespell-correctedquery)群聚成一組初步詞語群。修飾詞語指代使用所述至少一個(gè)功能的任務(wù)。原始查詢處理服務(wù)可被進(jìn)一步配置為,基于對自然語言詞語的基于規(guī)則的置換將所述一組初步群(preliminarygrouping)的各個(gè)群(grouping)分割且合并成精煉詞語群(refinedgroupingsofterms),所述精煉詞語群是基于所述至少一個(gè)功能的預(yù)定命名規(guī)約的,所述精煉詞語群指代所述至少一個(gè)功能,識別與精煉詞語群相關(guān)的先前搜索詞語的聚類,將自然語言表達(dá)與所識別的聚類相關(guān)聯(lián)以創(chuàng)建一組基于意圖的聚類信息,接收包含至少一個(gè)短語的新的原始查詢,以及將所述至少一個(gè)短語與基于意圖的聚類信息進(jìn)行比較以識別相關(guān)聯(lián)的先前搜索詞語的聚類。應(yīng)當(dāng)意識到上述主題還可以實(shí)現(xiàn)為計(jì)算機(jī)控制的裝置、計(jì)算機(jī)過程、計(jì)算系統(tǒng)或諸如計(jì)算機(jī)可讀介質(zhì)的制品。雖然本文呈現(xiàn)的實(shí)施例主要是在識別查詢意圖的上下文中公開,但是本文公開的概念和技術(shù)也可以用于從其它用戶提交的數(shù)據(jù)中譯解意圖。這些特征以及各種其它特征將通過理解下面的詳述以及相關(guān)聯(lián)的附圖的閱覽而變得明顯。提供該
發(fā)明內(nèi)容以便以簡化的形式來引入下面的具體實(shí)施方式中進(jìn)一步描述的概念的選集。該
發(fā)明內(nèi)容不旨在識別所要求保護(hù)的主題的關(guān)鍵特征或主要特征,也不旨在將該
發(fā)明內(nèi)容用于限制所要求保護(hù)的主題的范圍。此外,要求保護(hù)的主題不限于解決在本公開的任何部分中提到的任何或全部缺點(diǎn)的實(shí)現(xiàn)方式。附圖說明圖1是示出由本文呈現(xiàn)的實(shí)施例提供的示例性的操作環(huán)境和多個(gè)軟件組件的多方面的網(wǎng)絡(luò)圖;圖2是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的對原始用戶查詢進(jìn)行預(yù)處理的一個(gè)示例性的例程的多方面的流程圖;圖3是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于初步群聚查詢的詞典處理的一個(gè)示例性的例程的多方面的流程圖;圖4是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢的第二詞典處理(secondarydictionaryprocessing)的一個(gè)示例性的例程的多方面的流程圖;圖5是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢的最終詞典處理的一個(gè)示例性的例程的多方面的流程圖;圖6是示出可用于查詢意圖的標(biāo)識的一般輸出格式的示范性的表格;圖7是示出根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于使用聚類查詢信息進(jìn)行用戶查詢的處理的一個(gè)示例性的例程的多方面的流程圖;以及圖8是示出示例性的計(jì)算機(jī)硬件和軟件體系結(jié)構(gòu)的計(jì)算機(jī)體系結(jié)構(gòu)圖。具體實(shí)施方式下文的具體實(shí)施方式涉及用于確定用戶提交的針對由一個(gè)或一組軟件產(chǎn)品所提供的特征、功能和/或工具的查詢的意圖的技術(shù)。通過使用本文呈現(xiàn)的技術(shù)和概念,相對精確的意圖識別是可能的,使得可以為各種自然語言查詢提供適當(dāng)?shù)慕Y(jié)果,諸如用于發(fā)現(xiàn)計(jì)算機(jī)程序提供的功能的用戶查詢。如上文簡要論述的,常規(guī)的軟件產(chǎn)品可能需要利用與功能的已確立的名稱緊密地相匹配的描述,來以簡潔的技術(shù)術(shù)語提交想要對可用功能進(jìn)行定位的查詢。然而,使用本文公開的技術(shù)的實(shí)現(xiàn)方式,可以將對可用功能進(jìn)行定位的查詢表達(dá)為自然語言表達(dá),從中可以辨別出意圖。來自自然語言表達(dá)的短語和詞語可以在一個(gè)或多個(gè)詞典模型的界限內(nèi)被反復(fù)地解析成單個(gè)的詞語以及合并成單個(gè)的短語,使得短語的意圖能夠被識別、聚類以及用于未來的搜索。如本文所使用的,術(shù)語“詞典模型”指代將一組對于自然語言詞語的基于規(guī)則的置換與基于一個(gè)或多個(gè)軟件產(chǎn)品的內(nèi)部命名規(guī)約的一個(gè)或多個(gè)定義的詞語相關(guān)聯(lián)的文件或結(jié)構(gòu)。聚類系統(tǒng)利用詞典模型來處理短語以持續(xù)地拆分和合并短語,直至識別與一個(gè)或多個(gè)軟件功能相關(guān)的短語的一個(gè)或多個(gè)正確聚類。聚類系統(tǒng)隨后能夠提供將自然語言表達(dá)與相對少量的內(nèi)部軟件功能相匹配的“多對少(many-to-few)”表示的聚類信息。聚類信息可由被配置為接收查詢的任何軟件應(yīng)用或信息取回系統(tǒng)使用,包括例如被配置為接收來自期望使用軟件產(chǎn)品或一組軟件產(chǎn)品的用戶的查詢的信息取回系統(tǒng)。在接收到新的或未來的查詢時(shí),聚類辨識算法或模塊能夠?qū)⑿虏樵兣c相關(guān)聯(lián)的聚類匹配,并且提供結(jié)果以供由提交了查詢的用戶消費(fèi)。雖然本文所描述的主題是在關(guān)于計(jì)算機(jī)系統(tǒng)的操作系統(tǒng)和應(yīng)用程序的執(zhí)行相結(jié)合而執(zhí)行的程序模塊的一般上下文中呈現(xiàn)的,但是本領(lǐng)域技術(shù)人員將認(rèn)識到,可以與其它類型的程序模塊相結(jié)合來執(zhí)行其它的實(shí)現(xiàn)方式。通常,程序模塊包括執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)、以及其它類型的結(jié)構(gòu)。而且,本領(lǐng)域技術(shù)人員將意識到本文所述的主題可以利用其它計(jì)算機(jī)系統(tǒng)配置來實(shí)現(xiàn),包括手持式設(shè)備、多處理器系統(tǒng)、基于微處理器的或可編程消費(fèi)電子產(chǎn)品、微型計(jì)算機(jī)、大型計(jì)算機(jī)等。在下面的具體實(shí)施方式中參考了附圖,附圖構(gòu)成具體實(shí)施方式的部分并且是通過示例性的具體實(shí)施例或示例來示出的?,F(xiàn)在參考附圖對用于過濾電子消息的計(jì)算機(jī)系統(tǒng)和方法的多方面進(jìn)行說明,在圖中相似的標(biāo)記表示相似的元件。現(xiàn)在轉(zhuǎn)到圖1,將提供有關(guān)本文呈現(xiàn)的實(shí)施例所提供的示例性的操作環(huán)境和多個(gè)軟件組件的細(xì)節(jié)。特別地,圖1示出了用于確定一個(gè)或多個(gè)查詢的意圖的系統(tǒng)100的多方面。系統(tǒng)100包括經(jīng)由網(wǎng)絡(luò)105與聚類系統(tǒng)140可操作通信的一個(gè)或多個(gè)客戶端101A,101B和101C(在本文中以單數(shù)形式稱為“客戶端101”和/或復(fù)數(shù)形式稱為“多個(gè)客戶端101”)。客戶端101可以是任何適合的計(jì)算機(jī)系統(tǒng),包括但不限于臺式或膝上型個(gè)人計(jì)算機(jī)、平板式計(jì)算設(shè)備、智能手機(jī)、其它類型的移動(dòng)設(shè)備等??蛻舳?01可以被配置為執(zhí)行軟件產(chǎn)品,諸如應(yīng)用102A,102B和102C,或者一套軟件產(chǎn)品,其被提供以供用戶提交查詢,以便發(fā)現(xiàn)由軟件產(chǎn)品所支持的特征、功能和工具。在這方面,客戶端101可以接收一個(gè)或多個(gè)原始查詢130A,130B和130C(在本文中以單數(shù)形式稱為“原始查詢130”和/或以復(fù)數(shù)形式稱為“多個(gè)原始查詢130”)。原始查詢130可以包括客戶端101的用戶所創(chuàng)建的短語、詞語的群組和/或自然語言表達(dá)。原始查詢可以被提交以經(jīng)由網(wǎng)絡(luò)105傳輸。網(wǎng)絡(luò)105可以包括計(jì)算機(jī)通信網(wǎng)絡(luò),諸如因特網(wǎng)、局域網(wǎng)(“LAN”)、廣域網(wǎng)(“WAN”)或任何其它類型的網(wǎng)絡(luò),并且可用于將原始查詢130提交給聚類系統(tǒng)140以便進(jìn)一步處理。聚類系統(tǒng)140包括多個(gè)組件,所述多個(gè)組件被配置為執(zhí)行如本文所描述的與在詞典模型的界限內(nèi)對自然語言詞語和/或短語的群進(jìn)行拆分和合并以確定用戶提交的查詢的意圖相關(guān)的處理功能。例如,聚類系統(tǒng)140可被配置為通過原始查詢處理服務(wù)141來接收并處理原始查詢130。通常,原始查詢處理服務(wù)141被配置為從網(wǎng)絡(luò)105接收原始查詢130。原始查詢處理服務(wù)141進(jìn)一步被配置為通過存儲在詞典存儲145中的一個(gè)或多個(gè)詞典模型以及通過在聚類處理服務(wù)143處的聚類處理來確定原始查詢130的實(shí)際意圖。對要確定意圖的原始查詢的實(shí)際處理將參考圖2進(jìn)行更詳細(xì)的說明。在確定原始查詢130的意圖后,原始查詢處理服務(wù)141將所確定的意圖信息傳達(dá)給聚類處理服務(wù)143,使得保持在聚類存儲147中的聚類信息146反映所確定的意圖和相關(guān)聯(lián)的自然語言表達(dá)。應(yīng)注意,原始查詢處理服務(wù)141和聚類處理服務(wù)143在一些實(shí)施例中可以組合。因此,歸屬于兩者中任一服務(wù)的任何特定功能可以同等地歸屬于另一服務(wù),反之亦然。以可用的或期望的形式提供聚類信息147的任何此類修改都在本公開的范圍內(nèi)。聚類信息146包括與相對少量的內(nèi)部軟件功能匹配的多個(gè)自然語言表達(dá)的多對少表示。換言之,聚類信息147將多個(gè)原始查詢的意圖表示為在客戶端101處能執(zhí)行的目標(biāo)軟件產(chǎn)品的內(nèi)部軟件功能的映射。聚類信息146的一般的特征和布置在下文參考圖6來更全面地描述。聚類信息146可以傳達(dá)給被布置成與聚類系統(tǒng)140通信的可用的信息取回系統(tǒng)150。信息取回系統(tǒng)150可以包括任何適合的信息取回系統(tǒng),諸如例如搜索引擎、軟件產(chǎn)品幫助或查詢系統(tǒng)、在線服務(wù)提供商網(wǎng)絡(luò)(例如,在線幫助或信息提供商)或任何其它期望的系統(tǒng)。信息取回系統(tǒng)150一般包括:原始查詢處理服務(wù)151,其被布置成接收原始查詢130;以及聚類辨識服務(wù),其被布置成基于原始查詢130來生成搜索結(jié)果138。原始查詢處理服務(wù)151可以將來自原始查詢130的自然語言表達(dá)解析和分割成任何期望的群。此后,聚類辨識服務(wù)153可使用解析的查詢來確定在聚類信息146中描述的任何聚類是否匹配一個(gè)或多個(gè)解析的群。如果找到匹配,則聚類辨識服務(wù)153可以生成搜索結(jié)果138并且經(jīng)由網(wǎng)絡(luò)105將搜索結(jié)果138指向適當(dāng)?shù)目蛻舳?01(即,生成查詢的客戶端)。網(wǎng)絡(luò)105可以將搜索結(jié)果138分布為分別指向單個(gè)的客戶端101A,101B和101C的單個(gè)的搜索結(jié)果138A,138B和138C。應(yīng)當(dāng)理解,取決于原始查詢130源自哪里,可以分布更多或更少的搜索結(jié)果,或者那些搜索結(jié)果可以與那些特別示出的形式不同地分布?,F(xiàn)在參考圖2,將提供關(guān)于本文呈現(xiàn)的用于通過聚類系統(tǒng)140從原始查詢130提取意圖的實(shí)施例的另外的細(xì)節(jié)。特別地,圖2是示出了根據(jù)本文所呈現(xiàn)的一個(gè)實(shí)施例的用于處理原始查詢130的一個(gè)示例性的方法200的多方面的流程圖。如圖所示,方法200包括在框202處接收原始查詢。如上文簡要論述,原始查詢處理服務(wù)141經(jīng)由網(wǎng)絡(luò)或其它通信介質(zhì)接收一個(gè)或多個(gè)原始查詢130。取決于任何特定的實(shí)現(xiàn),原始查詢130可以單獨(dú)地或者在基本并行的過程中被處理。因此,多種形式的原始查詢處理都在本公開的范圍內(nèi),但是下面的特征是參考單一原始查詢130來描述的。方法200還包括:在框204處,對接收到的原始查詢130的初步拼寫檢查和異常處理。例如,可以初始地執(zhí)行拼寫檢查算法來校正在原始查詢130內(nèi)誤拼的任何詞語。拼寫檢查算法可以包括任何已知的或期望的算法,其比較各個(gè)詞語以確定誤拼是否顯見。拼寫檢查算法可以根據(jù)其個(gè)體的例程來校正任何誤拼,并且返回包含任何已校正的詞語的結(jié)果。此后,拼寫異常處理可以基于拼寫異常詞典模型來執(zhí)行,以進(jìn)一步校正詞語。例如,雖然特定的詞語可以在自然語言中正確地拼寫,但是一個(gè)或多個(gè)詞語可能實(shí)際上指代或者打算指代具有略微相似的拼寫的內(nèi)部軟件功能。拼寫異常詞典模型被布置成基于目標(biāo)軟件產(chǎn)品的內(nèi)部命名規(guī)約來校正這些不正確的指代。例如,雖然典型的拼寫檢查算法可以確定詞語“pain(疼痛)”是正確拼寫的詞語,原始查詢130可能實(shí)際上指代諸如來自微軟公司的MICROSOFTWORD文字處理程序的文字處理軟件產(chǎn)品的“pane(窗格)”或“toolpane(工具窗格)”。因此,在本文公開的實(shí)施例中所使用的拼寫異常詞典模型可以被配置為將原始查詢130中的拼寫校正后的自然語言正規(guī)化(例如,標(biāo)準(zhǔn)化)為與在客戶端101上執(zhí)行的目標(biāo)軟件產(chǎn)品一致。在下表1中提供了示范性的拼寫異常詞典模型中可以包含的示例的一組置換規(guī)則:表1:原始詞語置換后詞語picottablepivottablepicottablespivottablepivioittablepivottablepiviottablepivottablepiviouttablepivottablepivotaltablepivottablepivitotablepivottablepivotaltablepivottablepivitoltablepivottablepivitottablepivottable如上表1所示,多個(gè)詞語可以在原始查詢130內(nèi)置換以指代實(shí)際的軟件功能,而不是它們的自然語言定義。在表1的特定示例中,指代目標(biāo)軟件產(chǎn)品的“pivottable”功能的自然語言表達(dá)的多個(gè)不同的版本被置換成詞語“pivottable”。根據(jù)任何期望的實(shí)現(xiàn)方式,該置換可以包括:原始查詢130中的詞語的實(shí)際的交換,或者描述置換的元數(shù)據(jù)的添加。通過這種方式,拼寫異常詞典模型允許基于置換的詞語來創(chuàng)建基本詞語群。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品可應(yīng)用多種形式的拼寫異常詞典,并且相應(yīng)地,所有這些變型例都在本公開的范圍內(nèi)。方法200還包括:在框206處,來自框204的結(jié)果的初步群(preliminarygrouping)。一般地,原始查詢處理服務(wù)141可以基于在最初的原始查詢內(nèi)的修飾語或修飾語言將經(jīng)拼寫校正和拼寫異常置換的查詢處理成一組初步詞語群。修飾語詞語可以包括“哪里”以及“如何”或其它修飾詞語,來指代可以借以使用目標(biāo)軟件產(chǎn)品完成任務(wù)的位置或過程。其它指代時(shí)間關(guān)系的修飾詞語(例如,“何時(shí)”)或指代不能被立即辨識為與期望功能相關(guān)的關(guān)系的修飾詞語,可以被群聚在一起。相應(yīng)地,原始查詢處理服務(wù)141可以初始地基于這些修飾詞語的存在來對經(jīng)拼寫校正和拼寫異常置換的查詢進(jìn)行群聚。初始群可通過另外的詞典模型進(jìn)一步處理以推斷另外的關(guān)于原始查詢130的意圖的細(xì)節(jié)。方法200還包括:在框208處,初步群的初始詞典模型處理。例如,初始詞典模型處理可以包括通過有些類似于上述的拼寫異常詞典模型的多個(gè)初始詞典模型來處理。初始詞典模型處理可以得到被進(jìn)一步區(qū)分或拆分的群,使得一些短語被區(qū)分開,同義詞被辨識或去除,加記號的(tokenized)或者能加記號的(tokenizable)詞語被辨識出,和/或不重要的單詞被去除。下面參考圖2來詳述初始詞典處理。在框208處初始詞典模型處理至少部分成功完成時(shí),方法200還包括:在框210中,將預(yù)處理規(guī)則應(yīng)用于來自框208的結(jié)果。例如,預(yù)處理規(guī)則可以描述對被包含在框208的結(jié)果中的詞語進(jìn)行合并和分割,以形成與目標(biāo)軟件產(chǎn)品的功能更緊密相關(guān)的群。預(yù)處理規(guī)則可以被使用來嘗試將單個(gè)的或先前分割的詞語組織成與在客戶端101上執(zhí)行的目標(biāo)軟件產(chǎn)品的實(shí)際功能相關(guān)的合并短語。例如,預(yù)處理規(guī)則可以包括將諸如“打印”和“全部”等詞語合并成與其中文檔的全部頁被打印的打印功能相關(guān)的短語,諸如“打印全部”或者“打印全部頁”,取決于原始查詢130的結(jié)果和這些詞語在原始查詢130中的放置。其它非限制示例包括將諸如“打印”、“每一個(gè)”和“其它”的詞語合并成與分段打印功能相關(guān)的短語,諸如“隔頁打印”或“跳過打印奇數(shù)頁”,取決于原始查詢130的結(jié)構(gòu)和這些詞語在原始查詢130的放置。方法200還包括:在框212中從預(yù)處理群中提取詞性。如上所述,預(yù)處理群可以包括從原始查詢130處理的單個(gè)詞語群和單個(gè)短語群。例如,使用用于提取詞性的任何可用的應(yīng)用或服務(wù),原始查詢處理服務(wù)141可以將這些群分析成額外的詞性。一般地,詞性可以被組織為名詞、代詞、形容詞、動(dòng)詞、副詞、介詞、連詞和插入語。用于提取詞性的易于得到的工具可以包括例如,可從微軟獲得的統(tǒng)計(jì)解析與語言分析工具箱(“SPLAT”)。任何此類工具的輸出可被處理以對所識別的詞性(partofspeech)進(jìn)行群聚、以及從先前的群中去除被群聚的詞性。此后,方法200包括:在框214處,對來自框212的群結(jié)果的第二詞典處理。原始查詢處理服務(wù)141可以例如通過有些類似于上述的拼寫異常詞典模型和初始詞典模型的多個(gè)第二詞典模型來處理框212的群結(jié)果。第二詞典模型處理可以得到進(jìn)一步合并的群,使得一些詞語經(jīng)過詞形還原(lemmatization),辨識出輕動(dòng)詞,提取的詞性經(jīng)過覆蓋詞典模型處理,和/或形容詞-動(dòng)詞異常被合并。下面參考圖4來更詳細(xì)地描述第二詞典處理。方法200還包括:在框216處,從處理后的群中提取用于接收的原始查詢130的基本意圖。原始查詢處理服務(wù)141可以基于框214的結(jié)果來執(zhí)行對原始查詢130的基本或主要意圖的基于規(guī)則的提取?;谝?guī)則的提取必要地提取動(dòng)詞-名詞集合作為意圖的基礎(chǔ)。例如,基于規(guī)則的提取的規(guī)則可以基于諸如詞性、在較大的短語或原始查詢130中的每個(gè)詞性的位置以及詞性的順序等一個(gè)或多個(gè)因素。該方法200還包括:在框218中,基于所提取的基本意圖和處理后的群來進(jìn)行最終詞典處理。原始查詢處理服務(wù)141可以例如通過有些類似于上述的拼寫異常詞典模型、初始詞典模型和第二詞典模型的多個(gè)最終詞典模型來處理框216的群結(jié)果。最終詞典模型處理可以得到進(jìn)一步被合并或區(qū)分的群,使得與實(shí)際聚類相關(guān)的短語或詞語被識別和/或基于目標(biāo)軟件產(chǎn)品的專用短語被識別。下面參考圖5來進(jìn)一步描述最終詞典處理。在通過原始查詢服務(wù)141進(jìn)行成功的最終詞典處理后,方法200在框220處以從框218的結(jié)果中提取用于所接收的原始查詢的最終意圖而結(jié)束。一般地,框218的結(jié)果可通過聚類服務(wù)143來處理以基于先前確定的表示意圖的聚類來確定最終意圖。聚類服務(wù)143可以將部分匹配已知聚類的特定群與已知聚類相關(guān)聯(lián)。例如,包含短語“插入對象”的原始查詢130可以與表示用于插入對象的軟件功能的聚類相關(guān)聯(lián)。可以基于最終群的數(shù)量或大小而進(jìn)行進(jìn)一步的區(qū)分,并且可以進(jìn)行基于閾值的比較以確定原始查詢的意圖的最可能候選者。在成功與已知聚類相關(guān)聯(lián)后,聚類信息146被更新以反映關(guān)聯(lián)。此后,聚類信息146可以保持在聚類存儲147中和/或傳輸?shù)叫畔⑷』叵到y(tǒng)150。另外,原始查詢處理服務(wù)141和聚類處理服務(wù)143可以隨著新的原始查詢被取回、被接收或以其它方式被創(chuàng)建,而持續(xù)迭代經(jīng)過框202-220。如上所述,術(shù)語“詞典模型”指代將一組對于自然語言詞語的基于規(guī)則的置換與基于一個(gè)或多個(gè)目標(biāo)軟件產(chǎn)品的內(nèi)部命名規(guī)約的一個(gè)或多個(gè)定義的詞語或短語相關(guān)聯(lián)的文件或結(jié)構(gòu)。此外,術(shù)語“目標(biāo)軟件產(chǎn)品”指代安裝或布置以在客戶端101上執(zhí)行的、用戶針對其提交原始查詢的軟件產(chǎn)品。如此,本文所描述的每個(gè)詞典模型可以不同地布置以對于特定的目標(biāo)軟件產(chǎn)品實(shí)現(xiàn)期望的結(jié)果,即,通過如與一個(gè)或多個(gè)聚類相關(guān)聯(lián)地對詞語的群組進(jìn)行拆分或合并的規(guī)則。在如上所述的最終詞典處理時(shí),詞語的最終群將反映在一個(gè)或多個(gè)目標(biāo)軟件產(chǎn)品的界限內(nèi)的最初的原始查詢的相關(guān)聯(lián)的意圖。因此,隨著易于匹配以提供聚類信息146的新查詢被接收,進(jìn)一步的意圖識別可以通過簡單的聚類辨識算法(例如,聚類辨識服務(wù)153)執(zhí)行,該簡單的聚類辨識算法被配置為在預(yù)定閾值以內(nèi)或預(yù)定閾值以上找到原始查詢130的在聚類信息146內(nèi)的匹配。然而,根據(jù)需要,表示上述軟件功能的聚類的進(jìn)一步的拆分和合并可以持續(xù)地進(jìn)行,或者以批處理式樣的操作集合的方式進(jìn)行。下面參考圖7來提供在聚類系統(tǒng)140中所產(chǎn)生的聚類信息146的使用的更詳細(xì)的論述。下文中,參考圖3-5來提供初始的、第二的和最終的詞典處理和相關(guān)聯(lián)的詞典模型的多個(gè)示例。應(yīng)當(dāng)理解,雖然使用詞語“初始”、“第二”和“最終”描述,特定的處理順序或者詞典模型之間的依賴關(guān)系可在不偏離本公開的范圍的前提下被重新布置。轉(zhuǎn)到圖3,圖示說明了根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例,示出用于初步群聚查詢的初始詞典模型處理的一個(gè)示例性的方法300的多方面的流程圖。如圖所示,方法300包括:在框302處,接收來自框208的初步群。例如,框206的初步群可以被接收以進(jìn)行初始詞典模型處理。方法300還包括:在框304處,基于記號異常詞典模型(tokenexceptiondictionarymodel),對接收到的初步群上的記號異常群(tokenexceptiongroupings)進(jìn)行處理。記號異常詞典模型可被布置為應(yīng)當(dāng)保持相關(guān)聯(lián)在一起從而限制它們的分割的多個(gè)短語或詞語。因此,記號異常詞典模型保持原始查詢130中的一些短語的結(jié)構(gòu),使得它們與用于目標(biāo)軟件產(chǎn)品的功能的內(nèi)部命名更緊密地相關(guān)聯(lián)??梢园谑痉缎缘挠浱柈惓T~典模型中的示例的一組記號規(guī)則提供在下表2中:表2:保持短語(MaintainPhrase)一般格式(generalformat)文本格式(textformat)百分比樣式(percentstyle)百分比格式(percentformat)帳單格式(accountingformat)帳單樣式(accountingstyle)貨幣樣式(currencystyle)貨幣樣式(currencystyles)逗號分開的值(commaseparatedvalue)便攜文檔格式(portabledocumentformat)如上表2中所示,多個(gè)短語可以與內(nèi)部軟件功能相關(guān),并且應(yīng)當(dāng)因此被保持為原始查詢130內(nèi)的單個(gè)短語。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的記號異常詞典,并且相應(yīng)地,所有此類變型例都在本公開的范圍內(nèi)。方法300還包括:在框306中,基于詞語同義詞詞典模型,對框304的結(jié)果上的詞語同義詞群進(jìn)行處理。詞語同義詞異常詞典模型可布置為更適合于由與目標(biāo)軟件產(chǎn)品更緊密相關(guān)的一個(gè)或多個(gè)同義詞替代的多個(gè)短語或詞語。相應(yīng)地,詞語同義詞異常詞典模型取代原始查詢130中的詞語的一部分,以與和目標(biāo)軟件產(chǎn)品相關(guān)聯(lián)的詞語一致??梢园谑痉缎缘脑~語同義詞異常詞典模型中的一組示例的置換規(guī)則提供在下表3中:表3:原始詞語置換后詞語下拉(drop-down)下拉列表(drop-downlist)下拉(drop-downs)下拉列表(drop-downlist)下列表(droplist)下拉列表(drop-downlist)下菜單(dropmenu)下拉列表(drop-downlist)下拉菜單(drop-downmenu)下拉列表(drop-downlist)拾取列表(picklist)下拉列表(drop-downlist)拉列表(pulllist)下拉列表(drop-downlist)拉列表(pull-list)下拉列表(drop-downlist)拉下列表(pull-downlist)下拉列表(drop-downlist)拉下框(pull-downbox)下拉列表(drop-downlist)如上表3所示,多個(gè)短語可以與和內(nèi)部軟件功能相關(guān)聯(lián)的單個(gè)詞語相關(guān)聯(lián),并且應(yīng)當(dāng)因此在原始查詢130內(nèi)被替代。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的詞語同義詞異常詞典,并且相應(yīng)地,所有此類變型例都在本公開的范圍內(nèi)。方法300還包括:在框308處,基于記號異常詞典模型,再處理框306的結(jié)果上的記號異常群。例如,在替代如上所述的同義詞后,多個(gè)先前的短語或群已經(jīng)被擾亂(disturbed)以創(chuàng)建更適合于保持為短語的單個(gè)詞語。因此,框306的結(jié)果可如上所述被再處理。此后,方法300包括:在框310處,基于子句詞典模型,處理框308的結(jié)果上的子句群。子句詞典模型可被布置為用于替代指向特定子句的詞語或短語的一組規(guī)則。例如,諸如“如果”、“條件”、“快捷方式”或其它詞語的詞語可能與功能相關(guān)或者可能將與軟件產(chǎn)品的功能相關(guān)的必要的任務(wù)分割。因此,可以使用子句詞典模型來取代與原始查詢130中的子句或功能描述符相關(guān)的單個(gè)詞語或短語以與目標(biāo)軟件產(chǎn)品一致。在下表4中提供了示范性的條件詞語詞典模型中可能包含的一組示例的置換規(guī)則:表4:原始詞語置換后詞語如果且(ifand)條件如果(conditionalif)如果或(ifor)條件如果(conditionalif)如果那么(ifthen)條件如果那么(conditionalifthen)如果那么excel(ifthenexcel)條件如果那么(conditionalifthen)如果那么公式(ifthenformula)功能條件(functionconditional)如果且功能(ifandfunction)功能條件(functionconditional)如上表4中所示,多個(gè)短語可以與軟件功能相關(guān),并且應(yīng)當(dāng)因此在原始查詢130內(nèi)替代。應(yīng)當(dāng)注意的是,基于任何期望的目標(biāo)軟件功能,能應(yīng)用多種形式的子句詞典,并且相應(yīng)地,所有此類變型例都在本公開的范圍內(nèi)。方法300還包括:在框312中,基于輕單詞(lightword)或停止單詞(stopword)詞典模型,處理框310的結(jié)果上的“輕單詞”或“停止單詞”的群。如本文所使用的,術(shù)語“輕單詞”或“停止單詞”指代在可以被忽略而不影響原始查詢的意圖的提取的詞語或短語的部分。例如,在原始查詢130內(nèi)的多個(gè)詞語可能與目標(biāo)軟件產(chǎn)品的實(shí)際功能無關(guān),并且可被忽略。在下表5中提供了可被忽略的一組示例的詞語:表5:方法300還包括:在框314中輸出處理后的具有被忽略的詞語的群,進(jìn)一步如圖2的方法200中所概括的進(jìn)一步處理,并且在框316處停止。此后,通過原始查詢處理服務(wù)141可以進(jìn)行另外的處理,直至第二詞典處理可應(yīng)用為止。圖4是示出了根據(jù)本文呈現(xiàn)的實(shí)施例的用于群聚查詢的第二詞典處理的一個(gè)示例性的方法400的多方面的流程圖。如圖所示,方法400包括:在框402處,接收來自框214的一組群。在如上所述提取了詞性之后,可以從框212接收該組群。方法400還包括:在框404處,基于詞形還原詞典模型(lemmatizationdictionarymodel),對接收到的群進(jìn)行詞形還原。例如,在原始查詢130中的多個(gè)詞語可以與單個(gè)根詞語(rootterm)相關(guān)。因此,詞形還原詞典模型將原始查詢130中的詞語正規(guī)化(例如,標(biāo)準(zhǔn)化)成單數(shù)的根詞語或“詞元(lemma)”。在下表6中提供了可以包含在詞形還原詞典模型中的一組示例的置換規(guī)則:表6:原始詞語置換后詞語跑(run)跑(run)跑(runs)跑(run)跑(ran)跑(run)跑(running)跑(run)遮蔽(shade)遮蔽(shade)遮蔽(shading)遮蔽(shade)遮蔽(shaded)遮蔽(shade)如上表6中所示,多個(gè)詞語可以置換成單數(shù)的詞元以簡化處理。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用多種形式的詞形還原詞典,并且相應(yīng)地,所有這樣的變型例都在本公開的范圍內(nèi)。方法400還包括:在框406中,基于輕單詞詞典模型,處理詞形還原后的群上的輕單詞群。一般地,輕單詞詞典模型包括在為提取意圖的處理過程中不應(yīng)比其它動(dòng)詞加權(quán)更多的各種輕權(quán)重動(dòng)詞。作為非限制示例,如果原始查詢130包括短語“創(chuàng)建excel的電子表格”,則輕單詞詞典模型可以將“excel”加權(quán)少于“創(chuàng)建”。因此,在利用輕單詞詞典模型進(jìn)行處理時(shí),所得到的群將包含與輕權(quán)重動(dòng)詞相比而言更大權(quán)重的動(dòng)詞,諸如“實(shí)現(xiàn)(make)”、“取得(take)”或“得到(get)”。方法400還包括:在框408中,基于詞性覆蓋模型處理框406的結(jié)果上的詞性覆蓋群(partsofspeechoverridegroupings)。一般地,詞性覆蓋模型被布置成對詞性進(jìn)行校正。例如,多個(gè)詞語可以由詞性工具推斷為名詞。然而,這些詞語當(dāng)在特定的目標(biāo)軟件產(chǎn)品的上下文中理解時(shí)更反映動(dòng)詞。因此,詞性覆蓋詞典模型將原始查詢130中的更適合的詞性置換以與執(zhí)行于客戶端101上的目標(biāo)軟件產(chǎn)品一致。在下表7中提供了可以包含在示范性的詞性覆蓋詞典模型中的一組示例的置換規(guī)則。表7:原始詞語詞性群聚(group)動(dòng)詞刷新(refresh)動(dòng)詞過濾(filter)動(dòng)詞導(dǎo)出(export)動(dòng)詞插入(insert)動(dòng)詞拆分(split)動(dòng)詞輸入(input)動(dòng)詞如上表7中所示,多個(gè)詞語可以被更適當(dāng)?shù)卣J(rèn)為是動(dòng)詞,或者在特定的軟件產(chǎn)品的上下文中考慮其它詞性。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,能應(yīng)用詞性覆蓋詞典模型的多種形式,并且相應(yīng)地,所有這樣的變型例都在本公開的范圍內(nèi)。方法400還包括:在框410中,基于形容詞-動(dòng)詞異常詞典模型,對框408的結(jié)果上的形容詞-動(dòng)詞異常群進(jìn)行處理。形容詞-動(dòng)詞異常詞典模型還可以另外地校正與使用一般的詞性提取工具相關(guān)的詞性問題。例如,如果在原始查詢130中一些形容詞在名詞的緊前面,則可能更適合保留該詞語的詞性,而不是將其縮減為動(dòng)詞或名詞。作為非限制示例,如果諸如“有色的(colored)”、“陰影的(dashed)”和“打印的(printed)”的詞語出現(xiàn)在名詞之前,則適當(dāng)?shù)娜嚎梢园~棧,而不是將“打印的(printed)”縮減為動(dòng)詞“打印(print)”。方法400還包括:在框412處,輸出處理后的群以便如圖2的方法200中所概括的那樣進(jìn)一步處理,并且在框414處停止。這些處理后的群可以處理后以對于原始查詢130提取基本意圖,如上文所概括的。此后,可以執(zhí)行最終詞典處理以提取最終的意圖和聚類。圖5是示出了根據(jù)本文所呈現(xiàn)的一個(gè)實(shí)施例的用于群聚查詢的詞典處理的一個(gè)示例性的例程的多方面的流程圖。如圖所示,方法500包括:在框502處,接收來自框218的一組處理后的群。方法500還包括:在框504處,基于聚類同義詞詞典模型,處理接收到的群上的聚類同義詞群。一般地,聚類同義詞詞典模型被布置成將重復(fù)的群組映射到單個(gè)群組上。因此,多個(gè)不相干的群組可以映射到更反映原始查詢130的意圖的單個(gè)父群組(asingleparentgroups)上。在下表8中提供了在示范性的聚類同義詞詞典模型中所包含的一組示例的置換規(guī)則:表8:如上表8中所示,多個(gè)短語或群組可以置換成單數(shù)群組以簡化處理。注意的是,基于任何期望的目標(biāo)軟件產(chǎn)品,可以應(yīng)用多種形式的聚類同義詞詞典,并且相應(yīng)地,所有這樣的變型例都在本公開的范圍內(nèi)。方法500還包括:在框506中,基于對象-模型詞典模型(object-modeldictionarymodel),對框504的結(jié)果上的對象-模型群進(jìn)行處理。一般地,對象-模型詞典模型被布置成與目標(biāo)軟件產(chǎn)品的至少一個(gè)功能相關(guān)的詞語的詞典。短語可以直接指代單個(gè)的功能,并且因此,可以代表原始查詢130的意圖。因此,短語可被使用以與處理后的群進(jìn)行比較來通過試圖直接匹配處理后的群的部分而進(jìn)一步限定原始查詢130的意圖。在匹配時(shí),最終意圖信息可以是顯見的。方法500還包括:在框508處輸出處理后的群以如圖2的方法200中所概括的那樣進(jìn)一步處理,并且在框510處停止。圖6是示出了可用于識別查詢意圖的一般輸出格式的示范性的表600。注意的是,特定格式的表格600可改動(dòng)成任何期望的形式,并且因此,圖示的格式不限于本公開。一般地,表格600可以表示聚類信息146的一般形式,以便由諸如信息取回系統(tǒng)150的信息取回系統(tǒng)、搜索引擎系統(tǒng)或任何其它適合的系統(tǒng)使用。表格600包括被組織以分割原始查詢的原始搜索詞語或短語、反映原始查詢的意圖的更適合的新搜索詞語、原始查詢中的記號的總記號計(jì)數(shù)和用于識別所建立的聚類的聚類標(biāo)識(“ID”)值的列。表格600因此呈現(xiàn)了與表示字符串1的原始意圖的新詞語TERM1(詞語1)相關(guān)聯(lián)的多個(gè)搜索詞語TEXT1(文本1)-TEXTN(文本N)的多對少映射,以及相關(guān)聯(lián)的聚類標(biāo)識ID1。雖然呈現(xiàn)為到單個(gè)最初意圖的映射,但是應(yīng)當(dāng)理解,取決于在系統(tǒng)600中所包含的目標(biāo)軟件產(chǎn)品,聚類信息146的實(shí)際的輸出表示可以包括與多個(gè)不同的新詞語匹配的多個(gè)不同的搜索詞語。類似于表格600所表示的聚類信息146能夠用于識別在系統(tǒng)100的積極處理過程中接收到的新的原始查詢的意圖。例如,圖7是示出了根據(jù)本文呈現(xiàn)的一個(gè)實(shí)施例的用于使用聚類查詢信息來處理原始用戶查詢的一個(gè)示例性的方法700的多方面的流程圖。如圖所示,方法700包括:在框702處,接收原始用戶查詢。該方法700還包括:在框704處,確定接收到的原始查詢的聚類關(guān)聯(lián)。例如,聚類辨識服務(wù)153可以將來自接收到的原始查詢的自然語言與聚類信息146(或者表600的“搜索詞語”列)比較以確定聚類ID或聚類信息。如進(jìn)一步圖示的,該方法700包括用于所確定的聚類信息的處理的多個(gè)分歧選項(xiàng)。例如,該方法700可以包括:在框706處,將接收到的原始用戶查詢搜索字符串信息與所確定的聚類搜索字符串交換。此后,方法700包括:在框708處,利用交換后的字符串執(zhí)行查詢,以及在框710處返回搜索結(jié)果??商娲?,該方法700可以包括:在框712處,找到(find)與所確定的關(guān)聯(lián)的聚類相關(guān)的一個(gè)或多個(gè)“對等查詢”。例如,“對等查詢”可以指代對等用戶提交的原始查詢,其可以具有類似的或者至少部分相關(guān)的意圖。此后,方法700包括:在框714處,基于對等查詢來執(zhí)行查詢,以及在框710處返回一個(gè)或多個(gè)對等查詢的搜索結(jié)果。另外地,該方法700可以包括:在框716處,找到與所確定的聚類信息相關(guān)的一個(gè)或多個(gè)對等聚類。此后,方法700包括:在框718處,返回對等聚類信息。代表了意圖的波動(dòng)數(shù)量(fluctuatingnumber)的聚類信息146可以多種形式以及由多個(gè)應(yīng)用來使用。聚類信息146可以基于多個(gè)目標(biāo)軟件產(chǎn)品的用戶查詢的日志而在離線處理期間生成。日志可以通過聚類系統(tǒng)140訪問以創(chuàng)建和保持聚類信息146,如上文所概述的。此后,聚類信息146可在信息取回系統(tǒng)中用于通過更簡單的意圖識別進(jìn)行原始查詢的更快速處理。應(yīng)當(dāng)意識到,上述的邏輯操作可以實(shí)現(xiàn)為(1)計(jì)算機(jī)實(shí)現(xiàn)的動(dòng)作或在計(jì)算系統(tǒng)上運(yùn)行的程序模塊的序列,和/或(2)在計(jì)算系統(tǒng)內(nèi)的互連的機(jī)器邏輯電路或電路模塊。該實(shí)現(xiàn)方式是取決于計(jì)算系統(tǒng)的性能和其他要求的選擇。因此,本文所述的邏輯操作被多樣化地稱為狀態(tài)操作、結(jié)構(gòu)設(shè)備、動(dòng)作或模塊。這些操作、結(jié)構(gòu)設(shè)備、動(dòng)作和模塊可以用軟件、用固件、用專用數(shù)字邏輯以及它們的任意組合來實(shí)現(xiàn)。還應(yīng)當(dāng)意識到,可以執(zhí)行比圖中所示和本文所描述的更多或更少的操作。這些操作也可以按不同于那些描述的次序來執(zhí)行。圖8示出了能夠執(zhí)行本文所描述的軟件組件來用于以上文呈現(xiàn)的方式確定原始用戶查詢意圖的計(jì)算機(jī)800的示例的計(jì)算機(jī)體系結(jié)構(gòu)。圖8所示的計(jì)算機(jī)體系結(jié)構(gòu)圖示出常規(guī)的臺式計(jì)算機(jī)、膝上型計(jì)算機(jī)或服務(wù)器計(jì)算機(jī)并且可用于執(zhí)行本文所呈現(xiàn)的被描述在在聚類系統(tǒng)140上執(zhí)行的軟件組件的任何方面。圖8所示的計(jì)算機(jī)體系結(jié)構(gòu)包括中央處理單元802(“CPU”)、系統(tǒng)存儲器808和將存儲器與CPU802耦合的系統(tǒng)總線804,系統(tǒng)存儲器包括隨機(jī)存取存儲器814(“RAM”)和只讀存儲器(“ROM”)816。包含了有助于例如在啟動(dòng)期間在計(jì)算機(jī)800內(nèi)的元件之間傳遞信息的基本例程的基本輸入/輸出系統(tǒng)存儲在ROM816中。計(jì)算機(jī)800還包括用于存儲操作系統(tǒng)818、應(yīng)用程序和在本文中詳述的其他程序模塊的大容量存儲設(shè)備810。大容量存儲設(shè)備810通過連接到總線804的大容量控制器(未示出)與CPU802連接。大容量存儲設(shè)備810及其相關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)為計(jì)算機(jī)800提供了非易失性存儲。雖然在本文包含的計(jì)算機(jī)可讀介質(zhì)的描述指的是大容量存儲設(shè)備,如硬盤或CD-ROM驅(qū)動(dòng)器,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)意識到計(jì)算機(jī)可讀介質(zhì)可以是能夠由計(jì)算機(jī)800訪問的任何可用的計(jì)算機(jī)存儲介質(zhì)或通信介質(zhì)。通信介質(zhì)包含計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或諸如載波或其他傳輸機(jī)制的調(diào)制數(shù)據(jù)信號中的其他數(shù)據(jù)并且包括任何輸送介質(zhì)。術(shù)語“調(diào)制數(shù)據(jù)信號”意指使其一個(gè)或多個(gè)特性以將信息編碼在信號中的方式改變或設(shè)定的信號。通過示例的方式,而不是限制的方式,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或有線直連的有線介質(zhì)以及諸如聲波、RF、紅外和其他無線介質(zhì)的無線介質(zhì)。上述任意的組合也應(yīng)包含在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。通過示例而不是限制的方式,計(jì)算機(jī)存儲介質(zhì)可以包括以用于諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)的信息的存儲的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性的、可移除的和非可移除的介質(zhì)。例如,計(jì)算機(jī)介質(zhì)包括,但不限于,RAM、ROM、EPROM、EEPROM、閃速存儲器或其他固態(tài)存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(“DVD”)、HD-DVD、BLU-RAY或其他光學(xué)存儲設(shè)備、磁盒帶、磁帶、磁盤存儲或其他磁存儲設(shè)備,或者任何其他能用于存儲所需的信息且能夠由計(jì)算機(jī)800訪問的介質(zhì)。為了權(quán)利要求的目的,短語“計(jì)算機(jī)存儲介質(zhì)”及其變體不包含波或信號本身和/或通信介質(zhì)。根據(jù)各個(gè)實(shí)施例,計(jì)算機(jī)800可以利用通過諸如網(wǎng)絡(luò)820的網(wǎng)絡(luò)到遠(yuǎn)程計(jì)算機(jī)的邏輯連接在聯(lián)網(wǎng)環(huán)境下操作。計(jì)算機(jī)800可以通過與總線804連接的網(wǎng)絡(luò)接口單元806而連接到網(wǎng)絡(luò)820。應(yīng)當(dāng)意識到,網(wǎng)絡(luò)接口單元806還可以用于與其他類型的網(wǎng)絡(luò)和遠(yuǎn)程計(jì)算機(jī)系統(tǒng)連接。計(jì)算機(jī)800還可以包括輸入/輸出控制器812,用于接收和處理來自多個(gè)其他設(shè)備的輸入,包括鍵盤、鼠標(biāo)或電子觸筆(圖8中未示出)。類似地,輸入/輸出控制器可以向顯示屏、打印機(jī)或其他類型的輸出設(shè)備(圖8中也未示出)提供輸出。如上文簡要提及的,多個(gè)程序模塊和數(shù)據(jù)文件可以存儲在計(jì)算機(jī)800的大容量存儲設(shè)備810和RAM814中,包括適合于控制聯(lián)網(wǎng)的臺式計(jì)算機(jī)、膝上型計(jì)算機(jī)或服務(wù)器計(jì)算機(jī)的操作的操作系統(tǒng)818。大容量存儲設(shè)備810和RAM814還可以存儲一個(gè)或多個(gè)程序模塊,諸如上述的原始查詢處理服務(wù)141、聚類處理服務(wù)143、詞典存儲145和聚類存儲147。大容量存儲設(shè)備810和RAM814還可以存儲其他類型的程序模塊、服務(wù)和數(shù)據(jù)?;谏鲜?,應(yīng)當(dāng)意識到,本文提供了用于識別查詢意圖的技術(shù)。雖然本文呈現(xiàn)的主題以特定于計(jì)算機(jī)結(jié)構(gòu)特征、方法和變換動(dòng)作、具體的計(jì)算機(jī)器和計(jì)算機(jī)可讀介質(zhì)的語言進(jìn)行了描述,但是應(yīng)當(dāng)理解,在隨附的權(quán)利要求中限定的本發(fā)明不必限于本文所描述的具體的特征、動(dòng)作或介質(zhì)。相反,具體的特征、動(dòng)作和介質(zhì)是作為實(shí)現(xiàn)權(quán)利要求的示例的形式而被公開的。上述的主題僅通過示例的方式來提供,不應(yīng)解釋為限制。可以對本文所描述的主題進(jìn)行各種修改和改動(dòng)而不遵從所圖示的和描述的示例的實(shí)施例和應(yīng)用,并且不脫離在下面的權(quán)利要求所闡述的本發(fā)明的真正的精神和范圍。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3