混合與迭代關(guān)鍵詞以及類別搜索技術(shù)的制作方法
【專利摘要】本申請(qǐng)涉及混合與迭代關(guān)鍵詞以及類別搜索技術(shù)。提供了用于提供改進(jìn)查詢的推薦的技術(shù)。接收具有查詢關(guān)鍵詞和選定類別的查詢。響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別排名高,利用關(guān)鍵詞相關(guān)指標(biāo)計(jì)算查詢與每個(gè)子類別的查詢相關(guān)指標(biāo),基于查詢相關(guān)指標(biāo)給每個(gè)子類別排名,以及提供排名后的子類別,在選擇要與查詢一起提交的新類別時(shí)使用。
【專利說(shuō)明】混合與迭代關(guān)鍵詞以及類別搜索技術(shù)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施例涉及用于分布式計(jì)算系統(tǒng)與網(wǎng)絡(luò)環(huán)境,而且更具體地說(shuō),用于任何基于網(wǎng)絡(luò)的服務(wù)的混合與迭代關(guān)鍵詞以及類別搜索技術(shù)。
【背景技術(shù)】
[0002]在過(guò)去的二十年當(dāng)中,互聯(lián)網(wǎng)與萬(wàn)維網(wǎng)(WWW或Web)使信息技術(shù)有了巨大的變化。作為人-機(jī)和客戶端-服務(wù)器技術(shù),Web使具有連接到互聯(lián)網(wǎng)的計(jì)算機(jī)的任何人都能夠從他或她的指尖訪問(wèn)互聯(lián)網(wǎng)上任何公布的信息。
[0003]Web頁(yè)面是用例如超文本標(biāo)記語(yǔ)言(HTML)編寫的文檔。由于有巨大量的web內(nèi)容,因此大多數(shù)web用戶依賴web搜索引擎通過(guò)關(guān)鍵詞搜索來(lái)搜索有用的web頁(yè)面。
[0004]為了方便計(jì)算系統(tǒng)的集成并且向用戶提供更加交互式的用戶體驗(yàn)和豐富的內(nèi)容,近年來(lái)已經(jīng)推出了新的web技術(shù),它們當(dāng)中許多都基于可擴(kuò)展的標(biāo)記語(yǔ)言(XML)。這些技術(shù)中的兩種是Web服務(wù)與異步JAVASCRIPT和XML (AJAX)。(JAVASCRIPT是Oracle和/或其附屬公司的商標(biāo)或注冊(cè)商標(biāo)。)Web服務(wù)可以描述為機(jī)器到機(jī)器的分布式計(jì)算技術(shù),這種技術(shù)克服了使計(jì)算機(jī)程序能夠在異類計(jì)算環(huán)境中彼此通信的困難。這些困難是由不同的計(jì)算機(jī)平臺(tái)、不兼容的通信協(xié)議和計(jì)算機(jī)程序使用的各種計(jì)算機(jī)語(yǔ)言引起的。作為戰(zhàn)勝這些挑戰(zhàn)的一種基于標(biāo)準(zhǔn)的全面解決方案,Web服務(wù)被各行業(yè)廣泛支持。Web服務(wù)基于一系列標(biāo)準(zhǔn),例如XML、簡(jiǎn)單對(duì)象訪問(wèn)協(xié)議(SOAP)和Web服務(wù)描述語(yǔ)言(WSDL)。這些標(biāo)準(zhǔn)為運(yùn)行在計(jì)算機(jī)和電子設(shè)備上的應(yīng)用提供了經(jīng)網(wǎng)絡(luò)在它們之間交換信息的共用格式、語(yǔ)法和協(xié)議。與Web服務(wù)不同,AJAX沒(méi)有定義一組標(biāo)準(zhǔn)。AJAX使web應(yīng)用能夠異步地把數(shù)據(jù)從客戶端發(fā)送到服務(wù)器。AJAX可以用于實(shí)現(xiàn)REST (代表性狀態(tài)傳輸)風(fēng)格的Web服務(wù)。
[0005]例如,一個(gè)公司可以為不同的廠家創(chuàng)建銷售他們產(chǎn)品的市場(chǎng)網(wǎng)站。web服務(wù)的例子包括web站點(diǎn)的靈活實(shí)現(xiàn)web服務(wù)和支付web服務(wù),這些服務(wù)用于集成該市場(chǎng)網(wǎng)站與那些廠家的信息系統(tǒng)。
[0006]為了方便公布和搜索web服務(wù),已經(jīng)開發(fā)出了通用描述、發(fā)現(xiàn)與集成(UDDI)標(biāo)準(zhǔn)。UDDI標(biāo)準(zhǔn)定義如何創(chuàng)建web服務(wù)UDDI注冊(cè)表,以便使web服務(wù)提供商能夠公布他們的web服務(wù)并且使web服務(wù)消費(fèi)者能夠搜索并使用這些公布的web服務(wù)。
[0007]非UDDI的web服務(wù)注冊(cè)表可以提供web服務(wù)支配特征與語(yǔ)義web技術(shù)。這種web服務(wù)注冊(cè)表或儲(chǔ)存庫(kù)存儲(chǔ)附加的與web服務(wù)相關(guān)的元數(shù)據(jù),以便支配web服務(wù)的生命周期。Web本體語(yǔ)言(OWL)是一種基于本體論的標(biāo)記語(yǔ)言,它最初是在學(xué)術(shù)研究中開發(fā)的,以便以機(jī)器可理解的形式在web上呈現(xiàn)數(shù)據(jù)。OWL可以用于在web服務(wù)注冊(cè)表中組織與web服務(wù)相關(guān)的元數(shù)據(jù)。
[0008]在常規(guī)系統(tǒng)中,關(guān)鍵詞搜索被web服務(wù)消費(fèi)者用來(lái)在web服務(wù)注冊(cè)表中找出恰當(dāng)?shù)膚eb服務(wù)。Web服務(wù)的關(guān)鍵詞可以由web服務(wù)提供商手動(dòng)指定。自動(dòng)關(guān)鍵詞生成過(guò)程可以用于從web服務(wù)元數(shù)據(jù)生成關(guān)鍵詞。也可以使用手動(dòng)方法與自動(dòng)方法的組合,例如讓提供商驗(yàn)證或修改所生成的關(guān)鍵詞。[0009]UDDI與其它的注冊(cè)表提供了查詢應(yīng)用編程接口( API)和/或圖形用戶接口(⑶I),以使web服務(wù)消費(fèi)者能夠搜索在web服務(wù)注冊(cè)表中公布的web服務(wù)。利用這些查詢API或GUI,用戶提供進(jìn)行搜索的具體web服務(wù)元數(shù)據(jù)域的關(guān)鍵詞、串或其它數(shù)據(jù)。
[0010]例如,UDDI客戶端可以查詢UDDI注冊(cè)表,以基于名字、它們所屬的商業(yè)實(shí)體和它們所落入的類別找出web服務(wù)。在這個(gè)例子中,用戶提供web服務(wù)、商業(yè)實(shí)體和/或類別的部分或完整名字,來(lái)構(gòu)造這種搜索查詢。
[0011]現(xiàn)有的web服務(wù)注冊(cè)表技術(shù)允許用戶利用合成的查詢搜索web服務(wù)。這種查詢的搜索結(jié)果是構(gòu)成合成查詢的簡(jiǎn)單查詢的搜索結(jié)果集合的交集或并集。
[0012]本領(lǐng)域中需要發(fā)現(xiàn)服務(wù)例如web服務(wù)的改進(jìn)技術(shù)。
[0013]US20100185619公開了一種采樣分析,它包括根據(jù)與多個(gè)查詢關(guān)鍵詞關(guān)聯(lián)的頁(yè)面視圖值把多個(gè)查詢關(guān)鍵詞分類為多個(gè)查詢關(guān)鍵詞子集-例如,見摘要;附圖1-6 ;和行
[0023]-[0035]。
[0014]US20100174691公開了至少部分地基于與缺陷有關(guān)的關(guān)鍵詞把缺陷自動(dòng)歸類到一個(gè)類別中的方法與系統(tǒng)-例如,見摘要;附圖1-8 ;和行[0015]-[0017]、[0030]-[0076] ο
[0015]US20100131563公開了包括多個(gè)搜索列表的一個(gè)搜索結(jié)果頁(yè)面,所述多個(gè)搜索列表是通過(guò)施加到基于用戶查詢選擇的初始匹配文檔集合的多個(gè)群集操作生成的-例如,見摘要;附圖 1-9 ;和行[0014]-[0019]、[0046]-[0047]。
[0016]US20100036822公開了用于從先前的結(jié)果數(shù)據(jù)推斷類別同義詞的系統(tǒng)與方法_例如,見摘要;附圖 1-7 ;和行[0008]-[0011]、[0036]-[0060] ο
[0017]US20090222444公開了在提交到一個(gè)或多個(gè)搜索引擎之前分解搜索查詢。查詢被分解成使得該查詢明確地對(duì)應(yīng)于包括在把搜索查詢關(guān)聯(lián)到搜索類別的查詢本體中的類別—例如,見摘要;附圖 1-17 ;和行[0005]-[0012]、[0088]-[0124]。
[0018]US20070118509公開了用于建議給數(shù)字圖像加標(biāo)簽的關(guān)鍵詞的合作定位關(guān)鍵詞注冊(cè)表服務(wù)-例如,見摘要;附圖1-8 ;和行[0005]-[0007]、[0019]-[0063]。
[0019]US7, 620,627公開了一種生成在搜索內(nèi)容時(shí)所使用的關(guān)鍵詞的方法,該方法包括接收關(guān)鍵詞、從類別文件獲得對(duì)應(yīng)于該關(guān)鍵詞的類別、接收對(duì)應(yīng)于這些類別中至少一個(gè)類別的選擇并且生成與該選擇關(guān)聯(lián)的關(guān)鍵詞-例如,見摘要;附圖1-3 ;和第I欄第10-67行、第2欄第1-25行ο
[0020]US6, 571,239公開了解決被用戶用來(lái)進(jìn)行查詢的關(guān)鍵詞以及存儲(chǔ)在系統(tǒng)關(guān)鍵詞索引中、被手動(dòng)或自動(dòng)分類系統(tǒng)指定的那些關(guān)鍵詞之間的失配問(wèn)題的方法-例如,見摘要;附圖1_5 ;和第I欄第5-67行、第2欄第1~15行、第3欄第40-55行。
【發(fā)明內(nèi)容】
[0021]提供了用于提供改進(jìn)查詢的推薦的方法、計(jì)算機(jī)程序產(chǎn)品與系統(tǒng)。接收具有查詢關(guān)鍵詞和選定類別的查詢。響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別排名高,利用關(guān)鍵詞相關(guān)指標(biāo)計(jì)算查詢與每個(gè)子類別的查詢相關(guān)指標(biāo),基于查詢相關(guān)指標(biāo)給每個(gè)子類別排名,以及提供排名后的子類別,以在選擇要與查詢一起提交的新類別時(shí)使用?!緦@綀D】
【附圖說(shuō)明】
[0022]現(xiàn)在參考附圖,其中相同的標(biāo)號(hào)貫穿所有附圖都代表對(duì)應(yīng)的部分:
[0023]圖1說(shuō)明了根據(jù)某些實(shí)施例、包括查詢?cè)鰪?qiáng)系統(tǒng)的計(jì)算體系結(jié)構(gòu)。
[0024]圖2說(shuō)明了根據(jù)某些實(shí)施例、在分類層次或群集層次中具有兩個(gè)子類別的一個(gè)類別的圖。
[0025]圖3以流程圖說(shuō)明了根據(jù)某些實(shí)施例、在查詢?cè)鰪?qiáng)系統(tǒng)中由關(guān)鍵詞與分類類別匹配過(guò)程執(zhí)行的邏輯。圖3由圖3A、圖3B、圖3C和圖3D構(gòu)成。
[0026]圖4以框圖說(shuō)明了根據(jù)某些實(shí)施例可以使用的計(jì)算機(jī)體系結(jié)構(gòu)。
【具體實(shí)施方式】
[0027]在以下描述中,參考構(gòu)成本說(shuō)明書一部分并且說(shuō)明本發(fā)明幾個(gè)實(shí)施例的附圖。應(yīng)當(dāng)理解,在不背離本發(fā)明范圍的情況下,可以使用其它實(shí)施例而且可以進(jìn)行結(jié)構(gòu)與操作變化。
[0028]在實(shí)施例中,本文提到的服務(wù)指在信息系統(tǒng)上實(shí)現(xiàn)并且可以從電信網(wǎng)絡(luò)訪問(wèn)的任何服務(wù)。服務(wù)包括但不限于web服務(wù)。
[0029]圖1說(shuō)明了根據(jù)某些實(shí)施例、包括查詢?cè)鰪?qiáng)系統(tǒng)120的計(jì)算體系結(jié)構(gòu)。服務(wù)客戶端100通過(guò)通信網(wǎng)絡(luò)與服務(wù)注冊(cè)服務(wù)器110交互。服務(wù)注冊(cè)服務(wù)器110包括查詢?cè)鰪?qiáng)系統(tǒng)120和服務(wù)注冊(cè)表170。在某些實(shí)施例中,服務(wù)客戶端100可以通過(guò)由查詢?cè)鰪?qiáng)系統(tǒng)120提供的一個(gè)或多個(gè)用戶接口與服務(wù)注冊(cè)服務(wù)器110交互。
[0030]查詢?cè)鰪?qiáng)系統(tǒng)120提供一種集成和迭代的過(guò)程,以為服務(wù)注冊(cè)表170中所公布的一種或多種服務(wù)生成并識(shí)別恰當(dāng)?shù)年P(guān)鍵詞與分類和/或群集類別,并且所識(shí)別出的關(guān)鍵詞用于增強(qiáng)(即,改進(jìn))查詢。查詢?cè)鰪?qiáng)系統(tǒng)120提供了以集成的方式組合關(guān)鍵詞搜索與類別選擇/搜索的混合技術(shù)。另一方面,常規(guī)系統(tǒng)可以通過(guò)執(zhí)行兩個(gè)單獨(dú)的查詢、然后利用邏輯操作(例如“AND”或“0R”)組合結(jié)果來(lái)把關(guān)鍵詞與類別搜索組合成合成查詢。
[0031]查詢?cè)鰪?qiáng)系統(tǒng)120具有四個(gè)組件:分類-群集與服務(wù)關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130 (“關(guān)鍵詞數(shù)據(jù)存儲(chǔ)”130)、關(guān)鍵詞預(yù)處理器140、關(guān)鍵詞分類-群集匹配引擎150 (“匹配引擎”150)和關(guān)鍵詞詞庫(kù)160。
[0032]查詢?cè)鰪?qiáng)系統(tǒng)120利用基于迭代關(guān)鍵詞與類別的過(guò)程來(lái)發(fā)現(xiàn)例如面向服務(wù)的信息系統(tǒng)與網(wǎng)絡(luò)中可用的web服務(wù)。在可供選擇的實(shí)施例中,查詢?cè)鰪?qiáng)系統(tǒng)120可以發(fā)現(xiàn)除web服務(wù)之外的項(xiàng)。
[0033]服務(wù)注冊(cè)表170使服務(wù)提供商能夠公布他們的服務(wù)并且使服務(wù)消費(fèi)者能夠搜索并使用這些公布的服務(wù)。服務(wù)注冊(cè)表170存儲(chǔ)所公布服務(wù)的信息。
[0034]匹配引擎150提供一種機(jī)制,以通過(guò)允許用戶提供反饋來(lái)把關(guān)鍵詞搜索與類別瀏覽集成到相互校正與自校正搜索過(guò)程中。
[0035]關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130保留由服務(wù)提供商提供的或者從服務(wù)元數(shù)據(jù)生成的服務(wù)關(guān)鍵詞的信息,以及這些關(guān)鍵詞與分類/群集類別之間的關(guān)系信息。關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130中的信息是從存儲(chǔ)在服務(wù)注冊(cè)表170中的服務(wù)信息檢索或?qū)С龅摹?br>
[0036]關(guān)鍵詞與分類/群集類別之間的關(guān)系信息定義為相關(guān)指標(biāo)(indicator),這是與一個(gè)類別關(guān)聯(lián)的關(guān)鍵詞的權(quán)重(并且在本文中稱為關(guān)鍵詞相關(guān)指標(biāo))。相關(guān)指標(biāo)也用作與一個(gè)類別關(guān)聯(lián)的查詢的權(quán)重(并且在本文中稱為查詢相關(guān)指標(biāo))。
[0037]關(guān)鍵詞預(yù)處理器140被用來(lái)驗(yàn)證查詢關(guān)鍵詞是否有效。關(guān)鍵詞詞庫(kù)160在識(shí)別關(guān)鍵詞同義詞的過(guò)程中被采用。參考同義詞,詞的意義依賴于它們?cè)谄渲惺褂玫纳舷挛摹@?,服?wù)提供商使用的術(shù)語(yǔ)可能與服務(wù)客戶端100使用的術(shù)語(yǔ)不同。
[0038]服務(wù)可以分成分類或群集。分類可以由標(biāo)準(zhǔn)機(jī)構(gòu)創(chuàng)建并且可以具有明確定義并且很好理解的子類別名字。群集或群集層次可以由服務(wù)注冊(cè)服務(wù)器110創(chuàng)建,其中服務(wù)注冊(cè)服務(wù)器110實(shí)現(xiàn)本文所述的迭代關(guān)鍵詞與類別搜索技術(shù)。在某些實(shí)施例中,如果服務(wù)具有相似的關(guān)鍵詞,就把它們分到相同的群集中。在某些實(shí)施例中,群集不具有良好定義的名字。當(dāng)識(shí)別出一個(gè)群集并且需要將其呈現(xiàn)給用戶時(shí),該群集中一種典型樣本服務(wù)的信息被發(fā)送到用戶。用戶通過(guò)指定該樣本服務(wù)是否與用戶試圖找出的服務(wù)相似來(lái)決定是否選擇該群集。在各種實(shí)施例中,用戶可以是人、計(jì)算機(jī)程序、設(shè)備等。
[0039]在某些實(shí)施例中,本文所使用的分類指相同類型的事物分到其中的標(biāo)準(zhǔn)類別,例如北美行業(yè)分類系統(tǒng)(NAICS)。通常,這些分類是由標(biāo)準(zhǔn)機(jī)構(gòu)開發(fā)的而且,如果它們不是內(nèi)置特征的話,可以插入服務(wù)注冊(cè)表中。分類是一種歸類機(jī)制,它可以在關(guān)鍵詞搜索技術(shù)中使用。不管怎樣,任何分類都具有有限和固定的級(jí)別。在一個(gè)分類的最精細(xì)的級(jí)別,有可能有數(shù)千或者更多的服務(wù)分到相同的子類別中。在這種情況下,在這個(gè)最精細(xì)的子類別中期望進(jìn)一步的歸類/分組。
[0040]服務(wù)客戶端100與查詢?cè)鰪?qiáng)系統(tǒng)120之間的通信是迭代的過(guò)程。服務(wù)客戶端100與查詢?cè)鰪?qiáng)系統(tǒng)120來(lái)回傳遞關(guān)鍵詞和分類-群集類別信息多次,以便為處于服務(wù)客戶端100的用戶試圖找出的服務(wù)識(shí)別恰當(dāng)?shù)年P(guān)鍵詞和分類-群集類別。
[0041]當(dāng)服務(wù)客戶端100與查詢?cè)鰪?qiáng)系統(tǒng)120通信時(shí),關(guān)鍵詞預(yù)處理器140首先從服務(wù)客戶端100接收查詢并且檢查關(guān)鍵詞,以確信關(guān)鍵詞有效,例如沒(méi)有拼寫錯(cuò)誤。如果關(guān)鍵詞預(yù)處理器140識(shí)別出關(guān)鍵詞中的錯(cuò)誤,則關(guān)鍵詞預(yù)處理器140通知匹配引擎150,而且匹配引擎150在發(fā)送回服務(wù)客戶端100的消息中把該信息轉(zhuǎn)發(fā)到服務(wù)客戶端100。
[0042]匹配引擎150是實(shí)現(xiàn)匹配技術(shù)的組件。匹配引擎150從關(guān)鍵詞預(yù)處理器140接收預(yù)處理之后的查詢、從關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130檢索分類-群集類別關(guān)鍵詞、從關(guān)鍵詞詞庫(kù)提取關(guān)鍵詞的同義詞、比較查詢中的關(guān)鍵詞與類別中的關(guān)鍵詞,并且生成更新后的關(guān)鍵詞版本與排名后的類別列表。匹配引擎150把修改后的關(guān)鍵詞與類別信息提供回服務(wù)客戶端100,用于進(jìn)一步的反饋和調(diào)整。
[0043]關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130是其中存儲(chǔ)用于每個(gè)服務(wù)與分類/群集類別的關(guān)鍵詞的數(shù)據(jù)存儲(chǔ)。查詢?cè)鰪?qiáng)系統(tǒng)120計(jì)算用于每個(gè)類別的每個(gè)關(guān)鍵詞的關(guān)鍵詞相關(guān)指標(biāo)并且把這些相關(guān)指標(biāo)的值存儲(chǔ)在關(guān)鍵詞數(shù)據(jù)存儲(chǔ)130中。
[0044]關(guān)鍵詞詞庫(kù)160是由匹配引擎150用于找出兩組關(guān)鍵詞之間的同義詞的詞庫(kù)。在某些實(shí)施例中,如果兩個(gè)關(guān)鍵詞具有相同或者非常相似的意義,則它們是同義詞。
[0045]在迭代過(guò)程中通過(guò)指定或選擇多個(gè)關(guān)鍵詞并且通過(guò)選擇/指定服務(wù)所屬的恰當(dāng)分類或群集類別,查詢?cè)鰪?qiáng)系統(tǒng)120使服務(wù)消費(fèi)者能夠識(shí)別在服務(wù)注冊(cè)表中公布的恰當(dāng)服務(wù)。特別地,匹配引擎150識(shí)別最適合的服務(wù)所屬的恰當(dāng)關(guān)鍵詞與類別。在相互校正過(guò)程中利用在每個(gè)分類與群集級(jí)別的關(guān)鍵詞選擇,對(duì)合適服務(wù)的搜索范圍可以通過(guò)向下導(dǎo)航分類與群集層次而有效地縮小。同義詞問(wèn)題利用關(guān)鍵詞詞庫(kù)160來(lái)解決。在該過(guò)程結(jié)束時(shí),查詢?cè)鰪?qiáng)系統(tǒng)120允許服務(wù)用戶檢索候選服務(wù)的列表。
[0046]在某些實(shí)施例中,查詢?cè)鰪?qiáng)系統(tǒng)120為服務(wù)消費(fèi)者和提供商都提供關(guān)于關(guān)鍵詞選擇和類別識(shí)別的幫助。通過(guò)給類別排名并且引導(dǎo)服務(wù)用戶做出正確的關(guān)鍵詞選擇,查詢?cè)鰪?qiáng)系統(tǒng)120方便了服務(wù)搜索過(guò)程。
[0047]對(duì)于查詢?cè)鰪?qiáng)系統(tǒng)120,內(nèi)置了利用被查詢的關(guān)鍵詞與類別之間的關(guān)系、給用戶推薦(即,建議)和分析用戶的反饋以便作出更有效的搜索的智能。
[0048]查詢?cè)鰪?qiáng)系統(tǒng)120提供了收集并利用服務(wù)關(guān)鍵詞與服務(wù)所屬的層次性分類與群集類別之間關(guān)系的過(guò)程。相同的概念也可以應(yīng)用到服務(wù)注冊(cè)表中其它上下文相關(guān)的服務(wù)元數(shù)據(jù)。
[0049]更具體地說(shuō),通過(guò)比較用戶提供的關(guān)鍵詞和與每個(gè)分類和/或群集類別關(guān)聯(lián)的關(guān)鍵詞,利用來(lái)自關(guān)鍵詞詞庫(kù)160的額外幫助和來(lái)自用戶的反饋,匹配引擎150可以快速識(shí)別出恰當(dāng)?shù)年P(guān)鍵詞和相關(guān)的服務(wù)。用戶的反饋包括迭代地提供關(guān)于服務(wù)的關(guān)鍵詞與類別信
肩、O
[0050]當(dāng)服務(wù)注冊(cè)表存儲(chǔ)了數(shù)千或者甚至數(shù)百萬(wàn)種服務(wù)的信息時(shí),要求用戶給出關(guān)于他們想找出的服務(wù)的詳細(xì)和具體信息常常是低效的。相反,允許用戶給出多個(gè)關(guān)鍵詞、然后基于匹配引擎150提供的推薦關(guān)鍵詞進(jìn)行直截了當(dāng)?shù)倪x擇可能更實(shí)際。S卩,對(duì)于查詢?cè)鰪?qiáng)系統(tǒng)120,匹配引擎150的任務(wù)是幫助識(shí)別對(duì)用戶最適合的服務(wù)。
[0051]查詢?cè)鰪?qiáng)系統(tǒng)120提供了匹配引擎150,以利用有限的或者沒(méi)有關(guān)于注冊(cè)表結(jié)構(gòu)以及注冊(cè)表中所公布服務(wù)的確切細(xì)節(jié)的事先了解,使用戶能夠搜索在注冊(cè)表中公布的服務(wù)(以類似于web搜索引擎如何用于搜索web頁(yè)面的方式)。
[0052]類似地,查詢?cè)鰪?qiáng)系統(tǒng)120所采用的關(guān)鍵詞與歸類信息改進(jìn)技術(shù)不僅能幫助服務(wù)消費(fèi)者搜索服務(wù),而且能幫助服務(wù)提供商歸檔并分類它們的服務(wù)。
[0053]圖2說(shuō)明了根據(jù)某些實(shí)施例、在分類層次或群集層次中具有兩個(gè)子類別的一個(gè)類別的圖。特別地,圖2是說(shuō)明兩級(jí)類別層次的圖。類別A200 (在第一級(jí)別)具有兩個(gè)子類另U,類別_A1210 (在第二級(jí)別)和類別_A2220 (在第二級(jí)別)。
[0054]圖2用于描述兩個(gè)實(shí)體例如關(guān)鍵詞與類別之間關(guān)系的測(cè)量、相關(guān)指標(biāo)。
[0055]在某些實(shí)施例中,當(dāng)一個(gè)服務(wù)在服務(wù)注冊(cè)表中公布時(shí),服務(wù)提供商提供該服務(wù)的關(guān)鍵詞與分類信息。如果一個(gè)服務(wù)屬于一個(gè)類別,則其所有關(guān)鍵詞都屬于這個(gè)類別并且屬于其所有祖先類別。
[0056]例如,如果汽車保險(xiǎn)報(bào)價(jià)服務(wù)在注冊(cè)表中公布,則服務(wù)提供商可以指定這個(gè)服務(wù)屬于北美行業(yè)分類系統(tǒng)(NAICS)中的類別“保險(xiǎn)代理&經(jīng)紀(jì)業(yè)務(wù)”。這個(gè)類別是類別“保險(xiǎn)運(yùn)營(yíng)商及相關(guān)活動(dòng)”的子類別,而“保險(xiǎn)運(yùn)營(yíng)商及相關(guān)活動(dòng)”又是類別“金融與保險(xiǎn)”的子類另O。在這個(gè)例子中,為這個(gè)服務(wù)指定的所有關(guān)鍵詞也都是用于類別“保險(xiǎn)代理&經(jīng)紀(jì)業(yè)務(wù)”及其父類別“保險(xiǎn)運(yùn)營(yíng)商及相關(guān)活動(dòng)”和祖父類別“金融與保險(xiǎn)”的關(guān)鍵詞。每個(gè)類別中的關(guān)鍵詞可以具有與該類別關(guān)聯(lián)的不同權(quán)重,稱為關(guān)鍵詞相關(guān)指標(biāo)。
[0057]相關(guān)指標(biāo)可以描述為測(cè)量?jī)蓚€(gè)文檔有多么相關(guān)的權(quán)重。每個(gè)文檔都包含一組關(guān)鍵詞。文檔可以是單個(gè)關(guān)鍵詞、服務(wù)、查詢或類別。
[0058]特別地,一個(gè)具有關(guān)鍵詞列表的查詢可以被看作是一個(gè)文檔。一個(gè)包含關(guān)鍵詞集合的類別也可以被看作是一個(gè)文檔?;谄潢P(guān)鍵詞的權(quán)重來(lái)測(cè)量文檔相似性的不同方案已經(jīng)在信息檢索研究中開發(fā)出來(lái)了,例如余弦相似性、歐氏距離、骰子系數(shù)和杰卡德指數(shù)。這些方案中有些可以用來(lái)測(cè)量查詢與類別之間的相似性。在常規(guī)的信息檢索系統(tǒng)中,在這些方案中一些當(dāng)中所使用的關(guān)鍵詞的權(quán)重是利用基于詞頻-逆文檔頻率(TF-1DF)的技術(shù)計(jì)算的。
[0059]一個(gè)服務(wù)的關(guān)鍵詞集合也可以被看作是一個(gè)文檔。為了進(jìn)一步給服務(wù)歸類,當(dāng)分類達(dá)到其最精細(xì)的級(jí)別時(shí),多個(gè)相似性方案,例如余弦相似性或者歐氏距離,可以用于基于它們的關(guān)鍵詞測(cè)量服務(wù)之間的相似性。如果單個(gè)群集中有太多服務(wù),則這個(gè)群集中的服務(wù)可以進(jìn)一步分成更小的群集。這個(gè)過(guò)程可以遞歸進(jìn)行,以產(chǎn)生群集層次。多個(gè)群集或群集層次可以在分類層次中建立,以方便迭代關(guān)鍵詞搜索??梢詫?shí)現(xiàn)在層次性文檔群集研究中開發(fā)出的技術(shù),例如凝聚層次結(jié)構(gòu)群集或基于層次性頻率項(xiàng)的群集,以便創(chuàng)建群集層次。
[0060]關(guān)鍵詞相關(guān)指標(biāo)(RI)是一個(gè)與TF-1DF相似的測(cè)量,這是一種用于評(píng)估一個(gè)項(xiàng)對(duì)文檔集合中的一個(gè)文檔有多重要的加權(quán)方案。
[0061]關(guān)于相同的記號(hào),與一個(gè)類別關(guān)聯(lián)的關(guān)鍵詞的關(guān)鍵詞頻率(KF)類似于TF。KF測(cè)量一個(gè)關(guān)鍵詞在一個(gè)類別中出現(xiàn)得多頻繁。在某些實(shí)施例中,它被定義為類別中包含該關(guān)鍵詞的服務(wù)總數(shù)的與該類別中每個(gè)服務(wù)具有的所有關(guān)鍵詞的個(gè)數(shù)之和的商。等式(I)規(guī)定了 KFi:
【權(quán)利要求】
1.一種用于提供改進(jìn)查詢的推薦的方法,包括: 接收具有查詢關(guān)鍵詞和選定類別的查詢;以及 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別排名高, 利用關(guān)鍵詞相關(guān)指標(biāo)計(jì)算查詢與每個(gè)子類別的查詢相關(guān)指標(biāo); 基于查詢相關(guān)指標(biāo)給每個(gè)子類別排名;以及 提供排名后的子類別,以在選擇要與查詢一起提交的新類別時(shí)使用。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括: 確定是否到達(dá)選定類別中的最低類別級(jí)別;以及 響應(yīng)確定已經(jīng)到達(dá)最低類別級(jí)別, 給處于最低類別級(jí)別的個(gè)體服務(wù)排名;以及 從排名后的個(gè)體服務(wù)提供一個(gè)或多個(gè)高排名的服務(wù)。
3.如權(quán)利要求1或權(quán)利要求2所述的方法,進(jìn)一步包括: 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別中至少有一個(gè)選定類別排名低, 識(shí)別一對(duì)同義詞,該對(duì)同義詞中第一個(gè)同義詞與查詢關(guān)鍵詞關(guān)聯(lián)而該對(duì)同義詞中第二個(gè)同義詞與類別關(guān)鍵詞關(guān)聯(lián);以及 提供用來(lái)自該對(duì)同義詞中的同義詞代替查詢關(guān)鍵詞的推薦。
4.如權(quán)利要求3所述的方法,其中該對(duì)同義詞是為對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞識(shí)別的。
5.如前面任何一項(xiàng)權(quán)利要求所述的方法,進(jìn)一步包括: 對(duì)于非排名靠前的選定類別中具有高關(guān)鍵詞相關(guān)指標(biāo)值的類別關(guān)鍵詞,識(shí)別不在查詢中而且沒(méi)有為其識(shí)別出同義詞的類別關(guān)鍵詞;以及提供把所識(shí)別出的類別關(guān)鍵詞添加到查詢的推薦。
6.如前面任何一項(xiàng)權(quán)利要求所述的方法,進(jìn)一步包括: 識(shí)別對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值并且對(duì)排名靠前但未選的類別具有聞關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞; 從識(shí)別出的查詢關(guān)鍵詞,識(shí)別沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞;以及 提供把沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞從查詢中除去的推薦。
7.如前面任何一項(xiàng)權(quán)利要求所述的方法,進(jìn)一步包括: 提供關(guān)于用于在修正查詢時(shí)使用的查詢關(guān)鍵詞的推薦;以及 接收基于所提供的推薦的修正后的查詢。
8.如前面任何一項(xiàng)權(quán)利要求所述的方法,進(jìn)一步包括: 接收不執(zhí)行進(jìn)一步迭代的指示; 以當(dāng)前形式執(zhí)行查詢;以及 提供一個(gè)或多個(gè)服務(wù)的列表。
9.如前面任何一項(xiàng)權(quán)利要求所述的方法,進(jìn)一步包括: 迭代通過(guò)各級(jí)別類別。
10.一種用于提供改進(jìn)查詢的推薦的系統(tǒng),包括: 處理器;以及匹配引擎,可以耦合到處理器并且可操作執(zhí)行操作,所述操作包括: 接收具有查詢關(guān)鍵詞和選定類別的查詢;以及 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別排名高, 利用關(guān)鍵詞相關(guān)指標(biāo)計(jì)算查詢與每個(gè)子類別的查詢相關(guān)指標(biāo); 基于查詢相關(guān)指標(biāo)給每個(gè)子類別排名;以及 提供排名后的子類別,以在選擇要與查詢一起提交的新類別時(shí)使用。
11.如權(quán)利要求10所述的系統(tǒng),其中所述操作進(jìn)一步包括: 確定是否到達(dá)選定類別中的最低類別級(jí)別;以及 響應(yīng)于確定已經(jīng)到達(dá)最低類別級(jí)別, 給處于最低類別級(jí)別的個(gè)體服務(wù)排名;以及 從排名后的個(gè)體服務(wù)提供一個(gè)或多個(gè)高排名的服務(wù)。
12.如權(quán)利要求10或權(quán)利要求11所述的系統(tǒng),其中所述操作進(jìn)一步包括: 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別中至少有一個(gè)選定類別排名低, 識(shí)別一對(duì)同義詞,該對(duì)同義詞中第一個(gè)同義詞與查詢關(guān)鍵詞關(guān)聯(lián)而該對(duì)同義詞中第二個(gè)同義詞與類別關(guān)鍵詞關(guān)聯(lián);以及 提供用來(lái)自該對(duì)同義詞中的`同義詞代替查詢關(guān)鍵詞的推薦。
13.如權(quán)利要求12所述的系統(tǒng),其中該對(duì)同義詞是為對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞識(shí)別的。
14.如權(quán)利要求10至13中任何一項(xiàng)所述的系統(tǒng),其中所述操作進(jìn)一步包括: 對(duì)于非排名靠前的選定類別中具有高關(guān)鍵詞相關(guān)指標(biāo)值的類別關(guān)鍵詞,識(shí)別不在查詢中而且沒(méi)有為其識(shí)別出同義詞的類別關(guān)鍵詞;以及 提供把所識(shí)別出的類別關(guān)鍵詞添加到查詢的推薦。
15.如權(quán)利要求10至14中任何一項(xiàng)所述的系統(tǒng),其中所述操作進(jìn)一步包括: 識(shí)別對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值并且對(duì)排名靠前但未選的類別具有聞關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞; 從識(shí)別出的查詢關(guān)鍵詞,識(shí)別沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞;以及 提供把沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞從查詢中除去的推薦。
16.如權(quán)利要求10至15中任何一項(xiàng)所述的系統(tǒng),其中所述操作進(jìn)一步包括: 提供關(guān)于用于在修正查詢時(shí)使用的查詢關(guān)鍵詞的推薦;以及 接收基于所提供的推薦的修正后的查詢。
17.如權(quán)利要求10至16中任何一項(xiàng)所述的系統(tǒng),其中所述操作進(jìn)一步包括: 接收不執(zhí)行進(jìn)一步迭代的指示; 以當(dāng)前形式執(zhí)行查詢;以及 提供一個(gè)或多個(gè)服務(wù)的列表。
18.一種用于提供改進(jìn)查詢的推薦的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括: 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中包含計(jì)算機(jī)可讀程序代碼,所述計(jì)算機(jī)可讀程序代碼包括: 計(jì)算機(jī)可讀程序代碼,當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí),可配置成執(zhí)行:接收具有查詢關(guān)鍵詞和選定類別的查詢;以及 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別排名高, 利用關(guān)鍵詞相關(guān)指標(biāo)計(jì)算查詢與每個(gè)子類別的查詢相關(guān)指標(biāo); 基于查詢相關(guān)指標(biāo)給每個(gè)子類別排名;以及 提供排名后的子類別,以在選擇要與查詢一起提交的新類別時(shí)使用。
19.如權(quán)利要求18所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 確定是否到達(dá)選定類別中的最低類別級(jí)別;以及 響應(yīng)確定已經(jīng)到達(dá)最低類別級(jí)別, 給處于最低類別級(jí)別的個(gè)體服務(wù)排名;以及 從排名后的個(gè)體服務(wù)提供一個(gè)或多個(gè)高排名的服務(wù)。
20.如權(quán)利要求18或權(quán)利要求19所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 響應(yīng)于參考用于每個(gè)選定類別的查詢相關(guān)指標(biāo)值確定選定類別中至少有一個(gè)選定類別排名低, 識(shí)別一對(duì)同義詞,該對(duì)同義詞中第一個(gè)同義詞與查詢關(guān)鍵詞關(guān)聯(lián)而該對(duì)同義詞中第二個(gè)同義詞與類別關(guān)鍵詞關(guān)聯(lián);以及 提供用來(lái)自該對(duì)同義詞中的同義詞代替查詢關(guān)鍵詞的推薦。
21.如權(quán)利要求20所述的計(jì)算機(jī)程序產(chǎn)品,其中該對(duì)同義詞是為對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞識(shí)別的。
22.如權(quán)利要求18至21中任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 對(duì)于非排名靠前的選定類別中具有高關(guān)鍵詞相關(guān)指標(biāo)值的類別關(guān)鍵詞,識(shí)別不在查詢中而且沒(méi)有為其識(shí)別出同義詞的類別關(guān)鍵詞;以及提供把所識(shí)別出的類別關(guān)鍵詞添加到查詢的推薦。
23.如權(quán)利要求18至22中任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 識(shí)別對(duì)非排名靠前的選定類別具有低關(guān)鍵詞相關(guān)指標(biāo)值并且對(duì)排名靠前但未選的類別具有聞關(guān)鍵詞相關(guān)指標(biāo)值的查詢關(guān)鍵詞; 從識(shí)別出的查詢關(guān)鍵詞,識(shí)別沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞;以及 提供把沒(méi)有為其識(shí)別出同義詞的查詢關(guān)鍵詞從查詢中除去的推薦。
24.如權(quán)利要求18至23中任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 提供關(guān)于用于在修正查詢時(shí)使用的查詢關(guān)鍵詞的推薦;以及 接收基于所提供的推薦的修正后的查詢。
25.如權(quán)利要求18至24中任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼當(dāng)被計(jì)算機(jī)的處理器執(zhí)行時(shí)配置成執(zhí)行: 接收不執(zhí)行進(jìn)一步迭代的指示; 以當(dāng)前形式執(zhí)行查詢;以及提供一個(gè)或多個(gè)服務(wù)的 列表。
【文檔編號(hào)】G06F17/30GK103562916SQ201280025518
【公開日】2014年2月5日 申請(qǐng)日期:2012年4月25日 優(yōu)先權(quán)日:2011年5月26日
【發(fā)明者】J·J·陶 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司