本申請是申請日為2011/06/09、申請?zhí)枮?01110164789.0、發(fā)明名稱為“實(shí)體卡的實(shí)體檢測和提取”的中國專利申請的分案申請。
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及網(wǎng)絡(luò)技術(shù)中搜索查詢技術(shù)。
背景技術(shù):
搜索引擎被用于查找各種類型的信息。盡管將鏈接列表返回給相關(guān)文檔如今是一種熟悉的格式,但這并不一定是方便的格式。為了找到特定的某條信息,用戶通常必需點(diǎn)進(jìn)鏈接來查看對應(yīng)的文檔。如果所需信息不在用戶所訪問的第一篇文檔中,則用戶可能需要多次重復(fù)這一過程。
技術(shù)實(shí)現(xiàn)要素:
在各實(shí)施例中,提供了用于檢測包含在搜索結(jié)果內(nèi)的實(shí)體信息的系統(tǒng)和方法??墒褂盟鶛z測的實(shí)體信息來確定搜索結(jié)果內(nèi)的實(shí)體類別以及具體實(shí)體??蓮呐c搜索結(jié)果相關(guān)聯(lián)的文檔中提取實(shí)體信息。這一信息可被用作實(shí)體卡的信息的一部分,可向用戶顯示該信息結(jié)合搜索結(jié)果和/或代替搜索結(jié)果。
提供本發(fā)明內(nèi)容以便以簡化形式介紹將在以下的具體實(shí)施方式中進(jìn)一步描述的一些概念。該發(fā)明內(nèi)容不旨在標(biāo)識所要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在獨(dú)立地用于幫助確定所要求保護(hù)的主題的范圍。
附圖說明
下面將參考附圖詳細(xì)描述本發(fā)明,其中:
圖1是適用于實(shí)現(xiàn)本發(fā)明的各實(shí)施例的示例性計(jì)算環(huán)境的框圖。
圖2示意性地示出適用于執(zhí)行本發(fā)明的實(shí)施例的系統(tǒng)的示例。
圖3描繪了根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
圖4描繪了根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
圖5描繪了根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
具體實(shí)施方式
概覽
在各實(shí)施例中,當(dāng)接收到搜索查詢,搜索引擎可生成多個(gè)搜索結(jié)果。隨后可分析由搜索引擎生成的結(jié)果,以標(biāo)識由該結(jié)果指示的實(shí)體類別。這一標(biāo)識可部分地基于該結(jié)果中一個(gè)或多個(gè)面向類別的站點(diǎn)的標(biāo)識。可進(jìn)一步分析該結(jié)果,以確定意圖實(shí)體?;谝鈭D實(shí)體,可準(zhǔn)備對應(yīng)于該實(shí)體的實(shí)體卡并與搜索結(jié)果一起顯示??扇芜x地,可基于期望實(shí)體來排除對所生成的搜索結(jié)果中的一個(gè)或多個(gè)的顯示、或?qū)⑵浜喜⒌綄?shí)體卡中。
在以下討論中,實(shí)體卡是指增強(qiáng)的實(shí)體專用的信息呈現(xiàn)。實(shí)體卡可包括關(guān)于實(shí)體的各種類型的信息。實(shí)體卡可允許響應(yīng)于搜索查詢來向用戶呈現(xiàn)這些信息,使得用戶不需要篩選文檔鏈接來獲得該信息。
類別模板
確定與搜索查詢相關(guān)聯(lián)的用戶意圖可引起各種問題。一種用于標(biāo)識用戶意圖的方法可以是確定搜索查詢是否與實(shí)體相關(guān)。實(shí)體可以指代諸如作者、政治家或運(yùn)動員等類型的個(gè)人;諸如電影、書、或消費(fèi)品等類型的產(chǎn)品;或諸如餐廳、旅館、娛樂區(qū)或零售商店等類型的地方。然而,標(biāo)識與搜索查詢相關(guān)的實(shí)體也造成了困難。許多常規(guī)方法試圖建立可與搜索查詢中的項(xiàng)進(jìn)行匹配的實(shí)體列表。將這些列表保持最新可能是困難的且耗時(shí)的。另外,與搜索查詢相關(guān)的實(shí)體可能沒有被包括在搜索項(xiàng)中。
在各實(shí)施例中,實(shí)體信息可基于響應(yīng)于搜索查詢的搜索結(jié)果來動態(tài)地確定??刹糠值鼗跇?biāo)識來自已知與特定類別對應(yīng)的文檔的搜索結(jié)果來標(biāo)識實(shí)體。存在試圖跟蹤各種實(shí)體的當(dāng)前狀態(tài)的許多網(wǎng)站。例如,跟蹤電影、旅館、消費(fèi)電子產(chǎn)品或書的多個(gè)web位置是可用的。這些站點(diǎn)可被稱為面向類別的站點(diǎn)。面向類別的站點(diǎn)通常跟蹤感興趣的具體類別中的當(dāng)前發(fā)展,并可由此提供關(guān)于類別內(nèi)的實(shí)體的當(dāng)前信息。面向類別的站點(diǎn)的數(shù)量和/或身份通常隨時(shí)間緩慢改變,因此將適當(dāng)?shù)恼军c(diǎn)標(biāo)識為與類別相關(guān)可能是可管理的任務(wù)。與統(tǒng)一資源定位符(url)相關(guān)聯(lián)且來自這些站點(diǎn)中的一個(gè)站點(diǎn)的文檔與類別相關(guān)聯(lián)的可能性可能增加。
對于來自面向類別的站點(diǎn)的文檔,可構(gòu)造一個(gè)或多個(gè)類別模板。位于面向類別的站點(diǎn)的文檔結(jié)構(gòu)在站點(diǎn)上所描述的實(shí)體之間常常是一致的??墒褂贸尸F(xiàn)的一致性來構(gòu)造用于從站點(diǎn)提取信息的模板。例如,提供關(guān)于電影的信息的面向類別的站點(diǎn)通常將具有一致的呈現(xiàn)格式。電影導(dǎo)演將按特定方式來標(biāo)注,諸如標(biāo)注在文檔中的特定地方、或使用與導(dǎo)演姓名相鄰的和/或在其上面的標(biāo)題“導(dǎo)演”來標(biāo)注。可使用期望的呈現(xiàn)格式來構(gòu)造用于從文檔提取信息的模板。注意,站點(diǎn)可被認(rèn)為是超過一個(gè)類別的面向類型的站點(diǎn)。例如,在線零售商可出售包括消費(fèi)電子產(chǎn)品、dvd以及計(jì)算機(jī)游戲等產(chǎn)品。該在線零售商可具有與這些領(lǐng)域中的每一領(lǐng)域?qū)?yīng)的一個(gè)或多個(gè)url組件。由此,取決于搜索查詢,來自在線零售商的文檔的外觀可與電影類別、游戲類別或消費(fèi)品類別對應(yīng)。
可以為每一面向類別的站點(diǎn)構(gòu)造模板。模板可包括至少兩個(gè)組件。模板的一部分可以是url組件。url組件表示url的初始部分。與url模板的初始部分匹配的文檔可以是來自已知的面向類別的站點(diǎn)的文檔。模板的第二組件可以是提取格式組件。提取格式組件提供多個(gè)數(shù)據(jù)字段的規(guī)范,包括可針對每一數(shù)據(jù)字段提取的信息的類型,以及如何提取該信息的規(guī)范??墒褂萌魏畏奖愕念愋偷囊?guī)范。例如,規(guī)范可標(biāo)識文檔中的具體位置,以檢索信息,諸如從文檔第五行中的第二字段取得一值?;蛘?,規(guī)范可以是標(biāo)簽驅(qū)動,諸如指定首先標(biāo)識諸如“標(biāo)題”或“電影標(biāo)題”的頭部,并且隨后取得看上去與頭部有某種相關(guān)的信息或單詞。
除了基于面向類別的站點(diǎn)的類別模板以外,可以為類別構(gòu)造具有開放格式的一個(gè)或多個(gè)類別模板??蓸?gòu)造開放格式類別模板,以提取與面向類別的站點(diǎn)的模板相同的信息。開放格式模塊可與面向類別的站點(diǎn)的標(biāo)簽驅(qū)動的模板相似,因?yàn)殚_放格式模板將被應(yīng)用于與url組件不匹配的頁面。
注意,可將每一開放格式模板應(yīng)用于每一響應(yīng)結(jié)果、或應(yīng)用于被標(biāo)識成與所標(biāo)識的實(shí)體對應(yīng)的每一響應(yīng)結(jié)果。這可導(dǎo)致從相同文檔中提取每一數(shù)據(jù)字段的多個(gè)值。為了使這一數(shù)據(jù)對每一文檔更有用,可執(zhí)行一致性檢測以確定哪個(gè)開放格式模板對于提取給定數(shù)據(jù)字段的數(shù)據(jù)是成功的。例如,對于給定文檔,可將每一字段的多個(gè)值與從來自面向類別的站點(diǎn)的文檔提取的值作比較。因?yàn)榕既黄ヅ涞目赡苄暂^低,所以匹配值有可能是正確提取的值。另一類型的檢查可以是對使用來自其他文檔的開放格式模板所提取的值的一致性檢查。同樣,偶然匹配的可能性較低,因此匹配有可能指示該字段的成功提取。
可通過任何方便的方法來確定面向類別的站點(diǎn)。可以手動地標(biāo)識面向類別的站點(diǎn)?;蛘?,可通過提交應(yīng)返回類別專用結(jié)果的已知搜索來確定面向類別的站點(diǎn)。最頻繁地出現(xiàn)的站點(diǎn)可被認(rèn)為是面向類別的站點(diǎn)。
類別以及實(shí)體標(biāo)識
當(dāng)接收到搜索查詢時(shí),可使用常規(guī)搜索引擎來生成多個(gè)響應(yīng)結(jié)果或文檔。在以下各實(shí)施例中,可分析響應(yīng)文檔的一部分來確定類別或?qū)嶓w信息。該部分可與前10個(gè)、或前20個(gè)、或前50個(gè)或任何常規(guī)數(shù)量的響應(yīng)結(jié)果對應(yīng)??煞治鲰憫?yīng)文檔以確定實(shí)體類別。分析的一部分可以是將文檔與類別模板的url組件進(jìn)行匹配。在一個(gè)實(shí)施例中,可能需要至少一個(gè)url組件匹配,以便進(jìn)行實(shí)體類別的標(biāo)識。分析的另一部分可以是將來自搜索結(jié)果的元數(shù)據(jù)與已知項(xiàng)進(jìn)行匹配。例如,可將諸如“電影”、“零售商”或“影片”等元數(shù)據(jù)項(xiàng)與電影站點(diǎn)相關(guān)聯(lián)。元數(shù)據(jù)可與文檔的元標(biāo)簽、或與作為搜索結(jié)果來顯示的文檔的字幕、或當(dāng)文檔作為搜索結(jié)果來返回時(shí)可用的且與文檔相關(guān)聯(lián)的任何其他信息相對應(yīng)。
對類別模板或元數(shù)據(jù)的匹配可隨后被加權(quán),以確定針對搜索查詢是否與類別相對應(yīng)的分?jǐn)?shù)。例如,與url組件匹配的每一文檔可對該類別的分?jǐn)?shù)作出貢獻(xiàn)。可將額外的權(quán)重或分?jǐn)?shù)分配給與url組件匹配的第一文檔。相對于與url組件匹配的排名較低的搜索結(jié)果,可將額外的權(quán)重或分?jǐn)?shù)分配給排名較高的搜索結(jié)果。相似類型的加權(quán)可被用于元數(shù)據(jù)分析。
基于分?jǐn)?shù)可確定搜索的意圖類別。例如,如果檢測到單個(gè)類別的三個(gè)或更多url組件,則可將查詢分配給該類別。如果基于url組件的匹配而檢測到多個(gè)類別,則可分配排名最高的類別。在某些實(shí)施例中,如果沒有檢測到url組件匹配,則可能不存在類別的選擇?;蛘?,如果存在一個(gè)或更少的url組件匹配,則可不進(jìn)行類別的選擇。
還可分析結(jié)果以確定實(shí)體是否與搜索查詢相關(guān)聯(lián)。在一個(gè)實(shí)施例中,可首先標(biāo)識類別,并隨后可分析結(jié)果以確定實(shí)體。在這一實(shí)施例中,僅考慮屬于所標(biāo)識的類別的實(shí)體。在另一實(shí)施例中,如果沒有檢測到實(shí)體類別,則沒有與搜索查詢相關(guān)聯(lián)的實(shí)體。
實(shí)體分析的一部分可以是將類別模板應(yīng)用于來自面向類別的站點(diǎn)的文檔。由于文檔來自面向類別的站點(diǎn),所以文檔的提取格式有可能是已知的。由此,有可能與實(shí)體對應(yīng)的文檔的一部分也有可能是已知的,并且實(shí)體可被直接提取。實(shí)體分析的另一部分可以是將開放格式類別模板的一個(gè)或多個(gè)應(yīng)用于響應(yīng)結(jié)果中不是來自面向類別的站點(diǎn)的文檔。例如,許多餐廳評論網(wǎng)站列出餐廳名稱連同地址。開放格式模板將試圖通過找到與地址對應(yīng)的一組文本來從未知文檔格式中提取餐廳名稱。隨后可提取緊跟在地址前面的名稱作為可能的實(shí)體。在分析開放格式文檔以檢測實(shí)體之前類別不被確定的各實(shí)施例中,所使用的開放格式模板可與搜索結(jié)果中任何面向類別的站點(diǎn)的類別對應(yīng)。
隨后可分析從文檔中提取的實(shí)體數(shù)據(jù),以確定與搜索查詢相關(guān)聯(lián)的實(shí)體是否可被標(biāo)識。該分析可比較所提取的信息,以確定是否僅存在一個(gè)可能的實(shí)體、或是否可從若干實(shí)體中選擇一個(gè)實(shí)體、或是否存在阻止對實(shí)體的確定的歧義。
某些實(shí)體確定可以是相對簡單的。例如,類別選擇可以已經(jīng)基于多個(gè)面向類別的站點(diǎn)的存在,而面向類別的站點(diǎn)文檔中的每一個(gè)指示相同的實(shí)體。在這一情況中,來自面向類別的站點(diǎn)文檔的實(shí)體可被選作該實(shí)體。
在另一示例中,一個(gè)或多個(gè)文檔可來自面向類別的站點(diǎn),但實(shí)體信息的提取產(chǎn)生多個(gè)可能的實(shí)體。這可按各種方式來解決。一個(gè)選項(xiàng)可以是選擇在最大數(shù)量的面向類別的文檔中出現(xiàn)的實(shí)體。另一選項(xiàng)可以是選擇從最大數(shù)量的文檔中提取的實(shí)體,而不考慮源。這一選項(xiàng)將包括基于開放格式模板來定義的實(shí)體。又一選項(xiàng)可以是至少部分地基于從中提取每一實(shí)體的文檔的排名來選擇實(shí)體。又一些選項(xiàng)可基于將各權(quán)重給予從文檔中提取的數(shù)據(jù)來使用,包括與以上選項(xiàng)中的任一個(gè)的組合。
再一示例可涉及兩個(gè)或更多類別由搜索結(jié)果來標(biāo)識的情況。在某些實(shí)施例中,可首先確定類別,并隨后僅考慮在所選擇的類別內(nèi)的實(shí)體。在另一選項(xiàng)中,可根據(jù)每一潛在類別來分析每一文檔。隨后可使用如上所述的用于在多個(gè)實(shí)體之間進(jìn)行區(qū)分的方法來選擇實(shí)體。這將導(dǎo)致對應(yīng)的類別選擇。注意,在這一類型的實(shí)施例中,類別權(quán)重可被包括,作為在決定哪個(gè)實(shí)體對于搜索查詢是最佳匹配時(shí)的另一因素。
又一選項(xiàng)可涉及在實(shí)體之間進(jìn)行區(qū)分需要超過一條信息的情況。例如,許多餐廳是僅有一個(gè)位置的本地企業(yè)。結(jié)果,超過一個(gè)城市可能有具有相同名稱的餐廳,盡管各餐廳是不同的實(shí)體。具有相同名稱的多個(gè)餐廳實(shí)體可被稱為具有相同主標(biāo)識的實(shí)體。
以上情況可導(dǎo)致具有基于相同主標(biāo)識的餐廳的評論的多個(gè)餐廳評論站點(diǎn),但每一評論針對不同的餐廳實(shí)體。在此情況中,若干url組件匹配以及其他元數(shù)據(jù)的存在可清楚地指示餐廳類別,但可能需要進(jìn)一步確定以選擇與搜索查詢對應(yīng)的實(shí)體。一個(gè)選項(xiàng)是查看類別的附加提取的數(shù)據(jù)字段。在餐廳的示例中,用于提取的典型附加信息可包括地址和電話號碼信息??蓪@些字段進(jìn)行比較以標(biāo)識共享相同名稱的不同餐廳實(shí)體。這可被稱為比較各實(shí)體的次級信息。在基于次級信息在各實(shí)體之間進(jìn)行區(qū)分之后,對應(yīng)于每一不同實(shí)體的結(jié)果可被分類成對應(yīng)于每一不同實(shí)體的組。可以應(yīng)用如上所述的方法來確定與搜索查詢相關(guān)聯(lián)的實(shí)體,諸如通過選擇最常發(fā)生的實(shí)體、選擇具有排名最高的文檔的實(shí)體、或其他方法。
在某些實(shí)施例中,實(shí)體分析可導(dǎo)致沒有與查詢相關(guān)聯(lián)的實(shí)體。例如,如果由于缺乏url組件匹配而沒有分配類別,則可在該點(diǎn)停止實(shí)體分析過程。作為另一選項(xiàng),可使用評分系統(tǒng)來確定實(shí)體,以及對于作出分配而言,沒有實(shí)體可具有足夠高的分?jǐn)?shù)和/或與其他潛在實(shí)體足夠不同的分?jǐn)?shù)。在以上餐廳示例中,每一餐廳可僅出現(xiàn)在一個(gè)文檔中。評分系統(tǒng)可能需要在不止一個(gè)文檔中的出現(xiàn),以獲取對于分配為實(shí)體而言足夠的分?jǐn)?shù)?;蛘?,兩個(gè)餐廳可出現(xiàn)在相當(dāng)數(shù)量的文檔中,導(dǎo)致兩個(gè)餐廳具有相似的分?jǐn)?shù)。由于分?jǐn)?shù)不夠不同,因此沒有實(shí)體可被分配給搜索查詢。
在又一些實(shí)施例中,可選擇多個(gè)實(shí)體。在這些實(shí)施例中,超過一個(gè)實(shí)體可滿足被選作實(shí)體的準(zhǔn)則。例如,可選擇所有所標(biāo)識的實(shí)體,或可選擇具有高于閾值的分?jǐn)?shù)的實(shí)體。在這些實(shí)施例中,可為所選擇的每一實(shí)體提取實(shí)體信息。多個(gè)所選擇的實(shí)體可來自單個(gè)類別,或者也可標(biāo)識多個(gè)實(shí)體類別。例如,可選擇對應(yīng)于書的實(shí)體以及對應(yīng)于電影的實(shí)體??扇芜x地,可為所選擇的每一實(shí)體顯示實(shí)體卡。
實(shí)體卡提取
在標(biāo)識實(shí)體之后,可從作為搜索結(jié)果而返回的文檔中提取關(guān)于該實(shí)體的信息??墒褂盟崛〉男畔砩蓪?shí)體卡。實(shí)體卡允許關(guān)于意圖實(shí)體的信息被顯示成結(jié)果頁面的一部分,而無需用戶進(jìn)一步點(diǎn)擊或其他動作以尋找該信息。
在搜索結(jié)果中的至少一個(gè)與面向類別的站點(diǎn)對應(yīng)的各實(shí)施例中,可使用適當(dāng)?shù)念悇e模板來提取實(shí)體卡的信息。所提取的信息的類型可基于類別而變化??杀惶崛〉男畔⒌氖纠ㄎ恢眯畔?、聯(lián)系信息以及針對給定實(shí)體類型通常被請求的其他信息。例如,電影的實(shí)體卡可包括影片長度、導(dǎo)演姓名、以及影片是否為喜劇、戲劇或另一類型的電影。餐廳實(shí)體卡可包括食品類型以及價(jià)格范圍的一般指示。關(guān)于運(yùn)動隊(duì)的實(shí)體卡可包括下一場安排的比賽以及先前比賽的結(jié)果。
可包括在實(shí)體卡中的另一類型的信息是到其他類型的相關(guān)內(nèi)容的一個(gè)或多個(gè)鏈接。在某些實(shí)施例中,呈現(xiàn)在實(shí)體卡中的附加信息可對應(yīng)于與搜索查詢的次級意圖相關(guān)的信息。例如,與當(dāng)前影院放映的電影相關(guān)的搜索查詢有可能提供諸如電影評論和影院位置等結(jié)果。相反,影院中不再放映的電影將有可能具有與可購買該電影的副本的商店相關(guān)的結(jié)果。搜索結(jié)果的類型的這一差別可表示搜索查詢的次級意圖的差別??墒褂迷摯渭壱鈭D信息來包括與次級意圖相關(guān)的鏈接作為實(shí)體卡的一部分。包括在實(shí)體卡中的鏈接可與作為來自搜索引擎的結(jié)果的一部分的鏈接對應(yīng)或不對應(yīng)。附加鏈接的性質(zhì)可取決于實(shí)體而變化。對于餐廳,可將鏈接提供給處理預(yù)訂的在線站點(diǎn)。對于諸如電影或樂隊(duì)等體育或娛樂實(shí)體,可將鏈接提供給具有可獲得的門票的站點(diǎn)。還可將鏈接提供給已知為處理該類別的評論的一個(gè)或多個(gè)第三方評論站點(diǎn)。
基于搜索結(jié)果來形成實(shí)體卡的優(yōu)點(diǎn)中的一個(gè)是信息可被動態(tài)地生成。由此,搜索結(jié)果中所反映的信息的任何改變也可在實(shí)體卡中被自動地更新。然而,動態(tài)構(gòu)造的實(shí)體卡可與包含先前獲得的信息的靜態(tài)實(shí)體卡結(jié)合使用。在無法從搜索結(jié)果中提取所需信息的情況中,使用先前獲得的信息是有幫助的。
在又一實(shí)施例中,可標(biāo)識實(shí)體,并且可提供包括所存儲的信息的實(shí)體卡。在這一實(shí)施例中,可使用以上描述的實(shí)體標(biāo)識方法來標(biāo)識并選擇實(shí)體。隨后可使用對應(yīng)于所選擇的實(shí)體的所存儲的信息來形成實(shí)體卡。
基于實(shí)體檢測的信息放置
可使用與實(shí)體相關(guān)的搜索結(jié)果的意圖來修改對結(jié)果以及相關(guān)聯(lián)的信息的放置和/或顯示。在確定搜索查詢的意圖實(shí)體之后,結(jié)果可被查看以標(biāo)識與實(shí)體有關(guān)的任何結(jié)果。這些可包括對應(yīng)于面向類別的站點(diǎn)的結(jié)果、包括所標(biāo)識的實(shí)體的名稱的結(jié)果、或關(guān)于所標(biāo)識的實(shí)體沒有被成功地提取的附加信息。
實(shí)體的標(biāo)識可按各種方式來修改信息的放置。在一個(gè)實(shí)施例中,實(shí)體的標(biāo)識可導(dǎo)致對與實(shí)體相關(guān)的廣告的選擇??蓪⑺x擇的廣告放置在頁面上接近對應(yīng)于實(shí)體的搜索結(jié)果的位置。例如,如果對應(yīng)于所標(biāo)識的實(shí)體的排名最高的搜索結(jié)果是七至九,則可將廣告放置在接近示出前十個(gè)搜索結(jié)果的頁面的底部。類似地,如果生成了實(shí)體卡,則可將實(shí)體卡放置在與實(shí)體相關(guān)的排名最高的搜索結(jié)果附近、或接近與實(shí)體相關(guān)的排名第二高的結(jié)果。
實(shí)體檢測另一影響可以是將某些項(xiàng)從搜索結(jié)果的顯示中移除。例如,可將來自搜索結(jié)果的一個(gè)或多個(gè)文檔合并到實(shí)體卡??扇芜x地,可從所顯示的搜索結(jié)果列表中移除這些結(jié)果,因?yàn)樘娲乜山?jīng)由實(shí)體卡對這些文檔進(jìn)行訪問。修改結(jié)果顯示的另一方式可以是顯示響應(yīng)結(jié)果的一部分,諸如僅顯示與實(shí)體或與實(shí)體的類別相關(guān)的響應(yīng)結(jié)果。在這一實(shí)施例中,一旦進(jìn)行了類別和實(shí)體的分配,與類別和/或?qū)嶓w不匹配的結(jié)果可從結(jié)果顯示中被省略。相反,可顯示在附加用戶動作之后允許用戶訪問所排除的結(jié)果的對象。例如,可提供鏈接以指示更多與所標(biāo)識的實(shí)體不相關(guān)的結(jié)果是可用的。這一鏈接可通過用戶點(diǎn)進(jìn)或通過將指針或光標(biāo)移動到鏈接位置上方來訪問。另外,可提供具有附加結(jié)果的下拉菜單。
實(shí)體檢測的示例
在這一假想示例中,用戶首先將搜索項(xiàng)“教父”鍵入搜索引擎中。由這一搜索生成的結(jié)果包括來自與電影相關(guān)的至少一個(gè)面向類別的站點(diǎn)的多個(gè)結(jié)果。與零售銷售和/或視頻游戲相關(guān)的附加的面向類別的結(jié)果也可在搜索結(jié)果中。因?yàn)槊嫦蝾悇e的站點(diǎn)是排名最高的搜索結(jié)果,所以類別選擇是基于排名最高的面向類別的站點(diǎn)來作出的。結(jié)果,類別“電影”被選擇。
在選擇類別之后,使用面向類別的站點(diǎn)來檢測實(shí)體。這導(dǎo)致檢測到多個(gè)實(shí)體,因?yàn)殡娪啊敖谈浮焙碗娪啊敖谈竔i”兩者都被包括在搜索結(jié)果中?;谂c“教父ii”相比,“教父”在更多響應(yīng)結(jié)果中被檢測到的事實(shí),電影“教父”被選作適當(dāng)?shù)膶?shí)體。隨后將響應(yīng)結(jié)果連同對應(yīng)于該電影的實(shí)體卡一起呈現(xiàn)給用戶。實(shí)體卡是基于從響應(yīng)結(jié)果中列出的文檔中提取的信息來形成的。
在查看所呈現(xiàn)的結(jié)果之后,用戶將搜索項(xiàng)修改為“教父餐廳”。一組新的搜索結(jié)果被生成。在新結(jié)果中,評級最前的與一般評論站點(diǎn)對應(yīng),該一般評論站點(diǎn)可以是面向類別的但針對許多類別的。許多附加的潛在面向類別的站點(diǎn)被包括在前20個(gè)結(jié)果內(nèi),對應(yīng)于其他已知評論站點(diǎn)?;趤碜栽u論站點(diǎn)文檔的元標(biāo)簽,選擇了類別“餐廳”。
基于該類別選擇,可選擇適當(dāng)?shù)念悇e模板以分析這兩個(gè)面向類別的評論站點(diǎn)。還可使用開放格式類別模板來分析其他文檔。搜索結(jié)果包括位于美國周圍的若干不同餐廳、以及連鎖匹薩餐廳。然而,位置數(shù)據(jù)的唯一重復(fù)出現(xiàn)是針對加利福尼亞州的圣地亞哥。列出加利福尼亞州的圣地亞哥地址的文檔被分組在一起,并且該實(shí)體被選作對應(yīng)于搜索查詢的實(shí)體。注意,如果餐廳的每一實(shí)例僅出現(xiàn)了一次,則在某些實(shí)施例中沒有實(shí)體將被標(biāo)識,因?yàn)橐鈭D會不清楚。隨后可從對應(yīng)于實(shí)體的響應(yīng)結(jié)果中提取關(guān)于該實(shí)體的附加信息。
在簡要描述了本發(fā)明的各實(shí)施例的概覽后,現(xiàn)在描述適于執(zhí)行本發(fā)明的示例性操作環(huán)境。概括地參考附圖,并首先具體參考圖1,示出了用于實(shí)現(xiàn)本發(fā)明的各實(shí)施例的示例性操作環(huán)境,并將其概括地指定為計(jì)算設(shè)備100。計(jì)算設(shè)備100只是合適的計(jì)算環(huán)境的一個(gè)示例,并且不旨在對本發(fā)明的使用范圍或功能提出任何限制。也不應(yīng)該將計(jì)算設(shè)備100解釋為對所示出的任一組件或其組合有任何依賴性或要求。
本發(fā)明的各實(shí)施例可以在由計(jì)算機(jī)或諸如個(gè)人數(shù)據(jù)助理或其它手持式設(shè)備之類的其它機(jī)器執(zhí)行的計(jì)算機(jī)代碼或機(jī)器可使用指令(包括諸如程序模塊之類的計(jì)算機(jī)可執(zhí)行指令)的一般上下文中描述。一般而言,包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等的程序模塊指的是執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的代碼。本發(fā)明可以在各種系統(tǒng)配置中實(shí)施,這些系統(tǒng)配置包括手持式設(shè)備、消費(fèi)電子產(chǎn)品、通用計(jì)算機(jī)、更專用計(jì)算設(shè)備等等。本發(fā)明也可以在其中任務(wù)由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的分布式計(jì)算環(huán)境中實(shí)施。
繼續(xù)參考圖1,計(jì)算設(shè)備100包括直接或間接耦合以下設(shè)備的總線110:存儲器112、一個(gè)或多個(gè)處理器114、一個(gè)或多個(gè)呈現(xiàn)組件116、輸入/輸出(i/o)端口118、i/o組件120、和說明性電源122??偩€110可表示一條或多條總線(諸如地址總線、數(shù)據(jù)總線、或其組合)。雖然為了清楚起見利用線條示出了圖1的各框,但是實(shí)際上,各組件的輪廓并不是那樣清楚,并且比喻性地來說,線條更精確地將是灰色的和模糊的。例如,可以認(rèn)為諸如顯示設(shè)備的呈現(xiàn)組件是i/o組件。另外,許多處理器具有存儲器。發(fā)明人關(guān)于此點(diǎn)認(rèn)識到這是本領(lǐng)域的特性,并重申,圖1的圖示只是可以結(jié)合本發(fā)明的一個(gè)或多個(gè)實(shí)施例來使用的示例性計(jì)算設(shè)備的例示。諸如“工作站”、“服務(wù)器”、“膝上型計(jì)算機(jī)”、“手持式設(shè)備”等分類之間沒有區(qū)別,它們?nèi)慷急徽J(rèn)為是在圖1的范圍之內(nèi)的并且被稱為“計(jì)算設(shè)備”。
計(jì)算設(shè)備100通常包括各種計(jì)算機(jī)可讀介質(zhì)。計(jì)算機(jī)可讀介質(zhì)可以是可由計(jì)算設(shè)備100訪問的任何可用介質(zhì),而且包含易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。作為示例而非限制,計(jì)算機(jī)可讀介質(zhì)可以包括計(jì)算機(jī)存儲介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲介質(zhì)包括以用于存儲諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊之類的信息或其他數(shù)據(jù)的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。計(jì)算機(jī)存儲介質(zhì)包括,但不限于,隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、閃存或其它存儲器技術(shù)、cd-rom、數(shù)字多功能盤(dvd)或其它全息存儲器、磁帶盒、磁帶、磁盤存儲或其它磁性存儲設(shè)備、載波或可用于編碼所需信息且可以由計(jì)算設(shè)備100訪問的任何其它介質(zhì)。在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)可以是有形計(jì)算機(jī)可讀介質(zhì)。在另一實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)可以是非瞬態(tài)計(jì)算機(jī)可讀介質(zhì)。
存儲器112包括易失性和/或非易失性存儲器形式的計(jì)算機(jī)存儲介質(zhì)。存儲器可以是可移動的,不可移動的,或兩者的組合。示例性硬件設(shè)備包括固態(tài)存儲器、硬盤驅(qū)動器、光盤驅(qū)動器等等。計(jì)算設(shè)備100包括從諸如存儲器112或i/o組件120之類的各種實(shí)體讀取數(shù)據(jù)的一個(gè)或多個(gè)處理器。呈現(xiàn)組件116向用戶或其他設(shè)備呈現(xiàn)數(shù)據(jù)指示。示例性呈現(xiàn)組件包括顯示設(shè)備、揚(yáng)聲器、打印組件、振動組件等等。
i/o端口118可允許計(jì)算設(shè)備100在邏輯上耦合到包括i/o組件120在內(nèi)的其他設(shè)備,這些設(shè)備中的一些可以是內(nèi)置的。說明性組件包括話筒、操縱桿、游戲墊、碟形衛(wèi)星天線、掃描儀、打印機(jī)、無線設(shè)備等等。
現(xiàn)在轉(zhuǎn)向圖2,示出了例示根據(jù)本發(fā)明的一實(shí)施例的示例性計(jì)算系統(tǒng)200的框圖。本領(lǐng)域普通技術(shù)人員將理解和明白,圖2所示的計(jì)算系統(tǒng)200僅僅是一個(gè)合適的計(jì)算系統(tǒng)環(huán)境的示例,并且不旨在對本發(fā)明的各實(shí)施例的使用范圍或功能提出任何限制。也不應(yīng)該將計(jì)算系統(tǒng)200解釋為對其中所示出的任何單個(gè)組件或各組件的組合有任何依賴性或要求。此外,計(jì)算系統(tǒng)200可作為獨(dú)立產(chǎn)品、作為軟件開發(fā)環(huán)境的一部分或其任何組合來提供。
計(jì)算系統(tǒng)200包括經(jīng)由網(wǎng)絡(luò)204彼此通信的用戶設(shè)備206和搜索服務(wù)208。搜索服務(wù)208可包括搜索引擎212、實(shí)體標(biāo)識組件214、模板存儲216以及結(jié)果呈現(xiàn)組件218。搜索引擎212可以是用于基于搜索查詢來生成響應(yīng)結(jié)果的常規(guī)搜索引擎。實(shí)體標(biāo)識組件214可分析搜索結(jié)果以確定類別以及對應(yīng)于搜索查詢的實(shí)體。這一分析可部分地通過使用存儲在模板存儲216中的類別模板來執(zhí)行。結(jié)果呈現(xiàn)組件218可使用由實(shí)體標(biāo)識組件214提供的實(shí)體信息來修改響應(yīng)結(jié)果的顯示?;谒鶚?biāo)識的實(shí)體,可將基于實(shí)體的標(biāo)識的廣告包括在與關(guān)于所標(biāo)識的實(shí)體的結(jié)果對應(yīng)的位置。還可基于所標(biāo)識的實(shí)體來呈現(xiàn)實(shí)體卡。
圖3描繪了示出根據(jù)本發(fā)明的一實(shí)施例的方法的流程圖。在圖3所示的實(shí)施例中,獲得響應(yīng)于搜索查詢的多個(gè)結(jié)果310??蓮倪h(yuǎn)程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應(yīng)結(jié)果??蓪⒁粋€(gè)或多個(gè)響應(yīng)結(jié)果與對應(yīng)于一個(gè)或多個(gè)面向類別的站點(diǎn)的類別模板進(jìn)行匹配320。在各實(shí)施例中,響應(yīng)結(jié)果可都與一個(gè)類別模板匹配,或結(jié)果可與來自單個(gè)實(shí)體類別的各類別模板匹配,或結(jié)果可與來自多個(gè)實(shí)體類別的類別模板匹配?;谝粋€(gè)或多個(gè)匹配的響應(yīng)結(jié)果來選擇實(shí)體類別330。還基于響應(yīng)結(jié)果來標(biāo)識實(shí)體340。在各實(shí)施例中,可在選擇實(shí)體類別330之后標(biāo)識實(shí)體340。隨后檢索對應(yīng)于所標(biāo)識的實(shí)體的存儲的實(shí)體信息350。將所檢索的實(shí)體信息連同至少一個(gè)響應(yīng)結(jié)果合并到實(shí)體卡360。顯示不包括所合并的響應(yīng)結(jié)果的響應(yīng)結(jié)果列表370。實(shí)體卡也被顯示380。注意,在該實(shí)施例中,基于合并到所顯示的實(shí)體卡,所合并的響應(yīng)結(jié)果被排除在響應(yīng)結(jié)果列表以外。
圖4描繪了示出根據(jù)本發(fā)明的一實(shí)施例的方法的流程圖。在圖4所示的實(shí)施例中,獲得410響應(yīng)于搜索查詢的多個(gè)結(jié)果??蓮倪h(yuǎn)程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應(yīng)結(jié)果??蓪⒁粋€(gè)或多個(gè)響應(yīng)結(jié)果與對應(yīng)于一個(gè)或多個(gè)面向類別的站點(diǎn)的類別模板進(jìn)行匹配420。在各實(shí)施例中,響應(yīng)結(jié)果可都與一個(gè)類別模板匹配,或結(jié)果可與來自單個(gè)實(shí)體類別的各類別模板匹配,或結(jié)果可與來自多個(gè)實(shí)體類別的類別模板匹配?;谝粋€(gè)或多個(gè)匹配的響應(yīng)結(jié)果來選擇實(shí)體類別430?;陧憫?yīng)結(jié)果來標(biāo)識多個(gè)實(shí)體440。在各實(shí)施例中,可在選擇實(shí)體類別430之后標(biāo)識多個(gè)實(shí)體440。多個(gè)實(shí)體各自具有相同的主標(biāo)識。從響應(yīng)結(jié)果中提取多個(gè)實(shí)體中的每一個(gè)的次級信息450?;谒崛〉拇渭壭畔韺⑺鶚?biāo)識的實(shí)體分類到各實(shí)體組460。這一分類可允許是相同實(shí)體的所標(biāo)識的實(shí)體被分組在一起,而每一不同實(shí)體具有分開的組。隨后可選擇與搜索查詢對應(yīng)的實(shí)體組470。對于所選擇的實(shí)體組,可確定對應(yīng)于該實(shí)體組的響應(yīng)結(jié)果。將所選擇的實(shí)體組的次級信息合并到實(shí)體卡中490。顯示實(shí)體卡以及響應(yīng)結(jié)果的一部分495。響應(yīng)結(jié)果的一部分可排除被確定為對應(yīng)于實(shí)體組的響應(yīng)結(jié)果。
圖5描繪了示出根據(jù)本發(fā)明的一實(shí)施例的方法的流程圖。在圖5所示的實(shí)施例中,獲得響應(yīng)于搜索查詢的多個(gè)結(jié)果510??蓮倪h(yuǎn)程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應(yīng)結(jié)果??蓪⒁粋€(gè)或多個(gè)響應(yīng)結(jié)果與對應(yīng)于一個(gè)或多個(gè)面向類別的站點(diǎn)的類別模板進(jìn)行匹配520。在各實(shí)施例中,響應(yīng)結(jié)果可都與一個(gè)類別模板匹配,或結(jié)果可與來自單個(gè)實(shí)體類別的各類別模板匹配,或結(jié)果可與來自多個(gè)實(shí)體類別的類別模板匹配。基于一個(gè)或多個(gè)匹配的響應(yīng)結(jié)果來選擇實(shí)體類別530。還基于響應(yīng)結(jié)果來標(biāo)識實(shí)體540。在各實(shí)施例中,可在選擇實(shí)體類別530之后標(biāo)識實(shí)體540。隨后可從響應(yīng)結(jié)果中提取實(shí)體信息550??蓪⒏鲗?shí)體中的每一個(gè)實(shí)體的所提取的實(shí)體信息合并到實(shí)體卡560。可顯示多個(gè)實(shí)體卡570。
附加實(shí)施例
在一個(gè)實(shí)施例中,提供了存儲計(jì)算機(jī)可使用指令的一個(gè)或多個(gè)計(jì)算機(jī)存儲介質(zhì),當(dāng)這些指令由計(jì)算機(jī)設(shè)備執(zhí)行時(shí),執(zhí)行用于確定與搜索查詢相關(guān)聯(lián)的實(shí)體的方法。該方法包括獲得響應(yīng)于搜索查詢的多個(gè)結(jié)果。將多個(gè)響應(yīng)結(jié)果匹配到對應(yīng)于面向類別的站點(diǎn)的多個(gè)類別模板??苫谠摱鄠€(gè)所匹配的響應(yīng)結(jié)果來選擇實(shí)體類別?;诙鄠€(gè)所匹配的響應(yīng)結(jié)果來標(biāo)識實(shí)體。檢索關(guān)于所標(biāo)識的實(shí)體的存儲的實(shí)體信息。將所檢索的實(shí)體信息以及至少一個(gè)響應(yīng)結(jié)果合并到實(shí)體卡。在搜索結(jié)果列表中顯示響應(yīng)結(jié)果,該列表不包括該至少一個(gè)所合并的響應(yīng)結(jié)果。實(shí)體卡也被顯示。
在另一個(gè)實(shí)施例中,提供了存儲計(jì)算機(jī)可使用指令的一個(gè)或多個(gè)計(jì)算機(jī)存儲介質(zhì),當(dāng)這些指令由計(jì)算機(jī)設(shè)備執(zhí)行時(shí),執(zhí)行用于確定與搜索查詢相關(guān)聯(lián)的實(shí)體的方法。該方法包括獲得響應(yīng)于搜索查詢的多個(gè)結(jié)果。將一個(gè)或多個(gè)響應(yīng)結(jié)果匹配到對應(yīng)于面向類別的站點(diǎn)的至少一個(gè)類別模板?;谝粋€(gè)或多個(gè)匹配的響應(yīng)結(jié)果來選擇實(shí)體類別。標(biāo)識對應(yīng)于多個(gè)響應(yīng)結(jié)果中所選擇的實(shí)體類別的多個(gè)實(shí)體,所標(biāo)識的每一實(shí)體具有相同的主標(biāo)識。從多個(gè)響應(yīng)結(jié)果中提取對應(yīng)于所標(biāo)識的每一實(shí)體的次級標(biāo)識信息。基于所提取的次級標(biāo)識信息來將所標(biāo)識的實(shí)體分類成一個(gè)或多個(gè)實(shí)體組。將實(shí)體組選為與搜索查詢對應(yīng)。確定對應(yīng)于所選擇的實(shí)體組的一個(gè)或多個(gè)響應(yīng)結(jié)果。將所選擇的實(shí)體組的所提取的次級標(biāo)識信息合并到實(shí)體卡中。顯示實(shí)體卡以及響應(yīng)結(jié)果的一部分,響應(yīng)結(jié)果的該部分排除了所確定的對應(yīng)于所選擇的實(shí)體組的實(shí)體的一個(gè)或多個(gè)響應(yīng)結(jié)果。
在又一實(shí)施例中,提供了用于確定與搜索查詢相關(guān)聯(lián)的實(shí)體的方法。該方法包括獲得響應(yīng)于搜索查詢的多個(gè)結(jié)果。將一個(gè)或多個(gè)響應(yīng)結(jié)果匹配到對應(yīng)于面向類別的站點(diǎn)的至少一個(gè)類別模板。基于一個(gè)或多個(gè)匹配的響應(yīng)結(jié)果來選擇一個(gè)或多個(gè)實(shí)體類別。基于多個(gè)響應(yīng)結(jié)果來標(biāo)識多個(gè)實(shí)體。從多個(gè)響應(yīng)結(jié)果中提取對應(yīng)于多個(gè)所標(biāo)識的實(shí)體的實(shí)體信息。將多個(gè)所標(biāo)識的實(shí)體中的每一個(gè)的所提取的實(shí)體信息合并到多個(gè)實(shí)體卡中。顯示多個(gè)實(shí)體卡。
參考各具體實(shí)施例描述了本發(fā)明的各實(shí)施例,各具體實(shí)施例在所有方面都旨在是說明性的而非限制性的。不偏離本發(fā)明范圍的情況下,各替換實(shí)施例對于本發(fā)明所屬領(lǐng)域的技術(shù)人員將變得顯而易見。
從前面的描述可以看出,本發(fā)明很好地適用于實(shí)現(xiàn)上文所闡述的所有目的和目標(biāo),并且具有對于該結(jié)構(gòu)是顯而易見且固有的其他優(yōu)點(diǎn)。也可理解特定的特征和子組合是有用的,并且可以加以利用而無需參考其他特征和子組合。這由權(quán)利要求所構(gòu)想的,并在權(quán)利要求的范圍內(nèi)。