亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

將實體與類別相關(guān)聯(lián)的制作方法

文檔序號:6542094閱讀:193來源:國知局
將實體與類別相關(guān)聯(lián)的制作方法
【專利摘要】本發(fā)明涉及將實體與類別相關(guān)聯(lián)。除其它所公開的主題外,一種用于將實體與類別相關(guān)聯(lián)的計算機實現(xiàn)的方法包括為多個類別中的至少子集中的每一個確定概率值,所述概率值表示識別的實體屬于相應(yīng)類別的可能性并且使用關(guān)于實體的信息來確定。該方法包括使用概率值和基于訓(xùn)練數(shù)據(jù)的用于多個類別的規(guī)則集來為實體識別多個類別中的一個。
【專利說明】將實體與類別相關(guān)聯(lián)
[0001]分案說明
[0002]本申請屬于申請日為2009年9月14日并且申請?zhí)枮镹0.200980145280.2的中國專利申請的分案申請。
[0003]相關(guān)申請
[0004]本申請要求于2009年2月26日提交的、題為ASSOCIATING AN ENTITY WITH ACATEGORY (將實體與類別相關(guān)聯(lián))的美國申請序列號N0.12/393,361,以及于2008年9月15日提交的美國臨時專利申請序列號N0.61/097,026的優(yōu)先權(quán),特此通過引用合并所述美國申請的全部內(nèi)容。
【技術(shù)領(lǐng)域】
[0005]本文檔涉及信息處理。
【背景技術(shù)】
[0006]廣告主可以在多個不同平臺中的任何平臺上運行廣告活動,所述多個不同平臺包括因特網(wǎng)、電視、無線電廣播以及廣告牌。在廣告活動中所使用的廣告可以覆蓋產(chǎn)品和服務(wù)的范圍,并且可以定向特定受眾或更一般地定向更大人群。例如,運行網(wǎng)站的發(fā)布者可以向廣告主提供空間用于呈現(xiàn)廣告。呈現(xiàn)在網(wǎng)站上的廣告有時基于網(wǎng)站的內(nèi)容來選擇。

【發(fā)明內(nèi)容】

[0007]本發(fā)明涉及將實體與類別相關(guān)聯(lián)。
[0008]在第一方面中,一種用于將實體與類別相關(guān)聯(lián)的計算機實現(xiàn)的方法包括為多個類別中的至少子集中的每一個確定概率值,所述概率值表示識別的實體屬于相應(yīng)類別的可能性并且使用關(guān)于實體的信息來確定。該方法包括為實體記錄多個類別中的一個類別,類別使用概率值和用于多個類別的規(guī)則集來識別。
[0009]實施方式可以包括以下特征中的任何、全部特征或不包括以下特征。實體可以是被識別為加入在程序中的內(nèi)容提供者,在所述程序中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容,以及概率值可以使用與內(nèi)容提供者相關(guān)聯(lián)的至少一個關(guān)鍵詞以及與內(nèi)容提供者相關(guān)聯(lián)的至少一個財務(wù)值來確定。確定概率值可以包括將至少一個關(guān)鍵詞至少映射到多個類別的子集;用至少一個財務(wù)值對至少子集賦予權(quán)重,其中財務(wù)值已被分配給對應(yīng)關(guān)鍵詞;以及選擇預(yù)定數(shù)量的類別作為子集。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。規(guī)則集可以包括決策樹,其被配置用于通過處理包括在決策樹中的多個決策中的至少部分來選擇多個類別中的一個。該方法可以進一步包括使用訓(xùn)練數(shù)據(jù)來生成決策樹,其中訓(xùn)練數(shù)據(jù)包括實體到多個類別中的一個或多個的映射。生成決策樹可以進一步包括使用有關(guān)實體的財務(wù)數(shù)據(jù)對映射賦予權(quán)重。對映射賦予權(quán)重可以進一步包括基于與映射的至少子集相對應(yīng)的財務(wù)數(shù)據(jù)來過采樣(oversample)映射的所述子集。生成決策樹可以包括選擇用于決策樹的結(jié)構(gòu);確定決策樹的延伸區(qū)(extent),包括在選擇多個類別中的一個之前待進行的多個決策中的決策數(shù)量;以及確定待在多個決策中使用的閾值??梢缘蓻Q策樹。內(nèi)容提供者可以從事于廣告,以及多個類別可以包括內(nèi)容提供者待與之匹配的垂直元(vertical)。生成決策樹可以進一步包括識別垂直元中的至少一個,對于其概率值的確定具有將垂直元不恰當?shù)胤峙浣o內(nèi)容提供者的傾向;以及選擇閾值中的至少一個,使得降低所述傾向。該方法可以進一步包括基于已為實體識別的類別向用戶呈現(xiàn)信息。信息可以指示與類別相關(guān)聯(lián)的季節(jié)性。
[0010]在第二方面中,一種計算機系統(tǒng)包括第一分類器,其為多個類別中的至少子集中的每一個類別確定概率值,所述概率值表示識別的實體屬于相應(yīng)類別的可能性并且使用關(guān)于實體的信息來確定。該系統(tǒng)包括第二分類器,其使用概率值和用于多個類別的規(guī)則集來為實體識別多個類別中的一個類別。
[0011]實施方式可以包括以下特征中的任何、全部特征或不包括以下特征。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。第一分類器在確定概率值時可以考慮與實體有關(guān)的財務(wù)值。規(guī)則集可以包括決策樹,其被配置用于通過處理包括在決策樹中的多個決策中的至少部分來選擇多個類別中的一個,以及該計算機系統(tǒng)可以進一步包括使用訓(xùn)練數(shù)據(jù)來生成決策樹的規(guī)則組件,其中訓(xùn)練數(shù)據(jù)包括實體到多個類別中的一個或多個的映射。規(guī)則組件可以使用有關(guān)實體的財務(wù)數(shù)據(jù)對映射賦予權(quán)重,包括基于與映射的至少子集相對應(yīng)的財務(wù)數(shù)據(jù)來過采樣映射的所述子集。該系統(tǒng)可以進一步包括前端組件,其基于第二分類器已為實體識別了類別向用戶呈現(xiàn)信息。
[0012]在第三方面中,一種用于將內(nèi)容提供者與類別相關(guān)聯(lián)的計算機實現(xiàn)的方法包括將內(nèi)容提供者識別為加入在程序中,在所述程序中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容。該方法進一步包括接收有關(guān)內(nèi)容提供者的至少一個關(guān)鍵詞和有關(guān)關(guān)鍵詞的至少一個財務(wù)值。該方法進一步包括接收多個類別,其中內(nèi)容提供者待與類別中的至少一個相關(guān)聯(lián)。該方法進一步包括基于類別的名稱將至少一個關(guān)鍵詞映射到類別的子集。該方法進一步包括將類別的至少子集中的每一個與概率值相關(guān)聯(lián),所述概率值表示內(nèi)容提供者應(yīng)當與相應(yīng)類別相關(guān)聯(lián)的可能性,所述概率值使用財務(wù)值被賦予權(quán)重。該方法進一步包括接收所生成的有關(guān)多個類別的規(guī)則集,所述規(guī)則集被配置用于在識別類別中的一個時使用。該方法進一步包括使用規(guī)則集來處理有關(guān)內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括:(i)類別的至少子集中的每一個的概率值;(ii)有關(guān)內(nèi)容提供者的財務(wù)數(shù)據(jù)內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域。該方法進一步包括基于對數(shù)據(jù)的處理為內(nèi)容提供者選擇多個類別中的一個。該方法進一步包括將內(nèi)容提供者與所選擇的類別相關(guān)聯(lián)。
[0013]實施方式可以提供以下優(yōu)勢中的任何、全部優(yōu)勢或不提供以下優(yōu)勢。可以提供分成類別的改進的分類?;诟怕实姆诸惪梢员毁x予收益權(quán)重,以及可以由先前使用訓(xùn)練數(shù)據(jù)來訓(xùn)練的基于規(guī)則的分類進行進一步特定化??梢栽黾臃诸惖撵`活性。
[0014]在附圖和下面的描述中闡述了一個或多個實施例的細節(jié)。其它特征和優(yōu)勢從描述和附圖、以及從權(quán)利要求將是顯而易見的。
【專利附圖】

【附圖說明】
[0015]圖1示出了可以為實體識別類別的示例系統(tǒng)。
[0016]圖2示出了可以為實體識別類別的另一個示例系統(tǒng)。
[0017]圖3示出了可以基于已為實體識別的類別來呈現(xiàn)信息的示例用戶界面。[0018]圖4示出了可以執(zhí)行來為實體識別類別的示例方法。
[0019]圖5是可以結(jié)合在本文檔中描述的計算機實現(xiàn)的方法使用的計算系統(tǒng)的框圖。
[0020]各附圖中相同的參考標記指示相同的元素。
【具體實施方式】
[0021]圖1示出了可以為實體識別類別的示例系統(tǒng)100。多個實體可以在系統(tǒng)100中操作,例如實體可以是以下形式的:諸如廣告主的內(nèi)容提供者和諸如網(wǎng)頁或其它內(nèi)容的所有者的內(nèi)容發(fā)布者。在一些實施方式中,內(nèi)容提供者可以操作一個或多個內(nèi)容提供者系統(tǒng)102,以及內(nèi)容發(fā)布者可以操作一個或多個內(nèi)容發(fā)布者系統(tǒng)104??梢詫⑷魏畏N類的計算機設(shè)備、電子設(shè)備或系統(tǒng)包括在系統(tǒng)102和104中,諸如服務(wù)器計算機或個人計算機。系統(tǒng)100中的組件可以使用諸如本地計算機網(wǎng)絡(luò)或因特網(wǎng)的任何種類的網(wǎng)絡(luò)106來相互通信。
[0022]在一些實施方式中,系統(tǒng)100中的一個或多個實體可以參與事務(wù),在所述事務(wù)中內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容。例如,諸如廣告的內(nèi)容可以通過網(wǎng)絡(luò)106從內(nèi)容提供者系統(tǒng)102分發(fā)用于以內(nèi)容發(fā)布者系統(tǒng)104中的一個或多個的名義發(fā)布。在一些實施方式中,內(nèi)容可以由諸如內(nèi)容分發(fā)者系統(tǒng)108 (例如,廣告服務(wù)器)的第三方暫時或永久保持,并且可以從系統(tǒng)108分發(fā)用于發(fā)布。例如,當用戶系統(tǒng)110向發(fā)布者系統(tǒng)104請求媒體內(nèi)容(例如,網(wǎng)頁)時,內(nèi)容分發(fā)者系統(tǒng)108可以將相關(guān)聯(lián)的內(nèi)容(例如,廣告)提供給用戶系統(tǒng)110用于連同所請求的內(nèi)容一起呈現(xiàn)。在下面將描述其中諸如系統(tǒng)100中的內(nèi)容提供者和/或內(nèi)容發(fā)布者的一個或多個實體可以使用類別目錄來進行分類的示例。這樣的分類對涉及分類實體的任何人,例如管理在實體間分發(fā)內(nèi)容的個人,可以是有用的。
[0023]系統(tǒng)100可以包括一個或多個分類器。在一些實施方式中,系統(tǒng)100包括概率分類器112和基于規(guī)則的分類器114。這些和其它組件的名稱在此被寬泛使用,而不是狹窄使用;例如,概率分類器112在其操作中可以使用一個或多個規(guī)則,以及基于規(guī)則的分類器114在分類過程中可以確定或使用一個或多個概率。分類器112和114可以以任何形式,諸如使用軟件、硬件、固件或以上組合,來實現(xiàn)。
[0024]在一些實施方式中,可以使用分類器112和114,以使諸如操作系統(tǒng)102的內(nèi)容提供者的所選擇的實體與諸如來自垂直元目錄116的垂直元的一個或多個類別相匹配。垂直元可以是指一個或多個業(yè)務(wù)分類,諸如有時在市場分析中使用來表示在共同領(lǐng)域中交易的企業(yè)和客戶的歸類詞語(例如,消費電子垂直元或化妝品垂直元)。可以使用其它分類。
[0025]概率分類器112可以為諸如內(nèi)容提供者的實體確定針對目錄116中的垂直元中的至少一個的概率值。概率可以表示內(nèi)容提供者屬于對應(yīng)垂直元的可能性。例如,概率分類器可以確定實體“Example Company, Inc.(示例公司)”應(yīng)當被分類為屬于“抵押”垂直元的概率。概率可以使用有關(guān)實體的信息來確定。在一些實施方式中,概率分類器112可以確定多個概率值,諸如與目錄116中的垂直元的至少子集中的每一個相對應(yīng)的值。
[0026]基于規(guī)則的分類器114可以為實體識別類別,諸如目錄116中的垂直元中的一個。在一些實施方式中,基于規(guī)則的分類器114可以使用由概率分類器112確定的一個或多個概率和諸如決策樹118的規(guī)則集。例如,決策樹118可以包括多個決策,以及可以被配置用于通過處理決策中的至少部分來選擇目錄116中的多個垂直元中的一個。在一些實施方式中,系統(tǒng)100可以包括基于訓(xùn)練數(shù)據(jù)122來生成決策樹118或其它規(guī)則的規(guī)則組件120。在一些實施方式中,訓(xùn)練數(shù)據(jù)122可以包括實體到類別中的相應(yīng)類別一諸如目錄116中的垂直元一的映射。
[0027]可以以多種方式中的任何方式生成諸如決策樹118的規(guī)則集。在一些實施方式中,可以定義樹模型,并且然后可以基于訓(xùn)練數(shù)據(jù)122來生成樹。例如,可以選擇樹結(jié)構(gòu),諸如以定義樹應(yīng)當包括多級二元決策。作為另一個示例,可以定義樹的延伸區(qū)(例如,決策樹何時應(yīng)當結(jié)束),諸如在選擇多個類別中的一個之前待進行的多個決策中的決策數(shù)量。在一些實施方式中,樹118中的一個或多個決策可以使用閾值。例如,可以將概率(例如,由概率分類器112確定的概率)與閾值進行比較??梢允褂萌魏畏N類的迭代過程來生成決策樹118的一個或多個方面。例如,樹118的結(jié)構(gòu)可以在初始迭代中選擇,并且針對諸如訓(xùn)練數(shù)據(jù)122的代表性數(shù)據(jù)測試,以及這樣的測試的結(jié)果可以用于在另一個迭代中生成樹118的另一個結(jié)構(gòu)。作為另一個示例,可以在初始迭代中確定閾值的第一集合,以及可以在一個或多個額外迭代中通過反饋過程對值中的至少一個進行精化。
[0028]基于規(guī)則的分類器114在系統(tǒng)100中可以用于一個或多個用途。在一些實施方式中,概率分類器112可能具有在一個或多個方面將實體錯誤分類的傾向。例如,分類器114可能頻繁為實際上未參與娛樂業(yè)或僅僅參與較小程度的實體選擇“娛樂”垂直元。在概率確定中這樣的特性可以是概率分類器112如何被配置的人為結(jié)果,以及可以取決于多個因素,其可以使解決該問題困難或不現(xiàn)實。在一些實施方式中,可以將基于規(guī)則的分類器114與概率分類器112結(jié)合使用。例如,可以選擇由基于規(guī)則的分類器114使用的規(guī)則集(例如,決策樹118)中的閾值中的至少一個,以降低或消除所討論的關(guān)于類別的傾向。
[0029]可以為給定實體,諸如為運行系統(tǒng)102的內(nèi)容提供者,選擇至少一個類別(例如,目錄116中的垂直元中的一個)。這樣的選擇可以用于一個或多個用途,諸如用來向用戶輸出相關(guān)信息。在一些實施方式中,系統(tǒng)100可以包括可以使用一個或多個類別選擇的前端組件124。例如,前端組件124可以呈現(xiàn)與所選擇的類別有關(guān)的信息作為表征實體的方式。
[0030]圖2示出了可以為實體識別類別的另一個示例系統(tǒng)200。在系統(tǒng)200中,可以識別關(guān)于實體的一個或多個信息部分,諸如與內(nèi)容提供者相關(guān)聯(lián)的關(guān)鍵詞202。在一些實施方式中,作為參加內(nèi)容分發(fā)程序的一部分,內(nèi)容提供者可以自識別關(guān)鍵詞。例如,廣告主可以向內(nèi)容分發(fā)者系統(tǒng)108 (圖1)登記對一個或多個關(guān)鍵詞的出價,使得廣告主的廣告可以被考慮用于在與關(guān)鍵詞有關(guān)的語境下發(fā)布??梢宰R別有關(guān)實體的財務(wù)信息204。例如,這可以包括收益數(shù)據(jù),諸如有關(guān)廣告主花費在特定關(guān)鍵詞上的金額的信息。
[0031]系統(tǒng)200可以包括基礎(chǔ)分類器206。在一些實施方式中,基礎(chǔ)分類器可以被配置為使用諸如垂直元目錄116 (圖1)的類別集來對諸如內(nèi)容提供者或內(nèi)容分發(fā)活動的實體進行分類。在一些實施方式中,基礎(chǔ)分類器206可以將關(guān)鍵詞202映射到部分或全部垂直元,并且選擇預(yù)定數(shù)量的垂直元。例如,諸如通過選擇具有最大權(quán)重的那些垂直元,垂直元中的三個可以被選擇為最能代表實體。
[0032]基礎(chǔ)分類器206可以將用于特定實體的多個關(guān)鍵詞映射到相應(yīng)垂直元??梢院喜殛P(guān)鍵詞選擇的相應(yīng)垂直元(例如,可以求其相應(yīng)概率的平均值)以形成實體的單一歸類。在一些實施方式中,可以基于財務(wù)數(shù)據(jù)204,諸如基于花費在各個關(guān)鍵詞上的金額,來對為實體選擇的垂直元賦予權(quán)重。例如,在計算分類時,可以給予關(guān)于對內(nèi)容提供者的或分發(fā)活動的花費的相對較大部分負責(zé)的關(guān)鍵詞的垂直元相對較大的權(quán)重。在一些實施方式中,基礎(chǔ)分類器206可以包括概率分類器112 (圖1)。在一些實施方式中,基礎(chǔ)分類器206的輸出可以包括一個或多個賦予權(quán)重的垂直元208,諸如與權(quán)重(例如在O和I之間的數(shù)字)相關(guān)聯(lián)的至少一個分類器詞語(例如,垂直元名稱)。
[0033]系統(tǒng)200可以包括賦予花費權(quán)重規(guī)則組件210。在一些實施方式中,組件210可以提供用于定義若干類別之間,諸如在三個賦予收益權(quán)重的垂直元之間,的主類別的策略。例如,關(guān)于系統(tǒng)200中的其它組件,組件210可以作為離線程序運行,諸如以由Mathworks公司開發(fā)的MATLAB環(huán)境中的程序的形式。
[0034]賦予花費權(quán)重規(guī)則組件210可以被配置用于多維特征空間上的多類分類。在一些實施方式中,η維特征可以用于映射到任何m維。例如,垂直元目錄116可以包括30個垂直元。作為另一個示例,可以識別額外特征,包括但不限于實體的季度花費、實體的總花費、用于實體的關(guān)鍵詞的數(shù)量以及實體的促銷國家。因此,34維特征空間(S卩,n=34)可以用于成為任何30維(S卩,m=30)的分類。在一些實施方式中,特征維中的一個或多個,諸如實體國家,可以是分類的。例如,可以給預(yù)定數(shù)量的最高位國家(例如,九個國家)每一個分配一個類,以及可以將剩余國家聚組在公有類中。在一些實施方式中,特征維中的一個或多個可以是離散或連續(xù)變量。例如,關(guān)鍵詞計數(shù)可以是離散變量和/或總花費可以是連續(xù)變量。
[0035]在一些實施方式中,賦予花費權(quán)重規(guī)則組件210可以包括基于規(guī)則的分類器(圖1)。例如,組件210可以使用部分或全部訓(xùn)練數(shù)據(jù)122來定義適當策略。在一些實施方式中,賦予花費權(quán)重規(guī)則組件210可以在新的或經(jīng)修改的訓(xùn)練數(shù)據(jù)集變得可用時,諸如在人類分類者將一個或多個實體映射到了垂直元目錄116時,被觸發(fā)。
[0036]賦予花費權(quán)重規(guī)則組件210可以輸出可以在為實體選擇類別時使用的規(guī)則集212。在一些實施方式中,該規(guī)則集可以包括決策樹。例如,組件210可以使決策樹分裂并且生長以優(yōu)化給定實體是特定類別的成員的已確定概率。作為另一個示例,訓(xùn)練數(shù)據(jù)122(圖1)可以用于修剪決策樹,諸如以避免過擬合。
[0037]在一些實施方式中,可以使用諸如“分類回歸樹”(CART)的特征。在這樣的實施方式中,賦予花費權(quán)重規(guī)則組件210可以包括或基于CART分類器。例如,可以用定制的修剪程序(例如,停止規(guī)則)構(gòu)建CART模型。作為另一個示例,可以使用十折交叉驗證(10-foldcross validation)來計算CART模型的誤差估計。
[0038]在一些實施方式中,規(guī)則集212包括一維規(guī)則的分類決策樹,其用于將賦予收益權(quán)重的垂直元(例如,三個)集映射到用于實體的一個垂直元中。例如,這可以在系統(tǒng)200中提供更大歸納能力的益處,諸如以允許從基礎(chǔ)分類器206修剪“壞的垂直元”和/或其它系
統(tǒng)誤差。
[0039]在生成規(guī)則集212時,可以考慮財務(wù)數(shù)據(jù)。在一些實施方式中,可以在構(gòu)建CART模型時復(fù)制數(shù)據(jù),諸如以使復(fù)制量與花費金額成比例。例如,可能過采樣與相對較高的總花費和/或季度花費水平相對應(yīng)的數(shù)據(jù)。作為另一個示例,可能對與相對較低的總花費和/或季度花費水平相對應(yīng)的數(shù)據(jù)采樣不足。在一些實施方式中,基于收益的額外訓(xùn)練數(shù)據(jù)點可能易于使最終輸出(例如,對一個或多個類別的選擇)偏向于較高花費實體(例如,內(nèi)容提供者),并且提高有關(guān)這些實體的精確性。
[0040]下面在附錄I中展現(xiàn)了規(guī)則集212—在此為決策樹一的示例。
[0041]系統(tǒng)100可以包括主垂直元分類器214。在一些實施方式中,分類器可以將賦予收益權(quán)重的類別集(例如,賦予權(quán)重的垂直元208)靜態(tài)地映射到用于實體的單個主垂直元中。例如,分類器214可以使用規(guī)則集212 (諸如通過加載由組件210生成的CART分類樹)來從基礎(chǔ)分類器206選擇賦予權(quán)重的類別中的一個。
[0042]圖3示出了可以基于已為實體識別的類別來呈現(xiàn)信息的示例用戶界面300。在一些實施方式中,前端組件124(圖1)可以諸如向系統(tǒng)100中的動作者生成用戶界面300。在一些實施方式中,用戶界面300可以用于管理客戶關(guān)系,諸如用于監(jiān)視和/或跟蹤諸如廣告活動的內(nèi)容分發(fā)程序中的參與者。用戶界面300可以包括“名稱”區(qū)域302,其中可以呈現(xiàn)一個或多個實體的標識符,諸如廣告主和/或另一個內(nèi)容提供者的名稱。用戶界面300可以包括“垂直元”區(qū)域304,其中可以指示為實體識別的類別,諸如來自目錄116的垂直元。用戶界面300可以包括呈現(xiàn)與分配給實體的類別有關(guān)的信息的一個或多個區(qū)域,諸如“季節(jié)性”區(qū)域306。例如,從事特定垂直元的公司(例如,稅務(wù)籌劃顧問或鮮花零售商)在其業(yè)務(wù)和/或其它活動中可能具有季節(jié)性發(fā)生波動。在一些實施方式中,可以向用戶輸出這樣的季節(jié)性(例如,“該實體的業(yè)務(wù)在情人節(jié)附近可能達到最高峰”的信息)。在一些實施方式中,可以在沒有明確指示所選擇的垂直元的情況下輸出相關(guān)信息(例如,季節(jié)性區(qū)域306)。用戶界面300可以包括“搜索”控件308,通過其用戶可以使用一個或多個標準來搜索實體,以及可以通過將信息填充在區(qū)域302-306中的一個或多個中來呈現(xiàn)這樣的搜索的結(jié)果。用戶界面300可以包括“聯(lián)系”控件310,通過其用戶可以發(fā)起與一個或多個實體的聯(lián)系,諸如經(jīng)由電子郵件或電話。例如,當看見了季節(jié)性區(qū)域306中的信息時,諸如銷售代表的用戶可以聯(lián)系實體以確保其有關(guān)旺季的需求得到滿足。
[0043]圖4示出了可以執(zhí)行來為實體識別類別的示例方法400。方法400可以由例如系統(tǒng)100和/或200中、執(zhí)行存儲在計算機可讀介質(zhì)中的指令的處理器來執(zhí)行。在一些實施方式中,可以以另一種順序執(zhí)行步驟中的一個或多個;作為另一個示例,可以執(zhí)行更多或更少步驟。步驟410包括為多個類別中的至少子集中的每一個確定概率值。概率值可以表示識別的實體屬于相應(yīng)類別的可能性并且可以使用關(guān)于實體的信息來確定。例如,概率分類器112和/或基礎(chǔ)分類器可以為諸如內(nèi)容提供者或內(nèi)容發(fā)布者的特定實體生成賦予權(quán)重的垂直元208。子集可以包括一個或多個類別。
[0044]步驟420包括為實體記錄多個類別中的一個,類別使用概率值和基于例如訓(xùn)練數(shù)據(jù)的用于多個類別的規(guī)則集來識別。例如,基于規(guī)則的分類器114和/或主垂直元分類器214可以從目錄116選擇一個垂直元來與特定實體相關(guān)聯(lián)。
[0045]步驟430包括基于為實體對類別的識別來呈現(xiàn)信息。例如,前端組件124可以生成可以呈現(xiàn)季節(jié)性區(qū)域306的用戶界面300。
[0046]圖5是通用計算機系統(tǒng)500的不意圖。根據(jù)一個實施方式,系統(tǒng)500可以用于結(jié)合先前描述的任何計算機實現(xiàn)的方法描述的操作。系統(tǒng)500包括處理器510、存儲器520、存儲設(shè)備530和輸入/輸出設(shè)備540。組件510、520、530和540中的每一個使用系統(tǒng)總線550互連。處理器510能夠處理用于在系統(tǒng)500內(nèi)執(zhí)行的指令。在一個實施方式中,處理器510是單線程處理器。在另一個實施方式中,處理器510是多線程處理器。處理器510能夠處理存儲在存儲器520中或存儲設(shè)備530上的指令以在輸入/輸出設(shè)備540上顯示用于用戶界面的圖形信息。
[0047]存儲器520存儲系統(tǒng)500內(nèi)的信息。在一個實施方式中,存儲器520是計算機可讀介質(zhì)。在一個實施方式中,存儲器520是易失性存儲器單元。在另一個實施方式中,存儲器520是非易失性存儲器單元。
[0048]存儲設(shè)備530能夠為系統(tǒng)500提供海量存儲。在一個實施方式中,存儲設(shè)備530是計算機可讀介質(zhì)。在各種不同的實施方式中,存儲設(shè)備530可以是軟盤設(shè)備、硬盤設(shè)備、光盤設(shè)備或帶設(shè)備。
[0049]輸入/輸出設(shè)備540為系統(tǒng)500提供輸入/輸出操作。在一個實施方式中,輸入/輸出設(shè)備540包括鍵盤和/或指不設(shè)備。在另一個實施方式中,輸入/輸出設(shè)備540包括用于顯示圖形用戶界面的顯示單元。
[0050]可以在數(shù)字電子電路中,或者在計算機硬件、固件、軟件或者在它們的組合中實現(xiàn)所描述的特征??梢栽谟行蔚匕ㄔ谛畔⑤d體中一例如,在機器可讀存儲設(shè)備或傳播信號中一的、用于可編程處理器執(zhí)行的計算機程序產(chǎn)品中實現(xiàn)裝置;以及可以由執(zhí)行指令程序來執(zhí)行所描述的實施方式的功能的可編程處理器通過操作輸入數(shù)據(jù)并且生成輸出來執(zhí)行方法步驟??梢栽诎ㄖ辽僖粋€可編程處理器的可編程系統(tǒng)上可執(zhí)行的一個或多個計算機程序中有利地實現(xiàn)所描述的特征,所述至少一個可編程處理器被耦接以從數(shù)據(jù)存儲系統(tǒng)、至少一個輸入設(shè)備和至少一個輸出設(shè)備接收數(shù)據(jù)和指令以及將數(shù)據(jù)和指令傳送到數(shù)據(jù)存儲系統(tǒng)、至少一個輸入設(shè)備和至少一個輸出設(shè)備。計算機程序是可以在計算機中直接或間接使用來執(zhí)行某一動作或引起某一結(jié)果的指令集。計算機程序可以以任何形式的編程語言編寫,所述編程語言包括編譯或解釋語言,并且其可以以任何形式部署,包括作為獨立程序或作為模塊、組件、子程序或適于在計算環(huán)境中使用的其它單元。
[0051]用于執(zhí)行指令程序的適當處理器包括例如通用和專用微處理器兩者,以及任何種類的計算機的唯一處理器或多個處理器中的一個。通常,處理器將從只讀存儲器或隨機存取存儲器或兩者接收指令和數(shù)據(jù)。計算機的主要元件是用于執(zhí)行指令的處理器和用于存儲指令和數(shù)據(jù)的一個或多個存儲器。通常,計算機還包括用于存儲數(shù)據(jù)文件的一個或多個海量存儲設(shè)備,或可操作地耦接以與所述一個或多個海量存儲設(shè)備通信;這樣的設(shè)備包括磁盤,諸如內(nèi)部硬盤和可移動盤;磁光盤;以及光盤。適于有形地包括計算機程序指令和數(shù)據(jù)的存儲設(shè)備包括所有形式的非易失性存儲器,包括例如:半導(dǎo)體存儲器設(shè)備,例如EPR0M、EEPROM和閃存設(shè)備;磁盤,諸如內(nèi)部硬盤和可移動盤;磁光盤;以及CD-ROM和DVD-ROM盤。處理器和存儲器可以由ASIC (專用集成電路)補充,或合并入ASIC。
[0052]為了提供與用戶的交互,可以在具有下述的計算機上實現(xiàn)特征:用于向用戶顯示信息的顯示設(shè)備,例如CRT (陰極射線管)或LCD (液晶顯示)監(jiān)視器,以及用戶通過其可以向計算機提供輸入的鍵盤和指示設(shè)備,例如鼠標或跟蹤球。
[0053]可以在包括諸如數(shù)據(jù)服務(wù)器的后端組件、或者包括諸如應(yīng)用服務(wù)器或因特網(wǎng)服務(wù)器的中間件組件、或者包括諸如具有圖形用戶界面或因特網(wǎng)瀏覽器的客戶端計算機的前端組件、或者它們的任何組合的計算機系統(tǒng)中實現(xiàn)特征。系統(tǒng)的組件可以通過諸如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字數(shù)據(jù)通信連接。通信網(wǎng)絡(luò)的示例例如包括LAN、WAN以及形成因特網(wǎng)的計算機和網(wǎng)絡(luò)。
[0054]計算機系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠離并且典型地通過諸如所描述的網(wǎng)絡(luò)之一的網(wǎng)絡(luò)交互??蛻舳撕头?wù)器的關(guān)系依靠在各個計算機上運行并且彼此具有客戶端-服務(wù)器關(guān)系的計算機程序產(chǎn)生。[0055]已經(jīng)描述了多個實施例。然而,將理解的是,在不背離本公開的精神和范圍的情況下,可以進行各種修改。因此,其它實施例在權(quán)利要求的范圍內(nèi)。
[0056]附錄I
[0057]CART模型描述和輸出
[0058]自變量
[0059]xl:國家(例如,根據(jù)國家代碼)
[0060]x2:關(guān)鍵詞計數(shù)
[0061]x3:總花費(USD)
[0062]x4:季度花費(USD)
[0063]x5?x34:從最小到最大排序的用于垂直元的收益權(quán)重(例如,分類器112或206的輸出)
[0064]Id x5 x6 x7 x8 x9 xlO xll xl2 xl3 xl4
[0065]垂直2 3 4 5 7 8 11 12 13 14
[0066]元
[0067]Id xl5 xl6 xl7 xl8 xl9 x20 x21 x22 x23 x24
[0068]垂直15 16 18 19 20 29 44 45 47 52
[0069]元
[0070]Id x25 x26 x27 x28 x29 x30 x31 x32 x33 x34
[0071]垂直66 67 71 174 285 299 397 439 533 570
[0072]元
[0073]CART 輸出
[0074]用于分類的決策樹
[0075]Iif x26<0.156561then node2else node3
[0076]2if x9〈0.370092then node4else node5
[0077]3if x26<0.657022then node6else node7
[0078]4if xl7<0.495845then node8else node9
[0079]5if x9<0.823663then nodelOelse nodell
[0080]6if xl5<0.0685697then nodel2else nodel3
[0081]7if x21<0.0848807then nodel4else nodel5
[0082]8if x8〈0.521697then nodel6else nodel7
[0083]9if xl7<0.736217then nodel8else nodel9
[0084]IOif x23<0.498586then node20else node21
[0085]llclass=7
[0086]12if x20<0.257736then node22else node23
[0087]13if x20<0.0258419then node24else node25
[0088]14class=67
[0089]15if x2<7168.5then node26else node27
[0090]16if x24<0.354713then node28else node29
[0091]17if x8<0.716763then node30else node31[0092]18if x2<80663then node32else node33
[0093]19if xl7<0.925121then node34else node35
[0094]20if xl8<0.213272then node36else node37
[0095]21class=47
[0096]22if xl2<0.335248then node38else node39
[0097]23if xlin{1346}then node40else node41
[0098]24if x29<0.230442then node42else node43
[0099]25class=29
[0100]26class=44
[0101]27class=52
[0102]28if xll<0.331887then node44else node45
[0103]29class=52
[0104]30if x2<7057.5then node46else node47
[0105]31class=5
[0106]32if x7<0.0829784then node48else node49
[0107]33if xl=lthen node50else node51
[0108]34if x2<77348then node52else node53
[0109]35class=18
[0110]36if x20<0.371657then node54else node55
[0111]37if x3<3.85033e+06then node56else node57
[0112]38if xl9<0.330368then node58else node59
[0113]39class=12
[0114]40class=29
[0115]41class=67
[0116]42class=67
[0117]43class=285
[0118]44if x23<0.57222then node60else node61
[0119]45if x7<0.114347then node62else node63
[0120]46if xl3<0.330393then node64else node65
[0121]47if x7<0.255785then node66else node67
[0122]48if xlin{1237810}then node68else node69
[0123]49class=4
[0124]50class=ll
[0125]51class=285
[0126]52class=18
[0127]53class=20
[0128]54class=7
[0129]55class=29
[0130]56class=7[0131]57class=19
[0132]58if x21<0.203319then node70else node71
[0133]59class=20
[0134]60if x3<4.08266e+07then node72else node73
[0135]61if x23<0.730036then node74else node75
[0136]62if xll<0.537014then node76else node77
[0137]63if xlin{12810}then node78else node79
[0138]64if x24<0.10869then node80else node81
[0139]65if x2〈1310then node82else node83
[0140]66if xlin{1257}then node84else node85
[0141]67class=4
[0142]68class=18
[0143]69if x2<39894then node86else node87
[0144]70if xl3<0.193039then node88else node89
[0145]71class=44
[0146]72if x22<0.442255then node90else node91
[0147]73class=5
[0148]74if xl2<0.179846then node92else node93
[0149]75class=47
[0150]76if x27<0.189842then node94else node95
[0151]77class=ll
[0152]78class=4
[0153]79class=ll
[0154]80class=5
[0155]81if xlin{136810}then node96else node97
[0156]82class=13
[0157]83class=5
[0158]84if x32<0.117921then node98else node99
[0159]85class=5
[0160]86if x21<0.268462then nodelOOelse nodelOl
[0161]87class=52
[0162]88if xl7<0.209712then nodel02else nodel03
[0163]89class=13
[0164]90if x7<0.35475then nodel04else nodel05
[0165]91if x22<0.711517then nodel06else nodel07
[0166]92if x2<10.5then nodel08else nodel09
[0167]93class=12
[0168]94if x4〈368742then nodellOelse nodelll
[0169]95class=71[0170]96class=5
[0171]97class=52
[0172]98class=19
[0173]99class=18
[0174]100class=18
[0175]101class=44
[0176]102if x23<0.262412then nodell2else nodell3
[0177]103class=18
[0178]104if xl8<0.513483then nodell4else nodell5
[0179]105class=4
[0180]106if x21<0.210351then nodell6else nodell7
[0181]107class=45
[0182]108class=18
[0183]109class=47
[0184]IlOif xl2〈0.433287then nodell8else nodell9
[0185]Illclass=Il
[0186]112if x7〈0.569093then nodel20else nodel21
[0187]113class=47
[0188]114if x20<0.473106then nodel22else nodel23
[0189]115if x22<0.158422then nodel24else nodel25
[0190]116if x6〈0.0777122then nodel26else nodel27
[0191]117if x21〈0.470751then nodel28else nodel29
[0192]118if x3〈l.47723e+06then nodel30else nodel31
[0193]119if x3<5.20398e+06then nodel32else nodel33
[0194]120if xl4<0.396659then nodel34else nodel35
[0195]121class=4
[0196]122if xl2<0.470398then nodel36else nodel37
[0197]123if xl7<0.306859then nodel38else nodel39
[0198]124if xl8<0.824979then nodel40else nodel41
[0199]125class=19
[0200]126class=45
[0201]127if x3<l.93593e+06then nodel42else nodel43
[0202]128if x3<l.44848e+06then nodel44else nodel45
[0203]129class=45
[0204]130class=ll
[0205]131class=8
[0206]132if xlin{14568}then nodel46else nodel47
[0207]133class=ll
[0208]134if xll<0.09162then nodel48else nodel49
【權(quán)利要求】
1.一種用于將實體與類別相關(guān)聯(lián)的計算機實現(xiàn)的方法,所述方法包括: 使用一個或多個計算機處理器執(zhí)行指令,所述指令使得所述一個或多個計算機處理器生成內(nèi)容分發(fā)系統(tǒng),所述內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個內(nèi)容提供者接收一個或多個內(nèi)容部分,(ii)至少部分地基于所述至少一個內(nèi)容提供者屬于多個類別中的哪一個來選擇所述一個或多個內(nèi)容部分中的至少一個用于發(fā)布,以及(iii)提供所選擇的所述至少一個內(nèi)容部分以代表所述至少一個內(nèi)容提供者用于發(fā)布; 接收關(guān)于第一內(nèi)容提供者的第一信息; 使用一個或多個計算機處理器,相對于所述第一內(nèi)容提供者確定所述多個類別的至少子集中的每一個類別的概率值,每一個所述概率值表示所述第一內(nèi)容提供者屬于相應(yīng)類別的可能性并且使用關(guān)于所述第一內(nèi)容提供者的所述第一信息來確定;以及 使用一個或多個計算機處理器,識別所述多個類別的所述子集中的一個類別,并且將所識別的所述一個類別分配給所述內(nèi)容分發(fā)系統(tǒng)中的所述第一內(nèi)容提供者,所述一個類別使用所述概率值和用于所述多個類別的規(guī)則集來識別。
2.根據(jù)權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述概率值使用與所述第一內(nèi)容提供者相關(guān)聯(lián)的至少一個關(guān)鍵詞以及與所述第一內(nèi)容提供者相關(guān)聯(lián)的至少一個財務(wù)值來確定。
3.根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中確定所述概率值包括: 將所述至少一個關(guān)鍵詞 至少映射到所述多個類別的所述子集; 用所述至少一個財務(wù)值對至少所述子集賦予權(quán)重,其中所述財務(wù)值已被分配給對應(yīng)關(guān)鍵詞;以及 選擇預(yù)定數(shù)量的所述多個類別作為所述子集。
4.根據(jù)權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的計算機實現(xiàn)的方法,其中所述規(guī)則集包括決策樹,所述決策樹被配置用于通過處理包括在所述決策樹中的多個決策中的至少部分來選擇所述多個類別中的一個。
6.根據(jù)權(quán)利要求5所述的計算機實現(xiàn)的方法,進一步包括: 使用所述訓(xùn)練數(shù)據(jù)來生成所述決策樹,其中所述訓(xùn)練數(shù)據(jù)包括實體到所述多個類別中的一個或多個的映射。
7.根據(jù)權(quán)利要求6所述的計算機實現(xiàn)的方法,其中生成所述決策樹進一步包括: 使用有關(guān)所述實體的財務(wù)數(shù)據(jù)對所述映射賦予權(quán)重。
8.根據(jù)權(quán)利要求7所述的計算機實現(xiàn)的方法,其中對所述映射賦予權(quán)重進一步包括: 基于與所述映射的至少子集相對應(yīng)的所述財務(wù)數(shù)據(jù)來過采樣所述映射的所述子集。
9.根據(jù)權(quán)利要求5所述的計算機實現(xiàn)的方法,其中生成所述決策樹包括: 選擇用于所述決策樹的結(jié)構(gòu); 確定所述決策樹的延伸區(qū),包括在選擇所述多個類別中的所述一個之前待進行的所述多個決策中的決策數(shù)量;以及 確定待在所述多個決策中使用的閾值。
10.根據(jù)權(quán)利要求8所述的計算機實現(xiàn)的方法,其中所述決策樹被迭代生成。
11.根據(jù)權(quán)利要求6所述的計算機實現(xiàn)的方法,其中所述第一內(nèi)容提供者從事于廣告,以及其中所述多個類別包括所述第一內(nèi)容提供者待與之匹配的垂直元。
12.根據(jù)權(quán)利要求10所述的計算機實現(xiàn)的方法,其中生成所述決策樹進一步包括: 識別所述垂直元中的至少一個,對于所述至少一個垂直元所述概率值的所述確定具有將所述垂直元不恰當?shù)胤峙浣o所述第一內(nèi)容提供者的傾向;以及選擇所述閾值中的至少一個,使得降低所述傾向。
13.根據(jù)權(quán)利要求1所述的計算機實現(xiàn)的方法,進一步包括: 基于已為所述第一內(nèi)容提供者識別的所述類別向用戶呈現(xiàn)第二信息。
14.根據(jù)權(quán)利要求13所述的計算機實現(xiàn)的方法,其中所述第二信息指示與所述類別相關(guān)聯(lián)的季節(jié)性。
15.一種計算機系統(tǒng),包括: 一個或多個計算機處理器;以及 存儲有指令的非易失性計算機可讀存儲介質(zhì),所述指令在被執(zhí)行時使得所述一個或多個計算機處理器生成: 內(nèi)容分發(fā)系統(tǒng),所述內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個內(nèi)容提供者接收一個或多個內(nèi)容部分,(ii)至少部分地基于所述至少一個內(nèi)容提供者屬于多個類別中的哪一個來選擇所述一個或多個內(nèi)容部 分中的至少一個用于發(fā)布,以及(iii)提供所選擇的所述至少一個內(nèi)容部分以代表所述至少一個內(nèi)容提供者用于發(fā)布; 第一分類器,所述第一分類器相對于所述第一內(nèi)容提供者確定所述多個類別的至少子集中的每一個類別的概率值,每一個所述概率值表示所述第一內(nèi)容提供者屬于相應(yīng)類別的可能性并且使用所接收的關(guān)于所述第一內(nèi)容提供者的第一信息來確定;以及 第二分類器,所述第二分類器使用所述概率值和用于所述多個類別的規(guī)則集來為所述內(nèi)容分發(fā)系統(tǒng)中的所述第一內(nèi)容提供者識別所述多個類別的所述子集中的一個類別; 其中所述計算機系統(tǒng)將所識別的類別分配給所述第一內(nèi)容提供者。
16.根據(jù)權(quán)利要求15所述的計算機系統(tǒng),其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的計算機系統(tǒng),其中所述規(guī)則集包括決策樹,所述決策樹被配置用于通過處理包括在所述決策樹中的多個決策中的至少部分來選擇所述多個類別中的一個,所述計算機系統(tǒng)進一步包括: 規(guī)則組件,所述規(guī)則組件使用所述訓(xùn)練數(shù)據(jù)來生成所述決策樹,其中所述訓(xùn)練數(shù)據(jù)包括實體到所述多個類別中的一個或多個的映射。
18.根據(jù)權(quán)利要求17所述的計算機系統(tǒng),其中所述規(guī)則組件使用有關(guān)所述實體的財務(wù)數(shù)據(jù)對所述映射賦予權(quán)重,包括基于與所述映射的至少子集相對應(yīng)的所述財務(wù)數(shù)據(jù)來過采樣所述映射的所述子集。
19.根據(jù)權(quán)利要求15所述的計算機系統(tǒng),進一步包括: 前端組件,所述前端組件基于所述第二分類器已為所述第一內(nèi)容提供者識別了所述類別而向用戶呈現(xiàn)信息。
20.一種用于將內(nèi)容提供者與類別相關(guān)聯(lián)的計算機實現(xiàn)的方法,所述方法包括: 使用一個或多個計算機處理器,將第一內(nèi)容提供者識別為加入在程序中,在所述程序中所述第一內(nèi)容提供者提供待由至少一個發(fā)布者發(fā)布的內(nèi)容,其中內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個內(nèi)容提供者接收一個或多個內(nèi)容部分,(?)至少部分地基于所述至少一個內(nèi)容提供者屬于多個類別中的哪一個來選擇所述一個或多個內(nèi)容部分中的至少一個用于發(fā)布,以及(iii)提供所選擇的所述至少一個內(nèi)容部分以代表所述至少一個內(nèi)容提供者用于發(fā)布; 使用一個或多個計算機處理器,接收有關(guān)所述第一內(nèi)容提供者的至少一個關(guān)鍵詞和有關(guān)所述關(guān)鍵詞的至少一個財務(wù)值; 使用一個或多個計算機處理器,接收多個類別,其中所述第一內(nèi)容提供者待與所述類別中的至少一個相關(guān)聯(lián); 使用一個或多個計算機處理器,基于所述類別的名稱將所述至少一個關(guān)鍵詞映射到所述類別的子集; 使用一個或多個計算機處理器,將所述類別的至少所述子集中的每一個與概率值相關(guān)聯(lián),所述概率值表示所述第一內(nèi)容提供者應(yīng)當與相應(yīng)類別相關(guān)聯(lián)的可能性,所述概率值使用所述財務(wù)值被賦予權(quán)重; 使用一個或多個計算機處理器,接收所生成的有關(guān)所述多個類別的規(guī)則集,所述規(guī)則集被配置用于在識別所述類別中的一個時使用; 使用一個或多個計算機處理器,使用所述規(guī)則集來處理有關(guān)所述第一內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括:(i )所述類別的至少所述子集中的每一個的所述概率值;(ii )有關(guān)所述第一內(nèi)容提供者的財務(wù)數(shù)據(jù);(iii)所述第一內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域; 使用一個或多個計算機處理器,基于對所述數(shù)據(jù)的所述處理為所述第一內(nèi)容提供者選擇所述多個類別中的一個;以及 使用一個或多個計算機處理器,將所述第一內(nèi)容提供者與所選擇的類別相關(guān)聯(lián)。
【文檔編號】G06Q10/06GK103927615SQ201410119954
【公開日】2014年7月16日 申請日期:2009年9月14日 優(yōu)先權(quán)日:2008年9月15日
【發(fā)明者】裴忠順, 伍慶, 崔賢影, 維維克·拉古納坦 申請人:谷歌公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1