預(yù)測廣告質(zhì)量的制作方法

文檔序號：6570589閱讀：257來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：預(yù)測廣告質(zhì)量的制作方法
技術(shù)領(lǐng)域：
這里所描述的實(shí)現(xiàn)一般地涉及在線廣告，更特別地涉及提供對在線廣告質(zhì)量的預(yù)測性估計(jì)。
背景技術(shù)：
在線廣告系統(tǒng)寄放(host)可以對各種服務(wù)和/或產(chǎn)品做廣告的廣告。這樣的廣告可以被呈現(xiàn)給訪問由廣告系統(tǒng)所寄放的文檔的用戶，或者呈現(xiàn)給發(fā)出用于搜索文檔集的搜索查詢的用戶。廣告可以包括"創(chuàng)
意(creative)"，其包括與被廣告的服務(wù)和/或產(chǎn)品相關(guān)的文本、圖形和/或圖像。該廣告還可以包括連至包含關(guān)于被廣告服務(wù)和或產(chǎn)品的細(xì) 節(jié)的廣告"定著(landing)文檔"的鏈接。當(dāng)特定創(chuàng)意引起用戶的興趣時(shí)，該用戶可以選擇(或點(diǎn)擊)該創(chuàng)意，并且該相關(guān)鏈接使得用戶的網(wǎng)頁瀏覽器訪問與該創(chuàng)意相關(guān)的"定著文檔"及相關(guān)鏈接。在下文中，將用戶對廣告創(chuàng)意以及相關(guān)鏈接的選擇稱為"點(diǎn)擊"。
在線廣告系統(tǒng)通常為了記帳以及其他目的而跟蹤廣告點(diǎn)擊。跟蹤廣告點(diǎn)擊的一個(gè)非計(jì)帳目的是試圖確定廣告質(zhì)量。該點(diǎn)進(jìn)率(CRT)是用于確定廣告質(zhì)量的度量。CRT表示當(dāng)將給定的廣告創(chuàng)意呈現(xiàn)給用戶時(shí)該給定的廣告獲得"被點(diǎn)擊"的次數(shù)的分?jǐn)?shù)。但是，廣告的CRT是對廣告質(zhì)量的有缺陷的度量，因?yàn)樗魂P(guān)注于廣告創(chuàng)意而不是廣告對象，即定著文檔。為了確定廣告是好還是壞，用戶需要點(diǎn)擊廣告，因此發(fā)生/不發(fā)生點(diǎn)擊不足以確定廣告的質(zhì)量。一些廣告由于它們具有很好的創(chuàng)意而接收到許多點(diǎn)擊，但是定著文檔對于用戶來說卻是完全無法令人滿意的或者不相關(guān)的。其他廣告接收到非常少的點(diǎn)擊(例如，由于該廣告創(chuàng)意差)，但是每個(gè)點(diǎn)擊都讓用戶滿意。因而，現(xiàn)有的確定與在線廣告相關(guān)的CRT提供了對廣告質(zhì)量的有缺陷的度量。
此外，在現(xiàn)有的在線廣告系統(tǒng)中，顯示給用戶的廣告以及廣告顯示給用戶的次序完全基于廣告的CRT以及廣告商愿意為顯示其廣告而
支付的最大"每次點(diǎn)擊成本"(cost per click, CPC)。該CPC是廣告商愿意支付給廣告發(fā)布者的數(shù)額，并且其基于該特定廣告接收到的選擇(例如，點(diǎn)擊)的數(shù)量。就CTR被用作廣告質(zhì)量的替身來說，其由于已經(jīng)闡述的原因而是不充分的。因而，現(xiàn)有的用于確定顯示哪個(gè)廣告以及對廣告進(jìn)行分級的機(jī)制使用了一種對廣告質(zhì)量的有缺陷的度量，其可能不向用戶提供最高質(zhì)量的廣告。

發(fā)明內(nèi)容
依照一個(gè)方面，一種方法可以包括確定與對多個(gè)廣告的選擇相關(guān) 聯(lián)的質(zhì)量值，其中每個(gè)質(zhì)量值估計(jì)廣告為好廣告的可能性。該方法可以進(jìn)一步包括聚合質(zhì)量值并使用所聚合的質(zhì)量值來預(yù)測廣告為好廣告的將來的可能性。
依照另一個(gè)方面，一種方法可以包括響應(yīng)于搜索查詢向用戶提供一個(gè)或多個(gè)廣告；以及記錄與用戶對一個(gè)或多個(gè)廣告的選擇相關(guān)聯(lián) 的用戶行為。該方法可以進(jìn)一步包括記錄與一個(gè)或多個(gè)廣告中被選擇的廣告相關(guān)聯(lián)、或者與搜索査詢相關(guān)聯(lián)的特征；以及使用統(tǒng)計(jì)模型和所記錄的用戶行為來估計(jì)與所選擇的廣告相關(guān)聯(lián)的質(zhì)量分值。該方法也可以包括聚合所估計(jì)的質(zhì)量分值并使用所聚合的質(zhì)量分值來預(yù)測一個(gè)或多個(gè)廣告中的廣告的質(zhì)量。
依照其它的方面，一種方法可以包括從用戶接收搜索查詢，并基于該搜索査詢向用戶提供一組廣告。該方法可以進(jìn)一步包括從用戶接收對于從一組廣告中選擇廣告的指示，并記錄與搜索査詢或者所選擇的廣告相關(guān)聯(lián)的特征。該方法也可以包括使用所記錄的特征從存儲(chǔ)器中檢索以往的質(zhì)量分值，并根據(jù)所檢索的以往的質(zhì)量分值來預(yù)測所選擇的廣告的將來的質(zhì)量。

合并于本說明書并構(gòu)成本說明書一部分的附圖示出了本發(fā)明的一個(gè)或多個(gè)實(shí)施例，并且與文字描述一起用于解釋本發(fā)明。在附圖中，
圖1和2是實(shí)現(xiàn)的總體示例圖，在該實(shí)現(xiàn)中，使用所觀測的用戶行為和與一組廣告相關(guān)聯(lián)的已知質(zhì)量等級來構(gòu)建可被用于預(yù)測廣告質(zhì) 量的統(tǒng)計(jì)模型；
圖3是網(wǎng)絡(luò)的示例圖，在該網(wǎng)絡(luò)中可以實(shí)現(xiàn)符合本發(fā)明原理的系統(tǒng)和方法；
圖4是依照符合本發(fā)明原理的實(shí)現(xiàn)的圖3的客戶端或服務(wù)器的示
例圖，
圖5是依照符合本發(fā)明原理的實(shí)現(xiàn)的用于構(gòu)建與對多個(gè)在線廣告的選擇相關(guān)聯(lián)的用戶行為模型的示范性過程的流程圖6-13示出了相應(yīng)于所觀測或所記錄的用戶動(dòng)作的各種示范性會(huì) 話特征，它們可被用于構(gòu)建用于預(yù)測廣告質(zhì)量的統(tǒng)計(jì)模型；
圖14是依照符合本發(fā)明原理的實(shí)現(xiàn)的用于確定涉及廣告質(zhì)量的預(yù)測值的示范性過程的流程圖15是用圖形表示符合本發(fā)明一個(gè)方面的圖14的示范性過程的
視圖16是用于存儲(chǔ)在圖14中所確定的預(yù)測值的示范性數(shù)據(jù)結(jié)構(gòu)的
視圖17是依照符合本發(fā)明原理的實(shí)現(xiàn)的用于預(yù)測廣告質(zhì)量的示范性過程的流程圖18是用圖形表示符合本發(fā)明一個(gè)方面的圖17的示范性過程的
視圖19是依照符合本發(fā)明原理的實(shí)現(xiàn)的用于預(yù)測廣告質(zhì)量的示范性過程的流程圖；以及
圖20是用圖形表示符合本發(fā)明一個(gè)方面的圖19的示范性過程的視圖。
具體實(shí)施例方式
下面參照附圖來對本發(fā)明進(jìn)行詳細(xì)說明。在不同的附圖中，相同的參考數(shù)字可以表示相同或類似的元件。而且，下面的詳細(xì)說明不限制本發(fā)明。
與本發(fā)明的各方面一致的系統(tǒng)和方法可以使用與在線廣告的用戶選擇相關(guān)聯(lián)的用戶行為的多個(gè)觀察(例如，實(shí)時(shí)觀察或者來自記錄用戶的日志的觀察)，以與傳統(tǒng)的僅基于CTR的質(zhì)量確定相比更準(zhǔn)確地估計(jì)廣告質(zhì)量?？梢允褂门c已知評級(rate)的廣告相關(guān)聯(lián)的質(zhì)量分值、以及與這些已知評級的廣告的選擇(例如，"點(diǎn)擊")相關(guān)聯(lián)的相應(yīng) 測量的所觀測的用戶行為來構(gòu)造統(tǒng)計(jì)模型。隨后，可以使用該統(tǒng)計(jì)模型來根據(jù)與未評級廣告選擇相關(guān)聯(lián)的所觀測的用戶行為來估計(jì)與該未評級廣告相關(guān)聯(lián)的質(zhì)量。
如在此所使用的術(shù)語"文檔"應(yīng)被廣泛地解釋為包括任何機(jī)器可讀以及機(jī)器可存儲(chǔ)的工作成果。文檔可以包括例如電子郵件、網(wǎng)頁或網(wǎng)站、商務(wù)列表、文件、文件的組合、嵌有到其他文件的的連接的一個(gè)或多個(gè)文件、新聞組貼子、博客、在線廣告等。文檔通常包括文本信息，并且可以包括嵌入式信息(例如元信息、圖像、超鏈接等)禾口/ 或嵌入式指令(例如Javascript等)。如在此所使用的術(shù)語"鏈接"應(yīng) 被廣泛地解釋為包括從/到一個(gè)文檔到/從另一個(gè)文檔或者該相同文檔另一部分的任意參考。
概述
圖1和圖2示出了實(shí)現(xiàn)的示范性概要圖，在該實(shí)現(xiàn)中，使用統(tǒng)計(jì) 模型和所觀測的與對廣告的選擇相關(guān)聯(lián)的用戶行為來估計(jì)預(yù)測值，進(jìn) 一步聚合該預(yù)測值以提供對于廣告質(zhì)量的將來的預(yù)測。該對于廣告質(zhì) 量的將來的預(yù)測可被用于對廣告過濾、排名或提升(promotion)。
如圖1所示，多個(gè)評級的廣告100-1至100-N (在此共同地稱作廣
告100)中的每一個(gè)可以與相應(yīng)的文檔105-1至105-N (在此共同地稱作文檔105)相關(guān)聯(lián)。除了評級的廣告100外，每個(gè)文檔105可以包括一組搜索結(jié)果(該結(jié)果是基于用戶提供的搜索査詢而由搜索引擎執(zhí)行搜索獲得的)，并且還可以包括一個(gè)或多個(gè)廣告。每個(gè)廣告100可以與評級數(shù)據(jù)120相關(guān)聯(lián)，該評級數(shù)據(jù)120是由已對每個(gè)評級的廣告100 的質(zhì)量進(jìn)行了評級的評級人提供的。每個(gè)廣告100可以對各種產(chǎn)品或服務(wù)做廣告。
響應(yīng)于接收到廣告100，接收用戶可以基于廣告上顯示的"創(chuàng)意" 來選擇IIO廣告(例如，例如使用鼠標(biāo)在顯示的廣告上進(jìn)行"點(diǎn)擊")。在廣告選擇110之后，使用嵌入在廣告100中的鏈接通過寄放該廣告的服務(wù)器將廣告定著文檔115提供給選擇用戶。該廣告定著文檔115 可以提供在相應(yīng)廣告100中做廣告的產(chǎn)品和/或服務(wù)的細(xì)節(jié)。
在用戶進(jìn)行每個(gè)廣告選擇IIO之前、期間和/或之后，可以實(shí)時(shí)測量在"會(huì)話"期間與每個(gè)廣告選擇110相關(guān)聯(lián)的會(huì)話特征125或者將其記錄在存儲(chǔ)器中或磁盤上。會(huì)話可以包括在長于一個(gè)特定時(shí)間段內(nèi) 無中斷地發(fā)生的一組用戶動(dòng)作(例如，在長于三小時(shí)的時(shí)間段內(nèi)無中斷地發(fā)生的一組用戶動(dòng)作)。
所測量的會(huì)話特征125可以包括任何類型的所觀察的用戶行為或動(dòng)作。例如，會(huì)話特征125可以包括廣告選擇110的持續(xù)時(shí)間(例如，在廣告100上"點(diǎn)擊"的持續(xù)時(shí)間)、在給定的廣告選擇之前和/或之后其他廣告的選擇的數(shù)量、在給定的廣告選擇之前和/或之后搜索結(jié)果的選擇的數(shù)量、在給定的廣告選擇之前和/或之后對其他類型結(jié)果(例如，圖像、新聞、產(chǎn)品等)的選擇的數(shù)量、在給定的廣告選擇之前和/ 或之后文檔閱覽(例如，頁面閱覽)的數(shù)量(例如，在廣告選擇之前和/或之后搜索結(jié)果的頁面閱覽)、在給定的廣告選擇之前和/或之后搜索査詢的數(shù)量、與顯示廣告的用戶會(huì)話相關(guān)聯(lián)的查詢的數(shù)量、對同一給定廣告進(jìn)行重復(fù)選擇的數(shù)量或者給定的廣告選擇是否為會(huì)話中的最
后選擇、會(huì)話中的最后廣告選擇、對于給定的搜索查詢的最后選擇或對于給定的搜索查詢的最后廣告選擇的指示。與本發(fā)明的各方面一致，可以使用上面沒有描述的其他類型的與廣告選擇相關(guān)聯(lián)的所觀察的用戶行為。
利用與相應(yīng)評級的廣告100的每個(gè)廣告選擇110相關(guān)聯(lián)的所測量的會(huì)話特征125以及廣告評級數(shù)據(jù)120，可以構(gòu)造統(tǒng)計(jì)模型130 (如下面進(jìn)一步描述的)。該統(tǒng)計(jì)模型可以包括利用統(tǒng)計(jì)技術(shù)推導(dǎo)的概率模型。這樣的技術(shù)可以包括例如邏輯回歸(logistic regression)、回歸樹、提級的枝端(boosted stumps)或者任何其他統(tǒng)計(jì)建模技術(shù)。統(tǒng)計(jì)模型 130可以提供一個(gè)預(yù)測值，該預(yù)測值估計(jì)給定的廣告100是與廣告100 的用戶選擇相關(guān)聯(lián)的好的給定所測會(huì)話特征的可能性(例如，P (good ad|ad selection) =/g (session feaures))。
在構(gòu)建統(tǒng)計(jì)模型130之后，可以估計(jì)由一個(gè)或多個(gè)用戶選擇的未評級廣告的廣告質(zhì)量?？梢园雅c文檔140相關(guān)聯(lián)且寄放于網(wǎng)絡(luò)中的服務(wù)器上的未評級廣告135提供給訪問用戶。與未評級廣告135的用戶選擇145相關(guān)聯(lián)的會(huì)話特征155可以被測量或記錄在存儲(chǔ)器中或磁盤上，并且該測量可以被提供為統(tǒng)計(jì)模型130的輸入。給定所測量的會(huì) 話特征，統(tǒng)計(jì)模型130可以確定未評級廣告135是好廣告的可能性，并且可以為生成關(guān)于未評級廣告135的預(yù)測值160。
與未評級廣告135的選擇相關(guān)聯(lián)的廣告/査詢特征165也可以被觀測并記錄。廣告/查詢特征165可以包括與廣告135或者寄放或產(chǎn)生廣告的廣告主相關(guān)聯(lián)的不同特征，或者包括與導(dǎo)致顯示廣告135的由用戶發(fā)出的查詢相關(guān)聯(lián)的特征。例如，廣告/查詢特征165可以包括與廣告135的廣告主相關(guān)聯(lián)的標(biāo)識符(例如，廣告主的可視的統(tǒng)一資源定位符(URL))、廣告135定向的關(guān)鍵字、由用戶發(fā)出的查詢中廣告 135沒有定向的詞、和/或由用戶發(fā)出的查詢中廣告135沒有定向但與廣告135定向的詞類似的詞。在符合本發(fā)明原理的條件下，也可以使
用上面未描述的其它類型的廣告或査詢特征。依照相關(guān)聯(lián)的廣告/查詢
特征165，可以將所估計(jì)的預(yù)測值160存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)170中，下面將
對此作進(jìn)一步詳細(xì)描述。
盡管圖1描述了估計(jì)與單個(gè)未評級廣告135相關(guān)聯(lián)的預(yù)測質(zhì)量值，但是可以針對一個(gè)時(shí)間跨度內(nèi)由一個(gè)或多個(gè)用戶選擇的每個(gè)未評級廣告135來估計(jì)預(yù)測值160，從而產(chǎn)生多個(gè)廣告預(yù)測值160，其中每個(gè)預(yù) 測值160與一個(gè)或多個(gè)廣告/查詢特征(或多個(gè)特征)165相關(guān)聯(lián)?？?以將該多個(gè)廣告預(yù)測值160聚合在數(shù)據(jù)結(jié)構(gòu)170中，以產(chǎn)生聚合的預(yù) 測值200，如在圖2中所示。下面參考圖14對預(yù)測值的聚合進(jìn)行描述。如在圖2中進(jìn)一步所示，可以對數(shù)據(jù)結(jié)構(gòu)170中的每個(gè)廣告/查詢特征估計(jì)210可能性。所估計(jì)的可能性可以預(yù)測給定特定廣告/查詢特征的廣告的質(zhì)量。下面將參考圖17和圖18描述可能性估計(jì)的進(jìn)一步的示范性細(xì)節(jié)?？梢詫⑨槍γ總€(gè)廣告/查詢特征所估計(jì)的可能性存儲(chǔ)在數(shù)據(jù) 結(jié)構(gòu)170中。
隨后可以獲得220與廣告220的選擇相關(guān)聯(lián)的廣告/查詢特征。當(dāng) 用戶從文檔(例如，搜索結(jié)果文檔)中選擇廣告時(shí)，與該選擇相關(guān)聯(lián) 的廣告/査詢特征將被記錄。可以從數(shù)據(jù)結(jié)構(gòu)170中檢索230針對就廣告的選擇而獲得的每個(gè)廣告/查詢特征的所估計(jì)的可能性。然后，通過使用所檢索的針對與廣告選擇相關(guān)聯(lián)的每個(gè)廣告/査詢特征的所估計(jì)的可能性，可以預(yù)測240總體的廣告質(zhì)量。下面將參考圖19描述預(yù)測總
體廣告質(zhì)量的進(jìn)一步的示范性細(xì)節(jié)。示范性網(wǎng)絡(luò)結(jié)構(gòu)
圖3是其中可以實(shí)現(xiàn)與本發(fā)明的原理一致的系統(tǒng)和方法的網(wǎng)絡(luò) 300的示范圖。網(wǎng)絡(luò)300可以包括經(jīng)由網(wǎng)絡(luò)340連接到一個(gè)或多個(gè)服務(wù) 器320-330的多個(gè)客戶端310。為了簡便起見，示出了兩個(gè)客戶端310 以及兩個(gè)服務(wù)器320-330連接到網(wǎng)絡(luò)340。實(shí)際上，可以有更多或更少的客戶端和服務(wù)器。而且，在一些實(shí)例中，客戶端可以執(zhí)行服務(wù)器的功能，并且服務(wù)器可以執(zhí)行客戶端的功能。
客戶端310可以包括客戶端實(shí)體。實(shí)體可以被定義為裝置，諸如個(gè)人計(jì)算機(jī)、無線電話、個(gè)人數(shù)字助理(PDA)、膝上型電腦、或者另一類型的計(jì)算或通信裝置、在這些裝置之一上運(yùn)行的線程或進(jìn)程、和/或者可以由這些裝置之一執(zhí)行的對象。一個(gè)或多個(gè)用戶可以與每個(gè)
客戶端310相關(guān)聯(lián)。服務(wù)器320和330可以包括以與本發(fā)明的原理一致的方式來訪問、取得、聚合、處理、搜索和/或保持文檔的服務(wù)器實(shí) 體。客戶端310和服務(wù)器320及330可以經(jīng)由有線、無線、和/或光連接來連接到網(wǎng)絡(luò)340。
在與本發(fā)明的原理一致的實(shí)現(xiàn)中，服務(wù)器320可以包括搜索引擎系統(tǒng)325,其可由客戶端310的用戶使用。服務(wù)器320可以通過抓取文檔集(例如，Web文檔)對該文檔進(jìn)行索引以及將與該文檔相關(guān)聯(lián)的信息存儲(chǔ)文檔庫中來實(shí)現(xiàn)數(shù)據(jù)聚合服務(wù)。也可以以其他方式來實(shí)現(xiàn)該數(shù)據(jù)聚合服務(wù)，諸如與數(shù)據(jù)服務(wù)器330的操作者協(xié)定以經(jīng)由數(shù)據(jù)聚合服務(wù)來分發(fā)它們所寄放的文檔。在一些實(shí)現(xiàn)中，服務(wù)器320可以寄放可以被提供給在客戶端310的用戶的廣告(例如，創(chuàng)意、廣告定著文檔)。搜索引擎系統(tǒng)325可以執(zhí)行從在客戶端310的用戶接收的對存儲(chǔ)在文檔庫中的文檔集的査詢，并且可以將與所執(zhí)行的査詢相關(guān)的一組搜索結(jié)果提供給該用戶。除了該組搜索結(jié)果以外，服務(wù)器320還可以將與所執(zhí)行的搜索的結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)廣告創(chuàng)意提供給在客戶端310的用戶。
服務(wù)器330可以存儲(chǔ)或保持可以是由服務(wù)器320所抓取的文檔。這樣的文檔可以包括與出版的新聞故事、產(chǎn)品、圖像、用戶組、地理區(qū)域相關(guān)的數(shù)據(jù)或者任何其他類型的數(shù)據(jù)。例如，服務(wù)器330可以存儲(chǔ)或保持來自任何類型的新聞資源(諸如例如華盛頓郵報(bào)、紐約泰晤士報(bào)、泰晤士雜質(zhì)或者新聞周刊的新聞故事)。作為另一例子，服務(wù) 器330可以存儲(chǔ)或保持與特定產(chǎn)品相關(guān)的數(shù)據(jù)，諸如由一個(gè)或多個(gè)產(chǎn)
品制造商提供的產(chǎn)品數(shù)據(jù)。作為還一個(gè)例子，服務(wù)器330可以存儲(chǔ)或
保持與其他類型的Web文檔(例如網(wǎng)站的頁面)的數(shù)據(jù)。服務(wù)器330
還可以寄放廣告，諸如廣告創(chuàng)意以及廣告定著文檔。
網(wǎng)絡(luò)340可以包括任何類型的一個(gè)或多個(gè)網(wǎng)絡(luò)，包括局域網(wǎng) (LAN)、廣域網(wǎng)(WAN)、城域網(wǎng)(MAN)、諸如公共開關(guān)電話網(wǎng) 絡(luò)(PSTN)或公共陸地移動(dòng)網(wǎng)絡(luò)(PLMN)的電話網(wǎng)、內(nèi)聯(lián)網(wǎng)、因特網(wǎng)、存儲(chǔ)器裝置或者網(wǎng)絡(luò)的組合。該P(yáng)LMN可以進(jìn)一步包括分組交換子網(wǎng)，諸如例如通用分組無線服務(wù)(GPRS)、蜂窩數(shù)字分組數(shù)據(jù)(CDPD) 或移動(dòng)IP子網(wǎng)。
雖然服務(wù)器320-330被示為單獨(dú)的實(shí)體，但是也可能是服務(wù)器 320-330中的一個(gè)執(zhí)行該服務(wù)器320-330中的另一個(gè)的一個(gè)或多個(gè)功能。例如，可以將服務(wù)器320和330實(shí)現(xiàn)為單個(gè)服務(wù)器。也可以將服務(wù)器320和330中的單個(gè)服務(wù)器實(shí)現(xiàn)為兩個(gè)或更多個(gè)單獨(dú)(可能分布式的)的裝置。
示范性客戶端/服務(wù)器體系結(jié)構(gòu)
圖4是根據(jù)與本發(fā)明的原理一致的實(shí)現(xiàn)的客戶端或服務(wù)器實(shí)體 (下文中稱為"客戶端/服務(wù)器實(shí)體")(客戶端或服務(wù)器實(shí)體可以對應(yīng) 于一個(gè)或多個(gè)客戶端310和/或服務(wù)器320-330)的示范圖。該客戶端/ 服務(wù)器實(shí)體可以包括總線410、處理器420、主存儲(chǔ)器430、只讀存儲(chǔ) 器(ROM) 440、存儲(chǔ)裝置450、輸入裝置460、輸出裝置470以及通信接口 480?？偩€410可以包括允許在客戶端/服務(wù)器實(shí)體的元件之間進(jìn)行通信的路徑。
處理器420可以包括處理器、微處理器、或者可以解釋和執(zhí)行指令的處理邏輯。主存儲(chǔ)器430可以包括隨機(jī)存取存儲(chǔ)器(RAM)或者另一個(gè)類型的動(dòng)態(tài)存儲(chǔ)裝置，其可以存儲(chǔ)信息以及由處理器420執(zhí)行的指令。ROM 440可以包括ROM裝置以及另一種類型的靜態(tài)存儲(chǔ)裝
置，其可以存儲(chǔ)靜態(tài)信息以及供處理器420所使用的指令。存儲(chǔ)裝置
450可以包括磁和/或光記錄介質(zhì)及其相應(yīng)驅(qū)動(dòng)。
輸入裝置460可以包括用于允許操作者將信息輸入到客戶端/服務(wù)
器實(shí)體的機(jī)構(gòu)，諸如鍵盤、鼠標(biāo)、筆、語音識別和/或生物機(jī)制等。輸
出裝置470可以包括用于將信息輸出給操作者的機(jī)構(gòu)，包括顯示器、打印機(jī)、揚(yáng)聲器等。通信接口 480可以包括任何類似于收發(fā)器的機(jī)構(gòu)，其使得該客戶端/服務(wù)器實(shí)體能夠與其他裝置和/或系統(tǒng)進(jìn)行通信。例如，通信接口 480可以包括用于經(jīng)由諸如網(wǎng)絡(luò)340的網(wǎng)絡(luò)與另一個(gè)裝置或系統(tǒng)進(jìn)行通信的機(jī)構(gòu)。
與本發(fā)明的原理一致的客戶端/服務(wù)器實(shí)體可以執(zhí)行某些操作或進(jìn)程，如將在下面將詳細(xì)描述的。該客戶端/服務(wù)器實(shí)體可以響應(yīng)于處理器420執(zhí)行包含在諸如存儲(chǔ)器430的計(jì)算機(jī)可讀介質(zhì)中的軟件指令而執(zhí)行這些操作。計(jì)算機(jī)可讀介質(zhì)可以被定義為物理或邏輯存儲(chǔ)器裝置和/或載波。
可以從例如數(shù)據(jù)存儲(chǔ)裝置450的另一計(jì)算機(jī)可讀介質(zhì)，或者經(jīng)由通信接口 480從另一裝置，將軟件指令讀入到存儲(chǔ)器430中。包含在存儲(chǔ)器430中的軟件指令可以使處理器420執(zhí)行隨后將詳細(xì)描述的操作或處理。替代地，可以用硬線電路來替換軟件指令或者與軟件指令組合來實(shí)現(xiàn)與本發(fā)明的原理一致的處理。因而，與本發(fā)明的原理一致的實(shí)現(xiàn)不限于硬件電路和軟件的任意特定組合。
用于構(gòu)造與廣告選擇相關(guān)聯(lián)的用戶行為的統(tǒng)計(jì)模型的示范性過程圖5是用于構(gòu)造與多個(gè)在線廣告的選擇相關(guān)聯(lián)的用戶行為的統(tǒng)計(jì) 模型的示范性過程的流程圖。本領(lǐng)域技術(shù)人員可以理解的是，圖5中所示范的過程可以適當(dāng)?shù)匾攒浖?shí)現(xiàn)并被存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)器中，諸如主存儲(chǔ)器430、 ROM440或者服務(wù)器320、服務(wù)器330或客戶端310的存儲(chǔ)裝置450。
該示范性過程可以以獲取與評級的廣告相關(guān)聯(lián)的評級數(shù)據(jù)開始 (框500)。該評級數(shù)據(jù)可以包括對每個(gè)評級的廣告的質(zhì)量進(jìn)行評級(例如，對廣告進(jìn)行評級的一種方式是對該廣告相對于所發(fā)出的查詢的相關(guān)程度進(jìn)行評級)的人生成數(shù)據(jù)。然后，可以獲得與所評級的廣告的每個(gè)選擇相關(guān)聯(lián)的會(huì)話特征(框510)?？梢酝ㄟ^在給定的用戶會(huì)話期間觀察實(shí)際的用戶行為來實(shí)時(shí)地獲得會(huì)話特征(其在將每個(gè)廣告閃現(xiàn) (impression)顯示給用戶之前、期間以及之后發(fā)生)，或者可以在將每個(gè)廣告閃現(xiàn)顯示給用戶之前、期間以及之后從存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)中的會(huì) 話特征(即，用戶行為和動(dòng)作)的記錄日志中獲得。所獲得的會(huì)話特征125可以包括任何類型的觀察的用戶行為。每個(gè)會(huì)話特征125可以對應(yīng)于用戶對于給定廣告的滿意度的間接測量。會(huì)話特征125中的某些會(huì)話特征可以是確定不同用戶對于會(huì)話特征125中的其他會(huì)話特征如何具有不同值的因素(例如，具有撥號連接的用戶可以比具有高速
因特網(wǎng)連接的用戶具有更長的廣告選擇持續(xù)時(shí)間)。
會(huì)話特征125可以包括，但不限于，廣告選擇的持續(xù)時(shí)間(例如，在廣告上"點(diǎn)擊"的持續(xù)時(shí)間)、在給定的廣告選擇之前和/或之后的其他廣告的選擇的數(shù)量、在給定的廣告選擇之前和/或之后的搜索結(jié)果的選擇的數(shù)量、在給定的廣告選擇之前和/或之后的其他結(jié)果的選擇的數(shù)量、在給定的廣告選擇之前和/或之后的文檔瀏覽(例如，頁面瀏覽) 的數(shù)量、在給定的廣告選擇之前和/或之后的搜索査詢的數(shù)量、與顯示廣告的用戶會(huì)話相關(guān)聯(lián)的搜索查詢的數(shù)量、對相同同一給定廣告的重復(fù)選擇的數(shù)量或者給定的廣告選擇是否是會(huì)話中的最后選擇、會(huì)話中的最后廣告選擇、對于給定搜索查詢的最后選擇或者對于給定搜索查詢的最后廣告選擇的表示。圖6-13在下面描述了與本發(fā)明的各方面一致的可以作為會(huì)話特征而被測量的各種示范性類型的用戶行為。
圖6示出了廣告選擇的持續(xù)時(shí)間的測量作為會(huì)話特征600。如圖6 中所示，可以將與文檔610相關(guān)聯(lián)的廣告605提供給用戶。響應(yīng)于接
收到廣告605，該用戶可以選擇615廣告605,并且可以將該廣告定著文檔620提供給用戶。可以測量廣告選擇的持續(xù)時(shí)間625 (例如，從選擇廣告的時(shí)間直到用戶的下一動(dòng)作(諸如點(diǎn)擊另一個(gè)廣告、輸入新査詢等)的時(shí)間段)作為會(huì)話特征600。
圖7示出了在具體廣告選擇之前和/或之后的對其他廣告選擇的數(shù) 量的測量作為會(huì)話特征700。假設(shè)廣告N710的具體選擇705，以及響應(yīng)于該廣告選擇705而提供廣告定著文檔715，則可以測量與提供以前廣告定著文檔730對應(yīng)的廣告N-x 725中的一個(gè)或多個(gè)以前廣告選擇 720的數(shù)量。另外，或者作為選擇，假設(shè)廣告N710的具體選擇705，可以測量與提供下一廣告定著文檔745對應(yīng)的廣告N+x 740中的一個(gè) 或多個(gè)下一廣告選擇735的數(shù)量?？梢詼y量在具體的廣告選擇之前和/ 或之后的其他廣告選擇的數(shù)量，作為會(huì)話特征700。
圖8示出了在具體的廣告選擇之前和/或之后的對搜索結(jié)果選擇的數(shù)量的測量作為會(huì)話特征800。假設(shè)廣告N810的具體選擇805，以及響應(yīng)于該廣告選擇805而提供廣告定著文件815，可以測量在該廣告選擇805之前用戶瀏覽的搜索結(jié)果文檔820的數(shù)量作為會(huì)話特征800。可以使用用戶發(fā)出的搜索查詢基于搜索的執(zhí)行來將搜索結(jié)果文檔提供給用戶。另外，或者作為選擇，可以測量在廣告選擇805之后由該用戶瀏覽的搜索結(jié)果文檔825的數(shù)量作為會(huì)話特征800。
圖9示出了在具體的廣告選擇之前和/或之后的對用戶瀏覽的文檔的數(shù)量的測量作為會(huì)話特征卯O。假設(shè)廣告910的具體選擇卯5，并且響應(yīng)于該廣告選擇905而提供廣告定著文檔915，可以測量在廣告選擇 905之前用戶瀏覽的文檔920 (例如，頁面瀏覽)的數(shù)量作為會(huì)話特征 900。另外，或者作為選擇，可以測量在廣告選擇905之后用戶瀏覽的文檔925 (例如，頁面瀏覽)的數(shù)量作為會(huì)話特征900。
圖10示出了在具體廣告選擇之前和/或之后的對用戶發(fā)出的搜索
査詢的數(shù)量的測量作為會(huì)話特征1000。假設(shè)廣告1010的具體選擇
1005，并且響應(yīng)于該廣告選擇1005而提供廣告定著文檔1015，可以測量在廣告選擇1005之前用戶發(fā)出的搜索査詢1020的數(shù)量作為會(huì)話特征IOOO。另外，或者作為選擇，可以測量在廣告選擇1005之后用戶發(fā) 出的搜索査詢1025的數(shù)量作為會(huì)話特征1000。
圖11示出了在包括具體廣告選擇的會(huì)話中的對搜索查詢(其導(dǎo)致了對廣告進(jìn)行顯示)的數(shù)量的測量作為會(huì)話特征1100。假設(shè)包括預(yù)定廣告選擇的會(huì)話，可以測量搜索查詢1105的數(shù)量，其導(dǎo)致對相應(yīng)廣告 1110-1至1110-N進(jìn)行顯示。可以測量搜索查詢的數(shù)量作為會(huì)話特征 1100。導(dǎo)致對廣告進(jìn)行顯示的搜索查詢1105的數(shù)量可以表示給定用戶會(huì)話的商業(yè)性質(zhì)。
圖12示出了用戶對相同廣告的重復(fù)選擇的數(shù)量的測量作為會(huì)話特征1200。如圖12中所示，可以將可以與多個(gè)文檔1210-1至1210-N 相關(guān)聯(lián)的廣告1205提供給用戶一次或者多次。響應(yīng)于每次接收到廣告 1205，用戶可以選擇1215廣告1205，并且可以對于每次重復(fù)的用戶選擇將廣告定著文檔1220提供給用戶?？梢詼y量用戶對相同廣告的重復(fù) 選擇的數(shù)量作為會(huì)話特征1200。
圖13示出了確定廣告選擇是否是對于給定的搜索查詢的最后廣告選擇，或者該廣告選擇是否是對于用戶會(huì)話的最后廣告選擇，作為會(huì)話特征1300。如圖13中所示，用戶可以在給定的會(huì)話1310期間發(fā) 出搜索查詢1305，并且可以在發(fā)出搜索查詢1305之后將一個(gè)或多個(gè)廣告1315提供給用戶。響應(yīng)于每次接收到廣告1315，用戶可以選擇1320 廣告1315，并且可以將廣告定著文檔1325提供給用戶。可以做出該廣告選擇1320是否是對于搜索查詢1305的最后廣告選擇的確定。因而，如果發(fā)出搜索査詢1305的用戶選擇了多個(gè)廣告，則可以識別對于搜索査詢1305的僅僅最后廣告選擇。還可以做出該廣告選擇1320是否是對于會(huì)話1310的最后廣告選擇的確定。因此，如果在給定的會(huì)話期間
用戶已經(jīng)做出多個(gè)廣告選擇，則可以識別對于該會(huì)話的僅僅最后廣告選擇。
在圖6-13中未示出的其他類型的用戶行為也可以被用作與本發(fā)明的原理一致的會(huì)話特征。下面列出了其他示范性會(huì)話特征的多個(gè)例子
1) 代替廣告選擇持續(xù)時(shí)間，可以將給定的廣告選擇持續(xù)時(shí)間相對于用于給定用戶的平均廣告選擇持續(xù)時(shí)間的比值用作會(huì)話特征。
2) 給定的廣告選擇持續(xù)時(shí)間相對于所有選擇(例如，搜索結(jié)果選擇或者廣告選擇)的比值。
3) 用戶在給定的會(huì)話中選擇給定廣告的次數(shù)。
4) 從廣告結(jié)果選擇直到用戶發(fā)出另一搜索査詢的持續(xù)時(shí)間。這可以包括在給定廣告點(diǎn)擊之后花費(fèi)在(經(jīng)由搜索結(jié)果點(diǎn)擊或廣告點(diǎn)擊達(dá) 到的)其他頁面的時(shí)間。
5) 從給定的廣告結(jié)果選擇直到用戶發(fā)出另一搜索査詢?yōu)橹沟臅r(shí)間
相對于從廣告結(jié)果選擇直到用戶發(fā)出另一搜索查詢?yōu)橹沟乃衅渌麜r(shí) 間的比值。
6) 對于給定的廣告結(jié)果選擇，花費(fèi)在瀏覽搜索査詢的其他結(jié)果而
不是在給定的廣告結(jié)果上的時(shí)間。
7) 上述6)中花費(fèi)的時(shí)間(花費(fèi)在其他結(jié)果上而不是在點(diǎn)擊持續(xù) 時(shí)間上的時(shí)間)相對于經(jīng)過所有查詢在6)中花費(fèi)的平均時(shí)間的比值。
8) 在給定的搜索結(jié)果或廣告選擇之前在給定會(huì)話中發(fā)生多少個(gè)搜索(即，唯一發(fā)出的搜索查詢)。
9) 在給定的搜索結(jié)果或廣告選擇之后在給定會(huì)話中發(fā)生多少搜索。
10) 除了搜索，在給定選擇之前對于給定搜索查詢發(fā)生多少結(jié)果頁面瀏覽。這可以在査詢內(nèi)(即，僅僅對于唯一查詢)或?qū)τ谡麄€(gè)會(huì) 話進(jìn)行計(jì)算。
11) 除了搜索，在該選擇之后對于給定的搜索查詢發(fā)生多少搜索結(jié)果頁面瀏覽。這可以在査詢內(nèi)(即，僅僅對于唯一查詢)或?qū)τ谡?個(gè)會(huì)話進(jìn)行計(jì)算。12) 在該會(huì)話中發(fā)生的頁面瀏覽的總數(shù)；
13) 在顯示廣告的會(huì)話中頁面瀏覽的數(shù)量；
14) 在顯示廣告的會(huì)話中頁面瀏覽的數(shù)量相對于該會(huì)話中發(fā)生的頁面瀏覽的總數(shù)的比值；
15) 在會(huì)話中顯示的廣告閃現(xiàn)的總數(shù)；
16) 每個(gè)顯示廣告的査詢所顯示的廣告的平均數(shù)，該會(huì)話的另一個(gè)商業(yè)化測量；
17) 查詢掃描時(shí)間——從用戶看到査詢結(jié)果到用戶做其他事情(點(diǎn) 擊廣告、搜索結(jié)果、下一頁面、新査詢等)時(shí)用多長時(shí)間
18) 在給定査詢掃描時(shí)間與所有其他查詢掃描時(shí)間之間的比值；
19) 在給定搜索中發(fā)生的選擇(例如，點(diǎn)擊)的總數(shù)。這些選擇包括所有類型的選擇(例如，搜索、onebox、廣告)，而不是僅僅廣告選擇；
20) 在給定的廣告選擇之前在搜索中發(fā)生的選擇的總數(shù)；
21) 在給定的廣告選擇之后在搜索中發(fā)生的選擇的總數(shù)；
22) 在搜索中發(fā)生的廣告選擇的總數(shù)。可能需要用頁面上的廣告數(shù)量來規(guī)范化；
23) 在給定的廣告選擇之前在搜索中發(fā)生的廣告選擇的總數(shù)；
24) 在給定的廣告選擇之后在搜索中發(fā)生的廣告選擇的總數(shù)；
25) 在搜索中發(fā)生的、其在文檔上的廣告位置位于文檔上的給定廣告位置之上的廣告選擇的總數(shù)；
26) 在搜索中發(fā)生的、其在文檔上的廣告位置位于文檔上的給定廣告位置之下的廣告選擇的總數(shù)；
27) 在搜索中發(fā)生的不是對給定廣告的廣告選擇的總數(shù)；
28) 在搜索中發(fā)生的搜索結(jié)果選擇的總數(shù)
29) 在給定的廣告選擇之前在搜索中發(fā)生的搜索選擇的總數(shù)；
30) 在給定的廣告選擇之后在搜索中發(fā)生的搜索結(jié)果選擇的總數(shù)；
31) 在會(huì)話中發(fā)生的長持續(xù)時(shí)間的搜索結(jié)果選擇的總數(shù)；
32) 在會(huì)話中發(fā)生的短持續(xù)時(shí)間的搜索結(jié)果選擇的總數(shù)；
33) 在會(huì)話中最后發(fā)生的搜索結(jié)果選擇的總數(shù)。給定用戶可以通
過點(diǎn)擊搜索結(jié)果來結(jié)束會(huì)話，而不需要后續(xù)動(dòng)作，或者用戶可以以其他方式(例如，廣告結(jié)果點(diǎn)擊、發(fā)出查詢以及不點(diǎn)擊等)來結(jié)束會(huì)話；
34) 在搜索中發(fā)生的非搜索結(jié)果以及非廣告選擇的總數(shù)；
35) 是否存在來自該廣告選擇的轉(zhuǎn)換的表示；
36) 用戶的連接速度的表示(例如，撥號、線纜、DSL);
37) 用戶位于哪個(gè)國家的表示。不同的文化有可能導(dǎo)致用戶對相同的廣告有不同反應(yīng)，或者具有不同文化反應(yīng)，或者不同地停在網(wǎng)站上；
38) 用戶位于世界上的那個(gè)區(qū)域(例如，APAC二亞太區(qū))的表示；
39) 對于給定廣告的關(guān)鍵字是否與搜索査詢精確匹配(即，具有與查詢完全相同的術(shù)語)，或者是否缺失一個(gè)詞、多于一個(gè)詞、或者具有重寫術(shù)語。通常，廣告的質(zhì)量可能變化(匹配越精確，質(zhì)量越高)，并且關(guān)鍵字匹配可能是分割廣告的合理方式，并且預(yù)測廣告對于不同的匹配類型來說分別是好還是壞；
40) 對于給定廣告的估計(jì)點(diǎn)進(jìn)率(CTR)的表示；
41) 廣告商為給定的廣告選擇支付多少每次點(diǎn)擊成本(CPC) 廣告很好的可能性可以取決于廣告商支付了多少(越多質(zhì)量越高)；
42) 廣告商愿意支付多少CPC 在廣告拍賣中，可以使用廣告商出價(jià)來設(shè)置廣告排名，并且排名低于給定廣告/廣告商的廣告/廣告商設(shè) 置實(shí)際上將由下一個(gè)較高排名的廣告/廣告商支付的價(jià)格；
43) 有效CPC"頁測的CTR;或者
44) 出價(jià)CPC^預(yù)測的CTR。
上面描述了可以用于統(tǒng)計(jì)模型的會(huì)話特征的多個(gè)例子。但是，本
領(lǐng)域技術(shù)人員應(yīng)認(rèn)識到可以使用其他的會(huì)話特征，作為選擇，或者
與任意上述會(huì)話特征結(jié)合。
返回至圖5，然后可以推導(dǎo)出統(tǒng)計(jì)模型，用于確定每個(gè)所選廣告是給定與廣告選擇相關(guān)聯(lián)的所測會(huì)話特征的好質(zhì)量廣告的概率(框 250)?？梢允褂矛F(xiàn)有的統(tǒng)計(jì)技術(shù)(例如邏輯回歸)來推導(dǎo)出與本發(fā)明
的原理相一致的統(tǒng)計(jì)模型?；貧w包括發(fā)現(xiàn)用于將結(jié)果變量(因變量y)與一個(gè)或多個(gè)預(yù)測器(自變量&， X2，等)相關(guān)的函數(shù)。簡單的線性回歸假設(shè)如下形式的函數(shù)
<formula>formula see original document page 22</formula> 等式(1)并且發(fā)現(xiàn)co, Cl， C2等的值(ce被稱為"截距"或"常數(shù)項(xiàng))。在本發(fā)明的上下文中，每個(gè)預(yù)測器變量Xp X2， X3等對應(yīng)于廣告選擇期間測得的不同會(huì)話特征。邏輯回歸是普通回歸的變形，當(dāng)觀測到的結(jié) 果限定為兩個(gè)值時(shí)是很有用的，其通常表示某個(gè)結(jié)果事件的發(fā)生或未發(fā)生，(通常分別被編碼為l或0)，諸如在本發(fā)明的上下文中的好廣告或差廣告。
邏輯回歸產(chǎn)生作為獨(dú)立預(yù)測變量的函數(shù)對發(fā)生的概率進(jìn)行預(yù)測的公式。邏輯回歸通過采取線性回歸(上述等式(1))(其將生成位于正無窮大與負(fù)無窮大之間的任意y值)并用下面的函數(shù)對其進(jìn)行變換來符合特定S形曲線
<formula>formula see original document page 22</formula> 等式(2)
其中產(chǎn)生位于0 (當(dāng)y達(dá)到負(fù)無窮大時(shí))和1 (當(dāng)y達(dá)到正無窮大時(shí))之間的P值。將等式(1)代入等式(2)，這樣，好廣告的概率變?yōu)槿缦?br> <formula>formula see original document page 22</formula>
等式3
其中Cgo為等式的常數(shù)，Cgn為會(huì)話特征預(yù)測變量Xn的系數(shù)。類似地，可以通過下面的等式(4)來確定差廣告的概率
<formula>formula see original document page 22</formula>
等式4
其中CbO為等式的常數(shù)，Cbn為會(huì)話特征預(yù)測變量Xn的系數(shù)。
可以測試統(tǒng)計(jì)模型的符合，以確定哪個(gè)會(huì)話特征與好或差質(zhì)量廣
告相關(guān)。如果使用邏輯回歸技術(shù)來確定統(tǒng)計(jì)模型，則該邏輯回歸的目的是要通過使用最節(jié)儉的模型來正確預(yù)測各個(gè)情況的結(jié)果。為了實(shí)現(xiàn) 這一目的，創(chuàng)建一個(gè)模型，其中包括在預(yù)測因變量y的結(jié)果時(shí)有用的所有預(yù)測器變量(例如會(huì)話特征)。為了構(gòu)建統(tǒng)計(jì)模型，邏輯回歸可以在每個(gè)系數(shù)(C。)被增加或刪除后測試模型的符合，被稱為逐步回歸。
例如，可以使用反向逐步回歸，其中模型構(gòu)造從完整或飽和模型開始，并且在迭代過程中從模型中消除預(yù)測器變量以及它們的系數(shù)。在消除每個(gè)變量之后測試該模型的符合，以確保該模型仍舊足夠與數(shù)據(jù)符合。當(dāng)無法再從模型中消除預(yù)測器變量時(shí)，該模型的構(gòu)造就完成了。留在模型中的預(yù)測器變量(每一個(gè)對應(yīng)于所測的會(huì)話特征)識別與好或差廣告相關(guān)的會(huì)話特征。因而，邏輯回歸能夠提供不同預(yù)測器變量之間的關(guān)系和強(qiáng)度的了解。為了了解從模型包括或消除的重要性而測試系數(shù)以及它們相應(yīng)的預(yù)測器變量的過程可以包括幾個(gè)不同的已知技術(shù)。
這樣的技術(shù)可以包括Wald測試，相似性比率測試或者 Hosmer-Lemshow Goodness of Fit領(lǐng)!)試。這些系數(shù)測試技術(shù)在本領(lǐng)域內(nèi) 是已知的，并且這里將不再進(jìn)一步描述。在其他實(shí)現(xiàn)中，可以使用現(xiàn) 有的交叉確認(rèn)和單獨(dú)訓(xùn)練技術(shù)，來代替如上所述的分類估計(jì)以及測試回歸系數(shù)的技術(shù)。
代替或除了邏輯回歸，可以使用其他現(xiàn)有的統(tǒng)計(jì)技術(shù)來推導(dǎo)與本發(fā)明的原理相一致的統(tǒng)計(jì)模型。例如，使用"提級(boosting)"技術(shù) 的"枝端"模型可以被用來推導(dǎo)統(tǒng)計(jì)模型。本領(lǐng)域技術(shù)人員可以認(rèn)識到的是，"提級"是一種機(jī)器學(xué)習(xí)技術(shù)，用于通過連續(xù)地改進(jìn)其他弱的統(tǒng)計(jì)模型來建立統(tǒng)計(jì)模型。其基本思想是向整個(gè)訓(xùn)練數(shù)據(jù)集合重復(fù) 地應(yīng)用相同的算法，但是在每個(gè)階段對訓(xùn)練數(shù)據(jù)進(jìn)行不同地加權(quán)。該加權(quán)使得通過階段k與模型很好符合的情況在階段k+ 1接收相對小的權(quán)重，而通過階段k與模型不太符合的情況在階段k+l接收相對大的權(quán)重。
枝端是在每個(gè)階段都能夠應(yīng)用的弱統(tǒng)計(jì)模型。枝端是2葉分類樹，
其由根節(jié)點(diǎn)和二進(jìn)制規(guī)則構(gòu)成，其將情況分為兩個(gè)相互排斥的子集
(即，葉節(jié)點(diǎn))。規(guī)則可以采取形式"點(diǎn)擊持續(xù)時(shí)間(ClickDuration) < 120秒"，并且點(diǎn)擊持續(xù)時(shí)間滿足該規(guī)則的所有情況進(jìn)入一個(gè)葉節(jié)點(diǎn)，而不滿足該規(guī)則的情況進(jìn)入另一個(gè)葉節(jié)點(diǎn)。另一規(guī)則可以采取形式"廣告選擇是最后廣告選擇"，并且廣告選擇滿足該規(guī)則的所有情況進(jìn)入一個(gè)葉節(jié)點(diǎn)，而不滿足該規(guī)則的情況進(jìn)入另一個(gè)葉節(jié)點(diǎn)。
可以使用各種算法來符合"提級枝端"模型，包括例如基于梯度的方法。這樣的算法可以如下進(jìn)行給定一組權(quán)重，從所有可能的二
進(jìn)制判定規(guī)則中(從將該情況分為兩個(gè)葉子的會(huì)話特征中推到的)選擇一個(gè)將與該算法相關(guān)的(加權(quán))損耗函數(shù)最小化的規(guī)則。損耗函數(shù)
的一些例子是與最大相似法對應(yīng)的"伯努里式(Bernoulli)損耗"以及與周知的ADABoost方法對應(yīng)的"指數(shù)損耗"。在該階段選擇最佳二進(jìn)制判定規(guī)則之后，可以重新計(jì)算該權(quán)重，并可以重復(fù)該過程，借此選擇將新(加權(quán))損耗函數(shù)最小化的最佳二進(jìn)制規(guī)則。該過程可以被重復(fù)許多次(例如，幾百至幾千)并且可以使用重采樣法(例如，交叉確認(rèn))來定義停止規(guī)則，以便于防止過符合。
提級枝端已經(jīng)被顯示為近似附加邏輯回歸模型，因此每個(gè)特征都對符合模型作出附加的非線性貢獻(xiàn)(關(guān)于邏輯等級)。該枝端的序列定義會(huì)話特征與廣告被定級為"好"的概率之間的關(guān)系。該序列可以用如下的統(tǒng)計(jì)模型表示
e(c0+c,*B(x) + c2'B2(x)+...)
1 + ,。",*BIW+C2'B2W+...) 等式(5)
其中如果會(huì)話特征x滿足第k個(gè)二進(jìn)制規(guī)則則Bk (x) =1，或者如果會(huì)話特征x不滿足第k個(gè)二進(jìn)制規(guī)則則Bk (x) =0。該系數(shù)ck， k=l，...，是算法的副產(chǎn)品并且與在第k個(gè)二進(jìn)制規(guī)則的好廣告的可能性相關(guān)。實(shí)際上，給定會(huì)話特征x，就可以估計(jì)每個(gè)二進(jìn)制規(guī)則，并且相應(yīng)的系數(shù)被累計(jì)，以獲得好廣告的預(yù)測概率?？梢灶愃频赝茖?dǎo)出與上面的等式(5)類似的統(tǒng)計(jì)模型，其定義了會(huì)話特征與廣告被定級為
"差"的概率之間的關(guān)系。
雖然上面已經(jīng)描述了邏輯回歸和提級枝端作為構(gòu)造統(tǒng)計(jì)模型的示范性技術(shù)，但是本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識到也可以使用其他現(xiàn)有的統(tǒng)計(jì) 方法(例如回歸樹)來推導(dǎo)與本發(fā)明的原理一致的統(tǒng)計(jì)模型。
用于確定與廣告質(zhì)量相關(guān)的預(yù)測值的示范性過程圖14是根據(jù)與本發(fā)明的原理一致的實(shí)現(xiàn)的示范性過程的流程圖，用于確定與廣告的質(zhì)量相關(guān)的預(yù)測值。本領(lǐng)域技術(shù)人員可以理解，圖 14中舉例說明的過程可以被適當(dāng)?shù)匾攒浖韺?shí)現(xiàn)并被存儲(chǔ)在計(jì)算機(jī)可
讀存儲(chǔ)器中，諸如主存儲(chǔ)器430、 ROM 440或服務(wù)器320或330或客戶端310的存儲(chǔ)裝置450。
該示范性過程可以從接收搜索査詢開始(框1400)。用戶可以向服務(wù)器320發(fā)出搜索查詢，用于由搜索引擎系統(tǒng)325執(zhí)行。通過搜索引擎系統(tǒng)325可以獲得與所接收的搜索查詢相匹配的一組廣告(框 1405)。搜索引擎系統(tǒng)325可以根據(jù)所接收的搜索查詢來執(zhí)行搜索，以確定該組廣告，以及與該搜索査詢匹配的其他文檔。搜索引擎系統(tǒng) 325可以將該組廣告集合以及其他文檔的列表提供給發(fā)出該搜索請求的用戶。
可以獲得與從該組廣告中選擇廣告相關(guān)聯(lián)的會(huì)話特征(框1410)。可以在用戶廣告選擇期間實(shí)時(shí)地測量會(huì)話特征，或者可以從與廣告選擇相關(guān)聯(lián)的已記錄用戶行為的日志中獲得會(huì)話特征。如圖15中所示，用戶可以選擇1500與文檔1510 (例如，包含搜索結(jié)果和相關(guān)廣告的文檔)相關(guān)聯(lián)的廣告1505?？梢皂憫?yīng)于廣告選擇1505而將廣告定著文檔 1515提供給用戶。如圖15中所示，可以測量與廣告1505的選擇1500 相關(guān)聯(lián)的會(huì)話特征1520。所測量的會(huì)話特征可以包括與廣告選擇相關(guān) 聯(lián)的任意類型的用戶行為，諸如上面關(guān)于框510所述(圖5)。
上面的框520中推導(dǎo)出的統(tǒng)計(jì)模型以及所獲得的會(huì)話特征可以被用來確定表示該廣告是好廣告和/或差廣告的預(yù)測值(框1415)。該預(yù)
測值可以包括概率值(例如，使用上面的等式(3)或(5)取得的)，表示具有與該廣告的用戶選擇相關(guān)聯(lián)的給定會(huì)話特征是好廣告的概率。該預(yù)測值還可以包括概率值(上面的等式(4))，表示具有與該廣告的用戶選擇相關(guān)聯(lián)的給定測得會(huì)話特征是差廣告的概率。因此，可以將會(huì)話特征值輸入到等式(3) 、 (4)和/或(5)，以獲得該所選擇的廣告是好或差廣告的預(yù)測值。例如，可以將用于會(huì)話特征x,， x2， X3和X4的值輸入到等式(3)，以獲得P (good ad|session feature x,， x2， x3， x4)的概率值。如圖15所示，可以將該所測量的會(huì)話特征1520 輸入到統(tǒng)計(jì)模型130，并且該統(tǒng)計(jì)模型130可以輸出對于廣告1505的預(yù)測值1530。
可以獲得與廣告選擇相關(guān)聯(lián)的廣告/査詢特征(框1420)。如圖 15所示，可以獲得與廣告1505的選擇1500相關(guān)聯(lián)的廣告/查詢特征 1535。該廣告/查詢特征1535可以包括與廣告1505的廣告商相關(guān)聯(lián)的標(biāo)識符(例如，廣告商的可視統(tǒng)一資源定位符(URL))、廣告1505 定向的關(guān)鍵字、用戶發(fā)出的搜索查詢中廣告1505沒有定向的詞和/或用戶發(fā)出的搜索査詢中廣告沒有定向但是與廣告1505定向的詞類似的詞?？梢允褂门c本發(fā)明的原理一致的上面沒有描述的其他類型的廣告或査詢特征。例如，可以將組合(例如，兩個(gè)對象/査詢特征對)中觀査的任意上述廣告/查詢特征都用作單個(gè)廣告查詢/特征。
對于每個(gè)所獲得的廣告/查詢特征(即，在上面框1420中獲得的)，可以將所確定的預(yù)測值與對應(yīng)于廣告/査詢特征的存儲(chǔ)值求和(框 1425)。可以將所確定的預(yù)測值與存儲(chǔ)在數(shù)據(jù)結(jié)構(gòu)(諸如例如圖16中所示數(shù)據(jù)結(jié)構(gòu)1600中)的值求和。如圖16所示，數(shù)據(jù)結(jié)構(gòu)1600可以包括多個(gè)廣告/査詢特征1610-1至1610-N，其中"廣告選擇的總數(shù)" 1620、總"好的"預(yù)測值1630以及總"差的"預(yù)測值1640與每個(gè)廣告/査詢特征1610相關(guān)聯(lián)?？梢詫⒖?405中確定的每個(gè)預(yù)測值與存儲(chǔ)
在條目1630或1640中、對應(yīng)于每個(gè)廣告/査詢特征1610的當(dāng)前值求和，該廣告/查詢特征1610進(jìn)一步與廣告以及發(fā)布的查詢相關(guān)聯(lián)。作為例子，假設(shè)響應(yīng)于搜索查詢"flowers formother，s day (母親節(jié)的鮮花)" 而將"1800flowers.com"的廣告提供給用戶。與該廣告選擇相關(guān)聯(lián)的會(huì)話特征返回概率P (good ad|ad selection)為0.9。三個(gè)廣告/查詢特征與該廣告和査詢相關(guān)聯(lián)查詢長度(査詢中術(shù)語的數(shù)量)、廣告的可視URL以及在查詢中但是不在與該廣告相關(guān)聯(lián)的關(guān)鍵字中的詞的數(shù) 量。對于這三個(gè)廣告/查詢特征中的每一個(gè)，條目1620中相應(yīng)的"廣告選擇總數(shù)"值加1，并且將0.9加到存儲(chǔ)在與每個(gè)廣告/查詢特征對應(yīng)的總好預(yù)測值1630中的每個(gè)值。
如圖15中所示，可以將每個(gè)所確定的預(yù)測值1530與數(shù)據(jù)結(jié)構(gòu)1600 中的當(dāng)前值求和。一個(gè)或多個(gè)用戶可以選擇地對廣告的每個(gè)選擇重復(fù) 框1400至1425，以利用與一個(gè)或多個(gè)廣告/查詢特征相關(guān)聯(lián)的多個(gè)求和后的預(yù)測值來擴(kuò)充該數(shù)據(jù)結(jié)構(gòu)1600。
示范性可能性估計(jì)過程
圖17和18為示范性過程的流程圖，用于通過使用在圖14的框 1425中確定的總預(yù)測值1630或1640來估計(jì)與廣告相關(guān)聯(lián)的好或差質(zhì) 量的可能性。本領(lǐng)域技術(shù)人員應(yīng)理解，圖17和18中所示范的過程可以適當(dāng)?shù)匾攒浖韺?shí)現(xiàn)并且可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)器中，諸如主存儲(chǔ)器430、 ROM 440或服務(wù)器320或330或客戶端310的存儲(chǔ)裝置 450上。
給定廣告是好或差的所估計(jì)的可能性是該給定廣告是好或差的在先可能性以及與和給定廣告選擇相關(guān)聯(lián)的廣告/查詢特征相關(guān)聯(lián)的一個(gè) 或多個(gè)模型參數(shù)的函數(shù)?？梢允褂玫^程來計(jì)算該模型參數(shù)，其中該迭代過程試圖解決用于產(chǎn)生好或差廣告的預(yù)測可能性與訓(xùn)練所用的實(shí)際歷史數(shù)據(jù)的最佳擬合的參數(shù)值。
與每個(gè)廣告/查詢特征相關(guān)聯(lián)的模型特征可以由單個(gè)參數(shù)構(gòu)成，諸如關(guān)于好廣告或差廣告的概率或可能性的放大系數(shù)。可替代地，每個(gè) 廣告/査詢特征可以具有與其相關(guān)聯(lián)的多個(gè)模型參數(shù)，該多個(gè)模型參數(shù) 可以以更復(fù)雜的方式來影響好或差廣告的預(yù)測概率。
在下面的說明書中，使用了各種可能性和概率。事件發(fā)生的可能性以及事件發(fā)生的概率通過下面等式被關(guān)聯(lián)起來概率=可能性/ (可能性+l)。例如，如果事件發(fā)生的可能性為1/2 (即，按照經(jīng)常所寫的方式，可能性為1: 2)，則事件發(fā)生的相應(yīng)概率為1/3。根據(jù)該約定，可以認(rèn)為可能性和概率是可以相互轉(zhuǎn)換的。因?yàn)榭赡苄钥梢匀∪魏畏?負(fù)值，而概率必須位于0和1之間，所以用可能性而不是概率來表達(dá) 計(jì)算是方便的。但是，應(yīng)理解，僅需對下面的說明進(jìn)行最小的改變，即可以唯一使用概率、或者使用例如對數(shù)(可能性)的某種其他類似的表示來執(zhí)行如下的實(shí)現(xiàn)。
圖17是示出了預(yù)測模型的一個(gè)實(shí)現(xiàn)的流程圖，其中該預(yù)測模型用于基于與該廣告選擇相關(guān)聯(lián)的廣告/查詢特征來生成對于給定廣告是好還是差的可能性估計(jì)。根據(jù)本發(fā)明的原理的一個(gè)實(shí)現(xiàn)，可以通過將好廣告或差廣告的預(yù)先可能性(qo)乘以與每個(gè)廣告/查詢特征(ki)相關(guān) 聯(lián)的模型參數(shù)(nO來計(jì)算好或差廣告的可能性，此后被稱為可能性乘法器。這樣的方案可以被表示為
<formula>formula see original document page 28</formula>
本質(zhì)上，對于每個(gè)廣告/查詢特征k的可能性乘法器m可以是在確定廣告是好還是差期間該廣告/査詢特征的預(yù)測能力的統(tǒng)計(jì)表示。
在與本發(fā)明的原理一致的一個(gè)實(shí)現(xiàn)中，可以不斷地對上述模型參數(shù)進(jìn)行修改，以反映每個(gè)廣告/査詢特征k對于廣告是好或差的估計(jì)可能性的相關(guān)影響?？梢酝ㄟ^如下方式來進(jìn)行這樣的修改，即將具有該查詢/廣告特征的廣告是好或壞的平均預(yù)測可能性(將給定廣告/査詢特征忽略不計(jì))與具有該廣告/查詢特征的廣告的歷史質(zhì)量的估計(jì)進(jìn)行比
較。通過這種方式，可以識別以及提煉出所分析的廣告/查詢特征k的相關(guān)值。
具體地返回到圖17，對于每個(gè)所選擇的廣告/查詢特征(ki)，可以初始計(jì)算或識別平均自排除概率(P,)(動(dòng)作1700)。在一個(gè)實(shí)現(xiàn) 中，該自排除概率(Pi)是表示所選擇的廣告/査詢特征的相關(guān)性的值，并且可以測量當(dāng)從所估計(jì)的可能性計(jì)算中除去所選擇的廣告/查詢特征的模型參數(shù)(mi)時(shí)廣告是好或差的結(jié)果可能性。例如，對于廣告/査詢特征3，這可以表示為
尸3n +((《0-附|.附2,'"氣)/附3《((《0.附r附2'附3…'附"V附3 + U
在一個(gè)實(shí)施例中，每個(gè)廣告/查詢特征的自排除概率可以被保持為移動(dòng)平均，以確保所識別的自排除概率在識別用于每個(gè)所選廣告/查詢
特征的模型參數(shù)之后更快的收斂。這樣移動(dòng)平均可以表示為 ^ (，)=《"一d (呵)+ (1 -《
其中a為統(tǒng)計(jì)定義變量，其非常接近于1 (例如，0.999)并被用于控制移動(dòng)平均的半衰期。如上面表達(dá)式所示，通過如在以前廣告選擇(例如，n-l)確定的P,值對用于廣告選擇的當(dāng)前數(shù)(n)(例如，用于廣告/査詢特征ki的"廣告選擇總數(shù)"1620的當(dāng)前值)的Pi值加權(quán) 和平均。
然后，可以將平均自排除概率(Pi (avg))與涉及所觀測的廣告選擇的數(shù)量以及用于所觀測的選擇而觀測的好或差廣告的可能性的歷
史信息進(jìn)行比較(動(dòng)作1710)。然后，可以基于動(dòng)作nio的比較來生
成或修改與所選擇的廣告/査詢特征ki相關(guān)聯(lián)的模型參數(shù)mi(動(dòng)作1720) (如將在下面參照圖18中的框1820和1830進(jìn)一步描述的)。
圖18是示出了圖17的框1710-1720的一個(gè)示范性實(shí)現(xiàn)的流程圖。初始地，可以確定與好廣告或差廣告的可能性相關(guān)的置信區(qū)間(動(dòng)作 1800)。使用置信區(qū)間技術(shù)使得在使用具有更少量歷史數(shù)據(jù)的廣告/査
詢特征k時(shí)能夠更準(zhǔn)確和穩(wěn)定地估計(jì)。在一個(gè)實(shí)現(xiàn)中，該置信區(qū)間包括較低值Li和較高值Ui，并且基于廣告選擇的數(shù)量(ni)(例如，用
于廣告/查詢特征k,的數(shù)據(jù)結(jié)構(gòu)1600中的"廣告選擇的總數(shù)"1620中的當(dāng)前值)以及對所選廣告/査詢特征觀測的總好/差(ji)(例如，在用于廣告/査詢特征k,的數(shù)據(jù)結(jié)構(gòu)1600中的當(dāng)前總"好"預(yù)測值1630 或總"差"預(yù)測值1640)。例如，該置信區(qū)間可以是80X置信區(qū)間[Li， U,]，其是基于廣告選擇的數(shù)量(例如，在用于廣告/查詢特征ki的數(shù)據(jù) 結(jié)構(gòu)1600中的"廣告選擇的總數(shù)"1620中的當(dāng)前值)以及所觀測的總好或差(例如，用于廣告虔詢特征ki的數(shù)據(jù)結(jié)構(gòu)1600中的當(dāng)前總"好" 預(yù)測值1630或總"差"預(yù)測值1640)以常規(guī)方式計(jì)算的。在計(jì)算置信區(qū)間之后，然后可以確定該平均自排除概率(Pi (avg))是否落在該區(qū)間中(動(dòng)作1810)。如果落在區(qū)間中，則可以確定所選擇的廣告/査詢特征(ki)對于好廣告或差廣告的可能性沒有影響，并且可以將它的模型參數(shù)(mi)設(shè)置為1，這非常有效地將其從所估計(jì)的可能性計(jì)算中除去(動(dòng)作1820)。但是，如果確定該P(yáng)i (avg)落在置信區(qū)間之外，則可以將用于所選擇的廣告/查詢特征kj的模型參數(shù)(mi)設(shè)置為將該自排除概率(Pi(avg))置于置信區(qū)間中所必要的最小調(diào)整(動(dòng)作1830)。該計(jì)算可以算術(shù)地表示為
<formula>formula see original document page 30</formula>
現(xiàn)在返回到圖17，在計(jì)算了用于所選擇的廣告/查詢特征ki的模型參數(shù)后，可以確定附加的廣告/查詢特征(例如，圖16中的廣告/查詢特征1610-1至1610-N的)是否還要被處理(即，ki是否小于km，其中m等于在數(shù)據(jù)結(jié)構(gòu)1600中的廣告/查詢特征的總數(shù))。如果仍需要處理附加的廣告/查詢特征，則可以增加計(jì)數(shù)器變量i，并且該過程可以返回至動(dòng)作1700，以處理下一廣告/查詢特征kj。在用于所有廣告/査詢特征的模型參數(shù)都己經(jīng)被計(jì)算或修改后，可以使用等式q-q。.m,.m2. !113....111111來估計(jì)好廣告或差廣告的可能性(動(dòng)作1750)?？梢詫⑺?計(jì)的好廣告可能性(例如，ODDS (good ad|ad /query feature))存儲(chǔ) 在與該廣告/查詢特征1610對應(yīng)的數(shù)據(jù)結(jié)構(gòu)1600的"好"廣告可能性
條目1650中?？梢詫⑺烙?jì)的差廣告可能性(例如，ODDS (badad|ad /query feature))存儲(chǔ)在與該廣告/査詢特征1610對應(yīng)的數(shù)據(jù)結(jié)構(gòu)1600 的"差"廣告可能性條目1660中。
在與本發(fā)明的原理一致的一個(gè)實(shí)現(xiàn)中，可以通過當(dāng)日志數(shù)據(jù)到達(dá) 時(shí)對其進(jìn)行處理并對上述統(tǒng)計(jì)進(jìn)行累計(jì)(例如，廣告選擇、總好或差、自包括概率等)來訓(xùn)練可能性預(yù)測模型。當(dāng)附加的廣告選擇發(fā)生時(shí)，與每個(gè)廣告/査詢特征相關(guān)聯(lián)的置信區(qū)間可以收縮，并且該參數(shù)估計(jì)可
以變得更準(zhǔn)確。在附加的實(shí)現(xiàn)中，通過重新處理舊的日志數(shù)據(jù)，可以加速訓(xùn)練。在對日志數(shù)據(jù)進(jìn)行重新處理時(shí)，可以通過使用最新的參數(shù) 或可能性乘數(shù)值來重新計(jì)算好廣告或差廣告的估計(jì)可能性。這允許預(yù) 測模型更快地收斂。
示范性廣告質(zhì)量預(yù)測過程
圖19是根據(jù)與本發(fā)明的原理一致的實(shí)現(xiàn)的用于預(yù)測廣告質(zhì)量的示范性過程的流程圖。本領(lǐng)域技術(shù)人員應(yīng)理解，圖19中所示的過程可以適當(dāng)?shù)匾攒浖韺?shí)現(xiàn)并存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)器中，諸如主存儲(chǔ)器 430、 ROM 440或服務(wù)器320或330或客戶端310的存儲(chǔ)裝置450中。
該示范性過程可以以從用戶接收搜索查詢開始(框1900)。用戶可以向服務(wù)器320發(fā)出搜索查詢，以由搜索引擎系統(tǒng)325來執(zhí)行。搜索引擎系統(tǒng)325可以獲得與所接收的搜索査詢相匹配的一組廣告(框 1910)。搜索引擎系統(tǒng)325可以基于所接收的搜索查詢來執(zhí)行搜索，以確認(rèn)該組廣告以及與該搜索查詢匹配的其他文檔。對于該組廣告中的每個(gè)廣告，可以確定與所接收的搜索査詢以及廣告對應(yīng)的每個(gè)廣告/ 查詢特征(框1920)。用于每個(gè)搜索査詢和廣告對的廣告/查詢特征可以包括與登廣告商相關(guān)聯(lián)的標(biāo)識符(例如，廣告商的可視統(tǒng)一資源定位符(URL))、廣告定向的關(guān)鍵字、用戶發(fā)出的搜索查詢中的沒有定向的詞和/或用戶發(fā)出的搜索查詢中沒有定向但是與廣告定向的詞類似的詞。也可以使用與本發(fā)明的原理一致的上面沒有描述的其他類型
的廣告或查詢特征。例如，可以將組合(例如，兩個(gè)廣告/査詢特征的對)中觀測的任意上述廣告/查詢特征用作單一廣告査詢/特征。
對于該組廣告中的每一個(gè)廣告，可以從數(shù)據(jù)結(jié)構(gòu)1600中檢索用于
所確定的廣告/査詢特征i的所存儲(chǔ)的ODDS;(例如，ODDS (good adjad /query feature ) 1650， ODDS (bad ad|ad/query feature )1660)(框1930)。如圖20中所示，數(shù)據(jù)結(jié)構(gòu)1600可以以廣告/查詢特征2000為索引，其中該廣告/査詢特征2000對應(yīng)于搜索查詢和廣告，以檢索與每個(gè)廣告/ 查詢特征相關(guān)聯(lián)的一個(gè)或多個(gè)ODDSi2010。例如，如圖16中所示，可以檢索與每個(gè)廣告/查詢特征1610對應(yīng)的"好"廣告可能性值1650。在另一個(gè)例子中，如圖16所示，可以檢索與每個(gè)廣告/查詢特征1610 對應(yīng)的"差"廣告可能性值1660。
對于該組廣告中的每一個(gè)廣告，可以將用于每個(gè)廣告/查詢特征i 的所檢索的ODDSj相乘(框1940)，以生成總ODDS值(ODDSt): ODDSt二ODDSJODDS^ODDS3… 等式(6)
例如，可以將對于每個(gè)廣告/査詢特征的"好"廣告可能性值1650
相乘，以生成總好廣告可能性值ODDSt—goodad。作為另一個(gè)例子，可
以將對于每個(gè)廣告/查詢特征的"差"廣告可能性值1660相乘，以生成總差廣告可能性值ODDS^adad。如圖20所示，可以將從數(shù)據(jù)結(jié)構(gòu)1600 中檢索的ODDS 2010相乘，以生成總可能性值ODDSt2020。
對于該組廣告中的每個(gè)廣告，可以通過如下等式來確定可以包括該廣告是好的概率(Pgoodad)和/或該廣告是差的概率(Pbadad)的質(zhì) 量參數(shù)(框1950):
Pgood ad = ODDSt—good ad/ (l+ODDSt—GooD ad) 等式(7)
Pbad ad = ODDStBAD AD/ (l+ODDStBADAD) 等式(8)
如在圖20中所示，可以使用總的可能性值ODDSt 1820和等式(7)
或(8)來推導(dǎo)質(zhì)量參數(shù)(P) 2030。推導(dǎo)出的質(zhì)量參數(shù)P之后可以被
用于、例如，過濾、排名和/或提升，如在與本申請同一天提交、發(fā)明
名禾爾為"Using Estimated Ad Qualities for Ad Filtering, Ranking and Promotion"的同時(shí)待審的美國申請No.l 1/321,064中所描述的，通過引用而將該申請全部合并于此。
結(jié)論
以上對本發(fā)明的優(yōu)選實(shí)施例的描述提供了例證和說明，但并不意欲窮舉本發(fā)明或者將本發(fā)明限制為所披露的精確形式?？梢园凑丈厦?br> 的教導(dǎo)或者從本發(fā)明的實(shí)踐中獲得對本發(fā)明的某些更改和變化。例如，雖然己經(jīng)參照圖5、 14、和17-19描述了一系列動(dòng)作，但是在與本發(fā)明原理相一致的其他實(shí)現(xiàn)中可以修改這些動(dòng)作的順序。此外，互不依賴的動(dòng)作可以被并行執(zhí)行。
除了上面參照圖5描述的會(huì)話特征之外，在一些實(shí)現(xiàn)中可以可選地使用轉(zhuǎn)換跟蹤來推導(dǎo)預(yù)測值與用戶滿意度之間的直接標(biāo)度。當(dāng)對廣告的選擇直接導(dǎo)致了廣告商認(rèn)為有價(jià)值的用戶行為(例如，用戶購買) 時(shí)，就發(fā)生了轉(zhuǎn)換。廣告商或者為廣告商寄放廣告的服務(wù)可以跟蹤對于每個(gè)廣告選擇是否都發(fā)生了轉(zhuǎn)換。例如，如果用戶選擇了廣告商的廣告，并且隨后在線購買了在響應(yīng)于廣告選擇而提供給用戶的廣告定著文檔上顯示的產(chǎn)品，則廣告主或者寄放廣告的服務(wù)可以記錄關(guān)于該廣告選擇的轉(zhuǎn)換。該轉(zhuǎn)換跟蹤數(shù)據(jù)可以與所識別的廣告選擇相關(guān)聯(lián)。可以使用統(tǒng)計(jì)技術(shù)，例如，邏輯回歸、回歸樹、提級枝端等來推導(dǎo)在預(yù)測值與通過轉(zhuǎn)換測得的用戶滿意度之間的直接標(biāo)度。
對于本領(lǐng)域內(nèi)的普通技術(shù)人員來說，在圖中所示的實(shí)現(xiàn)中可以使用軟件、固件以及硬件的許多不同的形式來實(shí)現(xiàn)本發(fā)明如上所述的各個(gè)方面。用于實(shí)現(xiàn)與本發(fā)明原理相一致的各個(gè)方面的實(shí)際軟件代碼或專用控制硬件不會(huì)限制本發(fā)明。這樣，沒有參照特定軟件代碼來描述各個(gè)方面的操作和行為，然而，可以理解的是，基于這里的描述，本
領(lǐng)域內(nèi)的普通技術(shù)人員將能夠設(shè)計(jì)軟件和控制硬件來實(shí)現(xiàn)這些方面。
本發(fā)明申請中使用的元件、動(dòng)作或指令等不應(yīng)被構(gòu)造為對本發(fā)明來說是關(guān)鍵的或必不可少的，除非明確描述的確如此。而且，正如這里所使用的，冠詞"一"意欲包括一個(gè)或多個(gè)項(xiàng)目。在意圖僅表示一個(gè)項(xiàng)目的地方，使甩術(shù)語"一個(gè)"或類似用語。進(jìn)一步，短語"基于" 意欲表示"至少部分基于"，除非已明確地表示并非如此。
權(quán)利要求
1. 一種方法，包括確定與對多個(gè)廣告的選擇相關(guān)聯(lián)的質(zhì)量值，該質(zhì)量值估計(jì)所述多個(gè)廣告是好廣告的可能性；聚合所述質(zhì)量值；以及使用所聚合的質(zhì)量值來預(yù)測另一個(gè)廣告是好廣告的將來的可能性。
2. 根據(jù)權(quán)利要求l所述的方法，其中，查詢與對所述多個(gè)廣告的每個(gè)選擇相關(guān)聯(lián)。
3. 根據(jù)權(quán)利要求2所述的方法，進(jìn)一步包括基于與對所述多個(gè)廣告的選擇相關(guān)聯(lián)的一個(gè)或多個(gè)廣告或查詢特征來聚合所述質(zhì)量值。
4. 根據(jù)權(quán)利要求3所述的方法，其中，所述一個(gè)或多個(gè)廣告或查詢特征中的每個(gè)包括與所述多個(gè)廣告的每個(gè)廣告的廣告主相關(guān)聯(lián)的標(biāo) 識符、所述多個(gè)廣告中的每個(gè)廣告所定向的關(guān)鍵字、所述查詢中所述多個(gè)廣告中的每個(gè)廣告沒有定向的詞、或者所述査詢中所述多個(gè)廣告中的每個(gè)廣告沒有定向但與所述多個(gè)廣告中的每個(gè)廣告所定向的詞類似的詞。
5. 根據(jù)權(quán)利要求3所述的方法，其中，聚合所述質(zhì)量值包括基于所述一個(gè)或多個(gè)廣告或査詢特征來索引數(shù)據(jù)結(jié)構(gòu)，以存儲(chǔ)所述質(zhì)量值。
6.根據(jù)權(quán)利要求5所述的方法，進(jìn)一步包括: 接收查詢；獲得與所述査詢相關(guān)的一組廣告；接收對所述一組廣告中另一個(gè)廣告的選擇；并且觀測與對所述另一個(gè)廣告的選擇相關(guān)聯(lián)的一個(gè)或多個(gè)第二廣告或查詢特征。
7. 根據(jù)權(quán)利要求6所述的方法，其中，所述一個(gè)或多個(gè)第二廣告或査詢特征包括以下各項(xiàng)中的至少一項(xiàng)與所述另一個(gè)廣告的廣告主相關(guān)聯(lián)的標(biāo)識符、所述另一個(gè)廣告所定向的關(guān)鍵字、所述查詢中所述另一個(gè)廣告沒有定向的詞、或者所述査詢中所述另一個(gè)廣告沒有定向但與所述另一個(gè)廣告所定向的詞類似的詞。
8. 根據(jù)權(quán)利要求6所述的方法，其中，使用所聚合的質(zhì)量值來預(yù) 測另一個(gè)廣告是好廣告的將來的可能性包括基于所述一個(gè)或多個(gè)第二廣告或査詢特征從所述數(shù)據(jù)結(jié)構(gòu)中檢索所聚合的質(zhì)量值中的至少一些。
9. 一種方法，包括響應(yīng)于搜索查詢向用戶提供一個(gè)或多個(gè)廣告；記錄與對所述一個(gè)或多個(gè)廣告的用戶選擇相關(guān)聯(lián)的用戶行為；記錄與所述一個(gè)或多個(gè)廣告中被選擇的廣告相關(guān)聯(lián)、或者與所述搜索查詢相關(guān)聯(lián)的特征；使用統(tǒng)計(jì)模型和所記錄的用戶行為來估計(jì)與所選擇的廣告相關(guān)聯(lián)的質(zhì)量分值；聚合所估計(jì)的質(zhì)量分值；以及使用所聚合的質(zhì)量分值來預(yù)測另一個(gè)廣告的質(zhì)量。
10. 根據(jù)權(quán)利要求9所述的方法，其中，在存儲(chǔ)器中聚合所估計(jì) 的質(zhì)量分值包括基于所記錄的特征來索引數(shù)據(jù)結(jié)構(gòu)，以存儲(chǔ)所估計(jì)的質(zhì)量分值。
11. 根據(jù)權(quán)利要求9所述的方法，其中，所記錄的特征中的每一個(gè)包括以下各項(xiàng)中的至少一項(xiàng)與所述一個(gè)或多個(gè)廣告中相應(yīng)的廣告相關(guān)聯(lián)的標(biāo)識符、所述一個(gè)或多個(gè)廣告中相應(yīng)的廣告所定向的關(guān)鍵字、在所述搜索査詢的査詢中所述一個(gè)或多個(gè)廣告中的每個(gè)廣告沒有定向的詞、以及所述搜索查詢中所述一個(gè)或多個(gè)廣告中的每個(gè)廣告沒有定向但與所述一個(gè)或多個(gè)廣告中的每個(gè)廣告所定向的詞類似的詞。
12. —種方法，包括從用戶接收搜索査詢；基于所述搜索查詢向用戶提供一組廣告；從所述用戶接收從所述一組廣告中選擇廣告的指示；記錄與所述搜索査詢或者與所選擇的廣告相關(guān)聯(lián)的特征；使用所記錄的特征從存儲(chǔ)器中檢索以往的質(zhì)量分值；以及基于所檢索的以往的質(zhì)量分值來預(yù)測所選擇的廣告的將來的質(zhì)
13.根據(jù)權(quán)利要求12所述的方法，其中，所記錄的特征的每一個(gè) 包括以下各項(xiàng)中的至少一項(xiàng)與所選擇的廣告相關(guān)聯(lián)的標(biāo)識符、所述所選擇的廣告所定向的關(guān)鍵字、在所述搜索查詢中所述所選擇的廣告沒有定向的詞、以及所述搜索查詢中所述所選擇的廣告沒有定向但與所述所選擇的廣告所定向的詞類似的詞。
14.根據(jù)權(quán)利要求12所述的方法，其中，從存儲(chǔ)器中檢索以往的質(zhì)量分值包括-.使用所記錄的特征來索引所述存儲(chǔ)器中的數(shù)據(jù)結(jié)構(gòu)，以檢索以往的質(zhì)量分值。
15.根據(jù)權(quán)利要求12所述的方法，其中，根據(jù)所檢索的以往的質(zhì) 量分值來預(yù)測所選擇的廣告的將來的質(zhì)量包括-將算法應(yīng)用到所檢索的以往的質(zhì)量分值，以提供預(yù)測所述廣告的將來的質(zhì)量的值。
16. —種系統(tǒng)，包括用于基于用戶發(fā)出的搜索査詢向所述用戶提供多個(gè)廣告的裝置；用于從所述用戶接收從所述多個(gè)廣告中選擇廣告的指示的裝置；用于記錄與所述搜索査詢或者與所選擇的廣告相關(guān)聯(lián)的特征的裝置；用于使用所記錄的特征從數(shù)據(jù)結(jié)構(gòu)中檢索以往的質(zhì)量分值的裝置；以及用于基于所檢索的以往的質(zhì)量分值來預(yù)測所選擇的廣告的質(zhì)量的裝置。
17. —種存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì)，包括用于確定與對廣告的多個(gè)選擇相關(guān)聯(lián)的質(zhì)量值的指令，其中每個(gè)質(zhì)量值估計(jì)在第一環(huán)境下所述廣告是好廣告的可能性；用于存儲(chǔ)所述質(zhì)量值的指令；以及使用所存儲(chǔ)的質(zhì)量值來預(yù)測在第二環(huán)境下所述廣告是好廣告的將來的可能性，其中所述第二環(huán)境不同于所述第一環(huán)境。
全文摘要
一種系統(tǒng)，響應(yīng)于搜索查詢向用戶提供一個(gè)或多個(gè)廣告，并記錄與用戶對該一個(gè)或多個(gè)廣告的選擇相關(guān)聯(lián)的用戶行為。該系統(tǒng)也記錄與該一個(gè)或多個(gè)廣告中所選擇的廣告、或者與該搜索查詢相關(guān)聯(lián)的特征。該系統(tǒng)進(jìn)一步使用統(tǒng)計(jì)模型和所記錄的用戶行為來估計(jì)與所選擇的廣告相關(guān)聯(lián)的質(zhì)量分值，并且聚合所估計(jì)的質(zhì)量分值。該系統(tǒng)使用所聚合的質(zhì)量分值來預(yù)測另一個(gè)廣告的質(zhì)量。
文檔編號G06Q30/00GK101390118SQ200680053448
公開日2009年3月18日申請日期2006年12月29日優(yōu)先權(quán)日2005年12月30日
發(fā)明者丹尼爾·賴特, 達(dá)利爾·普雷格波恩, 黛安娜·唐申請人:谷歌公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：丹尼爾.賴特;達(dá)利爾.普雷格波恩;黛安娜.唐
技術(shù)所有人：谷歌公司
我是此專利的發(fā)明人

上一篇：增強(qiáng)眾核處理器的可靠性的制作方法
上一篇：用于使用條形碼的支付服務(wù)的方法和設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

預(yù)測廣告質(zhì)量的制作方法