用于關(guān)鍵字建議的系統(tǒng)和方法
【專利摘要】公開了用于向廣告者建議競標(biāo)關(guān)鍵字的系統(tǒng)和方法。系統(tǒng)包括非暫態(tài)處理器可讀存儲介質(zhì)和與該存儲介質(zhì)通信的處理器,該非暫態(tài)處理器可讀存儲介質(zhì)包括用于向廣告者建議競標(biāo)關(guān)鍵字的一組指令。處理器被配置為運(yùn)行該組指令以:從廣告者接收廣告創(chuàng)意;基于所述廣告創(chuàng)意,在不使用外部輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。
【專利說明】
用于關(guān)鍵字建議的系統(tǒng)和方法
技術(shù)領(lǐng)域
[0001] 本申請總體涉及在線廣告系統(tǒng)。更具體地,本申請涉及用于針對在線廣告者的關(guān) 鍵字建議的系統(tǒng)和方法。
【背景技術(shù)】
[0002] 作為廣告者向潛在顧客和客戶公開關(guān)于貨品和服務(wù)的信息的方式,在線廣告已經(jīng) 變得越來越流行。廣告者可通過使用諸如Yahoo!公司之類的在線提供商的網(wǎng)絡(luò)可訪問設(shè)施 來實現(xiàn)廣告活動。在線提供商用來將廣告者與訪問在線資源(例如,搜索引擎和新聞以及信 息站點(diǎn))的用戶相連接。廣告者的廣告("ad")被提供給用戶以通知并吸引用戶的注意。
[0003] 在線提供商使得多個市場可用于由廣告者進(jìn)行廣告活動。例如,Yahoo!公司在個 人計算機(jī)("PC")上以及移動平臺上的應(yīng)用("app")中提供許多它的流行的web資產(chǎn)(例如, 它的首頁和主頁)用于廣告活動。
[0004] -些在線廣告是依據(jù)關(guān)鍵字的。例如,廣告者可競標(biāo)以基于從用戶接收的搜索查 詢在搜索引擎網(wǎng)站上顯示廣告。原生廣告(一種形式的在線廣告方法,其中廣告者試圖通過 提供用戶的經(jīng)歷的上下文中的內(nèi)容來增加注意)也與特定用戶所關(guān)聯(lián)的關(guān)鍵字重度相關(guān)。
[0005] 通常針對這些依據(jù)關(guān)鍵字的廣告,當(dāng)廣告者公開新的產(chǎn)品和/或服務(wù)時,除了創(chuàng)建 與產(chǎn)品和/或服務(wù)相關(guān)聯(lián)的廣告創(chuàng)意之外,廣告者需要規(guī)定類別信息以及種子關(guān)鍵字的列 表(即,廣告者建議的競標(biāo)關(guān)鍵字)。對于初始類別信息和種子關(guān)鍵字的要求對廣告者提出 了額外負(fù)擔(dān),使得廣告服務(wù)不那么方便。另外,因為廣告者可能不是在線廣告的專家,廣告 者可能不能提供準(zhǔn)確和有效的種子關(guān)鍵字。因此,提供自動關(guān)鍵字和類別建議的在線廣告 系統(tǒng)可在廣告市場中具有更多優(yōu)勢。
【發(fā)明內(nèi)容】
[0006] 根據(jù)本公開的一方面,一種系統(tǒng)包括非暫態(tài)處理器可讀存儲介質(zhì)和與該存儲介質(zhì) 通信的處理器,該非暫態(tài)處理器可讀存儲介質(zhì)包括用于向廣告者建議競標(biāo)關(guān)鍵字的一組指 令。處理器可被配置為運(yùn)行該組指令以:從廣告者接收廣告創(chuàng)意;基于所述廣告創(chuàng)意,在不 使用外部輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以 及返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。
[0007] 根據(jù)本公開的另一方面,一種用于向廣告者建議競標(biāo)關(guān)鍵字的計算機(jī)實現(xiàn)的方法 可包括:由計算機(jī)從廣告者接收廣告創(chuàng)意;由至少一個計算機(jī)基于所述廣告創(chuàng)意,在不使用 外部輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及由 計算機(jī)返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。
[0008] 根據(jù)本公開的另一方面,一種非暫態(tài)處理器可讀存儲介質(zhì)可包括被配置為指令處 理器執(zhí)行以下動作的一組指令:從廣告者接收廣告創(chuàng)意;基于所述廣告創(chuàng)意,在不使用外部 輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及返回該 推薦關(guān)鍵字用于在線廣告競標(biāo)。
[0009]本公開的這些以及其他優(yōu)點(diǎn)、方面和新穎特征以及其示出的實施例的細(xì)節(jié)將根據(jù) 以下描述和圖示被更全面地理解。
【附圖說明】
[0010]圖1是示例在線信息系統(tǒng)的框圖;
[0011] 圖2是示出服務(wù)器的示例實施例的示意圖;
[0012] 圖3是示出客戶端設(shè)備的示例實施例的示意圖;
[0013] 圖4是示出用于提供具有搜索結(jié)果的列表的互聯(lián)網(wǎng)搜索頁面的系統(tǒng)的示例;
[0014] 圖5是根據(jù)本公開的示例實施例的競標(biāo)關(guān)鍵字建議系統(tǒng)的示意圖;
[0015] 圖6是示出如何確定關(guān)鍵字的特征向量的流程圖;
[0016] 圖7是根據(jù)本公開的示例實施例的關(guān)鍵字建議的第一階段的流程圖;
[0017] 圖8是示出根據(jù)本公開的示例實施例的關(guān)鍵字建議的第二階段的流程圖;以及
[0018] 圖9是示出根據(jù)本公開的示例實施例的回歸訓(xùn)練過程的流程圖。
【具體實施方式】
[0019] 本公開中的示例實施例提供了用于競標(biāo)關(guān)鍵字建議的系統(tǒng)和方法。系統(tǒng)可實現(xiàn)該 方法以幫助提供廣告服務(wù)。使用這些系統(tǒng)和方法,廣告者無需提供它的廣告創(chuàng)意的類別信 息和/或初始種子關(guān)鍵字,即可接收所建議的用于競標(biāo)在線廣告拍賣的關(guān)鍵字。為此,系統(tǒng) 和方法可實現(xiàn)兩階段的關(guān)鍵字分析方法。在階段1分析中,系統(tǒng)和方法可基于特征相似度分 析從關(guān)鍵字?jǐn)?shù)據(jù)庫中選擇多個候選關(guān)鍵字。在階段1分析中,系統(tǒng)和方法可進(jìn)一步通過綜合 地評估候選關(guān)鍵字與廣告創(chuàng)意的特征相似度、語義相似度和類別相似度來細(xì)化選擇。最終 選擇可被廣告者用作競標(biāo)關(guān)鍵字。
[0020] 現(xiàn)在將參考附圖在下文中更完全地描述主題,附圖形成本文的一部分并且通過圖 示的方式顯示具體的示例實施例。然而,可以以各種不同的方式實施主題,因此所覆蓋或所 要求的主題旨在被解釋為不限制于本文所闡述的任何示例實施例,所提供的示例實施例僅 僅是說明性的。同樣地,旨在為所要求或覆蓋的主題包括合理的廣闊范圍。此外,例如,主題 可以作為方法、設(shè)備、組件或系統(tǒng)被實施。因此,下面的詳細(xì)描述不旨在被理解為對所要求 保護(hù)的樞圍造成限制。
[0021] 在整個說明書和權(quán)利要求書中,術(shù)語可能具有上下文暗示或隱含的超越了明確說 明的意思的微妙含義。同樣的,如本文所用的短語"在一個實施例中"并不一定指的是同一 實施例,如本文所用的短語"在另一實施例中"并不一定指的是不同的實施例。所打算的是, 例如,所要求保護(hù)的主題包括示例實施例的全部或部分的組合。
[0022]在一般情況下,可以至少部分地從上下文中的用法來理解術(shù)語。例如,術(shù)語,比如 如本文中所用的"和"、"或"或"和/或"可以包括各種含義,其可能至少部分取決于使用這些 術(shù)語的上下文。通常,如果用于關(guān)聯(lián)列表,比如A、B或C,則"或"不僅意在表示A、B和C,這里用 于包含意義,而且還表示A、B或C,這里用于獨(dú)有意義。此外,如本文中所用的至少部分取決 于上下文的術(shù)語"一個或多個",可以用于描述單數(shù)意義的任何特征、結(jié)構(gòu)或特性,或者可以 用于描述復(fù)數(shù)意義的特征、結(jié)構(gòu)或特性的組合。類似地,術(shù)語,比如"一"或"該",再次,可以 理解為傳達(dá)單數(shù)用法或傳達(dá)復(fù)數(shù)用法,至少部分取決于上下文。此外,術(shù)語"根據(jù)"可以理解 為不一定旨在傳達(dá)專屬的一套因素,而是可能相反,(再次至少部分取決于上下文)允許不 一定被明確說明的附加的因素的存在。
[0023] 在線信息系統(tǒng)將廣告者的廣告放置于對末端用戶可用的內(nèi)容服務(wù)(例如,web頁 面、移動應(yīng)用("app")、TV app、或其他音頻或視覺內(nèi)容服務(wù))內(nèi)。廣告與其他內(nèi)容一同被提 供。其他內(nèi)容可包括文本、圖形、音頻、視頻、或者到這些內(nèi)容的鏈接的任意組合。廣告按照 慣例是基于多種標(biāo)準(zhǔn)(包括由廣告者規(guī)定的那些)進(jìn)行選擇的。按照慣例,廣告者定義廣告 活動來控制廣告如何以及何時可用于用戶并且來規(guī)定那些廣告的內(nèi)容。廣告的內(nèi)容本身有 時被稱作一個廣告創(chuàng)意或多個廣告創(chuàng)意。
[0024] 各種貨幣化技術(shù)或模型可結(jié)合贊助廣告來使用。在拍賣類型的在線廣告市場中, 廣告者可結(jié)合廣告的放置進(jìn)行競標(biāo),但是在確定廣告選擇或排名時也可包括其他因素。對 于依據(jù)關(guān)鍵字的廣告,競標(biāo)可與一個或多個關(guān)鍵字或某些特定事件(occurrence)所關(guān)聯(lián)的 一個或多個搜索查詢相關(guān)聯(lián)。競標(biāo)還可與廣告者針對某些特定事件(例如,針對廣告的放置 或點(diǎn)擊)支付的數(shù)額相關(guān)聯(lián)。廣告者針對在線廣告的支付可在各方之間進(jìn)行劃分,它們包括 一個或多個發(fā)行商或發(fā)行商網(wǎng)絡(luò)、一個或多個市場促進(jìn)者或提供商、或者潛在地包括其他 方。
[0025] 一些模型可包括保證送達(dá)廣告或非保證送達(dá)廣告,在保證送達(dá)廣告中廣告者可至 少部分地基于保證或提供廣告者將接收某一協(xié)定數(shù)量的合適廣告的確保的測量的協(xié)定來 進(jìn)行支付,非保證送達(dá)廣告可例如包括獨(dú)立的服務(wù)機(jī)會或者(一個或多個)現(xiàn)貨市場。在各 種模型中,廣告者可至少部分地基于與廣告送達(dá)或性能相關(guān)聯(lián)或者與特定的(一個或多個) 廣告者目標(biāo)的測量或逼近相關(guān)聯(lián)的各種度量中的任何度量來進(jìn)行支付。例如,模型可包括 (除了其他之外)至少部分地基于每印象成本(CPM)或者每印象數(shù)量成本、每點(diǎn)擊成本或每 點(diǎn)擊數(shù)量成本(CPM )、針對(一個或多個)特定動作的每行動成本(CPA )、每轉(zhuǎn)化或購買成本、 或者至少部分基于度量(可包括在線或離線度量)的某一組合的成本的支付。
[0026] 圖1是在線信息系統(tǒng)100的框圖。圖1的示例實施例中的在線信息系統(tǒng)100可包括賬 戶服務(wù)器102、和賬戶數(shù)據(jù)庫104、搜索引擎106、廣告(ad)服務(wù)器108、和廣告數(shù)據(jù)庫110。在 線信息系統(tǒng)100可由一個或多個廣告者設(shè)備(例如,廣告者設(shè)備112a、112b)以及由一個或多 個用戶設(shè)備(例如,用戶設(shè)備124a、124b)通過網(wǎng)絡(luò)120訪問。在這樣的在線信息系統(tǒng)的各種 示例中,用戶可搜索并獲得來自網(wǎng)絡(luò)120上的源的內(nèi)容。廣告者可提供廣告以便放置在通過 網(wǎng)絡(luò)發(fā)送給用戶設(shè)備(例如,用戶設(shè)備124a、124b)的web頁面以及其他通信上。在一個示例 中在線信息系統(tǒng)可由諸如Yahoo!公司之類的在線提供商部署和操作。
[0027] 賬戶服務(wù)器102可存儲廣告者的賬戶信息。賬戶服務(wù)器102可處于與賬戶數(shù)據(jù)庫 104的數(shù)據(jù)通信中。賬戶信息可包括與各個廣告者相關(guān)聯(lián)的一個或多個數(shù)據(jù)庫記錄。任何適 合的信息可被賬戶管理服務(wù)器102存儲、維護(hù)、更新以及從賬戶數(shù)據(jù)庫104中讀取。示例包括 廣告者標(biāo)識信息、諸如秘密和其他安全證書之類的廣告者安全信息、以及賬戶余額信息。在 一些實施例中,管理在線信息系統(tǒng)100的在線提供商可分配一個或多個賬戶管理者給各個 廣告者,并且關(guān)于一個或多個賬戶管理者的信息以及由賬戶管理者獲得并記錄用于后續(xù)訪 問的信息可被維護(hù)在賬戶數(shù)據(jù)庫104中。
[0028]賬戶服務(wù)器102可使用任何合適的設(shè)備實現(xiàn)。例如,賬戶管理服務(wù)器102可被實現(xiàn) 為單個服務(wù)器、多個服務(wù)器、或者本領(lǐng)域已知的任何其他類型的計算設(shè)備。對于賬戶服務(wù)器 102的訪問可通過防火墻(未示出)來完成,該防火墻保護(hù)賬戶管理程序和賬戶信息免受外 部篡改。額外的安全性可經(jīng)由對標(biāo)準(zhǔn)通信協(xié)議的增強(qiáng)(例如,安全HTTP或安全套接層)來提 供。
[0029] 賬戶服務(wù)器102可提供廣告者前端以簡化訪問廣告者的賬戶信息的過程。廣告者 前端可以是形成用戶界面的程序、應(yīng)用或軟件例程。根據(jù)本公開的示例實施例,廣告者前端 可作為具有一個或多個web頁面的web站點(diǎn)進(jìn)行訪問,接入的廣告者可在諸如廣告者設(shè)備 122a、122b之類的廣告者設(shè)備上查看這一個或多個web頁面。廣告者可使用廣告者前端查看 并編輯賬戶數(shù)據(jù)。在編輯廣告數(shù)據(jù)之后,賬戶數(shù)據(jù)然后被保存至賬戶數(shù)據(jù)庫104。
[0030] 搜索引擎106可以是計算機(jī)系統(tǒng)、一個或多個服務(wù)器、或者本領(lǐng)域已知的任何其他 計算設(shè)備??商鎿Q地,搜索引擎106可以是在計算機(jī)可讀存儲介質(zhì)上存儲的計算機(jī)程序、指 令或軟件代碼,該計算機(jī)可讀存儲介質(zhì)在單個服務(wù)器、多個服務(wù)器、或者本領(lǐng)域已知的任何 其他類型的計算設(shè)備的處理器上運(yùn)行。搜索引擎106可例如通過由用戶操作的用戶設(shè)備(例 如,用戶設(shè)備124a、124b)在網(wǎng)絡(luò)120上訪問。用戶設(shè)備124a、124b可向搜索引擎106傳送用戶 查詢。搜索引擎106可使用任何合適的協(xié)議或算法定位匹配信息并且向用戶設(shè)備124a、124b 返回信息。搜索引擎106可被設(shè)計為幫助用戶尋找位于互聯(lián)網(wǎng)或內(nèi)聯(lián)網(wǎng)上的信息。根據(jù)本公 開的示例實施例,搜索引擎106還可通過網(wǎng)絡(luò)120向用戶設(shè)備124a、124b提供具有以下內(nèi)容 的web頁面:搜索結(jié)果、匹配用戶查詢的上下文的信息、到其他網(wǎng)絡(luò)目的地或信息的鏈接、以 及操作用戶設(shè)備124a、124b的用戶感興趣的信息的文件。
[0031] 搜索引擎106可使得設(shè)備(例如,用戶設(shè)備124a、124b或者任何其他客戶端設(shè)備)使 用搜索查詢來搜索感興趣的文件。通常,搜素引擎106可由客戶端設(shè)備在網(wǎng)絡(luò)120上經(jīng)由一 個或多個服務(wù)器或者直接地進(jìn)行訪問。搜索引擎106例如可包括爬行器組件、索引器組件、 索引存儲組件、搜索組件、排名組件、緩存、簡檔存儲組件、登錄組件、簡檔構(gòu)建器、以及一個 或多個應(yīng)用程序接口(API)。搜索引擎106可以用分布式形式來部署(例如,經(jīng)由一組分布式 服務(wù)器)。組件在網(wǎng)絡(luò)內(nèi)可以是雙份的,例如為了冗余或更好地訪問。
[0032]廣告服務(wù)器108可操作以將廣告伺服給諸如用戶設(shè)備124a、124b之類的用戶設(shè)備。 廣告包括定義了廣告信息的數(shù)據(jù),用戶設(shè)備的用戶可能對廣告信息感興趣。廣告可包括文 本數(shù)據(jù)、圖形數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)、或音頻數(shù)據(jù)。廣告還可包括定義了到提供這些數(shù)據(jù) 的其他網(wǎng)絡(luò)資源的一個或多個鏈接的數(shù)據(jù)。其他位置可以是互聯(lián)網(wǎng)上的其他位置、由廣告 者操作的內(nèi)聯(lián)網(wǎng)上的其他位置、或者任何接入。
[0033]對于在線信息提供商,廣告可被顯示在源自用戶定義的搜索的web頁面上,該用戶 定義的搜索至少部分基于一個或多個搜索詞語。還可基于用戶打開的網(wǎng)頁的內(nèi)容來顯示廣 告。如果所顯示的廣告與一個或多個用戶的興趣相關(guān),則廣告對用戶、廣告者或者門戶網(wǎng)站 有益。
[0034]廣告服務(wù)器108可包括操作以對廣告數(shù)據(jù)進(jìn)行格式化用于傳送給用戶設(shè)備的邏輯 和數(shù)據(jù)。廣告服務(wù)器108可與廣告數(shù)據(jù)庫110進(jìn)行數(shù)據(jù)通信。廣告數(shù)據(jù)庫110可存儲包括定義 了要被伺服給用戶設(shè)備的廣告的數(shù)據(jù)的信息。此廣告數(shù)據(jù)可被另一數(shù)據(jù)處理設(shè)備或者被廣 告者存儲在廣告數(shù)據(jù)庫110中。
[0035]另外,廣告服務(wù)器108可與網(wǎng)絡(luò)120數(shù)據(jù)通信。廣告服務(wù)器108可通過網(wǎng)絡(luò)120向設(shè) 備傳送廣告數(shù)據(jù)和其他信息。此信息可包括被傳送至用戶設(shè)備的廣告數(shù)據(jù)。此信息還可包 括與諸如廣告者設(shè)備122a、122b之類的廣告者設(shè)備通信的廣告數(shù)據(jù)和其他信息。操作廣告 者設(shè)備的廣告者可通過網(wǎng)絡(luò)接入廣告服務(wù)器108以訪問包括廣告數(shù)據(jù)的信息。此訪問可包 括開發(fā)廣告創(chuàng)意、編輯廣告數(shù)據(jù)、刪除廣告數(shù)據(jù)和其他活動。
[0036] 廣告服務(wù)器108可提供廣告者前端來簡化訪問廣告者的廣告數(shù)據(jù)的過程。廣告者 前端可以是形成用戶界面的程序、應(yīng)用或軟件例程。在一個具體實施例中,廣告者前端可作 為具有一個或多個web頁面的web站點(diǎn)進(jìn)行訪問,接入的廣告者可在廣告者設(shè)備上查看這一 個或多個web頁面。廣告者可使用廣告者前端查看并編輯賬戶數(shù)據(jù)。在編輯廣告數(shù)據(jù)之后, 廣告數(shù)據(jù)然后可被保存至廣告數(shù)據(jù)庫110用于后續(xù)對用戶設(shè)備的廣告中的通信。
[0037] 廣告服務(wù)器108可以是計算機(jī)系統(tǒng)、一個或多個服務(wù)器、或者本領(lǐng)域已知的任何其 他計算設(shè)備??商鎿Q地,廣告服務(wù)器108可以是在計算機(jī)可讀存儲介質(zhì)上存儲的計算機(jī)程 序、指令或軟件代碼,該計算機(jī)可讀存儲介質(zhì)在單個服務(wù)器、多個服務(wù)器、或者本領(lǐng)域已知 的任何其他類型的計算設(shè)備的處理器上運(yùn)行。
[0038] 賬戶服務(wù)器102、搜索引擎106、和廣告服務(wù)器108可被實現(xiàn)為任何合適的計算設(shè) 備。計算設(shè)備能夠發(fā)送或接收數(shù)據(jù)(例如,經(jīng)由有線或無線網(wǎng)絡(luò)),或者能夠處理或存儲信號 (例如在存儲器中作為物理存儲器狀態(tài)),因此可用作服務(wù)器。因而,能夠用作服務(wù)器的設(shè)備 可例如包括專用機(jī)架式服務(wù)器、臺式計算機(jī)、膝上型計算機(jī)、機(jī)頂盒、合并前述設(shè)備的各種 特征(例如,兩個或更多個特征)的集成設(shè)備等等。
[0039] 網(wǎng)絡(luò)120可包括任何數(shù)據(jù)通信網(wǎng)絡(luò)或多個網(wǎng)絡(luò)的組合。網(wǎng)絡(luò)可將設(shè)備進(jìn)行耦合從 而使得可例如在服務(wù)器和客戶端設(shè)備或其他類型的設(shè)備之間(例如,包括經(jīng)由無線網(wǎng)絡(luò)耦 合的無線設(shè)備之間)互換通信。網(wǎng)絡(luò)還可包括大容量存儲設(shè)備,例如網(wǎng)絡(luò)附加存儲(NAS)、存 儲區(qū)域網(wǎng)絡(luò)(SAN)、或其他形式的計算機(jī)或機(jī)器可讀介質(zhì)。網(wǎng)絡(luò)可包括互聯(lián)網(wǎng)、一個或多個 局域網(wǎng)(LAN)、一個或多個廣域網(wǎng)(WAN)、線纜類型的連接、無線型連接、或者它們的任何組 合。類似地,子網(wǎng)絡(luò)(例如,可采用不同的架構(gòu)或者可與不同協(xié)議相兼容或者可兼容)可在諸 如網(wǎng)絡(luò)120之類的更大網(wǎng)絡(luò)內(nèi)相互操作。例如可使用各種類型的設(shè)備來提供針對不同架構(gòu) 或協(xié)議的互操作能力。作為一個說明性示例,路由器可提供以其他方式分離且獨(dú)立的LAN之 間的鏈路。通信鏈路或信道例如可包括模擬電話線(例如,雙絞線、同軸線纜)、全數(shù)字線路 或部分?jǐn)?shù)字線路(包括Tl、T2、T3、或T4型線路)、基礎(chǔ)服務(wù)數(shù)字網(wǎng)絡(luò)(IDSN)、數(shù)字訂戶線路 (DSL)、包括衛(wèi)星鏈路的無線鏈路、或者本領(lǐng)域技術(shù)人員已知的其他通信鏈路或信道。另外, 計算設(shè)備或其他相關(guān)電子設(shè)備可(例如,經(jīng)由電話線或鏈路)遠(yuǎn)程地耦合到網(wǎng)絡(luò)。
[0040] 廣告者設(shè)備122a、122b可包括可通過網(wǎng)絡(luò)120訪問在線信息系統(tǒng)100的任何數(shù)據(jù)處 理設(shè)備。廣告者設(shè)備122a、122b可操作以通過網(wǎng)絡(luò)120與賬戶服務(wù)器102、搜索引擎106、廣告 服務(wù)器108、內(nèi)容服務(wù)器和其他數(shù)據(jù)處理系統(tǒng)進(jìn)行交互。廣告者設(shè)備122a、122b例如可實現(xiàn) 用于查看web頁面和提交用戶請求的web瀏覽器。廣告者設(shè)備122a、122b可將數(shù)據(jù)傳送給在 線信息系統(tǒng)100,該數(shù)據(jù)包括定義web頁面的數(shù)據(jù)和其他信息。廣告者設(shè)備122a、122b可從在 線信息系統(tǒng)100接收包括定義web頁面和廣告創(chuàng)意的數(shù)據(jù)的通信。
[00411用戶設(shè)備124a、124b可包括可通過網(wǎng)絡(luò)120訪問在線信息系統(tǒng)100的任何數(shù)據(jù)處理 設(shè)備。用戶設(shè)備124a、124b可操作以通過網(wǎng)絡(luò)120與搜索引擎106進(jìn)行交互。用戶設(shè)備124a、 124b例如可實現(xiàn)用于查看web頁面和提交用戶請求的web瀏覽器。操作用戶設(shè)備124a、124b 的用戶可輸入搜索請求并將搜索請求傳送至在線信息系統(tǒng)100。搜索請求可由搜索引擎處 理并且搜索結(jié)果可返回至用戶設(shè)備124a、124b。在其他示例中,用戶設(shè)備124a、124b的用戶 可從在線信息處理系統(tǒng)100請求諸如信息的頁面之類的數(shù)據(jù)。數(shù)據(jù)繼而可在諸如原生移動 應(yīng)用、TV應(yīng)用、或音頻應(yīng)用之類的另一環(huán)境中被提供。在線信息處理系統(tǒng)100可提供數(shù)據(jù)或 者將瀏覽器重定向至另一web站點(diǎn)。此外,廣告服務(wù)器可從廣告數(shù)據(jù)庫110中選擇廣告并且 在向用戶設(shè)備124a、124b提供的數(shù)據(jù)中包括定義了廣告的數(shù)據(jù)。
[0042]廣告者設(shè)備122a、122b和用戶設(shè)備124a、124b在訪問在線信息系統(tǒng)上的信息時可 用作客戶端設(shè)備。諸如廣告者設(shè)備122a、122b和用戶設(shè)備124a、124b之類的客戶端設(shè)備可包 括能夠發(fā)送或接收數(shù)據(jù)(例如,經(jīng)由有線或無線網(wǎng)絡(luò))的計算設(shè)備。客戶端設(shè)備例如可包括 臺式計算機(jī)或便攜式設(shè)備,例如蜂窩電話、智能電話、顯示尋呼機(jī)、無線電頻率(RF)設(shè)備、紅 外(IR)設(shè)備、個人數(shù)字助理(PDA)、手持式計算機(jī)、平板計算機(jī)、膝上型計算機(jī)、機(jī)頂盒、可穿 戴計算機(jī)、合并前述設(shè)備的各種特征(例如,兩個或更多個特征)的集成設(shè)備等等。在圖1的 示例中,膝上型計算機(jī)124b和智能電話124a可互換地用作廣告者設(shè)備或用作用戶設(shè)備。 [0043]圖2是示出服務(wù)器200的示例實施例的示意圖。服務(wù)器200可被用作圖1的賬戶服務(wù) 器102、搜索引擎106和廣告服務(wù)器108。服務(wù)器200可廣泛地改變配置或能力,但是它可包括 一個或多個中央處理單元222和存儲器232、存儲應(yīng)用程序242或數(shù)據(jù)244的一個或多個介質(zhì) 230(例如,一個或多個大容量存儲設(shè)備)、一個或多個電源226、一個或多個有線或無線網(wǎng)絡(luò) 接口 250、一個或多個輸入/輸出接口 258、和/或一個或多個操作系統(tǒng)241 (例如,Windows Server?、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等等)。因此服務(wù)器200可例如包括專用機(jī) 架式服務(wù)器、臺式計算機(jī)、膝上型計算機(jī)、機(jī)頂盒、諸如智能電話之類的移動計算設(shè)備、合并 前述設(shè)備的各種特征(例如,兩個或更多個特征)的集成設(shè)備等等。
[0044]圖1中示出的賬戶服務(wù)器102、搜索引擎106、內(nèi)容服務(wù)器112和廣告服務(wù)器108可被 實現(xiàn)為內(nèi)容服務(wù)器或者可與內(nèi)容服務(wù)器相通信。內(nèi)容服務(wù)器可包括這樣的設(shè)備,該設(shè)備包 括經(jīng)由網(wǎng)絡(luò)向另一設(shè)備提供內(nèi)容的配置。內(nèi)容服務(wù)器例如可主持諸如社交網(wǎng)絡(luò)站點(diǎn)之類的 站點(diǎn),其不例可包括但不限于:Yahoo !?、FlickerTM、TwitterTM、FacebookTM、LinkedIn?、S 個人用戶站點(diǎn)(例如,博客、微博、在線約會站點(diǎn)等等)。內(nèi)容服務(wù)器還可主持各種其他站點(diǎn), 包括但不限于:商業(yè)站點(diǎn)、教育站點(diǎn)、詞典站點(diǎn)、百科站點(diǎn)、維基、財務(wù)站點(diǎn)、政府站點(diǎn)等等。 內(nèi)容服務(wù)器還可提供各種服務(wù),包括但不限于:web服務(wù)、第三方服務(wù)、音頻服務(wù)、視頻服務(wù)、 電子郵件服務(wù)、即時通訊(頂)服務(wù)、SMS服務(wù)、MMS服務(wù)、FTP服務(wù)、IP語音(VOIP)服務(wù)、日程服 務(wù)、照片服務(wù)等等。內(nèi)容的示例可包括文本、圖像、音頻、視頻等等,它們例如可以用物理信 號(例如,電子信號)的形式進(jìn)行處理,或者可在存儲器中例如作為物理狀態(tài)被存儲。可用作 內(nèi)容服務(wù)器的設(shè)備的示例包括臺式計算機(jī)、多處理器系統(tǒng)、微處理器型或可編程消費(fèi)電子 產(chǎn)品等等。內(nèi)容服務(wù)器可不與一個或多個廣告服務(wù)器共用所用權(quán)或控制。
[0045]圖3是示出可被用作用戶設(shè)備124a、124b和廣告者設(shè)備122a、122b的客戶端設(shè)備的 示例實施例的示意圖??蛻舳嗽O(shè)備可包括執(zhí)行在本公開中介紹的方法和軟件系統(tǒng)的裝置。 客戶端設(shè)備300可以是能夠允許軟件系統(tǒng)的計算設(shè)備。客戶端設(shè)備300例如可以是諸如個人 臺式計算機(jī)或便攜式設(shè)備(例如,膝上型計算機(jī)、平板計算機(jī)、蜂窩電話、或智能電話)之類 的設(shè)備。
[0046]客戶端設(shè)備300可在能力和特性方面改變。所要求保護(hù)的主題旨在覆蓋潛在變體 的廣泛范圍。例如,客戶端設(shè)備300可包括鍵盤/鍵板356。它還可包括顯示器354,例如液晶 顯示器(IXD)或者具有高級功能(例如,觸敏彩色2D或3D顯示器)的顯示器。然而,相比之下, 作為另一示例,web使能的客戶端設(shè)備300可包括一個或多個物理或虛擬鍵盤以及大容量存 儲介質(zhì)330。
[0047]客戶端設(shè)備300還可包括或者可允許多種操作系統(tǒng)341,這些操作系統(tǒng)包括諸如 Window?、或Linux?之類的操作系統(tǒng)或者諸如iOS?、Android?、或Windows Mobile?之類的 移動操作系統(tǒng)??蛻舳嗽O(shè)備300可包括或者可允許多種可能應(yīng)用342,例如電子游戲345。應(yīng) 用342可使能經(jīng)由網(wǎng)絡(luò)與其他設(shè)備的通信,例如經(jīng)由網(wǎng)絡(luò)與另一計算機(jī)、另一客戶端設(shè)備或 服務(wù)器通信。
[0048]另外,客戶端設(shè)備300可包括一個或多個非暫態(tài)處理器可讀存儲介質(zhì)330以及與非 暫態(tài)處理器可讀存儲介質(zhì)530通信的一個或多個處理器322。例如,非暫態(tài)處理器可讀存儲 介質(zhì)330可以是RAM存儲器、閃存存儲器、ROM 334、340存儲器、EPROM存儲器、EEPROM存儲器、 寄存器、硬盤、可移除盤、CD-ROM、或者本領(lǐng)域已知的任何其他形式的非暫態(tài)存儲介質(zhì)。一個 或多個非暫態(tài)處理器可讀存儲介質(zhì)330可存儲多組指令,或者包括這多組指令的單元和/或 模塊用于進(jìn)行本公開所描述的操作和/或方法步驟??商鎿Q地,單元和/或模塊可以是被配 置為施行本公開所描述的操作和/或方法步驟的客戶端設(shè)備300中布置的硬件。一個或多個 處理器可被配置為允許多組指令并執(zhí)行本公開的示例實施例中的操作。
[0049] 僅僅用于說明,在以下示例實施例中將在運(yùn)行操作和/或方法步驟的客戶端設(shè)備 和服務(wù)器中描述僅一個處理器。然而,應(yīng)當(dāng)注意本公開中的客戶端設(shè)備和服務(wù)器還可包括 多個處理器,因而在本公開中由一個處理器執(zhí)行的操作和/或方法步驟也可由多個處理器 聯(lián)合地或者分立地執(zhí)行。例如,如果在本公開中處理器執(zhí)行步驟A和步驟B二者,應(yīng)當(dāng)理解步 驟A和步驟B也可由客戶端設(shè)備中的兩個不同的處理器聯(lián)合地或者分立地執(zhí)行(例如,第一 處理器執(zhí)行步驟A并且第二處理器執(zhí)行步驟B,或者第一和第二處理器聯(lián)合地執(zhí)行步驟A和 步驟B)。
[0050] 圖4是示出用于提供具有查詢搜索結(jié)果的web頁面的系統(tǒng)400的示例。系統(tǒng)400可包 括至少一個服務(wù)器450。服務(wù)器450可以是圖1中的服務(wù)器102、106和108的總表示,或者可以 是這些服務(wù)器中的一部分的總表示。服務(wù)器450可與至少一個數(shù)據(jù)庫452通信來提供用于 web頁面400的數(shù)據(jù)。數(shù)據(jù)庫452可包括內(nèi)容數(shù)據(jù)庫,這包括要被顯示在web頁面400上的多個 文章(article)和/或web頁面鏈接。文章可以是任何形式的內(nèi)容項。例如,文章可以是文本 項(例如,文本報告、故事等等)或者多媒體的內(nèi)容(例如,音頻/視頻片段)或者其組合。數(shù)據(jù) 庫452還可包括廣告數(shù)據(jù)庫,這包括要被顯示在網(wǎng)站中的多個廣告。數(shù)據(jù)庫452可被存儲在 與服務(wù)器450通信的非暫態(tài)處理器可讀存儲介質(zhì)中。圖4中示出的web頁面402是具有與搜索 查詢"hard mattress (硬床墊)"相對應(yīng)的搜索結(jié)果的示例互聯(lián)網(wǎng)搜索頁面。但是web頁面 402也可以是網(wǎng)站的首頁、著陸頁、或者特定話題(例如,體育、財經(jīng)、新聞等等)的web頁面。 web頁面402可被顯示在用戶設(shè)備124a、124b的瀏覽器上。
[00511 web頁面402可包括搜索輸入框440。用戶可在搜索輸入框440中輸出搜索查詢441 并且服務(wù)器450可返回并顯示搜索結(jié)果在web頁面402上。例如,在圖4所示的web頁面402中, 用戶輸入搜索查詢"hardmattress"。
[0052] web頁面402的中心欄可以是一欄web頁面內(nèi)容424 jeb頁面內(nèi)容424可包括多個槽 位,其中一系列項420、422、426、428、430和432被一項接一項地顯示。各項422、426、428、430 和432可以是與搜索查詢"hard mattress"對應(yīng)的搜索結(jié)果。各項可包括該項的文本概括 412。項422、426、428、430和432還可包括圖形/視頻416、其他數(shù)據(jù)(未示出)以及到該項的附 加信息的鏈接414。點(diǎn)擊或者以其他方式選擇鏈接414可將用戶設(shè)備124a、124b上的瀏覽器 重定向至具有附加信息的web頁面。
[0053] 項422、426、428、430和432的界613頁面內(nèi)容424可包括任何類型的內(nèi)容項。例如,¥6匕 頁面內(nèi)容424可包括文章,這包括新聞、商業(yè)相關(guān)的文章、體育相關(guān)的文章等等。除了文本或 圖形內(nèi)容之外,文章422、426、428、430和432可包括其他數(shù)據(jù),例如音頻和視頻數(shù)據(jù)或應(yīng)用。 [0054] 項422、426、428、430和432在《613頁面內(nèi)容424中的位置可基于相關(guān)性來確定。例 如,第一項422可以是相比第六項432與搜索查詢"hard mattress"更相關(guān)的文章。然而位置 可以是也可以不是該項對于用戶的受歡迎程度的精確指示符。例如,盡管第二項422相比第 六項432是與搜索查詢"hard mattress"更相關(guān)的文章,但是與硬床墊提供商Ashley家具工 業(yè)公司相關(guān)聯(lián)的第六項432可接收比第二項422更多的點(diǎn)擊,第二項422是與背痛相關(guān)的文 早。
[0055] 在右手側(cè),web頁面402可包括廣告(例如,廣告442)的欄444。廣告442可被設(shè)計為 吸引用戶的注意并且推銷廣告者的產(chǎn)品和/或服務(wù)。例如,圖4中的廣告442被設(shè)計為推銷由 Ashley家具工業(yè)公司生產(chǎn)的家庭家具。此外,廣告442也可被放置在中心欄424,或者web頁 面402中的任何其他合適地方。
[0056]廣告442的創(chuàng)意可包括名稱(例如,廣告者的名稱);題目442a(例如,廣告的題目); 和描述442b(例如,對廣告者的產(chǎn)品和/或服務(wù)的描述)。在廣告442中可僅顯示創(chuàng)意的題目 442a和描述442b。另外,題目442a可被顯示為超鏈接,從而使得點(diǎn)擊該題目的用戶將被引導(dǎo) 至廣告者的web頁面460(即,產(chǎn)品和/或服務(wù)的著陸頁)。表1示出了廣告442的創(chuàng)意的示例。
[0057]表 1
[0059] 廣告442將題目442a作為超鏈接并且將描述442b作為純文本顯示在web頁面402 上。當(dāng)用戶點(diǎn)擊超鏈接時,用戶被引導(dǎo)至Ashley家具工業(yè)公司的主頁。
[0060] 廣告者可通過由發(fā)布者(例如,網(wǎng)站402或者網(wǎng)站402的獨(dú)立代理)提供的在線廣告 競拍服務(wù)來顯示廣告442。廣告者可基于搜索查詢441和與廣告442相關(guān)聯(lián)的競標(biāo)關(guān)鍵字的 列表之間的相似度來決定他的出價。當(dāng)廣告者從發(fā)布者處訂購廣告顯示服務(wù)時,競標(biāo)關(guān)鍵 字的列表可由發(fā)布者提供,從而使得廣告者不需要提供它自己的廣告442的種子關(guān)鍵字和/ 或類別信息給發(fā)布者進(jìn)行關(guān)鍵字分析。
[0061] 圖5是根據(jù)本公開的示例實施例用于向服務(wù)器502提供競標(biāo)關(guān)鍵字建議服務(wù)的系 統(tǒng)500的示意圖。系統(tǒng)500可屬于廣告發(fā)布者,從而關(guān)鍵字建議服務(wù)是由發(fā)布者提供的在線 廣告服務(wù)的一部分。可替換地,系統(tǒng)500可以是獨(dú)立于發(fā)布者向廣告者提供獨(dú)立競標(biāo)關(guān)鍵字 建議服務(wù)的系統(tǒng)。
[0062]系統(tǒng)500可包括關(guān)鍵字建議引擎504,其被配置為在不要求與創(chuàng)意相關(guān)聯(lián)的種子關(guān) 鍵字作為外部輸入的情況下向廣告者建議競標(biāo)關(guān)鍵字。關(guān)鍵字建議引擎504可以是包括處 理器222和非暫態(tài)存儲介質(zhì)230的服務(wù)器200。存儲介質(zhì)230可具有在其中存儲的一組指令。 這組指令可指引處理器222執(zhí)行預(yù)定的性能。例如,當(dāng)廣告者502輸入廣告創(chuàng)意("創(chuàng)意")518 給關(guān)鍵字建議引擎504時,處理器222可允許在介質(zhì)230中存儲的相關(guān)性模型506(即,一組指 令)以進(jìn)行兩階段的關(guān)鍵字分析。對創(chuàng)意518的第一階段分析508和第二階段分析510不需要 使用ad廣告者(或者廣告者的代理)建議的與該創(chuàng)意相關(guān)聯(lián)的種子關(guān)鍵字(即,發(fā)起關(guān)鍵字 分析的關(guān)鍵字)。因此,關(guān)鍵字建議引擎504能夠在不要求來自廣告者的創(chuàng)意的種子關(guān)鍵字 或類別信息的輸入的情況下向廣告者返回建議競標(biāo)關(guān)鍵字520的列表。在示例實現(xiàn)中,關(guān)鍵 字建議引擎504可完全依靠創(chuàng)意518的輸入來進(jìn)行關(guān)鍵字分析。建議競標(biāo)關(guān)鍵字的列表可包 括預(yù)定數(shù)目(例如,50)的競標(biāo)關(guān)鍵字,這些競標(biāo)關(guān)鍵字根據(jù)與創(chuàng)意的相關(guān)性分?jǐn)?shù)(即,推薦 度)來排名,從而使得廣告者502可將建議競標(biāo)關(guān)鍵字520的列表當(dāng)做用于在在線廣告拍賣 中就其廣告進(jìn)行出價以將其廣告放置在發(fā)布者的網(wǎng)站上的關(guān)鍵字。另外,分析可完全基于 創(chuàng)意518的輸入來進(jìn)行并且足夠準(zhǔn)確和有效以使得不需要廣告者502提供它自己的一組競 標(biāo)關(guān)鍵字用于拍賣或者它自己的一組種子關(guān)鍵字用于進(jìn)行擴(kuò)展的關(guān)鍵字分析。
[0063]在第一階段分析508中,處理器222可基于輸入從關(guān)鍵字?jǐn)?shù)據(jù)庫中選擇預(yù)定數(shù)目的 候選關(guān)鍵字。為此,關(guān)鍵字建議引擎504可與關(guān)鍵字詞典512通信,該關(guān)鍵字詞典是預(yù)先構(gòu)建 的數(shù)據(jù)庫,其包括成千上萬的關(guān)鍵字、相關(guān)關(guān)鍵字、關(guān)鍵字之間的相關(guān)度的排名分?jǐn)?shù)(向 量)、以及與每個關(guān)鍵字對應(yīng)的特征向量(或者多個特征向量)。關(guān)鍵字可由頻率過濾器516 提供,該頻率過濾器516收集由一般大眾在Yahoo!網(wǎng)絡(luò)過去的一段時間內(nèi)的日常在線活動 期間在互聯(lián)網(wǎng)中輸入的搜索查詢。頻率過濾器516可被配置為捕獲用戶對于搜索結(jié)果頁面 的查看和點(diǎn)擊行為。頻率過濾器516可用作數(shù)據(jù)源,其中前一億個經(jīng)常搜索的關(guān)鍵字被從關(guān) 鍵字詞典512中挑出。關(guān)鍵字詞典512中存儲的關(guān)鍵字足夠完備從而使得在統(tǒng)計上講,它幾 乎覆蓋了一般廣告進(jìn)行競標(biāo)廣告拍賣所需的所有關(guān)鍵字。
[0064]在第二階段分析510中,處理器222可進(jìn)一步將在第一階段分析中選擇的候選關(guān)鍵 字細(xì)化為建議競標(biāo)關(guān)鍵字的列表。例如,處理器222可使用線性回歸算法從大約500個候選 關(guān)鍵字中選擇50個關(guān)鍵字作為建議競標(biāo)關(guān)鍵字??墒褂糜删庉嬚呷斯Q斷的一組訓(xùn)練數(shù)據(jù) 518通過訓(xùn)練模型514對線性回歸算法進(jìn)行預(yù)優(yōu)化。
[0065] 圖6是根據(jù)本公開的示例實施例示出如何確定預(yù)先構(gòu)建的關(guān)鍵字詞典512中的關(guān) 鍵字的特征向量的流程圖。流程圖中的過程可由諸如服務(wù)器200之類能夠訪問在關(guān)鍵字詞 典512中保存的關(guān)鍵字?jǐn)?shù)據(jù)庫的服務(wù)器執(zhí)行。服務(wù)器可在廣告者向關(guān)鍵字建議引擎504輸入 創(chuàng)意之前獨(dú)立地對關(guān)鍵字?jǐn)?shù)據(jù)庫進(jìn)行分析。
[0066] 在步驟602中,服務(wù)器可針對在關(guān)鍵字?jǐn)?shù)據(jù)中保存的每個關(guān)鍵字(此后被稱作"數(shù) 據(jù)庫關(guān)鍵字")進(jìn)行互聯(lián)網(wǎng)搜索并獲得搜索結(jié)果的列表。每個搜索結(jié)果可對應(yīng)于URL(統(tǒng)一資 源位置)。另外,服務(wù)器可根據(jù)URL中的內(nèi)容與數(shù)據(jù)庫關(guān)鍵字的相關(guān)性對URL的列表進(jìn)行排 名。URL的排名越高,URL的內(nèi)容與數(shù)據(jù)庫關(guān)鍵字越相關(guān)。
[0067]在步驟604,服務(wù)器可從搜索結(jié)果的列表中選擇預(yù)定數(shù)目的候選URL,這些候選URL 具有被用該數(shù)據(jù)庫關(guān)鍵字搜索互聯(lián)網(wǎng)的一般用戶點(diǎn)擊的最高可能性。例如,服務(wù)器可僅從 搜索結(jié)果的列表中選擇前10個URL。在選擇候選URL時可考慮若干因素。例如,一個因素可以 是(但不被限于)URL在URL列表中的位置(即,排名),即用戶可選擇具有與數(shù)據(jù)庫關(guān)鍵字更 相關(guān)的內(nèi)容的那些URL。另一因素可以是在一段時間內(nèi)一般大眾訪問該URL的次數(shù),即服務(wù) 器也可選擇URL的列表中最受歡迎的URL(即,被最多點(diǎn)擊的URL)。因此,所選擇的候選URL可 反映URL與數(shù)據(jù)庫關(guān)鍵字的相關(guān)性以及URL在上網(wǎng)的一般用戶間的受歡迎度二者,從而反映 了 URL將被使用對應(yīng)的數(shù)據(jù)庫關(guān)鍵字搜索互聯(lián)網(wǎng)的用戶選擇的可能性。
[0068]在步驟606中,服務(wù)器可從每個URL指向的頁面內(nèi)容中提取多個關(guān)鍵字(下文被稱為 "URL特征關(guān)鍵字")并計算每個URL特征關(guān)鍵字的重要性的值。為此,服務(wù)器可首先提取URL的 內(nèi)容。例如,服務(wù)器可僅從URL提取文本內(nèi)容,這排除了諸如廣告之類的任何非相關(guān)信息。然后 月艮務(wù)器可將內(nèi)容與詞典(例如,關(guān)鍵字詞典512)比較來從內(nèi)容中提取URL特征關(guān)鍵字,這里詞典 充當(dāng)百科全書式的關(guān)鍵字?jǐn)?shù)據(jù)庫。另外,服務(wù)器可為每個URL特征關(guān)鍵字計算一值,該值反映了 URL特征關(guān)鍵字在URL的內(nèi)容中的重要性。計算可基于URL特征關(guān)鍵字的語義值以及對應(yīng)的URL將 被用戶選擇的可能性。例如,服務(wù)器可在URL指向的整個頁面內(nèi)容中針對每個URL特征關(guān)鍵字進(jìn) 行TF-IDF(詞頻-逆向文檔頻率)分析,并獲得URL特征關(guān)鍵字的對應(yīng)TF-IDF值。服務(wù)器然后可使 用4
計算URL特征關(guān)鍵的重要性的值,其中d是URL所指向的文檔(web頁面內(nèi)容),fid是第i個URL 特征關(guān)鍵字,α是經(jīng)驗倌,「l+log(clickd+l)]是與該URL在過去接收的點(diǎn)擊數(shù)目相對應(yīng)的權(quán) 重,并5
與URL在URL搜索結(jié)果的列表中的位置(即,該關(guān)鍵字的排名 或相關(guān)性)相對應(yīng)的權(quán)重??紤]到針對相同關(guān)鍵字的重復(fù)搜索可能不產(chǎn)生相同的URL搜結(jié) 果,該位置可以是URL在預(yù)定數(shù)目的搜索間的平均位置。
[0069]服務(wù)器可針對每個候選URL進(jìn)行上面的URL特征關(guān)鍵字提取以及重要性值計算,并 且將URL特征關(guān)鍵字收集到一起。當(dāng)URL特征關(guān)鍵字在不止一個候選URL對應(yīng)的內(nèi)容中出現(xiàn) 時,服務(wù)器可根據(jù)以下公式將URL特征關(guān)鍵字的每個獨(dú)立的重要性值相加以獲得URL特征關(guān) 鍵字的總體重要性值:
[0070]
[0071 ]在步驟608中,服務(wù)器可為關(guān)鍵字詞典512中的每個數(shù)據(jù)庫關(guān)鍵字確定特征向量 (此后被稱作"數(shù)據(jù)庫關(guān)鍵字特征向量")。為此,服務(wù)器可將詞典中的所有詞或者關(guān)鍵字詞 典512的關(guān)鍵字?jǐn)?shù)據(jù)庫中的所有關(guān)鍵字放置在預(yù)定序列中,并且將該序列看做特征向量模 板,從而使得序列中的每個詞具有固定位置并且成為特征向量模板的元素。因此,候選URL 的所有URL特征關(guān)鍵字可對應(yīng)于特征向量模板中的元素。接下來,服務(wù)器可通過分配特征向 量模板中的每個元素的值來獲得數(shù)據(jù)庫關(guān)鍵字的特征向量。如果特征向量模板中的元素不 是URL特征關(guān)鍵字,服務(wù)器可向該元素分配為0的值。如果該元素是URL特征關(guān)鍵字,服務(wù)器 可向該元素分配該URL特征關(guān)鍵字的總體重要性值。因此,數(shù)據(jù)庫關(guān)鍵字特征向量可以是:
[0072] V(url_ feature_keyword) ,0,score(fi),0,score(f2),0,score (fi),〇,···}
[0073] 在步驟610中,服務(wù)器可保存數(shù)據(jù)庫關(guān)鍵字特征向量并將它與對應(yīng)的數(shù)據(jù)庫關(guān)鍵 字相關(guān)聯(lián)。服務(wù)器可在廣告者505輸入創(chuàng)意518之前完成上面針對關(guān)鍵字詞典512中的每個 數(shù)據(jù)庫關(guān)鍵字的數(shù)據(jù)庫關(guān)鍵字特征向量確定。
[0074]圖7是根據(jù)本公開的示例實施例的第一階段分析508的流程圖。在步驟702中從廣 告者502接收創(chuàng)意518之后,關(guān)鍵字建議引擎504可確定創(chuàng)意的特征向量(此后被稱作"創(chuàng)意 特征向量")。
[0075]為此,在步驟704中,關(guān)鍵字建議引擎504可基于詞典以與步驟606中的提取過程類 似的方式從創(chuàng)意中提取關(guān)鍵字(此后被稱作"創(chuàng)意關(guān)鍵字")。例如,對于表1中的創(chuàng)意,所提 取的關(guān)鍵字可以是:
[0076] <Ashley,look,furniture,visit,today,home,furniture,industries, store,...>〇
[0077] 關(guān)鍵字建議引擎然后也可針對每個創(chuàng)意關(guān)鍵字計算重要性值。例如,關(guān)鍵字建議 引擎504可對每個創(chuàng)意關(guān)鍵字進(jìn)行TF-IDF分析并獲得其值。TF-IDF值可被看作對應(yīng)的創(chuàng)意 關(guān)鍵字的重要性值。因此,表1中的創(chuàng)意的每個創(chuàng)意關(guān)鍵字的重要性值可以是:
[0078] <Ashley:0.465, look:0.140,furniture:0.447,visit:0.151,today :0.152, home:10·13,furniture:0·401,industries:0·161,store:0·234,…>〇
[0079] 在步驟706中,關(guān)鍵字建議引擎504可確定創(chuàng)意的創(chuàng)意特征向量。為此,關(guān)鍵字建議 引擎504可使用步驟608中描述的特征向量模板,并且如果特征向量模板中的一元素不是創(chuàng) 意關(guān)鍵字則向該元素分配為〇的值。如果該元素是創(chuàng)意關(guān)鍵字,則關(guān)鍵字建議引擎504可向 該元素分配與創(chuàng)意關(guān)鍵字對應(yīng)的重要性值。因此,表1中的創(chuàng)意的創(chuàng)意特征向量可以是:
[0080] V(creative) = {0,····,0· 465,···,0· 140,···,0· 447,···,0·151,···,0·152,···, 10.13,···,0·401,···,0.161,···,0·234,···}。
[00811在步驟708中,關(guān)鍵字建議引擎504可計算創(chuàng)意特征向量與關(guān)鍵字詞典512中存儲 的每個數(shù)據(jù)庫關(guān)鍵字特征向量之間的相似度值(例如,余弦相似度)。創(chuàng)意特征向量與數(shù)據(jù) 庫關(guān)鍵字特征向量之間的相似度越高,則創(chuàng)意與對應(yīng)的數(shù)據(jù)庫關(guān)鍵字越相關(guān)。
[0082]然后在步驟710中,關(guān)鍵字建議引擎504可選擇一組候選關(guān)鍵字,這包括與具有相 對創(chuàng)意特征向量的最高相似度的數(shù)據(jù)庫關(guān)鍵字特征向量相對應(yīng)的預(yù)定數(shù)目(例如,500)的 數(shù)據(jù)庫關(guān)鍵字。這些候選關(guān)鍵字可表示與創(chuàng)意最相關(guān)的關(guān)鍵字(例如,500個最相關(guān)的關(guān)鍵 字)。
[0083]在一些實例中,不是所有的候選關(guān)鍵字是理想的或者廣告者更喜歡來提出競標(biāo) 的。例如,廣告者可確定不響應(yīng)于包括廣告者的競爭者的名稱的搜索查詢來放置廣告。因 此,關(guān)鍵字建議引擎504可獲得該廣告者的排除列表。排除列表可從關(guān)鍵字建議引擎504可 訪問的數(shù)據(jù)庫中獲得,或者可由廣告者提供。排除列表可包括廣告者的競爭者名稱,或者可 包括廣告者不希望競標(biāo)的其他關(guān)鍵字。
[0084]接下來,在步驟712中,關(guān)鍵字建議引擎504可通過從候選關(guān)鍵字中過濾掉在排除 列表中的關(guān)鍵字來對候選關(guān)鍵字進(jìn)行細(xì)化。例如,關(guān)鍵字建議引擎504可分析每個候選關(guān)鍵 字并從候選關(guān)鍵字中提取品牌相關(guān)的術(shù)語。關(guān)鍵字建議引擎504也可分析創(chuàng)意并提取其中 的品牌相關(guān)的術(shù)語(例如,表1的創(chuàng)意中的Ashley)。如果候選關(guān)鍵字不包括品牌相關(guān)的術(shù) 語,則候選關(guān)鍵字可能是內(nèi)容中性的。進(jìn)一步分析可能不被需要。否則,關(guān)鍵字建議引擎可 比較來自創(chuàng)意的品牌相關(guān)的術(shù)語與來自候選關(guān)鍵字的品牌相關(guān)的術(shù)語。如果術(shù)語具有較大 的重疊(即,兩個品牌相關(guān)的術(shù)語類似),則關(guān)鍵字建議引擎504可確定對應(yīng)的創(chuàng)意和候選關(guān) 鍵字有可能指代相同的產(chǎn)品或服務(wù)品牌。然而,如果來自候選關(guān)鍵字的品牌相關(guān)的術(shù)語存 在但是與來自創(chuàng)意的品牌相關(guān)的術(shù)語很少重疊或者不重疊,則關(guān)鍵字建議引擎504可確定 該品牌相關(guān)的術(shù)語與競爭者相關(guān)聯(lián)。因此,對應(yīng)的候選關(guān)鍵字可從候選關(guān)鍵字群組中被移 除。
[0085]圖8是根據(jù)本公開的示例實施例示出第二階段分析的流程圖。在第二階段分析中, 關(guān)鍵字建議引擎504可對經(jīng)細(xì)化的候選關(guān)鍵字進(jìn)行評估并進(jìn)一步選擇建議一組關(guān)鍵字520。 評估和選擇可基于語義相似度、類別相似度、以及候選關(guān)鍵字與創(chuàng)意的特征相似度。
[0086] 在步驟802中,關(guān)鍵字建議引擎504可將創(chuàng)意518中的術(shù)語分解。在創(chuàng)意中通過空格 和標(biāo)點(diǎn)與其他詞分開的任何詞語可被視為單個術(shù)語。結(jié)果,關(guān)鍵字建議引擎504可獲得創(chuàng)意 術(shù)語集。例如,針對表1中的創(chuàng)意,對應(yīng)的術(shù)語集可以是:〈ashley furniture industries inc.find great looking furniture that lasts ashley furniture store is the name in home furniture visit an ashley store save today>〇類似地,關(guān)鍵字建議引 擎504也可獲得針對每個經(jīng)細(xì)化的候選關(guān)鍵字的術(shù)語集。例如,對于關(guān)鍵字"home furnituresuggestion",術(shù)語集可以是:〈home furniture suggestion)〇
[0087]在步驟804中,關(guān)鍵字建議引擎504可確定每個候選關(guān)鍵字的文字重疊計數(shù)。文字 重疊計數(shù)可以是候選關(guān)鍵字術(shù)語集中也顯現(xiàn)在創(chuàng)意術(shù)語集中的術(shù)語的數(shù)目。在上面的示例 中,兩個術(shù)語"home"和"furni ture"是重疊術(shù)語,因為它們均顯現(xiàn)在關(guān)鍵字術(shù)語集和創(chuàng)意術(shù) 語集二者中。因此,關(guān)鍵字"home furniture suggestion"的文字重疊計數(shù)是2。文字重疊計 數(shù)可反映候選關(guān)鍵字和創(chuàng)意之間的絕對的重疊度。文字重疊計數(shù)的值越大,候選關(guān)鍵字與 創(chuàng)意共享的術(shù)語越多。因此,文字重疊計數(shù)可反映候選關(guān)鍵字和創(chuàng)意之間的文字相似度的 一個方面。
[0088]在步驟806中,關(guān)鍵字建議引擎506可確定每個候選關(guān)鍵字的文字重疊比例。文字 重疊比例可以是文字重疊計數(shù)與候選關(guān)鍵字術(shù)語集中的術(shù)語數(shù)目之間的比例。例如,術(shù)語 集〈home furniture suggestion〉包括三個術(shù)語并且具有等于2的文字重疊計數(shù)。因此,它 的文字重疊比例是2/3。文字重疊比例可反映候選關(guān)鍵字與創(chuàng)意重疊的完全程度。文字重疊 比例越大,重疊就越好或者越"平行"。因此,文字重疊比例可反映候選關(guān)鍵字和創(chuàng)意之間的 文字相似度的另一方面。
[0089]在步驟808中,關(guān)鍵字建議引擎504可進(jìn)一步對創(chuàng)意和經(jīng)細(xì)化的候選關(guān)鍵字的每個 關(guān)鍵字進(jìn)行分類。例如,關(guān)鍵字建議引擎504可訪問被離線預(yù)先構(gòu)建的類別分析設(shè)置。類別 分析設(shè)置可包括類別數(shù)據(jù)庫并且可被配置為將每個類別映射以一組導(dǎo)航關(guān)鍵字。結(jié)果,當(dāng) 類別分析設(shè)置接收創(chuàng)意時,它可搜索映射并確定最佳地匹配創(chuàng)意中的關(guān)鍵字的一個或多個 類別。例如,表1中的創(chuàng)意可被歸類到3個類別中:retail (零售)、home(家庭WPappliance (器具);關(guān)鍵字"home furniture suggestion"可被歸類到2個類別中:retail(零售)和 home (家庭)。
[0090]在步驟810中,關(guān)鍵字建議引擎504可進(jìn)一步確定創(chuàng)意和經(jīng)細(xì)化的候選關(guān)鍵字的每 個關(guān)鍵字之間的類別相似度。類別相似度可根據(jù)以下公式來計算:類別相似度=類別重疊 計數(shù)/創(chuàng)意類別數(shù)目。在以上示例中,關(guān)鍵字的類別重疊計數(shù)是2,因為存在關(guān)鍵字"home furniture suggestion"的兩個類別(即,"retail(零售)"和"home(家庭)")與創(chuàng)意的三個 類別(即,"retail"、"home"和"appliances")相重疊。因此,關(guān)鍵字的類別相似度是2/3。
[0091]在步驟812中,關(guān)鍵字建議引擎504可確定對于每個經(jīng)細(xì)化的候選關(guān)鍵字的推薦 度。該確定可基于候選關(guān)鍵字相對于創(chuàng)意的特征相似度、文字重疊計數(shù)、文字重疊比例、和 類別相似度。例如,關(guān)鍵字建議引擎504可將候選關(guān)鍵字相對于創(chuàng)意的特征相似度、文字重 疊計數(shù)、文字重疊比例、和類別相似度作為輸入并且執(zhí)行經(jīng)預(yù)先訓(xùn)練的線性回歸算法。線性 回歸算法可通過評估輸入的值來返回一得分(例如,0到1)作為推薦度。關(guān)鍵字建議引擎504 可僅在該得分高于或等于閾值(例如,0.4)時才采用候選關(guān)鍵字。
[0092]最終在步驟814中,關(guān)鍵字建議引擎504可選擇具有最高推薦度的候選關(guān)鍵字作為 用于廣告者502的建議競標(biāo)關(guān)鍵字并且返回建議競標(biāo)關(guān)鍵字。
[0093]圖9是根據(jù)本公開的示例實施例示出了回歸訓(xùn)練過程的流程圖。此過程可由諸如 服務(wù)器200之類的服務(wù)器運(yùn)行,并且可被用于步驟810中的線性回歸算法。
[0094] 在步驟902中,編輯者可準(zhǔn)備一組示例創(chuàng)意-關(guān)鍵字對。編輯者可以是人,例如關(guān)鍵 字建議系統(tǒng)500的設(shè)計者。這組示例創(chuàng)意-關(guān)鍵字對可包括大約100個創(chuàng)意,并且每個創(chuàng)意可 配對以30到50個關(guān)鍵字。每個關(guān)鍵字可以是基于創(chuàng)意來選擇的。
[0095]在步驟904中,服務(wù)器可以在與第一階段和第二階段分析相同的過程中確定關(guān)鍵 字的特征相似度、文字重疊計數(shù)、文字重疊比例、和類別相似度。
[0096]在步驟906中,基于對于創(chuàng)意-關(guān)鍵字對的實際人類經(jīng)驗,可向創(chuàng)意-關(guān)鍵字對人工 地分配推薦度。例如,編輯者(其是人)可閱讀每個創(chuàng)意-關(guān)鍵字對并用反映他/她有多么推 薦關(guān)鍵字的得分(即,基于他/她作為人的感受,關(guān)鍵字與創(chuàng)意的匹配有多好)來標(biāo)記創(chuàng)意-關(guān)鍵字對。得分可以是0和1之間的值。例如,1可表示完美匹配,0.7可表示優(yōu)秀的匹配,0.5 可表示良好匹配,0.4可表示一般匹配,而0可表示差匹配。因此,每個創(chuàng)意-關(guān)鍵字對可具有 人工標(biāo)記的值。
[0097] 在步驟908中,關(guān)鍵字的得分以及特征相似度、文字重疊計數(shù)、文字重疊比例、和類 別相似度可作為訓(xùn)練數(shù)據(jù)用于優(yōu)化線性回歸算法。結(jié)果,線性回歸算法可被用于確定候選 關(guān)鍵字的得分(即,推薦度),其中,候選關(guān)鍵字的特征相似度、文字重疊計數(shù)、文字重疊比 例、和類別相似度作為輸入。
[0098] 本公開的以上示例實施例提供了用于競標(biāo)關(guān)鍵字建議的系統(tǒng)和方法。這些系統(tǒng)和 方法可基于廣告者提交的創(chuàng)意來向廣告者建議競標(biāo)關(guān)鍵字。廣告者不需要給它的廣告創(chuàng)意 提供初始種子關(guān)鍵字和/或類別信息來接收用于競標(biāo)在線廣告機(jī)會的建議關(guān)鍵字。為此,系 統(tǒng)進(jìn)行了兩階段的關(guān)鍵字建議分析。
[0099] 在第一階段分析中,系統(tǒng)和方法可從由一般大眾使用的搜索查詢中收集關(guān)鍵字的 數(shù)據(jù)庫。通過使用每個關(guān)鍵字的選擇的搜索結(jié)果,系統(tǒng)和方法可為每個關(guān)鍵字構(gòu)造數(shù)據(jù)庫 關(guān)鍵字特征向量。當(dāng)系統(tǒng)和方法從廣告者接收創(chuàng)意時,系統(tǒng)和方法可構(gòu)造創(chuàng)意特征向量并 把創(chuàng)意特征向量與數(shù)據(jù)庫關(guān)鍵字特征向量相比較。系統(tǒng)和方法然后可從數(shù)據(jù)庫中挑選向量 具有相比創(chuàng)意特征向量的最高相似度(例如,余弦相似度)的關(guān)鍵字。最終,系統(tǒng)和方法可移 除包含被排除的信息(例如,競爭者的名稱)的那些被選擇的數(shù)據(jù)庫關(guān)鍵字,并且返回剩下 的所選擇的數(shù)據(jù)庫關(guān)鍵字作為候選關(guān)鍵字。
[0100]在第二階段分析中,系統(tǒng)和方法可通過利用每個候選關(guān)鍵字和創(chuàng)意之間的特征相 似度、類別相似度和文字相似度評估每個候選關(guān)鍵字來對選擇進(jìn)行細(xì)化。最終選擇的候選 關(guān)鍵字可被返回為建議關(guān)鍵字。廣告者可在競標(biāo)在線廣告機(jī)會時使用建議關(guān)鍵字。
[0101] 盡管本公開的示例實施例涉及用于在線廣告關(guān)鍵字建議的系統(tǒng)和方法,這些系統(tǒng) 和方法還可應(yīng)用于其他應(yīng)用中。例如,除了建議在用戶輸入搜索查詢時的場景中使用的競 標(biāo)關(guān)鍵字之外,系統(tǒng)和方法還可被實現(xiàn)來提供建議的web頁面內(nèi)容用于在線廣告。在另一示 例中,除了分析廣告創(chuàng)意之外,系統(tǒng)和方法還可被實現(xiàn)以分析web頁面的內(nèi)容。
[0102] 因此,圖1-9中所示的示例實施例僅用作描述本公開的實現(xiàn)方案的若干方式的示 例。它們不應(yīng)當(dāng)被解釋為限制本公開的示例實施例的精神和范圍。應(yīng)當(dāng)注意,本領(lǐng)域技術(shù)人 員仍然可以在不背離示例實施例的精神和范圍的情況下做出各種修改或變更。這樣的修改 或變更應(yīng)當(dāng)落入在所附權(quán)利要求中定義的示例實施例的保護(hù)范圍中。
【主權(quán)項】
1. 一種計算機(jī)系統(tǒng),包括: 非暫態(tài)處理器可讀存儲介質(zhì),該非暫態(tài)處理器可讀存儲介質(zhì)包括用于向廣告者建議競 標(biāo)關(guān)鍵字的一組指令;以及 處理器,該處理器與該存儲介質(zhì)通信并且被配置為運(yùn)行該組指令以: 從廣告者接收廣告創(chuàng)意; 基于所述廣告創(chuàng)意,在不使用外部輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意 相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及 返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。2. 如權(quán)利要求1所述的系統(tǒng),其中為了確定所述推薦關(guān)鍵字,所述處理器還被配置為運(yùn) 行該組指令以: 基于所述廣告創(chuàng)意,獲得創(chuàng)意特征向量; 基于所述廣告創(chuàng)意,在無需使用由所述廣告者提供的種子關(guān)鍵字的情況下,獲得多個 關(guān)鍵字,所述多個關(guān)鍵字中的每個關(guān)鍵字與關(guān)鍵字特征向量相關(guān)聯(lián); 確定所述創(chuàng)意特征向量與多個關(guān)鍵字特征向量中的每個關(guān)鍵字特征向量之間的特征 相似度;以及 基于這些相似度從所述多個關(guān)鍵字中選擇多個候選關(guān)鍵字。3. 如權(quán)利要求2所述的系統(tǒng),其中為了選擇所述多個候選關(guān)鍵字,所述處理器還被配置 為運(yùn)行該組指令以: 從所述多個候選關(guān)鍵字中移除預(yù)定被排除的關(guān)鍵字。4. 如權(quán)利要求2所述的系統(tǒng),其中為了獲得關(guān)鍵字特征向量,所述處理器還被配置為運(yùn) 行該組指令以: 執(zhí)行對于所述多個關(guān)鍵字中的關(guān)鍵字的互聯(lián)網(wǎng)搜索以獲得多個搜索結(jié)果; 基于搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用戶選擇的可能性,從所述多個搜 索結(jié)果中選擇多個候選搜索結(jié)果; 基于所述多個候選搜索結(jié)果中的每個候選搜索結(jié)果的內(nèi)容,確定分立的特征向量;以 及 通過組合這多個分立的特征向量來形成所述關(guān)鍵字特征向量。5. 如權(quán)利要求4所述的系統(tǒng),其中搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用戶 選擇的可能性是至少基于所述搜索結(jié)果過去被點(diǎn)擊的數(shù)目以及所述搜索結(jié)果的內(nèi)容與所 述關(guān)鍵字的相關(guān)性而確定的。6. 如權(quán)利要求2所述的系統(tǒng),其中所述處理器還被配置為運(yùn)行該組指令以: 針對所述多個候選關(guān)鍵字中的每個候選關(guān)鍵字,至少基于該候選關(guān)鍵字與所述廣告創(chuàng) 意之間的所述特征相似度、文字相似度和類別相似度來確定推薦分?jǐn)?shù);以及 由計算機(jī)基于所述推薦分?jǐn)?shù),從所述多個候選關(guān)鍵字中選擇所述推薦關(guān)鍵字。7. 如權(quán)利要求6所述的系統(tǒng),其中所述候選關(guān)鍵字的文字相似度包括: 文字重疊計數(shù),該文字重疊計數(shù)是均出現(xiàn)在所述候選關(guān)鍵字中以及所述廣告創(chuàng)意中的 術(shù)語的數(shù)目;以及 文字重疊比例,該文字重疊比例是所述文字重疊計數(shù)與所述候選關(guān)鍵字中的術(shù)語的總 數(shù)目之間的比例;并且 其中所述候選關(guān)鍵字的類別相似度包括: 類別重疊計數(shù),該類別重疊計數(shù)是所述候選關(guān)鍵字和所述廣告創(chuàng)意均屬于的類別的數(shù) 目;以及 類別重疊比例,該類別重疊比例是所述類別重疊計數(shù)與所述候選關(guān)鍵字所屬于的類別 的總數(shù)目之間的比例。8. -種用于向廣告者建議競標(biāo)關(guān)鍵字的計算機(jī)實現(xiàn)的方法,包括: 由計算機(jī)從廣告者接收廣告創(chuàng)意; 由至少一個計算機(jī)基于所述廣告創(chuàng)意,在不使用外部輸入的種子關(guān)鍵字的情況下,確 定與所述廣告創(chuàng)意相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及 由計算機(jī)返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。9. 如權(quán)利要求8所述的方法,其中確定所述推薦關(guān)鍵字包括: 由計算機(jī)基于所述廣告創(chuàng)意,獲得創(chuàng)意特征向量; 由至少一個計算機(jī)基于所述廣告創(chuàng)意,在無需使用由所述廣告者提供的種子關(guān)鍵字的 情況下,獲得多個關(guān)鍵字,所述多個關(guān)鍵字中的每個關(guān)鍵字與關(guān)鍵字特征向量相關(guān)聯(lián); 由計算機(jī)確定所述創(chuàng)意特征向量與多個關(guān)鍵字特征向量中的每個關(guān)鍵字特征向量之 間的特征相似度;以及 由計算機(jī)基于這些相似度從所述多個關(guān)鍵字中選擇多個候選關(guān)鍵字。10. 如權(quán)利要求9所述的方法,其中選擇所述多個候選關(guān)鍵字還包括: 由計算機(jī)從所述多個候選關(guān)鍵字中移除預(yù)定被排除的關(guān)鍵字。11. 如權(quán)利要求9所述的方法,其中獲得關(guān)鍵字特征向量包括: 由計算機(jī)執(zhí)行對于所述多個關(guān)鍵字中的關(guān)鍵字的互聯(lián)網(wǎng)搜索以獲得多個搜索結(jié)果; 由計算機(jī)基于搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用戶選擇的可能性,從所 述多個搜索結(jié)果中選擇多個候選搜索結(jié)果; 由計算機(jī)基于所述多個候選搜索結(jié)果中的每個候選搜索結(jié)果的內(nèi)容,確定分立的特征 向量;以及 由計算機(jī)通過組合這多個分立的特征向量來形成所述關(guān)鍵字特征向量。12. 如權(quán)利要求11所述的方法,其中搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用 戶選擇的可能性是至少基于所述搜索結(jié)果過去被點(diǎn)擊的數(shù)目以及所述搜索結(jié)果的內(nèi)容與 所述關(guān)鍵字的相關(guān)性而確定的。13. 如權(quán)利要求9所述的方法,還包括: 針對所述多個候選關(guān)鍵字中的每個候選關(guān)鍵字,由計算機(jī)至少基于該候選關(guān)鍵字與所 述廣告創(chuàng)意之間的所述特征相似度、文字相似度和類別相似度來確定推薦分?jǐn)?shù);以及 由計算機(jī)基于所述推薦分?jǐn)?shù),從所述多個候選關(guān)鍵字中選擇所述推薦關(guān)鍵字。14. 如權(quán)利要求13所述的方法,其中所述候選關(guān)鍵字的文字相似度包括: 文字重疊計數(shù),該文字重疊計數(shù)是均出現(xiàn)在所述候選關(guān)鍵字中以及所述廣告創(chuàng)意中的 術(shù)語的數(shù)目;以及 文字重疊比例,該文字重疊比例是所述文字重疊計數(shù)與所述候選關(guān)鍵字中的術(shù)語的總 數(shù)目之間的比例;并且 其中所述候選關(guān)鍵字的類別相似度包括: 類別重疊計數(shù),該類別重疊計數(shù)是所述候選關(guān)鍵字和所述廣告創(chuàng)意均屬于的類別的數(shù) 目;以及 類別重疊比例,該類別重疊比例是所述類別重疊計數(shù)與所述候選關(guān)鍵字所屬于的類別 的總數(shù)目之間的比例。15. -種非暫態(tài)處理器可讀存儲介質(zhì),包括被配置為指令處理器執(zhí)行以下動作的一組 指令: 從廣告者接收廣告創(chuàng)意; 基于所述廣告創(chuàng)意,在不使用外部輸入的種子關(guān)鍵字的情況下,確定與所述廣告創(chuàng)意 相關(guān)聯(lián)的推薦競標(biāo)關(guān)鍵字;以及 返回該推薦關(guān)鍵字用于在線廣告競標(biāo)。16. 如權(quán)利要求15所述的存儲介質(zhì),其中確定所述推薦關(guān)鍵字包括: 基于所述廣告創(chuàng)意,獲得創(chuàng)意特征向量; 基于所述廣告創(chuàng)意,在無需使用由所述廣告者提供的種子關(guān)鍵字的情況下,獲得多個 關(guān)鍵字,所述多個關(guān)鍵字中的每個關(guān)鍵字與關(guān)鍵字特征向量相關(guān)聯(lián); 確定所述創(chuàng)意特征向量與多個關(guān)鍵字特征向量中的每個關(guān)鍵字特征向量之間的特征 相似度;以及 基于這些相似度從所述多個關(guān)鍵字中選擇多個候選關(guān)鍵字。17. 如權(quán)利要求16所述的存儲介質(zhì),還包括從所述多個候選關(guān)鍵字中移除預(yù)定被排除 的關(guān)鍵字。18. 如權(quán)利要求16所述的存儲介質(zhì),其中獲得關(guān)鍵字特征向量包括: 執(zhí)行對于所述多個關(guān)鍵字中的關(guān)鍵字的互聯(lián)網(wǎng)搜索以獲得多個搜索結(jié)果; 基于搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用戶選擇的可能性,從所述多個搜 索結(jié)果中選擇多個候選搜索結(jié)果; 基于所述多個候選搜索結(jié)果中的每個候選搜索結(jié)果的內(nèi)容,確定分立的特征向量;以 及 通過組合這多個分立的特征向量來形成所述關(guān)鍵字特征向量, 其中搜索結(jié)果會被使用該關(guān)鍵字進(jìn)行互聯(lián)網(wǎng)搜索的用戶選擇的可能性是至少基于所 述搜索結(jié)果過去被點(diǎn)擊的數(shù)目以及所述搜索結(jié)果的內(nèi)容與所述關(guān)鍵字的相關(guān)性而確定的。19. 如權(quán)利要求16所述的存儲介質(zhì),還包括: 針對所述多個候選關(guān)鍵字中的每個候選關(guān)鍵字,至少基于該候選關(guān)鍵字與所述廣告創(chuàng) 意之間的所述特征相似度、文字相似度和類別相似度來確定推薦分?jǐn)?shù);以及 基于所述推薦分?jǐn)?shù),從所述多個候選關(guān)鍵字中選擇所述推薦關(guān)鍵字。20. 如權(quán)利要求19所述的存儲介質(zhì),其中所述候選關(guān)鍵字的文字相似度包括: 文字重疊計數(shù),該文字重疊計數(shù)是均出現(xiàn)在所述候選關(guān)鍵字中以及所述廣告創(chuàng)意中的 術(shù)語的數(shù)目;以及 文字重疊比例,該文字重疊比例是所述文字重疊計數(shù)與所述候選關(guān)鍵字中的術(shù)語的總 數(shù)目之間的比例;并且 其中所述候選關(guān)鍵字的類別相似度包括: 類別重疊計數(shù),該類別重疊計數(shù)是所述候選關(guān)鍵字和所述廣告創(chuàng)意均屬于的類別的數(shù) 目;以及 類別重疊比例,該類別重疊比例是所述類別重疊計數(shù)與所述候選關(guān)鍵字所屬于的類別 的總數(shù)目之間的比例。
【文檔編號】G06F17/30GK106062743SQ201480076363
【公開日】2016年10月26日
【申請日】2014年3月10日
【發(fā)明人】勞倫斯·莊, 張蔚茹, 韓曉, 馬霖, 吳庭毅, 羅海特·查恩達(dá)
【申請人】??怂箘P利博Ip有限責(zé)任公司