專利名稱:用于提供相關廣告服務的方法和裝置的制作方法
技術領域:
本發(fā)明一般地涉及廣告,并且更具體地,涉及通過將廣告商的確定目標標準和所述廣告將被刊登在其上的媒體的內容進行比較來提供相關的廣告服務。
背景技術:
使用傳統(tǒng)媒體諸如電視、收音機、報紙和雜志做廣告是公知的。廣告商使用這些類型的媒體以便使大量的受眾接觸到他們的廣告(“ads”)。為了接觸到更容易做出反應的受眾,廣告商使用了人口統(tǒng)計學研究。例如,廣告商可以利用廣播事件諸如足球比賽給啤酒做廣告,并且使用動作片向較年輕的男性受眾做廣告。然而,即使使用人口統(tǒng)計學研究和關于各種媒體渠道的典型受眾的完全合理的假設,廣告商認識到因為目標受眾并不對他們接收到的廣告感興趣,所以他們大部分的廣告預算都只是被浪費了。
交互式的媒體,諸如因特網,具有更好地為廣告確定目標的潛力。例如,某些網站提供基于搜索信息的用戶輸入的查詢關鍵字的信息搜索功能。這種用戶查詢可以被用作該用戶感興趣的信息類型的指示符。通過對用戶查詢和由廣告商規(guī)定的一列關鍵字進行比較,可以給這些搜索服務的用戶提供某種形式的目標的廣告。由Google公司提供的Adwords系統(tǒng)就是這種系統(tǒng)的一個例子。
雖然諸如Adwords的系統(tǒng)已經為廣告商提供了更好地為廣告確定目標的能力,但是其效力限于這樣的網站,即用戶在所述網站上輸入搜索查詢以便指示他們感興趣的主題。然而,大多數(shù)Web頁面不提供搜索功能,并且對于這些頁面,廣告商難以為他們的廣告確定目標。結果,不能進行搜索的頁面上的廣告通常對于該頁面的觀看者來說沒有什么價值,并且因此與有用的信息源相比更多地被看作為是令人厭煩的。毫不奇怪,這些廣告通常給廣告商帶來比更具有目標性的基于搜索的廣告更低的投資回報。
因此,具有用于為這樣的情況提供相關的廣告的方法和裝置是有益的,所述的情況是文檔被提供給終端用戶,但是不是響應于終端用戶感興趣的主題的明確的指示(例如,不是響應于終端用戶提出的搜索查詢)。
發(fā)明內容
按照本發(fā)明的系統(tǒng)和方法通過為廣告識別確定目標信息、分析目標文檔的內容以便為目標文檔識別出一個或多個主題的列表,對所述的確定目標信息和所述的主題列表進行比較以便確定是否存在匹配,并且如果存在匹配,確定廣告與目標文檔相關,解決了這種需要和其它的需要。
本發(fā)明的附加的方面涉及計算機系統(tǒng),并且涉及具有與上述方面有關的特征的計算機可讀媒體。
結合于本說明書中,并且構成說明書的一部分的
了本發(fā)明的實施例,并且與下面的說明一起解釋了本發(fā)明,在附圖中圖1是示出了本發(fā)明可以被實現(xiàn)在其內的環(huán)境的圖;圖2是功能性地說明了按照本發(fā)明的廣告系統(tǒng)的圖;圖3是示出本發(fā)明可以被以其實施的裝置的圖;圖4是按照本發(fā)明的、用于提供相關廣告的示例方法的流程圖;和
圖5是一個示例的目標文檔。
具體實施例方式
下面將參考附圖詳細說明本發(fā)明。下面的詳細說明不是對本發(fā)明的限制。代替地由所附的權利要求和其等同物限定本發(fā)明的范圍。
本發(fā)明涉及用于確定與給定文檔相關的廣告的方法和裝置。在一個實現(xiàn)中,所述文檔是網頁,并且所述廣告是可以被呈現(xiàn)在所述網頁上的電子文件。通過分析所述網頁的內容,一組,諸如一列,相應于所述網頁的主題被產生。存在有多種可以執(zhí)行這種處理的技術,其中之一是通過為所述的網頁計算一個術語向量,并且從所述向量選擇頂上的N個術語。主題的列表被與和所述廣告相關聯(lián)的目標信息(例如,由廣告規(guī)定的關鍵字)比較,以便確定哪些廣告與該網頁相關。然后這些相關的廣告中的一些或全部可以被與該網頁關聯(lián)在一起,從而它們可以與該網頁一起被呈現(xiàn)(例如,顯示)出來。
本領域的技術人員將會認識到,按照本發(fā)明的許多其它的實現(xiàn)是可能的。
A環(huán)境和體系結構圖1是說明本發(fā)明可以被實現(xiàn)在其中的環(huán)境的圖。所述環(huán)境包括廣告商110、廣告系統(tǒng)120、廣告消費者130和廣告目標140。
廣告商110可以是直接銷售被廣告的貨物或服務的一方(例如,Amazon.com)或被授權代表刊登廣告者做廣告的代理。廣告商110所希望的廣告可以各種形式存在,其范圍涉及標準的打印的廣告、在線的廣告、音頻廣告、音頻/視頻廣告或所希望的感官信息的任意其它類型。
廣告系統(tǒng)120與廣告商110和廣告消費者130兩者接口。它執(zhí)行如下面參考圖2更詳細解釋的各種功能。本發(fā)明可以被用于這種廣告系統(tǒng)120。
廣告消費者130是這樣的實體,它向廣告系統(tǒng)120發(fā)出廣告請求,從廣告系統(tǒng)120獲得廣告,并且將所述廣告呈現(xiàn)給廣告目標140。典型地,廣告消費者是這樣的實體,它提供所述廣告將被與之關聯(lián)在一起的內容。在一個實現(xiàn)中,廣告消費者130是搜索引擎,諸如由www.google.com的Google公司使用的搜索引擎。
廣告目標140是最終接收所述廣告的個人(或一組個人)。例如,在可視廣告的情況下,廣告目標140是觀看所述廣告的人。
圖2是功能性地說明按照本發(fā)明的廣告系統(tǒng)的圖。所述系統(tǒng)包括廣告活動條目和管理組件210、工具組件220、記賬組件230、一個或多個數(shù)據庫240、消費者接口組件250、廣告選擇組件260、廣告排序組件270、廣告服務組件280和統(tǒng)計引擎組件290。如果本發(fā)明用于這種廣告系統(tǒng),將主要關心廣告選擇組件260。為了幫助理解本發(fā)明,下面將解釋所述廣告系統(tǒng)的其它組件。此外,雖然圖2示出了構成廣告系統(tǒng)120的組件的特定的布置,本領域的技術人員將會認識到,并不是所有的組件都需要被如所示出的那樣布置,不是所有的組件都是需要的,并且其它的組件可以被增加或替換示出的那些組件。
廣告條目和管理組件210是這樣的組件,廣告商通過它輸入廣告活動所需的信息并管理所述的活動。廣告活動包括一個或多個以某種方式相聯(lián)系的廣告。例如,F(xiàn)ord Motor公司可以具有一個零百分比融資的廣告活動,它可以包含一系列有關該主題的廣告。尤其是,可以由廣告商通過廣告條目和管理組件210提供如下內容一個或多個廣告創(chuàng)作(被簡單地稱為“廣告”),一組或幾組與這些創(chuàng)作相關聯(lián)的關鍵字或主題(它們可以被用作所述廣告的確定目標信息),地理的確定目標信息,用于所述廣告的數(shù)值指示,開始日期,結束日期等。廣告條目和管理組件210所需的或由廣告條目和管理組件210獲得的數(shù)據存在于數(shù)據庫240中的一個數(shù)據庫內。
工具組件220包含被設計為用于幫助廣告商110創(chuàng)建、監(jiān)視和管理其活動的各種工具。例如,工具組件220可以包含這樣的工具,其用于幫助廣告商110估計對于特定的關鍵詞或主題一個廣告將接收到印象的數(shù)目。類似地,工具組件220可以被用于幫助廣告商110為給定的廣告產生關鍵字或主題列表,或是基于由廣告商110提供的有代表性的那些關鍵字或主題產生附加的關鍵字或主題。還可以提供其它的可能的工具。取決于所述工具的性質,一個或多個數(shù)據庫240可以被用于收集或存儲信息。
記賬組件230有助于執(zhí)行與記賬有關的功能。例如,記賬組件230為特定廣告商110或廣告活動生成發(fā)票。此外,記賬組件230可以被由廣告商110用于監(jiān)視其各種活動所花費的數(shù)目。記賬組件230所需的或從記賬組件230獲得的數(shù)據存在于數(shù)據庫240中。
數(shù)據庫240包含用于廣告系統(tǒng)120的各種數(shù)據。除了上面提到的關于廣告條目和管理系統(tǒng)210的信息之外,數(shù)據庫240可以包含關于什么廣告已經被顯示過了、它們被顯示的頻次如何、它們被選擇的次數(shù)、誰選擇了這些廣告、廣告的顯示導致交易成交的頻次如何等的統(tǒng)計信息。雖然在圖2中數(shù)據庫240被作為一個單元示出,本領域的普通技術人員將會認識到,多個數(shù)據庫可以被用于收集和存儲由廣告系統(tǒng)120使用的信息。
廣告消費者接口250是這樣一個組件,它和廣告消費者130連接以便獲得或發(fā)送信息。例如,廣告消費者130可以向廣告消費者接口250發(fā)送對一個或多個廣告的請求。所述請求可以包括這樣的信息,諸如請求廣告的站點、可用于輔助選擇廣告的任何信息、被請求廣告的號碼等。作為響應,廣告消費者250可以向廣告消費者130提供一個或多個廣告。此外,廣告消費者130可以通過廣告消費者接口250將與所述廣告的性能有關的信息發(fā)送回廣告系統(tǒng)。例如,這可以包括上面說明的關于數(shù)據庫240的統(tǒng)計信息。廣告消費者接口組件250所需的或從廣告消費者接口組件250獲得的數(shù)據存在于數(shù)據庫240中。
廣告選擇組件260接收對指定號碼的廣告的請求,所述請求結合了有助于選擇正確的廣告的信息。這種信息可以包括,例如,由終端用戶指定的搜索查詢??商鎿Q地,或是另外,如下面更詳細地說明的,這種信息可以包括與為其請求廣告的頁面的內容有關的數(shù)據。
廣告排序組件270從廣告選擇組件260接收相關的廣告列表,并且確定廣告將被呈現(xiàn)給終端用戶的優(yōu)選的順序。例如,可以基于與每個廣告關聯(lián)的數(shù)值指示對相關廣告進行排序。這些排序后的廣告可以被提供給廣告服務組件280。
廣告服務組件280從廣告排序組件270接收排序后的廣告列表,并且將該列表編排成適合于呈現(xiàn)給廣告消費者130的格式。這可能涉及,例如,將廣告呈現(xiàn)成超文本標記語言(HTML)、專有數(shù)據格式等。
統(tǒng)計引擎290包含關于所述廣告的選擇和性能的信息。例如,統(tǒng)計引擎290可以記錄由廣告消費者130作為廣告請求的一部分而提供的信息,由廣告選擇組件260為所述請求選擇的廣告,由排序組件270選擇的順序,以及由廣告提供組件280對所述廣告的呈現(xiàn)。此外,統(tǒng)計引擎290可以記錄關于廣告一旦被提供給廣告消費者130,就該廣告來說發(fā)生了什么的信息。其包括這樣的信息,諸如廣告在什么位置被提供、對該廣告的響應是什么、廣告的效果是什么等。
圖3是示出了本發(fā)明可以被實現(xiàn)在其內的體系結構的圖。該體系結構包括多個客戶機設備302、服務器設備310和網絡301,網絡301可以是,例如,因特網。每個客戶機設備302包括計算機可讀媒體309,諸如連接于處理器308的隨機存取存儲器。處理器308執(zhí)行存儲在存儲器309中的程序指令??蛻魴C設備302還可以包括多個附加的外部或內部設備,諸如,鼠標、CD-ROM、鍵盤和顯示器,但不限于這些。因此,如本領域的技術人員所理解的,客戶機設備可以是個人計算機、個人數(shù)字助理、移動電話、內容播放器(content player)等。
通過客戶機設備302,請求器305可以通過網絡301彼此間以及和連接于網絡301的其它系統(tǒng)和設備,諸如服務器設備310通信。請求器305可以例如是廣告商110、廣告消費者130或廣告目標140。
與客戶機設備302類似,服務器設備310可以包括連接于計算機可讀存儲器312的處理器311。服務器設備310可以附加地包括輔助存儲元件,諸如數(shù)據庫240。
客戶機處理器308和服務器處理器311可以是任意的數(shù)目的公知的微處理器,諸如Santa Clara,California的Intel公司的處理器。通常,客戶機設備302可以是被連接到網絡并且與應用程序交互的任意類型的計算平臺,諸如數(shù)字助理或“智能的”蜂窩電話或尋呼機。雖然被以單個計算機系統(tǒng)給出,服務器310可以被實現(xiàn)為計算機處理器的網絡。
存儲器312可以包含多個程序,諸如上面關于圖2所說明的組件。
B操作圖4是按照本發(fā)明的用于確定廣告是否與文檔相關的示例方法的流程圖。如此處所使用的,術語“文檔”包括任意類型的書面或電子文檔或文件,包括音頻、視頻、圖像、文本等。即,如本領域的技術人員將會理解的,本說明書中使用的“文檔”是任意的機器可讀的和機器可存儲的作品。文檔可以是文件、文件的組合、具有到其它文件的嵌入的鏈接的一個或多個文件等。應當理解,為了說明起見,此處說明的處理是作為廣告選擇組件260的一部分而發(fā)生的,雖然本領域的技術人員將會認識到,并不必須單獨發(fā)生在該組件內。
示例的方法不限于該流程圖中示出的順序。該處理為廣告識別確定目標信息。(階段410)確定目標信息當由廣告商110通過廣告活動條目和管理組件210提供時,可以是與廣告相關聯(lián)的關鍵字或短語的列表的形式(例如,“本田”、“本田汽車”、“汽車”等)??商鎿Q地,或是另外,可以基于廣告的內容、被廣告的貨物或服務、其它相關廣告的目標的確定等以算法確定所述的確定目標信息。例如,如果廣告的內容包括“以本年最低的價格購買本田汽車”,術語“本田”或“本田汽車”可以被從該內容中提取出來。確定目標信息還可以包括其它的人口統(tǒng)計學信息,諸如地理位置、財富等。因此,確定目標信息僅是這樣的某些信息,從這些信息可以得出主題。
接著,目標文檔(即,相應于相關廣告被請求的文檔)被分析,以便識別出相應于所述目標文檔的主題(階段420)。目標文檔可以被存儲在數(shù)據庫240上,或是可以由廣告消費者130通過廣告消費者接口組件250提供。如下面參考圖5和有關的文字所說明的,存在有多種分析目標文檔以識別這種主題的方法。
在階段410識別出的確定目標信息被與階段420中識別出的一個或多個主題比較,以便確定是否存在匹配(階段430)?!捌ヅ洹辈⒉皇蔷_的匹配。而是,匹配是對相對高的類似程度和/或一個預先確定的類似程度(例如,絕對的)的指示。如果存在匹配,該廣告被確定為與該目標文檔是相關的(階段440),并且可以被提供給廣告排序組件270,以便最終通過廣告消費者接口組件250提供給廣告消費者130。
本領域的技術人員將會認識到,每個階段中說明的功能僅是示例的,并且不旨在是要進行限制。
一種識別相應于目標文檔的主題的方法是通過分析目標文檔內的某些或全部文本,這將參考圖5進行說明。圖5示出了題目為“Travels in Italy”的樣本文檔,該文檔包含關于意大利的與旅游有關的信息的集合。該文檔的文本包含術語“restaurant”(出現(xiàn)了20次)、“chianti”(出現(xiàn)了10次)和“the”(出現(xiàn)了100次)??梢源_定出現(xiàn)在目標文檔的題目中的每個術語中的一個或多個術語(單詞或短語)相應于目標文檔的主題。以此為基礎,這個文檔的主題可以是“travels”、“in”和/或“Italy”。
可替換地,可以確定出現(xiàn)在目標文檔主題中的每個術語中的一個或多個術語相應于目標文檔的主題。在最簡單的情況下,目標文檔中的每個術語將被識別為一個主題。一種稍微復雜一些的方法將把這樣的術語識別為主題,如果它在目標文檔中出現(xiàn)了多于N次,諸如N=2的話(并且的確可以在每次分析文本中的術語時使用這種基于閾值的方法)??梢詧?zhí)行甚至更復雜的分析,諸如通過使用目標文檔的術語向量,其對每個術語分配權重。例如,在目標文檔中頻繁出現(xiàn)的術語被分配有與那些出現(xiàn)的頻率較少的術語相比相對高的權重。并且因此,術語“the”比“restaurant”具有更高的權重,而“restaurant”具有比“chianti”更高的權重。
此外,將調整加權,以便給與在一個集合中以很少頻率出現(xiàn)的術語較高的權重,所述的集合諸如是該文檔所屬的集合或文檔的一般的集合。例如,術語“chianti”沒有在文檔的一般的集合中非常普遍地出現(xiàn),因此它的權重可被提升。相反地,術語“the”在文檔的集合中出現(xiàn)得如此頻繁,所以可以降低它的權重或是被完全除去。
在給文本中的術語分配權重或分數(shù)的任意情況下,這些產生的分數(shù)可以被用于確定哪些術語將被識別為目標文檔的主題。例如,可以確定僅僅分數(shù)最高的術語構成目標文檔的主題。可替換地,或是另外,可以確定最高的Z個術語(或一個子集)構成目標文檔的主題,Z是某個確定的數(shù)目??商鎿Q地,或是另外,可以確定具有超過Y的分數(shù)的術語(或子集)構成目標文檔的主題,Y是某個確定的數(shù)目。因此,如本領域的技術人員將會理解的,可以基于絕對和/或相對準則確定主題。
可替換地,或是除了使用目標文檔中的文本或其它信息之外,可以使用與目標文檔相關聯(lián)的元信息。例如,由另一文檔對目標文檔的引用可以包含對目標文檔的簡要的說明。假設被稱為“Entertainment”的文檔包含對目標文檔的引用,并且將它描述為“對于意大利的飯店和葡萄酒的說明,見“Travels in Italy””。在網頁的環(huán)境中,這通常被說明為錨文本。一個或多個這種簡要的說明可以被用作通過以所述的簡要說明補充或替換目標文檔的某些或全部內容來修訂(修飾性地)目標文檔。因此,例如,可以從目標文檔的題目和對目標文檔的簡要說明的組合中識別主題。
可替換地,或除了來自這些引用的簡要說明之外,可以使用這些引用本身。例如,從另一文檔到目標文檔的引用可以被用作這兩個文檔相類似的指示??商鎿Q地,或是另外,從目標文檔到另一文檔的引用可以被用作這兩個文檔相類似的指示。因此,文檔“Entertainment”和文檔“Travels in Italy”之間的引用可以指出它們兩個是相關的。在網頁的環(huán)境中,這些引用以從一個網頁到另一個網頁的鏈接的形式出現(xiàn)。以此為基礎,所述其它文檔的內容(或元信息)可以被用于通過以所述其它文檔的內容補充或替換目標文檔的內容修訂(修飾性地)目標文檔。然后可以使用上面說明的技術分析修訂后的目標文檔的內容,以便識別一個或多個主題。
可替換地,或除了使用與目標文檔相關聯(lián)的內容(可能包括元數(shù)據)之外,可以使用其它的技術為目標文檔識別一個或多個主題。例如,導致對目標文檔的引用的最多的N個查詢可以被確定為構成目標文檔的主題,N是某個確定的數(shù)目。這些查詢可以是,例如,搜索引擎中的文本查詢,它們產生了鏈接到目標文檔或網頁的結果??商鎿Q地,或是另外,其它的類似文檔的內容(例如,與目標文檔在同一個集合中,與目標文檔在同一個類別中等)可以被用于修訂(修飾性地)目標文檔的內容。然后,可以使用上面說明的任意的技術分析目標文檔以便識別一個或多個主題。在網頁的環(huán)境中,這可以是與目標文檔存儲在同一個主機上的相關頁面的子目錄內的其它的網頁??商鎿Q地,或是另外,可以使用用于將目標文檔分類到一個或多個主題或類別的組中的任何技術。基于這樣的理論,即,在時間上與所述的搜索查詢歷史接近的對目標文檔的訪問指示出用戶認為它們的概念是相關的,甚至訪問該目標文檔(或目標網頁)的一個或多個用戶的搜索查詢歷史也可以被用于識別目標文檔或網頁的主題。例如,如果用戶搜索了“Italy wine”,并且不久后觀看了文檔“Travels in Italy”,則前面的搜索的內容可以被用于確定“Italian”和/或“wine”是文檔“Travels inItaly”的潛在的主題。
使用上面說明的各種技術中的一個或多個技術,或其它的技術,可以為目標文檔識別一個或多個主題。一旦已經識別出了這些主題,可以使用各種技術確定與這些識別出的主題相關的其它主題。例如,可以使用辭典確定與識別出的主題緊密相關的其它主題(例如,同義詞)或是在概念上近似于識別出的主題的其它主題。
為了清楚起見,前面提到的“修訂”目標文檔是為了幫助理解使用附加信息的一種比喻,所述的附加信息在字面上不存在于目標文檔內。本領域的技術人員將會認識到,實際上不需要修訂目標文檔,以便使用這種附加信息。
C結論對本發(fā)明的優(yōu)選實施例的上述說明提供了說明和描述,而不是旨在于窮舉或將本發(fā)明限制為所披露的精確的形式。根據上面的技術可以作出或從本發(fā)明的實踐可以獲得修改和改變。
本發(fā)明的范圍由權利要求和它們的等同物限定。
權利要求
1.一種用于確定廣告是否與目標文檔相關的方法,該方法包括為廣告識別確定目標信息;分析目標文檔的內容,以便為目標文檔識別一個或多個主題的組;對所述確定目標信息和所述的一個或多個主題的組進行比較,以便確定是否存在匹配;和如果存在匹配,確定所述廣告與所述目標文檔是相關的。
2.如權利要求1的方法,其中所述廣告屬于廣告商,并且其中識別確定目標信息包括從所述廣告商處接收主題列表。
3.如權利要求1的方法,其中識別確定目標信息包括通過分析廣告的內容產生主題列表。
4.如權利要求1的方法,其中分析內容包括通過基于目標文檔中的文本為目標文檔計算術語向量,識別一個或多個主題的組。
5.如權利要求4的方法,其中基于術語在目標文檔的文本內出現(xiàn)的頻率,為所述術語向量中的術語分配權重。
6.如權利要求4的方法,其中基于術語在文檔集合中出現(xiàn)的頻率,為所述術語向量中的術語分配權重。
7.如權利要求4的方法,其中所述的一個或多個主題的組包含其權重超過了確定的閾值的術語。
8.如權利要求4的方法,其中所述的一個或多個主題的組包括限定數(shù)目的在所述術語向量的術語中具有最高的權重的術語。
9.如權利要求1的方法,其中分析內容包括基于所述目標文檔是其一個部分的集合的其它部分識別主題。
10.如權利要求1的方法,其中分析內容包括基于產生對所述目標文檔的引用的一個或多個查詢識別主題。
11.如權利要求1的方法,其中分析內容包括確定至少一個與目標文檔類似的文檔;以所述類似的文檔的內容補充目標文檔的內容;和分析補充后的目標文檔的內容以便識別主題。
12.如權利要求11的方法,其中確定至少一個類似的文檔包括如果文檔包含對所述目標文檔的引用則確定該文檔是類似的。
13.如權利要求11的方法,其中確定至少一個類似的文檔包括如果目標文檔包含對該文檔的引用,則確定該文檔是類似的。
14.如權利要求11的方法,其中所述的補充包括以所述至少一個類似的文檔的至少部分內容替換目標文檔的至少部分內容。
15.如權利要求1的方法,其中分析內容包括識別引用所述目標文檔的另一文檔所使用的對目標文檔的說明;和分析所述說明的內容以便識別目標文檔的主題。
16.如權利要求1的方法,其中分析內容包括識別引用目標文檔的另一文檔所使用的對目標文檔的說明;以所述的說明補充目標文檔的內容;和分析補充后的目標文檔的內容以便識別目標文檔的主題。
17.如權利要求1的方法,其中分析內容包括將目標文檔分類到一個類別中;和基于所述的類別為所述目標文檔識別出一個或多個主題的列表。
18.如權利要求17的方法,其中與目標文檔相關聯(lián)的元信息被用于將目標文檔分類到一個類別中。
19.如權利要求18的方法,其中所述的元信息包括來自包含對所述目標文檔的引用的另一文檔的信息。
20.如權利要求18的方法,其中所述的元信息包括來自目標文檔引用的另一文檔的信息。
21.如權利要求19的方法,其中所述來自另一文檔的信息包括與其它文檔相關聯(lián)的元信息。
22.如權利要求1的方法,其中將確定目標信息和所述主題進行比較包括,則將確定目標信息與所述主題或相關的主題進行比較以確定是否存在匹配。
23.如權利要求14的方法,其中所述相關的主題是所述主題的同義詞。
24.如權利要求14的方法,其中所述相關的主題在概念上與所述主題類似。
25.如權利要求1的方法,其中所述目標文檔是目標網頁。
26.如權利要求25的方法,其中分析內容包括分析目標網頁內的術語,并且如果術語在目標文檔網頁內出現(xiàn)的頻率超過了一個閾值,則將它們包括在一個或多個主題的組中。
27.如權利要求26的方法,還包括確定與所述組中的一個或多個主題相關的術語;和對所述組進行補充,將所述相關的術語包括在內。
28.如權利要求25的方法,其中分析內容包括分析目標網頁的題目內的術語,并且如果術語在所述題目內出現(xiàn)的頻率超過了一個閾值,則將它們包括在一個或多個主題的組中。
29.如權利要求25的方法,其中分析內容包括基于目標網頁內的文本,為目標網頁計算術語向量;和基于所述術語向量識別一個或多個主題的列表。
30.如權利要求29的方法,其中基于術語向量內的術語在目標文檔中出現(xiàn)的頻率,為該術語分配權重。
31.如權利要求29的方法,其中基于術語向量內的術語在網頁的集合中出現(xiàn)的頻率,為該術語分配權重。
32.如權利要求29的方法,其中所述的一個或多個主題的組包括其權重超過了一個限定的值的術語。
33.如權利要求29的方法,其中所述的一個或多個主題的組包括限定數(shù)目的在所述術語向量的術語中具有最高的權重的術語。
34.如權利要求25的方法,其中分析內容包括確定至少一個與目標網頁類似的網頁;通過以所述的類似的網頁的內容補充目標網頁的內容,修訂目標網頁的內容;和分析目標網頁修訂后的內容,以便識別一個或多個主題的組。
35.如權利要求34的方法,其中所述的補充包括以所述類似的網頁的內容的至少一部分替換目標網頁的內容的至少一部分。
36.如權利要求34的方法,其中確定至少一個類似的網頁包括如果網頁包含對目標網頁的鏈接,則確定該網頁是類似的。
37.如權利要求34的方法,其中確定至少一個類似的網頁包括如果目標網頁包含對該網頁的鏈接,則確定該網頁是類似的。
38.如權利要求34的方法,所述的網頁被包含在主機內,并且其中確定至少一個類似的網頁包括如果網頁與目標網頁包含在同一個主機內,則確定該網頁是類似的。
39.如權利要求34的方法,所述的網頁被包含在主機內,并且其中確定至少一個類似的網頁包括如果網頁與目標網頁存儲在同一個主機上的相關頁面的子目錄內,則確定該網頁是類似的網頁。
40.如權利要求25的方法,其中分析內容包括確定相應于目標網頁的錨文本;通過以所述錨文本補充目標網頁的內容,修訂目標網頁的內容;和分析目標網頁修訂后的內容以便識別一個或多個主題的組。
41.如權利要求40的方法,其中所述的補充包括以所述錨文本的至少一部分替換目標網頁的內容的至少一部分。
42.如權利要求40的方法,其中所述的補充包括以所述錨文本的至少一部分替換目標網頁的內容。
43.如權利要求25的方法,其中分析內容包括將目標網頁分類到一個類別中;和基于所述的類別識別目標網頁的一個或多個主題的列表。
44.如權利要求43的方法,其中與目標網頁相關聯(lián)的元信息被用于將目標網頁分類到一個類別中。
45.如權利要求44的方法,其中所述的元信息包括來自于包含對目標網頁的引用的另一文檔的信息。
46.如權利要求45的方法,其中所述來自另一文檔的信息包括與其它文檔相關聯(lián)的元信息。
47.如權利要求44的方法,其中所述的元信息包括相應于目標網頁的錨文本。
48.如權利要求25的方法,其中所述廣告屬于廣告商,并且其中識別確定目標信息包括從所述廣告商處接收一個或多個主題的組。
49.如權利要求25的方法,其中識別確定目標信息包括基于所述廣告的內容產生一個或多個主題的組。
50.如權利要求25的方法,其中識別確定目標信息包括基于搜索引擎上的查詢文本產生所述廣告的一個或多個主題的組,所述的查詢產生鏈接到網站上所述廣告鏈接到的網頁的結果。
51.一種用于確定廣告是否與目標網頁相關的方法,該方法包括為所述廣告識別確定目標信息;基于搜索引擎上的查詢文本,產生目標網頁的一個或多個主題的組,所述的查詢產生鏈接到所述的目標網頁的結果;對所述的確定目標信息和所述一個或多個主題的組進行比較,以便確定是否存在匹配;和如果存在匹配,確定所述廣告與所述的目標網頁相關。
52.一種用于確定廣告是否與目標網頁相關的方法,該方法包括為所述廣告識別確定目標信息;基于一個或多個訪問所述目標網頁的用戶的搜索查詢歷史產生目標網頁的一個或多個主題的組;對所述的確定目標信息和所述一個或多個主題的組進行比較,以便確定是否存在匹配;和如果存在匹配,確定所述廣告與所述的目標網頁相關。
53.如權利要求52的方法,其中所述的搜索查詢歷史基于這樣的用戶,所述的用戶在給定的時間段內訪問過所述的目標網頁。
54.如權利要求53的方法,其中所述的給定的時間段是最后的Y分鐘,其中Y是一個預先確定的期間。
55.一種用于為目標網頁提供相關廣告服務的方法,該方法包括接收對與所述目標網頁相關的廣告的請求;分析所述的目標網頁的文本,以便識別相應于所述目標網頁的一個或多個主題的組;確定與出現(xiàn)在所述的組中的主題相關聯(lián)的廣告;和響應所述的請求提供至少一個識別出的廣告。
56.如權利要求54的方法,其中確定廣告包括確定這樣的廣告,對于這些廣告已經規(guī)定了相應于出現(xiàn)在所述的組內的主題的關鍵字。
57.用于確定廣告是否與目標網頁相關的裝置,該裝置包括用于為所述廣告識別確定目標信息的裝置;用于分析目標網頁的內容以便識別目標網頁的一個或多個主題的組的裝置;用于對所述的確定目標信息和所述的一個或多個主題的組進行比較以便確定是否存在匹配的裝置;和用于如果存在匹配則確定所述廣告與所述目標網頁相關的裝置。
58.一種用于確定廣告是否與目標網頁相關的方法,該方法包括用于為所述廣告識別確定目標信息的步驟;用于分析目標網頁的內容以便識別目標網頁的一個或多個主題的組的步驟;用于對所述的確定目標信息和所述的一個或多個主題的組進行比較以便確定是否存在匹配的步驟;和用于如果存在匹配則確定所述廣告與所述目標網頁相關的步驟。
59.用于確定廣告是否與目標網頁相關的裝置,該裝置包括至少一個具有程序指令的存儲器,和至少一個處理器,被配置為執(zhí)行所述的程序指令,以便執(zhí)行以下操作為所述廣告識別確定目標信息;分析目標網頁的內容以便識別目標網頁的一個或多個主題的組;對所述的確定目標信息和所述的一個或多個主題的組進行比較以便確定是否存在匹配;和如果存在匹配,則確定所述廣告與所述目標網頁相關。
全文摘要
改進了廣告與用戶的興趣的相關性(圖4)。在一個實現(xiàn)中,分析網頁的內容,以便確定與所述網頁(420)相關聯(lián)的一個或多個主題的列表。如果廣告與屬于所述一個或多個主題的列表中的關鍵字相關聯(lián),則該廣告可以被認為與所述網頁相關(440)。可以提供一個或多個這種相關的廣告,以便和所述網頁或相關的網頁一起呈現(xiàn)出來。
文檔編號G06F17/30GK1826596SQ03822749
公開日2006年8月30日 申請日期2003年9月24日 優(yōu)先權日2002年9月24日
發(fā)明者杰弗里·A.·迪安, 喬治斯·R.·哈瑞克, 保羅·布鍥特 申請人:Google公司