專利名稱:在因特網(wǎng)搜索引擎上檢測無效點擊的方法和設備的制作方法
技術領域:
本發(fā)明涉及因特網(wǎng)搜索引擎服務器。更明確地說,本發(fā)明涉及用于檢 測搜索項的無效點擊的方法和設備,搜索項被包括在一個由因特網(wǎng)搜索引 擎服務器提供的搜索結果網(wǎng)頁內。此外,本發(fā)明涉及用于檢測無效點擊的 方法和設備,其可以檢測不公平地增加搜索項點擊量的各種嘗試并可以立 即應付這些嘗試。
背景技術:
隨著因特網(wǎng)的使用越來越廣泛,諸如可經(jīng)由因特網(wǎng)訪問的網(wǎng)頁之類的 信息源的數(shù)量已經(jīng)以算術級數(shù)增長。此外,為了在大量信息源之中發(fā)現(xiàn)信
息,搜索器訪問諸如NAVER、 Yahoo和Lycos之類的因特網(wǎng)搜索引擎服務
器以請求搜索。因特網(wǎng)搜索服務提供商產(chǎn)生一個包括搜索項在內的搜索結 果網(wǎng)頁,其包括與搜索器輸入的搜索字有關的信息,然后向搜索器提供生 成的搜索結果網(wǎng)頁。例如,當搜索器訪問NAVER搜索引擎服務器然后輸 入搜索字"Digital Camera (數(shù)碼相機)"時,搜索結果網(wǎng)頁如圖2所示。包 括在搜索結果網(wǎng)頁內的每一項都與URL(統(tǒng)一資源定位符)有關。
因為與單一搜索字有關的搜索項的數(shù)量不計其數(shù),然而,這類不計其
數(shù)的搜索項如何在搜索結果網(wǎng)頁上顯示和以什么順序顯示對因特網(wǎng)搜索 服務提供商來說是一個非常重要的問題。因特網(wǎng)搜索服務提供商通過結合 幾個標準來確定搜索項的列出順序。已被廣泛使用的其中一個標準是用戶 對特殊搜索項的點擊量。例如,如果用戶對一個搜索項的點擊量很大,則 該搜索項被顯示在搜索結果網(wǎng)頁相對靠上的部分。甚至在因特網(wǎng)搜索服務 提供商通過結合多個參數(shù)來確定搜索項的列出順序的情況中,如果其中一 個參數(shù)是用戶點擊量,則具有很高點擊量的搜索項被顯示在搜索結果網(wǎng)頁 的相對靠上的部分。
此外,因特網(wǎng)搜索服務器產(chǎn)生的搜索結果網(wǎng)頁被顯示得越高,用戶可
能點擊和訪問該網(wǎng)頁的可能性就越大。從而,web服務器的網(wǎng)絡信息提供 商想要把與他(她)自己有關的搜索項顯示在搜索結果網(wǎng)頁的頂端。因為這 個原因,為了將他(她)的網(wǎng)頁搜索項顯示在搜索結果網(wǎng)頁的頂端,網(wǎng)絡信 息提供商可以故意地訪問因特網(wǎng)搜索服務器來多次點擊他(她)自己網(wǎng)頁 的搜索項。有時,網(wǎng)絡信息提供商可以用一個專門的程序不斷地點擊他(她) 的網(wǎng)頁的搜索項。因為這類不公平的搜索項點擊并不反映真實的用戶搜索 結果,所以因特網(wǎng)搜索服務提供商必須檢測這類無效的點擊。
先有技術中存在這類服務,其中,與搜索項有關的網(wǎng)絡信息提供商基 于搜索結果網(wǎng)頁中的每個搜索項的點擊量被收費。因特網(wǎng)搜索服務提供商 Overture Services ,lnc.(U.S.A)提供這類服務,其中,當搜索器點擊與網(wǎng) 絡信息提供商有關的搜索結果網(wǎng)頁中的搜索項時,網(wǎng)絡信息提供商支付每 次點擊。在這種情況下,如果搜索器故意多次點擊一個特殊的搜索項,則 與搜索項有關的網(wǎng)絡信息提供商必須支付額外的費用。因此,甚至在這種 情況下也必須要檢測無效點擊,其意圖是只增加點擊量而實際上沒有對搜 索項進行搜索。
發(fā)明內容
本發(fā)明被提供來解決上述的先有技術中的問題。本發(fā)明的一個目的是 提供用于檢測搜索項的無效點擊的方法和設備,搜索項包括在一個由因特 網(wǎng)搜索引擎服務器提供的搜索結果網(wǎng)頁內。
本發(fā)明的另一個目的是提供用于檢測無效點擊的方法和設備,其可以 檢測不正當增加搜索項的點擊量的各種嘗試,并且可以立即應付這些嘗
試o
本發(fā)明的另一個目的是提供一個用于檢測無效點擊的方法和設備,其 中,為了檢測無效點擊而提供的幾個標識符很難被仿造或偽造。 為了達到上述目的并解決先有技術中的上述問題,本發(fā)明提供了一個
在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應于來自搜 索器的搜索請求產(chǎn)生一個搜索結果網(wǎng)頁,獲取一個對應于被產(chǎn)生網(wǎng)頁的頁 面標識符,從搜索器接收包括在搜索結果網(wǎng)頁內的搜索項的點擊,獲取一 個對應于被點擊搜索項的站點標識符,并且如果頁面標識符和站點標識符
與在預定時段內的其它點擊有關的頁面標識符和站點標識符一致,則確定 該點擊是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點 擊的方法,包括下列步驟響應于來自搜索器的搜索請求產(chǎn)生一個搜索結
果網(wǎng)頁,獲取一個包括在搜索器終端存儲的會話cookie文件內的會話標識 符,從搜索器接收一個包括在搜索結果網(wǎng)頁內的搜索項點擊,獲取一個對
應于被點擊搜索項的站點標識符,并且如果會話標識符和站點標識符與預 定時段內與其它點擊有關的會話標識符和站點標識符一致,則確定該點擊
是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點
擊的方法,包括下列步驟從搜索器接收包括在搜索結果網(wǎng)頁內的搜索項
的點擊,獲取一個對應于搜索器終端的客戶機IP地址,獲取一個對應于被 點擊的搜索項的站點標識符,并且如果客戶機IP地址和站點標識符與預定 時段內的其它點擊有關的客戶機IP地址和站點標識符一致,則確定該點擊 是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點
擊的方法,包括下列步驟響應于來自搜索器的搜索請求產(chǎn)生一個搜索結 果網(wǎng)頁,獲取一個對應于搜索器終端的終端標識符,產(chǎn)生一個包括終端標
識符的用戶cookie文件然后把用戶cookie文件存儲在搜索器終端中,從搜
索器接收一個包括在搜索結果網(wǎng)頁內的搜索項點擊,獲取一個對應于被點 擊搜索項的站點標識符,并且如果終端標識符和站點標識符與預定時段內 的其它點擊有關的終端標識符和站點標識符一致,則確定該點擊是無效 的。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設備,其 中,如果搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結果網(wǎng)頁內的搜 索項,則至少搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡地址、與搜索 結果網(wǎng)頁有關的搜索字、搜索器的web瀏覽器的相關信息、與存儲在搜索 器終端中的點擊和cookie文件信息有關的點擊時間、與搜索項有關的URL 信息的其中一個被接收,并且基于一個根據(jù)被接收信息預定的標準 (reference)來確定該點擊是否無效。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設備,包括 (1)一個日志存儲單元,其響應于搜索器點擊包括在由因特網(wǎng)搜索引擎提 供的搜索結果網(wǎng)頁內的搜索項,來存儲一個至少與下列兩項有關的日志 搜索器終端的IP地址,搜索器終端所屬的網(wǎng)絡地址,與搜索結果網(wǎng)頁有關
的搜索字,搜索器的web瀏覽器的相關信息,與點擊有關的點擊時間、存 儲在搜索器終端中cookie文件信息和與搜索項有關的URL信息,(2)—個無 效點擊模型存儲單元,其存儲與至少下列中兩個有關的無效點擊模型搜 索器終端的IP地址、搜索器終端所屬的網(wǎng)絡地址、與搜索結果網(wǎng)頁有關的 搜索字、搜索器的web瀏覽器的相關信息、與點擊有關的點擊時間、存儲 在搜索器終端中的cookie文件信息、和與搜索項有關的URL信息,和(3) 一個無效點擊決定單元,其基于日志存儲單元中存儲的日志和無效點擊模 型存儲單元中存儲的無效點擊模型來確定搜索點擊是否是一個無效點擊。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設備,包括 一個點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結果 網(wǎng)頁內的搜索項,計數(shù)預定時段內每個搜索項的搜索器點擊量, 一個平均 點擊量計算裝置,用于在預定時段內計算屬于搜索項所屬類別的搜索項的 平均點擊量,和一個決定裝置,用于確定每個搜索項的點擊量是否比平均 點擊量大一個預定的差。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設備,包括 一個點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結果 網(wǎng)頁內的搜索項,計數(shù)預定時段內每個搜索項的搜索器點擊量, 一個平均 點擊量計算裝置,用于在搜索結果網(wǎng)頁中在預定時段內計算位于搜索項較 高端的搜索項的預定第一數(shù)量和位于搜索項較低端的搜索結果的預定第 二數(shù)量的平均點擊量,和決定裝置,用于確定每個搜索項的點擊量是否比 平均點擊量大一個預定的差。
無效點擊很難精確地定義,并且無效點擊的范圍應該取決于實施例和 應用來不同地定義。然而,無效點擊可能指的是以只增加點擊量而不以實 際搜索為目的而做出的點擊。
圖1是一個示意圖,說明因特網(wǎng)搜索服務器的一個網(wǎng)絡連接,包括用 于檢測無效點擊的設備和根據(jù)本發(fā)明的客戶機終端。
圖2是一個說明由因特網(wǎng)搜索引擎產(chǎn)生的搜索結果網(wǎng)頁的示意圖。 圖3是一個說明根據(jù)本發(fā)明實施例來檢測無效點擊的設備結構的框圖。
圖4是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 圖5顯示了根據(jù)本發(fā)明實施例的示例的日志文件。 圖6a和6b是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 圖7顯示了 一個根據(jù)本發(fā)明實施例的示例的日志文件。 圖8是一個根據(jù)本發(fā)明實施例來產(chǎn)生會話標識符的方法流程圖。 圖9是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 圖10顯示了 一個根據(jù)本發(fā)明實施例的示例的日志文件。 圖11是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 圖12是一個說明通用計算機系統(tǒng)的結構的框圖,該系統(tǒng)可用于創(chuàng)立一 個搜索引擎服務器和一個用于根據(jù)本發(fā)明檢測無效點擊的設備。
具體實施例方式
在下文中,本發(fā)明的優(yōu)選實施例將參考附圖被詳細描述。 圖1是一個示意圖,說明包括用于檢測無效點擊的設備和根據(jù)本發(fā)明 的客戶機終端的因特網(wǎng)搜索服務器的網(wǎng)絡連接。
嘗試不公平點擊的搜索器或作弊器經(jīng)由連接到因特網(wǎng)103的客戶機 終端101來訪問因特網(wǎng)搜索服務器104。作弊器通過多次點擊由因特網(wǎng)搜 索服務器104提供的搜索結果網(wǎng)頁中的搜索項來增加點擊量。例如在圖2 中,假定搜索項202是一個與http:〃www.invalidclick.com有關的搜索項, 并且作弊器不斷地點擊搜索項202以便于搜索項202被顯示在搜索結果網(wǎng) 頁的頂端。
當客戶機終端101被連接到搜索引擎服務器104或其它網(wǎng)絡站點時, cookie文件102是一個由搜索引擎服務器104或其它網(wǎng)絡站點存儲在客戶 機終端101的硬盤中的特殊的文本文件。在用于連接網(wǎng)絡站點的HTTP協(xié) 議中,每個對網(wǎng)頁的請求都與其它請求無關。因此,網(wǎng)絡服務器不具這樣
的信息,即哪個頁面先前已經(jīng)被發(fā)送到客戶機終端101或者客戶機終端
101先前己經(jīng)執(zhí)行了什么工作。因此,為了關聯(lián)像這樣獨立處理的各個請
求, 一個cookie文件被提供。這類cookie文件服務允許網(wǎng)絡服務器把用戶 信息存儲在用戶的計算機中。為了在本發(fā)明中檢測無效點擊,甚至可以使 用幾個cookie文件。這將在后面被詳細描述。
日志文件105是一個用于存儲與用戶點擊模型相關的幾個日志的文 件。在本發(fā)明中,為了檢測無效點擊而使用幾個參數(shù)。在與各個點擊有關 的參數(shù)被存儲在日志文件中之后,基于預定的規(guī)則和模型來確定輸入點擊 是否無效。
根據(jù)本發(fā)明實施例的日志文件的例子如圖5、 7和10中所示。 圖3是一個說明根據(jù)本發(fā)明實施例來檢測無效點擊的設備結構的框圖。
根據(jù)本發(fā)明實施例來檢測無效點擊301的設備包括參數(shù)輸入單元 304、日志存儲單元305、無效點擊模型存儲單元306、無效點擊驗證單元 307、無效點擊報告單元308和無效點擊決定單元309。
如果搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結果網(wǎng)頁內的 搜索項,則與該點擊有關的幾個參數(shù)302被輸入到參數(shù)輸入單元304。這 些參數(shù)是用于確定無效點擊的基本信息,并且包括搜索器終端的IP地址、 搜索器終端所屬的網(wǎng)絡地址、與搜索結果網(wǎng)頁有關的搜索字、搜索器的 web瀏覽器的相關信息、與點擊有關的點擊時間、存儲在搜索器終端中的 cookie文件信息、與搜索項有關的URL信息等等。
如果搜索器向因特網(wǎng)搜索引擎服務器104請求一個搜索,則搜索請求 分組從客戶機終端101被傳遞到因特網(wǎng)搜索引擎服務器104。搜索請求分 組包括一個根據(jù)HTTP協(xié)議的分組配置并且還被包含在因特網(wǎng)(IP:網(wǎng)際協(xié) 議)分組內。因為源IP地址字段被包括在因特網(wǎng)協(xié)議分組的配置內,所以 因特網(wǎng)搜索引擎服務器104從點擊所請求的搜索請求分組提取一個源IP地 址,從而提取搜索器終端的IP地址。
源IP地址的前部分是搜索器終端所屬的網(wǎng)絡地址。IP地址由4個字節(jié) 組成。IP地址的前部分是一個用于識別搜索器終端所屬網(wǎng)絡的網(wǎng)絡地址, 而其剩余部分是用于識別網(wǎng)絡內的搜索器終端的地址。因此,網(wǎng)絡地址從
源IP地址中被提取。根據(jù)本發(fā)明的實施例,IP地址前部分的3個字節(jié)被認 為是一個網(wǎng)絡地址并且該網(wǎng)絡地址從源IP地址被獲得。例如,如果源IP地 址是123.45.67.89,貝!J123.45.67被提取為一個網(wǎng)絡地址。
與搜索結果網(wǎng)頁有關的搜索字是一個由搜索器輸入因特網(wǎng)搜索服務 器104的值。
搜索器的web瀏覽器的相關信息是web瀏覽器上的信息,所述web瀏 覽器被裝載在搜索器的客戶機終端101中并被用來訪問因特網(wǎng)搜索服務 器104。 web瀏覽器的相關信息包括web瀏覽器的類型、web瀏覽器的版 本、web瀏覽器的產(chǎn)品ID等等。特別地,即使當多個搜索器具有相同類型 和相同版本的web瀏覽器時,它們的web瀏覽器的產(chǎn)品ID也可能不同。從 而,它變成了用于識別一個搜索器終端的有用信息。
根據(jù)被用于連接到網(wǎng)絡的HTTP協(xié)議,客戶機的一部分環(huán)境參數(shù)被包 括在HTTP分組內來傳送到網(wǎng)絡服務器。網(wǎng)絡服務器的程序(搜索弓I擎程序) 可以接收環(huán)境參數(shù)并且可以使用這些參數(shù)來檢測無效點擊。
這類環(huán)境參數(shù)包括下列信息
REMOTE—HOST:被連接者的域名
REMOTE—ADDR:被連接客戶機主機的IP地址
REMOTE—USER:被連接者的名字(在網(wǎng)絡服務器設置了用戶驗證的 情況下顯示)
REMOTE—USER:被連接者的ID(在網(wǎng)絡服務器設置了用戶驗證的 情況下被顯示)
HTTP—USER—AGENT:被連接者驅動的程序的相關注冊信息, 一般 來說是瀏覽器的名稱
HTTP—ACCEPT—LANGUAGE:被連接者使用的語言 HTTP—REFERER:呼叫對應CGI程序的文檔名稱 REQUEST—METHOD:向服務器傳輸數(shù)據(jù)的方法(GET,POST) QUERY—STRING:當數(shù)據(jù)以GET模式發(fā)送時,發(fā)送數(shù)據(jù)的被存儲
參數(shù)
CONTENT—LENGTH:當數(shù)據(jù)以POST模式被發(fā)送時,被發(fā)射數(shù)據(jù) 的總長度(字節(jié)數(shù))
CONTENT—TYPE:當數(shù)據(jù)以POST模式被發(fā)射時,數(shù)據(jù)的MIME
類型
AUTH_TYPE:用于確認用戶授權的參數(shù) SERVER—NAME:當前服務器的域名
SERVER_SOFTWARE:當前安裝在服務器上的網(wǎng)絡服務器程序的
名稱
SERVER—PROTOCOL:服務器當前使用的網(wǎng)絡協(xié)議的名稱和版本 SERVER—PORT:服務器當前所使用的端口數(shù)(在HTTP的情況下一 般是80)
PATHJNFO:被呼叫的CGI程序的當前路徑的信息 PATH—TRANSLATED:網(wǎng)絡要求的網(wǎng)絡服務器中的當前資源路徑的 相關信息
SCRIPT—NAME:當前正在被呼叫的CGI程序的名稱 HTTP—ACCEPT:當前可以以HTTP接收的資源的類型 與搜索器的點擊有關的點擊時間是來自搜索器的點擊輸入被接收的 時間。根據(jù)本發(fā)明的另一個實施例,與搜索器的點擊時間有關的其它時間 可以被使用。例如,可以使用搜索器實際上將點擊輸入客戶機的時間。
存儲在搜索器終端中的cookie文件上的信息被因特網(wǎng)搜索服務器104 獲得,其中因特網(wǎng)搜索服務器104訪問存儲在客戶機終端101中的cookie 文件102。在本發(fā)明中,cookie文件102可以被用于多種用途。這將參考 其它實施例被詳細描述。
與搜索器點擊的搜索項有關的URL信息可以通過查閱搜索數(shù)據(jù)庫而 獲得,因為它被存儲在與搜索引擎服務器104有關的搜索數(shù)據(jù)庫(未示出) 中。URL信息可以是網(wǎng)絡服務器的域名或包括域名、目錄和文件名的信息。 例如,http:〃www.naver.com禾卩http:〃www.naver.com/download是相同 的,因為它們是鑒于域名的www.naver.com,但是具有不同的URL。在本 發(fā)明中,使用URL及至域名的實施例己經(jīng)為了解釋起見進行了說明。然而, 本發(fā)明覆蓋了所有的實施例,其中,如果URL盡管其域名相同但是具有不 同的目錄(因為它們包括了域名、目錄和文件名全部),則URL被認為是不 同的搜索項。此外應當理解,在本發(fā)明中,URL信息包括根據(jù)這個說明書的所有實施例。
此外,除了上述的參數(shù)之外,在本發(fā)明的精神內,被用于檢測無效點 擊的其它參數(shù)也可以被用來檢測無效點擊。
上述種類的參數(shù)302被輸入到參數(shù)輸入單元304。這些參數(shù)又被存儲 在日志存儲單元305中。根據(jù)本發(fā)明,存儲在日志存儲單元中的日志的例 子如圖5、 7和10中所示。在這些附圖中,只包括一部分參數(shù)的日志被顯 示以用于解釋。然而,根據(jù)本發(fā)明的另一個實施例,包括全部或一部分參 數(shù)302的日志可以被存儲在日志存儲單元305中。
根據(jù)本發(fā)明的一個實施例,日志存儲單元305在其中存儲關于至少下 列兩項的日志搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡地址、與搜 索結果網(wǎng)頁有關的搜索字、搜索器的web瀏覽器的相關信息、與點擊有關 的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索項有關的 URL信息。根據(jù)本發(fā)明的一個優(yōu)選實施例,日志存儲單元305在其中存儲 一個關于至少下列一項的日志搜索器終端的IP地址、搜索器終端所屬的 網(wǎng)絡地址、與搜索結果網(wǎng)頁有關的搜索字、搜索器的web瀏覽器的相關信 息、與點擊有關的點擊時間、存儲在搜索器終端中的cookie文件信息和與 搜索項有關的URL信息。
無效點擊型式存儲單元306在其中存儲一個與至少下列兩項的一對 有關的無效點擊模型或規(guī)則搜索器終端的IP地址、搜索器終端所屬的網(wǎng) 絡地址、與搜索結果網(wǎng)頁有關的搜索字、搜索器的web瀏覽器的相關信息、 與點擊有關的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索 項有關的URL信息。例如,搜索器終端的IP地址和與搜索項有關的URL 信息型在10分鐘內的點擊輸入中彼此一致的規(guī)則或模型可以被存儲在無 效點擊模型存儲單元306中。同樣地,用于確定無效點擊的被存儲在無效 點擊模型存儲單元306中的規(guī)則等等可以用文件的形式存儲,該文件使用 根據(jù)預定規(guī)則的預定語言?;蛘撸谏鲜鲆?guī)則或模型的情況下,它可以用 程序的形式被存儲以便于它被確定是一無效點擊。
無效點擊決定單元309基于日志存儲單元305中存儲的日志和無效點 擊模型存儲單元306中存儲的無效點擊模型來確定搜索器點擊是否是無 效點擊。 無效點擊報告單元308向因特網(wǎng)搜索引擎的管理員303報告與點擊中 的預定標準一致的點擊,其被無效點擊決定單元309確定無效。根據(jù)本發(fā) 明的一個實施例,無效點擊報告單元308向因特網(wǎng)搜索引擎的管理員報告 所有被無效點擊決定單元309確定為無效的點擊。在這種情況下,預定標 準是己經(jīng)被無效點擊決定單元309確定為無效的所有點擊。根據(jù)本發(fā)明的 另一個實施例,指示是否向管理員303報告對應于規(guī)則或模型的情況的字 段被存儲在無效點擊模型存儲單元306中儲存的每個規(guī)則或者模型中。在 這種情況下,在對應于管理員303必須被通知的規(guī)則的情況下,無效點擊 報告單元308將其報告給管理員303。
無效點擊驗證單元307允許管理員303把已經(jīng)被無效點擊決定單元 309確定為無效的點擊改變成有效點擊。因為無效點擊驗證單元307可以 把誤定為無效點擊的點擊改變成有效點擊,所以無效點擊可以被更精確地 確定。
圖4是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務器104從搜索器接收一個搜索請求(步驟401)。如果搜 索器訪問因特網(wǎng)搜索服務器104然后輸入搜索字,則該搜索字作為搜索請 求分組被傳送到因特網(wǎng)搜索服務器104。
因特網(wǎng)搜索服務器104響應于該搜索請求產(chǎn)生一個搜索結果網(wǎng)頁(步 驟402)。例如圖2中所示,包括多個對應于搜索器輸入搜索字的搜索項的 搜索結果網(wǎng)頁被提供給搜索器。
對應于產(chǎn)生的搜索結果網(wǎng)頁的頁面標識符被獲取(步驟403)。每當產(chǎn) 生搜索結果網(wǎng)頁的時候就產(chǎn)生一個頁面標識符。頁面標識符是一個用于識 別搜索結果網(wǎng)頁的標識符。因此,如果相同的搜索器通過重復地向因特網(wǎng) 搜索服務器104的搜索窗中輸入相同的搜索字,則每次都分配一個新的頁 面標識符。同樣地,如果搜索器點擊顯示搜索結果網(wǎng)頁的web瀏覽器中的 "reload (重新加載)",則因特網(wǎng)搜索服務器104向搜索結果網(wǎng)頁分配一 個新的頁面標識符,因為搜索請求分組從客戶機終端101傳送到因特網(wǎng)搜 索服務器104。不同的頁面標識符被分配給乍一看相同的搜索結果網(wǎng)頁是 可能的。然而,如果新的搜索請求從客戶機終端101被接收,則搜索結果 網(wǎng)頁在那時被重新產(chǎn)生。不同于先前的搜索結果網(wǎng)頁的搜索結果網(wǎng)頁從而
可以被提供。
在步驟404中,因特網(wǎng)搜索服務器104從搜索器接收一個包括在搜索 結果網(wǎng)頁內的搜索項的點擊。如果點擊被接收,則因特網(wǎng)搜索服務器104 允許用于搜索項的超鏈接來連接因特網(wǎng)搜索服務器104,允許因特網(wǎng)搜索 服務器104執(zhí)行必要的處理,然后允許客戶機終端訪問對應于該搜索項的 網(wǎng)絡站點。 例如, 在
http:〃www.naver.com/abc/女http:〃www.invalidclick.com/被準備作為對應 于"http〃www.invalidclick.com/"的搜索項超鏈接的情況下,如果搜索器點 擊該搜索項,則搜索被允許以訪問稱作http:Z/www.naver.com的搜索服務 器。搜索服務器允許客戶機終端根據(jù)位于超鏈接后側的URL來訪問 http:〃www. invalidclick.com。
因特網(wǎng)搜索服務器104獲取一個對應于被點擊搜索項的站點標識符 (步驟405)。站點標識符是一個用于識別搜索項的標識符,并且基于對應 于搜索項的URL信息來產(chǎn)生。根據(jù)本發(fā)明的另一個實施例,站點標識符使 用對應于搜索項的原URL信息。用作產(chǎn)生站點標識符的基本信息的URL 信息可以是網(wǎng)絡服務器的域名或包括域名、目錄和文件名在內的信息。例 如,http:〃www.naver.com禾卩http:〃www.naver.com/download是相同的, 因為它們從域名的觀點來看都是www.naver.com,但是從URL的觀點來看 則不相同。在本發(fā)明中, 一個使用URL及至域名的實施例已經(jīng)為了解釋方 便起見而進行了說明。然而,本發(fā)明覆蓋了所有的實施例,其中,如果 URL盡管其域名相同但是具有不同的目錄(因為它們不僅包括了域名,而 且還包括了目錄和文件名),則URL被認為是不同的搜索項。此外應當理 解,在本發(fā)明中,URL信息包括根據(jù)這個說明書的所有實施例。
在步驟406中,如果頁面標識符和站點標識符與預定時段內的其它點 擊相關的頁面標識符和站點標識符一致,則用于檢測無效點擊的設備確定 點擊是無效的。
圖5顯示了根據(jù)本發(fā)明實施例的示例的日志文件。圖4的實施例將參考 圖5來說明。
根據(jù)本發(fā)明,每當從用戶接收一個搜索項的點擊,頁面標識符509和 站點標識符510就被存儲在日志文件500中。附圖標記501到508指出被存
儲的各個點擊輸入的日志。
作弊器訪問因特網(wǎng)搜索服務器104以請求一搜索。因特網(wǎng)搜索服務器 104產(chǎn)生搜索結果網(wǎng)頁并產(chǎn)生一個對應于搜索結果網(wǎng)頁的頁面標識符 "nCe249sisnO"。作弊器不斷地點擊包括在搜索結果網(wǎng)頁內的一個特定的 搜索項。即使一旦所產(chǎn)生的搜索結果網(wǎng)頁中的特定搜索項被不斷地點擊, 頁面標識符也不會被重新產(chǎn)生。從而,頁面標識符保留了相同的值。
從而在預定時段內的點擊輸入日志中,確定具有相同的頁面標識符和 相同的站點標識符的日志501、日志502和日志504是無效點擊。根據(jù)本發(fā) 明的一個實施例,確定一致的日志中的一個是無效點擊,則剩余的日志是 無效點擊。
作弊器可以通過點擊web瀏覽器中的"reload"來更新搜索結果網(wǎng)頁。 在這種情況下,頁面標識符被重新分配并且關于頁面標識符的日志是日志 505。其后,作弊器點擊相同搜索項的情況對應于日志506。
因此,根據(jù)這個實施例,如果作弊器點擊"reloads"然后點擊相同的搜 索項(在日志506的情況下),則它不被確定是一個無效點擊。同樣地,用 于確定"reload"是無效點擊的情況的方法將參考圖6在下列實施例中被說 明。
圖6a和6b是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 因特網(wǎng)搜索服務器104從搜索器接收搜索請求(步驟601)。因特網(wǎng)搜索
服務器104響應于該搜索請求產(chǎn)生一搜索結果網(wǎng)頁(步驟602)。
用于確定無效點擊的設備確定會話cookie文件是否被存儲在請求搜
索的客戶機終端101中(步驟603)。步驟603到步驟611被處理以獲得一個
會話標識符。
如果確定會話cookie文件沒有存儲在客戶機終端101中,則用于確定 無效點擊的設備產(chǎn)生一個新的會話標識符(步驟604)。在步驟605中,包括 會話標識符在內的會話cookie文件被存儲在客戶機終端101中。會話標識 符的更新時間還被存儲在會話cookie文件中。更新時間被存儲在會話 cookie文件中(步驟609)。
如果確定會話cookie文件在步驟602中存儲在客戶機終端101中,則 用于確定無效點擊的設備確定包括會話cookie文件在內的會話標識符的 最后更新時間是否在預定時段內(步驟606)。
作為步驟606中的確定結果,如果包括在會話cookie文件內的會話標 識符的最后更新時間在預定時段內,則用于確定無效點擊的設備提取一個 包括在會話cookie文件內的會話標識符(步驟607)。
作為步驟606中的確定結果,如果包括沒有會話cookie文件內的會話 標識符的最后更新時間不在預定時段內,則用于確定無效點擊的設備產(chǎn)生 一個新的會話標識符(步驟608)。包括在會話cookie文件內的會話標識符 用重新創(chuàng)建的會話標識符來更新(步驟610)。會話標識符的更新時間被存 儲在會話cookie文件中(步驟611 )。
因特網(wǎng)搜索服務器104從搜索器接收一個包括在搜索結果網(wǎng)頁內的 搜索項的點擊(步驟612)。
因特網(wǎng)搜索服務器104獲取一個對應于被點擊搜索項的站點標識符 (步驟613)。
如果會話標識符和站點標識符與在預定時段內與其它點擊有關的會 話標識符和站點標識符一致,則用于檢測無效點擊的設備確定該點擊是無 效點擊(步驟614)。
圖7顯示了根據(jù)本發(fā)明實施例的示例的日志文件。
在這個實施例中,每當從用戶接收一個搜索項的點擊,點擊時間710、 會話標識符的更新時間711 、會話標識符712和站點標識符713被存儲在日 志文件700中。附圖標記701到708指出對應于各個點擊輸入存儲的日志。
作弊器訪問因特網(wǎng)搜索服務器104以請求一個搜索請求。因特網(wǎng)搜索 服務器104產(chǎn)生一個搜索結果網(wǎng)頁。因特網(wǎng)搜索服務器104接收一個包括 在搜索結果網(wǎng)頁內包括在內搜索項的點擊。
因特網(wǎng)搜索服務器104確定會話cookie文件是否被存儲在客戶機終端 101中。如果確定會話cookie文件沒有存儲在客戶機終端101中,則因特 網(wǎng)搜索服務器104產(chǎn)生一個新的會話標識符,并且將其更新時間和包括會 話標識符在內的會話cookie文件存儲在客戶機終端101中。在這個實施例 中,會話標識符"xigw9492"和更新時間"10:50:14"被記錄。此外,對應于 搜索項的點擊時間、更新時間、會話標識符和站點標識符作為日志701被 存儲在日志文件700中。在第一次產(chǎn)生會話cookie文件的情況中,只要在
那時還產(chǎn)生點擊和會話標識符,會話cookie文件就被產(chǎn)生。從而,點擊時 間和會話標識符更新時間是相同的。
作弊器在相同的搜索結果頁面中點擊相同的搜索項。因特網(wǎng)搜索服務 器104確定會話cookie文件是否被存儲在客戶機終端101中。因為上述產(chǎn) 生的會話cookie文件已經(jīng)被存儲在客戶機終端101中,因特網(wǎng)搜索服務器 104訪問存儲在客戶機終端101中的會話cookie文件。會話cookie文件在其
中存儲一個會話標識符和會話標識符的最后更新時間。在這個實施例中, 會話標識符"xigw9492"和更新時間"10:50:14"被存儲在會話cookie文件中。
因特網(wǎng)搜索服務器104確定來自搜索器的搜索項的點擊時間是否在 從與會話標識符有關的最后更新時間開始的預定時段內。在這個實施例 中,第二點擊的點擊時間是"10:50:18"。如果預定時段是5秒,則點擊時 間"10:50:18"在從最后更新時間"10:50:14"開始的預定時段內。同樣地, 在這種情況下,存儲在會話cookie文件中的會話標識符被用作一個當前的 會話標識符并且該會話cookie文件的會話標識符沒有被更新。從而在這種 情況下,例如日志702被記錄。
從而,確定日志702是一個無效點擊,因為它具有與日志701相同的 會話標識符和站點標識符。
日志704對應于其中作弊器請求"reload"的情況。同樣地,結果作弊 器請求"reload",制定出存儲在客戶機終端101中的會話cookie文件的標 準,并且會話標識符沒有被更新,因為存儲在會話cookie文件中的最后更 新時間在預定時段內。因此,例如日志704被記錄。因為它和日志701 — 樣,所以確定日志704是一個無效點擊。g卩,根據(jù)這個實施例,有可能檢 測作弊器在短時間間隔內在點擊"reload"之后點擊相同的搜索項的情況。
日志705對應于這種情況,即相同搜索項的點擊從不同于日志701、 日志702和日志704的搜索器被接收。在這種情況下,因為新的會話標識 符被分配,所以它不被確定為一個無效點擊。
日志709對應于這種情況,即與日志701相同的搜索器在相當多時間 之后點擊相同的搜索項。在這種情況下,因為點擊在相當長時間之后才被 接收,所以它不被確定為一個無效點擊。
根據(jù)這個實施例,作弊器在預定時段之后點擊相同的搜索項的情況, 因為一個會話標識符被產(chǎn)生,所以它被確定是一個無效點擊。
同樣地,根據(jù)本發(fā)明的另一個實施例基于無效點擊決定來確定這樣的 情況可能是一個無效點擊,即在從相同搜索項的最后點擊時間開始的預定 時段內做出點擊。這將被簡單地說明。
如果點擊從搜索器被接收,則確定會話cookie文件是否被存儲在終端 中。如果確定會話cookie文件被存儲在終端中,則確定來自搜索器的搜索 項的點擊時間是否在從與會話標識符有關的最后點擊時間開始的預定時 段內。
如果確定搜索項的點擊時間在預定時段內,則包括在會話cookie文件 內的會話標識符被獲取并且最后點擊時間用搜索項的點擊時間來更新。
如果確定搜索項的點擊時間不在預定時段內,則新的會話標識符被產(chǎn) 生以更新包括在會話cookie文件內的會話標識符。此外,最后點擊時間用 搜索項的點擊時間來更新。
例如在圖7中,在存在來自于相同客戶機終端的相同搜索項的多個點 擊的情況下,如果確定從最后的點擊已經(jīng)過去了5秒的情況是有效的,則 與日志704有關的點擊被確定是有效的,因為它在先前的最后點擊時間 "10:50:18"的13秒后被做出"10:50:31"。
根據(jù)本發(fā)明的優(yōu)選實施例,時間參考根據(jù)無效點擊的檢測目的來決定。
圖8是一個根據(jù)本發(fā)明實施例來產(chǎn)生會話標識符的方法流程圖。 會話標識符必須被唯一地分配以便它能與其它的會話標識符區(qū)分并 且必須很難被仿造或偽造。在會話標識符只被唯一地分配的情況下,存在 一個可能性,即作弊器實際上可能產(chǎn)生一個會話標識符然后把會話標識符 存儲在會話cookie中,或者可能用一個程序不正當?shù)卦黾狱c擊量,這個程 序被驅動來不斷地點擊搜索項而同時改變會話標識符。
源數(shù)據(jù)801是用于產(chǎn)生會話標識符805的基本數(shù)據(jù)。源數(shù)據(jù)可以是當 前的時間信息、搜索字、搜索器的web瀏覽器的產(chǎn)品ID等等。源數(shù)據(jù)可以 是隨機選擇的數(shù)量。散列函數(shù)802被應用到源數(shù)據(jù)801以產(chǎn)生一個編碼串 803。然后,校驗和被添加到編碼串803以產(chǎn)生會話標識符805。校驗和用 來防止作弊器偽造會話標識符。
用于根據(jù)這個實施例產(chǎn)生會話標識符的方法可以被應用來產(chǎn)生一個 隨后將被說明的頁面標識符、站點標識符、終端標識符等等。
圖9是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。 因特網(wǎng)搜索服務器104從搜索器接收一個包括在搜索結果網(wǎng)頁內的
搜索項的點擊(步驟901)。因特網(wǎng)搜索服務器104獲取一個對應于搜索器的
終端101的客戶機IP地址(步驟902)。客戶機的IP地址可以從被接收的IP分
組的源IP地址字段中提取。
因特網(wǎng)搜索服務器104獲取對應于被點擊搜索項的站點標識符(步驟
903)。
在步驟904中,如果客戶機IP地址和站點標識符與預定時段內其它點 擊相關的客戶機IP地址和站點客戶機IP地址一致,則用于搜索無效點擊的 設備確定該點擊無效。
圖10顯示了根據(jù)本發(fā)明實施例的示例的日志文件。
在這個實施例中,每當從用戶接收一個搜索項的點擊,點擊時間
中。附圖標記1001到1009指:對應于各個點擊輸入的所存儲的日志。
如果相同的客戶機終端不斷地點擊相同的搜索項,則如果點擊在預定 時段內被重復,則該點擊無效的可能性很高。然而,往往是這樣的情況, 即相同客戶機終端的用戶在相當長時間之后點擊相同的搜索項。換言之, 存在一個趨勢,即用戶往往訪問一個它很感興趣的網(wǎng)絡站點。如果用戶在 短時間內不斷地訪問一個網(wǎng)絡站點,則很難把它看作是一個普通的點擊。 從而,這個情況被確定是一個無效點擊。例如,如果時間標準是5分鐘, 則具有與日志1001相同的客戶機IP地址和相同的站點標識符的日志 1002、日志1004和日志1005被確定是無效點擊。確定在大約20分鐘中與 被點擊日志1009相關的點擊是有效點擊。
如果基于客戶機IP地址來確定無效點擊,那么存在一些需要謹慎的 點。在客戶機終端使用代理服務器或IP網(wǎng)關的情況中,存在一個危險,即 使作弊器點擊與其它的客戶機終端相同的搜索項,它也可能被確定為一個 無效點擊。因此,優(yōu)選地,這個實施例與使用諸如會話標識符之類的其它
參數(shù)的一個實施例一起聯(lián)合構造。
相反地,存在這樣一種情況,即點擊相同搜索項的客戶機終端的客戶 機lP地址是不同的,而它們的網(wǎng)絡地址是相同的。這對應于這樣一種情況, 即幾個人不斷地嘗試用一個程序來不公平的點擊一處或點擊相同的搜索 項,而同時改變它們的源IP地址。在這種情況下,如果點擊相同搜索項的 客戶機終端的網(wǎng)絡地址是相同的并且其它情況(例如,在搜索項所屬的目 錄內,點擊量大于平均點擊量的情況)被滿足,則這可以被確定是一個無 效點擊。
圖11是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務器104從搜索器接收搜索請求(步驟1101)并且產(chǎn)生一 個搜索結果網(wǎng)頁(步驟1102)。
因特網(wǎng)搜索服務器104確定包括終端標識符在內的用戶cookie文件是 否被存儲在終端中(步驟1103)。
由于步驟1103中的確定結果,如果包括終端標識符在內的用戶cookie 文件沒有被存儲在終端中,則因特網(wǎng)搜索服務器104產(chǎn)生一個終端標識符 (步驟1104)。
因特網(wǎng)搜索服務器104產(chǎn)生包括終端標識符在內的用戶cookie文件并 把它存儲在搜索器終端中(步驟1105)。
由于步驟1103中的確定結果,如果包括終端標識符在內的用戶cookie 文件被存儲在終端中,則因特網(wǎng)搜索服務器104從用戶cookie文件中提取 終端標識符(步驟1106)。
因特網(wǎng)搜索服務器104從搜索器接收包括在搜索結果網(wǎng)頁內的搜索 項的點擊(步驟1107),然后獲取一個對應于被點擊搜索項的站點標識符 (步驟1108)。
最后,在步驟1109中,用于確定如果無效點擊的設備確定終端標識 符和站點標識符與與預定時段內其它點擊有關的終端標識符和站點標識 符一致,則該點擊是無效的。
根據(jù)這個實施例,即使客戶機終端使用一個代理服務器或IP網(wǎng)關,也 有可能用終端標識符來判別客戶機的終端。從而,即使不同的客戶機終端 使用代理服務器或IP網(wǎng)關,也可能正確地識別來自于不同客戶機的點擊。
在本發(fā)明的另一個實施例中,如果對于包括在由因特網(wǎng)搜索引擎提供 的搜索結果網(wǎng)頁內的搜索項,預定時段內每個搜索項的搜索器的點擊量大 于屬于搜索項所屬類別的搜索項的平均點擊量,則它被認為是一個無效點 擊并從而將其報告給管理員。
根據(jù)本實施例的用于檢測無效點擊的設備包括點擊計數(shù)器裝置,用于 針對包括在由因特網(wǎng)搜索引擎提供的搜索結果網(wǎng)頁內的搜索項計數(shù)預定 時段內每個搜索項的搜索器點擊量,,平均點擊量計算裝置,用于計算預 定時段內屬于搜索項所屬類別的搜索項的平均點擊量,和決定裝置,用于 確定每個搜索項的點擊量是否比平均點擊量大一個預定的差。如果每個搜 索項的點擊量比平均點擊量大一個預定的差,則這個事實經(jīng)由無效點擊報
告單元308被報告給管理員。
根據(jù)本發(fā)明的另一個實施例,針對包括在由因特網(wǎng)搜索引擎提供的搜 索結果網(wǎng)頁內的搜索項,在預定時間段內,將每個搜索項的搜索器的點擊 量與預定時段內在搜索結果網(wǎng)頁中的位于搜索項上端的搜索項預定第一 數(shù)量和位于搜索項下端的搜索項的預定第二數(shù)量的平均點擊量相比較。例 如,在相同的周期中,特殊的搜索項的點擊量與緊接位于特殊搜索項上的 兩個搜索項和緊接位于特殊搜索項下的兩個搜索項的點擊量相比較。作為 比較的結果,如果特殊搜索項的點擊量比圍繞其它搜索項的點擊量大5倍, 則它是無效點擊的可能性很高并且從而同樣地被報告給管理員。
用于確定無效點擊的各種方法已經(jīng)在上面被說明。用于確定無效點擊 的方法可以被獨立地使用或者可以與用于確定無效點擊的方法聯(lián)合使用。 例如, 一個規(guī)則可以被存儲在無效點擊模型存儲單元306中,其中,對應 于搜索項的客戶機IP地址、頁面標識符和站點標識符在從搜索項的最后點 擊開始的5分鐘內被重復的情況是無效的。
在本發(fā)明中,因特網(wǎng)搜索服務器和用于識別不公平點擊的設備已經(jīng)被 混亂地描述為單個單元。然而,根據(jù)本發(fā)明的另一個實施例,應當注意它 們可以根據(jù)它們的功能被分開執(zhí)行并且可以由不同的管理員來管理。
此外,在本發(fā)明中,被顯示并被描述為分開元件的元件可以物理上被 創(chuàng)建在單個系統(tǒng)中并且可以物理上被創(chuàng)建在一個單獨的系統(tǒng)中-。
此外,盡管幾個實施例已經(jīng)在本發(fā)明中被說明,對于所屬領域技術人
員來說顯而易見的是,多個實施例的一部分或剩余的實施例也屬于本發(fā)明 的精神。
另外,本發(fā)明的實施例還涉及包括用于執(zhí)行不同的計算機執(zhí)行操作的 程序指令的計算機可讀媒介。該媒介還可以單獨(或與程序指令相結合)包 括數(shù)據(jù)文件、數(shù)據(jù)結構、數(shù)據(jù)表等等。媒介和程序指令可以被特別地設計 并構造以用于本發(fā)明目的,或它們可能是眾所周知的類型并是計算機軟件 領域的技術人員可用的。計算機可讀媒介的例子包括諸如硬盤、軟盤和磁
帶之類的磁性媒介;諸如CD-ROM磁盤之類的光媒介;諸如可光讀磁盤之 類的磁光媒介;和被特別配置來存儲和執(zhí)行程序指令的硬件裝置,比如只 讀存儲器裝置(ROM)和隨機存取存儲器(RAM)。媒介還可能是諸如光或金 屬線路、導波器等等之類的傳輸媒介,包括發(fā)射規(guī)定程序指令、數(shù)據(jù)結構 等等的信號的載波。程序指令的例子包括兩個諸如由編譯器產(chǎn)生的之類的 機器代碼,和包括可以由計算機使用解釋器來執(zhí)行的高級代碼在內的文 件。
圖12是一個說明通用計算機系統(tǒng)的結構的框圖,該系統(tǒng)可用于創(chuàng)立搜 索引擎服務器和用于根據(jù)本發(fā)明檢測無效點擊的設備。
計算機系統(tǒng)包括任意數(shù)量的處理器1240(也被稱為中央處理器或 CPUs),它們被耦合到包括主存儲器1260(—般來說是隨機存取存儲器或 "RAM")、主存儲器1270(—般來說是只讀存儲器或"ROM")的存儲裝置。 在本領域中眾所周知的是,主存儲器1260把數(shù)據(jù)和指令單向傳送到CPU, 并且主存儲器1260—般被用來以雙向方式傳送數(shù)據(jù)和指令。這兩個主存 儲器裝置都可以包括如上所述的任何適當?shù)念愋偷挠嬎銠C可讀媒介。大容 量存儲裝置1210還被雙向耦合到CPU1240和提供附加的數(shù)據(jù)存儲量并且 可以包括如上所述的任何計算機可讀媒介。大容量存儲裝置1210可以被 用來存儲程序、數(shù)據(jù)等等,并且一般是一個諸如比主存儲器慢的硬盤之類 的輔助存儲器媒介。諸如光盤1220之類的特殊大容量存儲裝置還可以把 數(shù)據(jù)單向傳遞給CPU。處理器1240還被耦合到一個接口1230,其包括一 個或多個輸入輸出設備,比如視頻監(jiān)視器、跟蹤球、鼠標、鍵盤、擴音器、 觸控式顯示器、換能器讀卡機、磁或紙帶讀取器、寫字板、觸針〔音頻或 手寫識別器或諸如當然包括其它計算機之類的其它眾所周知的輸入裝置。
最后,如通常在1250所示,處理器1240可以選擇性地使用網(wǎng)絡連接被耦 合到計算機或電信網(wǎng)。有了這類網(wǎng)絡連接,CPU可以在執(zhí)行上述方法步驟 的過程中從網(wǎng)絡接收信息或者可以向網(wǎng)絡輸出信息是可期望的。上述裝置 和材料對于計算機硬件和軟件領域中的技術人員來說是很熟悉的。
如上所述的硬件元件可以被配置(一般暫時)來充當一個或多個執(zhí)行 本發(fā)明操作的軟件模塊。 工業(yè)實用性
根據(jù)上述的本發(fā)明, 一個用于檢測包括在由因特網(wǎng)搜索引擎服務器提 供的搜索結果網(wǎng)頁內的搜索項的無效點擊的方法和設備被提供。
根據(jù)本發(fā)明, 一個用于檢測無效點擊的方法和設備,其可以檢測各種 不正當?shù)卦黾铀阉黜楛c擊量的嘗試,并且立即處理這些嘗試。g卩,如果新 模型的不公平的點擊嘗試被發(fā)現(xiàn),則該模型或規(guī)則被存儲在一個根據(jù)本發(fā) 明的無效點擊模型存儲單元中。從而,立即處理這個遵循新模型的不公平 點擊嘗試是可能的。
此外,根據(jù)本發(fā)明提供了一個用于檢測無效點擊的方法和設備,其可 以防止為了檢測無效點擊而提供的幾個標識符被仿造或偽造。
盡管本發(fā)明已經(jīng)關于附圖中說明的本發(fā)明實施例而被說明,然而它并 沒有被限制在其中,因為對于所屬領域技術人員來說,顯然可以在其中做 出不同的置換、修改和改變。本發(fā)明的范圍由附加的權利要求來定義。所 有在權利要求的意義和范圍內做出的改變或修改或其等效物應該被看作 是屬于本發(fā)明的范圍。
權利要求
1. 一種用于檢測無效點擊的設備,包括點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結果網(wǎng)頁內的搜索項,計數(shù)預定時段內每個搜索項的搜索器點擊量;平均點擊量計算裝置,用于在預定時段內計算屬于搜索項所屬類別的搜索項的平均點擊量;和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預定的差。
2. —種用于檢測無效點擊的設備,包括點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結果 網(wǎng)頁內的搜索項,計數(shù)預定時段內每個搜索項的搜索器點擊量;平均點擊量的計算裝置,用于在預定時段內在搜索結果網(wǎng)頁中,計算 位于搜索項上端的搜索項的預定第一數(shù)量和位于搜索項下端的搜索項的 預定第二數(shù)量的平均點擊量;和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預 定的差。
全文摘要
本發(fā)明涉及一種因特網(wǎng)搜索引擎服務器。更明確地說,本發(fā)明涉及用于檢測搜索項的無效點擊的方法和設備,搜索項被包括在一個由因特網(wǎng)搜索引擎服務器提供的搜索結果網(wǎng)頁內。本發(fā)明涉及一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應于來自于搜索器的搜索請求產(chǎn)搜索結果網(wǎng)頁;獲取一對應于被產(chǎn)生網(wǎng)頁的頁面標識符;從搜索器接收一包括在搜索結果網(wǎng)頁內的搜索項的點擊;獲取一對應于被點擊的搜索項的站點標識符;并且如果頁面標識符和站點標識符與預定時段內的其它點擊有關的頁面標識符和站點標識符一致,則確定該點擊無效。根據(jù)本發(fā)明提供了一個用于檢測無效點擊的方法和設備,其檢測各種不正當?shù)卦黾铀阉黜楛c擊量的嘗試,并且立即處理這些嘗試。
文檔編號G06F17/30GK101388035SQ20081016103
公開日2009年3月18日 申請日期2004年2月27日 優(yōu)先權日2003年3月19日
發(fā)明者姜錫昊, 李宇晟, 河定秀 申請人:Nhn株式會社