亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在因特網(wǎng)搜索引擎上檢測無效點擊的方法和設(shè)備的制作方法

文檔序號:6479528閱讀:147來源:國知局
專利名稱:在因特網(wǎng)搜索引擎上檢測無效點擊的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及因特網(wǎng)搜索引擎服務(wù)器。更明確地說,本發(fā)明涉及用于檢測搜索項的無效點擊的方法和設(shè)備,搜索項被包括在一個由因特網(wǎng)搜索引擎服務(wù)器提供的搜索結(jié)果網(wǎng)頁內(nèi)。此外,本發(fā)明涉及用于檢測無效點擊的方法和設(shè)備,其可以檢測不公平地增加搜索項點擊量的各種嘗試并可以立即應(yīng)付這些嘗試。
背景技術(shù)
隨著因特網(wǎng)的使用越來越廣泛,諸如可經(jīng)由因特網(wǎng)訪問的網(wǎng)頁之類的信息源的數(shù)量已經(jīng)以算術(shù)級數(shù)增長。此外,為了在大量信息源之中發(fā)現(xiàn)信息,搜索器訪問諸如NAVER、Yahoo和Lycos之類的因特網(wǎng)搜索引擎服務(wù)器以請求搜索。因特網(wǎng)搜索服務(wù)提供商產(chǎn)生一個包括搜索項在內(nèi)的搜索結(jié)果網(wǎng)頁,其包括與搜索器輸入的搜索字有關(guān)的信息,然后向搜索器提供生成的搜索結(jié)果網(wǎng)頁。例如,當(dāng)搜索器訪問NAVER搜索引擎服務(wù)器然后輸入搜索字″Digital Camera(數(shù)碼相機(jī))″時,搜索結(jié)果網(wǎng)頁如圖2所示。包括在搜索結(jié)果網(wǎng)頁內(nèi)的每一項都與URL(統(tǒng)一資源定位符)有關(guān)。
因為與單一搜索字有關(guān)的搜索項的數(shù)量不計其數(shù),然而,這類不計其數(shù)的搜索項如何在搜索結(jié)果網(wǎng)頁上顯示和以什么順序顯示對因特網(wǎng)搜索服務(wù)提供商來說是一個非常重要的問題。因特網(wǎng)搜索服務(wù)提供商通過結(jié)合幾個標(biāo)準(zhǔn)來確定搜索項的列出順序。已被廣泛使用的其中一個標(biāo)準(zhǔn)是用戶對特殊搜索項的點擊量。例如,如果用戶對一個搜索項的點擊量很大,則該搜索項被顯示在搜索結(jié)果網(wǎng)頁相對靠上的部分。甚至在因特網(wǎng)搜索服務(wù)提供商通過結(jié)合多個參數(shù)來確定搜索項的列出順序的情況中,如果其中一個參數(shù)是用戶點擊量,則具有很高點擊量的搜索項被顯示在搜索結(jié)果網(wǎng)頁的相對靠上的部分。
此外,因特網(wǎng)搜索服務(wù)器產(chǎn)生的搜索結(jié)果網(wǎng)頁被顯示得越高,用戶可能點擊和訪問該網(wǎng)頁的可能性就越大。從而,web服務(wù)器的網(wǎng)絡(luò)信息提供商想要把與他(她)自己有關(guān)的搜索項顯示在搜索結(jié)果網(wǎng)頁的頂端。因為這個原因,為了將他(她)的網(wǎng)頁搜索項顯示在搜索結(jié)果網(wǎng)頁的頂端,網(wǎng)絡(luò)信息提供商可以故意地訪問因特網(wǎng)搜索服務(wù)器來多次點擊他(她)自己網(wǎng)頁的搜索項。有時,網(wǎng)絡(luò)信息提供商可以用一個專門的程序不斷地點擊他(她)的網(wǎng)頁的搜索項。因為這類不公平的搜索項點擊并不反映真實的用戶搜索結(jié)果,所以因特網(wǎng)搜索服務(wù)提供商必須檢測這類無效的點擊。
先有技術(shù)中存在這類服務(wù),其中,與搜索項有關(guān)的網(wǎng)絡(luò)信息提供商基于搜索結(jié)果網(wǎng)頁中的每個搜索項的點擊量被收費(fèi)。因特網(wǎng)搜索服務(wù)提供商Overture Services,Inc.(U.S.A)提供這類服務(wù),其中,當(dāng)搜索器點擊與網(wǎng)絡(luò)信息提供商有關(guān)的搜索結(jié)果網(wǎng)頁中的搜索項時,網(wǎng)絡(luò)信息提供商支付每次點擊。在這種情況下,如果搜索器故意多次點擊一個特殊的搜索項,則與搜索項有關(guān)的網(wǎng)絡(luò)信息提供商必須支付額外的費(fèi)用。因此,甚至在這種情況下也必須要檢測無效點擊,其意圖是只增加點擊量而實際上沒有對搜索項進(jìn)行搜索。

發(fā)明內(nèi)容
本發(fā)明被提供來解決上述的先有技術(shù)中的問題。本發(fā)明的一個目的是提供用于檢測搜索項的無效點擊的方法和設(shè)備,搜索項包括在一個由因特網(wǎng)搜索引擎服務(wù)器提供的搜索結(jié)果網(wǎng)頁內(nèi)。
本發(fā)明的另一個目的是提供用于檢測無效點擊的方法和設(shè)備,其可以檢測不正當(dāng)增加搜索項的點擊量的各種嘗試,并且可以立即應(yīng)付這些嘗試。
本發(fā)明的另一個目的是提供一個用于檢測無效點擊的方法和設(shè)備,其中,為了檢測無效點擊而提供的幾個標(biāo)識符很難被仿造或偽造。
為了達(dá)到上述目的并解決先有技術(shù)中的上述問題,本發(fā)明提供了一個在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自搜索器的搜索請求產(chǎn)生一個搜索結(jié)果網(wǎng)頁,獲取一個對應(yīng)于被產(chǎn)生網(wǎng)頁的頁面標(biāo)識符,從搜索器接收包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊,獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符,并且如果頁面標(biāo)識符和站點標(biāo)識符與在預(yù)定時段內(nèi)的其它點擊有關(guān)的頁面標(biāo)識符和站點標(biāo)識符一致,則確定該點擊是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自搜索器的搜索請求產(chǎn)生一個搜索結(jié)果網(wǎng)頁,獲取一個包括在搜索器終端存儲的會話cookie文件內(nèi)的會話標(biāo)識符,從搜索器接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項點擊,獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符,并且如果會話標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)與其它點擊有關(guān)的會話標(biāo)識符和站點標(biāo)識符一致,則確定該點擊是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟從搜索器接收包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊,獲取一個對應(yīng)于搜索器終端的客戶機(jī)IP地址,獲取一個對應(yīng)于被點擊的搜索項的站點標(biāo)識符,并且如果客戶機(jī)IP地址和站點標(biāo)識符與預(yù)定時段內(nèi)的其它點擊有關(guān)的客戶機(jī)IP地址和站點標(biāo)識符一致,則確定該點擊是無效的。
根據(jù)本發(fā)明的方面提供了一個用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自搜索器的搜索請求產(chǎn)生一個搜索結(jié)果網(wǎng)頁,獲取一個對應(yīng)于搜索器終端的終端標(biāo)識符,產(chǎn)生一個包括終端標(biāo)識符的用戶cookie文件然后把用戶cookie文件存儲在搜索器終端中,從搜索器接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項點擊,獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符,并且如果終端標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)的其它點擊有關(guān)的終端標(biāo)識符和站點標(biāo)識符一致,則確定該點擊是無效的。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設(shè)備,其中,如果搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,則至少搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與存儲在搜索器終端中的點擊和cookie文件信息有關(guān)的點擊時間、與搜索項有關(guān)的URL信息的其中一個被接收,并且基于一個根據(jù)被接收信息預(yù)定的標(biāo)準(zhǔn)(reference)來確定該點擊是否無效。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設(shè)備,包括(1)一個日志存儲單元,其響應(yīng)于搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,來存儲一個至少與下列兩項有關(guān)的日志搜索器終端的IP地址,搜索器終端所屬的網(wǎng)絡(luò)地址,與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字,搜索器的web瀏覽器的相關(guān)信息,與點擊有關(guān)的點擊時間、存儲在搜索器終端中cookie文件信息和與搜索項有關(guān)的URL信息,(2)一個無效點擊模型存儲單元,其存儲與至少下列中兩個有關(guān)的無效點擊模型搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息、和與搜索項有關(guān)的URL信息,和(3)一個無效點擊決定單元,其基于日志存儲單元中存儲的日志和無效點擊模型存儲單元中存儲的無效點擊模型來確定搜索點擊是否是一個無效點擊。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設(shè)備,包括一個點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,計數(shù)預(yù)定時段內(nèi)每個搜索項的搜索器點擊量,一個平均點擊量計算裝置,用于在預(yù)定時段內(nèi)計算屬于搜索項所屬類別的搜索項的平均點擊量,和一個決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預(yù)定的差。
根據(jù)本發(fā)明的另一個方面提供了一個用于檢測無效點擊的設(shè)備,包括一個點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,計數(shù)預(yù)定時段內(nèi)每個搜索項的搜索器點擊量,一個平均點擊量計算裝置,用于在搜索結(jié)果網(wǎng)頁中在預(yù)定時段內(nèi)計算位于搜索項較高端的搜索項的預(yù)定第一數(shù)量和位于搜索項較低端的搜索結(jié)果的預(yù)定第二數(shù)量的平均點擊量,和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預(yù)定的差。
無效點擊很難精確地定義,并且無效點擊的范圍應(yīng)該取決于實施例和應(yīng)用來不同地定義。然而,無效點擊可能指的是以只增加點擊量而不以實際搜索為目的而做出的點擊。


圖1是一個示意圖,說明因特網(wǎng)搜索服務(wù)器的一個網(wǎng)絡(luò)連接,包括用于檢測無效點擊的設(shè)備和根據(jù)本發(fā)明的客戶機(jī)終端。
圖2是一個說明由因特網(wǎng)搜索引擎產(chǎn)生的搜索結(jié)果網(wǎng)頁的示意圖。
圖3是一個說明根據(jù)本發(fā)明實施例來檢測無效點擊的設(shè)備結(jié)構(gòu)的框圖。
圖4是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
圖5顯示了根據(jù)本發(fā)明實施例的示例的日志文件。
圖6a和6b是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
圖7顯示了一個根據(jù)本發(fā)明實施例的示例的日志文件。
圖8是一個根據(jù)本發(fā)明實施例來產(chǎn)生會話標(biāo)識符的方法流程圖。
圖9是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
圖10顯示了一個根據(jù)本發(fā)明實施例的示例的日志文件。
圖11是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
圖12是一個說明通用計算機(jī)系統(tǒng)的結(jié)構(gòu)的框圖,該系統(tǒng)可用于創(chuàng)立一個搜索引擎服務(wù)器和一個用于根據(jù)本發(fā)明檢測無效點擊的設(shè)備。
具體實施例方式
在下文中,本發(fā)明的優(yōu)選實施例將參考附圖被詳細(xì)描述。
圖1是一個示意圖,說明包括用于檢測無效點擊的設(shè)備和根據(jù)本發(fā)明的客戶機(jī)終端的因特網(wǎng)搜索服務(wù)器的網(wǎng)絡(luò)連接。
嘗試不公平點擊的搜索器或作弊器經(jīng)由連接到因特網(wǎng)103的客戶機(jī)終端101來訪問因特網(wǎng)搜索服務(wù)器104。作弊器通過多次點擊由因特網(wǎng)搜索服務(wù)器104提供的搜索結(jié)果網(wǎng)頁中的搜索項來增加點擊量。例如在圖2中,假定搜索項202是一個與http//www.invalidclick.com有關(guān)的搜索項,并且作弊器不斷地點擊搜索項202以便于搜索項202被顯示在搜索結(jié)果網(wǎng)頁的頂端。
當(dāng)客戶機(jī)終端101被連接到搜索引擎服務(wù)器104或其它網(wǎng)絡(luò)站點時,cookie文件102是一個由搜索引擎服務(wù)器104或其它網(wǎng)絡(luò)站點存儲在客戶機(jī)終端101的硬盤中的特殊的文本文件。在用于連接網(wǎng)絡(luò)站點的HTTP協(xié)議中,每個對網(wǎng)頁的請求都與其它請求無關(guān)。因此,網(wǎng)絡(luò)服務(wù)器不具這樣的信息,即哪個頁面先前已經(jīng)被發(fā)送到客戶機(jī)終端101或者客戶機(jī)終端101先前已經(jīng)執(zhí)行了什么工作。因此,為了關(guān)聯(lián)像這樣獨立處理的各個請求,一個cookie文件被提供。這類cookie文件服務(wù)允許網(wǎng)絡(luò)服務(wù)器把用戶信息存儲在用戶的計算機(jī)中。為了在本發(fā)明中檢測無效點擊,甚至可以使用幾個cookie文件。這將在后面被詳細(xì)描述。
日志文件105是一個用于存儲與用戶點擊模型相關(guān)的幾個日志的文件。在本發(fā)明中,為了檢測無效點擊而使用幾個參數(shù)。在與各個點擊有關(guān)的參數(shù)被存儲在日志文件中之后,基于預(yù)定的規(guī)則和模型來確定輸入點擊是否無效。
根據(jù)本發(fā)明實施例的日志文件的例子如圖5、7和10中所示。
圖3是一個說明根據(jù)本發(fā)明實施例來檢測無效點擊的設(shè)備結(jié)構(gòu)的框圖。
根據(jù)本發(fā)明實施例來檢測無效點擊301的設(shè)備包括參數(shù)輸入單元304、日志存儲單元305、無效點擊模型存儲單元306、無效點擊驗證單元307、無效點擊報告單元308和無效點擊決定單元309。
如果搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,則與該點擊有關(guān)的幾個參數(shù)302被輸入到參數(shù)輸入單元304。這些參數(shù)是用于確定無效點擊的基本信息,并且包括搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息、與搜索項有關(guān)的URL信息等等。
如果搜索器向因特網(wǎng)搜索引擎服務(wù)器104請求一個搜索,則搜索請求分組從客戶機(jī)終端101被傳遞到因特網(wǎng)搜索引擎服務(wù)器104。搜索請求分組包括一個根據(jù)HTTP協(xié)議的分組配置并且還被包含在因特網(wǎng)(IP網(wǎng)際協(xié)議)分組內(nèi)。因為源IP地址字段被包括在因特網(wǎng)協(xié)議分組的配置內(nèi),所以因特網(wǎng)搜索引擎服務(wù)器104從點擊所請求的搜索請求分組提取一個源IP地址,從而提取搜索器終端的IP地址。
源IP地址的前部分是搜索器終端所屬的網(wǎng)絡(luò)地址。IP地址由4個字節(jié)組成。IP地址的前部分是一個用于識別搜索器終端所屬網(wǎng)絡(luò)的網(wǎng)絡(luò)地址,而其剩余部分是用于識別網(wǎng)絡(luò)內(nèi)的搜索器終端的地址。因此,網(wǎng)絡(luò)地址從源IP地址中被提取。根據(jù)本發(fā)明的實施例,IP地址前部分的3個字節(jié)被認(rèn)為是一個網(wǎng)絡(luò)地址并且該網(wǎng)絡(luò)地址從源IP地址被獲得。例如,如果源IP地址是123.45.67.89,則123.45.67被提取為一個網(wǎng)絡(luò)地址。
與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字是一個由搜索器輸入因特網(wǎng)搜索服務(wù)器104的值。
搜索器的web瀏覽器的相關(guān)信息是web瀏覽器上的信息,所述web瀏覽器被裝載在搜索器的客戶機(jī)終端101中并被用來訪問因特網(wǎng)搜索服務(wù)器104。web瀏覽器的相關(guān)信息包括web瀏覽器的類型、web瀏覽器的版本、web瀏覽器的產(chǎn)品ID等等。特別地,即使當(dāng)多個搜索器具有相同類型和相同版本的web瀏覽器時,它們的web瀏覽器的產(chǎn)品ID也可能不同。從而,它變成了用于識別一個搜索器終端的有用信息。
根據(jù)被用于連接到網(wǎng)絡(luò)的HTTP協(xié)議,客戶機(jī)的一部分環(huán)境參數(shù)被包括在HTTP分組內(nèi)來傳送到網(wǎng)絡(luò)服務(wù)器。網(wǎng)絡(luò)服務(wù)器的程序(搜索引擎程序)可以接收環(huán)境參數(shù)并且可以使用這些參數(shù)來檢測無效點擊。
這類環(huán)境參數(shù)包括下列信息REMOTE_HOST被連接者的域名REMOTE_ADDR被連接客戶機(jī)主機(jī)的IP地址REMOTE_USER被連接者的名字(在網(wǎng)絡(luò)服務(wù)器設(shè)置了用戶驗證的情況下顯示)REMOTE_USER被連接者的ID(在網(wǎng)絡(luò)服務(wù)器設(shè)置了用戶驗證的情況下被顯示)HTTP_USER_AGENT被連接者驅(qū)動的程序的相關(guān)注冊信息,一般來說是瀏覽器的名稱HTTP_ACCEPT_LANGUAGE被連接者使用的語言HTTP_REFERER呼叫對應(yīng)CGI程序的文檔名稱REQUEST_METHOD向服務(wù)器傳輸數(shù)據(jù)的方法(GET,POST)QUERY_STRING當(dāng)數(shù)據(jù)以GET模式發(fā)送時,發(fā)送數(shù)據(jù)的被存儲參數(shù)CONTENT_LENGTH當(dāng)數(shù)據(jù)以POST模式被發(fā)送時,被發(fā)射數(shù)據(jù)的總長度(字節(jié)數(shù))CONTENT_TYPE當(dāng)數(shù)據(jù)以POST模式被發(fā)射時,數(shù)據(jù)的MIME類型AUTH_TYPE用于確認(rèn)用戶授權(quán)的參數(shù)SERVER_NAME當(dāng)前服務(wù)器的域名SERVER_SOFTWARE當(dāng)前安裝在服務(wù)器上的網(wǎng)絡(luò)服務(wù)器程序的名稱SERVER_PROTOCOL服務(wù)器當(dāng)前使用的網(wǎng)絡(luò)協(xié)議的名稱和版本SERVER_PORT服務(wù)器當(dāng)前所使用的端口數(shù)(在HTTP的情況下一般是80)PATH_INFO被呼叫的CGI程序的當(dāng)前路徑的信息PATH_TRANSLATED網(wǎng)絡(luò)要求的網(wǎng)絡(luò)服務(wù)器中的當(dāng)前資源路徑的相關(guān)信息SCRIPT_NAME當(dāng)前正在被呼叫的CGI程序的名稱HTTP_ACCEPT當(dāng)前可以以HTTP接收的資源的類型與搜索器的點擊有關(guān)的點擊時間是來自搜索器的點擊輸入被接收的時間。根據(jù)本發(fā)明的另一個實施例,與搜索器的點擊時間有關(guān)的其它時間可以被使用。例如,可以使用搜索器實際上將點擊輸入客戶機(jī)的時間。
存儲在搜索器終端中的cookie文件上的信息被因特網(wǎng)搜索服務(wù)器104獲得,其中因特網(wǎng)搜索服務(wù)器104訪問存儲在客戶機(jī)終端101中的cookie文件102。在本發(fā)明中,cookie文件102可以被用于多種用途。這將參考其它實施例被詳細(xì)描述。
與搜索器點擊的搜索項有關(guān)的URL信息可以通過查閱搜索數(shù)據(jù)庫而獲得,因為它被存儲在與搜索引擎服務(wù)器104有關(guān)的搜索數(shù)據(jù)庫(未示出)中。URL信息可以是網(wǎng)絡(luò)服務(wù)器的域名或包括域名、目錄和文件名的信息。例如,http//www.naver.com和http//www.naver.com/download是相同的,因為它們是鑒于域名的www.naver.com,但是具有不同的URL。在本發(fā)明中,使用URL及至域名的實施例已經(jīng)為了解釋起見進(jìn)行了說明。然而,本發(fā)明覆蓋了所有的實施例,其中,如果URL盡管其域名相同但是具有不同的目錄(因為它們包括了域名、目錄和文件名全部),則URL被認(rèn)為是不同的搜索項。此外應(yīng)當(dāng)理解,在本發(fā)明中,URL信息包括根據(jù)這個說明書的所有實施例。
此外,除了上述的參數(shù)之外,在本發(fā)明的精神內(nèi),被用于檢測無效點擊的其它參數(shù)也可以被用來檢測無效點擊。
上述種類的參數(shù)302被輸入到參數(shù)輸入單元304。這些參數(shù)又被存儲在日志存儲單元305中。根據(jù)本發(fā)明,存儲在日志存儲單元中的日志的例子如圖5、7和10中所示。在這些附圖中,只包括一部分參數(shù)的日志被顯示以用于解釋。然而,根據(jù)本發(fā)明的另一個實施例,包括全部或一部分參數(shù)302的日志可以被存儲在日志存儲單元305中。
根據(jù)本發(fā)明的一個實施例,日志存儲單元305在其中存儲關(guān)于至少下列兩項的日志搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索項有關(guān)的URL信息。根據(jù)本發(fā)明的一個優(yōu)選實施例,日志存儲單元305在其中存儲一個關(guān)于至少下列一項的日志搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索項有關(guān)的URL信息。
無效點擊型式存儲單元306在其中存儲一個與至少下列兩項的一對有關(guān)的無效點擊模型或規(guī)則搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索項有關(guān)的URL信息。例如,搜索器終端的IP地址和與搜索項有關(guān)的URL信息型在10分鐘內(nèi)的點擊輸入中彼此一致的規(guī)則或模型可以被存儲在無效點擊模型存儲單元306中。同樣地,用于確定無效點擊的被存儲在無效點擊模型存儲單元306中的規(guī)則等等可以用文件的形式存儲,該文件使用根據(jù)預(yù)定規(guī)則的預(yù)定語言?;蛘?,在上述規(guī)則或模型的情況下,它可以用程序的形式被存儲以便于它被確定是一無效點擊。
無效點擊決定單元309基于日志存儲單元305中存儲的日志和無效點擊模型存儲單元306中存儲的無效點擊模型來確定搜索器點擊是否是無效點擊。
無效點擊報告單元308向因特網(wǎng)搜索引擎的管理員303報告與點擊中的預(yù)定標(biāo)準(zhǔn)一致的點擊,其被無效點擊決定單元309確定無效。根據(jù)本發(fā)明的一個實施例,無效點擊報告單元308向因特網(wǎng)搜索引擎的管理員報告所有被無效點擊決定單元309確定為無效的點擊。在這種情況下,預(yù)定標(biāo)準(zhǔn)是已經(jīng)被無效點擊決定單元309確定為無效的所有點擊。根據(jù)本發(fā)明的另一個實施例,指示是否向管理員303報告對應(yīng)于規(guī)則或模型的情況的字段被存儲在無效點擊模型存儲單元306中儲存的每個規(guī)則或者模型中。在這種情況下,在對應(yīng)于管理員303必須被通知的規(guī)則的情況下,無效點擊報告單元308將其報告給管理員303。
無效點擊驗證單元307允許管理員303把已經(jīng)被無效點擊決定單元309確定為無效的點擊改變成有效點擊。因為無效點擊驗證單元307可以把誤定為無效點擊的點擊改變成有效點擊,所以無效點擊可以被更精確地確定。
圖4是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務(wù)器104從搜索器接收一個搜索請求(步驟401)。如果搜索器訪問因特網(wǎng)搜索服務(wù)器104然后輸入搜索字,則該搜索字作為搜索請求分組被傳送到因特網(wǎng)搜索服務(wù)器104。
因特網(wǎng)搜索服務(wù)器104響應(yīng)于該搜索請求產(chǎn)生一個搜索結(jié)果網(wǎng)頁(步驟402)。例如圖2中所示,包括多個對應(yīng)于搜索器輸入搜索字的搜索項的搜索結(jié)果網(wǎng)頁被提供給搜索器。
對應(yīng)于產(chǎn)生的搜索結(jié)果網(wǎng)頁的頁面標(biāo)識符被獲取(步驟403)。每當(dāng)產(chǎn)生搜索結(jié)果網(wǎng)頁的時候就產(chǎn)生一個頁面標(biāo)識符。頁面標(biāo)識符是一個用于識別搜索結(jié)果網(wǎng)頁的標(biāo)識符。因此,如果相同的搜索器通過重復(fù)地向因特網(wǎng)搜索服務(wù)器104的搜索窗中輸入相同的搜索字,則每次都分配一個新的頁面標(biāo)識符。同樣地,如果搜索器點擊顯示搜索結(jié)果網(wǎng)頁的web瀏覽器中的″reload(重新加載)″,則因特網(wǎng)搜索服務(wù)器104向搜索結(jié)果網(wǎng)頁分配一個新的頁面標(biāo)識符,因為搜索請求分組從客戶機(jī)終端101傳送到因特網(wǎng)搜索服務(wù)器104。不同的頁面標(biāo)識符被分配給乍一看相同的搜索結(jié)果網(wǎng)頁是可能的。然而,如果新的搜索請求從客戶機(jī)終端101被接收,則搜索結(jié)果網(wǎng)頁在那時被重新產(chǎn)生。不同于先前的搜索結(jié)果網(wǎng)頁的搜索結(jié)果網(wǎng)頁從而可以被提供。
在步驟404中,因特網(wǎng)搜索服務(wù)器104從搜索器接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊。如果點擊被接收,則因特網(wǎng)搜索服務(wù)器104允許用于搜索項的超鏈接來連接因特網(wǎng)搜索服務(wù)器104,允許因特網(wǎng)搜索服務(wù)器104執(zhí)行必要的處理,然后允許客戶機(jī)終端訪問對應(yīng)于該搜索項的網(wǎng)絡(luò)站點。例如,在http//www.naver.com/abc/*http//www.invalidclick.com/被準(zhǔn)備作為對應(yīng)于″http//www.invalidclick.com/″的搜索項超鏈接的情況下,如果搜索器點擊該搜索項,則搜索被允許以訪問稱作http//www.naver.com的搜索服務(wù)器。搜索服務(wù)器允許客戶機(jī)終端根據(jù)位于超鏈接后側(cè)的URL來訪問http//www.invalidclick.com。
因特網(wǎng)搜索服務(wù)器104獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符(步驟405)。站點標(biāo)識符是一個用于識別搜索項的標(biāo)識符,并且基于對應(yīng)于搜索項的URL信息來產(chǎn)生。根據(jù)本發(fā)明的另一個實施例,站點標(biāo)識符使用對應(yīng)于搜索項的原URL信息。用作產(chǎn)生站點標(biāo)識符的基本信息的URL信息可以是網(wǎng)絡(luò)服務(wù)器的域名或包括域名、目錄和文件名在內(nèi)的信息。例如,http//www.naver.com和http//www.naver.com/download是相同的,因為它們從域名的觀點來看都是www.naver.com,但是從URL的觀點來看則不相同。在本發(fā)明中,一個使用URL及至域名的實施例已經(jīng)為了解釋方便起見而進(jìn)行了說明。然而,本發(fā)明覆蓋了所有的實施例,其中,如果URL盡管其域名相同但是具有不同的目錄(因為它們不僅包括了域名,而且還包括了目錄和文件名),則URL被認(rèn)為是不同的搜索項。此外應(yīng)當(dāng)理解,在本發(fā)明中,URL信息包括根據(jù)這個說明書的所有實施例。
在步驟406中,如果頁面標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)的其它點擊相關(guān)的頁面標(biāo)識符和站點標(biāo)識符一致,則用于檢測無效點擊的設(shè)備確定點擊是無效的。
圖5顯示了根據(jù)本發(fā)明實施例的示例的日志文件。圖4的實施例將參考圖5來說明。
根據(jù)本發(fā)明,每當(dāng)從用戶接收一個搜索項的點擊,頁面標(biāo)識符509和站點標(biāo)識符510就被存儲在日志文件500中。附圖標(biāo)記501到508指出被存儲的各個點擊輸入的日志。
作弊器訪問因特網(wǎng)搜索服務(wù)器104以請求一搜索。因特網(wǎng)搜索服務(wù)器104產(chǎn)生搜索結(jié)果網(wǎng)頁并產(chǎn)生一個對應(yīng)于搜索結(jié)果網(wǎng)頁的頁面標(biāo)識符″nCe249sisnO″。作弊器不斷地點擊包括在搜索結(jié)果網(wǎng)頁內(nèi)的一個特定的搜索項。即使一旦所產(chǎn)生的搜索結(jié)果網(wǎng)頁中的特定搜索項被不斷地點擊,頁面標(biāo)識符也不會被重新產(chǎn)生。從而,頁面標(biāo)識符保留了相同的值。
從而在預(yù)定時段內(nèi)的點擊輸入日志中,確定具有相同的頁面標(biāo)識符和相同的站點標(biāo)識符的日志501、日志502和日志504是無效點擊。根據(jù)本發(fā)明的一個實施例,確定一致的日志中的一個是無效點擊,則剩余的日志是無效點擊。
作弊器可以通過點擊web瀏覽器中的″reload″來更新搜索結(jié)果網(wǎng)頁。在這種情況下,頁面標(biāo)識符被重新分配并且關(guān)于頁面標(biāo)識符的日志是日志505。其后,作弊器點擊相同搜索項的情況對應(yīng)于日志506。
因此,根據(jù)這個實施例,如果作弊器點擊″reloads″然后點擊相同的搜索項(在日志506的情況下),則它不被確定是一個無效點擊。同樣地,用于確定″reload″是無效點擊的情況的方法將參考圖6在下列實施例中被說明。
圖6a和6b是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務(wù)器104從搜索器接收搜索請求(步驟601)。因特網(wǎng)搜索服務(wù)器104響應(yīng)于該搜索請求產(chǎn)生一搜索結(jié)果網(wǎng)頁(步驟602)。
用于確定無效點擊的設(shè)備確定會話cookie文件是否被存儲在請求搜索的客戶機(jī)終端101中(步驟603)。步驟603到步驟611被處理以獲得一個會話標(biāo)識符。
如果確定會話cookie文件沒有存儲在客戶機(jī)終端101中,則用于確定無效點擊的設(shè)備產(chǎn)生一個新的會話標(biāo)識符(步驟604)。在步驟605中,包括會話標(biāo)識符在內(nèi)的會話cookie文件被存儲在客戶機(jī)終端101中。會話標(biāo)識符的更新時間還被存儲在會話cookie文件中。更新時間被存儲在會話cookie文件中(步驟609)。
如果確定會話cookie文件在步驟602中存儲在客戶機(jī)終端101中,則用于確定無效點擊的設(shè)備確定包括會話cookie文件在內(nèi)的會話標(biāo)識符的最后更新時間是否在預(yù)定時段內(nèi)(步驟606)。
作為步驟606中的確定結(jié)果,如果包括在會話cookie文件內(nèi)的會話標(biāo)識符的最后更新時間在預(yù)定時段內(nèi),則用于確定無效點擊的設(shè)備提取一個包括在會話cookie文件內(nèi)的會話標(biāo)識符(步驟607)。
作為步驟606中的確定結(jié)果,如果包括沒有會話cookie文件內(nèi)的會話標(biāo)識符的最后更新時間不在預(yù)定時段內(nèi),則用于確定無效點擊的設(shè)備產(chǎn)生一個新的會話標(biāo)識符(步驟608)。包括在會話cookie文件內(nèi)的會話標(biāo)識符用重新創(chuàng)建的會話標(biāo)識符來更新(步驟610)。會話標(biāo)識符的更新時間被存儲在會話cookie文件中(步驟611)。
因特網(wǎng)搜索服務(wù)器104從搜索器接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊(步驟612)。
因特網(wǎng)搜索服務(wù)器104獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符(步驟613)。
如果會話標(biāo)識符和站點標(biāo)識符與在預(yù)定時段內(nèi)與其它點擊有關(guān)的會話標(biāo)識符和站點標(biāo)識符一致,則用于檢測無效點擊的設(shè)備確定該點擊是無效點擊(步驟614)。
圖7顯示了根據(jù)本發(fā)明實施例的示例的日志文件。
在這個實施例中,每當(dāng)從用戶接收一個搜索項的點擊,點擊時間710、會話標(biāo)識符的更新時間711、會話標(biāo)識符712和站點標(biāo)識符713被存儲在日志文件700中。附圖標(biāo)記701到708指出對應(yīng)于各個點擊輸入存儲的日志。
作弊器訪問因特網(wǎng)搜索服務(wù)器104以請求一個搜索請求。因特網(wǎng)搜索服務(wù)器104產(chǎn)生一個搜索結(jié)果網(wǎng)頁。因特網(wǎng)搜索服務(wù)器104接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)包括在內(nèi)搜索項的點擊。
因特網(wǎng)搜索服務(wù)器104確定會話cookie文件是否被存儲在客戶機(jī)終端101中。如果確定會話cookie文件沒有存儲在客戶機(jī)終端101中,則因特網(wǎng)搜索服務(wù)器104產(chǎn)生一個新的會話標(biāo)識符,并且將其更新時間和包括會話標(biāo)識符在內(nèi)的會話cookie文件存儲在客戶機(jī)終端101中。在這個實施例中,會話標(biāo)識符″xigw9492″和更新時間″10:50:14″被記錄。此外,對應(yīng)于搜索項的點擊時間、更新時間、會話標(biāo)識符和站點標(biāo)識符作為日志701被存儲在日志文件700中。在第一次產(chǎn)生會話cookie文件的情況中,只要在那時還產(chǎn)生點擊和會話標(biāo)識符,會話cookie文件就被產(chǎn)生。從而,點擊時間和會話標(biāo)識符更新時間是相同的。
作弊器在相同的搜索結(jié)果頁面中點擊相同的搜索項。因特網(wǎng)搜索服務(wù)器104確定會話cookie文件是否被存儲在客戶機(jī)終端101中。因為上述產(chǎn)生的會話cookie文件已經(jīng)被存儲在客戶機(jī)終端101中,因特網(wǎng)搜索服務(wù)器104訪問存儲在客戶機(jī)終端101中的會話cookie文件。會話cookie文件在其中存儲一個會話標(biāo)識符和會話標(biāo)識符的最后更新時間。在這個實施例中,會話標(biāo)識符″xigw9492″和更新時間″10:50:14″被存儲在會話cookie文件中。
因特網(wǎng)搜索服務(wù)器104確定來自搜索器的搜索項的點擊時間是否在從與會話標(biāo)識符有關(guān)的最后更新時間開始的預(yù)定時段內(nèi)。在這個實施例中,第二點擊的點擊時間是″10:50:18″。如果預(yù)定時段是5秒,則點擊時間″10:50:18″在從最后更新時間″10:50:14″開始的預(yù)定時段內(nèi)。同樣地,在這種情況下,存儲在會話cookie文件中的會話標(biāo)識符被用作一個當(dāng)前的會話標(biāo)識符并且該會話cookie文件的會話標(biāo)識符沒有被更新。從而在這種情況下,例如日志702被記錄。
從而,確定日志702是一個無效點擊,因為它具有與日志701相同的會話標(biāo)識符和站點標(biāo)識符。
日志704對應(yīng)于其中作弊器請求″reload″的情況。同樣地,結(jié)果作弊器請求″reload″,制定出存儲在客戶機(jī)終端101中的會話cookie文件的標(biāo)準(zhǔn),并且會話標(biāo)識符沒有被更新,因為存儲在會話cookie文件中的最后更新時間在預(yù)定時段內(nèi)。因此,例如日志704被記錄。因為它和日志701一樣,所以確定日志704是一個無效點擊。即,根據(jù)這個實施例,有可能檢測作弊器在短時間間隔內(nèi)在點擊″reload″之后點擊相同的搜索項的情況。
日志705對應(yīng)于這種情況,即相同搜索項的點擊從不同于日志701、日志702和日志704的搜索器被接收。在這種情況下,因為新的會話標(biāo)識符被分配,所以它不被確定為一個無效點擊。
日志709對應(yīng)于這種情況,即與日志701相同的搜索器在相當(dāng)多時間之后點擊相同的搜索項。在這種情況下,因為點擊在相當(dāng)長時間之后才被接收,所以它不被確定為一個無效點擊。
根據(jù)這個實施例,作弊器在預(yù)定時段之后點擊相同的搜索項的情況,因為一個會話標(biāo)識符被產(chǎn)生,所以它被確定是一個無效點擊。
同樣地,根據(jù)本發(fā)明的另一個實施例基于無效點擊決定來確定這樣的情況可能是一個無效點擊,即在從相同搜索項的最后點擊時間開始的預(yù)定時段內(nèi)做出點擊。這將被簡單地說明。
如果點擊從搜索器被接收,則確定會話cookie文件是否被存儲在終端中。如果確定會話cookie文件被存儲在終端中,則確定來自搜索器的搜索項的點擊時間是否在從與會話標(biāo)識符有關(guān)的最后點擊時間開始的預(yù)定時段內(nèi)。
如果確定搜索項的點擊時間在預(yù)定時段內(nèi),則包括在會話cookie文件內(nèi)的會話標(biāo)識符被獲取并且最后點擊時間用搜索項的點擊時間來更新。
如果確定搜索項的點擊時間不在預(yù)定時段內(nèi),則新的會話標(biāo)識符被產(chǎn)生以更新包括在會話cookie文件內(nèi)的會話標(biāo)識符。此外,最后點擊時間用搜索項的點擊時間來更新。
例如在圖7中,在存在來自于相同客戶機(jī)終端的相同搜索項的多個點擊的情況下,如果確定從最后的點擊已經(jīng)過去了5秒的情況是有效的,則與日志704有關(guān)的點擊被確定是有效的,因為它在先前的最后點擊時間″10:50:18″的13秒后被做出“10:50:31”。
根據(jù)本發(fā)明的優(yōu)選實施例,時間參考根據(jù)無效點擊的檢測目的來決定。
圖8是一個根據(jù)本發(fā)明實施例來產(chǎn)生會話標(biāo)識符的方法流程圖。
會話標(biāo)識符必須被唯一地分配以便它能與其它的會話標(biāo)識符區(qū)分并且必須很難被仿造或偽造。在會話標(biāo)識符只被唯一地分配的情況下,存在一個可能性,即作弊器實際上可能產(chǎn)生一個會話標(biāo)識符然后把會話標(biāo)識符存儲在會話cookie中,或者可能用一個程序不正當(dāng)?shù)卦黾狱c擊量,這個程序被驅(qū)動來不斷地點擊搜索項而同時改變會話標(biāo)識符。
源數(shù)據(jù)801是用于產(chǎn)生會話標(biāo)識符805的基本數(shù)據(jù)。源數(shù)據(jù)可以是當(dāng)前的時間信息、搜索字、搜索器的web瀏覽器的產(chǎn)品ID等等。源數(shù)據(jù)可以是隨機(jī)選擇的數(shù)量。散列函數(shù)802被應(yīng)用到源數(shù)據(jù)801以產(chǎn)生一個編碼串803。然后,校驗和被添加到編碼串803以產(chǎn)生會話標(biāo)識符805。校驗和用來防止作弊器偽造會話標(biāo)識符。
用于根據(jù)這個實施例產(chǎn)生會話標(biāo)識符的方法可以被應(yīng)用來產(chǎn)生一個隨后將被說明的頁面標(biāo)識符、站點標(biāo)識符、終端標(biāo)識符等等。
圖9是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務(wù)器104從搜索器接收一個包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊(步驟901)。因特網(wǎng)搜索服務(wù)器104獲取一個對應(yīng)于搜索器的終端101的客戶機(jī)IP地址(步驟902)。客戶機(jī)的IP地址可以從被接收的IP分組的源IP地址字段中提取。
因特網(wǎng)搜索服務(wù)器104獲取對應(yīng)于被點擊搜索項的站點標(biāo)識符(步驟903)。
在步驟904中,如果客戶機(jī)IP地址和站點標(biāo)識符與預(yù)定時段內(nèi)其它點擊相關(guān)的客戶機(jī)IP地址和站點客戶機(jī)IP地址一致,則用于搜索無效點擊的設(shè)備確定該點擊無效。
圖10顯示了根據(jù)本發(fā)明實施例的示例的日志文件。
在這個實施例中,每當(dāng)從用戶接收一個搜索項的點擊,點擊時間1010、客戶機(jī)IP地址1011和站點標(biāo)識符1012就被存儲在日志文件1000中。附圖標(biāo)記1001到1009指定對應(yīng)于各個點擊輸入的所存儲的日志。
如果相同的客戶機(jī)終端不斷地點擊相同的搜索項,則如果點擊在預(yù)定時段內(nèi)被重復(fù),則該點擊無效的可能性很高。然而,往往是這樣的情況,即相同客戶機(jī)終端的用戶在相當(dāng)長時間之后點擊相同的搜索項。換言之,存在一個趨勢,即用戶往往訪問一個它很感興趣的網(wǎng)絡(luò)站點。如果用戶在短時間內(nèi)不斷地訪問一個網(wǎng)絡(luò)站點,則很難把它看作是一個普通的點擊。從而,這個情況被確定是一個無效點擊。例如,如果時間標(biāo)準(zhǔn)是5分鐘,則具有與日志1001相同的客戶機(jī)IP地址和相同的站點標(biāo)識符的日志1002、日志1004和日志1005被確定是無效點擊。確定在大約20分鐘中與被點擊日志1009相關(guān)的點擊是有效點擊。
如果基于客戶機(jī)IP地址來確定無效點擊,那么存在一些需要謹(jǐn)慎的點。在客戶機(jī)終端使用代理服務(wù)器或IP網(wǎng)關(guān)的情況中,存在一個危險,即使作弊器點擊與其它的客戶機(jī)終端相同的搜索項,它也可能被確定為一個無效點擊。因此,優(yōu)選地,這個實施例與使用諸如會話標(biāo)識符之類的其它參數(shù)的一個實施例一起聯(lián)合構(gòu)造。
相反地,存在這樣一種情況,即點擊相同搜索項的客戶機(jī)終端的客戶機(jī)IP地址是不同的,而它們的網(wǎng)絡(luò)地址是相同的。這對應(yīng)于這樣一種情況,即幾個人不斷地嘗試用一個程序來不公平的點擊一處或點擊相同的搜索項,而同時改變它們的源IP地址。在這種情況下,如果點擊相同搜索項的客戶機(jī)終端的網(wǎng)絡(luò)地址是相同的并且其它情況(例如,在搜索項所屬的目錄內(nèi),點擊量大于平均點擊量的情況)被滿足,則這可以被確定是一個無效點擊。
圖11是一個根據(jù)本發(fā)明實施例來檢測無效點擊的方法流程圖。
因特網(wǎng)搜索服務(wù)器104從搜索器接收搜索請求(步驟1101)并且產(chǎn)生一個搜索結(jié)果網(wǎng)頁(步驟1102)。
因特網(wǎng)搜索服務(wù)器104確定包括終端標(biāo)識符在內(nèi)的用戶cookie文件是否被存儲在終端中(步驟1103)。
由于步驟1103中的確定結(jié)果,如果包括終端標(biāo)識符在內(nèi)的用戶cookie文件沒有被存儲在終端中,則因特網(wǎng)搜索服務(wù)器104產(chǎn)生一個終端標(biāo)識符(步驟1104)。
因特網(wǎng)搜索服務(wù)器104產(chǎn)生包括終端標(biāo)識符在內(nèi)的用戶cookie文件并把它存儲在搜索器終端中(步驟1105)。
由于步驟1103中的確定結(jié)果,如果包括終端標(biāo)識符在內(nèi)的用戶cookie文件被存儲在終端中,則因特網(wǎng)搜索服務(wù)器104從用戶cookie文件中提取終端標(biāo)識符(步驟1106)。
因特網(wǎng)搜索服務(wù)器104從搜索器接收包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊(步驟1107),然后獲取一個對應(yīng)于被點擊搜索項的站點標(biāo)識符(步驟1108)。
最后,在步驟1109中,用于確定如果無效點擊的設(shè)備確定終端標(biāo)識符和站點標(biāo)識符與與預(yù)定時段內(nèi)其它點擊有關(guān)的終端標(biāo)識符和站點標(biāo)識符一致,則該點擊是無效的。
根據(jù)這個實施例,即使客戶機(jī)終端使用一個代理服務(wù)器或IP網(wǎng)關(guān),也有可能用終端標(biāo)識符來判別客戶機(jī)的終端。從而,即使不同的客戶機(jī)終端使用代理服務(wù)器或IP網(wǎng)關(guān),也可能正確地識別來自于不同客戶機(jī)的點擊。
在本發(fā)明的另一個實施例中,如果對于包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,預(yù)定時段內(nèi)每個搜索項的搜索器的點擊量大于屬于搜索項所屬類別的搜索項的平均點擊量,則它被認(rèn)為是一個無效點擊并從而將其報告給管理員。
根據(jù)本實施例的用于檢測無效點擊的設(shè)備包括點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項計數(shù)預(yù)定時段內(nèi)每個搜索項的搜索器點擊量,平均點擊量計算裝置,用于計算預(yù)定時段內(nèi)屬于搜索項所屬類別的搜索項的平均點擊量,和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預(yù)定的差。如果每個搜索項的點擊量比平均點擊量大一個預(yù)定的差,則這個事實經(jīng)由無效點擊報告單元308被報告給管理員。
根據(jù)本發(fā)明的另一個實施例,針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,在預(yù)定時間段內(nèi),將每個搜索項的搜索器的點擊量與預(yù)定時段內(nèi)在搜索結(jié)果網(wǎng)頁中的位于搜索項上端的搜索項預(yù)定第一數(shù)量和位于搜索項下端的搜索項的預(yù)定第二數(shù)量的平均點擊量相比較。例如,在相同的周期中,特殊的搜索項的點擊量與緊接位于特殊搜索項上的兩個搜索項和緊接位于特殊搜索項下的兩個搜索項的點擊量相比較。作為比較的結(jié)果,如果特殊搜索項的點擊量比圍繞其它搜索項的點擊量大5倍,則它是無效點擊的可能性很高并且從而同樣地被報告給管理員。
用于確定無效點擊的各種方法已經(jīng)在上面被說明。用于確定無效點擊的方法可以被獨立地使用或者可以與用于確定無效點擊的方法聯(lián)合使用。例如,一個規(guī)則可以被存儲在無效點擊模型存儲單元306中,其中,對應(yīng)于搜索項的客戶機(jī)IP地址、頁面標(biāo)識符和站點標(biāo)識符在從搜索項的最后點擊開始的5分鐘內(nèi)被重復(fù)的情況是無效的。
在本發(fā)明中,因特網(wǎng)搜索服務(wù)器和用于識別不公平點擊的設(shè)備已經(jīng)被混亂地描述為單個單元。然而,根據(jù)本發(fā)明的另一個實施例,應(yīng)當(dāng)注意它們可以根據(jù)它們的功能被分開執(zhí)行并且可以由不同的管理員來管理。
此外,在本發(fā)明中,被顯示并被描述為分開元件的元件可以物理上被創(chuàng)建在單個系統(tǒng)中并且可以物理上被創(chuàng)建在一個單獨的系統(tǒng)中。
此外,盡管幾個實施例已經(jīng)在本發(fā)明中被說明,對于所屬領(lǐng)域技術(shù)人員來說顯而易見的是,多個實施例的一部分或剩余的實施例也屬于本發(fā)明的精神。
另外,本發(fā)明的實施例還涉及包括用于執(zhí)行不同的計算機(jī)執(zhí)行操作的程序指令的計算機(jī)可讀媒介。該媒介還可以單獨(或與程序指令相結(jié)合)包括數(shù)據(jù)文件、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)表等等。媒介和程序指令可以被特別地設(shè)計并構(gòu)造以用于本發(fā)明目的,或它們可能是眾所周知的類型并是計算機(jī)軟件領(lǐng)域的技術(shù)人員可用的。計算機(jī)可讀媒介的例子包括諸如硬盤、軟盤和磁帶之類的磁性媒介;諸如CD-ROM磁盤之類的光媒介;諸如可光讀磁盤之類的磁光媒介;和被特別配置來存儲和執(zhí)行程序指令的硬件裝置,比如只讀存儲器裝置(ROM)和隨機(jī)存取存儲器(RAM)。媒介還可能是諸如光或金屬線路、導(dǎo)波器等等之類的傳輸媒介,包括發(fā)射規(guī)定程序指令、數(shù)據(jù)結(jié)構(gòu)等等的信號的載波。程序指令的例子包括兩個諸如由編譯器產(chǎn)生的之類的機(jī)器代碼,和包括可以由計算機(jī)使用解釋器來執(zhí)行的高級代碼在內(nèi)的文件。
圖12是一個說明通用計算機(jī)系統(tǒng)的結(jié)構(gòu)的框圖,該系統(tǒng)可用于創(chuàng)立搜索引擎服務(wù)器和用于根據(jù)本發(fā)明檢測無效點擊的設(shè)備。
計算機(jī)系統(tǒng)包括任意數(shù)量的處理器1240(也被稱為中央處理器或CPUs),它們被耦合到包括主存儲器1260(一般來說是隨機(jī)存取存儲器或″RAM″)、主存儲器1270(一般來說是只讀存儲器或″ROM″)的存儲裝置。在本領(lǐng)域中眾所周知的是,主存儲器1260把數(shù)據(jù)和指令單向傳送到CPU,并且主存儲器1260一般被用來以雙向方式傳送數(shù)據(jù)和指令。這兩個主存儲器裝置都可以包括如上所述的任何適當(dāng)?shù)念愋偷挠嬎銠C(jī)可讀媒介。大容量存儲裝置1210還被雙向耦合到CPU1240和提供附加的數(shù)據(jù)存儲量并且可以包括如上所述的任何計算機(jī)可讀媒介。大容量存儲裝置1210可以被用來存儲程序、數(shù)據(jù)等等,并且一般是一個諸如比主存儲器慢的硬盤之類的輔助存儲器媒介。諸如光盤1220之類的特殊大容量存儲裝置還可以把數(shù)據(jù)單向傳遞給CPU。處理器1240還被耦合到一個接口1230,其包括一個或多個輸入輸出設(shè)備,比如視頻監(jiān)視器、跟蹤球、鼠標(biāo)、鍵盤、擴(kuò)音器、觸控式顯示器、換能器讀卡機(jī)、磁或紙帶讀取器、寫字板、觸針、音頻或手寫識別器或諸如當(dāng)然包括其它計算機(jī)之類的其它眾所周知的輸入裝置。最后,如通常在1250所示,處理器1240可以選擇性地使用網(wǎng)絡(luò)連接被耦合到計算機(jī)或電信網(wǎng)。有了這類網(wǎng)絡(luò)連接,CPU可以在執(zhí)行上述方法步驟的過程中從網(wǎng)絡(luò)接收信息或者可以向網(wǎng)絡(luò)輸出信息是可期望的。上述裝置和材料對于計算機(jī)硬件和軟件領(lǐng)域中的技術(shù)人員來說是很熟悉的。
如上所述的硬件元件可以被配置(一般暫時)來充當(dāng)一個或多個執(zhí)行本發(fā)明操作的軟件模塊。
工業(yè)實用性根據(jù)上述的本發(fā)明,一個用于檢測包括在由因特網(wǎng)搜索引擎服務(wù)器提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的無效點擊的方法和設(shè)備被提供。
根據(jù)本發(fā)明,一個用于檢測無效點擊的方法和設(shè)備,其可以檢測各種不正當(dāng)?shù)卦黾铀阉黜楛c擊量的嘗試,并且立即處理這些嘗試。即,如果新模型的不公平的點擊嘗試被發(fā)現(xiàn),則該模型或規(guī)則被存儲在一個根據(jù)本發(fā)明的無效點擊模型存儲單元中。從而,立即處理這個遵循新模型的不公平點擊嘗試是可能的。
此外,根據(jù)本發(fā)明提供了一個用于檢測無效點擊的方法和設(shè)備,其可以防止為了檢測無效點擊而提供的幾個標(biāo)識符被仿造或偽造。
盡管本發(fā)明已經(jīng)關(guān)于附圖中說明的本發(fā)明實施例而被說明,然而它并沒有被限制在其中,因為對于所屬領(lǐng)域技術(shù)人員來說,顯然可以在其中做出不同的置換、修改和改變。本發(fā)明的范圍由附加的權(quán)利要求來定義。所有在權(quán)利要求的意義和范圍內(nèi)做出的改變或修改或其等效物應(yīng)該被看作是屬于本發(fā)明的范圍。
權(quán)利要求
1.一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟(a)響應(yīng)于來自于搜索器的搜索請求產(chǎn)生搜索結(jié)果網(wǎng)頁;(b)獲取一對應(yīng)于所產(chǎn)生的網(wǎng)頁的頁面標(biāo)識符;(c)從搜索器接收一包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊;(d)獲取一對應(yīng)于被點擊搜索項的站點標(biāo)識符;和(e)如果頁面標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)的與其它點擊有關(guān)的頁面標(biāo)識符和站點標(biāo)識符一致,則確定該點擊無效。
2.權(quán)利要求1的方法,其中,頁面標(biāo)識符和站點標(biāo)識符包括一校驗和。
3.一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自于搜索器的搜索請求產(chǎn)生搜索結(jié)果網(wǎng)頁;獲取一包括在搜索器終端中存儲的會話cookie文件內(nèi)的會話標(biāo)識符;從搜索器接收一包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊;獲取一對應(yīng)于被點擊搜索項的站點標(biāo)識符;和如果會話標(biāo)識符和站點標(biāo)識符與在預(yù)定時段內(nèi)的與其它點擊有關(guān)的會話標(biāo)識符和站點標(biāo)識符一致,則確定該點擊無效。
4.權(quán)利要求3的方法,其中,獲取包括在搜索器終端中存儲的會話cookie文件內(nèi)的會話標(biāo)識符的步驟包括下列步驟確定會話cookie文件是否被存儲在終端中;和如果確定會話cookie文件沒有存儲在終端中,則產(chǎn)生一新的會話標(biāo)識符然后把包括產(chǎn)生的會話標(biāo)識符的會話cookie文件存儲在終端中。
5.權(quán)利要求4的方法,還包括下列步驟如果確定會話cookie文件被存儲在終端中,則確定包括在會話cookie文件內(nèi)的會話標(biāo)識符的最后更新時間是否在預(yù)定時段內(nèi);和如果確定最后更新時間在預(yù)定時段內(nèi),則獲取一包括在會話cookie文件內(nèi)的會話標(biāo)識符。
6.權(quán)利要求5的方法,還包括下列步驟如果確定最后更新時間不在預(yù)定時段內(nèi),則通過產(chǎn)生新的會話標(biāo)識符來更新包括在會話cookie文件內(nèi)的會話標(biāo)識符;和把會話標(biāo)識符的更新時間存儲在會話cookie文件中。
7.權(quán)利要求4的方法,還包括下列步驟如果確定會話cookie文件存儲在終端中,則確定來自搜索器的搜索項的點擊時間是否在與會話標(biāo)識符有關(guān)的最后點擊時間之后的預(yù)定時段內(nèi);如果確定搜索項的點擊時間在最后點擊時間之后的預(yù)定時段內(nèi),則獲取一包括在會話cookie文件內(nèi)的會話標(biāo)識符;和用搜索項的點擊時間來更新最后點擊時間。
8.權(quán)利要求7的方法,還包括下列步驟如果確定搜索項的點擊時間不在最后點擊時間之后的預(yù)定時段內(nèi),則通過產(chǎn)生新的會話標(biāo)識符來更新包括在會話cookie文件內(nèi)的會話標(biāo)識符;和用搜索項的點擊時間來更新最后點擊時間。
9.權(quán)利要求3到8中任何一個的方法,其中,會話標(biāo)識符和站點標(biāo)識符包括一個校驗和。
10.一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟從搜索器接收一包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊;獲取一對應(yīng)于搜索器終端的客戶機(jī)IP地址;獲取一對應(yīng)于被點擊搜索項的站點標(biāo)識符;和如果客戶機(jī)IP地址和站點標(biāo)識符與預(yù)定時段內(nèi)的與其它點擊有關(guān)的客戶機(jī)IP地址和站點標(biāo)識符一致,則確定該點擊是無效的。
11.權(quán)利要求10的方法,其中,站點標(biāo)識符用其中包括的校驗和來產(chǎn)生。
12.一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自于搜索器的搜索請求產(chǎn)生一搜索結(jié)果網(wǎng)頁;獲取一對應(yīng)于搜索器終端的終端標(biāo)識符;產(chǎn)生一包括終端標(biāo)識符的用戶cookie文件,然后把用戶cookie文件存儲在搜索器終端中;從搜索器接收一包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊;獲取一對應(yīng)于被點擊搜索項的站點標(biāo)識符;和如果終端標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)的與其它點擊有關(guān)的終端標(biāo)識符和站點標(biāo)識符一致,則確定該點擊是無效的。
13.權(quán)利要求12的方法,還包括下列步驟確定包括終端標(biāo)識符在內(nèi)的cookie文件是否被存儲在終端中;和如果確定包括終端標(biāo)識符在內(nèi)的用戶cookie文件存儲在終端中,則從用戶cookie文件接收終端標(biāo)識符。
14.權(quán)利要求12或13的方法,其中,終端標(biāo)識符和站點標(biāo)識符包括一校驗和。
15.一種計算機(jī)可讀的記錄媒介,其中,一個用于實現(xiàn)根據(jù)權(quán)利要求1到8和10到13中任何一個的程序被記錄。
16.一種用于檢測無效點擊的設(shè)備,其中如果搜索器點擊包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,則搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與存儲在搜索器終端中的點擊和cookie文件信息有關(guān)的點擊時間、與搜索項有關(guān)的URL信息中的至少一個被接收,并且根據(jù)基于接收的信息的預(yù)定的標(biāo)準(zhǔn)來確定點擊是否無效。
17.一種用于檢測無效點擊的設(shè)備,包括日志存儲單元,其響應(yīng)于包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的搜索器點擊,存儲至少與下列兩項相關(guān)的日志搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、搜索器的web瀏覽器的相關(guān)信息、與該點擊有關(guān)的點擊時間、存儲在搜索器終端中的cookie文件信息和與搜索項有關(guān)的URL信息;無效點擊模型存儲單元,其存儲與下列中至少兩項的一對有關(guān)的無效點擊模型搜索器終端的IP地址、搜索器終端所屬的網(wǎng)絡(luò)地址、與搜索結(jié)果網(wǎng)頁有關(guān)的搜索字、有關(guān)搜索器的web瀏覽器的信息,與點擊有關(guān)的點擊時間,存儲在搜索器終端中的cookie文件信息、與搜索項有關(guān)的URL信息;和無效點擊決定單元,其基于日志存儲單元中存儲的日志和無效點擊模型存儲單元中存儲的無效點擊模型來確定搜索器點擊是否是一個無效點擊。
18.權(quán)利要求17的設(shè)備,還包括無效點擊報告單元,用于向因特網(wǎng)搜索引擎的管理員報告滿足被確定為無效的點擊之中的預(yù)定標(biāo)準(zhǔn)的點擊。
19.權(quán)利要求18的設(shè)備,還包括無效點擊驗證單元,其根據(jù)管理員的輸入把無效點擊改變成一個有效點擊。
20.一種用于檢測無效點擊的設(shè)備,包括點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,計數(shù)預(yù)定時段內(nèi)每個搜索項的搜索器點擊量;平均點擊量計算裝置,用于在預(yù)定時段內(nèi)計算屬于搜索項所屬類別的搜索項的平均點擊量;和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預(yù)定的差。
21.一種用于檢測無效點擊的設(shè)備,包括點擊計數(shù)器裝置,用于針對包括在由因特網(wǎng)搜索引擎提供的搜索結(jié)果網(wǎng)頁內(nèi)的搜索項,計數(shù)預(yù)定時段內(nèi)每個搜索項的搜索器點擊量;平均點擊量的計算裝置,用于在預(yù)定時段內(nèi)在搜索結(jié)果網(wǎng)頁中,計算位于搜索項上端的搜索項的預(yù)定第一數(shù)量和位于搜索項下端的搜索項的預(yù)定第二數(shù)量的平均點擊量;和決定裝置,用于確定每個搜索項的點擊量是否比平均點擊量大一個預(yù)定的差。
全文摘要
本發(fā)明涉及一種因特網(wǎng)搜索引擎服務(wù)器。更明確地說,本發(fā)明涉及用于檢測搜索項的無效點擊的方法和設(shè)備,搜索項被包括在一個由因特網(wǎng)搜索引擎服務(wù)器提供的搜索結(jié)果網(wǎng)頁內(nèi)。本發(fā)明涉及一種用于在因特網(wǎng)搜索引擎中檢測無效點擊的方法,包括下列步驟響應(yīng)于來自于搜索器的搜索請求產(chǎn)搜索結(jié)果網(wǎng)頁;獲取一對應(yīng)于被產(chǎn)生網(wǎng)頁的頁面標(biāo)識符;從搜索器接收一包括在搜索結(jié)果網(wǎng)頁內(nèi)的搜索項的點擊;獲取一對應(yīng)于被點擊的搜索項的站點標(biāo)識符;并且如果頁面標(biāo)識符和站點標(biāo)識符與預(yù)定時段內(nèi)的其它點擊有關(guān)的頁面標(biāo)識符和站點標(biāo)識符一致,則確定該點擊無效。根據(jù)本發(fā)明提供了一個用于檢測無效點擊的方法和設(shè)備,其檢測各種不正當(dāng)?shù)卦黾铀阉黜楛c擊量的嘗試,并且立即處理這些嘗試。
文檔編號G06F17/30GK1761961SQ200480007418
公開日2006年4月19日 申請日期2004年2月27日 優(yōu)先權(quán)日2003年3月19日
發(fā)明者河定秀, 姜錫昊, 李宇晟 申請人:Nhn株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1