專利名稱:廣告信息檢索系統(tǒng)及廣告信息檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索技術(shù),尤其涉及廣告信息檢索系統(tǒng)及廣告信息檢索方法。
背景技術(shù):
互聯(lián)網(wǎng)搜索引擎作為一個(gè)信息服務(wù)平臺,在為互聯(lián)網(wǎng)用戶提供搜索服務(wù)的同時(shí),也為互聯(lián)網(wǎng)廣告客戶提供廣告投放服務(wù)。投放廣告的服務(wù)不但可以為廣告客戶進(jìn)行宣傳,而且可以為用戶提供更多的服務(wù)信息。通過搜索引擎投放廣告已成為廣告商普遍采用的一種廣告投放方式。
在現(xiàn)有的搜索引擎中,普遍采用根據(jù)用戶的當(dāng)前查詢此匹配相關(guān)廣告的廣告投放方法。互聯(lián)網(wǎng)用戶在搜索時(shí),向搜索引擎提交查詢詞,搜索引擎將與查詢詞最相關(guān)的一組網(wǎng)頁的鏈接作為搜索結(jié)果頁面返回給用戶;用戶可以點(diǎn)擊這些鏈接去訪問相關(guān)的網(wǎng)頁。廣告客戶通過搜索關(guān)鍵詞競價(jià)排名系統(tǒng)注冊與其所要推廣的廣告鏈接網(wǎng)站/網(wǎng)頁密切相關(guān)的一組搜索關(guān)鍵詞。如果互聯(lián)網(wǎng)用戶提交的查詢詞與競價(jià)排名系統(tǒng)中的關(guān)鍵詞匹配,那么注冊該關(guān)鍵詞的廣告客戶所提供的廣告鏈接也將出現(xiàn)在搜索結(jié)果頁面中。這種廣告投放方法存在一定的缺陷,由于搜索結(jié)果頁中所展現(xiàn)的廣告,是根據(jù)用戶當(dāng)前的查詢詞與廣告關(guān)鍵詞的匹配來選擇確定的,如果用戶的一個(gè)查詢在廣告庫中沒有找到匹配的關(guān)鍵詞,即使從該用戶的搜索歷史記錄中可以看出用戶最近經(jīng)常搜索的一些查詢在廣告庫中都有合適的廣告可以匹配,但返回用戶的搜索結(jié)果中也不展現(xiàn)廣告。并且,對于不同的用戶,只要查詢詞相同,匹配顯示的廣告信息也是相同的,在匹配中并沒有考慮用戶的歷史行為。
現(xiàn)在,還有一種廣告投放方式,即在互聯(lián)網(wǎng)用戶瀏覽一個(gè)網(wǎng)頁時(shí),網(wǎng)頁的所有者在網(wǎng)頁中以文字鏈接方式展現(xiàn)相關(guān)廣告。目前常用的方法是通過分析網(wǎng)頁的文本內(nèi)容,選擇展現(xiàn)與該網(wǎng)頁在內(nèi)容上最密切相關(guān)的文字鏈廣告。在這種投放方法中,由于網(wǎng)站服務(wù)器根據(jù)當(dāng)前網(wǎng)頁的文本內(nèi)容選擇展現(xiàn)與其相關(guān)的廣告;如果當(dāng)前網(wǎng)頁的內(nèi)容在廣告庫中沒有合適的匹配,即使搜索引擎可以選取展現(xiàn)一些與用戶的過去搜索歷史中的查詢詞相關(guān)的廣告該網(wǎng)頁展現(xiàn),頁面中也將沒有廣告。
利用用戶網(wǎng)上行為歷史中的信息,目前通用的技術(shù)是對用戶的網(wǎng)上行為歷史的原始數(shù)據(jù)進(jìn)行分析和挖掘,生成用戶簡檔(user-profile);對于一個(gè)用戶,用戶簡檔保存了一些事實(shí)性或推測性的個(gè)人身份信息(如性別,年齡、籍貫、職業(yè)、地址等)和主要個(gè)人行為傾向信息(如某些方面的興趣、愛好和習(xí)慣等);用戶簡檔的特點(diǎn)是,數(shù)據(jù)具有總結(jié)性,存儲的數(shù)據(jù)量相對較小,格式一般為結(jié)構(gòu)化數(shù)據(jù)。用戶簡檔中的每一種信息,一般是對用戶在某一方面的歸類信息?,F(xiàn)在普遍使用的一種生成用戶簡檔的方法是,為用戶提供個(gè)人信息輸入表,該表中有關(guān)于個(gè)人身份信息和個(gè)人行為傾向的空格或選項(xiàng),當(dāng)用戶通過填寫完畢后,對用戶填寫的信息進(jìn)行分析總結(jié),生成用戶簡檔。當(dāng)用戶身份信息或興趣發(fā)生變化時(shí),一般只有在用戶主動修改個(gè)人信息時(shí),才會對其用戶簡檔進(jìn)行修改更新,因此用戶簡檔往往不能及時(shí)有效地反映用戶的實(shí)際信息;并且,用戶信息的準(zhǔn)確程度與信息輸入表格設(shè)計(jì)也有很大的關(guān)系,有時(shí)用戶并不能從中選擇到合適自己的選項(xiàng),從而用戶填寫的表格并不能準(zhǔn)確完整的反映用戶的實(shí)際信息。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)所存在的缺陷,提供廣告信息檢索系統(tǒng)及廣告信息檢索方法,能夠?qū)τ脩粼L問行為進(jìn)行記錄,并利用用戶標(biāo)識建立索引,基于用戶歷史行為匹配廣告,使廣告能為用戶提供更為有用的信息。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種廣告信息檢索系統(tǒng),包括日志分析子系統(tǒng),用于記錄、分析用戶的訪問日志;索引子系統(tǒng),與所述日志分析子系統(tǒng)連接,用于生成用戶標(biāo)識關(guān)鍵詞索引及關(guān)鍵詞廣告索引;檢索子系統(tǒng),與所述日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求、用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)及關(guān)鍵詞廣告索引數(shù)據(jù)匹配廣告信息。
所述日志分析子系統(tǒng)包括日志分析設(shè)備,該日志分析設(shè)備包括日志信息庫,用于存儲日志信息;日志記錄模塊,與所述日志信息庫連接,用于接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理庫,用于存儲日志預(yù)處理數(shù)據(jù),該日志預(yù)處理數(shù)據(jù)包括用戶標(biāo)識及查詢串;日志預(yù)處理模塊,與所述日志信息庫及日志預(yù)處理庫連接,用于分析日志信息,抽取查詢串,并將生成的預(yù)處理數(shù)據(jù)存儲于日志預(yù)處理庫中。
為了避免每天大規(guī)模的傳輸歷史庫造成的網(wǎng)絡(luò)開銷,由檢索設(shè)備負(fù)責(zé)用戶標(biāo)識關(guān)鍵詞索引歷史庫的生成,索引子系統(tǒng)只生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。
所述索引子系統(tǒng)包括索引設(shè)備,該索引設(shè)備包括用戶標(biāo)識關(guān)鍵詞索引庫,用于存儲用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引生成模塊,與所述日志預(yù)處理庫及用戶標(biāo)識關(guān)鍵詞索引庫連接,用于生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)并將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)存儲于用戶標(biāo)識關(guān)鍵詞索引庫中;關(guān)鍵詞廣告索引庫,用于存儲關(guān)鍵詞廣告索引數(shù)據(jù);關(guān)鍵詞廣告索引生成模塊,與所述關(guān)鍵詞廣告索引庫連接,用于生成關(guān)鍵詞廣告索引數(shù)據(jù)。
所述檢索子系統(tǒng)包括檢索設(shè)備,該檢索設(shè)備包括WEB服務(wù)模塊,用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊,與所述WEB服務(wù)模塊連接,用于接收檢索請求,生成廣告檢索結(jié)果頁面;用戶標(biāo)識關(guān)鍵詞索引歷史庫,用于存儲用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引歷史庫生成模塊,與所述用戶標(biāo)識關(guān)鍵詞索引歷史庫連接,用于將用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)合并到用戶標(biāo)識關(guān)鍵詞索引歷史庫中;廣告匹配模塊,與關(guān)鍵詞廣告索引庫及用戶標(biāo)識關(guān)鍵詞索引庫連接,用于根據(jù)檢索請求,檢索用戶標(biāo)識關(guān)鍵詞索引庫及關(guān)鍵詞廣告索引庫,將匹配的廣告發(fā)送至用戶接口模塊。
每一子系統(tǒng)中均可包括一臺或多臺相應(yīng)設(shè)備,當(dāng)包括多臺相應(yīng)設(shè)備時(shí),每一設(shè)備根據(jù)預(yù)先設(shè)定的分組,對部分用戶標(biāo)識的數(shù)據(jù)進(jìn)行處理。
對于一個(gè)搜索引擎,每天有大量的訪問用戶,為了避免索引子系統(tǒng)成為系統(tǒng)的瓶頸,由日志分析設(shè)備進(jìn)行部分的數(shù)據(jù)處理工作,生成分時(shí)段的用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。而索引設(shè)備只需將用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)合并為用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù),并傳送給檢索子系統(tǒng)即可。日志分析設(shè)備還可包括分時(shí)段增量生成模塊,與所述日志預(yù)處理庫連接,用于實(shí)時(shí)讀取日志預(yù)處理數(shù)據(jù),對查詢串切詞,得到關(guān)鍵詞,生成用戶標(biāo)識關(guān)鍵詞索引增量并將用戶標(biāo)識關(guān)鍵詞索引增量存儲到分時(shí)段增量庫中;分時(shí)段增量庫,與所述分時(shí)段增量生成模塊及用戶標(biāo)識關(guān)鍵詞索引生成模塊連接,用于存儲用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引生成模塊將用戶標(biāo)識關(guān)鍵詞索引的分時(shí)段增量數(shù)據(jù)合并為用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。
為了實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種廣告信息檢索方法,包括記錄日志信息,生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟;根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù),得到用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表的步驟;根據(jù)用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引信息的步驟。
在生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)時(shí),對日志信息進(jìn)行預(yù)處理,實(shí)時(shí)分析日志信息,抽取查詢串,生成預(yù)處理數(shù)據(jù),該預(yù)處理數(shù)據(jù)包括用戶標(biāo)識信息及查詢串。實(shí)時(shí)對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。定時(shí)將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)與用戶標(biāo)識關(guān)鍵詞索引歷史庫中的用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并,并存儲于用戶標(biāo)識關(guān)鍵詞索引歷史庫中。
所述用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)可包括關(guān)鍵詞的權(quán)值信息。當(dāng)將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)合并入用戶標(biāo)識關(guān)鍵詞索引歷史庫時(shí),可執(zhí)行以下步驟步驟121、將用戶標(biāo)識關(guān)鍵詞索引歷史庫中各關(guān)鍵詞的權(quán)值乘以衰減因子;步驟122、提取用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中待合并的第一個(gè)用戶標(biāo)識;步驟123、判斷用戶標(biāo)識關(guān)鍵詞索引歷史庫中是否存在該用戶標(biāo)識,若存在,執(zhí)行步驟124,否則,執(zhí)行步驟125;步驟124、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表并入用戶標(biāo)識關(guān)鍵詞索引歷史庫中相應(yīng)關(guān)鍵詞列表,執(zhí)行步驟126;步驟125、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表插入用戶標(biāo)識關(guān)鍵詞索引歷史庫中;步驟126、判斷是否存在待合并的用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù),若存在,執(zhí)行步驟122,否則執(zhí)行步驟127;步驟127、結(jié)束。
在將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表并入用戶標(biāo)識關(guān)鍵詞索引歷史庫中相應(yīng)關(guān)鍵詞列表時(shí),可執(zhí)行以下步驟步驟1241、訪問用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表中待合并的第一個(gè)關(guān)鍵詞;步驟1242、判斷該關(guān)鍵詞是否存在于用戶標(biāo)識關(guān)鍵詞索引歷史庫相應(yīng)關(guān)鍵詞列表中,若是,執(zhí)行步驟1243,否則,執(zhí)行步驟1244;步驟1243、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中該關(guān)鍵詞的權(quán)值累加在用戶標(biāo)識關(guān)鍵詞索引歷史庫與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表的相應(yīng)關(guān)鍵詞權(quán)值上;步驟1244、將該關(guān)鍵詞插入用戶標(biāo)識關(guān)鍵詞索引歷史庫與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,權(quán)值與用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中的權(quán)值相同;步驟1245、判斷是否存在待合并的關(guān)鍵詞,若存在,執(zhí)行步驟1242;否則,執(zhí)行步驟126。
在檢索用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)時(shí),可只檢索歷史數(shù)據(jù),也可結(jié)合增量數(shù)據(jù)和歷史數(shù)據(jù)共同檢索,還可結(jié)合當(dāng)前檢索請求中的查詢串得到關(guān)鍵詞,并將關(guān)鍵詞并入檢索得到的關(guān)鍵詞列表中。
在檢索關(guān)鍵詞廣告索引庫,生成關(guān)鍵詞廣告索引檢索結(jié)果時(shí),可執(zhí)行以下步驟步驟111、針對與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,在關(guān)鍵詞廣告索引庫中查找并讀取各關(guān)鍵詞對應(yīng)的廣告索引列表;步驟112、將廣告索引列表合并,得到與用戶標(biāo)識對應(yīng)的總廣告索引列表;步驟113、生成廣告檢索結(jié)果頁面。
在合并廣告索引列表時(shí),可根據(jù)關(guān)鍵詞的權(quán)值,計(jì)算廣告索引的權(quán)值。當(dāng)一個(gè)廣告索引與多個(gè)關(guān)鍵詞相對應(yīng)時(shí),將多個(gè)關(guān)鍵詞權(quán)值累加,得到該廣告索引的權(quán)值。得到總廣告索引列表后,按照廣告索引權(quán)值由高至低的順序排列總廣告索引列表中的廣告索引,從而廣告檢索結(jié)果中,排在第一位的廣告索引為權(quán)值最大,與用戶最相關(guān)的廣告索引。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了另一種廣告信息檢索系統(tǒng),包括日志分析子系統(tǒng),用于記錄、分析用戶的訪問日志,生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù);索引子系統(tǒng),與所述日志分析子系統(tǒng)連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù),并根據(jù)關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成用戶標(biāo)識廣告索引數(shù)據(jù);檢索子系統(tǒng),與所述日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求中的用戶標(biāo)識檢索用戶標(biāo)識廣告索引數(shù)據(jù),得到匹配的廣告索引信息。
日志分析子系統(tǒng)包括日志分析設(shè)備,日志分析設(shè)備包括日志信息庫,用于存儲日志信息;日志記錄模塊,與所述日志信息庫連接,用于接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理庫,用于存儲日志預(yù)處理數(shù)據(jù),該日志預(yù)處理數(shù)據(jù)包括用戶標(biāo)識查詢串?dāng)?shù)據(jù);日志預(yù)處理模塊,與所述日志信息庫及日志預(yù)處理庫連接,用于分析日志信息,抽取查詢串,生成日志預(yù)處理數(shù)據(jù)并存儲于日志預(yù)處理庫中;關(guān)鍵詞用戶標(biāo)識索引庫,用于存儲關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù);關(guān)鍵詞用戶標(biāo)識索引生成模塊,與所述日志預(yù)處理庫及關(guān)鍵詞用戶標(biāo)識索引庫連接,用于根據(jù)日志預(yù)處理數(shù)據(jù)生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)并存儲于關(guān)鍵詞用戶標(biāo)識索引庫中。
索引子系統(tǒng)包括索引設(shè)備,索引設(shè)備可包括廣告關(guān)鍵詞索引庫,用于存儲廣告關(guān)鍵詞索引數(shù)據(jù);廣告關(guān)鍵詞索引生成模塊,與所述廣告關(guān)鍵詞索引庫連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù)并存儲于廣告關(guān)鍵詞索引庫中;關(guān)鍵詞用戶標(biāo)識索引歷史庫,用于存儲關(guān)鍵詞用戶標(biāo)識索引歷史數(shù)據(jù);關(guān)鍵詞用戶標(biāo)識索引歷史庫生成模塊,與所述關(guān)鍵詞用戶標(biāo)識索引庫及關(guān)鍵詞用戶標(biāo)識索引歷史庫連接,用于將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)合并到關(guān)鍵詞用戶標(biāo)識索引歷史庫中;用戶標(biāo)識廣告索引庫,用于存儲用戶標(biāo)識廣告索引數(shù)據(jù);用戶標(biāo)識廣告索引生成模塊,與所述廣告關(guān)鍵詞索引庫及關(guān)鍵詞用戶標(biāo)識索引庫連接,用于生成用戶標(biāo)識廣告索引數(shù)據(jù)并存儲于用戶標(biāo)識廣告索引庫中。
檢索子系統(tǒng)包括檢索設(shè)備,檢索設(shè)備可包括WEB服務(wù)模塊,用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊,與所述WEB服務(wù)模塊連接,用于接收檢索請求,生成廣告檢索結(jié)果頁面;廣告匹配模塊,與關(guān)鍵詞廣告索引庫連接,用于根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識廣告索引庫,得到匹配的廣告索引數(shù)據(jù)并發(fā)送至用戶接口模塊。
每一子系統(tǒng)中均可包括一臺或多臺相應(yīng)設(shè)備,當(dāng)包括多臺相應(yīng)設(shè)備時(shí),每一設(shè)備根據(jù)預(yù)先設(shè)定的分組,對部分用戶標(biāo)識的數(shù)據(jù)進(jìn)行處理。
為了實(shí)現(xiàn)上述目的,本發(fā)明又提供了另一種廣告信息檢索方法,包括
記錄日志信息,生成用戶標(biāo)識廣告索引數(shù)據(jù)的步驟;根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識廣告索引數(shù)據(jù),得到用戶標(biāo)識對應(yīng)的廣告索引列表的步驟。
在生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)時(shí),可先根據(jù)日志信息,生成關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù);然后根據(jù)關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成用戶標(biāo)識廣告索引數(shù)據(jù)。
本發(fā)明實(shí)現(xiàn)了對用戶訪問行為進(jìn)行記錄,并利用Cookie用戶標(biāo)識建立索引,基于用戶歷史行為匹配廣告,使廣告能為用戶提供能為有用的信息。在用戶個(gè)性化服務(wù)和客戶廣告定向投放的準(zhǔn)確度、覆蓋度和實(shí)時(shí)性等方面具有很大的優(yōu)越性。
下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
圖1為本發(fā)明的一種廣告信息檢索系統(tǒng)結(jié)構(gòu)示意圖;圖2為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖;圖3為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備另一具體實(shí)施例結(jié)構(gòu)示意圖;圖4為本發(fā)明的一種廣告信息檢索系統(tǒng)的索引設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖;圖5為本發(fā)明的一種廣告信息檢索系統(tǒng)的檢索設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖;圖6為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備再一具體實(shí)施例結(jié)構(gòu)示意圖;圖7為本發(fā)明的一種廣告信息檢索系統(tǒng)一具體實(shí)施例結(jié)構(gòu)示意圖;圖8為本發(fā)明的一種廣告信息檢索方法流程圖;
圖9為本發(fā)明的一種廣告信息檢索方法的廣告匹配的方法流程圖;圖10為本發(fā)明的一種廣告信息檢索方法的Cookie關(guān)鍵詞索引增量數(shù)據(jù)合并入Cookie關(guān)鍵詞索引歷史庫的方法流程圖;圖11為本發(fā)明的一種廣告信息檢索方法的增量數(shù)據(jù)關(guān)鍵詞列表合并入Cookie關(guān)鍵詞索引歷史庫關(guān)鍵詞列表的方法流程圖;圖12為本發(fā)明的一種廣告信息檢索方法的廣告列表合并方法流程圖;圖13為本發(fā)明的另一種廣告信息檢索方法流程圖;圖14為本發(fā)明的另一種廣告信息檢索系統(tǒng)的日志分析設(shè)備一具體實(shí)施例的結(jié)構(gòu)示意圖;圖15為本發(fā)明的另一種廣告信息檢索方法的在內(nèi)存中生成關(guān)鍵詞Cookie索引數(shù)據(jù)的方法流程圖;圖16為本發(fā)明的另一種廣告信息檢索方法的將內(nèi)存中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)與關(guān)鍵詞Cookie索引庫中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)進(jìn)行合并的方法流程圖;圖17為本發(fā)明的另一種廣告信息檢索系統(tǒng)的索引設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖;圖18為本發(fā)明的另一種廣告信息檢索方法的將關(guān)鍵詞Cookie索引增量數(shù)據(jù)與Cookie關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并的方法流程圖;圖19為本發(fā)明的另一種廣告信息檢索方法的根據(jù)關(guān)鍵詞Cookie索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成Cookie廣告索引數(shù)據(jù)的方法流程圖;圖20為本發(fā)明的另一種廣告信息檢索方法的根據(jù)各廣告索引對應(yīng)的總Cookie列表建立Cookie廣告索引數(shù)據(jù)的方法流程21為本發(fā)明的另一種廣告信息檢索系統(tǒng)的檢索設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖;圖22為本發(fā)明的另一種廣告信息檢索系統(tǒng)一具體實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施例方式
一個(gè)大型互聯(lián)網(wǎng)搜索引擎在給大量用戶提供搜索服務(wù)的同時(shí),積累了海量的關(guān)于用戶的搜索行為信息。利用這些搜索行為信息可以改進(jìn)搜索引擎,為用戶和客戶提供更高質(zhì)量的搜索服務(wù)。
Cookie是Web服務(wù)器保存在用戶硬盤上的一段文本。Cookie允許一個(gè)Web站點(diǎn)在用戶的電腦上保存信息并且隨后再取回它。Cookie中存儲有WEB網(wǎng)站分配給用戶的唯一標(biāo)識信息,本發(fā)明的廣告信息檢索系統(tǒng),收集和分析互聯(lián)網(wǎng)搜索引擎的查詢和點(diǎn)擊日志,記錄Cookie中的用戶標(biāo)識及其所對應(yīng)的用戶在一段時(shí)間內(nèi)的搜索點(diǎn)擊瀏覽行為,建立索引,根據(jù)用戶歷史行為匹配廣告信息。為了敘述方便,以下將用戶標(biāo)識稱為Cookie,并將由A到B的索引數(shù)據(jù)成為AB索引,例如,從Cookie到關(guān)鍵詞的索引稱為Cookie關(guān)鍵詞索引,從關(guān)鍵詞到廣告的索引稱為關(guān)鍵詞廣告索引,從廣告到關(guān)鍵詞的索引稱為廣告關(guān)鍵詞索引。
如圖1所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)結(jié)構(gòu)示意圖,包括日志分析子系統(tǒng)、索引子系統(tǒng)及檢索子系統(tǒng)。日志分析子系統(tǒng),用于記錄、分析用戶的訪問日志;索引子系統(tǒng),與日志分析子系統(tǒng)連接,用于生成Cookie關(guān)鍵詞索引及關(guān)鍵詞廣告索引;檢索子系統(tǒng),與日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求、Cookie關(guān)鍵詞索引庫及關(guān)鍵詞廣告索引庫匹配廣告信息。
日志分析子系統(tǒng)由日志分析設(shè)備構(gòu)成。如圖2所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖,包括日志信息庫、日志記錄模塊、日志預(yù)處理模塊及日志預(yù)處理庫。日志記錄模塊接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理模塊實(shí)時(shí)分析日志信息庫中的日志信息,抽取查詢串,生成日志預(yù)處理數(shù)據(jù),并將日志預(yù)處理數(shù)據(jù)存儲于日志預(yù)處理庫中。其中,日志預(yù)處理數(shù)據(jù)包括Cookie及查詢串。
日志分析設(shè)備可以為一臺或多臺。當(dāng)日志信息數(shù)據(jù)量大,訪問量大時(shí),可采用多臺日志分析設(shè)備。可將日志分析設(shè)備分為多組,每組日志分析設(shè)備記錄部分Cookie的日志信息。各設(shè)備IP地址不同,但映射為同一域名。對于一個(gè)檢索請求,可根據(jù)組數(shù)對Cookie進(jìn)行取模運(yùn)算,根據(jù)取模結(jié)果來選擇組,進(jìn)而選擇由哪臺日志分析設(shè)備記錄日志信息。為了防止及其故障時(shí),系統(tǒng)仍能正常工作,每組可設(shè)置2臺設(shè)備,一臺作為另一臺的備份。正常情況下,所有機(jī)器負(fù)載均衡。如果某一臺機(jī)器出現(xiàn)問題,則請求會轉(zhuǎn)移到同組的另一臺。
如圖3所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備另一具體實(shí)施例結(jié)構(gòu)示意圖。本實(shí)施例在上一實(shí)施例的基礎(chǔ)上加入了日志分發(fā)模塊,該模塊用于接收檢索請求,并根據(jù)檢索請求中的Cookie將檢索請求轉(zhuǎn)發(fā)至相應(yīng)的日志記錄模塊,從而可保證同一Cookie的日志信息記錄于一臺日志分析設(shè)備中,以便于索引的建立。
為了避免每天大規(guī)模的傳輸歷史庫造成的網(wǎng)絡(luò)開銷,由檢索設(shè)備負(fù)責(zé)Cookie關(guān)鍵詞索引歷史庫的生成。索引設(shè)備只生成Cookie關(guān)鍵詞索引增量數(shù)據(jù),根據(jù)數(shù)據(jù)量和系統(tǒng)的具體情況,索引子系統(tǒng)中的Cookie關(guān)鍵詞索引增量數(shù)據(jù)可以為半天的增量數(shù)據(jù),也可以為當(dāng)天、兩天、三天或一周的增量數(shù)據(jù)。
索引子系統(tǒng)由索引設(shè)備構(gòu)成,根據(jù)索引數(shù)據(jù)量的大小,索引設(shè)備可以為一臺或多臺。如圖4所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)的索引設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖,包括Cookie關(guān)鍵詞索引庫、Cookie關(guān)鍵詞索引生成模塊、關(guān)鍵詞廣告索引庫以及關(guān)鍵詞廣告索引生成模塊。Cookie關(guān)鍵詞索引庫存儲Cookie關(guān)鍵詞索引數(shù)據(jù),即存儲Cookie及相應(yīng)的關(guān)鍵詞信息;Cookie關(guān)鍵詞索引生成模塊與日志預(yù)處理庫及Cookie關(guān)鍵詞索引庫連接,生成Cookie關(guān)鍵詞索引增量數(shù)據(jù)并將Cookie關(guān)鍵詞索引增量數(shù)據(jù)存儲于Cookie關(guān)鍵詞索引庫中;關(guān)鍵詞廣告索引庫存儲關(guān)鍵詞廣告索引數(shù)據(jù),即存儲關(guān)鍵詞與廣告信息的對應(yīng)關(guān)系;關(guān)鍵詞廣告索引生成模塊,與關(guān)鍵詞廣告索引庫連接,用于生成關(guān)鍵詞廣告索引數(shù)據(jù)。
考慮到當(dāng)索引信息較多時(shí),可能將索引機(jī)分為多組,每組設(shè)備負(fù)責(zé)生成部分Cookie的Cookie關(guān)鍵詞索引增量數(shù)據(jù),每組的索引機(jī)器可以配置多臺,互為備份。為了使系統(tǒng)具有良好的可擴(kuò)展性,傳送模塊具有按分組分發(fā)數(shù)據(jù)的功能,在選擇分組時(shí),也可采用上述的根據(jù)組數(shù)對Cookie取模的方式,在此不再贅述。與傳送模塊相配合,索引設(shè)備中可設(shè)置一接收模塊,用于接收Cookie關(guān)鍵詞索引的分時(shí)段增量數(shù)據(jù)。
檢索子系統(tǒng)由檢索設(shè)備構(gòu)成,如圖5所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)的檢索設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖,包括WEB服務(wù)模塊、用戶接口模塊、Cookie關(guān)鍵詞索引歷史庫、Cookie關(guān)鍵詞索引歷史庫生成模塊及廣告匹配模塊。WEB服務(wù)模塊用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊與WEB服務(wù)模塊連接,用于接收WEB服務(wù)模塊轉(zhuǎn)發(fā)的檢索請求,并生成廣告檢索結(jié)果頁面;Cookie關(guān)鍵詞索引歷史庫存儲Cookie關(guān)鍵詞索引歷史數(shù)據(jù);Cookie關(guān)鍵詞索引歷史庫生成模塊與Cookie關(guān)鍵詞索引庫及Cookie關(guān)鍵詞索引歷史庫連接,將索引設(shè)備生成的Cookie關(guān)鍵詞索引增量數(shù)據(jù)合并到Cookie關(guān)鍵詞索引歷史庫中;廣告匹配模塊,與Cookie關(guān)鍵詞索引歷史庫及Cookie關(guān)鍵詞索引庫連接,根據(jù)檢索請求中的Cookie,檢索Cookie關(guān)鍵詞索引歷史庫,得到與Cookie對應(yīng)的關(guān)鍵詞列表,根據(jù)關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引列表,發(fā)送至用戶接口模塊。若Cookie對應(yīng)多個(gè)關(guān)鍵詞,那么會在關(guān)鍵詞廣告索引庫中檢索出多個(gè)廣告索引列表,此時(shí),要對多個(gè)列表合并,得到總廣告索引列表,并向用戶接口模塊發(fā)送。其中,廣告匹配模塊也可只檢索由于Cookie關(guān)鍵詞索引庫中的增量數(shù)據(jù)比Cookie關(guān)鍵詞索引歷史庫中的歷史數(shù)據(jù)更能反映用戶近期行為特點(diǎn),因此在匹配廣告信息時(shí),還可參考增量數(shù)據(jù),或?qū)深悢?shù)據(jù)綜合參考。因此,在檢索設(shè)備另一實(shí)施例中,廣告匹配模塊還與索引設(shè)備的Cookie關(guān)鍵詞索引庫連接,在接收到檢索請求時(shí),即檢索Cookie關(guān)鍵詞索引歷史數(shù)據(jù)又檢索增量數(shù)據(jù),根據(jù)兩個(gè)數(shù)據(jù)庫的檢索結(jié)果得到Cookie對應(yīng)的關(guān)鍵詞列表。
檢索設(shè)備可以為一臺或多臺,當(dāng)檢索設(shè)備為多臺時(shí),需要對檢索設(shè)備分組,每組設(shè)備只響應(yīng)部分檢索請求。WEB服務(wù)模塊接收到檢索請求后,根據(jù)Cookie將請求轉(zhuǎn)發(fā)到相應(yīng)的檢索設(shè)備,由相應(yīng)檢索設(shè)備進(jìn)行處理。
對于一個(gè)搜索引擎,每天有大量活躍的Cookie,所以為了避免索引子系統(tǒng)成為系統(tǒng)的瓶頸,由日志分析設(shè)備進(jìn)行部分的數(shù)據(jù)處理工作,生成分時(shí)段的Cookie關(guān)鍵詞索引增量數(shù)據(jù)。而索引設(shè)備只需將Cookie關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)合并為Cookie關(guān)鍵詞索引增量數(shù)據(jù),并傳送給檢索子系統(tǒng)即可。
如圖6所示,為本發(fā)明的一種廣告信息檢索系統(tǒng)的日志分析設(shè)備再一具體實(shí)施例結(jié)構(gòu)示意圖,本實(shí)施例進(jìn)一步加入了分時(shí)段增量生成模塊、分時(shí)段增量庫以及傳送模塊。分時(shí)段增量生成模塊與日志預(yù)處理庫連接,該模塊實(shí)時(shí)讀取日志預(yù)處理數(shù)據(jù),對查詢串切詞,得到關(guān)鍵詞,在內(nèi)存中記錄的Cookie與關(guān)鍵詞的對應(yīng)關(guān)系,定時(shí)轉(zhuǎn)儲到分時(shí)段增量庫中,生成Cookie關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù),并清空內(nèi)存。為了保證Cookie關(guān)鍵詞索引庫的及時(shí)更新,還在日志分析設(shè)備中設(shè)置一傳送模塊,專門用于向檢索設(shè)備發(fā)送Cookie關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù),只要關(guān)鍵詞分時(shí)段增量數(shù)據(jù)轉(zhuǎn)儲到分時(shí)段增量庫,傳送模塊就將分時(shí)段增量數(shù)據(jù)傳送到索引設(shè)備。
由于日志信息數(shù)據(jù)量比較大,Cookie查詢串索引數(shù)據(jù)(即Cookie與查詢串的對應(yīng)關(guān)系)相對較小,因此,可保存多天的Cookie查詢串索引數(shù)據(jù),當(dāng)系統(tǒng)崩潰、數(shù)據(jù)被破壞時(shí),Cookie查詢串索引數(shù)據(jù)可作為建立Cookie關(guān)鍵詞索引的數(shù)據(jù)源;并且,Cookie查詢串索引庫也可作對用戶行為進(jìn)行深層次分析的數(shù)據(jù)資源。
如圖7所示,為本發(fā)明的本發(fā)明的一種廣告信息檢索系統(tǒng)一具體實(shí)施例結(jié)構(gòu)示意圖。由日志分析子系統(tǒng)、索引子系統(tǒng)及檢索子系統(tǒng)組成。每一子系統(tǒng)包括一臺或多臺設(shè)備。日志分析設(shè)備包括上述的日志分發(fā)模塊、日志記錄模塊、日志信息庫、日志預(yù)處理模塊、日志預(yù)處理庫、分時(shí)段增量生成模塊、分時(shí)段增量庫及傳送模塊,并進(jìn)一步加入了Cookie查詢串索引庫及Cookie查詢串索引生成模塊。Cookie查詢串索引庫用于存儲Cookie查詢串索引數(shù)據(jù),在該查詢庫可查找與Cookie對應(yīng)的查詢串;Cookie查詢串索引生成模塊,與日志預(yù)處理庫及Cookie查詢串索引庫連接,用于生成Cookie查詢串索引數(shù)據(jù)并存儲至Cookie查詢串索引庫中。Cookie查詢串索引生成模塊可定時(shí)對實(shí)時(shí)生成的預(yù)處理數(shù)據(jù)進(jìn)行合并,生成定時(shí)預(yù)處理數(shù)據(jù),并存儲預(yù)定時(shí)間段內(nèi)的定時(shí)預(yù)處理數(shù)據(jù)。例如,每天在網(wǎng)站訪問低谷時(shí)段生成當(dāng)天的預(yù)處理數(shù)據(jù),存儲于Cookie查詢串索引庫中,基于數(shù)據(jù)安全性的考慮,可保存一段時(shí)間內(nèi)的查詢串?dāng)?shù)據(jù),例如保存若干天的查詢串?dāng)?shù)據(jù),這段時(shí)間前的查詢串?dāng)?shù)據(jù)被覆蓋。
為了減小檢索關(guān)鍵詞廣告索引庫和Cookie關(guān)鍵詞索引庫的網(wǎng)絡(luò)傳輸開銷,可在檢索子系統(tǒng)中存儲Cookie關(guān)鍵詞索引增量數(shù)據(jù)以及關(guān)鍵詞廣告索引數(shù)據(jù),這樣,在進(jìn)行廣告匹配時(shí),檢索設(shè)備在本地就可完成信息檢索,而不需再去訪問索引設(shè)備了。從而,在本實(shí)施例中,檢索設(shè)備除了包括WEB服務(wù)模塊、用戶接口模塊、廣告匹配模塊、Cookie關(guān)鍵詞索引歷史庫及Cookie關(guān)鍵詞索引歷史庫生成模塊外,進(jìn)一步包括了關(guān)鍵詞廣告索引庫及待合并Cookie關(guān)鍵詞索引庫。關(guān)鍵詞廣告索引庫用于存儲關(guān)鍵詞廣告索引數(shù)據(jù),其數(shù)據(jù)來源于檢索子系統(tǒng)的關(guān)鍵詞廣告索引庫,并且與該數(shù)據(jù)庫的數(shù)據(jù)保持一致。待合并Cookie關(guān)鍵詞索引庫用于存儲待并入Cookie關(guān)鍵詞索引歷史庫的Cookie關(guān)鍵詞索引增量數(shù)據(jù),其數(shù)據(jù)來源于索引設(shè)備的Cookie關(guān)鍵詞索引庫,Cookie關(guān)鍵詞索引歷史庫生成模塊定期將待合并Cookie關(guān)鍵詞索引庫中的Cookie關(guān)鍵詞索引增量數(shù)據(jù)合并到Cookie關(guān)鍵詞索引歷史庫中。例如,當(dāng)Cookie關(guān)鍵詞索引庫存儲的是當(dāng)天Cookie關(guān)鍵詞索引增量數(shù)據(jù)時(shí),可在每天網(wǎng)站訪問的低谷時(shí)段進(jìn)行Cookie關(guān)鍵詞索引數(shù)據(jù)的合并。
本實(shí)施例的索引設(shè)備除了包括Cookie關(guān)鍵詞索引生成模塊、Cookie關(guān)鍵詞索引庫、關(guān)鍵詞廣告索引生成模塊及關(guān)鍵詞廣告索引庫之外,進(jìn)一步包括了接收模塊和索引傳送模塊。接收模塊與日志分析設(shè)備的傳送模塊配合工作,接收Cookie關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)。索引傳送模塊與Cookie關(guān)鍵詞索引庫及關(guān)鍵詞廣告索引庫連接,用于定時(shí)向檢索設(shè)備傳送Cookie關(guān)鍵詞索引增量數(shù)據(jù),并在廣告庫更新時(shí)將關(guān)鍵詞廣告索引庫傳送到檢索設(shè)備。
基于數(shù)據(jù)安全性的考慮,可在索引設(shè)備中保留一定時(shí)間段內(nèi)的Cookie關(guān)鍵詞索引增量數(shù)據(jù),例如保留一段時(shí)間的當(dāng)天Cookie關(guān)鍵詞索引增量數(shù)據(jù),用于系統(tǒng)崩潰數(shù)據(jù)丟失情況下的Cookie關(guān)鍵詞索引歷史庫的重建。但是,在待合并Cookie關(guān)鍵詞索引庫中,只需保存需要合并入Cookie關(guān)鍵詞索引歷史庫的增量數(shù)據(jù)即可,例如,若每天進(jìn)行一次索引歷史數(shù)據(jù)的合并,那么只需在待合并Cookie關(guān)鍵詞索引歷史庫中存儲當(dāng)天的Cookie關(guān)鍵詞索引增量數(shù)據(jù)。
如圖8所示,為本發(fā)明的一種廣告信息檢索方法流程圖,包括如下步驟步驟11、記錄日志信息,生成Cookie關(guān)鍵詞索引數(shù)據(jù)的步驟;步驟12、根據(jù)檢索請求中的Cookie,檢索Cookie關(guān)鍵詞索引數(shù)據(jù),得到Cookie對應(yīng)的關(guān)鍵詞列表;步驟13、根據(jù)Cookie對應(yīng)的關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引信息。
當(dāng)存在多臺檢索設(shè)備時(shí),檢索設(shè)備的WEB服務(wù)器接收到檢索請求后,根據(jù)Cookie及檢索設(shè)備分組,將檢索請求發(fā)送至相應(yīng)的檢索設(shè)備。
如圖9所示,為本發(fā)明的一種廣告信息檢索方法的廣告匹配的方法流程圖,包括如下步驟步驟111、針對與Cookie對應(yīng)的關(guān)鍵詞列表,在關(guān)鍵詞廣告索引庫中查找并讀取相應(yīng)的廣告索引列表;步驟112、將廣告索引列表合并,得到與Cookie對應(yīng)的總廣告索引列表;步驟113、生成廣告檢索結(jié)果頁面。
在合并廣告索引列表時(shí),可直接將各列表合并,刪除重復(fù)的廣告信息,即可得到與Cookie對應(yīng)的廣告信息。
為了使廣告與用戶歷史行為更準(zhǔn)確地匹配,為用戶提供更為有效的信息,可為Cookie對應(yīng)的每個(gè)關(guān)鍵詞設(shè)置一個(gè)權(quán)值,并記錄于Cookie關(guān)鍵詞索引庫及Cookie關(guān)鍵詞索引歷史庫中,Cookie關(guān)鍵詞索引庫中權(quán)值大小與Cookie關(guān)鍵詞索引歷史庫中的權(quán)值可能不同。關(guān)鍵詞權(quán)值取決于相應(yīng)時(shí)間段內(nèi)用戶使用該關(guān)鍵詞的頻率,使用的時(shí)間及詞的屬性等信息。例如,當(dāng)Cookie關(guān)鍵詞索引庫記錄當(dāng)天增量數(shù)據(jù)時(shí),關(guān)鍵詞的權(quán)值取決于用戶當(dāng)天使用該詞的頻率、關(guān)鍵詞的屬性等信息;在Cookie關(guān)鍵詞索引歷史庫中,關(guān)鍵詞的權(quán)值還取決于訪問的時(shí)間,每次將Cookie關(guān)鍵詞索引增量數(shù)據(jù)并入Cookie關(guān)鍵詞索引歷史庫時(shí),都要將歷史庫所有關(guān)鍵詞的權(quán)值乘上一個(gè)衰減因子,若用戶長期沒有使用某個(gè)關(guān)鍵詞,那么該關(guān)鍵詞的權(quán)值會隨時(shí)間一直衰減;直到權(quán)值小于某個(gè)閾值時(shí),將該關(guān)鍵詞從歷史庫中刪除。
如圖10所示,為本發(fā)明的一種廣告信息檢索方法的將Cookie關(guān)鍵詞索引增量數(shù)據(jù)合并入Cookie關(guān)鍵詞索引歷史庫的方法流程圖,包括如下步驟步驟121、將Cookie關(guān)鍵詞索引歷史庫中各關(guān)鍵詞的權(quán)值乘以衰減因子;步驟122、提取增量數(shù)據(jù)中待合并的第一個(gè)Cookie;步驟123、判斷Cookie關(guān)鍵詞索引歷史庫中是否存在該Cookie,若存在,執(zhí)行步驟124,否則,執(zhí)行步驟125;步驟124、將Cookie關(guān)鍵詞索引增量數(shù)據(jù)中Cookie的關(guān)鍵詞列表并入Cookie關(guān)鍵詞索引歷史庫中相應(yīng)關(guān)鍵詞列表,執(zhí)行步驟126;步驟125、將Cookie關(guān)鍵詞索引增量數(shù)據(jù)中Cookie的關(guān)鍵詞列表插入Cookie關(guān)鍵詞索引歷史庫中;步驟126、判斷是否存在待合并的增量數(shù)據(jù),若存在,執(zhí)行步驟122,否則執(zhí)行步驟127;步驟127、結(jié)束。
若Cookie關(guān)鍵詞索引歷史庫中存在當(dāng)前Cookie,在步驟124中,將增量數(shù)據(jù)中關(guān)鍵詞列表并入Cookie關(guān)鍵詞索引歷史庫中相應(yīng)關(guān)鍵詞列表時(shí),可順序?qū)γ總€(gè)關(guān)鍵詞進(jìn)行處理,方法如圖11所示步驟1241、訪問增量數(shù)據(jù)中當(dāng)前Cookie的關(guān)鍵詞列表中待合并的第一個(gè)關(guān)鍵詞;步驟1242、判斷該關(guān)鍵詞是否存在于歷史庫相應(yīng)關(guān)鍵詞列表中,若是,執(zhí)行步驟1243,否則,執(zhí)行步驟1244;步驟1243、將增量數(shù)據(jù)中該關(guān)鍵詞的權(quán)值累加在歷史庫當(dāng)前Cookie的關(guān)鍵詞列表的相應(yīng)關(guān)鍵詞權(quán)值上;步驟1244、將該關(guān)鍵詞插入歷史庫當(dāng)前Cookie的關(guān)鍵詞列表,權(quán)值與增量數(shù)據(jù)中的權(quán)值相同;步驟1245、判斷是否存在待合并的關(guān)鍵詞,若存在,執(zhí)行步驟1242;否則,執(zhí)行步驟126。
當(dāng)為關(guān)鍵詞設(shè)置了權(quán)值后,可將Cookie對應(yīng)的關(guān)鍵詞按權(quán)值排序。在對各廣告列表合并時(shí),根據(jù)關(guān)鍵詞權(quán)值計(jì)算每個(gè)廣告的權(quán)值,當(dāng)一個(gè)廣告對應(yīng)多個(gè)關(guān)鍵詞時(shí),可將多個(gè)關(guān)鍵詞的權(quán)值累加,得到廣告的權(quán)值,合并方法如圖12所示步驟131、建立總廣告索引列表,用于記錄已處理的關(guān)鍵詞廣告索引信息以及關(guān)鍵詞廣告索引的權(quán)值;建立一標(biāo)號數(shù)組,用于記錄已處理的廣告標(biāo)號及廣告索引在總廣告索引列表中的位置;步驟132、訪問第一個(gè)待合并的廣告列表;步驟133、訪問第一個(gè)待合并的廣告索引;步驟134、在標(biāo)號數(shù)組中查找是否包含廣告索引中的標(biāo)號,若存在,執(zhí)行步驟135,否則,執(zhí)行步驟136;步驟135、根據(jù)標(biāo)號對應(yīng)的位置,在總廣告索引列表中查找廣告索引,并將當(dāng)前廣告列表對應(yīng)的關(guān)鍵詞權(quán)值累加到總廣告索引列表中該廣告索引的權(quán)值上;步驟136、將廣告索引添加到總廣告索引列表中,將廣告標(biāo)號及廣告索引在總廣告索引列表的位置記錄于標(biāo)號數(shù)組中;步驟137、判斷當(dāng)前廣告列表是否有未合并的廣告索引,若是,執(zhí)行步驟133,否則執(zhí)行步驟138;步驟138、判斷是否有未合并的廣告列表,若是,執(zhí)行步驟132,否則,執(zhí)行步驟139;步驟139、結(jié)束。
在執(zhí)行了步驟131-139后,總廣告索引列表中存放了與Cookie匹配的所有廣告索引信息以及相應(yīng)的權(quán)值,即得到了與檢索請求中的Cookie匹配的廣告。
還可進(jìn)一步對總廣告索引列表中的廣告索引按照權(quán)值排序,在返回的廣告檢索結(jié)果中按照權(quán)值從大到小的順序排列廣告索引,排在最前面的廣告索引是與用戶最相關(guān)的廣告。
在根據(jù)Cookie確定關(guān)鍵詞時(shí),可檢索Cookie關(guān)鍵詞索引歷史庫,根據(jù)用戶在當(dāng)天以前的歷史數(shù)據(jù)匹配廣告信息;也可既檢索Cookie關(guān)鍵詞索引歷史庫,又檢索存儲有Cookie關(guān)鍵詞索引增量數(shù)據(jù)的待合并Cookie關(guān)鍵詞索引庫,在得到Cookie在兩個(gè)數(shù)據(jù)庫中的關(guān)鍵詞列表后,先對兩關(guān)鍵詞列表進(jìn)行合并,得到一個(gè)既能體現(xiàn)用戶當(dāng)前時(shí)間段行為特征又能體現(xiàn)用戶歷史行為特征的關(guān)鍵詞列表。在既檢索Cookie關(guān)鍵詞索引歷史庫又檢索待合并Cookie關(guān)鍵詞索引庫時(shí),關(guān)鍵詞的權(quán)值計(jì)算方法可參照將增量數(shù)據(jù)并入Cookie關(guān)鍵詞索引歷史庫的權(quán)值計(jì)算方法,假設(shè)Cookie在待合并Cookie關(guān)鍵詞索引庫中的索引列表稱為列表1,在Cookie關(guān)鍵詞索引歷史庫中的索引列表為索引列表2,那么先建立一個(gè)空的列表3,將索引列表2的信息復(fù)制到列表3中,列表3中各關(guān)鍵詞權(quán)值乘以衰減因子;順序訪問列表1中的每一個(gè)關(guān)鍵詞,若列表3中存在該關(guān)鍵詞,則將列表1中的關(guān)鍵詞權(quán)值累加到列表3的關(guān)鍵詞權(quán)值上,若不存在,則在列表3中插入該關(guān)鍵詞,并記錄列表1中的關(guān)鍵詞權(quán)值;當(dāng)列表1中的關(guān)鍵詞全部處理完畢后,列表3中記錄著列表1和列表2的合并結(jié)果,即Cookie對應(yīng)的關(guān)鍵詞信息,該信息即可反映用戶的當(dāng)天行為特征又可反映用戶的歷史行為特征。
在根據(jù)Cookie確定關(guān)鍵詞時(shí),還可考慮用戶當(dāng)前查詢的關(guān)鍵詞,根據(jù)關(guān)鍵詞屬性等信息為該關(guān)鍵詞設(shè)置一個(gè)權(quán)值,然后將該關(guān)鍵詞及權(quán)值合并到檢索出的關(guān)鍵詞中;在合并時(shí),若關(guān)鍵詞列表中沒有這個(gè)關(guān)鍵詞,那么直接將這個(gè)關(guān)鍵詞及權(quán)值信息插入關(guān)鍵詞列表中,若關(guān)鍵詞列表中有這個(gè)關(guān)鍵詞,則將當(dāng)前關(guān)鍵詞權(quán)值累加到關(guān)鍵詞列表中的權(quán)值上。
在Cookie關(guān)鍵詞索引歷史庫中存儲的各Cookie中,可能有部分Cookie并不經(jīng)常訪問該網(wǎng)站,或者有些Cookie只在某一時(shí)間內(nèi)段內(nèi)對一些關(guān)鍵詞的相關(guān)信息感興趣,若對這些長時(shí)間沒有使用的Cookie或者關(guān)鍵詞進(jìn)行長期的保存無疑會浪費(fèi)存儲空間,因此可在將索引增量數(shù)據(jù)合并入進(jìn)行歷史庫時(shí),對各關(guān)鍵詞的權(quán)值進(jìn)行搜索,刪除權(quán)值小于預(yù)定閾值的關(guān)鍵詞,并且,若某個(gè)Cookie的關(guān)鍵詞均被刪除了,說明該Cookie長期沒有訪問過網(wǎng)站,那么將該Cookie也刪除。
上述的廣告信息檢索系統(tǒng)及廣告信息檢索方法是根據(jù)用戶訪問日志建立Cookie關(guān)鍵詞索引,Cookie與關(guān)鍵詞的對應(yīng)關(guān)系還可以另一種索引方式來記錄,即關(guān)鍵詞Cookie索引。當(dāng)建立了關(guān)鍵詞Cookie索引后,可根據(jù)廣告關(guān)鍵詞索引數(shù)據(jù)確定廣告索引對應(yīng)的關(guān)鍵詞列表,進(jìn)而利用關(guān)鍵詞Cookie索引數(shù)據(jù)確定廣告的投放用戶群,并根據(jù)廣告Cookie索引建立其倒排索引,即Cookie廣告索引,從而在用戶訪問網(wǎng)站時(shí),可根據(jù)Cookie查詢Cookie廣告索引,確定向用戶播放的廣告。
本發(fā)明的另一種廣告信息檢索系統(tǒng)結(jié)構(gòu)示意圖同樣如圖1所示,包括日志分析子系統(tǒng)、索引子系統(tǒng)及檢索子系統(tǒng)。但各子系統(tǒng)的功能與上述的廣告信息檢索系統(tǒng)相應(yīng)子系統(tǒng)的功能有所不同。本廣告信息檢索系統(tǒng)中,日志分析子系統(tǒng)用于記錄、分析用戶的訪問日志,生成關(guān)鍵詞Cookie索引增量數(shù)據(jù);索引子系統(tǒng),與所述日志分析子系統(tǒng)連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù),并根據(jù)關(guān)鍵詞Cookie索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成Cookie廣告索引數(shù)據(jù);檢索子系統(tǒng),與所述日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求中的Cookie檢索Cookie廣告索引數(shù)據(jù),得到匹配的廣告索引信息。
與前述的廣告信息檢索系統(tǒng)相似,每一子系統(tǒng)均可包括一臺或多臺相應(yīng)的設(shè)備,但各設(shè)備的功能與前述廣告信息檢索系統(tǒng)相應(yīng)設(shè)備的功能有所不同。
如圖13所示,為本發(fā)明的另一種廣告信息檢索方法流程圖,包括如下步驟步驟21、記錄日志信息,生成Cookie廣告索引數(shù)據(jù);步驟22、根據(jù)檢索請求中的Cookie,檢索Cookie廣告索引數(shù)據(jù),得到Cookie對應(yīng)的廣告索引列表。
日志分析設(shè)備記錄日志信息,并對日志進(jìn)行分析處理,生成關(guān)鍵詞Cookie索引增量數(shù)據(jù)。索引設(shè)備建立廣告關(guān)鍵詞索引,定時(shí)將關(guān)鍵詞Cookie索引增量并入Cookie關(guān)鍵詞索引歷史數(shù)據(jù)中,并根據(jù)廣告關(guān)鍵詞索引數(shù)據(jù)及關(guān)鍵詞Cookie索引歷史數(shù)據(jù)生成廣告Cookie索引數(shù)據(jù),并進(jìn)而生成Cookie廣告索引數(shù)據(jù)。檢索設(shè)備在接收到檢索請求后,根據(jù)檢索請求中的Cookie查詢Cookie廣告索引數(shù)據(jù),得到播放的廣告索引數(shù)據(jù)。
如圖14所示,為本發(fā)明的另一種廣告信息檢索系統(tǒng)的日志分析設(shè)備一具體實(shí)施例的結(jié)構(gòu)示意圖,包括日志信息庫、日志記錄模塊、日志預(yù)處理庫、日志預(yù)處理模塊、關(guān)鍵詞Cookie索引庫以及關(guān)鍵詞Cookie索引生成模塊。日志信息庫用于存儲日志信息;日志記錄模塊與日志信息庫連接,用于接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理庫用于存儲日志預(yù)處理數(shù)據(jù),該日志預(yù)處理數(shù)據(jù)包括Cookie及查詢串?dāng)?shù)據(jù);日志預(yù)處理模塊,與日志信息庫及日志預(yù)處理庫連接,用于分析日志信息,抽取查詢串,生成日志預(yù)處理數(shù)據(jù)并存儲于日志預(yù)處理庫中;關(guān)鍵詞Cookie索引庫用于存儲關(guān)鍵詞Cookie索引數(shù)據(jù);關(guān)鍵詞Cookie索引生成模塊,與日志預(yù)處理庫及關(guān)鍵詞Cookie索引庫連接,用于根據(jù)日志預(yù)處理數(shù)據(jù)生成關(guān)鍵詞Cookie索引增量數(shù)據(jù)并存儲于關(guān)鍵詞Cookie索引庫中。
當(dāng)日志分析設(shè)備為多臺時(shí),可將日志分析設(shè)備分為多組,每一日志分析設(shè)備根據(jù)分組,記錄和分析部分Cookie的日志信息,生成包括部分Cookie的關(guān)鍵詞Cookie索引數(shù)據(jù)。此時(shí),日志分析設(shè)備應(yīng)具有根據(jù)檢索請求選擇設(shè)備的功能,即根據(jù)檢索請求中的Cookie,將檢索請求發(fā)送至相應(yīng)的日志分析設(shè)備處理。在本發(fā)明的另一種廣告信息檢索系統(tǒng)的日志分析設(shè)備另一具體實(shí)施例中,該設(shè)備還包括日志分發(fā)模塊,該日志分發(fā)模塊用于接收檢索請求,并根據(jù)檢索請求中的Cookie將檢索請求轉(zhuǎn)發(fā)至相應(yīng)的日志記錄模塊,從而可保證同一Cookie的日志信息記錄于一臺日志分析設(shè)備中,以便索引的建立。
關(guān)鍵詞Cookie索引生成模塊對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,生成關(guān)鍵詞Cookie索引增量數(shù)據(jù)。該模塊可實(shí)施監(jiān)控并讀取日志預(yù)處理庫不斷增加的預(yù)處理數(shù)據(jù)并在內(nèi)存中生成關(guān)鍵詞Cookie索引數(shù)據(jù)。關(guān)鍵詞Cookie模塊首先創(chuàng)建關(guān)鍵詞詞典、Cookie詞典并分配Cookie屬性存儲空間和關(guān)鍵詞cookie索引空間。如圖15所示,為本發(fā)明的另一種廣告信息檢索方法的在內(nèi)存中生成關(guān)鍵詞Cookie索引數(shù)據(jù)的方法流程圖,包括如下步驟步驟211、讀入一行日志記錄;步驟212、提取日志記錄中的Cookie,在內(nèi)存中的Cookie詞典中查找是否存在該Cookie,若存在,執(zhí)行步驟214,否則,執(zhí)行步驟213;步驟213、在內(nèi)存中的Cookie詞典中插入該Cookie,并存儲日志記錄中Cookie的屬性;步驟214、對日志記錄的查詢串進(jìn)行切詞,在內(nèi)存中的關(guān)鍵詞詞典中查找是否存在切詞結(jié)果,若存在,執(zhí)行步驟216,否則,執(zhí)行步驟215;步驟215、在內(nèi)存中的關(guān)鍵詞詞典中插入切詞結(jié)果;步驟216、順序?qū)η性~結(jié)果中的各關(guān)鍵詞進(jìn)行處理,若關(guān)鍵詞的Cookie列表中存在當(dāng)前Cookie,則更新Cookie信息,若不存在,則插入Cookie信息。
為了對Cookie與關(guān)鍵詞及廣告的相關(guān)性進(jìn)行衡量,根據(jù)預(yù)先定義的規(guī)則為切詞結(jié)果中的每一關(guān)鍵詞設(shè)置以權(quán)值。在確定權(quán)值時(shí)可考慮關(guān)鍵詞在廣告庫中出現(xiàn)的頻率及切詞類型等因素。
在更新Cookie信息時(shí),根據(jù)當(dāng)前日志活動時(shí)間更新Cookie活動時(shí)間,并合并權(quán)值。在向關(guān)鍵詞對應(yīng)的用戶列表插入Cookie時(shí),將Cookie屬性信息的存儲位置、當(dāng)前日志活動時(shí)間及權(quán)值進(jìn)行封裝,按照Cookie升序插入Cookie列表。
當(dāng)讀取到內(nèi)存的數(shù)據(jù)記錄達(dá)到一定數(shù)量(如Cookie數(shù)達(dá)3兆)或者自從上次合并數(shù)據(jù)以來經(jīng)歷了一定的時(shí)間(例如1個(gè)小時(shí)),關(guān)鍵詞Cookie索引生成模塊就將內(nèi)存中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)與關(guān)鍵詞Cookie索引庫中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)合并。如圖16所示,為本發(fā)明的另一種廣告信息檢索方法的將內(nèi)存中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)與關(guān)鍵詞Cookie索引庫中的關(guān)鍵詞Cookie索引增量數(shù)據(jù)進(jìn)行合并的方法流程圖,包括步驟221、遍歷讀入的關(guān)鍵詞Cookie索引庫關(guān)鍵詞詞典,對該關(guān)鍵詞詞典中的每一關(guān)鍵詞,在內(nèi)存中的關(guān)鍵詞詞典中查找,若查找到,則將內(nèi)存中該關(guān)鍵詞的Cookie列表與關(guān)鍵詞Cookie索引庫中該關(guān)鍵詞的Cookie列表合并,并在內(nèi)存中的關(guān)鍵詞詞典中刪除該關(guān)鍵詞;步驟222、遍歷內(nèi)存中的關(guān)鍵詞詞典,將每個(gè)關(guān)鍵詞插入關(guān)鍵詞Cookie索引庫關(guān)鍵詞詞典中,并將各關(guān)鍵詞的Cookie列表插入關(guān)鍵詞Cookie索引庫。
當(dāng)關(guān)鍵詞Cookie索引增量數(shù)據(jù)達(dá)到一定數(shù)量或到達(dá)某一指定的時(shí)間點(diǎn)時(shí),由索引設(shè)備將關(guān)鍵詞Cookie索引增量數(shù)據(jù)并入關(guān)鍵詞Cookie索引歷史數(shù)據(jù)。
如圖17所示,為本發(fā)明的另一種廣告信息檢索系統(tǒng)的索引設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖,包括廣告關(guān)鍵詞索引庫、廣告關(guān)鍵詞索引生成模塊、關(guān)鍵詞Cookie索引歷史庫、關(guān)鍵詞Cookie索引歷史庫生成模塊、Cookie廣告索引庫以及Cookie廣告索引生成模塊。廣告關(guān)鍵詞索引庫用于存儲廣告關(guān)鍵詞索引數(shù)據(jù);廣告關(guān)鍵詞索引生成模塊與廣告關(guān)鍵詞索引庫連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù)并存儲于廣告關(guān)鍵詞索引庫中;關(guān)鍵詞Cookie索引歷史庫用于存儲關(guān)鍵詞Cookie索引歷史數(shù)據(jù);關(guān)鍵詞Cookie索引歷史庫生成模塊,與關(guān)鍵詞Cookie索引庫及關(guān)鍵詞Cookie索引歷史庫連接,用于將關(guān)鍵詞Cookie索引增量數(shù)據(jù)合并到關(guān)鍵詞Cookie索引歷史庫中;Cookie廣告索引庫用于存儲Cookie廣告索引數(shù)據(jù);Cookie廣告索引生成模塊與廣告關(guān)鍵詞索引庫及關(guān)鍵詞Cookie索引庫連接,用于生成Cookie廣告索引數(shù)據(jù)并存儲于Cookie廣告索引庫中。
如圖18所示,為本發(fā)明的另一種廣告信息檢索方法的將關(guān)鍵詞Cookie索引增量數(shù)據(jù)與Cookie關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并的方法流程圖,包括步驟231、遍歷讀入的關(guān)鍵詞Cookie索引歷史庫關(guān)鍵詞詞典,對該關(guān)鍵詞詞典中的每一關(guān)鍵詞,在關(guān)鍵詞Cookie索引庫關(guān)鍵詞詞典中查找,若查找到,則將關(guān)鍵詞Cookie索引庫該關(guān)鍵詞的Cookie列表與關(guān)鍵詞Cookie索引歷史庫中該關(guān)鍵詞的Cookie列表合并,并在關(guān)鍵詞Cookie索引庫的關(guān)鍵詞詞典中刪除該關(guān)鍵詞;在權(quán)值合并時(shí),與第一種廣告索引方法類似,可將索引歷史數(shù)據(jù)中的權(quán)值乘以衰減因子,使權(quán)值隨時(shí)間衰減。當(dāng)關(guān)鍵詞的用戶列表中Cookie對應(yīng)的權(quán)值小于預(yù)先設(shè)定的閾值或Cookie過期(如Cookie最近活動時(shí)間距當(dāng)前時(shí)間超過某預(yù)定天數(shù))時(shí),刪除該Cookie。
步驟232、遍歷關(guān)鍵詞Cookie索引庫的關(guān)鍵詞詞典,將每個(gè)關(guān)鍵詞插入關(guān)鍵詞Cookie索引歷史庫關(guān)鍵詞詞典中,并將各關(guān)鍵詞的Cookie列表插入關(guān)鍵詞Cookie索引歷史庫。
在合并Cookie時(shí),可采用2路歸并。在合并索引庫時(shí),可采用0/1目錄相互切換的方法。也就是說和0目錄中索引庫合并后的新索引庫會輸出到1目錄下,和1目錄中索引庫合并后的新索引庫會輸出到0目錄下,如此不斷循環(huán)更新。當(dāng)前使用的最新目錄號會更新在與0/1目錄統(tǒng)計(jì)的狀態(tài)文件中,供確定哪份目錄下的索引庫是最新的。
在得到關(guān)鍵詞Cookie索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)后,就可以建立Cookie廣告索引了。如圖19所示,為本發(fā)明的另一種廣告信息檢索方法的根據(jù)關(guān)鍵詞Cookie索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成Cookie廣告索引數(shù)據(jù)的方法流程圖,包括步驟241、遍歷廣告關(guān)鍵詞索引庫,對每一個(gè)廣告索引,提取對應(yīng)的關(guān)鍵詞列表,并根據(jù)每一個(gè)關(guān)鍵詞,從關(guān)鍵詞Cookie索引歷史庫中提取Cookie列表;將多個(gè)Cookie列表合并,得到該廣告索引對應(yīng)的總Cookie列表;步驟242、根據(jù)各廣告索引對應(yīng)的總Cookie列表建立Cookie廣告索引數(shù)據(jù)。
其中,如圖20所示,步驟242的根據(jù)各廣告索引對應(yīng)的總Cookie列表建立Cookie廣告索引數(shù)據(jù)的方法包括步驟2421、訪問待處理的第一個(gè)廣告索引;步驟2422、訪問該廣告索引對應(yīng)的待處理的第一個(gè)Cookie;步驟2423、判斷該Cookie是否存在于Cookie廣告索引庫中,若存在,執(zhí)行步驟2424,否則,執(zhí)行步驟2425;步驟2424、將廣告索引插入Cookie對應(yīng)的廣告索引列表中;步驟2425、在Cookie廣告索引庫中插入該Cookie,并將廣告索引置于Cookie的廣告索引列表的初始位置;步驟2426、判斷當(dāng)前用戶列表中是否存在待處理的Cookie,若存在,執(zhí)行步驟2422,否則,執(zhí)行步驟2427;步驟2427、判斷是否存在待處理的廣告索引,若存在,執(zhí)行步驟2421,否則,執(zhí)行步驟2428;步驟2428、結(jié)束。
每當(dāng)?shù)玫叫碌年P(guān)鍵詞Cookie索引歷史數(shù)據(jù)或新的廣告關(guān)鍵詞索引數(shù)據(jù)后,就可對Cookie廣告索引數(shù)據(jù)進(jìn)行更新。關(guān)鍵詞Cookie索引歷史數(shù)據(jù)變化引起的更新可執(zhí)行步驟2421-2428;廣告關(guān)鍵詞索引數(shù)據(jù)變化引起的更新需要生成新的廣告Cookie索引,然后再根據(jù)該索引生成Cookie廣告索引。為了便于廣告信息變化引起的更新,可存儲廣告Cookie索引數(shù)據(jù),即存儲每個(gè)廣告索引對應(yīng)的總Cookie列表。在更新時(shí),只需調(diào)整有變化的廣告的總Cookie列表。
得到Cookie廣告索引后,檢索設(shè)備就可根據(jù)檢索請求中的Cookie查詢對應(yīng)的廣告索引信息了。
如圖21所示,為本發(fā)明的另一種廣告信息檢索系統(tǒng)的檢索設(shè)備一具體實(shí)施例結(jié)構(gòu)示意圖,包括WEB服務(wù)模塊、用戶接口模塊及廣告匹配模塊。WEB服務(wù)模塊用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊與WEB服務(wù)模塊連接,用于接收檢索請求,生成廣告檢索結(jié)果頁面;廣告匹配模塊與關(guān)鍵詞廣告索引庫連接,用于根據(jù)檢索請求中的Cookie,檢索Cookie廣告索引庫,得到匹配的廣告索引數(shù)據(jù)并發(fā)送至用戶接口模塊。
由于日志信息數(shù)據(jù)量比較大,Cookie查詢串索引數(shù)據(jù)(即Cookie與查詢串的對應(yīng)關(guān)系)相對較小,因此,可保存多天的Cookie查詢串索引數(shù)據(jù),當(dāng)系統(tǒng)崩潰、數(shù)據(jù)被破壞時(shí),Cookie查詢串索引數(shù)據(jù)可作為建立Cookie關(guān)鍵詞索引的數(shù)據(jù)源;并且,Cookie查詢串索引庫也可作對用戶行為進(jìn)行深層次分析的數(shù)據(jù)資源。
如圖22所示,為本發(fā)明的另一種廣告信息檢索系統(tǒng)一具體實(shí)施例結(jié)構(gòu)示意圖。在本實(shí)施例中,日志分析設(shè)備除了包括日志信息庫、日志記錄模塊、日志預(yù)處理庫、日志預(yù)處理模塊、關(guān)鍵詞Cookie索引庫以及關(guān)鍵詞Cookie索引生成模塊之外,還加入了數(shù)據(jù)傳送模塊,專門用于向索引設(shè)備傳輸關(guān)鍵詞Cookie索引增量數(shù)據(jù),并加入了Cookie查詢串索引庫及Cookie查詢串索引生成模塊,Cookie查詢串索引庫用于存儲Cookie查詢串索引數(shù)據(jù),Cookie查詢串索引生成模塊與所述日志預(yù)處理庫及Cookie查詢串索引庫連接,用于生成Cookie查詢串索引數(shù)據(jù)并存儲于Cookie查詢串索引庫中。
索引設(shè)備除了包括廣告關(guān)鍵詞索引庫、廣告關(guān)鍵詞索引生成模塊、關(guān)鍵詞Cookie索引歷史庫、關(guān)鍵詞Cookie索引歷史庫生成模塊、Cookie廣告索引庫以及Cookie廣告索引生成模塊之外,還加入了與數(shù)據(jù)傳送模塊配合工作的數(shù)據(jù)接收模塊,并加入用于向檢索設(shè)備傳送Cookie廣告索引數(shù)據(jù)的索引傳送模塊。
檢索設(shè)備除了WEB服務(wù)模塊、用戶接口模塊及廣告匹配模塊之外,還加入了Cookie廣告索引庫,該索引庫中的數(shù)據(jù)與索引設(shè)備中的Cookie廣告索引庫一致,當(dāng)檢索設(shè)備保存有Cookie廣告索引數(shù)據(jù)后,在本地就可完成檢索,而不需再通過網(wǎng)絡(luò)訪問索引設(shè)備,從而可減小網(wǎng)絡(luò)開銷。
本發(fā)明使用信息檢索和搜索技術(shù)對用戶搜索行為數(shù)據(jù)直接建立索引提供查詢,在保持用戶搜索記錄多樣性和完整性的基礎(chǔ)上,以用戶以前所使用過的查詢詞作為對該用戶行為特征的直接描述。這樣的方法在用戶個(gè)性化服務(wù)和客戶廣告定向投放的準(zhǔn)確度、覆蓋度和實(shí)時(shí)性等方面具有很大的優(yōu)越性,無論對用戶和客戶都能產(chǎn)生更令人滿意的服務(wù)效果。
最后應(yīng)當(dāng)說明的是以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非對其限制;盡管參照較佳實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,依然可以對本發(fā)明的具體實(shí)施方式
進(jìn)行修改或者對部分技術(shù)特征進(jìn)行等同替換;而不脫離本發(fā)明技術(shù)方案的精神,其均應(yīng)涵蓋在本發(fā)明請求保護(hù)的技術(shù)方案范圍當(dāng)中。
權(quán)利要求
1.一種廣告信息檢索系統(tǒng),其中包括日志分析子系統(tǒng),用于記錄、分析用戶的訪問日志;索引子系統(tǒng),與所述日志分析子系統(tǒng)連接,用于生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)及關(guān)鍵詞廣告索引數(shù)據(jù);檢索子系統(tǒng),與所述日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求、用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)及關(guān)鍵詞廣告索引數(shù)據(jù)匹配廣告信息。
2.根據(jù)權(quán)利要求1所述的廣告信息檢索系統(tǒng),其中所述日志分析子系統(tǒng)包括日志分析設(shè)備,該日志分析設(shè)備包括日志信息庫,用于存儲日志信息;日志記錄模塊,與所述日志信息庫連接,用于接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理庫,用于存儲日志預(yù)處理數(shù)據(jù),該日志預(yù)處理數(shù)據(jù)包括用戶標(biāo)識查詢串?dāng)?shù)據(jù);日志預(yù)處理模塊,與所述日志信息庫及日志預(yù)處理庫連接,用于分析日志信息,抽取查詢串,生成預(yù)處理數(shù)據(jù)并存儲于日志預(yù)處理庫中。
3.根據(jù)權(quán)利要求2所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備為多臺,每一日志分析設(shè)備用于根據(jù)預(yù)先設(shè)定的分組,記錄和分析部分用戶標(biāo)識的日志信息。
4.根據(jù)權(quán)利要求3所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括日志分發(fā)模塊,該日志分發(fā)模塊用于接收檢索請求并根據(jù)檢索請求中的用戶標(biāo)識將檢索請求轉(zhuǎn)發(fā)至相應(yīng)的日志記錄模塊。
5.根據(jù)權(quán)利要求2至4任一所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括用戶標(biāo)識查詢串索引庫,用于存儲用戶標(biāo)識查詢串索引數(shù)據(jù);用戶標(biāo)識查詢串索引生成模塊,與所述日志預(yù)處理庫及用戶標(biāo)識查詢串索引庫連接,用于生成用戶標(biāo)識查詢串索引數(shù)據(jù)并將用戶標(biāo)識查詢串索引數(shù)據(jù)存儲于用戶標(biāo)識查詢串索引庫中。
6.根據(jù)權(quán)利要求2所述的廣告信息檢索系統(tǒng),其中所述索引子系統(tǒng)包括索引設(shè)備,該索引設(shè)備包括用戶標(biāo)識關(guān)鍵詞索引庫,用于存儲用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引生成模塊,與所述日志預(yù)處理庫及用戶標(biāo)識關(guān)鍵詞索引庫連接,用于生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)并將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)存儲于用戶標(biāo)識關(guān)鍵詞索引庫中;關(guān)鍵詞廣告索引庫,用于存儲關(guān)鍵詞廣告索引數(shù)據(jù);關(guān)鍵詞廣告索引生成模塊,與所述關(guān)鍵詞廣告索引庫連接,用于生成關(guān)鍵詞廣告索引數(shù)據(jù)并將關(guān)鍵詞廣告索引數(shù)據(jù)存儲于關(guān)鍵詞廣告索引庫中。
7.根據(jù)權(quán)利要求6所述的廣告信息檢索系統(tǒng),其中所述索引設(shè)備為多臺,每一索引設(shè)備用于根據(jù)預(yù)先設(shè)定的分組生成部分用戶標(biāo)識的用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)。
8.根據(jù)權(quán)利要求6所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括分時(shí)段增量生成模塊,與所述日志預(yù)處理庫連接,用于實(shí)時(shí)讀取日志預(yù)處理數(shù)據(jù),對查詢串切詞,得到關(guān)鍵詞,生成用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)并將用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)存儲于分時(shí)段增量庫中;分時(shí)段增量庫,與所述分時(shí)段增量生成模塊及用戶標(biāo)識關(guān)鍵詞索引生成模塊連接,用于存儲用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引生成模塊對用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)進(jìn)行合并,生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。
9.根據(jù)權(quán)利要求5所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括數(shù)據(jù)傳送模塊,所述索引設(shè)備還包括數(shù)據(jù)接收模塊;數(shù)據(jù)傳送模塊實(shí)時(shí)地將用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù)通過數(shù)據(jù)接收模塊發(fā)送至用戶標(biāo)識關(guān)鍵詞索引生成模塊。
10.根據(jù)權(quán)利要求6所述的廣告信息檢索系統(tǒng),其中所述索引設(shè)備還包括數(shù)據(jù)索引傳送模塊,與所述用戶標(biāo)識關(guān)鍵詞索引庫及關(guān)鍵詞廣告索引庫連接,用于向檢索子系統(tǒng)發(fā)送索引數(shù)據(jù)。
11.根據(jù)權(quán)利要求6所述的廣告信息檢索系統(tǒng),其中所述檢索子系統(tǒng)包括檢索設(shè)備,該檢索設(shè)備包括WEB服務(wù)模塊,用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊,與所述WEB服務(wù)模塊連接,用于接收檢索請求,生成廣告檢索結(jié)果頁面;用戶標(biāo)識關(guān)鍵詞索引歷史庫,用于存儲用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù);用戶標(biāo)識關(guān)鍵詞索引歷史庫生成模塊,與所述用戶標(biāo)識關(guān)鍵詞索引歷史庫連接,用于將用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)合并到用戶標(biāo)識關(guān)鍵詞索引歷史庫中;廣告匹配模塊,與關(guān)鍵詞廣告索引庫及用戶標(biāo)識關(guān)鍵詞索引歷史庫連接,用于根據(jù)檢索請求,檢索用戶標(biāo)識關(guān)鍵詞索引歷史庫,得到用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,根據(jù)關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引數(shù)據(jù)并發(fā)送至用戶接口模塊。
12.根據(jù)權(quán)利要求11所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備為多臺,每一檢索設(shè)備用于根據(jù)預(yù)先設(shè)定的分組記錄部分用戶標(biāo)識的用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù),響應(yīng)部分檢索請求。
13.根據(jù)權(quán)利要求11或12所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備還包括待合并用戶標(biāo)識關(guān)鍵詞索引庫,用于存儲待并入用戶標(biāo)識關(guān)鍵詞索引歷史庫的用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù),用戶標(biāo)識關(guān)鍵詞索引歷史庫生成模塊定時(shí)將待合并用戶標(biāo)識關(guān)鍵詞索引庫中的用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)合并到用戶標(biāo)識關(guān)鍵詞索引歷史庫中。
14.根據(jù)權(quán)利要求13所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備的廣告匹配模塊與待合并用戶標(biāo)識關(guān)鍵詞索引庫連接;所述廣告匹配模塊檢索用戶標(biāo)識關(guān)鍵詞索引歷史庫及待合并用戶標(biāo)識關(guān)鍵詞索引庫,得到用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表。
15.根據(jù)權(quán)利要求11或12所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備還包括關(guān)鍵詞廣告索引庫,與廣告匹配模塊連接,廣告匹配模塊在該關(guān)鍵詞廣告索引庫中檢索匹配的廣告索引信息。
16.一種廣告信息檢索方法,其中包括記錄日志信息,生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟;根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù),得到用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表的步驟;根據(jù)用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引信息的步驟。
17.根據(jù)權(quán)利要求16所述的廣告信息檢索方法,其中還包括接收到檢索請求的檢索設(shè)備根據(jù)用戶標(biāo)識及檢索設(shè)備分組,將檢索請求發(fā)送至相應(yīng)的檢索設(shè)備。
18.根據(jù)權(quán)利要求16所述的廣告信息檢索方法,其中所述的根據(jù)用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表檢索關(guān)鍵詞廣告索引庫,得到匹配的廣告索引信息的步驟具體為步驟111、針對與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,在關(guān)鍵詞廣告索引庫中查找并讀取各關(guān)鍵詞對應(yīng)的廣告索引列表;步驟112、將廣告索引列表合并,得到與用戶標(biāo)識對應(yīng)的總廣告索引列表;步驟113、生成廣告檢索結(jié)果頁面。
19.根據(jù)權(quán)利要求16所述的廣告信息檢索方法,其中所述的記錄日志信息的步驟具體為根據(jù)檢索請求中攜帶的用戶標(biāo)識選擇相應(yīng)的日志記錄模塊記錄日志信息。
20.根據(jù)權(quán)利要求16所述的廣告信息檢索方法,其中所述的生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟具體為根據(jù)日志信息,生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù),并存儲于用戶標(biāo)識關(guān)鍵詞索引庫中;定時(shí)將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)與用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并,并存儲于用戶標(biāo)識關(guān)鍵詞索引歷史庫中。
21.根據(jù)權(quán)利要求20所述的廣告信息檢索方法,其中還包括對日志信息進(jìn)行預(yù)處理,實(shí)時(shí)分析日志信息,抽取查詢串,生成預(yù)處理數(shù)據(jù),該預(yù)處理數(shù)據(jù)包括用戶標(biāo)識信息及查詢串。
22.根據(jù)權(quán)利要求20所述的廣告信息檢索方法,其中所述的生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)的步驟具體為實(shí)時(shí)對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。
23.根據(jù)權(quán)利要求20所述的廣告信息檢索方法,其中所述的生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)的步驟具體為實(shí)時(shí)對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,記錄用戶標(biāo)識與關(guān)鍵詞的映射關(guān)系,并定時(shí)轉(zhuǎn)儲到硬盤中,生成用戶標(biāo)識關(guān)鍵詞索引分時(shí)段增量數(shù)據(jù);對用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)分時(shí)段增量數(shù)據(jù)進(jìn)行合并,生成用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)。
24.根據(jù)權(quán)利要求15-23任一所述的廣告信息檢索方法,其中所述的檢索用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟具體為在用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)中檢索用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表。
25.根據(jù)權(quán)利要求15-23任一所述的廣告信息檢索方法,其中所述的檢索用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟具體為在用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)及用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中分別檢索用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,并將檢索出的關(guān)鍵詞列表合并。
26.根據(jù)權(quán)利要求25所述的廣告信息檢索方法,其中還包括從檢索請求中提取查詢串,對查詢串切詞得到查詢關(guān)鍵詞,根據(jù)預(yù)先設(shè)定的規(guī)則為查詢關(guān)鍵詞設(shè)置權(quán)值,將查詢關(guān)鍵詞合并入與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表中。
27.根據(jù)權(quán)利要求26所述的廣告信息檢索方法,其中所述步驟111具體為按照關(guān)鍵詞權(quán)值對關(guān)鍵詞排序,讀取各關(guān)鍵詞對應(yīng)的廣告索引列表。
28.根據(jù)權(quán)利要求26所述的廣告信息檢索方法,其中所述步驟112還包括根據(jù)關(guān)鍵詞的權(quán)值,計(jì)算廣告索引的權(quán)值。
29.根據(jù)權(quán)利要求28所述的廣告信息檢索方法,其中當(dāng)一個(gè)廣告索引與多個(gè)關(guān)鍵詞相對應(yīng)時(shí),將多個(gè)關(guān)鍵詞權(quán)值累加,得到該廣告索引的權(quán)值。
30.根據(jù)權(quán)利要求28所述的廣告信息檢索方法,其中所述步驟113還包括按照權(quán)值由高至低的順序排列總廣告索引列表中的廣告索引。
31.根據(jù)權(quán)利要求20所述的廣告信息檢索方法,其中還包括定時(shí)對實(shí)時(shí)生成的預(yù)處理數(shù)據(jù)進(jìn)行合并,生成用戶標(biāo)識查詢串索引數(shù)據(jù),并存儲預(yù)定時(shí)間段內(nèi)的用戶標(biāo)識查詢串索引數(shù)據(jù)。
32.根據(jù)權(quán)利要求19所述的廣告信息檢索方法,當(dāng)用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)包括關(guān)鍵詞權(quán)值信息時(shí),所述的將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)與索引歷史庫中的用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并的步驟具體為步驟121、將索引歷史庫中各關(guān)鍵詞的權(quán)值乘以衰減因子;步驟122、提取用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中待合并的第一個(gè)用戶標(biāo)識;步驟123、判斷索引歷史庫中是否存在該用戶標(biāo)識,若存在,執(zhí)行步驟124,否則,執(zhí)行步驟125;步驟124、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表并入索引歷史庫中相應(yīng)關(guān)鍵詞列表,執(zhí)行步驟126;步驟125、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表插入索引歷史庫中;步驟126、判斷是否存在待合并的用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù),若存在,執(zhí)行步驟122,否則執(zhí)行步驟127;步驟127、結(jié)束。
33.根據(jù)權(quán)利要求32所述的廣告信息檢索方法,其中所述步驟124具體為步驟1241、訪問用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表中待合并的第一個(gè)關(guān)鍵詞;步驟1242、判斷該關(guān)鍵詞是否存在于索引歷史庫相應(yīng)關(guān)鍵詞列表中,若是,執(zhí)行步驟1243,否則,執(zhí)行步驟1244;步驟1243、將用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中該關(guān)鍵詞的權(quán)值累加在索引歷史庫與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表的相應(yīng)關(guān)鍵詞權(quán)值上;步驟1244、將該關(guān)鍵詞插入索引歷史庫與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表,權(quán)值與用戶標(biāo)識關(guān)鍵詞索引增量數(shù)據(jù)中的權(quán)值相同;步驟1245、判斷是否存在待合并的關(guān)鍵詞,若存在,執(zhí)行步驟1242;否則,執(zhí)行步驟126。
34.根據(jù)權(quán)利要求32或33所述的廣告信息檢索方法,其中還包括刪除權(quán)值小于預(yù)先設(shè)置的閾值的關(guān)鍵詞。
35.根據(jù)權(quán)利要求34所述的廣告信息檢索方法,其中還包括當(dāng)與用戶標(biāo)識對應(yīng)的關(guān)鍵詞列表中不存在關(guān)鍵詞時(shí),刪除該用戶標(biāo)識。
36.一種廣告信息檢索系統(tǒng),其中包括日志分析子系統(tǒng),用于記錄、分析用戶的訪問日志,生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù);索引子系統(tǒng),與所述日志分析子系統(tǒng)連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù),并根據(jù)關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成用戶標(biāo)識廣告索引數(shù)據(jù);檢索子系統(tǒng),與所述日志分析子系統(tǒng)及索引子系統(tǒng)連接,用于根據(jù)檢索請求中的用戶標(biāo)識檢索用戶標(biāo)識廣告索引數(shù)據(jù),得到匹配的廣告索引信息。
37.根據(jù)權(quán)利要求36所述的廣告信息檢索系統(tǒng),其中所述日志分析子系統(tǒng)包括日志分析設(shè)備,該日志分析設(shè)備包括日志信息庫,用于存儲日志信息;日志記錄模塊,與所述日志信息庫連接,用于接收檢索請求,并將檢索請求記錄于日志信息庫中;日志預(yù)處理庫,用于存儲日志預(yù)處理數(shù)據(jù),該日志預(yù)處理數(shù)據(jù)包括用戶標(biāo)識查詢串?dāng)?shù)據(jù);日志預(yù)處理模塊,與所述日志信息庫及日志預(yù)處理庫連接,用于分析日志信息,抽取查詢串,生成日志預(yù)處理數(shù)據(jù)并存儲于日志預(yù)處理庫中;關(guān)鍵詞用戶標(biāo)識索引庫,用于存儲關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù);關(guān)鍵詞用戶標(biāo)識索引生成模塊,與所述日志預(yù)處理庫及關(guān)鍵詞用戶標(biāo)識索引庫連接,用于根據(jù)日志預(yù)處理數(shù)據(jù)生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)并將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)存儲于關(guān)鍵詞用戶標(biāo)識索引庫中。
38.根據(jù)權(quán)利要求37所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備為多臺,每一日志分析設(shè)備用于根據(jù)預(yù)先設(shè)定的分組,記錄和分析部分用戶標(biāo)識的日志信息并生成包括部分用戶標(biāo)識的關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)。
39.根據(jù)權(quán)利要求38所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括日志分發(fā)模塊,該日志分發(fā)模塊用于接收檢索請求并根據(jù)檢索請求中的用戶標(biāo)識將檢索請求轉(zhuǎn)發(fā)至相應(yīng)的日志記錄模塊。
40.根據(jù)權(quán)利要求36所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括用戶標(biāo)識查詢串索引庫,用于存儲用戶標(biāo)識查詢串索引數(shù)據(jù);用戶標(biāo)識查詢串索引生成模塊,與所述日志預(yù)處理庫及用戶標(biāo)識查詢串索引庫連接,用于生成用戶標(biāo)識查詢串索引數(shù)據(jù)并將用戶標(biāo)識查詢串索引數(shù)據(jù)存儲于用戶標(biāo)識查詢串索引庫中。
41.根據(jù)權(quán)利要求37-40任一所述的廣告信息檢索系統(tǒng),其中所述索引子系統(tǒng)包括索引設(shè)備,該索引設(shè)備包括廣告關(guān)鍵詞索引庫,用于存儲廣告關(guān)鍵詞索引數(shù)據(jù);廣告關(guān)鍵詞索引生成模塊,與所述廣告關(guān)鍵詞索引庫連接,用于生成廣告關(guān)鍵詞索引數(shù)據(jù)并將廣告關(guān)鍵詞索引數(shù)據(jù)存儲于廣告關(guān)鍵詞索引庫中;關(guān)鍵詞用戶標(biāo)識索引歷史庫,用于存儲關(guān)鍵詞用戶標(biāo)識索引歷史數(shù)據(jù);關(guān)鍵詞用戶標(biāo)識索引歷史庫生成模塊,與所述關(guān)鍵詞用戶標(biāo)識索引庫及關(guān)鍵詞用戶標(biāo)識索引歷史庫連接,用于將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)合并到關(guān)鍵詞用戶標(biāo)識索引歷史庫中;用戶標(biāo)識廣告索引庫,用于存儲用戶標(biāo)識廣告索引數(shù)據(jù);用戶標(biāo)識廣告索引生成模塊,與所述廣告關(guān)鍵詞索引庫及關(guān)鍵詞用戶標(biāo)識索引庫連接,用于生成用戶標(biāo)識廣告索引數(shù)據(jù)并將用戶標(biāo)識廣告索引數(shù)據(jù)存儲于用戶標(biāo)識廣告索引庫中。
42.根據(jù)權(quán)利要求41所述的廣告信息檢索系統(tǒng),其中所述索引設(shè)備為多臺,每一索引設(shè)備用于根據(jù)預(yù)先設(shè)定的分組生成包含部分用戶標(biāo)識的關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)。
43.根據(jù)權(quán)利要求41所述的廣告信息檢索系統(tǒng),其中所述日志分析設(shè)備還包括數(shù)據(jù)傳送模塊,所述索引設(shè)備還包括數(shù)據(jù)接收模塊,數(shù)據(jù)傳送模塊將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)經(jīng)數(shù)據(jù)接收模塊發(fā)送至關(guān)鍵詞用戶標(biāo)識索引歷史庫生成模塊。
44.根據(jù)權(quán)利要求41所述的廣告信息檢索系統(tǒng),其中所述索引設(shè)備還包括數(shù)據(jù)索引傳送模塊,與所述用戶標(biāo)識廣告索引庫連接,用于向檢索子系統(tǒng)發(fā)送索引數(shù)據(jù)。
45.根據(jù)權(quán)利要求41所述的廣告信息檢索系統(tǒng),其中所述檢索子系統(tǒng)包括檢索設(shè)備,該檢索設(shè)備包括WEB服務(wù)模塊,用于檢索子系統(tǒng)與互聯(lián)網(wǎng)的通信;用戶接口模塊,與所述WEB服務(wù)模塊連接,用于接收檢索請求,生成廣告檢索結(jié)果頁面;廣告匹配模塊,與關(guān)鍵詞廣告索引庫連接,用于根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識廣告索引庫,得到匹配的廣告索引數(shù)據(jù)并發(fā)送至用戶接口模塊。
46.根據(jù)權(quán)利要求45所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備為多臺,每一檢索設(shè)備根據(jù)預(yù)先設(shè)定的分組響應(yīng)部分用戶標(biāo)識的檢索請求。
47.根據(jù)權(quán)利要求45或46所述的廣告信息檢索系統(tǒng),其中所述檢索設(shè)備還包括用戶標(biāo)識廣告索引庫,與所述廣告匹配模塊連接,該用戶標(biāo)識廣告索引庫的數(shù)據(jù)與索引設(shè)備的用戶標(biāo)識廣告索引庫的數(shù)據(jù)一致。
48.一種廣告信息檢索方法,其中包括記錄日志信息,生成用戶標(biāo)識廣告索引數(shù)據(jù)的步驟;根據(jù)檢索請求中的用戶標(biāo)識,檢索用戶標(biāo)識廣告索引數(shù)據(jù),得到用戶標(biāo)識對應(yīng)的廣告索引列表的步驟。
49.根據(jù)權(quán)利要求48所述的廣告信息檢索方法,其中所述的記錄日志信息的步驟具體為根據(jù)檢索請求中攜帶的用戶標(biāo)識選擇相應(yīng)的日志記錄模塊記錄日志信息。
50.根據(jù)權(quán)利要求48所述的廣告信息檢索方法,其中所述的生成用戶標(biāo)識關(guān)鍵詞索引數(shù)據(jù)的步驟具體為根據(jù)日志信息,生成關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù);根據(jù)關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成用戶標(biāo)識廣告索引數(shù)據(jù)。
51.根據(jù)權(quán)利要求50所述的廣告信息檢索方法,其中的生成關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)的步驟具體為生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù),并存儲于關(guān)鍵詞用戶標(biāo)識索引庫中;定時(shí)將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)與用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并,并存儲于關(guān)鍵詞用戶標(biāo)識索引歷史庫中。
52.根據(jù)權(quán)利要求51所述的廣告信息檢索方法,其中還包括對日志信息進(jìn)行預(yù)處理,實(shí)時(shí)分析日志信息,抽取查詢串,生成預(yù)處理數(shù)據(jù),該預(yù)處理數(shù)據(jù)包括用戶標(biāo)識信息及查詢串。
53.根據(jù)權(quán)利要求52所述的廣告信息檢索方法,其中所述的生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)的步驟具體為對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)。
54.根據(jù)權(quán)利要求52所述的廣告信息檢索方法,其中所述的生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)的步驟具體為實(shí)時(shí)對查詢串進(jìn)行切詞,抽取關(guān)鍵詞,在內(nèi)存中生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù),并定時(shí)或在內(nèi)存中的數(shù)據(jù)記錄達(dá)到預(yù)定數(shù)量時(shí),將內(nèi)存中的關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)與關(guān)鍵詞用戶標(biāo)識索引庫中的關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)進(jìn)行合并。
55.根據(jù)權(quán)利要求54所述的廣告信息檢索方法,其中所述的在內(nèi)存中生成關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)的步驟具體為步驟211、讀入一行日志記錄;步驟212、提取日志記錄中的用戶標(biāo)識,在內(nèi)存中的用戶標(biāo)識詞典中查找是否存在該用戶標(biāo)識,若存在,執(zhí)行步驟214,否則,執(zhí)行步驟213;步驟213、在內(nèi)存中的用戶標(biāo)識詞典中插入該用戶標(biāo)識,并存儲日志記錄中用戶標(biāo)識的屬性;步驟214、對日志記錄的查詢串進(jìn)行切詞,在內(nèi)存中的關(guān)鍵詞詞典中查找是否存在該關(guān)鍵詞,若存在,執(zhí)行步驟216,否則,執(zhí)行步驟215;步驟215、在內(nèi)存中的關(guān)鍵詞詞典中插入切詞結(jié)果;步驟216、順序?qū)η性~結(jié)果中的各關(guān)鍵詞進(jìn)行處理,若關(guān)鍵詞的用戶標(biāo)識列表中存在當(dāng)前用戶標(biāo)識,則更新用戶標(biāo)識信息,若不存在,則插入用戶標(biāo)識信息。
56.根據(jù)權(quán)利要求55所述的廣告信息檢索方法,其中在步驟215與步驟216之間還包括根據(jù)預(yù)先設(shè)定的規(guī)則設(shè)置各關(guān)鍵詞的權(quán)值。
57.根據(jù)權(quán)利要求56所述的廣告信息檢索方法,其中所述的更新用戶標(biāo)識信息的步驟具體為將用戶標(biāo)識列表中的用戶標(biāo)識活動時(shí)間更新為當(dāng)前日志活動時(shí)間,并將權(quán)值合并。
58.根據(jù)權(quán)利要求56所述的廣告信息檢索方法,其中所述的插入用戶標(biāo)識信息的步驟具體為將用戶標(biāo)識屬性信息的存儲位置、當(dāng)前日志活動時(shí)間及權(quán)值進(jìn)行封裝,按照用戶標(biāo)識升序插入用戶標(biāo)識列表。
59.根據(jù)權(quán)利要求56所述的廣告信息檢索方法,其中所述的將內(nèi)存中的關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)與關(guān)鍵詞用戶標(biāo)識索引庫中的關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)進(jìn)行合并的步驟具體為步驟221、遍歷讀入的關(guān)鍵詞用戶標(biāo)識索引庫關(guān)鍵詞詞典,對該關(guān)鍵詞詞典中的每一關(guān)鍵詞,在內(nèi)存中的關(guān)鍵詞詞典中查找,若查找到,則將內(nèi)存中該關(guān)鍵詞的用戶標(biāo)識列表與關(guān)鍵詞用戶標(biāo)識索引庫中該關(guān)鍵詞的用戶標(biāo)識列表合并,并在內(nèi)存中的關(guān)鍵詞詞典中刪除該關(guān)鍵詞;步驟222、遍歷內(nèi)存中的關(guān)鍵詞詞典,將每個(gè)關(guān)鍵詞插入關(guān)鍵詞用戶標(biāo)識索引庫關(guān)鍵詞詞典中,并將各關(guān)鍵詞的用戶標(biāo)識列表插入關(guān)鍵詞用戶標(biāo)識索引庫。
60.根據(jù)權(quán)利要求59所述的廣告信息檢索方法,其中所述的將關(guān)鍵詞用戶標(biāo)識索引增量數(shù)據(jù)與用戶標(biāo)識關(guān)鍵詞索引歷史數(shù)據(jù)進(jìn)行合并的步驟具體為步驟231、遍歷讀入的關(guān)鍵詞用戶標(biāo)識索引歷史庫關(guān)鍵詞詞典,對該關(guān)鍵詞詞典中的每一關(guān)鍵詞,在關(guān)鍵詞用戶標(biāo)識索引庫關(guān)鍵詞詞典中查找,若查找到,則將關(guān)鍵詞用戶標(biāo)識索引庫該關(guān)鍵詞的用戶標(biāo)識列表與關(guān)鍵詞用戶標(biāo)識索引歷史庫中該關(guān)鍵詞的用戶標(biāo)識列表合并,并在關(guān)鍵詞用戶標(biāo)識索引庫的關(guān)鍵詞詞典中刪除該關(guān)鍵詞;步驟232、遍歷關(guān)鍵詞用戶標(biāo)識索引庫的關(guān)鍵詞詞典,將每個(gè)關(guān)鍵詞插入關(guān)鍵詞用戶標(biāo)識索引歷史庫關(guān)鍵詞詞典中,并將各關(guān)鍵詞的用戶標(biāo)識列表插入關(guān)鍵詞用戶標(biāo)識索引歷史庫。
61.根據(jù)權(quán)利要求60所述的廣告信息檢索方法,其中所述步驟231中在合并時(shí),將關(guān)鍵詞用戶標(biāo)識索引歷史庫中的權(quán)值乘以衰減因子。
62.根據(jù)權(quán)利要求61所述的廣告信息檢索方法,其中當(dāng)關(guān)鍵詞的用戶列表中用戶標(biāo)識對應(yīng)的權(quán)值小于預(yù)先設(shè)定的閾值時(shí),刪除該用戶標(biāo)識。
63.根據(jù)權(quán)利要求60所述的方法,其中若關(guān)鍵詞的用戶列表中用戶標(biāo)識過期,則刪除該用戶標(biāo)識。
64.根據(jù)權(quán)利要求50所述的廣告信息檢索方法,其中所述的根據(jù)關(guān)鍵詞用戶標(biāo)識索引數(shù)據(jù)及廣告關(guān)鍵詞索引數(shù)據(jù)生成用戶標(biāo)識廣告索引數(shù)據(jù)的步驟具體為步驟241、遍歷廣告關(guān)鍵詞索引庫,對每一個(gè)廣告索引,提取對應(yīng)的關(guān)鍵詞列表,并根據(jù)每一個(gè)關(guān)鍵詞,從關(guān)鍵詞用戶標(biāo)識索引歷史庫中提取用戶標(biāo)識列表;將多個(gè)用戶標(biāo)識列表合并,得到該廣告索引對應(yīng)的總用戶標(biāo)識列表;步驟242、根據(jù)各廣告索引對應(yīng)的總用戶標(biāo)識列表建立用戶標(biāo)識廣告索引數(shù)據(jù)。
65.根據(jù)權(quán)利要求64所述的廣告信息檢索方法,其中所述步驟242具體為步驟2421、訪問待處理的第一個(gè)廣告索引;步驟2422、訪問該廣告索引對應(yīng)的待處理的第一個(gè)用戶標(biāo)識;步驟2423、判斷該用戶標(biāo)識是否存在于用戶標(biāo)識廣告索引庫中,若存在,執(zhí)行步驟2424,否則,執(zhí)行步驟2425;步驟2424、將廣告索引插入用戶標(biāo)識對應(yīng)的廣告索引列表中;步驟2425、在用戶標(biāo)識廣告索引庫中插入該用戶標(biāo)識,并將廣告索引置于用戶標(biāo)識的廣告索引列表的初始位置;步驟2426、判斷當(dāng)前用戶列表中是否存在待處理的用戶標(biāo)識,若存在,執(zhí)行步驟2422,否則,執(zhí)行步驟2427;步驟2427、判斷是否存在待處理的廣告索引,若存在,執(zhí)行步驟2421,否則,執(zhí)行步驟2428;步驟2428、結(jié)束。
66.根據(jù)權(quán)利要求48所述的廣告信息檢索方法,其中還包括接收到檢索請求的檢索設(shè)備根據(jù)用戶標(biāo)識及檢索設(shè)備分組,將檢索請求發(fā)送至相應(yīng)的檢索設(shè)備。
全文摘要
本發(fā)明涉及一種廣告信息檢索系統(tǒng)及方法,根據(jù)訪問日志生成Cookie關(guān)鍵詞索引數(shù)據(jù);在接收到檢索請求后,根據(jù)Cookie查詢Cookie關(guān)鍵詞索引,得到Cookie對應(yīng)的關(guān)鍵詞,并查詢關(guān)鍵詞廣告索引,從而得到Cookie對應(yīng)的廣告索引。本發(fā)明還涉及另一種廣告信息檢索系統(tǒng)及方法,根據(jù)訪問日志生成關(guān)鍵詞Cookie索引數(shù)據(jù),根據(jù)關(guān)鍵詞Cookie索引及廣告關(guān)鍵詞索引建立廣告Cookie索引,并進(jìn)而建立Cookie廣告索引;在接收到檢索請求后,根據(jù)Cookie查詢Cookie廣告索引,得到Cookie對應(yīng)的廣告索引。本發(fā)明利用Cookie建立索引,基于用戶歷史行為匹配廣告,使廣告能為用戶提供能為有用的信息。在用戶個(gè)性化服務(wù)和客戶廣告定向投放的準(zhǔn)確度、覆蓋度和實(shí)時(shí)性等方面具有很大的優(yōu)越性。
文檔編號G06Q30/02GK1877582SQ20061009859
公開日2006年12月13日 申請日期2006年7月12日 優(yōu)先權(quán)日2006年7月12日
發(fā)明者李彥宏, 朱洪波, 劉建國, 郭眈, 周利民, 王湛, 劉子正, 袁杰, 王闖, 楊文凱 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司