亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于識別用戶搜索內(nèi)容的方法、管理平臺和系統(tǒng)與流程

文檔序號:12464842閱讀:382來源:國知局
用于識別用戶搜索內(nèi)容的方法、管理平臺和系統(tǒng)與流程

本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種用于識別用戶搜索內(nèi)容的方法、管理平臺和系統(tǒng)。



背景技術(shù):

隨著大數(shù)據(jù)業(yè)務(wù)中海量數(shù)據(jù)挖掘存儲技術(shù)的快速發(fā)展,RTB廣告推送業(yè)務(wù)的精確性逐步提高,涉及領(lǐng)域包括金融、旅游、教育等行業(yè)。其中基于用戶搜索內(nèi)容特征分析的廣告推送業(yè)務(wù),是一種新興的精確廣告推送的模式,通過對用戶長期的上網(wǎng)行為記錄深入挖掘,刻畫出用戶的性別、年齡、收入、有無子女、品牌關(guān)注、消費(fèi)傾向、興趣愛好、職業(yè)、訪問偏好、搜索偏好等消費(fèi)特征,從而能夠在用戶搜索相關(guān)產(chǎn)品時(shí)觸發(fā)快速、精確的投放廣告。

即搜即投業(yè)務(wù)是基于搜索內(nèi)容的廣告推送業(yè)務(wù)進(jìn)一步升級,根據(jù)用戶搜索行為投放相應(yīng)的廣告,廣告主通過預(yù)先設(shè)置關(guān)鍵詞列表,當(dāng)目標(biāo)用戶在主流搜索引擎搜索過這些關(guān)鍵詞后,一旦能夠成功匹配上合適的廣告,在用戶訪問到代理公司合作網(wǎng)盟的廣告位時(shí),由代理公司為用戶展現(xiàn)廣告主預(yù)設(shè)的廣告。而即搜即投業(yè)務(wù)最重要的價(jià)值體現(xiàn)就是用戶搜索行為記錄的時(shí)效性,直接影響到用戶的回復(fù)率,包括點(diǎn)擊、注冊或購買等行為,這也是廣告投放客戶考慮的關(guān)鍵因素。即搜即投因?yàn)樾枰R別用戶搜索的關(guān)鍵詞,所以涉及到對http中g(shù)et字段的深度解析,包括Host、Request URI(Uniform Resource Identifier統(tǒng)一資源標(biāo)識符)等字段識別解析,提煉出用戶搜索關(guān)鍵詞。

電信運(yùn)營商作為數(shù)據(jù)管道,本身擁有眾多的數(shù)據(jù)資源,在與企業(yè)客戶合作開展即搜即投業(yè)務(wù)時(shí),具有天然的優(yōu)勢。運(yùn)營商將自有數(shù)據(jù)結(jié)合第三方的數(shù)據(jù),通過數(shù)據(jù)挖掘算法生成結(jié)果數(shù)據(jù)集,以各種方式提供給 企業(yè)客戶,幫助企業(yè)了解用戶,提高競爭力,目前主要分為精準(zhǔn)廣告推送、數(shù)據(jù)報(bào)告、精準(zhǔn)營銷、能力開放和能力租用等5大模式。在精確廣告方面,電信運(yùn)營商通過深度包解析技術(shù)(DPI,Deep Packet Inspection),在IP數(shù)據(jù)包、TCP或UDP數(shù)據(jù)流通過基于DPI技術(shù)的帶寬管理系統(tǒng)時(shí),該系統(tǒng)通過深入讀取IP包載荷的內(nèi)容來對OSI七層協(xié)議中的應(yīng)用層信息進(jìn)行重組,從而得到整個應(yīng)用程序的內(nèi)容,然后按照系統(tǒng)定義的管理策略對流量進(jìn)行整形操作,建立與DSP(Demand-Side Platform,需求方平臺)基于數(shù)據(jù)標(biāo)簽的合作,建立數(shù)據(jù)加密平臺,脫敏處理實(shí)時(shí)流量數(shù)據(jù),完成合作DSP的快速接入。

而隨著主流搜索網(wǎng)站逐步將http協(xié)議轉(zhuǎn)為https私有協(xié)議,通用的DPI技術(shù)無法解析https的搜索內(nèi)容,傳統(tǒng)基于對搜索網(wǎng)站的http中URI解析方式識別搜索內(nèi)容的方式,不再可行,造成即搜即投的業(yè)務(wù)發(fā)展遇到瓶頸。



技術(shù)實(shí)現(xiàn)要素:

鑒于以上技術(shù)問題,本發(fā)明提供了一種用于識別用戶搜索內(nèi)容的方法、管理平臺和系統(tǒng),基于refer字段解析的搜索內(nèi)容識別,提升了對用戶搜索內(nèi)容的搜索識別率。

根據(jù)本發(fā)明的一個方面,提供一種用于識別用戶搜索內(nèi)容的方法,包括:

收集深度包解析裝置過濾后的所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息;

從所述上行實(shí)時(shí)流信息中提取目標(biāo)信息,其中所述目標(biāo)信息包括refer信息;

對目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別。

在本發(fā)明的一個實(shí)施例中,在對目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別的步驟之后,還包括:

根據(jù)識別到的用戶搜索內(nèi)容以及相關(guān)廣告內(nèi)容建立用戶實(shí)時(shí)標(biāo)簽信息;

將用戶實(shí)時(shí)標(biāo)簽信息發(fā)送給需求方平臺,以便需求方平臺根據(jù)用戶 實(shí)時(shí)標(biāo)簽信息向相應(yīng)用戶投放廣告。

在本發(fā)明的一個實(shí)施例中,從所述上行實(shí)時(shí)流信息中提取目標(biāo)信息的步驟包括:

從所述上行實(shí)時(shí)流信息中獲取目標(biāo)字段,其中所述目標(biāo)字段包括refer字段;

根據(jù)前綴、后綴來提取目標(biāo)字段中編碼的關(guān)鍵字,作為目標(biāo)信息。

在本發(fā)明的一個實(shí)施例中,對目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別的步驟包括:

根據(jù)目標(biāo)字段所在網(wǎng)站的加密方式和存儲位置,對編碼的關(guān)鍵字進(jìn)行解密,以識別用戶搜索內(nèi)容。

根據(jù)本發(fā)明的另一方面,提供一種用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺,包括收集模塊、信息提取模塊和識別模塊,其中:

收集模塊,用于收集深度包解析裝置過濾后的所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息;

信息提取模塊,用于從收集模塊收集的所述上行實(shí)時(shí)流信息中提取目標(biāo)信息,其中所述目標(biāo)信息包括refer信息;

識別模塊,用于對信息提取模塊提取的目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別。

在本發(fā)明的一個實(shí)施例中,所述數(shù)據(jù)管理平臺還包括標(biāo)簽建立模塊和標(biāo)簽發(fā)送模塊,其中:

標(biāo)簽建立模塊,用于根據(jù)識別模塊識別到的用戶搜索內(nèi)容以及相關(guān)廣告內(nèi)容建立用戶實(shí)時(shí)標(biāo)簽信息;

標(biāo)簽發(fā)送模塊,用于將標(biāo)簽建立模塊建立的用戶實(shí)時(shí)標(biāo)簽信息發(fā)送給需求方平臺,以便需求方平臺根據(jù)用戶實(shí)時(shí)標(biāo)簽信息向相應(yīng)用戶投放廣告。

在本發(fā)明的一個實(shí)施例中,信息提取模塊包括字段獲取單元和信息提取單元,其中:

字段獲取單元,用于從收集模塊收集的所述上行實(shí)時(shí)流信息中獲取目標(biāo)字段,其中所述目標(biāo)字段包括refer字段;

信息提取單元,用于根據(jù)前綴、后綴來提取目標(biāo)字段中編碼的關(guān)鍵字,作為目標(biāo)信息。

在本發(fā)明的一個實(shí)施例中,識別模塊用于根據(jù)目標(biāo)字段所在網(wǎng)站的加密方式和存儲位置,對編碼的關(guān)鍵字進(jìn)行解密,以識別用戶搜索內(nèi)容。

根據(jù)本發(fā)明的另一方面,提供一種用于識別用戶搜索內(nèi)容的系統(tǒng),包括深度包解析裝置和數(shù)據(jù)管理平臺,其中:

深度包解析裝置,用于匯聚所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息,并發(fā)送給數(shù)據(jù)管理平臺;

數(shù)據(jù)管理平臺,為上述任一實(shí)施例所述的數(shù)據(jù)管理平臺。

在本發(fā)明的一個實(shí)施例中,所述系統(tǒng)還包括需求方平臺,其中:

需求方平臺,用于接收數(shù)據(jù)管理平臺發(fā)送的用戶實(shí)時(shí)標(biāo)簽信息,根據(jù)投放廣告主的展現(xiàn)需求,向相應(yīng)用戶投放廣告。

在本發(fā)明的一個實(shí)施例中,深度包解析裝置包括采集模塊、轉(zhuǎn)換模塊和處理模塊,其中:

采集模塊,用于匯聚所有監(jiān)控網(wǎng)絡(luò)的上行流量;

轉(zhuǎn)換模塊,用于將所述上行流量的接入?yún)f(xié)議轉(zhuǎn)換為統(tǒng)一的接入?yún)f(xié)議;

處理模塊,用于對統(tǒng)一接入?yún)f(xié)議的上行流量進(jìn)行過濾處理,向數(shù)據(jù)管理平臺輸出過濾后的上行實(shí)時(shí)流信息。

本發(fā)明基于refer字段解析的搜索內(nèi)容識別,從上一跳訪問內(nèi)容提取搜索關(guān)鍵詞,從而提升了對用戶搜索內(nèi)容的搜索識別率。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明用于識別用戶搜索內(nèi)容的方法一個實(shí)施例的示意圖。

圖2為本發(fā)明一個實(shí)施例中深度包解析裝置的部署架構(gòu)示意圖。

圖3為本發(fā)明一個實(shí)施例中用戶搜索抓包的示意圖。

圖4為本發(fā)明用于識別用戶搜索內(nèi)容的方法另一實(shí)施例的示意圖。

圖5為本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺一個實(shí)施例的示意圖。

圖6為本發(fā)明一個實(shí)施例中信息提取模塊的示意圖。

圖7為本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺另一實(shí)施例的示意圖。

圖8為本發(fā)明用于識別用戶搜索內(nèi)容的系統(tǒng)一個實(shí)施例的示意圖。

圖9為本發(fā)明一個實(shí)施例中深度包解析裝置的結(jié)構(gòu)示意圖。

圖10為本發(fā)明用于識別用戶搜索內(nèi)容的系統(tǒng)另一實(shí)施例的示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。以下對至少一個示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對本發(fā)明及其應(yīng)用或使用的任何限制。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。

同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。

對于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說明書的一部分。

在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。

應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步討論。

圖1為本發(fā)明用于識別用戶搜索內(nèi)容的方法一個實(shí)施例的示意圖。優(yōu)選的,本實(shí)施例可由本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺DMP執(zhí)行。該方法包括以下步驟:

步驟101,收集深度包解析裝置過濾后的所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息。

在本發(fā)明的一個實(shí)施例中,所述監(jiān)控網(wǎng)絡(luò)包括某一地理區(qū)域內(nèi)所有被監(jiān)控的固定網(wǎng)絡(luò)和移動網(wǎng)絡(luò)。

下面通過一個具體實(shí)施例介紹深度包解析裝置獲取所有監(jiān)控網(wǎng)絡(luò)上行實(shí)時(shí)流信息的方法。

如圖2所示的具體實(shí)施例中,監(jiān)控網(wǎng)絡(luò)為蘇州、南京和無錫三地的城域網(wǎng)。此時(shí),獲取所有監(jiān)控網(wǎng)絡(luò)上行實(shí)時(shí)流信息的方法可以包括:

1、通過在城域網(wǎng)固定鏈路上行出口部署DPI系統(tǒng),利用網(wǎng)絡(luò)側(cè)的城域網(wǎng)策略路由調(diào)整和端口鏡像方式,將所有從BAS(寬帶接入服務(wù)器)發(fā)上來的80、8080端口的http上行流量牽引至城域網(wǎng)固定鏈路上。

2、在匯聚http流量鏈路的出口部署監(jiān)控流量接入?yún)f(xié)議轉(zhuǎn)換設(shè)備,將40GPOS或10GPOS轉(zhuǎn)換成10GE(10g比特以太網(wǎng))信號,交由分析刀片設(shè)備進(jìn)行處理。

3、分析刀片通過密集計(jì)算與流量管控實(shí)現(xiàn)最核心的http協(xié)議的深度包解析。同時(shí)增加后臺管理服務(wù)器,實(shí)現(xiàn)數(shù)據(jù)存儲與統(tǒng)計(jì)控制界面功能,通過將匯聚的城域網(wǎng)上行流量進(jìn)行匯聚,輸出至數(shù)據(jù)管理平臺(新媒體運(yùn)營平臺)。

步驟102,從所述上行實(shí)時(shí)流信息中提取目標(biāo)信息,其中所述目標(biāo)信息包括refer信息。

在本發(fā)明的一個實(shí)施例中,步驟102可以包括:

步驟1021,從所述上行實(shí)時(shí)流信息中獲取目標(biāo)字段,其中所述目標(biāo)字段包括refer字段(例如圖3具體示例中的referer字段)。

步驟1022,根據(jù)前綴、后綴來提取目標(biāo)字段中編碼的關(guān)鍵字,作為目標(biāo)信息。

步驟103,對目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別。

在本發(fā)明的一個實(shí)施例中,步驟103可以包括:根據(jù)目標(biāo)字段所在網(wǎng)站的加密方式和存儲位置,對編碼的關(guān)鍵字進(jìn)行解密,以識別用戶搜索內(nèi)容。

下面通過一個具體示例對步驟102和步驟103進(jìn)行說明。

在本發(fā)明的一個具體實(shí)施例中,從所述上行實(shí)時(shí)流信息中獲取的目標(biāo)字段內(nèi)容為:http://www.baidu.com/s?wd=%E6%84%9F%E5%8A%A8%E4%B8%AD%E5%9B%BD&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg。

然后,根據(jù)前綴、后綴來提取目標(biāo)字段中編碼的關(guān)鍵字,作為目標(biāo)信息,得到:%E6%84%9F%E5%8A%A8%E4%B8%AD%E5%9B%BD。

最后,根據(jù)配置文件中的加密算法utf8對上邊提取出來的加密的關(guān)鍵字信息(目標(biāo)信息)進(jìn)行解密處理,識別出用戶搜索內(nèi)容為:感動中國。

在本發(fā)明的一個具體實(shí)施例中,當(dāng)模擬用戶在百度等基于https的網(wǎng)站搜索之后,點(diǎn)擊搜索內(nèi)容中展示的鏈接,該鏈接中的http get字段抓包分析,上一跳的refer信息會帶出百度頁面的搜索內(nèi)容。而且測試發(fā)現(xiàn),所有網(wǎng)頁都會輸出refer字段,所以本發(fā)明用于識別用戶搜索內(nèi)容的方法可以實(shí)現(xiàn)https私有協(xié)議無法解析的所有頁面場景。

基于本發(fā)明上述實(shí)施例提供的用于識別用戶搜索內(nèi)容的方法,基于refer字段解析的搜索內(nèi)容識別,從上一跳訪問內(nèi)容提取搜索關(guān)鍵詞,由此解決了主流搜索網(wǎng)站將協(xié)議改為https后DPI系統(tǒng)無法對https協(xié)議進(jìn)行解析的問題,從而提升了對用戶搜索內(nèi)容的搜索識別率。

在本發(fā)明的一個實(shí)施例中,所述目標(biāo)字段還可以包括Host字段、Request字段和URI字段中的至少一項(xiàng);所述目標(biāo)信息為六元組信息,包括源地址、目的地址、源端口、目的端口、URL信息和refer信息。

在本發(fā)明的一個實(shí)施例中,步驟102還可以包括確定目標(biāo)字段的步驟,即,步驟102還可以包括:判斷當(dāng)前上行實(shí)時(shí)流采用的是https協(xié)議,還是http協(xié)議;若當(dāng)前上行實(shí)時(shí)流采用的是https私有化協(xié)議,則將目標(biāo)字段設(shè)置為refer字段,之后執(zhí)行步驟1021和1022;若當(dāng)前上行實(shí)時(shí)流采用的是http協(xié)議,則將目標(biāo)字段設(shè)置為Host字段、Request字段和URI字段,之后執(zhí)行步驟1021和1022。

本發(fā)明上述實(shí)施例中基于refer字段解析的搜索內(nèi)容識別方法,從而大大提升了對用戶搜索內(nèi)容的搜索識別率。基于本發(fā)明上述方法識別的用戶搜索內(nèi)容數(shù)據(jù),可以應(yīng)用于歷史數(shù)據(jù)挖掘、行業(yè)分析、行業(yè)報(bào)告、用戶需求的信息或網(wǎng)頁推薦、大數(shù)據(jù)RTB(Real-Time Bidding實(shí)時(shí)競價(jià))廣告運(yùn)營等方面。

下面具體介紹本發(fā)明基于refer字段解析的搜索內(nèi)容識別方法在即搜即投廣告運(yùn)營方面的應(yīng)用。

圖4為本發(fā)明用于識別用戶搜索內(nèi)容的方法另一實(shí)施例的示意圖。優(yōu)選的,本實(shí)施例可由本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺執(zhí)行。圖4實(shí)施例的步驟401-步驟403分別與圖1實(shí)施例的步驟101-步驟103相同或相似,這里不再詳述。與圖1實(shí)施例相比,圖4實(shí)施例的方法還可以包括以下步驟:

步驟404,根據(jù)識別到的用戶搜索內(nèi)容以及相關(guān)廣告內(nèi)容建立用戶實(shí)時(shí)標(biāo)簽信息。

在本發(fā)明的一個實(shí)施例中,實(shí)時(shí)標(biāo)簽信息為Key-Value標(biāo)簽(K-V標(biāo)簽)。

步驟405,將用戶實(shí)時(shí)標(biāo)簽信息發(fā)送給需求方平臺,以便需求方平臺根據(jù)用戶實(shí)時(shí)標(biāo)簽信息向相應(yīng)用戶投放廣告。

在本發(fā)明的一個具體實(shí)施例中,某運(yùn)營商與DSP公司合作,在運(yùn)營商自有匯聚固網(wǎng)實(shí)時(shí)流運(yùn)營平臺上,部署DSP合作方的即搜即投等核心算法,共同運(yùn)營即搜即投業(yè)務(wù)。

DSP主營的即搜即投業(yè)務(wù),基于其自有的Adirect平臺,通過在電信方建設(shè)的對外合作的DMP,對于采用http協(xié)議的上行流量,采用非 cookie技術(shù)深入解析http get字段中URI實(shí)現(xiàn)基于搜索內(nèi)容的動態(tài)廣告調(diào)度輸出K-V標(biāo)簽,支撐其即投即投業(yè)務(wù),業(yè)務(wù)運(yùn)作良好。

對于更改http協(xié)議為https協(xié)議的搜索網(wǎng)站的上行流量,通過增加對http請求中的refer字段內(nèi)容中搜索網(wǎng)站關(guān)鍵詞的識別,在DMP平臺上實(shí)現(xiàn)新方法下的K-V標(biāo)簽結(jié)果輸出。本發(fā)明上述實(shí)施例投入低、收益高、容易實(shí)現(xiàn)、業(yè)務(wù)價(jià)值高,較快的規(guī)避了大量人力投入到https私有協(xié)議的反復(fù)解析。

本發(fā)明上述實(shí)施例主要應(yīng)用在廣告推送業(yè)務(wù)運(yùn)營中利用數(shù)據(jù)包中的refer字段以提高對用戶搜索內(nèi)容的識別率;本發(fā)明上述實(shí)施例針對私有的https協(xié)議,結(jié)合即搜即投業(yè)務(wù)的只針對用戶搜索內(nèi)容的識別要求,創(chuàng)新性的增加refer字段解析上一跳為https私有協(xié)議封裝的搜索關(guān)鍵詞,由此解決了協(xié)議私有化導(dǎo)致的精確廣告無法實(shí)施問題;本發(fā)明上述實(shí)施例新增refer字段解析,將原有因https協(xié)議而無法解析的搜索關(guān)鍵詞,通過在下一跳網(wǎng)站中捕捉回來,實(shí)現(xiàn)全網(wǎng)搜索內(nèi)容關(guān)鍵詞的百分百獲取,由此提高了推送識別率。

圖5為本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺一個實(shí)施例的示意圖。如圖5所示,所述數(shù)據(jù)管理平臺包括收集模塊501、信息提取模塊502和識別模塊503,其中:

收集模塊501,用于收集深度包解析裝置過濾后的所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息。

信息提取模塊502,用于從收集模塊501收集的所述上行實(shí)時(shí)流信息中提取目標(biāo)信息,其中所述目標(biāo)信息包括refer信息。

在本發(fā)明的一個實(shí)施例中,如圖6所示,圖5中的信息提取模塊502包括字段獲取單元5021和信息提取單元5022,其中:字段獲取單元5021,用于從收集模塊501收集的所述上行實(shí)時(shí)流信息中獲取目標(biāo)字段,其中所述目標(biāo)字段包括refer字段;信息提取單元5022,用于根據(jù)前綴、后綴來提取目標(biāo)字段中編碼的關(guān)鍵字,作為目標(biāo)信息。

識別模塊503,用于對信息提取模塊502提取的目標(biāo)信息中的用戶搜索內(nèi)容進(jìn)行識別。

在本發(fā)明的一個實(shí)施例中,識別模塊503具體用于根據(jù)目標(biāo)字段所在網(wǎng)站的加密方式和存儲位置,對編碼的關(guān)鍵字進(jìn)行解密,以識別用戶搜索內(nèi)容。

基于本發(fā)明上述實(shí)施例提供的用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺,基于refer字段解析的搜索內(nèi)容識別,從上一跳訪問內(nèi)容提取搜索關(guān)鍵詞,由此解決了主流搜索網(wǎng)站將協(xié)議改為https后DPI系統(tǒng)無法對https協(xié)議進(jìn)行解析的問題,從而提升了對用戶搜索內(nèi)容的搜索識別率。

圖7為本發(fā)明用于識別用戶搜索內(nèi)容的數(shù)據(jù)管理平臺另一實(shí)施例的示意圖。與圖5所示的實(shí)施例相比,圖7所示實(shí)施例中,所述數(shù)據(jù)管理平臺還包括標(biāo)簽建立模塊504和標(biāo)簽發(fā)送模塊505,其中:

標(biāo)簽建立模塊504,用于根據(jù)識別模塊503識別到的用戶搜索內(nèi)容以及相關(guān)廣告內(nèi)容建立用戶實(shí)時(shí)標(biāo)簽信息;

標(biāo)簽發(fā)送模塊505,用于將標(biāo)簽建立模塊504建立的用戶實(shí)時(shí)標(biāo)簽信息發(fā)送給需求方平臺,以便需求方平臺根據(jù)用戶實(shí)時(shí)標(biāo)簽信息向相應(yīng)用戶投放廣告。

本發(fā)明上述實(shí)施例針對私有的https協(xié)議,結(jié)合即搜即投業(yè)務(wù)的只針對用戶搜索內(nèi)容的識別要求,創(chuàng)新性的增加refer字段解析上一跳為https私有協(xié)議封裝的搜索關(guān)鍵詞,由此解決了協(xié)議私有化導(dǎo)致的精確廣告無法實(shí)施問題。本發(fā)明上述實(shí)施例通過新增refer字段解析,將原有因https協(xié)議而無法解析的搜索關(guān)鍵詞,通過在下一跳網(wǎng)站中捕捉回來,實(shí)現(xiàn)全網(wǎng)搜索內(nèi)容關(guān)鍵詞的百分百獲取,由此提高了推送識別率;本發(fā)明上述實(shí)施例投入低、收益高,針對https協(xié)議私有化,不投入人力開發(fā)對私有協(xié)議解析,通過簡單的軟件開發(fā),增加對refer字段關(guān)鍵詞的解析,從而實(shí)現(xiàn)了即投即投業(yè)務(wù)快速上線。

圖8為本發(fā)明用于識別用戶搜索內(nèi)容的系統(tǒng)一個實(shí)施例的示意圖。如圖8所示,所述用于識別用戶搜索內(nèi)容的系統(tǒng)包括數(shù)據(jù)管理平臺50、深度包解析裝置60和需求方平臺70,其中:

深度包解析裝置60,用于匯聚所有監(jiān)控網(wǎng)絡(luò)的上行實(shí)時(shí)流信息, 并發(fā)送給數(shù)據(jù)管理平臺。

在本發(fā)明的一個實(shí)施例中,如圖9所示,深度包解析裝置包括采集模塊601、轉(zhuǎn)換模塊602和處理模塊603,其中:

采集模塊601,用于匯聚所有監(jiān)控網(wǎng)絡(luò)的上行流量。

轉(zhuǎn)換模塊602,用于將所述上行流量的接入?yún)f(xié)議轉(zhuǎn)換為統(tǒng)一的接入?yún)f(xié)議。在本發(fā)明的一個具體實(shí)施例中,如圖2所示,所述轉(zhuǎn)換模塊602為監(jiān)控流量接入?yún)f(xié)議轉(zhuǎn)換設(shè)備,所述統(tǒng)一的接入?yún)f(xié)議為10GE信號。

處理模塊603,用于對統(tǒng)一接入?yún)f(xié)議的上行流量進(jìn)行過濾處理,向數(shù)據(jù)管理平臺輸出過濾后的上行實(shí)時(shí)流信息。在本發(fā)明的一個具體實(shí)施例中,如圖2所示,處理模塊603為分析刀片設(shè)備。

數(shù)據(jù)管理平臺50,為圖5-圖7中任一實(shí)施例所述的數(shù)據(jù)管理平臺。

需求方平臺70,用于接收數(shù)據(jù)管理平臺發(fā)送的用戶實(shí)時(shí)標(biāo)簽信息,根據(jù)投放廣告主的展現(xiàn)需求,向相應(yīng)用戶投放廣告。

圖10為本發(fā)明用于識別用戶搜索內(nèi)容的系統(tǒng)另一實(shí)施例的示意圖。如圖10所示,所述數(shù)據(jù)管理平臺DMP包括采集處理層和分析處理層,其中:

DMP平臺中的采集處理層,收集DPI側(cè)提供的過濾后http實(shí)時(shí)流信息,并輸出為簡單的六元組,包括源地址、目的地址、源端口、目的端口、URL信息、refer信息,其中refer信息是針對本方法中提出的識別而新增的字段。

DMP平臺的分析處理層根據(jù)六元組信息,識別到的用戶搜索內(nèi)容,根據(jù)相關(guān)的廣告內(nèi)容完成用戶實(shí)時(shí)標(biāo)簽建模。

DSP平臺接收用戶實(shí)時(shí)標(biāo)簽信息,根據(jù)投放廣告主展現(xiàn)需求,按照提前配置的廣告下單展現(xiàn)區(qū)域、展現(xiàn)頻次、目標(biāo)興趣用戶等信息,完成相應(yīng)用戶的廣告展現(xiàn)。

本發(fā)明上述實(shí)施例通過修改RTB廣告投放算法的解析字段優(yōu)化,增加了用戶搜索信息的識別,提升了廣告快速匹配投放識別準(zhǔn)確率。

下面舉例用戶搜索“汽車”關(guān)鍵詞為例,描述本發(fā)明實(shí)施后,廣告展現(xiàn)的具體流程。

1、用戶搜索“汽車”等廣告投放關(guān)鍵詞,或者近期瀏覽過網(wǎng)站的汽車相關(guān)網(wǎng)站,系統(tǒng)根據(jù)本發(fā)明修改后的推送算法,識別用戶訪問http請求中URL、refer字段解析出汽車關(guān)鍵詞的信息,就會自動檢測此用戶的“汽車”相關(guān)興趣,用戶建立本次搜索的實(shí)時(shí)標(biāo)簽。

2、當(dāng)此用戶訪問到廣告投放訂單側(cè)投放的廣告媒體位的時(shí)候,系統(tǒng)就會根據(jù)用戶的興趣匹配到奔馳的品牌投放訂單,給用戶展示奔馳的廣告素材。

3、系統(tǒng)統(tǒng)計(jì)平臺還會實(shí)時(shí)對廣告投放數(shù)據(jù)進(jìn)行分析和匯總,提供廣告展現(xiàn)量、產(chǎn)品訂購量等統(tǒng)計(jì)信息。

在上面所描述的數(shù)據(jù)管理平臺、深度包解析裝置和需求方平臺等可以實(shí)現(xiàn)為用于執(zhí)行本申請所描述功能的通用處理器、可編程邏輯控制器(PLC)、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件或者其任意適當(dāng)組合。

至此,已經(jīng)詳細(xì)描述了本發(fā)明。為了避免遮蔽本發(fā)明的構(gòu)思,沒有描述本領(lǐng)域所公知的一些細(xì)節(jié)。本領(lǐng)域技術(shù)人員根據(jù)上面的描述,完全可以明白如何實(shí)施這里公開的技術(shù)方案。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。

本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1