本發(fā)明屬于互聯(lián)網(wǎng)
技術(shù)領(lǐng)域:
,具體涉及一種廣告投放圖譜構(gòu)建方法及廣告投放圖譜異常投放檢測(cè)方法。
背景技術(shù):
:互聯(lián)網(wǎng)廣告,由于其互動(dòng)性強(qiáng)、準(zhǔn)確性高的優(yōu)勢(shì)在廣告結(jié)構(gòu)中的比重逐年提升,并有繼續(xù)擴(kuò)大的趨勢(shì)。2011至2014年,互聯(lián)網(wǎng)廣告的市場(chǎng)規(guī)模已經(jīng)超過(guò)了報(bào)紙廣告規(guī)模,名列第二位,市場(chǎng)規(guī)模連續(xù)保持高速增長(zhǎng)。RTB(RealtimeBidding,實(shí)時(shí)競(jìng)價(jià))是一種利用第三方技術(shù)在數(shù)量龐大的各個(gè)網(wǎng)站上針對(duì)每一個(gè)用戶廣告展示行為進(jìn)行評(píng)估以及出價(jià)的競(jìng)價(jià)技術(shù)。實(shí)時(shí)競(jìng)價(jià)規(guī)避了無(wú)效的受眾到達(dá),廣告主或者其代理可以針對(duì)有意義的用戶進(jìn)行流量購(gòu)買(mǎi)。RTB的核心是DSP(DemandSidePlatform,需求方平臺(tái))和AdExchange(ADX,廣告交易市場(chǎng))。DSP整合了不同來(lái)源的在線廣告資源,可以讓廣告主或者其代理通過(guò)一個(gè)統(tǒng)一的平臺(tái)來(lái)購(gòu)買(mǎi)、管理廣告資源。通過(guò)DSP,可以實(shí)現(xiàn)統(tǒng)一的定向投放,數(shù)據(jù)管理,優(yōu)化和效果報(bào)告。ADX是一個(gè)類(lèi)似于證券交易所的場(chǎng)所,將廣告供應(yīng)方(網(wǎng)站媒體)和需求方(廣告主或者其代理)聚集在一起交易在線廣告存貨,其本身并不買(mǎi)賣(mài)在線廣告存貨,而只是提供了交易的場(chǎng)所,按交易金額收取費(fèi)用。ADX是DSP的一個(gè)重要的在線廣告資源來(lái)源之一??傊?,ADX就是一個(gè)能夠讓廣告主在正確的時(shí)間,正確的媒體接觸到合適的用戶的地方,交易中運(yùn)用的RTB技術(shù)可以讓廣告主或其代理DSP競(jìng)拍每一次廣告顯示在用戶面前的機(jī)會(huì)。但是,目前,廣告在投放的過(guò)程中,人們并不能直觀觀測(cè)到廣告在某時(shí)刻某媒體上的投放量和投放成本指標(biāo)等,不便于廣告主和廣告分析人員把握市場(chǎng)動(dòng)態(tài),調(diào)整業(yè)務(wù)分配策略。并且也不能及時(shí)發(fā)現(xiàn)廣告在投放的過(guò)程中發(fā)生的流量異常、投放系統(tǒng)故障或者突發(fā)性作弊等現(xiàn)象,不方便對(duì)投放過(guò)程進(jìn)行跟蹤和控制。技術(shù)實(shí)現(xiàn)要素:本發(fā)明是為了解決上述問(wèn)題而進(jìn)行的,目的在于提供一種能夠觀察到在整個(gè)投放周期內(nèi),廣告在不同時(shí)刻不同媒體上的投放量、投放成本等指標(biāo)的廣告投放圖譜構(gòu)建方法,以及能夠檢測(cè)出投放過(guò)程中發(fā)生流量異常、投放系統(tǒng)故障或者突發(fā)性作弊,方便對(duì)投放過(guò)程進(jìn)行跟蹤和控制的廣告投放圖譜異常投放檢測(cè)方法。本發(fā)明提供了一種廣告投放圖譜構(gòu)建方法,其特征在于,包括以下步驟:步驟1,將任意兩個(gè)媒體基于預(yù)定規(guī)則得到兩個(gè)媒體之間的用戶重合度,根據(jù)所述用戶重合度得到媒體相似性矩陣;步驟2,根據(jù)所述媒體相似性矩陣基于預(yù)定規(guī)則得到投影向量;步驟3,根據(jù)所述投影向量基于預(yù)定規(guī)則得到每個(gè)媒體的投影坐標(biāo);步驟4,以時(shí)間為橫坐標(biāo),媒體為縱坐標(biāo),將廣告的投放指標(biāo)繪制成投放圖譜。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜構(gòu)建方法中,還可以具有這樣的特征:其中,步驟1中,每個(gè)媒體根據(jù)實(shí)時(shí)競(jìng)價(jià)數(shù)據(jù)得到該媒體上出現(xiàn)過(guò)的用戶,并以矩陣的形式表示:domain=(user1user2…usern)domain為媒體矩陣,n為正整數(shù)。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜構(gòu)建方法中,還可以具有這樣的特征:其中,兩個(gè)媒體之間的用戶重合度由雅克比相似性公式求得:所述媒體相似性矩陣為:mpq為兩個(gè)媒體之間的用戶重合度,M為p行q列矩陣,p、q均為正整數(shù)。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜構(gòu)建方法中,還可以具有這樣的特征:其中,步驟2中,所述投影向量基于主成分分析法求得,求解公式如下:argmaxμTMμs.t.μTμ=1μ為投影向量,μT為μ的轉(zhuǎn)置向量,M為媒體相似性矩陣。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜構(gòu)建方法中,還可以具有這樣的特征:其中,步驟3中,所述投影坐標(biāo)由以下公式求得:ki=μTdomainidomaini=(user1user2…usern)ki為某個(gè)媒體的投影坐標(biāo),μ為投影向量,domaini為某個(gè)媒體矩陣。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜構(gòu)建方法中,還可以具有這樣的特征:其中,步驟4中,繪制投放圖譜包含以下步驟:步驟4-1,計(jì)算同一時(shí)刻下,所有媒體的投影坐標(biāo),每個(gè)媒體的展現(xiàn)和點(diǎn)擊指標(biāo),步驟4-2,將在同一時(shí)刻下投影坐標(biāo)相同的媒體的展現(xiàn)和點(diǎn)擊指標(biāo)合并,步驟4-3,時(shí)間為橫坐標(biāo),媒體為縱坐標(biāo),將步驟4-2中得到的展現(xiàn)和點(diǎn)擊指標(biāo)繪制在相應(yīng)的位置處得到投放圖譜。本發(fā)明還提供了一種廣告投放圖譜異常投放檢測(cè)方法,其特征在于,包含以下步驟:步驟1,將根據(jù)上面所述的廣告投放圖譜構(gòu)建方法所得到的投放圖譜做SVD分解;步驟2,選取低秩恢復(fù)系數(shù),然后對(duì)投放圖譜進(jìn)行低秩重建得到重建圖譜;步驟3,根據(jù)投放圖譜與重建圖譜基于預(yù)定規(guī)則得到重建誤差;步驟4,判斷所述重建誤差與閾值的大小,如果所述重建誤差小于所述閾值,選取步驟2的低秩恢復(fù)系數(shù),否則,返回步驟2,并增大所述低秩恢復(fù)系數(shù)的值;步驟5,根據(jù)步驟4選取的低秩回復(fù)系數(shù)分析廣告投放圖譜投放是否發(fā)生異常。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜異常投放檢測(cè)方法中,還可以具有這樣的特征:其中,步驟1中,所述投放圖譜做SVD分解的公式如下:X=UΣVTX是投放圖譜;U是p×p階酉矩陣;Σ是半正定p×q階對(duì)角矩陣;VT,即V的共軛轉(zhuǎn)置,是q×q階酉矩陣。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜異常投放檢測(cè)方法中,還可以具有這樣的特征:其中,步驟2中,通過(guò)下面公式對(duì)投放圖譜進(jìn)行低秩重建:為重建圖譜,c為低秩恢復(fù)系數(shù),Uc表示矩陣U的前c個(gè)分量,Σc表示矩陣Σ的前c個(gè)分量,表示矩陣VT的前c個(gè)分量。進(jìn)一步,在本發(fā)明提供的廣告投放圖譜異常投放檢測(cè)方法中,還可以具有這樣的特征:其中,步驟3中,重建誤差的計(jì)算公式如下:ε為重建誤差,X為投放圖譜,為重建圖譜。本發(fā)明的優(yōu)點(diǎn)如下:根據(jù)本發(fā)明所涉及的廣告投放圖譜構(gòu)建方法,通過(guò)媒體的用戶訪問(wèn)數(shù)據(jù)將媒體映射為縱坐標(biāo),將時(shí)間作為橫坐標(biāo),將不同時(shí)刻不同媒體的投放指標(biāo)繪制在相應(yīng)位置處得到投放圖譜,因此廣告投放過(guò)程可以通過(guò)投放圖譜進(jìn)行可視化,廣告主和廣告分析人員能夠觀察到在整個(gè)投放周期內(nèi),廣告在不同時(shí)刻不同媒體上的投放量、投放成本等指標(biāo)。本發(fā)明所涉及的廣告投放圖譜異常投放檢測(cè)方法,能夠?qū)Σ捎帽景l(fā)明的廣告投放圖譜構(gòu)建方法得到的投放圖譜進(jìn)行檢測(cè),根據(jù)投放圖譜的波動(dòng)檢測(cè)到廣告投放圖譜在投放過(guò)中發(fā)生的流量異常、投放系統(tǒng)故障或者突發(fā)性作弊,方便對(duì)投放過(guò)程進(jìn)行跟蹤和控制。附圖說(shuō)明圖1是本發(fā)明中廣告投放圖譜構(gòu)建方法的流程圖;圖2是本發(fā)明中樣本中廣告投放圖譜異常檢測(cè)方法的流程圖。具體實(shí)施方式為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,以下實(shí)施例結(jié)合附圖對(duì)本發(fā)明廣告投放圖譜構(gòu)建方法及廣告投放圖譜異常投放檢測(cè)方法作具體闡述。廣告投放圖譜構(gòu)建方法用于將廣告投放過(guò)程以圖譜的方式呈現(xiàn),使其能夠可視化。如圖1所示,廣告投放圖譜構(gòu)建方法包含以下步驟:步驟S1-1,將任意兩個(gè)媒體基于預(yù)定規(guī)則得到兩個(gè)媒體之間的用戶重合度,根據(jù)所述用戶重合度得到媒體相似性矩陣。在廣告業(yè)務(wù)中,媒體一般以域名(domain)和廣告位(adslot)表示。每個(gè)媒體從RTB(RealtimeBidding,實(shí)時(shí)競(jìng)價(jià))廣播數(shù)據(jù)中可以得到該媒體上出現(xiàn)過(guò)的用戶,并將每個(gè)媒體以矩陣的形式表示:domain=(user1user2…usern)其中,domain為媒體矩陣,n為正整數(shù)。在本實(shí)施例中,每個(gè)媒體上出現(xiàn)的用戶如表1所示。表1.每個(gè)媒體上出現(xiàn)的用戶User1User2…UsernDomain110…0Domain211…1……………DomainP00…1兩個(gè)媒體之間的用戶重合度由雅克比相似性公式求得:媒體相似性矩陣為:其中,mpq為兩個(gè)媒體之間的用戶重合度,M為p行q列矩陣,p、q均為正整數(shù)。在本實(shí)施例中,兩兩媒體之間的用戶重合度如表2所示。表2.兩兩媒體之間的用戶重合度則媒體相似性矩陣為:步驟S1-2,根據(jù)媒體相似性矩陣基于預(yù)定規(guī)則得到投影向量μ。投影向量μ基于主成分分析法求得,求解公式如下:argmaxμTMμs.t.μTμ=1μ為投影向量,μT為μ的轉(zhuǎn)置向量。步驟S1-3,根據(jù)投影向量基于預(yù)定規(guī)則得到每個(gè)媒體的投影坐標(biāo)。投影坐標(biāo)ki由以下公式求得:ki=μTdomainidomaini=(user1user2…usern)domaini為某個(gè)媒體矩陣。采用上述過(guò)程計(jì)算得到的每個(gè)媒體對(duì)應(yīng)的投影坐標(biāo)滿足:媒體之間的用戶重合度高的得到的投影坐標(biāo)接近,媒體之間的用戶重合度低的得到的投影坐標(biāo)分離。步驟S1-4,以時(shí)間為橫坐標(biāo),媒體為縱坐標(biāo),將廣告的投放指標(biāo)繪制成投放圖譜X。投放圖譜X為二維圖像,t表示時(shí)間,k表示媒體,Xk,t表示t時(shí)刻在媒體k上的投放指標(biāo)。投放指標(biāo)包含展現(xiàn)(impression)和點(diǎn)擊(click)指標(biāo)。投放圖譜X繪制過(guò)程包括以下步驟:步驟S1-4-1,計(jì)算同一時(shí)刻下,所有媒體的投影坐標(biāo),每個(gè)媒體的展現(xiàn)(impression)和點(diǎn)擊(click)指標(biāo)。在本實(shí)施例中,同一時(shí)刻不同媒體的投影坐標(biāo)、展現(xiàn)和點(diǎn)擊指標(biāo)的數(shù)據(jù)如表3所示。表3.同一時(shí)刻不同媒體的投影坐標(biāo)、展現(xiàn)和點(diǎn)擊指標(biāo)媒體投影坐標(biāo)impressionclickdomain1k1300010domain2k2200020domain3k1100030…………步驟S1-4-2,將在同一時(shí)刻下投影坐標(biāo)相同的媒體的展現(xiàn)和點(diǎn)擊指標(biāo)合并。如表4所示。表4.坐標(biāo)系中同一時(shí)刻不同坐標(biāo)下對(duì)應(yīng)的展示和點(diǎn)擊指標(biāo)投影坐標(biāo)impressionclickk1400040k2200020………步驟S1-4-3,時(shí)間為橫坐標(biāo),媒體為縱坐標(biāo),將步驟S1-4-2中得到的展現(xiàn)和點(diǎn)擊指標(biāo)繪制在相應(yīng)的位置處得到投放圖譜。圖譜能夠展示在整個(gè)投放周期內(nèi),廣告在不同媒體上的投放量、投放成本等指標(biāo)。廣告投放圖譜投放異常檢測(cè)方法能夠根據(jù)投放圖譜的波動(dòng)檢測(cè)到廣告投放圖譜在投放過(guò)中發(fā)生的流量異常、投放系統(tǒng)故障或者突發(fā)性作弊,方便對(duì)投放過(guò)程進(jìn)行跟蹤和控制。如圖2所示,廣告投放圖譜投放異常檢測(cè)方法包含以下步驟:步驟S2-1,將根據(jù)廣告投放圖譜構(gòu)建方法所得到的投放圖譜做SVD分解。SVD分解的公式如下:X=UΣVTX是投放圖譜;U是p×p階酉矩陣;Σ是半正定p×q階對(duì)角矩陣;VT,即V的共軛轉(zhuǎn)置,是q×q階酉矩陣。步驟S2-2,選取重建系數(shù)c,然后對(duì)投放圖譜X進(jìn)行低秩重建得到重建圖譜投放圖譜X進(jìn)行低秩重建公式如下:為重建圖譜,c為重建系數(shù),Uc表示矩陣U的前c個(gè)分量,Σc表示矩陣Σ的前c個(gè)分量,表示矩陣VT的前c個(gè)分量。步驟S2-3,根據(jù)投放圖譜與重建圖譜基于預(yù)定規(guī)則得到重建誤差。重建誤差ε的計(jì)算公式如下:步驟S2-4,判斷所述重建誤差與閾值的大小,如果所述重建誤差小于所述閾值,選取步驟S2-2的重建系數(shù)c,否則,返回步驟S2-2,并增大重建系數(shù)c的值。步驟S2-5,根據(jù)步驟S2-4選取的低秩回復(fù)系數(shù)c分析廣告投放圖譜投放是否發(fā)生異常。重建系數(shù)c表示了廣告在投放時(shí)的媒體變化情況,如果媒體變化較大,則重建系數(shù)c的值較大,否則,重建系數(shù)c的值較小。如果某廣告投放過(guò)程中,重建系數(shù)c一直很穩(wěn)定,但是某個(gè)時(shí)間點(diǎn)處發(fā)生了突變,則說(shuō)明廣告投放的媒體發(fā)生了變化,進(jìn)而可判定投放發(fā)生了異常。例如,在投放圖譜中分別截取t0~t1、t0~t2、t0~t3、t0~t4的圖譜,根據(jù)廣告投放圖譜投放異常檢測(cè)方法得到t1、t2、t3、t4四個(gè)時(shí)刻的重建系數(shù)c1、c2、c3、c4。c1、c2、c3近似相等,而c4明顯大于c1、c2、c3,則說(shuō)明t3~t4時(shí)刻廣告發(fā)生了異常投放。上述實(shí)施方式為本發(fā)明的優(yōu)選案例,并不用來(lái)限制本發(fā)明的保護(hù)范圍。當(dāng)前第1頁(yè)1 2 3