專利名稱:一種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法
技術(shù)領(lǐng)域:
本發(fā)明涉及廣告內(nèi)容匹配、效果評(píng)估技術(shù),特別涉及一種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法。
背景技術(shù):
互聯(lián)網(wǎng)廣告現(xiàn)在已經(jīng)廣泛應(yīng)用于各個(gè)網(wǎng)站,為網(wǎng)站運(yùn)營者提供了一個(gè)很好的利益增長點(diǎn)。通常的方法運(yùn)用關(guān)鍵詞匹配策略來進(jìn)行廣告投放與評(píng)價(jià),即網(wǎng)絡(luò)側(cè)的廣告服務(wù)器對(duì)用戶所瀏覽的頁面的內(nèi)容進(jìn)行分析,抽取出滿足條件的關(guān)鍵詞,并在廣告庫中將該關(guān)鍵詞與廣告進(jìn)行匹配,并將匹配的廣告返回給網(wǎng)頁,然后展現(xiàn)給瀏覽的用戶。普通的廣告信息匹配、評(píng)估軟件,多只支持網(wǎng)頁信息,不支持其他媒體形式的廣告,具有一定的局限性。另外,在廣告效用評(píng)測效果上也不盡如人意。本發(fā)明的方法是一種電子商務(wù)的互聯(lián)網(wǎng)廣告信息匹配、評(píng)估和分析方法,是互聯(lián)網(wǎng)廣告商、電子商務(wù)企業(yè)提高互聯(lián)網(wǎng)廣告制作水平、精準(zhǔn)推送產(chǎn)品和服務(wù)信息的有效方法。 本方法能有效地提升用戶廣告針對(duì)性,能更好地促進(jìn)網(wǎng)絡(luò)營銷的效果。本方法能有效提高廣告效用評(píng)測的準(zhǔn)確性。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決現(xiàn)有技術(shù)中普通的廣告信息匹配、評(píng)估軟件只支持網(wǎng)頁信息、不支持其他媒體形式、廣告效用評(píng)測不準(zhǔn)確的問題,提供一種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)測方法。為了解決上述技術(shù)問題,本發(fā)明結(jié)合具體實(shí)施例公布了如下技術(shù)方案—種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,包括如下步驟動(dòng)態(tài)收取網(wǎng)絡(luò)數(shù)據(jù),對(duì)多媒體內(nèi)容進(jìn)行處理;對(duì)多媒體內(nèi)容進(jìn)行分析,抽取特征,建立特征庫;基于XML模型建立特征管理知識(shí)庫和語義關(guān)系庫;采用本體庫技術(shù)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)廣告內(nèi)容的語義表示;利用基于Agent的自動(dòng)語義匹配技術(shù),實(shí)現(xiàn)文本、語音、視頻、圖片等的快速準(zhǔn)確匹配;通過TOB數(shù)據(jù)挖掘,將用戶基礎(chǔ)資料、用戶行為、用戶關(guān)鍵字的表現(xiàn)生成大量的記錄文件和信息庫,從而獲得瀏覽率、點(diǎn)擊率、路徑、關(guān)聯(lián)規(guī)則、序列模式和統(tǒng)計(jì)特征等指標(biāo), 對(duì)其進(jìn)行深入挖掘分析,從而對(duì)廣告效果進(jìn)行評(píng)估。進(jìn)一步的,上述的多媒體內(nèi)容處理步驟進(jìn)一步包括內(nèi)容獲取步驟,用于對(duì)原始媒體進(jìn)行處理,提取內(nèi)容;內(nèi)容描述步驟,用于將提取出的內(nèi)容采用標(biāo)準(zhǔn)形式進(jìn)行描述;內(nèi)容操縱步驟,用于對(duì)內(nèi)容進(jìn)行查詢、檢索、搜索、摘要、瀏覽、過濾等操作。進(jìn)一步的,上述的TOB數(shù)據(jù)挖掘步驟進(jìn)一步包括
對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;對(duì)數(shù)據(jù)進(jìn)行挖掘,得到用戶的共同使用模式和概念空間;根據(jù)上一步驟得到的結(jié)果,為當(dāng)前用戶提供個(gè)性化推薦。進(jìn)一步的,上述方法進(jìn)一步包括設(shè)置動(dòng)態(tài)數(shù)據(jù)庫,用于統(tǒng)計(jì)檢驗(yàn)廣告點(diǎn)擊次數(shù),當(dāng)檢測到同一 IP地址一天之內(nèi)針對(duì)同一廣告進(jìn)行點(diǎn)擊時(shí),其點(diǎn)擊次數(shù)記為1 ;當(dāng)檢測到同一臺(tái)計(jì)算機(jī)在同一天在同一網(wǎng)站進(jìn)行廣告點(diǎn)擊時(shí),點(diǎn)擊次數(shù)超過設(shè) 定閾值時(shí),其點(diǎn)擊次數(shù)記為設(shè)定閾值。進(jìn)一步的,上述方法進(jìn)一步包括防作弊點(diǎn)擊步驟,包括記錄點(diǎn)擊的來路頁面后,人工巡查廣告放置是否正確,查看旁邊是否有引導(dǎo)性不良語句;記錄放置廣告頁面的來路,如果該頁面沒有來路,則判斷這個(gè)頁面的流量非連接
流量;設(shè)置當(dāng)訪問者打開網(wǎng)站頁面N秒內(nèi)點(diǎn)擊廣告為作弊點(diǎn)擊;當(dāng)幾次點(diǎn)擊的時(shí)間差完全一致時(shí),判斷為作弊點(diǎn)擊;或是在N秒內(nèi)立即關(guān)閉的,判斷為作弊點(diǎn)擊;對(duì)于同一個(gè)鼠標(biāo)值,只記一次點(diǎn)擊。本發(fā)明具有如下優(yōu)點(diǎn)本發(fā)明構(gòu)建了瀏覽率、點(diǎn)擊率、路徑、關(guān)聯(lián)規(guī)則、序列模式和特征統(tǒng)計(jì)等分析指標(biāo)的廣告效用評(píng)測體系,建立了基于用戶背景與能力、訪問行為、消費(fèi)偏好、購買模式等特征信息的受眾行為模型,為電子商務(wù)產(chǎn)品和服務(wù)信息的精準(zhǔn)推送提供技術(shù)支撐。研發(fā)了智能防作弊點(diǎn)擊技術(shù),建立了網(wǎng)頁訪問的動(dòng)態(tài)參數(shù)與判斷規(guī)則庫,動(dòng)態(tài)設(shè)置過濾機(jī)制和警示模塊中的參數(shù)及權(quán)重,構(gòu)建了多層次的作弊識(shí)別系統(tǒng),有效剔除了 “作弊點(diǎn)擊”,提高了廣告效用評(píng)測的準(zhǔn)確性。針對(duì)廣告信息的多媒體特征,提出了廣告內(nèi)容的特征分析和語義描述方法,開發(fā)了海量廣告信息的搜索引擎,支持多媒體廣告信息的快速搜索和匹配。
圖1系統(tǒng)結(jié)構(gòu)圖;圖2內(nèi)容處理示意圖。
具體實(shí)施例方式本發(fā)明針對(duì)互聯(lián)網(wǎng)廣告的多媒體特征,包括文本、語音、視頻、圖片等,對(duì)互聯(lián)網(wǎng)廣告內(nèi)容中的海量信息進(jìn)行特征抽取,建立基于內(nèi)容的特征庫;然后基于XML的模型建立互聯(lián)網(wǎng)廣告內(nèi)容特征關(guān)聯(lián)知識(shí)庫和語義關(guān)系表,采用Ontology技術(shù)實(shí)現(xiàn)廣告內(nèi)容的語義表示;再利用基于Agent的自動(dòng)語義匹配技術(shù),支持商務(wù)信息的文本、語音、視頻、圖片等快速準(zhǔn)確搜索和匹配。如圖1所示。在此基礎(chǔ)上,構(gòu)建互聯(lián)網(wǎng)廣告效用評(píng)估分析體系,通過建立廣告受眾行為模型,為廣告的精準(zhǔn)推送和服務(wù)提供技術(shù)支撐。本發(fā)明是針對(duì)互聯(lián)網(wǎng)廣告的多媒體特征,要求實(shí)現(xiàn)商務(wù)信息文本、語音、視頻、圖片等的快速搜索與匹配,因此多媒體內(nèi)容的特征選取和建立識(shí)別模型就顯得格為重要。
多媒體內(nèi)容的處理步驟分為三大部分內(nèi)容獲取、內(nèi)容描述和內(nèi)容操縱。也可將其看成是內(nèi)容處理的三個(gè)步驟,即先對(duì)原始媒體進(jìn)行處理,提取內(nèi)容,然后用標(biāo)準(zhǔn)形式對(duì)它們進(jìn)行描述,以支持各種內(nèi)容的操縱。內(nèi)容處理如圖2所示。 內(nèi)容獲取(Populating)通過對(duì)各種的而獲得媒體內(nèi)容的過程。多媒體數(shù)據(jù)具有時(shí)空特性,內(nèi)容的一個(gè)重要成分是空間和時(shí)間結(jié)構(gòu)。內(nèi)容的結(jié)構(gòu)化(Structuring)就是分割(Segmenting)出圖像對(duì)象、視頻的時(shí)間結(jié)構(gòu)、運(yùn)動(dòng)對(duì)象,以及這些對(duì)象之間的關(guān)系。特征抽取(Extraction)就是提取顯著的區(qū)分特征和人的視覺(Visual)、聽覺(Auditory)方面的感知特征來表示媒體和媒體對(duì)象的性質(zhì)。內(nèi)容描述(Description)描述在以上過程中獲取的內(nèi)容。目前,MPEG-7專家組正在制定多媒體內(nèi)容描述標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)主要采用描述子(Descriptor)和描述模式(Scheme) 來分別描述媒體的特性及其關(guān)系。內(nèi)容操縱(Manipulating)針對(duì)內(nèi)容的用戶操作和應(yīng)用。有許多這方面的名詞和術(shù)語。查詢(Query)是面向用戶的術(shù)語,多用于數(shù)據(jù)庫操作。檢索(Retrieval)是在索引 (Index)支持下的快速信息獲取方式。搜索(Search)常用于Internet的搜索引擎,含有搜尋的意思,又有在大規(guī)模信息庫中搜尋信息的含義。摘要(Summarization,Excerpt)對(duì)多媒體中的時(shí)基媒體(如視頻和音頻)是一種特殊的操作。我們熟知文獻(xiàn)摘要的含義,在內(nèi)容技術(shù)支持下,也可以對(duì)視頻和音頻媒體進(jìn)行摘要,獲得一目了然的全局視圖和概要。同樣,用戶可以通過瀏覽(Browsing)操作,線性或非線性地存取結(jié)構(gòu)化的內(nèi)容。另外,基于內(nèi)容的技術(shù)不僅僅用在多媒體信息的檢索和搜索方面,檢索僅僅是信息存取的一個(gè)方面。過濾(Filtering)就是與檢索相反的一種信息存取方式。用過濾技術(shù)可以實(shí)現(xiàn)個(gè)人化的信息服務(wù)。本體映射技術(shù)是實(shí)現(xiàn)商品供求語義匹配的核心。本體映射通過定義條件規(guī)則、函數(shù)、邏輯以及表與關(guān)系的集合來實(shí)現(xiàn)不同本體間的映射,是完成本體集成的重要一步工作 (本體集成的概念包括本體重用、本體合并、本體修正等,在這些過程中建立準(zhǔn)確的本體映射是基礎(chǔ)性的任務(wù))?;蛘哒f,本體映射是不同的本體在概念層語義相關(guān)聯(lián),源本體的實(shí)例根據(jù)語義關(guān)聯(lián)的關(guān)系轉(zhuǎn)換為目的本體。本體映射技術(shù)主要包括一對(duì)一映射、定義一個(gè)共享本體作為標(biāo)準(zhǔn),以其作為中介進(jìn)行映射、基于資源的相似性而使用本體聚類等方法。在本項(xiàng)目中,我們考慮到軟件的實(shí)用性,采用了定義共享本體作為中介進(jìn)行映射的方式。Agent和多Agent系統(tǒng)基于分布式人工智能的研究,已成為分布式人工智能(DAD 的一個(gè)熱點(diǎn),并且被賦予高于早期的分布式問題求解型的人工智能的一些特點(diǎn)。多Agent 系統(tǒng)(MultiAgent System)是一個(gè)高度交叉的研究領(lǐng)域。在一個(gè)個(gè)標(biāo)準(zhǔn)的多Agent系統(tǒng)口必須包含一些通過通信交互的Agent。這些Agent可以感知環(huán)境并在環(huán)境中動(dòng)作,不同的 Agent可以控制或影響環(huán)境的不同部分。若有時(shí)這些影響有重疊部分,則證明了這些Agent 之間直接或間接存在著某種依賴關(guān)系。傳統(tǒng)的并行數(shù)據(jù)庫的UNION查詢處理流程一般分為三個(gè)步驟第一步數(shù)據(jù)重新分布,即根據(jù)分布算法將數(shù)據(jù)分布到執(zhí)行節(jié)點(diǎn)上;第二步子查詢并行執(zhí)行,即在所有執(zhí)行節(jié)點(diǎn)并行執(zhí)行子查詢;第三步結(jié)果匯總,把執(zhí)行節(jié)點(diǎn)的查詢結(jié)果匯總,返回給用戶。
這種處理方式導(dǎo)致UNION查詢成為數(shù)據(jù)庫中代價(jià)最大的幾個(gè)操作之一。在海量并行數(shù)據(jù)庫應(yīng)用系統(tǒng)中,由于系統(tǒng)具有海量性、高速性、連續(xù)性等特點(diǎn),從而對(duì)UNION查詢的執(zhí)行效率以及查詢性能提出了更高的要求。然而,即使是最好的查詢方案也不得不遍歷分布在各個(gè)數(shù)據(jù)庫節(jié)點(diǎn)上的全部數(shù)據(jù)源才能找到滿足查詢條件的完整實(shí)體集。隨著數(shù)據(jù)源的數(shù)量和查詢條件的數(shù)量的增加,UNION查詢所要做的數(shù)據(jù)傳輸量也將迅速的增加。系統(tǒng)需要大量的網(wǎng)絡(luò)和磁盤I/O開銷,以至于在海量并行數(shù)據(jù)庫環(huán)境下,即使是很簡單的查詢統(tǒng)計(jì)也變得很難實(shí)現(xiàn)。 Web挖掘分三類第一類是Web內(nèi)容挖掘(Web Content Mining)從大量的Web數(shù)據(jù)中發(fā)現(xiàn)并抽取有用信息的過程;第二類是Web使用挖掘(Web Usage Mining)通過挖掘用戶的Web日志(log)記錄,發(fā)現(xiàn)用戶訪問Web頁面的模式,得到有價(jià)值的信息 ’第三類是 Web結(jié)構(gòu)挖掘(Web Structure Mining)從WWW鏈接結(jié)構(gòu)關(guān)系網(wǎng)絡(luò)中推導(dǎo)出知識(shí)。利用Web挖掘方法分析Web訪問日志可以幫助人們根據(jù)用戶群訪問的相似性,進(jìn)行頁面和用戶聚類分析,直接對(duì)用戶進(jìn)行頁面內(nèi)容過濾、傳送,為用戶提供個(gè)性化的服務(wù)。 個(gè)性化服務(wù)技術(shù)一般分為三類第一類是企業(yè)Web站點(diǎn)管理員根據(jù)用戶統(tǒng)計(jì)數(shù)、靜態(tài)個(gè)性文件或用戶會(huì)話(User Session)記錄制定一系列規(guī)則并利用這些規(guī)則為特定用戶提供特定服務(wù);第二類是基于內(nèi)容的過濾(Content-basedFiltering)系統(tǒng),通過用戶歷史訪問內(nèi)容挖掘用戶訪問模式并將該模式需求同URL(Uniform Resource Locator)結(jié)合以滿足用戶個(gè)性化需求;第三種是協(xié)作過濾(Collaborative Filtering)系統(tǒng),通過用戶群的相似性進(jìn)行內(nèi)容推薦。WEB數(shù)據(jù)挖掘技術(shù)進(jìn)一步包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;對(duì)數(shù)據(jù)進(jìn)行挖掘,得到用戶的共同使用模式和概念空間;根據(jù)上一步驟得到的結(jié)果,為當(dāng)前用戶提供個(gè)性化推薦。首先對(duì)站點(diǎn)文檔以及服務(wù)器日志進(jìn)行數(shù)據(jù)預(yù)處理,分別得到倒置文檔結(jié)構(gòu)及事務(wù)文件,并對(duì)其表示形式進(jìn)行統(tǒng)一化,再分別對(duì)它們進(jìn)行聚類,得到相應(yīng)的概念空間及使用模式,通過對(duì)概念空間和使用模式的進(jìn)一步處理,得到用戶的共同概念空間和共同使用模式 (分別表示用戶在內(nèi)容聚類和使用聚類中的重疊區(qū)域)。由內(nèi)容挖掘和使用挖掘分別得到用戶共同概念空間和共同使用模式,作為輸入數(shù)據(jù)為推薦機(jī)所使用。推薦機(jī)是Web個(gè)性化系統(tǒng)的在線部分,其任務(wù)是根據(jù)當(dāng)前用戶會(huì)話進(jìn)行推薦,即推薦出與當(dāng)前用戶會(huì)話最匹配的對(duì)象的集合(廣告、鏈接、產(chǎn)品等)。通過TOB數(shù)據(jù)挖掘技術(shù),建立了基于用戶背景與能力、用戶訪問行為、消費(fèi)偏好、 購買模式等特征信息的網(wǎng)絡(luò)廣告受眾行為模型,為商務(wù)網(wǎng)絡(luò)廣告的精準(zhǔn)推送和服務(wù)提供了技術(shù)支撐。網(wǎng)絡(luò)廣告效果評(píng)測體系中指標(biāo)包括瀏覽率、點(diǎn)擊率、路徑、關(guān)聯(lián)規(guī)則、序列模式以及特征統(tǒng)計(jì)等,體系對(duì)用戶行為進(jìn)行了強(qiáng)大的綜合性的全面評(píng)測。網(wǎng)絡(luò)廣告效用評(píng)測需要的數(shù)據(jù)主要來自三個(gè)方面用戶的背景信息,主要來自用戶的登記表。有基本信息和附加信息構(gòu)成,包括了用戶實(shí)體基礎(chǔ)資料,用戶教育實(shí)體基本資料,用戶工作實(shí)體基礎(chǔ)資料,用戶社會(huì)關(guān)系實(shí)體基礎(chǔ)資料等等。這是獲取有效的,潛在的信息,實(shí)施用戶行為分析,提升和改進(jìn)用戶體驗(yàn)的基礎(chǔ)數(shù)據(jù)。
來自用戶的點(diǎn)擊流,主要用于考查用戶的行為表現(xiàn)。我們構(gòu)建了強(qiáng)大,健壯的用戶點(diǎn)擊流信息庫,以數(shù)據(jù)分析軟件和自主分析技術(shù)系統(tǒng)作為支撐,實(shí)施數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn),分析用戶的個(gè)人偏好,性格特征,職業(yè)背景等信息,從而匹配出用戶感興趣的廣告,實(shí)現(xiàn)數(shù)據(jù)模式的非平凡過程。用戶的關(guān)鍵詞搜索,主要用于關(guān)注用戶的需求表現(xiàn)。根據(jù)用戶自我需求的定位和確定,系統(tǒng)可以數(shù)據(jù)建模,搜索優(yōu)化,抽樣評(píng)估已達(dá)到“送廣告上門,,的目的,以滿足用戶的定制需求,個(gè)性需求,以人為本,精準(zhǔn)的匹配所需求的廣告。以此為基礎(chǔ),本發(fā)明利用計(jì)算機(jī),網(wǎng)絡(luò),數(shù)據(jù)挖掘等相關(guān)技術(shù),智能,高效,快速,準(zhǔn)確的對(duì)數(shù)據(jù)進(jìn)行分析,挖掘,利用。從而匹配出用戶當(dāng)前最需要和預(yù)期需要的廣告信息,進(jìn)而了解和理解用戶的消費(fèi)偏好、購買模式,行為表現(xiàn),預(yù)期需求。構(gòu)建網(wǎng)絡(luò)廣告受眾行為模型,為商務(wù)網(wǎng)絡(luò)廣告的精準(zhǔn)推送和服務(wù)提供了技術(shù)支撐。為了提高網(wǎng)絡(luò)廣告效用評(píng)測的準(zhǔn)確性,本發(fā)明還包括防無效點(diǎn)擊步驟和防作弊點(diǎn)
擊步驟。建立網(wǎng)頁訪問的動(dòng)態(tài)參數(shù)與判斷規(guī)則庫,基于聯(lián)接機(jī)制和方法,動(dòng)態(tài)設(shè)置過濾機(jī)制和警示模塊中的參數(shù)與權(quán)重,搭建了技術(shù)+人工干預(yù)的四層無效點(diǎn)擊和反作弊點(diǎn)擊機(jī)制。前兩層是自動(dòng)處理,無須人工干預(yù)的,而后面兩層則加入人工干預(yù)因素,剔除了無效點(diǎn)擊和作弊點(diǎn)擊,節(jié)約成本,提高網(wǎng)絡(luò)廣告效用評(píng)測的準(zhǔn)確性。無效點(diǎn)擊指的是非刻意安排下的點(diǎn)擊行為,與有效點(diǎn)擊相反,也可以說是一種統(tǒng)計(jì)方法,如同一個(gè)IP —天之內(nèi)針對(duì)同一個(gè)廣告的點(diǎn)擊都只算一次;只有廣告打開完整才統(tǒng)計(jì);客戶端禁止使用cookie的點(diǎn)擊無效;同一臺(tái)計(jì)算機(jī)同一天在同一頁面同一廣告位只能點(diǎn)擊廣告N次,這個(gè)N是動(dòng)態(tài)的,系統(tǒng)會(huì)不定期進(jìn)行合理的調(diào)整;同一臺(tái)計(jì)算機(jī)同一天在同一網(wǎng)站點(diǎn)擊廣告只有前N次有效,這個(gè)N值也是動(dòng)態(tài)的。將這些參數(shù)建立動(dòng)態(tài)數(shù)據(jù)庫,防止無效點(diǎn)擊行為計(jì)入費(fèi)用點(diǎn)擊,為廣告主節(jié)省推廣成本。所謂防作弊點(diǎn)擊,與無效點(diǎn)擊不同,主要是人為刻意進(jìn)行的點(diǎn)擊行為,如利用自動(dòng)點(diǎn)擊程序或者專門為點(diǎn)擊廣告而設(shè)計(jì)的應(yīng)用軟件;雇用低價(jià)勞力或者誘導(dǎo)他人點(diǎn)擊廣告鏈接;發(fā)布者人工點(diǎn)擊他們頁面上的廣告;廣告客戶人工點(diǎn)擊他們競爭者的廣告;遭受競爭者或其他惡意者報(bào)復(fù)的發(fā)布者等。本項(xiàng)目針對(duì)此類作弊點(diǎn)擊行為創(chuàng)新性的采用“反偽造點(diǎn)擊技術(shù)”,除過濾無效點(diǎn)擊外,還設(shè)立點(diǎn)擊比率上限設(shè)置,目前富媒體廣告的點(diǎn)擊率在2%到 5%,普通圖片點(diǎn)擊在0. 到1%,與圖片的創(chuàng)意有關(guān),所以設(shè)置的點(diǎn)擊率超過5%即提示可能作弊點(diǎn)擊;另外通過來源統(tǒng)計(jì)防止作弊,1)記錄點(diǎn)擊的來路頁面后,人工巡查廣告放置是否正確,查看旁邊是否有引導(dǎo)性不良語句;2)記錄放置廣告頁面的來路,如果該頁面沒有來路,則判斷這個(gè)頁面的流量非連接流量;還有時(shí)間順差防止作弊,即設(shè)置當(dāng)訪問者打開網(wǎng)站頁面N秒內(nèi)點(diǎn)擊廣告為作弊廣告,當(dāng)幾次點(diǎn)擊的時(shí)間差完全一致時(shí),也判斷為作弊點(diǎn)擊,或是在N秒內(nèi)立即關(guān)閉的,這里的N為動(dòng)態(tài)設(shè)置,可以進(jìn)行合理調(diào)整。同時(shí)還根據(jù)鼠標(biāo)值,因?yàn)楫?dāng)你按下鼠標(biāo)時(shí),都會(huì)有一個(gè)坐標(biāo)值,同一個(gè)鼠標(biāo)值,我們只記一次點(diǎn)擊,而且每次點(diǎn)擊都會(huì)產(chǎn)生鼠標(biāo)的KEYUP和KEYD0WN的行為,如果未能捕獲這個(gè)值,也視為作弊點(diǎn)擊給予標(biāo)記或報(bào)警。
權(quán)利要求
1.一種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,包括如下步驟 動(dòng)態(tài)收取網(wǎng)絡(luò)數(shù)據(jù),對(duì)多媒體內(nèi)容進(jìn)行處理;對(duì)多媒體內(nèi)容進(jìn)行分析,抽取特征,建立特征庫; 基于XML模型建立特征管理知識(shí)庫和語義關(guān)系庫; 采用本體庫技術(shù)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)廣告內(nèi)容的語義表示;利用基于Agent的自動(dòng)語義匹配技術(shù),實(shí)現(xiàn)文本、語音、視頻、圖片等的快速準(zhǔn)確匹配; 通過WEB數(shù)據(jù)挖掘,將用戶基礎(chǔ)資料、用戶行為、用戶關(guān)鍵字的表現(xiàn)生成大量的記錄文件和信息庫,從而獲得瀏覽率、點(diǎn)擊率、路徑、關(guān)聯(lián)規(guī)則、序列模式和統(tǒng)計(jì)特征等指標(biāo),對(duì)其進(jìn)行深入挖掘分析,從而對(duì)廣告效果進(jìn)行評(píng)估。
2.根據(jù)權(quán)利要求1所述的富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,所述方法進(jìn)一步包括通過WEB數(shù)據(jù)挖掘技術(shù),建立基于用戶背景與能力、用戶訪問行為、消費(fèi)偏好、購買模式等特征信息的網(wǎng)絡(luò)廣告受眾行為模型,為商務(wù)網(wǎng)絡(luò)廣告的精準(zhǔn)推送和服務(wù)提供依據(jù)。
3.根據(jù)權(quán)利要求1所述的富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,所述的多媒體內(nèi)容處理步驟進(jìn)一步包括內(nèi)容獲取步驟,用于對(duì)原始媒體進(jìn)行處理,提取內(nèi)容;內(nèi)容描述步驟,用于將提取出的內(nèi)容采用標(biāo)準(zhǔn)形式進(jìn)行描述;內(nèi)容操縱步驟,用于對(duì)內(nèi)容進(jìn)行查詢、檢索、搜索、摘要、瀏覽、過濾等操作。
4.根據(jù)權(quán)利要求1所述的富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,所述的WEB數(shù)據(jù)挖掘步驟進(jìn)一步包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;對(duì)數(shù)據(jù)進(jìn)行挖掘,得到用戶的共同使用模式和概念空間; 根據(jù)上一步驟得到的結(jié)果,為當(dāng)前用戶提供個(gè)性化推薦。
5.根據(jù)權(quán)利要求1所述的富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,所述方法進(jìn)一步包括設(shè)置動(dòng)態(tài)數(shù)據(jù)庫,用于統(tǒng)計(jì)檢驗(yàn)廣告點(diǎn)擊次數(shù),當(dāng)檢測到同一 IP地址一天之內(nèi)針對(duì)同一廣告進(jìn)行點(diǎn)擊時(shí),其點(diǎn)擊次數(shù)記為1 ;當(dāng)檢測到同一臺(tái)計(jì)算機(jī)在同一天在同一網(wǎng)站進(jìn)行廣告點(diǎn)擊時(shí),點(diǎn)擊次數(shù)超過設(shè)定閾值時(shí),其點(diǎn)擊次數(shù)記為設(shè)定閾值。
6.根據(jù)權(quán)利要求1所述的富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,其特征在于,所述方法進(jìn)一步包括防作弊點(diǎn)擊步驟,包括記錄點(diǎn)擊的來路頁面后,人工巡查廣告放置是否正確,查看旁邊是否有引導(dǎo)性不良語句;記錄放置廣告頁面的來路,如果該頁面沒有來路,則判斷這個(gè)頁面的流量非連接流量;設(shè)置當(dāng)訪問者打開網(wǎng)站頁面N秒內(nèi)點(diǎn)擊廣告為作弊點(diǎn)擊;當(dāng)幾次點(diǎn)擊的時(shí)間差完全一致時(shí),判斷為作弊點(diǎn)擊;或是在N秒內(nèi)立即關(guān)閉的,判斷為作弊點(diǎn)擊; 對(duì)于同一個(gè)鼠標(biāo)值,只記一次點(diǎn)擊。
全文摘要
本發(fā)明涉及廣告內(nèi)容匹配、效果評(píng)估技術(shù),提供了一種富媒體互聯(lián)網(wǎng)廣告內(nèi)容匹配、效果評(píng)估方法,所述方法包括如下步驟動(dòng)態(tài)收取網(wǎng)絡(luò)數(shù)據(jù),對(duì)多媒體內(nèi)容進(jìn)行處理;對(duì)多媒體內(nèi)容進(jìn)行分析,抽取特征,建立特征庫;基于XML模型建立特征管理知識(shí)庫和語義關(guān)系庫;采用本體庫技術(shù)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)廣告內(nèi)容的語義表示;利用基于Agent的自動(dòng)語義匹配技術(shù),實(shí)現(xiàn)文本、語音、視頻、圖片等的快速準(zhǔn)確匹配;通過WEB數(shù)據(jù)挖掘,將用戶基礎(chǔ)資料、用戶行為、用戶關(guān)鍵字的表現(xiàn)生成大量的記錄文件和信息庫,從而獲得瀏覽率、點(diǎn)擊率、路徑、關(guān)聯(lián)規(guī)則、序列模式和統(tǒng)計(jì)特征等指標(biāo),對(duì)其進(jìn)行深入挖掘分析,從而對(duì)廣告效果進(jìn)行評(píng)估。
文檔編號(hào)G06F17/30GK102254265SQ20101017480
公開日2011年11月23日 申請(qǐng)日期2010年5月18日 優(yōu)先權(quán)日2010年5月18日
發(fā)明者王健, 胡飛陽, 蘇琪, 項(xiàng)東方 申請(qǐng)人:北京首家通信技術(shù)有限公司