亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

將圖像分類為廣告圖像或非廣告圖像的制作方法

文檔序號(hào):6477505閱讀:223來源:國知局
專利名稱:將圖像分類為廣告圖像或非廣告圖像的制作方法
將圖像分類為廣告圖像或非廣告圖像背景許多網(wǎng)站的提供者依賴在線廣告作為收入的來源。這些提供者可能依賴第三方廣 告服務(wù)器來提供被包括在他們的網(wǎng)站的網(wǎng)頁上的廣告。在網(wǎng)頁被生成時(shí),可在具有引用廣 告服務(wù)器的超鏈接的網(wǎng)頁上分配廣告空間。在該網(wǎng)頁被瀏覽器顯示時(shí),瀏覽器通過向廣告 服務(wù)器發(fā)送請求來解析該超鏈接。廣告服務(wù)器標(biāo)識(shí)合適的廣告并將該廣告返回瀏覽器,該 廣告可以包括到關(guān)于正在廣告的事物的網(wǎng)頁的鏈接。瀏覽器隨后將該廣告顯示為網(wǎng)頁的一 部分。在用戶選擇該廣告的超鏈接時(shí),網(wǎng)頁的提供者可以得到該廣告的補(bǔ)償。為提高增加收入的機(jī)會(huì),網(wǎng)頁的提供者可以使網(wǎng)頁擠滿廣告。然而,網(wǎng)頁擠滿廣告 可能有負(fù)面的結(jié)果。例如,諸如手持式個(gè)人計(jì)算機(jī)、蜂窩電話、以及個(gè)人數(shù)字助理(“PDA”) 等移動(dòng)設(shè)備正成為越來越流行的訪問因特網(wǎng)的方式。不幸的是,使用這些移動(dòng)設(shè)備來訪問 具有許多廣告的網(wǎng)頁的用戶體驗(yàn)不令人滿意。首先,因?yàn)檫@些移動(dòng)設(shè)備具有小顯示區(qū)域,難 以有效地在此類小顯示區(qū)域中顯示具有許多廣告的網(wǎng)頁。第二,因?yàn)檫@些移動(dòng)設(shè)備通常具 有相對較慢的通信鏈接(例如,經(jīng)由蜂窩電話網(wǎng)絡(luò)),所以下載擠滿廣告的被訪問的網(wǎng)頁可 花費(fèi)難以接收的長時(shí)間。第三,因?yàn)橐苿?dòng)設(shè)備具有有限的計(jì)算能力,所以擠滿廣告的網(wǎng)頁的 呈現(xiàn)也可以花費(fèi)難以接受的長時(shí)間。作為另一示例,許多搜索引擎服務(wù)提供對可經(jīng)由網(wǎng)頁訪問的圖像的搜索。這 些搜索引擎服務(wù)允許用戶搜索用戶可能感興趣的圖像。在用戶提交包含搜索項(xiàng)的搜索 請求(即,查詢)之后,搜索引擎服務(wù)標(biāo)識(shí)可能與這些搜索項(xiàng)相關(guān)的圖像。為快速標(biāo)識(shí) 相關(guān)的圖像,搜索引擎服務(wù)可維護(hù)關(guān)鍵詞到圖像的映射或索引。該映射可以通過“爬尋 (crawl)”web(g卩,萬維網(wǎng))以標(biāo)識(shí)包含圖像的網(wǎng)頁的關(guān)鍵詞來生成。為爬尋web,搜索引擎 服務(wù)可使用根網(wǎng)頁列表來標(biāo)識(shí)能通過這些根網(wǎng)頁訪問的所有網(wǎng)頁。只要搜索引擎服務(wù)標(biāo)識(shí) 了網(wǎng)頁上的圖像,它就將該圖像添加到映射。因?yàn)榫W(wǎng)頁的許多圖像是作為廣告的一部分的 圖像,映射將包含搜索圖像的用戶通常對其不感興趣的廣告的圖像。在存在大量廣告的圖 像時(shí),搜索引擎服務(wù)生成映射花費(fèi)更長的時(shí)間;該映射消耗更多的系統(tǒng)資源;訪問該映射 花費(fèi)更長的時(shí)間;且搜索結(jié)果可能包含用戶對其不感興趣的許多廣告的圖像。概述提供了將顯示頁面的圖像作為廣告圖像或非廣告圖像的標(biāo)識(shí)。廣告圖像分類系統(tǒng) 訓(xùn)練二元分類器來將圖像分類成廣告圖像或非廣告圖像并隨后使用該二元分類器來將諸 如網(wǎng)頁等顯示頁面的圖像分類成廣告圖像或非廣告圖像。在訓(xùn)練階段期間,分類系統(tǒng)收集 具有圖像的網(wǎng)頁并標(biāo)識(shí)這些網(wǎng)頁的圖像。分類系統(tǒng)隨后為每一圖像輸入一標(biāo)簽,以指示該 圖像是廣告圖像還是非廣告圖像。分類系統(tǒng)隨后為每一圖像生成包含從圖像及其網(wǎng)頁中導(dǎo) 出的特征的特征向量。分類系統(tǒng)訓(xùn)練二元分類器來使用包括特征向量和圖像的標(biāo)簽的訓(xùn)練 數(shù)據(jù)來分類圖像。在分類階段期間,分類系統(tǒng)輸入具有圖像的網(wǎng)頁并為該圖像生成特征向 量。分類系統(tǒng)隨后將已訓(xùn)練的二元分類器應(yīng)用于該特征向量以生成指示圖像是廣告圖像還 是非廣告圖像的分?jǐn)?shù)。提供本概述是為了以簡化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本概述不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于幫助確定 所要求保護(hù)的主題的范圍。附圖簡述

圖1是示出在一個(gè)實(shí)施例中的分類系統(tǒng)的各組件的框圖。圖2是示出某些實(shí)施例中在生成可視布局特征中使用的各因子的框圖。圖3是例示某些實(shí)施例中分類系統(tǒng)的生成分類器組件的處理的流程圖。圖4是例示某些實(shí)施例中分類系統(tǒng)的生成特征向量組件的處理的流程圖。圖5是例示某些實(shí)施例中分類系統(tǒng)的生成圖像特征向量組件的處理的流程圖。圖6是例示某些實(shí)施例中分類系統(tǒng)的學(xué)習(xí)相關(guān)特征組件的處理的流程圖。圖7是例示某些實(shí)施例中分類系統(tǒng)的分類圖像組件的處理的流程圖。圖8是例示某些實(shí)施例中分類系統(tǒng)的特征生成組件的處理的流程圖。詳細(xì)描述提供了將顯示頁面的圖像作為廣告圖像或非廣告圖像的標(biāo)識(shí)。在某些實(shí)施例中, 廣告圖像分類系統(tǒng)訓(xùn)練二元分類器來將圖像分類成廣告圖像或非廣告圖像,并隨后使用該 二元分類器來將諸如網(wǎng)頁等顯示頁面的圖像分類成廣告圖像或非廣告圖像。在訓(xùn)練階段期 間,分類系統(tǒng)收集具有圖像的網(wǎng)頁并標(biāo)識(shí)這些網(wǎng)頁的圖像。分類系統(tǒng)隨后為每一圖像輸入 一標(biāo)簽,以指示該圖像是廣告圖像還是非廣告圖像。分類系統(tǒng)隨后為每一圖像生成包含從 圖像及其網(wǎng)頁中導(dǎo)出的特征的特征向量。例如,特征可包括圖像的尺寸、圖像在網(wǎng)頁上的左 和頂坐標(biāo)、其網(wǎng)頁上具有相同左坐標(biāo)的圖像的數(shù)量、圖像的高度等。分類系統(tǒng)訓(xùn)練二元分類 器來使用包括特征向量和圖像的標(biāo)簽的訓(xùn)練數(shù)據(jù)來分類圖像。分類系統(tǒng)可使用各種技術(shù)來 訓(xùn)練二元分類器,如支持向量機(jī)技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)、貝葉斯技術(shù)等。二元分類器在分類圖 像時(shí)可由指示給定每一特征的權(quán)重的特征權(quán)重來表示。在分類階段期間,分類系統(tǒng)輸入具 有圖像的網(wǎng)頁并為該圖像生成特征向量。分類系統(tǒng)隨后將二元分類器的權(quán)重應(yīng)用于該特征 向量以生成指示圖像是廣告圖像還是非廣告圖像的分?jǐn)?shù)。二元分類器可被圖像搜索引擎服 務(wù)使用來標(biāo)識(shí)廣告圖像并在它們被添加到圖像的映射之前將這些圖像丟棄。二元分類器還 可被支持移動(dòng)設(shè)備的服務(wù)器使用來在網(wǎng)頁被提供給移動(dòng)設(shè)備之前標(biāo)識(shí)并丟棄來自網(wǎng)頁的 廣告圖像。在某些實(shí)施例中,分類系統(tǒng)在特征標(biāo)識(shí)階段期間標(biāo)識(shí)相關(guān)于圖像作為廣告圖像或 非廣告圖像的分類的特征。分類系統(tǒng)可隨后在訓(xùn)練階段期間使用這些相關(guān)特征。為標(biāo)識(shí)相 關(guān)特征,分類系統(tǒng)選擇要從其中標(biāo)識(shí)相關(guān)特征的候選特征。分類系統(tǒng)以類似于上文所述的 為訓(xùn)練階段的方式來為特征標(biāo)識(shí)階段生成包括特征向量及其標(biāo)簽的訓(xùn)練數(shù)據(jù)。然而,一個(gè) 區(qū)別可以是在特征標(biāo)識(shí)階段中使用的特征向量包括所有候選特征,而在訓(xùn)練階段中使用的 特征向量僅包括被確定為相關(guān)的候選特征。例如,候選特征可包括指示圖像的元數(shù)據(jù)是否 包含單詞“廣告”的特征和指示圖像的尺寸的另一特征。在特征標(biāo)識(shí)階段期間,分類系統(tǒng)可 確定涉及元數(shù)據(jù)的特征是不相關(guān)的而涉及尺寸的特征是相關(guān)的。因此,相關(guān)特征是候選特 征的子集。如果分類系統(tǒng)在特征標(biāo)識(shí)階段和訓(xùn)練階段兩者中使用相同的網(wǎng)頁,則該分類系 統(tǒng)可通過從特征標(biāo)識(shí)階段期間生成的特征向量復(fù)制相關(guān)特征來為訓(xùn)練階段生成特征向量。分類系統(tǒng)隨后使用自適應(yīng)增強(qiáng)技術(shù)來使用候選特征的特征向量和標(biāo)簽來訓(xùn)練分 類器將圖像分類為廣告圖像或非廣告圖像。自適應(yīng)增強(qiáng)技術(shù)為每一候選特征生成一弱分類
5器且學(xué)習(xí)每一弱分類器的權(quán)重。自適應(yīng)增強(qiáng)技術(shù)基于訓(xùn)練數(shù)據(jù)的誤分類來學(xué)習(xí)這些權(quán)重。 分類系統(tǒng)隨后選擇其權(quán)重指示它們與圖像是廣告圖像或非廣告圖像的分類相關(guān)的弱分類 器的候選特征作為相關(guān)特征。例如,分類系統(tǒng)可以選擇權(quán)重最重的那些弱分類器的候選特 征。在某些實(shí)施例中,分類系統(tǒng)將候選特征分類為文本特征、鏈接特征、可視布局特 征、或內(nèi)容特征。文本特征是從網(wǎng)頁中導(dǎo)出的、可以指示該單詞是廣告的單詞(例如,圖像 的URL、圖像的ALT串、或環(huán)繞圖像的文本)。此類單詞包括“彈出”和“廣告”。鏈接特征從與圖像相關(guān)聯(lián)的鏈接所指向的站點(diǎn)中導(dǎo)出。一個(gè)鏈接特征指示標(biāo)識(shí)圖 像的超鏈接是指向提供網(wǎng)頁的相同網(wǎng)站,還是指向不同的位置,該不同的位置可以是廣告 服務(wù)器。指向不同位置的此類超鏈接可指向廣告服務(wù)器并從而指示該圖像是廣告。另一鏈 接特征指示與圖像相關(guān)聯(lián)的超鏈接是指向提供網(wǎng)頁的相同網(wǎng)站還是指向不同的位置,該不 同的位置可以是通過其可購買被廣告的商品的網(wǎng)頁。指向不同位置的此類超鏈接可能是指 向廣告客戶的網(wǎng)頁的并因此指示該圖像是廣告??梢暡季痔卣魃婕皥D像如何在其網(wǎng)頁內(nèi)被可視地布局??梢暡季痔卣骺砂▓D像 的最左坐標(biāo)、圖像的高度、其網(wǎng)頁中具有相同最左坐標(biāo)的圖像的數(shù)量等。各種特征可被規(guī)范 化為網(wǎng)頁的寬度和高度。例如,網(wǎng)頁的X-坐標(biāo)和Y-坐標(biāo)可在0到1之間的范圍內(nèi)。內(nèi)容特征涉及圖像本身的內(nèi)容。內(nèi)容特征可包括圖像的縱橫比、圖像格式、圖像是 照片還是圖形、圖像的尺寸、圖像的不同色彩數(shù)量、圖像的灰色區(qū)域的百分比、以及圖像是 否具有高對比度的指示??v橫比特征在標(biāo)識(shí)又短又寬的橫幅廣告中可以是有用的。圖像格 式特征在標(biāo)識(shí)可帶有具有多個(gè)框架的格式的廣告圖像中可以是有用的。照片/圖形特征可 以是有用的,因?yàn)樵S多廣告圖像是包含廣告的信息的圖形。尺寸特征可以是有用的,因?yàn)閺V 告圖像需要大到足以被注意。顏色數(shù)量特征可以是有用的,因?yàn)閺V告圖像與非廣告圖像相 比通常具有的不同顏色較少?;疑俜直忍卣骺梢允怯杏玫?,因?yàn)閺V告圖像通常具有不同 的灰度作為背景。對比度特征可以是有用的,因?yàn)閺V告圖像被手動(dòng)創(chuàng)建以具有尖銳的對比 度。下表列出在一個(gè)實(shí)施例中被標(biāo)識(shí)為相關(guān)的候選特征。排名指示在特征標(biāo)識(shí)階段期 間被分配給特征的弱分類器的權(quán)重的排序。Cl表示文本特征,C2表示鏈接特征,C3表示可 視布局特征,而C4表示內(nèi)容特征。
權(quán)利要求
1.一種在計(jì)算設(shè)備中用于標(biāo)識(shí)顯示頁面的廣告圖像的方法,所述方法包括提供顯示頁面的訓(xùn)練圖像;將所述圖像標(biāo)記(301)為廣告圖像或非廣告圖像;生成(302)每一所述訓(xùn)練圖像的特征向量,所述特征向量包括從所述圖像的顯示頁面 中導(dǎo)出的特征;使用所述特征向量和所述圖像的標(biāo)簽來訓(xùn)練(305) 二元分類器;以及通過生成圖像的特征向量并將所述已訓(xùn)練的二元分類器應(yīng)用到圖像所生成的特征向 量來將所述圖像分類(701,702)為廣告圖像或非廣告圖像。
2.如權(quán)利要求1所述的方法,其特征在于,包括學(xué)習(xí)用于將圖像分類為廣告圖像和非 廣告圖像的相關(guān)特征。
3.如權(quán)利要求2所述的方法,其特征在于,所述學(xué)習(xí)包括應(yīng)用自適應(yīng)增強(qiáng)技術(shù)來學(xué)習(xí) 弱分類器的權(quán)重,每一弱分類器對應(yīng)于一特征,并選擇其權(quán)重指示它們可有效地區(qū)分廣告 圖像與非廣告圖像的那些特征作為相關(guān)特征。
4.如權(quán)利要求1所述的方法,其特征在于,圖像的所述特征包括可視布局特征和內(nèi)容 特征。
5.如權(quán)利要求4所述的方法,其特征在于,所述可視布局特征包括從下組中選擇的特 征所述圖像的頂部、右側(cè)、和左側(cè)的坐標(biāo)、所述圖像的中心的坐標(biāo)、所述圖像的寬度、所述 顯示頁面中與所述圖像具有相同的右坐標(biāo)的圖像的數(shù)量、所述顯示頁面中與所述圖像具有 相同的頂坐標(biāo)的圖像的數(shù)量、所述顯示頁面中與所述圖像具有相同的右坐標(biāo)和相同的寬度 的圖像的數(shù)量、以及所述顯示頁面中與所述圖像具有相同的頂坐標(biāo)和相同的高度的圖像的 數(shù)量。
6.如權(quán)利要求4所述的方法,其特征在于,所述內(nèi)容特征包括從下組中選擇的特征所 述圖像的尺寸、所述圖像的對比度、所述圖像是照片還是圖形、所述圖像的灰色比分比、以 及所述圖像的對比度組成。
7.如權(quán)利要求4所述的方法,其特征在于,圖像的所述特征還包括從超鏈接中導(dǎo)出的 特征。
8.如權(quán)利要求1所述的方法,其特征在于,使用支持向量機(jī)來訓(xùn)練所述二元分類器。
9.如權(quán)利要求8所述的方法,其特征在于,包括通過應(yīng)用自適應(yīng)增強(qiáng)技術(shù)來學(xué)習(xí)弱分 類器的權(quán)重以學(xué)習(xí)用于將圖像分類為廣告圖像和非廣告圖像的相關(guān)特征,每一弱分類器對 應(yīng)于一特征,且選擇其權(quán)重指示它們可有效地區(qū)分廣告圖像與非廣告圖像的那些特征作為 相關(guān)特征,且其中圖像的所述特征包括可視布局特征和內(nèi)容特征。
10.如權(quán)利要求1所述的方法,其特征在于,通過使用候選特征并選擇被所述分類器賦 予最大權(quán)重的那些特征作為相關(guān)特征來訓(xùn)練分類器以學(xué)習(xí)要被包括在所述特征向量內(nèi)的 圖像的特征。
11.一種用于以一種方法來生成用于將網(wǎng)頁的圖像分類為廣告圖像或非廣告圖像的二 元分類器的計(jì)算機(jī)可讀介質(zhì),所述方法包括提供訓(xùn)練網(wǎng)頁;標(biāo)識(shí)所述訓(xùn)練網(wǎng)頁的圖像;接收(301)用于所述圖像的、指示圖像是廣告圖像還是非廣告圖像的標(biāo)簽;生成(302)每一所述已標(biāo)識(shí)圖像的特征向量,所述特征向量包括網(wǎng)頁上的所述圖像的 可視布局特征;以及使用所述特征向量和所述圖像的標(biāo)簽來訓(xùn)練(305) 二元分類器,其中所述訓(xùn)練標(biāo)識(shí)所 述特征的權(quán)重以供在分類圖像中使用。
12.如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,包括通過生成圖像的特征向 量并將所述已訓(xùn)練的二元分類器應(yīng)用到所述圖像的所生成的特征向量來將所述圖像分類 為廣告圖像或非廣告圖像。
13.如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,包括學(xué)習(xí)用于將圖像分類為 廣告圖像和非廣告圖像的相關(guān)特征。
14.如權(quán)利要求13所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述學(xué)習(xí)包括應(yīng)用自適應(yīng)增 強(qiáng)技術(shù)來學(xué)習(xí)特征專用的弱分類器的權(quán)重,并選擇其權(quán)重指示它們可有效地區(qū)分廣告圖像 與非廣告圖像的弱分類器的那些特征作為相關(guān)特征。
15.如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,圖像的所述特征包括內(nèi)容特征。
16.如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,使用支持向量機(jī)來訓(xùn)練所述二元分類器。
17.一種用于標(biāo)識(shí)網(wǎng)頁的圖像的特征以用于將圖像分類為廣告圖像或非廣告圖像的計(jì) 算機(jī)設(shè)備,包括訓(xùn)練數(shù)據(jù)存儲(chǔ)(112),所述訓(xùn)練數(shù)據(jù)存儲(chǔ)包括網(wǎng)頁的圖像的特征向量,所述圖像被標(biāo)記 為廣告圖像或非廣告圖像,所述特征向量包括候選特征;組件(121),所述組件使用具有候選特征的特征向量和所述訓(xùn)練數(shù)據(jù)存儲(chǔ)的標(biāo)簽來訓(xùn) 練分類器;以及組件(124),所述組件選擇其權(quán)重指示它們可有效地區(qū)分廣告圖像與非廣告圖像的那 些候選特征作為用于分類圖像的特征。
18.如權(quán)利要求17所述的計(jì)算設(shè)備,其特征在于,包括訓(xùn)練二元分類器以使用所選特 征將圖像分類為廣告圖像和非廣告圖像的組件。
19.如權(quán)利要求18所述的計(jì)算設(shè)備,其特征在于,使用自適應(yīng)增強(qiáng)技術(shù)來訓(xùn)練使用所 述候選特征訓(xùn)練的所述分類器,并使用支持向量機(jī)技術(shù)來訓(xùn)練使用所述所選特征訓(xùn)練的所 述二元分類器。
20.如權(quán)利要求19所述的計(jì)算設(shè)備,其特征在于,包括通過生成圖像的所選特征的特 征向量并將所述已訓(xùn)練的二元分類器應(yīng)用到所述圖像的所生成的特征向量來將所述圖像 分類為廣告圖像或非廣告圖像的組件。
全文摘要
廣告圖像分類系統(tǒng)訓(xùn)練二元分類器來將圖像分類成廣告圖像或非廣告圖像,并隨后使用該二元分類器來將網(wǎng)頁的圖像分類成廣告圖像或非廣告圖像。在訓(xùn)練階段期間,該分類系統(tǒng)生成包括表示圖像的特征向量和指示圖像是廣告圖像還是非廣告圖像的標(biāo)簽的訓(xùn)練數(shù)據(jù)。該分類系統(tǒng)使用訓(xùn)練數(shù)據(jù)來訓(xùn)練二元分類器以分類圖像。在分類階段期間,該分類系統(tǒng)輸入具有圖像的網(wǎng)頁并為該圖像生成特征向量。該分類系統(tǒng)隨后將已訓(xùn)練的二元分類器應(yīng)用于該特征向量以生成指示圖像是廣告圖像還是非廣告圖像的分?jǐn)?shù)。
文檔編號(hào)G06Q30/00GK102138151SQ200880019701
公開日2011年7月27日 申請日期2008年6月13日 優(yōu)先權(quán)日2007年6月13日
發(fā)明者B·王, D·李, M·李, Z·李 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1