專利名稱::檢索在線廣告資源的方法和裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及網(wǎng)絡(luò)通信領(lǐng)域,特別涉及一種檢索在線廣告資源的方法和裝置。
背景技術(shù):
:在線廣告又稱網(wǎng)絡(luò)廣告或互聯(lián)網(wǎng)廣告,是指利用互聯(lián)網(wǎng)發(fā)布的廣告,包括網(wǎng)站、即時(shí)通信工具、網(wǎng)上直播軟件和下載軟件等載體上的廣告。廣告包括文字鏈接廣告、旗幟、視頻等多種形式。在線廣告資源是指可用于展示廣告創(chuàng)意的廣告位置,如網(wǎng)頁(yè)、即時(shí)通信軟件等展示廣告的位置。發(fā)布在線廣告的網(wǎng)絡(luò)媒體往往有非常繁多、復(fù)雜的在線廣告資源,例如,騰訊網(wǎng)有超過(guò)三千的在線廣告資源,廣告形式超過(guò)一百種。這些在線廣告資源往往具有不同的受眾特征、地理分布和表現(xiàn)力等屬性。源的名稱進(jìn)行匹配檢索。參見(jiàn)圖1,用戶檢索在線廣告資源時(shí),輸入關(guān)鍵詞,通過(guò)將該關(guān)鍵詞與在線廣告資源的分類名稱進(jìn)行匹配,或者將該關(guān)鍵詞與在線廣告資源的名稱進(jìn)行匹配,檢索到需要的在線廣告資源。例如,將在線廣告資源分為網(wǎng)站廣告和游戲廣告等類別,其中,在網(wǎng)站廣告中命名首頁(yè)通欄為在線廣告資源的名稱,當(dāng)用戶4企索時(shí),只有輸入的關(guān)^^定詞為首頁(yè)通欄或?yàn)榫W(wǎng)站廣告時(shí),才會(huì)找到所需的在線廣告資源。上述現(xiàn)有技術(shù)在^^索的過(guò)程中,查詢條件過(guò)少,只有當(dāng)用戶輸入的關(guān)鍵詞與在線廣告資源分類名稱完全匹配,或者與在線廣告資源名稱完全匹配時(shí),才能夠成功檢索到所需的在線廣告資源,對(duì)查詢條件要求較高,因此存在查詢結(jié)果匹配難以及;f全索結(jié)果可能遺漏有效的在線廣告資源等問(wèn)題。
發(fā)明內(nèi)容為了提高檢索在線廣告資源的準(zhǔn)確性,本發(fā)明實(shí)施例提供了一種檢索在線廣告資源的方法和裝置。所述技術(shù)方案如下一方面,本發(fā)明實(shí)施例提供了一種檢索在線廣告資源的方法,所述方法包括生成分類,并為在線廣告資源設(shè)置標(biāo)簽;將所述標(biāo)簽歸類到所述分類的類別中;接收用戶在^r索在線廣告資源時(shí)輸入的關(guān)鍵詞;將所述關(guān)^t詞歸類到所述分類的類別中;當(dāng)所述關(guān)鍵詞所屬的類別中有標(biāo)簽時(shí),將所述標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。其中,為在線廣告資源設(shè)置標(biāo)簽的步驟具體為對(duì)每個(gè)在線廣告資源,根據(jù)其屬性信息為其附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽。其中,所述屬性信息包括在線廣告資源的類別、受眾特征、地理分布和表現(xiàn)力。其中,將所述標(biāo)簽歸類到所述分類的類別中的步驟具體包括為所述分類中的每個(gè)類別選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)所述標(biāo)簽在每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;將所述標(biāo)簽歸類到最高頻率對(duì)應(yīng)的類別中。其中,將所述關(guān)鍵詞歸類到所述分類的類別中的步驟具體包括為所述分類中的每個(gè)類別選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)所述關(guān)^:詞在每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;將所述關(guān)4建詞歸類到最高頻率對(duì)應(yīng)的類別中。其中,所述關(guān)鍵詞包括待檢索的在線廣告資源的類別名稱、受眾特征信息、地理分布信息和表現(xiàn)力信息。另一方面,本發(fā)明實(shí)施例還提供了一種檢索在線廣告資源的裝置,所述裝置包括初始化模塊,用于生成分類并為在線廣告資源設(shè)置標(biāo)簽;歸類模塊,用于將所述初始化模塊設(shè)置的標(biāo)簽歸類到所述初始化模塊生成的分類的類別中,并將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞歸類到所述初始化模塊生成的分類的類別中;匹配及發(fā)送模塊,用于當(dāng)所述歸類模塊將所述關(guān)鍵詞歸入的類別中有標(biāo)簽時(shí),將所述標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。其中,所述初始化模塊具體用于生成分類,并對(duì)每個(gè)在線廣告資源,根據(jù)其屬性信息為其附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽。其中,所述歸類模塊具體包括初始化單元,用于為所述初始化模塊生成的分類中的每個(gè)類別,選擇固定數(shù)量的訓(xùn)練語(yǔ)料;標(biāo)簽統(tǒng)計(jì)比較單元,用于統(tǒng)計(jì)所述初始化模塊設(shè)置的標(biāo)簽在所述初始化單元選擇的每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;標(biāo)簽歸類單元,用于將所述初始化模塊設(shè)置的標(biāo)簽,歸類到所述標(biāo)簽統(tǒng)計(jì)比較單元比較得出的最高頻率對(duì)應(yīng)的類別中;關(guān)鍵詞統(tǒng)計(jì)比較單元,用于統(tǒng)計(jì)用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,在所述初始化單元選擇的每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;關(guān)鍵詞歸類單元,用于將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,歸類到所述關(guān)鍵詞統(tǒng)計(jì)比較單元比較得出的最高頻率對(duì)應(yīng)的類別中。上述技術(shù)方案通過(guò)生成分類并為在線廣告資源設(shè)置標(biāo)簽,將標(biāo)簽和用戶檢索的關(guān)鍵詞使用相同的規(guī)則歸類到分類的類別中,將與關(guān)鍵詞屬于相同類別的標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶,從而提高了檢索在線廣告資源的準(zhǔn)確性。通過(guò)為在線廣告資源設(shè)置標(biāo)簽,使非結(jié)構(gòu)化的信息增加了結(jié)構(gòu)化的屬性,用戶如廣告銷售人員根據(jù)與待檢索的在線廣告資源相關(guān)的受眾特征、地理分布和表現(xiàn)力等信息進(jìn)行檢索,降低了對(duì)查詢條件的要求,而且采用相同的規(guī)則歸類標(biāo)簽和關(guān)鍵詞,使檢索結(jié)果的準(zhǔn)確性和有效性大大得到增強(qiáng),有利于廣告銷售人員選擇合適的廣告資源推薦給客戶。與現(xiàn)有技術(shù)相比,不必關(guān)鍵詞與在線廣告資源名稱或分類名稱完全匹配,只要關(guān)鍵詞與標(biāo)簽被歸為同一類即可檢索到在線廣告資源,克服了查詢結(jié)果匹配難的問(wèn)題,而且避免了檢索結(jié)果可能遺漏有效的在線廣告資源等問(wèn)題。圖l是現(xiàn)有技術(shù)中4企索在線廣告資源的示意圖2是本發(fā)明實(shí)施例一提供的檢索在線廣告資源的裝置結(jié)構(gòu)圖3是圖2中的歸類沖莫塊的結(jié)構(gòu)圖4是本發(fā)明實(shí)施例二提供的檢索在線廣告資源的方法流程圖。具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。本發(fā)明實(shí)施例通過(guò)生成分類并為在線廣告資源設(shè)置標(biāo)簽,將標(biāo)簽和用戶檢索的關(guān)鍵詞使用相同的規(guī)則歸類到分類的類別中,將與關(guān)鍵詞屬于相同類別的標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶,從而提高檢索在線廣告資源的準(zhǔn)確性。實(shí)施例一參見(jiàn)圖2,本發(fā)明實(shí)施例提供了一種檢索在線廣告資源的裝置,具體包括初始化模塊101,用于生成分類并為在線廣告資源設(shè)置標(biāo)簽;初始化模塊101生成分類時(shí)可以按照多種規(guī)則進(jìn)行分類,生成的分類可以為樹(shù)型結(jié)構(gòu),即生成分類樹(shù),如按照行業(yè)劃分類別并生成分類樹(shù),或者按照產(chǎn)品劃分類別并生成分類樹(shù),也可以按照在線廣告資源劃分類別并生成分類樹(shù)等等;歸類模塊102,用于將初始化模塊101設(shè)置的標(biāo)簽歸類到初始化模塊101生成的分類的類別中,并將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞歸類到初始化模塊101生成的分類的類別中;用戶輸入的關(guān)鍵詞可以為待檢索的在線廣告資源的類別名稱、受眾特征信息、地理分布信息和表現(xiàn)力信息等等;歸類模塊102對(duì)標(biāo)簽進(jìn)行歸類和對(duì)關(guān)鍵詞進(jìn)行歸類采用相同的歸類原則;匹配及發(fā)送模塊103,用于當(dāng)歸類模塊102將用戶輸入的關(guān)鍵詞歸入的類別中有標(biāo)簽時(shí),將該標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。其中,初始化;f莫塊101可以具體用于生成分類,并對(duì)每個(gè)在線廣告資源,根據(jù)其屬性信息為其附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽。其中,在線廣告資源的屬性信息包括在線廣告資源的類別、受眾特征、地理分布和表現(xiàn)力等等。例如,有關(guān)汽車的在線廣告資源可以為其設(shè)置多個(gè)標(biāo)簽為"東風(fēng)雪鐵龍"、"白色"、"省油"等等。進(jìn)一步地,參見(jiàn)圖3,歸類模塊102可以具體包括初始化單元201,用于為初始化模塊101生成的分類中的每個(gè)類別,選擇固定數(shù)量的訓(xùn)練語(yǔ)料;訓(xùn)練語(yǔ)料可以為與該類別相關(guān)的文章等,訓(xùn)練語(yǔ)料的數(shù)量可以根據(jù)需要選擇,如為分類樹(shù)中的每個(gè)類別選擇20篇訓(xùn)練語(yǔ)料;標(biāo)簽統(tǒng)計(jì)比較單元202,用于統(tǒng)計(jì)初始化模塊101設(shè)置的標(biāo)簽在初始化單元201為每個(gè)類別選擇的訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較統(tǒng)計(jì)得到的頻率;標(biāo)簽歸類單元203,用于將初始化模塊IOI設(shè)置的標(biāo)簽,歸類到標(biāo)簽統(tǒng)計(jì)比較單元202比較得出的最高頻率對(duì)應(yīng)的類別中;關(guān)鍵詞統(tǒng)計(jì)比4交單元204,用于統(tǒng)計(jì)用戶在^r索在線廣告資源時(shí)輸入的關(guān)鍵詞,在初始化單元201為每個(gè)類別選擇的訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較統(tǒng)計(jì)得到的頻率;關(guān)鍵詞歸類單元205,用于將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,歸類到關(guān)鍵詞統(tǒng)計(jì)比較單元204比較得出的最高頻率對(duì)應(yīng)的類別中。實(shí)施例二參見(jiàn)圖4,本發(fā)明實(shí)施例還提供了一種檢索在線廣告資源的方法,采用上述裝置實(shí)現(xiàn)對(duì)在線廣告資源的檢索,具體包括以下步驟步驟301:初始化模塊生成分類,并為在線廣告資源設(shè)置標(biāo)簽。生成分類時(shí)可以采用一種樹(shù)形的對(duì)詞匯進(jìn)行分類的方法,即生成分類樹(shù)。初始化模塊分類時(shí)可以按照預(yù)先設(shè)置的規(guī)則進(jìn)行分類,將自然語(yǔ)言的詞匯劃分到各個(gè)類別中。預(yù)先設(shè)置的規(guī)則有多種,如按照行業(yè)劃分類別并生成分類樹(shù),或者按照產(chǎn)品劃分類別并生成分類樹(shù),也可以按照在線廣告資源劃分類別并生成分類樹(shù)等等。分類后的類別具有樹(shù)型的結(jié)構(gòu),即大類中有若干個(gè)小類,每個(gè)小類再細(xì)分若干個(gè)類別,以此類推,分成多層次的類別。例如,參見(jiàn)表l,按照行業(yè)劃分兩個(gè)大類,化妝美容和健康醫(yī)療,其中,化妝美容又分為7個(gè)小類,包括香水、美發(fā)、護(hù)膚、彩妝、脫發(fā)、化妝品和體形管理,健康醫(yī)療又分為9個(gè)小類,包括病癥及疾病、中藥、護(hù)理體檢、懷孕生育、醫(yī)院、醫(yī)療器械、健康食品、健康管理、育兒,總共分為兩個(gè)層次,即生成如表1所示的分類樹(shù)。表1<table>tableseeoriginaldocumentpage9</column></row><table>在線廣告資源屬于非結(jié)構(gòu)化信息,不利于檢索,初始化模塊為在線廣告資源設(shè)置標(biāo)簽可以使其變?yōu)榻Y(jié)構(gòu)化信息。標(biāo)簽可以為與在線廣告資源相關(guān)的信息,設(shè)置標(biāo)簽時(shí)可以具體根據(jù)每個(gè)在線廣告資源的屬性信息,為每個(gè)在線廣告資源附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽,即把在線廣告資源與所加的詞匯或語(yǔ)句關(guān)聯(lián)起來(lái)。其中,在線廣告資源的屬性信息包括在線廣告資源的類別、受眾特征、地理分布和表現(xiàn)力等。標(biāo)簽可以與在線廣告資源所屬的類別名稱相同,也可以不相同。例如,在線廣告資源為體育頻道首頁(yè)通欄,與其相關(guān)的信息有l(wèi))類別信息,如體育用品、運(yùn)動(dòng)、健身等等;2)受眾特征信息,如性別、愛(ài)好、年齡分布等等;3)地理分布信息,如南方、北方、深圳、北京等等;4)表現(xiàn)力信息,如點(diǎn)擊率、轉(zhuǎn)換率等等;根據(jù)上述信息為體育頻道首頁(yè)通欄設(shè)置多個(gè)標(biāo)簽體育用品、運(yùn)動(dòng)服裝、飲料、性別為男性、北京等等。步驟302:歸類模塊將初始化模塊為在線廣告資源設(shè)置的標(biāo)簽,歸類到初始化模塊生成的分類的類別中。歸類的方式有多種,其中,可以采用統(tǒng)計(jì)分析的方式來(lái)歸類,具體如下歸類模塊為初始化模塊生成的分類中的每個(gè)類別,選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)初始化模塊為在線廣告資源設(shè)置的標(biāo)簽在每個(gè)類別的訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并對(duì)統(tǒng)計(jì)出來(lái)的所有頻率進(jìn)行比較;將初始化模塊為在線廣告資源設(shè)置的標(biāo)簽歸類到比較后得到的最高頻率所對(duì)應(yīng)的類別中。例如,假設(shè)在線廣告資源的標(biāo)簽為"奶粉",生成的分類樹(shù)如表l所示,兩大類別中共有16個(gè)小類別,為其中的每個(gè)類別選擇20篇的訓(xùn)練語(yǔ)料(可以為與該類別相關(guān)的文章等),統(tǒng)計(jì)標(biāo)簽"奶粉"在各個(gè)類別的訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,如在類別"懷孕生育"的20篇訓(xùn)練語(yǔ)料中出現(xiàn)的頻率為80%,在類別"育兒"的20篇訓(xùn)練語(yǔ)料中出現(xiàn)的頻率為50%等等,對(duì)統(tǒng)計(jì)后得到的所有頻率進(jìn)行比較,選擇其中最高的頻率如為80%,將標(biāo)簽"奶粉"歸類到最高頻率80%對(duì)應(yīng)的類別"懷孕生育"中??梢愿鶕?jù)TF(TermFrequency,單文本詞匯頻率)和IDF(InverseDocumentFrequency,逆文本頻率指H)來(lái)統(tǒng)計(jì),例如,采用如下7>式來(lái)計(jì)算頻率=TFxIDF;其中,TF衡量了一個(gè)文本詞匯在大量訓(xùn)練語(yǔ)料中的出現(xiàn)的頻率,出現(xiàn)的頻率越高,則TF值越大;IDF衡量了一個(gè)詞匯在大量訓(xùn)練語(yǔ)料中應(yīng)該被去掉的權(quán)重,越重要的詞匯,IDF值越?。籘FxlDF的值即為統(tǒng)計(jì)出來(lái)的標(biāo)簽在訓(xùn)練語(yǔ)料中出現(xiàn)的頻率。步驟303:接收用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞。用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,可以是與在線廣告資源相關(guān)的各種信息,如類別名稱、受眾特征信息、地理分布信息和表現(xiàn)力信息等等。步驟304:歸類模塊將收到的關(guān)鍵詞歸類到初始化模塊生成的分類的類別中。其中,對(duì)關(guān)^:詞進(jìn)行歸類的方式采用與步驟302中對(duì)在線廣告資源的標(biāo)簽進(jìn)行歸類相同的方式,如采用統(tǒng)計(jì)分析的方式來(lái)歸類,具體如下歸類模塊為初始化模塊生成的分類中的每個(gè)類別,選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)收到的關(guān)鍵詞在每個(gè)類別的訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并對(duì)統(tǒng)計(jì)出來(lái)的所有頻率進(jìn)行比較;將收到的關(guān)鍵詞歸類到比較后得到的最高頻率所對(duì)應(yīng)的類別中。步驟305:匹配及發(fā)送模塊判斷歸類模塊歸類后,收到的關(guān)鍵詞所屬的類別中是否有標(biāo)簽,如果有,則執(zhí)行步驟306;否則,執(zhí)行步驟307。匹配及發(fā)送模塊判斷歸類后上述關(guān)^t詞所屬的類別中是否有標(biāo)簽的過(guò)程即匹配的過(guò)程,如果關(guān)4建詞和標(biāo)簽被歸類到相同的類別中,則匹配成功。匹配到的標(biāo)簽可能為一個(gè),也可能為多個(gè)。步驟306:匹配及發(fā)送模塊將匹配成功后得到的標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶,然后結(jié)束。如果匹配到的標(biāo)簽有多個(gè),則可以將所有標(biāo)簽所關(guān)聯(lián)的在線廣告資源,以列表數(shù)據(jù)的形式發(fā)送給用戶,供用戶查看。步驟307:匹配及發(fā)送模塊未檢索到合適的在線廣告資源,返回未檢索到在線廣告資源的信息給用戶,然后結(jié)束。例如,某個(gè)網(wǎng)站上教育頻道的高考欄目的一個(gè)橫幅廣告位,為其設(shè)置標(biāo)簽為"高考",標(biāo)簽"高考"被歸類到分類樹(shù)的"教育"類別中;某用戶在檢索時(shí)輸入關(guān)鍵詞"大學(xué)"檢索在線廣告資源,關(guān)鍵詞"大學(xué)"也被歸類到分類樹(shù)的"教育"類別中,則匹配成功,將匹配到的標(biāo)簽"高考"對(duì)應(yīng)的教育頻道的高考欄目的橫幅廣告位作為查詢結(jié)果返回給用戶。本發(fā)明實(shí)施例通過(guò)初始化模塊生成分類并為在線廣告資源設(shè)置標(biāo)簽,歸類模塊將標(biāo)簽和用戶檢索的關(guān)鍵詞使用相同的規(guī)則歸類到分類的類別中,匹配及發(fā)送模塊將與關(guān)鍵詞屬于相同類別的標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶,從而提高了檢索在線廣告資源的準(zhǔn)確性。通過(guò)為在線廣告資源設(shè)置標(biāo)簽,使非結(jié)構(gòu)化的信息增加了結(jié)構(gòu)化的屬性,用戶如廣告銷售人員根據(jù)與待檢索的在線廣告資源相關(guān)的受眾特征、地理分布和表現(xiàn)力等信息進(jìn)行檢索,降低了對(duì)查詢條件的要求,而且采用相同的規(guī)則歸類標(biāo)簽和關(guān)鍵詞,使檢索結(jié)果的準(zhǔn)確性和有效性大大得到增強(qiáng),有利于廣告銷售人員選擇合適的廣告資源推薦給客戶。與現(xiàn)有技術(shù)相比,不必關(guān)鍵詞與在線廣告資源名稱或分類名稱完全匹配,只要關(guān)鍵詞與標(biāo)簽被歸為同一類即可檢索到在線廣告資源,克服了查詢結(jié)果匹配難的問(wèn)題,而且避免了^r索結(jié)果可能遺漏有效的在線廣告資源等問(wèn)題。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。權(quán)利要求1.一種檢索在線廣告資源的方法,其特征在于,所述方法包括生成分類,并為在線廣告資源設(shè)置標(biāo)簽;將所述標(biāo)簽歸類到所述分類的類別中;接收用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞;將所述關(guān)鍵詞歸類到所述分類的類別中;當(dāng)所述關(guān)鍵詞所屬的類別中有標(biāo)簽時(shí),將所述標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。2.根據(jù)權(quán)利要求1所述的檢索在線廣告資源的方法,其特征在于,為在線廣告資源設(shè)置標(biāo)簽的步驟具體為對(duì)每個(gè)在線廣告資源,根據(jù)其屬性信息為其附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽。3.根據(jù)權(quán)利要求2所述的檢索在線廣告資源的方法,其特征在于,所述屬性信息包括在線廣告資源的類別、受眾特征、地理分布和表現(xiàn)力。4.根據(jù)權(quán)利要求1所述的檢索在線廣告資源的方法,其特征在于,將所述標(biāo)簽歸類到所述分類的類別中的步驟具體包括為所述分類中的每個(gè)類別選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)所述標(biāo)簽在每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;將所述標(biāo)簽歸類到最高頻率對(duì)應(yīng)的類別中。5.根據(jù)權(quán)利要求1所述的檢索在線廣告資源的方法,其特征在于,將所述關(guān)鍵詞歸類到所述分類的類別中的步驟具體包括為所述分類中的每個(gè)類別選擇固定數(shù)量的訓(xùn)練語(yǔ)料;統(tǒng)計(jì)所述關(guān)鍵詞在每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;將所述關(guān)4建詞歸類到最高頻率對(duì)應(yīng)的類別中。6.根據(jù)權(quán)利要求1所述的檢索在線廣告資源的方法,其特征在于,所述關(guān)鍵詞包括待檢索的在線廣告資源的類別名稱、受眾特征信息、地理分布信息和表現(xiàn)力信息。7.—種檢索在線廣告資源的裝置,其特征在于,所述裝置包括初始化模塊,用于生成分類并為在線廣告資源設(shè)置標(biāo)簽;歸類模塊,用于將所述初始化模塊設(shè)置的標(biāo)簽歸類到所述初始化模塊生成的分類的類別中,并將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞歸類到所述初始化模塊生成的分類的類別中;匹配及發(fā)送模塊,用于當(dāng)所述歸類模塊將所述關(guān)鍵詞歸入的類別中有標(biāo)簽時(shí),將所述標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。8.根據(jù)權(quán)利要求7所述的檢索在線廣告資源的裝置,其特征在于,所述初始化模塊具體用于生成分類,并對(duì)每個(gè)在線廣告資源,才艮據(jù)其屬性信息為其附加至少一個(gè)詞匯或語(yǔ)句作為標(biāo)簽。9.根據(jù)權(quán)利要求7所述的檢索在線廣告資源的裝置,其特征在于,所述歸類模塊具體包括初始化單元,用于為所述初始化模塊生成的分類中的每個(gè)類別,選擇固定數(shù)量的訓(xùn)練語(yǔ)料;標(biāo)簽統(tǒng)計(jì)比較單元,用于統(tǒng)計(jì)所述初始化模塊設(shè)置的標(biāo)簽在所述初始化單元選擇的每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;標(biāo)簽歸類單元,用于將所述初始化模塊設(shè)置的標(biāo)簽,歸類到所述標(biāo)簽統(tǒng)計(jì)比較單元比較得出的最高頻率對(duì)應(yīng)的類別中;關(guān)鍵詞統(tǒng)計(jì)比較單元,用于統(tǒng)計(jì)用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,在所述初始化單元選擇的每個(gè)類別的所述訓(xùn)練語(yǔ)料中出現(xiàn)的頻率,并比較所述頻率;關(guān)鍵詞歸類單元,用于將用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞,歸類到所述關(guān)鍵詞統(tǒng)計(jì)比較單元比較得出的最高頻率對(duì)應(yīng)的類別中。全文摘要本發(fā)明公開(kāi)了一種檢索在線廣告資源的方法和裝置,屬于網(wǎng)絡(luò)通信領(lǐng)域。所述方法包括生成分類,并為在線廣告資源設(shè)置標(biāo)簽;將所述標(biāo)簽歸類到所述分類的類別中;接收用戶在檢索在線廣告資源時(shí)輸入的關(guān)鍵詞;將所述關(guān)鍵詞歸類到所述分類的類別中;當(dāng)所述關(guān)鍵詞所屬的類別中有標(biāo)簽時(shí),將所述標(biāo)簽對(duì)應(yīng)的在線廣告資源發(fā)送給用戶。所述裝置包括初始化模塊、歸類模塊和匹配及發(fā)送模塊。本發(fā)明提高了檢索在線廣告資源的準(zhǔn)確性,降低了對(duì)查詢條件的要求,與現(xiàn)有技術(shù)相比,克服了查詢結(jié)果匹配難的問(wèn)題,避免了檢索結(jié)果可能遺漏有效的在線廣告資源等問(wèn)題。文檔編號(hào)G06Q30/00GK101114295SQ200710075688公開(kāi)日2008年1月30日申請(qǐng)日期2007年8月11日優(yōu)先權(quán)日2007年8月11日發(fā)明者姜躍平,釗戴申請(qǐng)人:騰訊科技(深圳)有限公司