專利名稱:廣告系統(tǒng)中的搜索方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索技術(shù)領(lǐng)域,特別涉及廣告系統(tǒng)中的搜索方法和裝置。
背景技術(shù):
為方便理解,首先給出如下幾個術(shù)語的解釋檢索串(query):搜索引擎用戶提交的檢索字符串;關(guān)鍵詞(keyword):其可稱為拍賣詞,同一個拍賣詞可被多個客戶購買為不同的關(guān)鍵詞;廣告除非特別說明,一條廣告特指頁面可展現(xiàn)的含有廣告創(chuàng)意及關(guān)鍵詞的一條 推廣結(jié)果;廣告創(chuàng)意按照客戶投放意愿和業(yè)務(wù)規(guī)則而得到實(shí)際展現(xiàn)的“推廣結(jié)果”,包括廣告標(biāo)題、廣告描述第一行、廣告描述第二行、目標(biāo)URL、顯不URL等信息。競價價格為單個關(guān)鍵詞設(shè)定的最高競價出價,點(diǎn)擊價格不會超過該價格;匹配類型query與廣告主購買的關(guān)鍵詞之間的匹配選項(xiàng),它決定了哪些搜索查詢可以觸發(fā)廣告展示。廣告主可以為購買的關(guān)鍵詞指定匹配選項(xiàng),以控制自己廣告的展示對象。各廣告系統(tǒng)中的幫助定義可能有所差別,以google廣告系統(tǒng)中的匹配選項(xiàng)為例,設(shè)置了如下類型廣泛匹配(基于會話)根據(jù)用戶在搜索會話中進(jìn)行過的搜索操作,將query視為廣告主購買的某個關(guān)鍵詞的變體形式。完全匹配query與廣告主購買的某個關(guān)鍵字完全匹配。詞組匹配query包含在廣告主購買的某個關(guān)鍵詞中。檢索串分析(qa :query analysis):離線對query分析,擴(kuò)展出關(guān)鍵詞。qa詞表qa系統(tǒng)離線針對搜索引擎歷史上的高頻query,挖掘出來的關(guān)鍵詞擴(kuò)展詞表。詞表結(jié)構(gòu)分為“左鍵”和“右鍵”,其中,左鍵”是高頻query,“右鍵”是高頻query對應(yīng)的關(guān)鍵詞。檢索串?dāng)U展(qe query expansion):以query為研究對象,利用query間關(guān)聯(lián)關(guān)系,或根據(jù)統(tǒng)計(jì)經(jīng)驗(yàn)對query做各種變化(增、刪、改),得到擴(kuò)展query (也即新query)的方法。檢索串檢索量(qv query view) query向搜索引擎發(fā)送的檢索請求次數(shù),即廣告
檢索量。廣告展現(xiàn)檢索量(AdMatchedQueries):有廣告展現(xiàn)的檢索次數(shù)。消耗(Cost):廣告點(diǎn)擊產(chǎn)生的總消耗(實(shí)際計(jì)費(fèi))。千次檢索消耗(RPM):消耗/(廣告檢索量X 1000)。廣告展現(xiàn)量(Adlmpressions):展現(xiàn)的廣告總數(shù)(包括重復(fù)展現(xiàn))。廣告曝光數(shù)(UniShownCreatives):至少展現(xiàn)過一次的廣告總數(shù)。點(diǎn)擊量(AdClicks):廣告被點(diǎn)擊的總次數(shù)(實(shí)際計(jì)費(fèi))。
廣告點(diǎn)擊率(AdCtr):點(diǎn)擊量/廣告展現(xiàn)量。覆蓋率(Coverage):廣告展現(xiàn)檢索量/廣告檢索量。傳統(tǒng)的搜索廣告匹配系統(tǒng)是基于用戶提交的query進(jìn)行實(shí)時匹配檢索,具體為根據(jù)廣告主設(shè)置的匹配類型找到與query對應(yīng)的關(guān)鍵詞,該匹配類型可為上述的任一匹配類型,比如,可為廣泛匹配、完全匹配、或詞組匹配;并針對query進(jìn)行切詞、規(guī)范化處理后,按照一定的數(shù)據(jù)結(jié)構(gòu)檢索與該找到的關(guān)鍵詞對應(yīng)的廣告信息。隨著廣告搜索技術(shù)的不斷改進(jìn),傳統(tǒng)的在線實(shí)時匹配越來越趨向于整合一些離線的技術(shù)。在近幾年的發(fā)展中,一種離線挖掘query的擴(kuò)展資源已經(jīng)進(jìn)入匹配系統(tǒng),具體如圖I所示。其中,離線挖掘query的擴(kuò)展資源具體為針對搜索系統(tǒng)歷史檢索的高頻query, 使用如圖I所示的檢索日志、qa系統(tǒng)、上下文關(guān)系等方法找到這部分高頻query與關(guān)鍵詞(keyword)的映射關(guān)系,形成qa詞表?;诖耍脠DI所示的結(jié)構(gòu)進(jìn)行的廣告檢索方法如下當(dāng)用戶提供的query進(jìn)入匹配系統(tǒng)后,首先會去查qa詞表,如果命中,則直接使用找到的關(guān)鍵詞去拉取廣告,繼續(xù)后面的競價排名流程;如果沒有命中,則通過特征匹配,索引到與這個query相似度最高的擴(kuò)展query作為代替,使用擴(kuò)展query對應(yīng)的關(guān)鍵詞來拉取廣告。擴(kuò)展query是對query做各種等價的擴(kuò)展、變形得到的。通過查qa詞表,并在命中時直接使用離線找到的關(guān)鍵詞去拉取廣告,能夠有效補(bǔ)充檢索系統(tǒng)中高頻query匹配關(guān)鍵詞的數(shù)量;而不命中時,則表明用戶提供的query為長尾query (不被經(jīng)常使用的query),通過使用擴(kuò)展query對應(yīng)的關(guān)鍵詞拉取廣告,這是針對長尾query的一種有效處理辦法。在上述方法中,通過離線挖掘出來的qa詞表,理論上qv占比能達(dá)到75%,甚至更多,但是實(shí)際應(yīng)用中,實(shí)際效果嚴(yán)重依賴于挖掘出來的與query關(guān)聯(lián)的關(guān)鍵詞的質(zhì)量,以及關(guān)鍵詞的實(shí)時有效性情況,通過匹配系統(tǒng)統(tǒng)計(jì)結(jié)果表明實(shí)際的qv占比遠(yuǎn)低于理論值。此外,上述方法中對長尾query的處理,雖然能夠建立起與分析過的高頻query的聯(lián)系,但是由于很難保證擴(kuò)展query的質(zhì)量,往往找到的關(guān)聯(lián)query在語義上會發(fā)生偏離,進(jìn)而利用該語義發(fā)生偏離的query找到的關(guān)鍵詞也發(fā)生偏離,最終匹配出相關(guān)性不好的廣
生口 ο
發(fā)明內(nèi)容
本發(fā)明提供了廣告系統(tǒng)中的搜索方法和裝置,以提高離線挖掘的關(guān)鍵詞的質(zhì)量和數(shù)量。本發(fā)明提供的技術(shù)方案包括一種廣告系統(tǒng)中的搜索方法,該方法包括對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合;在qa詞表中查找接收的query ;如果在qa詞表中查找不到所述query,則在所述關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。。一種廣告系統(tǒng)中的搜索方法,該方法包括
建立包含以下對應(yīng)關(guān)系的qa詞表query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系;在所述qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。一種廣告系統(tǒng)中的搜索裝置,其特征在于,該裝置應(yīng)用于上述的第一種方法,包括聚類單元,用于對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合;查找單元,用于在query分析qa詞表中查找接收的query ;匹配單元,用于在所述查找單元的查找結(jié)果為否時,在關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
一種廣告系統(tǒng)中的搜索裝置,該裝置應(yīng)用于上述的第二種方法,包括建立單元,用于建立包含以下對應(yīng)關(guān)系的qa詞表query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系;匹配單元,用于在所述qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。由以上技術(shù)方案可以看出,本發(fā)明提供的第一種方法,如果在qa詞表中查找不到接收的query,通過在對廣告庫中的關(guān)鍵詞進(jìn)行聚類得到的關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息,由于關(guān)鍵詞聚類集合中的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系,該第一種方法通過在該關(guān)鍵詞聚類集合中匹配出與接收的query對應(yīng)的關(guān)鍵詞,這提高了離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量,并強(qiáng)化了對長尾query的多粒度擴(kuò)展;還有,本發(fā)明提供的第二種方法,通過對現(xiàn)有的qa詞表進(jìn)行優(yōu)化,使優(yōu)化后的qa詞表包含query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞二者之間的對應(yīng)關(guān)系,這樣,在接收到用戶提供的query時,直接在所述qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,這顯然提高了離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量;進(jìn)一步地,本發(fā)明提供的上述兩種方法中,由于提高了離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量,能夠進(jìn)一步提升廣告點(diǎn)擊率、收益、廣告覆蓋率等指標(biāo),同時增加了以前未展示的廣告的曝光機(jī)會,加強(qiáng)了廣告間競價的激烈程度。
圖I為現(xiàn)有技術(shù)中比較常見的一種搜索廣告匹配系統(tǒng)結(jié)構(gòu)圖;圖2為本發(fā)明實(shí)施例提供的基本流程圖;圖3為本發(fā)明實(shí)施例提供的對應(yīng)圖2的系統(tǒng)結(jié)構(gòu)圖;圖4為本發(fā)明實(shí)施例提供的步驟202中匹配操作的實(shí)現(xiàn)流程圖;圖5為本發(fā)明實(shí)施例提供的裝置結(jié)構(gòu)圖;圖6為本發(fā)明實(shí)施例提供的另一裝置結(jié)構(gòu)圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)描述。針對現(xiàn)有技術(shù)存在的缺陷,本發(fā)明通過在實(shí)時匹配過程中引入關(guān)鍵詞聚類擴(kuò)展,可以增加以前未展示廣告的曝光機(jī)會、強(qiáng)化對長尾query的多粒度擴(kuò)展、加強(qiáng)有展示廣告間競價的激烈程度,從而綜合提升廣告展現(xiàn)檢索覆蓋率、千次檢索收益等指標(biāo),最終帶來收入的提高。下面通過圖2對本發(fā)明提供的方法進(jìn)行描述參見圖2,圖2為本發(fā)明實(shí)施例提供的方法流程圖。在圖2中,需要對對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合。下面先對廣告庫中的關(guān)鍵詞聚類進(jìn)行描述通常,同一廣告主、同一廣告系列中的關(guān)鍵詞之間往往存在一定的相關(guān)性,而不同廣告主在針對自己廣告優(yōu)化關(guān)鍵詞出價時,除了考慮價格因素,還會選擇與現(xiàn)有質(zhì)量較高的關(guān)鍵詞相似的其他關(guān)鍵詞,以降低成本。因此,可以看出,廣告庫中的關(guān)鍵詞天然地存在著關(guān)聯(lián)關(guān)系?;诖?,可以將廣告庫中一些相似或相關(guān)的關(guān)鍵詞聚類在一起。其中,在執(zhí)行聚類時,可以依據(jù)字面上相關(guān)的文本特征,比如,寶馬與寶馬汽車,也可以依據(jù)表達(dá)同一意思上的語義特征,比如,個人電腦與PC,或者兩者的結(jié)合等,本發(fā)明并不具體限定。 本發(fā)明中,如果把關(guān)鍵詞看作一個節(jié)點(diǎn),關(guān)鍵詞之間有等價或聚類關(guān)系看作一條邊,那么關(guān)鍵詞聚類集合將構(gòu)成一個有向圖。在實(shí)際的匹配系統(tǒng)中,如果關(guān)鍵詞聚類集合以map詞表形式表現(xiàn),則它的“左鍵”是關(guān)鍵詞本身,對應(yīng)的“右鍵”是與這個關(guān)鍵詞具有聚類關(guān)系的其他關(guān)鍵詞序列。本發(fā)明對廣告庫中的關(guān)鍵詞進(jìn)行聚類,原因是由于關(guān)鍵詞需要廣告主購買,商業(yè)性比較強(qiáng),另外,相對用戶每日檢索的query集合,規(guī)模變化不大,很適合使用各種挖掘方法對它們建立起聚類關(guān)系。至此,完成對廣告庫中的關(guān)鍵詞進(jìn)行聚類的描述?;谏衔牡拿枋?,下面結(jié)合圖2對本發(fā)明提供的方法進(jìn)行描述如圖2所示,該流程可包括以下步驟步驟201,在qa詞表中查找接收的query。這里的qa詞表與現(xiàn)有技術(shù)中的qa詞表類似,包含了搜索中高頻出現(xiàn)的query比如在某一個統(tǒng)計(jì)時間內(nèi)經(jīng)常被用戶使用的query和關(guān)鍵詞之間的對應(yīng)關(guān)系。步驟202,如果在qa詞表中查找不到所述query,則在所述關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。至此,完成圖2的描述。優(yōu)選地,本發(fā)明中,如果在qa詞表中查找到所述query,則利用該query對應(yīng)的關(guān)鍵詞拉取對應(yīng)的廣告信息。為便于理解,圖2所示的流程可通過圖3具體描述。從圖3可以看出,相比于圖I所示的現(xiàn)有搜索流程,本發(fā)明并不改變現(xiàn)有的搜索廣告流程,只不過增加了對未命中qa詞表中高頻出現(xiàn)的query的處理。以關(guān)鍵詞聚類集合為map詞表形式表現(xiàn)為例,則步驟202是匹配上了“左鍵”,這可有效地直接補(bǔ)充很多具有聚類關(guān)系的關(guān)鍵詞。在上面描述中,步驟202中的在關(guān)鍵詞聚類集合中匹配出與query對應(yīng)的關(guān)鍵詞具體實(shí)現(xiàn)時可通過圖4所示的流程體現(xiàn)。參見圖4,圖4為本發(fā)明提供的步驟202中匹配操作的流程圖。如圖4所示,該流程可包括
步驟401,在關(guān)鍵詞聚類集合中匹配與所述query完全相同的關(guān)鍵詞,得到匹配出的關(guān)鍵詞、以及與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞。步驟402,判斷得到的關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,執(zhí)行步驟403,否則,執(zhí)行步驟404 ;在上面描述的步驟402中,預(yù)設(shè)的關(guān)鍵詞確定條件具體實(shí)現(xiàn)時可有多種實(shí)現(xiàn)方式,比如,得到的關(guān)鍵詞達(dá)到設(shè)定數(shù)量,或者該得到的關(guān)鍵詞對應(yīng)拉取出來的廣告按廣告主排重后是否達(dá)到設(shè)定數(shù)量(往往多個關(guān)鍵詞都是一個廣告主買的,所以要做排重)等,本發(fā)明并不具體限定,完全可由實(shí)際情況設(shè)置。步驟403,將得到的關(guān)鍵詞確定為所述query對應(yīng)的關(guān)鍵詞。結(jié)束當(dāng)前流程。優(yōu)選地,作為本實(shí)施例的一種擴(kuò)展,也可在步驟401得到關(guān)鍵詞后,直接將得到的
關(guān)鍵詞確定為所述query對應(yīng)的關(guān)鍵詞,結(jié)束當(dāng)前流程,省略步驟401之后的各個步驟。步驟404,將得到的關(guān)鍵詞作為第一關(guān)鍵詞,并按照優(yōu)先級順序選取query的一個子集,將選取的子集作為當(dāng)前子集。步驟405,在關(guān)鍵詞聚類集合中匹配與當(dāng)前子集完全相同的關(guān)鍵詞,得到匹配出的關(guān)鍵詞、以及與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將得到的關(guān)鍵詞與第一類關(guān)鍵詞一起確定為第二關(guān)鍵詞。步驟406,判斷第二關(guān)鍵詞是否滿足所述預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,執(zhí)行步驟407,否則,執(zhí)行步驟408。步驟407,將第二關(guān)鍵詞確定為所述query對應(yīng)的關(guān)鍵詞。結(jié)束當(dāng)前流程。步驟408,當(dāng)還存在未被選取的query的子集時,按照優(yōu)先級順序繼續(xù)選取一個與當(dāng)前子集不同的子集,將該選取的子集作為當(dāng)前子集,并將第二關(guān)鍵詞重新確定為第一關(guān)鍵詞,返回上述步驟405,當(dāng)不存在未被選取的query子集時,返回上述步驟407。至此,完成圖4的描述。通過圖4可以實(shí)現(xiàn)在關(guān)鍵詞聚類集合中匹配出與query對應(yīng)的關(guān)鍵詞。優(yōu)選地,作為本發(fā)明實(shí)施例的一種擴(kuò)展,在關(guān)鍵詞聚類集合中匹配出與query對應(yīng)的關(guān)鍵詞,可以是多層次、多粒度的,不局限于直接使用query去完全匹配關(guān)鍵詞聚類集合,還可以使用多模式的匹配技術(shù),例如首先利用預(yù)先定義的匹配選項(xiàng)匹配出所述query對應(yīng)的關(guān)鍵詞;按照匹配出的關(guān)鍵詞的優(yōu)先級順序從關(guān)鍵詞聚類集合中找到與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將該查找到的關(guān)鍵詞,以及匹配出的關(guān)鍵詞確定為與query對應(yīng)的關(guān)鍵詞。其中,預(yù)先定義的匹配選項(xiàng)可為詞組匹配或廣泛匹配。這樣能最大限度地保證通過聚類補(bǔ)充的關(guān)鍵詞與query之間的相關(guān)性,也是對關(guān)鍵詞聚類集合的充分利用,同時能有效減小廣告點(diǎn)擊率等相關(guān)指標(biāo)的波動。另外,這還避免了 query檢索不出關(guān)鍵詞(廣告)的機(jī)會,并有效增強(qiáng)了匹配出的關(guān)鍵詞之間競價的激烈程度,從而幫助廣告主實(shí)現(xiàn)合理的預(yù)算支出,也提高了服務(wù)商的利潤。需要說明的是,在實(shí)際使用關(guān)鍵詞聚類集合時,廣告主為節(jié)約成本,可設(shè)置其購買的關(guān)鍵詞的日使用額度,當(dāng)該關(guān)鍵詞的費(fèi)用超過日使用額度時,該關(guān)鍵詞變?yōu)闊o效,而本發(fā)明中,無需關(guān)注關(guān)鍵詞聚類集合中的關(guān)鍵詞是當(dāng)前有效還是無效,因?yàn)闊o效的關(guān)鍵詞可能擴(kuò)展出其他有效的關(guān)鍵詞,從而帶來廣告展示。最后,還需要說明的是,本發(fā)明中,還可以使用購買詞聚類資源對qa詞表進(jìn)行優(yōu)化(記為優(yōu)化方法),從而補(bǔ)充對高頻query的擴(kuò)展結(jié)果,具體為建立包含以下對應(yīng)關(guān)系的qa詞表query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞二者之間的對應(yīng)關(guān)系;qa詞表中的query在搜索中高頻出現(xiàn),可以看出,該優(yōu)化方法中,對現(xiàn)有的qa詞表進(jìn)行了改進(jìn),增加聚類關(guān)鍵詞?;诖?,當(dāng)接收到用戶提供的query時,在已建立的qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。該優(yōu)化方法與圖2所示的方法一樣,能夠有效增強(qiáng)廣告間競價的激烈程度,增加廣告的曝光機(jī)會,提升指標(biāo),最終表現(xiàn)為聞頻query的收入提聞。至此,完成本發(fā)明提供的方法的描述。下面對本發(fā)明提供的裝置進(jìn)行描述參見圖5,圖5為本發(fā)明實(shí)施例提供的裝置結(jié)構(gòu)圖。如圖5所示,該裝置可包括聚類單元,用于對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合;·
查找單元,用于在qa詞表中查找接收的query ;匹配單元,用于在所述查找單元的查找結(jié)果為否時,在關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。優(yōu)選地,如圖5所示,該裝置進(jìn)一步包括處理單元,用于在所述查找單元的查找結(jié)果為是時,利用該query對應(yīng)的關(guān)鍵詞拉取對應(yīng)的廣告信息。其中,所述匹配單元在具體實(shí)現(xiàn)時有兩種實(shí)現(xiàn)方式,其中一種實(shí)現(xiàn)方式為該匹配單元包括第一匹配子單元,用于在關(guān)鍵詞聚類集合中匹配與所述query完全相同的關(guān)鍵詞,得到匹配出的關(guān)鍵詞、以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞;第一確定子單元,用于將所述第一匹配子單元得到的關(guān)鍵詞確定為所述query對應(yīng)的關(guān)鍵詞。其中,所述第一確定子單元包括第一判斷模塊,用于判斷得到的關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將得到的關(guān)鍵詞確定為所述query對應(yīng)的關(guān)鍵詞;選取模塊,用于在所述第一判斷模塊的判斷結(jié)果為否時,將得到的關(guān)鍵詞作為第一關(guān)鍵詞,將query的一個子集作為當(dāng)前子集;匹配模塊,用于在關(guān)鍵詞聚類集合中匹配出與當(dāng)前子集完全相同的關(guān)鍵詞、以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將得到的關(guān)鍵詞與第一類關(guān)鍵詞一起確定為第二關(guān)鍵詞;第二判斷模塊,用于判斷第二關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將第二關(guān)鍵詞確定為query對應(yīng)的關(guān)鍵詞,如果否,則當(dāng)query存在未被選取的子集時,選取一個與當(dāng)前子集不同的子集,將該選取的子集作為當(dāng)前子集,并將第二關(guān)鍵詞重新確定為第一關(guān)鍵詞,觸發(fā)所述匹配模塊執(zhí)行匹配操作,當(dāng)query不存在未被選取的子集時,將第二關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞。另一種實(shí)現(xiàn)形式為該匹配單元包括第二匹配子單元,利用預(yù)先定義的匹配選項(xiàng)匹配出所述query對應(yīng)的關(guān)鍵詞,所述匹配選項(xiàng)為詞組匹配或廣泛匹配;第二確定子單元,用于將匹配出的關(guān)鍵詞,以及關(guān)鍵詞聚類集合中與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞確定為與query對應(yīng)的關(guān)鍵詞。優(yōu)選地,本發(fā)明實(shí)施例還提供了另一裝置,該替換裝置應(yīng)用于上述的優(yōu)化方法,具體如圖6所示,包括建立單元,用于建立包含以下對應(yīng)關(guān)系的query分析qa詞表query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系;匹配單元,用于在已建立的qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。至此,完成本發(fā)明實(shí)施例提供的裝置的描述。
由以上技術(shù)方案可以看出,本發(fā)明提供的一種方法中,如果在qa詞表中查找不到接收的query,則在通過對廣告庫中的關(guān)鍵詞進(jìn)行聚類得到的關(guān)鍵詞聚類集合中匹配出與所述query對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息,這顯然提高離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量,并強(qiáng)化對長尾query的多粒度擴(kuò)展;為進(jìn)一步驗(yàn)證效果,對真實(shí)的廣告匹配系統(tǒng)引入關(guān)鍵詞聚類前后做了對比實(shí)驗(yàn),統(tǒng)計(jì)結(jié)果表明,本發(fā)明引入關(guān)鍵詞聚類的方法能夠明顯提升搜索引擎結(jié)果頁的廣告展示數(shù),增加覆蓋率,并且提升整體廣告相關(guān)性;進(jìn)一步地,本發(fā)明提供的一種方法將廣告庫中的關(guān)鍵詞通過聚類方法聚合在一起,整合進(jìn)搜索廣告匹配流程,豐富了匹配算法和檢索策略;還有,本發(fā)明提供的另一種方法通過對現(xiàn)有的qa詞表進(jìn)行優(yōu)化,使優(yōu)化后的qa詞表包含query、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系,這樣,在接收到用戶提供的query時,直接在所述qa詞表中匹配出與接收的query對應(yīng)的所有關(guān)鍵詞,這顯然提高了離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量;進(jìn)一步地,本發(fā)明提供的上述兩種方法中,由于提高了離線挖掘的關(guān)鍵詞質(zhì)量和數(shù)量,能夠進(jìn)一步提升廣告點(diǎn)擊率、收益、廣告覆蓋率等指標(biāo),同時增加了以前未展示的廣告的曝光機(jī)會,加強(qiáng)了廣告間競價的激烈程度。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種廣告系統(tǒng)中的搜索方法,其特征在于,該方法包括 對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合; 在檢索串分析qa詞表中查找接收的檢索串; 如果在qa詞表中查找不到所述檢索串,則在所述關(guān)鍵詞聚類集合中匹配出與所述檢索串對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,該方法進(jìn)一步包括 如果在qa詞表中查找到所述檢索串,則利用該檢索串對應(yīng)的關(guān)鍵詞拉取對應(yīng)的廣告信息。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述在關(guān)鍵詞聚類集合中匹配出與檢索串對應(yīng)的關(guān)鍵詞包括 在關(guān)鍵詞聚類集合中匹配與所述檢索串完全相同的關(guān)鍵詞,得到匹配出的關(guān)鍵詞、以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將該得到的關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將得到的關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞包括 步驟A,判斷得到的關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將得到的關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞;如果否,則將得到的關(guān)鍵詞作為第一關(guān)鍵詞,將檢索串的一個子集作為當(dāng)前子集,并執(zhí)行步驟B ; 步驟B,在關(guān)鍵詞聚類集合中匹配出與當(dāng)前子集完全相同的關(guān)鍵詞,以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將得到的關(guān)鍵詞與第一類關(guān)鍵詞一起確定為第二關(guān)鍵詞; 步驟C,判斷第二關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將第二關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞,如果否,則當(dāng)檢索串存在未被選取的子集時,選取一個與當(dāng)前子集不同的子集,將該選取的子集作為當(dāng)前子集,并將第二關(guān)鍵詞重新確定為第一關(guān)鍵詞,返回步驟B,,當(dāng)檢索串不存在未被選取的子集時,將第二關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述在關(guān)鍵詞聚類集合中匹配出與檢索串對應(yīng)的關(guān)鍵詞包括 利用預(yù)先定義的匹配選項(xiàng)匹配出所述檢索串對應(yīng)的關(guān)鍵詞,所述匹配選項(xiàng)為詞組匹配或廣泛匹配; 將匹配出的關(guān)鍵詞,以及關(guān)鍵詞聚類集合中與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞確定為與檢索串對應(yīng)的關(guān)鍵詞。
6.一種廣告系統(tǒng)中的搜索方法,其特征在于,該方法包括 建立包含以下對應(yīng)關(guān)系的檢索串分析qa詞表檢索串、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系; 在所述qa詞表中匹配出與接收的檢索串對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
7.一種廣告系統(tǒng)中的搜索裝置,其特征在于,該裝置應(yīng)用于如權(quán)利要求I所述的方法,包括 聚類單元,用于對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合;查找單元,用于在檢索串分析qa詞表中查找接收的檢索串; 匹配單元,用于在所述查找單元的查找結(jié)果為否時,在關(guān)鍵詞聚類集合中匹配出與所述檢索串對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,該裝置進(jìn)一步包括 處理單元,用于在所述查找單元的查找結(jié)果為是時,利用該檢索串對應(yīng)的關(guān)鍵詞拉取對應(yīng)的廣告信息。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述匹配單元包括 第一匹配子單元,用于在關(guān)鍵詞聚類集合中匹配與所述檢索串完全相同的關(guān)鍵詞,得到匹配出的關(guān)鍵詞、以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞; 第一確定子單元,用于將所述第一匹配子單元得到的關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一確定子單元包括 第一判斷模塊,用于判斷得到的關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將得到的關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞; 選取模塊,用于在所述第一判斷模塊的判斷結(jié)果為否時,將得到的關(guān)鍵詞作為第一關(guān)鍵詞,將檢索串的一個子集作為當(dāng)前子集; 匹配模塊,用于在關(guān)鍵詞聚類集合中匹配出與當(dāng)前子集完全相同的關(guān)鍵詞、以及與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞,將得到的關(guān)鍵詞與第一類關(guān)鍵詞一起確定為第二關(guān)鍵詞; 第二判斷模塊,用于判斷第二關(guān)鍵詞是否滿足預(yù)設(shè)的關(guān)鍵詞確定條件,如果是,則將第二關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞,如果否,則當(dāng)檢索串存在未被選取的子集時,選取一個與當(dāng)前子集不同的子集,將該選取的子集作為當(dāng)前子集,并將第二關(guān)鍵詞重新確定為第一關(guān)鍵詞,觸發(fā)所述匹配模塊執(zhí)行匹配操作,當(dāng)檢索串不存在未被選取的子集時,將第二關(guān)鍵詞確定為所述檢索串對應(yīng)的關(guān)鍵詞。
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述匹配單元包括 第二匹配子單元,利用預(yù)先定義的匹配選項(xiàng)匹配出所述檢索串對應(yīng)的關(guān)鍵詞,所述匹配選項(xiàng)為詞組匹配或廣泛匹配; 第二確定子單元,用于將匹配出的關(guān)鍵詞,以及關(guān)鍵詞聚類集合中與該匹配出的關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞確定為與檢索串對應(yīng)的關(guān)鍵詞。
12.—種廣告系統(tǒng)中的搜索裝置,其特征在于,該裝置應(yīng)用于如權(quán)利要求6所述的方法,包括 建立單兀,用于建立包含以下對應(yīng)關(guān)系的檢索串分析qa詞表檢索串、關(guān)鍵詞、與該關(guān)鍵詞具有聚類關(guān)系的關(guān)鍵詞三者之間的對應(yīng)關(guān)系; 匹配單元,用于在所述qa詞表中匹配出與接收的檢索串對應(yīng)的所有關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
全文摘要
本發(fā)明提供了廣告系統(tǒng)中的搜索方法和裝置。其中一種方法中,對廣告庫中的關(guān)鍵詞進(jìn)行聚類,得到關(guān)鍵詞聚類集合;在檢索串分析qa詞表中查找接收的檢索串;如果在qa詞表中查找不到所述檢索串,則在所述關(guān)鍵詞聚類集合中匹配出與所述檢索串對應(yīng)的關(guān)鍵詞,利用匹配出的關(guān)鍵詞拉取對應(yīng)的廣告信息。
文檔編號G06F17/30GK102902671SQ20111020856
公開日2013年1月30日 申請日期2011年7月25日 優(yōu)先權(quán)日2011年7月25日
發(fā)明者赫南, 王迪, 王艷敏, 郭陽, 朱建朋 申請人:騰訊科技(深圳)有限公司