專利名稱:信息調(diào)整方法及裝置的制作方法
技術(shù)領(lǐng)域:
本申請涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種信息調(diào)整方法及裝置。
背景技術(shù):
目前,根據(jù)統(tǒng)計出的用戶點擊行為信息(比如,用戶對于根據(jù)關(guān)鍵詞搜索到的信息的點擊行為信息、對于前臺展示的信息的點擊行為信息等),可以采用效果統(tǒng)計算法來確定信息類別與信息之間的匹配度。需要說明的是,這里的信息可以是指以聲音、語言、文字、圖像、動畫等方式所表示的實際內(nèi)容,而信息類別則可以看做是多個信息所具備的一種共同屬性。比如,“上衣”、“連衣裙”、“短褲”、“長褲”等文字信息具備的共同屬性可以為“月艮裝”,則這些文字信息的信息類別可以為“服裝”。又比如,包含有高山的圖像、包含有瀑布的圖像、包含有海洋的圖像等圖像信息所具備的共同屬性可以為“風(fēng)景”,則這些圖片信息的 信息類別可以為“風(fēng)景”。一般地,在搜索領(lǐng)域中,輸入的關(guān)鍵詞可以看做是信息類別,而根據(jù)搜索到的與該關(guān)鍵詞匹配的信息則可以看做是該信息類別包含的信息,比如,根據(jù)關(guān)鍵詞“酒店”搜索到的“希爾頓酒店”、“香格里拉酒店”、“北京大酒店”等都可以看做是“酒店”這一信息類別所包含的信息。在實際應(yīng)用中,確定信息類別與信息之間的匹配度對于后續(xù)根據(jù)該匹配度確定關(guān)鍵詞搜索命中率、確定信息排序/展現(xiàn)準確率、對信息類別所包含的信息進行調(diào)整(如從某一信息類別包含的信息中,刪除掉與該信息類別匹配度較低的信息)等具有重要意義。現(xiàn)有技術(shù)中提供的用于確定上述匹配度的效果統(tǒng)計算法比較簡單,一般是直接根據(jù)用戶點擊的信息來確定用戶點擊的信息與相應(yīng)的信息類別之間的匹配度。但現(xiàn)有技術(shù)提供的效果統(tǒng)計算法不會考慮被展現(xiàn)但未被用戶點擊的信息對于上述匹配度的貢獻,從而其存在確定出的匹配度準確性不高的問題。由于確定出的匹配度的準確性不高,進而也會使得根據(jù)該準確性不高的匹配度確定出的關(guān)鍵詞搜索命中率、信息排序/展現(xiàn)準確率也是不準確的,這就相當于是浪費處理資源來得到了可用性較低的確定結(jié)果。并且,在根據(jù)該匹配度對信息類別所包含的展現(xiàn)信息進行調(diào)整時,也可能出現(xiàn)對展現(xiàn)信息產(chǎn)生較大的誤調(diào)整從而浪費了處理資源。
發(fā)明內(nèi)容
本申請實施例提供一種信息調(diào)整方法及裝置,用以解決基于現(xiàn)有技術(shù)提供的效果統(tǒng)計算法得到的信息與信息所屬類別的匹配度對展現(xiàn)信息進行調(diào)整時,可能出現(xiàn)對展現(xiàn)信息產(chǎn)生較大的誤調(diào)整從而導(dǎo)致浪費處理資源的問題。本申請實施例采用以下技術(shù)方案一種信息調(diào)整方法,包括從信息瀏覽日志中獲取針對展現(xiàn)信息的點擊行為信息,并根據(jù)所述點擊行為信息,從展現(xiàn)信息中確定被點擊信息和只展現(xiàn)但未被點擊信息,并確定只展現(xiàn)但未被點擊信息的總個數(shù);為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值;確定各個只展現(xiàn)但未被點擊信息所屬的信息類別,并針對確定出的只展現(xiàn)但未被點擊信息所屬的任意信息類別,確定該信息類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)所述總個數(shù)和所述第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分配第二對應(yīng)關(guān)系權(quán)重值;以及針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行確定該信息類別包含的被點擊信息和只展現(xiàn)但未被點擊信息,并根據(jù)該信息類別包含的被點擊信息被分配的第一原始權(quán)重值、該信息類別包含的只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值,以及該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值和第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度;并根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息??蛇x的,為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,具體包括確定展現(xiàn)信息中包含的被點擊信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù);根據(jù)展現(xiàn)信息的總個數(shù)、被點擊信息的總個數(shù),確定第一原始權(quán)重值并分配給各個被點擊信息;根據(jù)展現(xiàn)信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù),確定第二原始權(quán)重值并分 配給各個只展現(xiàn)但未被點擊信息??蛇x的,根據(jù)所述任意信息類別包含的被點擊信息被分配的第一原始權(quán)重值、該信息類別包含的只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值,以及該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值和第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度,具體包括執(zhí)行該信息類別包含的各個被點擊信息被分配的第一原始權(quán)重值分別與該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第一和值;并執(zhí)行該信息類別包含的各個只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值分別與該信息類別被分配的第二對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第二和值;以及根據(jù)第一和值與第二和值之和,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度??蛇x的,根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息,具體包括判斷確定的該信息類別與其包含的展現(xiàn)信息之間的匹配度是否低于預(yù)設(shè)的匹配度閾值;并在判斷結(jié)果為是時,從該信息類別包含的非展現(xiàn)信息中選取信息;并利用選取的信息更新該信息類別所包含的展現(xiàn)信息??蛇x的,所述點擊行為信息為指定時間長度內(nèi)的點擊行為信息。一種信息調(diào)整裝置,包括信息和個數(shù)確定單元,用于從信息瀏覽日志中獲取針對信息的點擊行為信息,并根據(jù)所述點擊行為信息,從展現(xiàn)信息中確定被點擊信息和只展現(xiàn)但未被點擊信息,并確定只展現(xiàn)但未被點擊信息的總個數(shù);第一權(quán)重值分配單元,用于為信息和個數(shù)確定單元確定的各個被點擊信息分別分配第一原始權(quán)重值,為信息和個數(shù)確定單元確定的只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為信息和個數(shù)確定單元確定的被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值;信息類別確定單元,用于確定信息和個數(shù)確定單元確定的各個只展現(xiàn)但未被點擊信息所屬的信息類別;第二權(quán)重值分配單元,用于針對信息類別確定單元確定出的只展現(xiàn)但未被點擊信息所屬的各個類別,分別確定各個類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)所述總個數(shù)和所述第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分別分配第二對應(yīng)關(guān)系權(quán)重值;匹配度確定單元,用于針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行確定該信息類別包含的被點擊信息和只展現(xiàn)但未被點擊信息,并根據(jù)第一權(quán)重值分配單元為該信息類別包含的被點擊信息分配的第一原始權(quán)重值、為該信息類別包含的只展現(xiàn)但未被點擊信息分配的第二原始權(quán)重值、為該信息類別分配的第一對應(yīng)關(guān)系權(quán)重值和第二權(quán)重值分配單元為該信息類別分配的第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度;信息調(diào)整單元,用于針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行根據(jù)匹配度確定單元確定的該信息類別與其包含的展現(xiàn)信息之間的匹配度,調(diào)整該信息類別包含的展現(xiàn)信息。本申請實施例的有益效果如下采用本申請實施例提供的上述方案,在確定信息類別與信息之間匹配度時,不僅體現(xiàn)了被點擊信息對信息類別與信息之間匹配度的貢獻度,還體現(xiàn)了只展現(xiàn)但未被點擊的信息以及信息個數(shù)對該匹配度的貢獻度,因此確定出的匹配度非常準確,進而基于該匹配度進行信息調(diào)整時也不會出現(xiàn)較大的誤調(diào)整,從而解決了基于現(xiàn)有技術(shù)提供的效果統(tǒng)計算 法得到的匹配度對信息進行調(diào)整時,可能導(dǎo)致出現(xiàn)較大誤調(diào)整從而導(dǎo)致浪費處理資源的問題。
圖I為本申請實施例提供的一種信息調(diào)整方法的具體流程示意圖;圖2為本申請實施例提供的方法應(yīng)用于根據(jù)關(guān)鍵詞進行信息搜索的場景下的具體應(yīng)用流程圖;圖3為本申請實施例提供的一種信息調(diào)整裝置的具體結(jié)構(gòu)示意圖。
具體實施例方式為了解決基于現(xiàn)有技術(shù)提供的效果統(tǒng)計算法得到的信息與信息所屬類別的匹配度對信息進行調(diào)整時,可能導(dǎo)致出現(xiàn)較大誤調(diào)整從而導(dǎo)致浪費處理資源的問題,本申請實施例提供一種信息調(diào)整方案。該方案在確定信息類別與信息之間匹配度時,在考慮到被點擊信息以及只展現(xiàn)但未被點擊的信息都會為該匹配度做出貢獻,以及被展現(xiàn)的分屬不同信息類別的信息個數(shù)也會對該匹配度做出貢獻的基礎(chǔ)上,分別為不同展現(xiàn)信息分配相應(yīng)的權(quán)重值,并進一步根據(jù)該權(quán)重值來確定信息類別與其包含的展現(xiàn)信息之間匹配度,從而能夠根據(jù)該匹配度對展現(xiàn)信息進行準確調(diào)整。本申請實施例提供的該方案能夠在體現(xiàn)被點擊信息的貢獻度的同時,充分體現(xiàn)只展現(xiàn)但未被點擊的信息的貢獻度,并且還能體現(xiàn)信息個數(shù)對于該匹配度的貢獻度,從而能夠非常準確地確定信息類別與信息之間匹配度,避免基于現(xiàn)有技術(shù)采用的方案得到的匹配度準確性不高而導(dǎo)致出現(xiàn)較大的信息誤調(diào)整的問題。以下結(jié)合附圖,對本申請實施例提供的該方案進行詳細說明。本申請實施例首先提供一種信息調(diào)整方法,該方法的具體流程示意圖如圖I所示,包括以下步驟步驟11,從信息瀏覽日志中獲取針對展現(xiàn)信息的點擊行為信息,并根據(jù)該點擊行為信息,從展現(xiàn)信息中確定被點擊信息和只展現(xiàn)但未被點擊信息,并確定只展現(xiàn)但未被點擊信息的總個數(shù);在本申請實施例中,展現(xiàn)信息可以為根據(jù)搜索關(guān)鍵詞,利用搜索引擎搜索到并展現(xiàn)在用戶終端顯示屏上的信息,也可以為信息提供方直接顯示在終端顯示屏上的信息,t匕如商品賣家在終端顯示屏上向買家展示的商品信息就可視為展現(xiàn)信息。用戶在對展現(xiàn)信息進行瀏覽時,會根據(jù)自身需求對某個或某些信息進行點擊,這樣就會在信息瀏覽中留下相應(yīng)的記錄,即上文所述的點擊行為信息??蛇x的,這里的點擊行為信息可以為指定時間長度內(nèi)的點擊行為信息。一般地,該指定時間長度越長,記錄的行為信息會越多,則最終得到的匹配度的準確度越高。步驟12,為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值;本申請實施例中,第一原始權(quán)重值可以但不限于根據(jù)被點擊信息在展現(xiàn)信息中所 占比例來確定,而第二原始權(quán)重值可以但不限于根據(jù)只展現(xiàn)但未被點擊信息在展現(xiàn)信息中所占比例來確定。比如,若展現(xiàn)信息總個數(shù)為20個,其中包含8個點擊信息、12個只展現(xiàn)但未被點擊信息,則第一原始權(quán)重值可以為8個點擊信息在20個展現(xiàn)信息中所占比例,即O. 4,而第二原始權(quán)重值可以為12個只展現(xiàn)但未被點擊信息在20個展現(xiàn)信息中所占比例,即O. 6?;蛘?,可以將O. 4擴大10倍變?yōu)?后作為第一原始權(quán)重值,而相應(yīng)地,也可將O. 6擴大10倍變?yōu)?后作為第二原始權(quán)重值。而上述第一對應(yīng)關(guān)系權(quán)重值的具體大小則可以是一個固定值。比如,本申請實施例中,就可以將該固定值設(shè)置為I。需要說明的是,這里的第一對應(yīng)關(guān)系權(quán)重值與后文將要出現(xiàn)的為只展現(xiàn)但未被點擊信息所屬的各個信息類別分配的第二對應(yīng)關(guān)系權(quán)重值是有一定聯(lián)系的。一般地,為任一信息類別所分配的第二對應(yīng)關(guān)系權(quán)重值是與屬于該信息類別的只展現(xiàn)但未被點擊信息在只展現(xiàn)但未被點擊信息中所占比例有關(guān)的,而該比例一般不會超過1,即不會超過上述固定值。也就是說,按照上述設(shè)置方式,一般情況下,第二對應(yīng)關(guān)系權(quán)重值與第一對應(yīng)關(guān)系權(quán)重值的關(guān)系為第二對應(yīng)關(guān)系權(quán)重值 < 第一對應(yīng)關(guān)系權(quán)重值。不過,第一、第二對應(yīng)關(guān)系權(quán)重值的設(shè)置是可以靈活變動的。按照另外的設(shè)置方式,也可能出現(xiàn)第二對應(yīng)關(guān)系權(quán)重值>第一對應(yīng)關(guān)系權(quán)重值的情況。步驟13,確定各個只展現(xiàn)但未被點擊信息所屬的信息類別,針對確定出的只展現(xiàn)但未被點擊信息所屬的任意信息類別,確定該信息類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)步驟11中確定的只展現(xiàn)但未被點擊信息的總個數(shù)和該第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分配第二對應(yīng)關(guān)系權(quán)重值;前文已提到,第二對應(yīng)關(guān)系權(quán)重值可以與只展現(xiàn)但未被點擊信息的個數(shù)在只展現(xiàn)但未被點擊信息的總個數(shù)的比例有關(guān),具體來說,比如在20個展現(xiàn)信息中,若只展現(xiàn)但未被點擊信息的總個數(shù)為12個,而某信息類別所包含的只展現(xiàn)但未被點擊信息的個數(shù)為6,即該信息列別所包含的只展現(xiàn)但未被點擊信息在只展現(xiàn)但未被點擊信息中所占比例為O. 5,那么該信息類別被分配的第二對應(yīng)關(guān)系權(quán)重值就可以為O. 5。步驟14,針對展現(xiàn)信息所屬的任意信息類別,執(zhí)行下述操作確定該信息類別包含的被點擊信息和只展現(xiàn)但未被點擊信息,并根據(jù)確定出的該信息類別包含的被點擊信息被分配的第一原始權(quán)重值、確定出的該信息類別包含的只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值,以及該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值和第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度,并根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息。步驟14所述的操作的一種實現(xiàn)方式可以為執(zhí)行對該信息類別包含的各個被點擊信息被分配的第一原始權(quán)重值分別與該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第一和值;并執(zhí)行對該信息類別包含的各個只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值分別與該信息類別被分配的第二對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第二和值;最后,根據(jù)第一和值與第二和值之和,就可以確定出該信息類別與其包含的展現(xiàn)信息之間的匹配度,從而根據(jù)該匹配度調(diào)整該信息類別包含的展現(xiàn)信息。 在一個較佳的實施例中,上述步驟12中為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值的具體過程可以為首先,從展現(xiàn)信息中確定被點擊信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù);然后,根據(jù)展現(xiàn)信息的總個數(shù)、被點擊信息的總個數(shù),確定第一原始權(quán)重值并分配給各個被點擊信息;最后,根據(jù)展現(xiàn)信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù),確定第二原始權(quán)重值并分配給各個只展現(xiàn)但未被點擊信息。本申請實施例提供的上述方法通過在確定信息類別與其包含的展現(xiàn)信息之間的匹配度時,不僅考慮到被點擊的信息為該匹配度做出的貢獻,還引入了只展現(xiàn)但未被點擊的信息為該匹配度做出的貢獻、被展現(xiàn)的分屬不同類別的信息個數(shù)為該匹配度做出貢獻,因此,可以大大提高確定出的匹配度的準確性,從而根據(jù)確定出的準確性較高的匹配度對展現(xiàn)信息進行調(diào)整就能夠盡量避免產(chǎn)生較大的誤調(diào)整,從而解決基于現(xiàn)有技術(shù)提供的效果統(tǒng)計算法得到的信息與信息所屬類別的匹配度對信息進行調(diào)整時,可能導(dǎo)致出現(xiàn)較大誤調(diào)整從而導(dǎo)致浪費處理資源的問題。可選的,上述步驟14中所述的“根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息”的具體實現(xiàn)過程可以為首先,判斷該信息類別與其包含的展現(xiàn)信息之間的匹配度是否低于預(yù)設(shè)的匹配度閾值;然后,在判斷結(jié)果為是時,從該信息類別包含的非展現(xiàn)信息中選取信息,并利用選取的信息更新該信息類別包含的展現(xiàn)信息。比如,針對共包含40條信息的信息類別A,若當前只對該信息類別A包含的20條信息進行了展現(xiàn)(即信息類別A包含的展現(xiàn)信息有20條,而包含非展現(xiàn)信息也有20條),并且確定出信息類別A與其包含的這20條展現(xiàn)信息之間的匹配度低于了匹配度閾值(比如為30% )。那么,就可以從信息類別A所包含的20條非展現(xiàn)信息中選取信息對信息類別A包含的展現(xiàn)信息進行替換。如可以從20條非展現(xiàn)信息中選取10條信息對展現(xiàn)信息中的10條只展現(xiàn)但未被點擊信息進行替換,也可以選取全部的20條非展現(xiàn)信息對全部的20條展現(xiàn)信息進行替換。此外,還可以按照一次替換一條展現(xiàn)信息的方式,逐次從該信息類別包含的非展現(xiàn)信息中選取非展現(xiàn)信息對展現(xiàn)信息進行替換,并在每次替換后,都可以根據(jù)用戶針對替換后的展現(xiàn)信息所產(chǎn)生的新的點擊行為信息,確定該信息類別與其當前包含的展現(xiàn)信息(即替換后的展現(xiàn)信息)之間的匹配度,從而最終可以選擇一個最大的匹配度所對應(yīng)的展現(xiàn)信息作為一種較佳的信息集合進行長期展示。通過根據(jù)信息類別與其包含的展現(xiàn)信息之間的匹配度對展現(xiàn)信息的動態(tài)調(diào)整,能夠從展現(xiàn)信息中去除或替換掉用戶不感興趣的、與信息類別匹配程度不高的信息,而只將用戶感興趣的、與信息類別匹配程度較高的信息展現(xiàn)給用戶,從而可以避免浪費處理資源來提供用戶不感興趣的信息的問題,同時還大大了提升用戶的體驗。在實際應(yīng)用中,在根據(jù)關(guān)鍵詞進行信息搜索的場景下,采用本申請實施例提供的上述方案確定信息類別與信息之間匹配度的具體實現(xiàn)流程示意圖如圖2所示,包括如下步驟步驟21,對根據(jù)某一關(guān)鍵詞進行一次搜索并呈現(xiàn)給用戶的展現(xiàn)信息、展現(xiàn)信息對應(yīng)的信息類別標識、用戶針對展現(xiàn)信息的點擊行為信息進行記錄;步驟22,根據(jù)記錄的上述信息,確定展現(xiàn)信息的總個數(shù),并確定被點擊信息的總個數(shù)以及只展現(xiàn)但未被點擊信息的總個數(shù);在本申請實施例中,可以假設(shè)確定出的展現(xiàn)信息總個數(shù)為10,被點擊信息的總個數(shù)為3,只展現(xiàn)但未被點擊信息的總個數(shù)為7 ; 步驟23,根據(jù)展現(xiàn)信息總個數(shù)、被用戶點擊的信息總個數(shù)以及只展現(xiàn)但未被點擊的信息總個數(shù),為被用戶點擊的信息分配原始權(quán)重值;比如,根據(jù)展現(xiàn)信息總個數(shù)10,被用戶點擊的信息總個數(shù)3,只展現(xiàn)但未被點擊的信息總個數(shù)7,為被用戶點擊的信息分配原始權(quán)重值3/10 = O. 3,該原始權(quán)重值可以記為Sctr0同時,為只展現(xiàn)但未被點擊的信息分配原始權(quán)重值7/10 = O. 7,該原始權(quán)重值可以記為Sn。步驟24,按照預(yù)設(shè)的對應(yīng)關(guān)系權(quán)重值分配策略,為展現(xiàn)信息所屬信息類別分別分配相應(yīng)的對應(yīng)關(guān)系權(quán)重值,其中,展現(xiàn)信息所屬信息類別被分配的對應(yīng)關(guān)系權(quán)重值大小可以與各信息類別與展現(xiàn)信息之間的匹配度成正比;如,假設(shè)上述3個被點擊信息所屬信息類別的標識分別為p_catel、p_cate2、p_cate3,則按照預(yù)設(shè)的“為被點擊信息所屬信息類別分配的對應(yīng)關(guān)系權(quán)重值=I”這樣的對應(yīng)關(guān)系權(quán)重值分配策略,可以為3個被點擊信息所屬信息類別分別分配對應(yīng)關(guān)系權(quán)重值“I”。若將第η個信息類別被分配的對應(yīng)關(guān)系權(quán)重值記為Rsctr (kw p_caten),則根據(jù)上述分配策略,當η為1、2、3時,分別有如下式[I]、[2]、[3]這樣的等式Rsctr (kw p_catel) = I[I]Rsctr (kw p_cate2) = I[2]Rsctr (kw p_cate3) = I[3]而針對另外7個只展現(xiàn)但未被點擊信息而言,則可以采用下述方式確定其分別所屬的信息類別的對應(yīng)關(guān)系權(quán)重值首先,確定這7個只展現(xiàn)但未被點擊信息所分屬的信息類別,比如,假設(shè)確定出這7個只展現(xiàn)但未被點擊信息中,有4個信息是屬于信息類別p_catel,另外的3個信息則分屬于信息類別 p_cate2、p_cate3、p_cate4 ;然后,按照“第η個信息類別被分配的對應(yīng)關(guān)系權(quán)重值Rsn (kw p_caten)=該信息類別所包含的只展現(xiàn)但未被點擊信息的個數(shù)/只展現(xiàn)但未被點擊信息的總個數(shù)”的計算方式,可以計算得到如下述公式[4] [7]所示的信息類別p_catel p_cate4被分配的對應(yīng)關(guān)系權(quán)重值Rsn (kw p_catel) = 4/7 = O. 57[4]Rsn (kw p_cate2) = 1/7 = O. 14[5]
Rsn (kw p_cate3) = 1/7 = 0. 14[6]Rsn (kw p_cate4) = 1/7 = 0. 14[7]步驟25,根據(jù)確定的原始權(quán)重值和對應(yīng)關(guān)系權(quán)重值,確定每個信息類別的信息類別權(quán)重值Kwa p_caten,其中,Kwa p_caten即體現(xiàn)了信息類別與其包含的展現(xiàn)信息之間的匹配度;具體地,針對信息類別p_catel,可以按照下述計算方式[8]計算在以關(guān)鍵詞Kwl作為檢索關(guān)鍵詞的前提下為信息類別p_catel所確定的信息類別權(quán)重值Kwl p_catel Kwl p_catel = SctrXRsctr (kw p_catel)+SnXRsn(kw p_catel)
= O. 3X1+0. 7X0. 57[8]= O. 699類似地,針對信息類別p_cate2、p_cate3、p_cate4,還可以計算出以關(guān)鍵詞Kwl作為檢索關(guān)鍵詞的前提下的信息類別權(quán)重值Kwl :p_cate2、Kwl :p_cate3、Kwl :p_cate4,如下式[9]、[10]、[11]所示Kwl p_cate2 = SctrXRsctr (kw p_cate2)+SnXRsn(kw p_cate2)= 0. 3X1+0. 7X0. 14[9]= 0. 398Kwl p_cate3 = SctrXRsctr (kw p_cate3)+SnXRsn(kw p_cate3)= 0. 3X1+0. 7X0. 14[10]= 0. 398Kwl p_cate4 = SctrXRsctr (kw p_cate4)+SnXRsn(kw p_cate4)= 0+0. 7X0. 14[11]= 0. 098上述步驟22 25是基于某一關(guān)鍵詞進行一次搜索并對展現(xiàn)信息、展現(xiàn)信息對應(yīng)的信息類別標識、用戶基于展現(xiàn)信息的點擊行為信息進行記錄后進行的操作。此時可以直接根據(jù)上述信息類別權(quán)重值的具體數(shù)值O. 699,0. 398,0. 398,0. 098來確定信息類別與信息之間匹配度。按照原始權(quán)重值和對應(yīng)關(guān)系權(quán)重值的分配方式可知,信息類別權(quán)重值越大,則該信息類別所包含的信息與該信息類別的匹配度越高;反之,則匹配度越低。步驟26,針對任一信息類別,當根據(jù)其信息類別權(quán)重值Kwa p_caten和預(yù)設(shè)的信息類別權(quán)重閾值確定出需要對該信息類別包含的展現(xiàn)信息進行調(diào)整時,執(zhí)行調(diào)整展現(xiàn)信息的操作。當考慮到需要保證結(jié)果的較高準確度時,在步驟21中,也可以是對一臺服務(wù)器在一天24小時內(nèi)針對同一關(guān)鍵詞(或所有關(guān)鍵詞)產(chǎn)生的上述信息進行記錄,或者是對一臺服務(wù)器在30天內(nèi)針對同一關(guān)鍵詞(或所有關(guān)鍵詞)產(chǎn)生的上述信息進行記錄,還可以是對多臺服務(wù)器在指定時間長度內(nèi)針對同一關(guān)鍵詞(或所有關(guān)鍵詞)產(chǎn)生的上述信息進行記錄。一般說來,該指定時間長度越長,記錄的信息越多,基于記錄的信息所確定出的上述匹配度就會越準確。在本申請實施例中,當記錄了一臺服務(wù)器在一天24小時內(nèi)針對同一關(guān)鍵詞Kwa進行的m次搜索并展現(xiàn)信息、展現(xiàn)信息對應(yīng)的信息類別標識、用戶基于展現(xiàn)信息的點擊行為信息時,那么,在按照上述步驟22 25,實現(xiàn)分別根據(jù)每次搜索所記錄的上述信息確定出各個信息類別的信息類別權(quán)重值之后,針對任意信息類別n,可以進一步采用下式[12]計算該信息類別η的m個信息類別權(quán)重值的平均值Dn (kwa p_caten)。需要說明的是,為了便于描述,可以將基于關(guān)鍵詞Kwa進行的第j次搜索所計算得到的、針對信息類別η的信息類別權(quán)重值可以記為Kwaj p_caten,將相應(yīng)的對應(yīng)關(guān)系權(quán)重值記為Rsctrj (kwa p_caten)和 Rsnj (kwa p_caten)。
權(quán)利要求
1.一種信息調(diào)整方法,其特征在于,包括 從信息瀏覽日志中獲取針對展現(xiàn)信息的點擊行為信息,并根據(jù)所述點擊行為信息,從展現(xiàn)信息中確定被點擊信息和只展現(xiàn)但未被點擊信息,并確定只展現(xiàn)但未被點擊信息的總個數(shù); 為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值; 確定各個只展現(xiàn)但未被點擊信息所屬的信息類別,并針對確定出的只展現(xiàn)但未被點擊信息所屬的任意信息類別,確定該信息類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)所述總個數(shù)和所述第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分配第二對應(yīng)關(guān)系權(quán)重值;以及 針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行 確定該信息類別包含的被點擊信息和只展現(xiàn)但未被點擊信息,并根據(jù)該信息類別包含的被點擊信息被分配的第一原始權(quán)重值、該信息類別包含的只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值,以及該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值和第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度;并根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息。
2.如權(quán)利要求I所述的方法,其特征在于,為各個被點擊信息分別分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,具體包括 確定展現(xiàn)信息中包含的被點擊信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù); 根據(jù)展現(xiàn)信息的總個數(shù)、被點擊信息的總個數(shù),確定第一原始權(quán)重值并分配給各個被點擊信息; 根據(jù)展現(xiàn)信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù),確定第二原始權(quán)重值并分配給各個只展現(xiàn)但未被點擊信息。
3.如權(quán)利要求I所述的方法,其特征在于,根據(jù)所述任意信息類別包含的被點擊信息被分配的第一原始權(quán)重值、該信息類別包含的只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值,以及該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值和第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度,具體包括 執(zhí)行該信息類別包含的各個被點擊信息被分配的第一原始權(quán)重值分別與該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第一和值;并 執(zhí)行該信息類別包含的各個只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值分別與該信息類別被分配的第二對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第二和值;以及 根據(jù)第一和值與第二和值之和,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度。
4.如權(quán)利要求I 3任一所述的方法,其特征在于,根據(jù)確定的匹配度調(diào)整該信息類別包含的展現(xiàn)信息,具體包括 判斷確定的該信息類別與其包含的展現(xiàn)信息之間的匹配度是否低于預(yù)設(shè)的匹配度閾值;并 在判斷結(jié)果為是時,從該信息類別包含的非展現(xiàn)信息中選取信息;并 利用選取的信息更新該信息類別所包含的展現(xiàn)信息。
5.如權(quán)利要求I 3任一所述的方法,其特征在于,所述點擊行為信息為指定時間長度內(nèi)的點擊行為信息。
6.一種信息調(diào)整裝置,其特征在于,包括 信息和個數(shù)確定單元,用于從信息瀏覽日志中獲取針對信息的點擊行為信息,并根據(jù)所述點擊行為信息,從展現(xiàn)信息中確定被點擊信息和只展現(xiàn)但未被點擊信息,并確定只展現(xiàn)但未被點擊信息的總個數(shù); 第一權(quán)重值分配單元,用于為信息和個數(shù)確定單元確定的各個被點擊信息分別分配第一原始權(quán)重值,為信息和個數(shù)確定單元確定的只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為信息和個數(shù)確定單元確定的被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值; 信息類別確定單元,用于確定信息和個數(shù)確定單元確定的各個只展現(xiàn)但未被點擊信息所屬的信息類別; 第二權(quán)重值分配單元,用于針對信息類別確定單元確定出的只展現(xiàn)但未被點擊信息所屬的各個類別,分別確定各個類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)所述總個數(shù)和所述第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分別分配第二對應(yīng)關(guān)系權(quán)重值; 匹配度確定單元,用于針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行確定該信息類別包含的被點擊信息和只展現(xiàn)但未被點擊信息,并根據(jù)第一權(quán)重值分配單元為該信息類別包含的被點擊信息分配的第一原始權(quán)重值、為該信息類別包含的只展現(xiàn)但未被點擊信息分配的第二原始權(quán)重值、為該信息類別分配的第一對應(yīng)關(guān)系權(quán)重值和第二權(quán)重值分配單元為該信息類別分配的第二對應(yīng)關(guān)系權(quán)重值,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度; 信息調(diào)整單元,用于針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行根據(jù)匹配度確定單元確定的該信息類別與其包含的展現(xiàn)信息之間的匹配度,調(diào)整該信息類別包含的展現(xiàn)信肩、O
7.如權(quán)利要求6所述的裝置,其特征在于,所述第一權(quán)重值分配單元具體包括 總個數(shù)確定模塊,用于確定展現(xiàn)信息中包含的被點擊信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù); 第一分配模塊,用于根據(jù)總個數(shù)確定模塊確定的展現(xiàn)信息的總個數(shù)、被點擊信息的總個數(shù),確定第一原始權(quán)重值并分配給各個被點擊信息; 第二分配模塊,用于根據(jù)總個數(shù)確定模塊確定的展現(xiàn)信息的總個數(shù)、只展現(xiàn)但未被點擊信息的總個數(shù),確定第二原始權(quán)重值并分配給各個只展現(xiàn)但未被點擊信息; 第三分配模塊,用于為信息和個數(shù)確定單元確定的被點擊信息所屬的各個信息類別分別分配第一對應(yīng)關(guān)系權(quán)重值。
8.如權(quán)利要求6所述的裝置,其特征在于,所述匹配度確定單元具體包括 第一和值確定模塊,用于針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行該信息類別包含的各個被點擊信息被分配的第一原始權(quán)重值分別與該信息類別被分配的第一對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第一和值;并 第二和值確定模塊,用于執(zhí)行該信息類別包含的各個只展現(xiàn)但未被點擊信息被分配的第二原始權(quán)重值分別與該信息類別被分配的第二對應(yīng)關(guān)系權(quán)重值相乘,并對所有相乘結(jié)果進行相加的操作,得到第二和值; 匹配度確定模塊,用于根據(jù)第一和值確定模塊確定的第一和值與第二和值確定模塊確定的第二和值之和,確定該信息類別與其包含的展現(xiàn)信息之間的匹配度。
9.如權(quán)利要求6 8任一所述的裝置,其特征在于,所述信息調(diào)整單元具體包括 判斷模塊,針對所述展現(xiàn)信息所屬的任意信息類別,執(zhí)行判斷匹配度確定單元確定的該信息類別與其包含的展現(xiàn)信息之間的匹配度是否低于預(yù)設(shè)的匹配度閾值; 選取模塊,用于在判斷模塊得到的判斷結(jié)果為是時,從該信息類別包含的非展現(xiàn)信息中選取信息; 更新模塊,用于利用選取模塊選取的信息更新該信息類別所包含的展現(xiàn)信息。
10.如權(quán)利要求6 8任一所述的裝置,其特征在于,所述點擊行為信息為指定時間長度內(nèi)的點擊行為信息。
全文摘要
本申請公開了一種信息調(diào)整方法及裝置,以解決可能出現(xiàn)對展現(xiàn)信息產(chǎn)生較大的誤調(diào)整從而導(dǎo)致浪費處理資源的問題。包括根據(jù)點擊行為信息確定只展現(xiàn)但未被點擊信息的總個數(shù);為被點擊信息分配第一原始權(quán)重值,為只展現(xiàn)但未被點擊信息分配第二原始權(quán)重值,為被點擊信息所屬信息類別分配第一對應(yīng)關(guān)系權(quán)重值;確定信息類別包含的只展現(xiàn)但未被點擊信息的第一個數(shù),并根據(jù)所述總個數(shù)和第一個數(shù),為只展現(xiàn)但未被點擊信息所屬的各個信息類別分配第二對應(yīng)關(guān)系權(quán)重值;并執(zhí)行根據(jù)第一原始權(quán)重值、第二原始權(quán)重值、第一對應(yīng)關(guān)系權(quán)重值、第二對應(yīng)關(guān)系權(quán)重值,確定所述匹配度;并根據(jù)匹配度調(diào)整展現(xiàn)信息。
文檔編號G06F17/30GK102810104SQ20111014983
公開日2012年12月5日 申請日期2011年6月3日 優(yōu)先權(quán)日2011年6月3日
發(fā)明者王暢, 黃慧, 史健, 謝鋒, 傅茂建, 劉剛 申請人:阿里巴巴集團控股有限公司