本發(fā)明涉及信息處理領(lǐng)域,尤其涉及一種推送信息粗選排序方法及裝置。
背景技術(shù):
隨著信息技術(shù)的發(fā)展,在信息推送領(lǐng)域確定出信息推送的目標(biāo)用戶以提升信息推送的效率是現(xiàn)有技術(shù)中一直致力解決的問(wèn)題。所述信息推送包括廣告推送,向用戶推薦的視頻、音頻以及圖文信息等。為了向用戶發(fā)送感興趣的推送信息,提高推送信息的傳達(dá)率及資源有效利用率,會(huì)對(duì)各個(gè)推送信息進(jìn)行受歡迎程度的排序預(yù)測(cè)。在進(jìn)行預(yù)測(cè)時(shí),包括預(yù)測(cè)值的粗選排序及精選排序。在粗選排序中將根據(jù)推送信息目前的數(shù)據(jù),從成千上萬(wàn)數(shù)量級(jí)的推送信息中選擇少量的受歡迎程度較高的推送信息,再由精選排序進(jìn)一步對(duì)粗選出的推送信息進(jìn)行受歡迎程度、被觀看或被點(diǎn)擊的預(yù)測(cè)概率再次進(jìn)行精確的排序。然而在現(xiàn)有技術(shù)中發(fā)現(xiàn),通常某些推送信息是非常受用戶歡迎的,但是有推送的時(shí)間短等問(wèn)題,導(dǎo)致在粗選中就被過(guò)濾掉了,導(dǎo)致的處理結(jié)果精確度低等問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例期望提供一種推送信息粗選排序方法及裝置,至少部分解決粗選結(jié)果精確度低的問(wèn)題。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
本發(fā)明實(shí)施例第一方面提供了一種推送信息粗選方法,所述方法包括:
根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
計(jì)算所述特征的標(biāo)準(zhǔn)差;
確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
基于上述方案,所述方法還包括:
確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值,包括:
基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
基于上述方案,所述方法還包括:
確定安全因子,其中,所述安全因子用于防止所述標(biāo)準(zhǔn)差異為特定值或未獲取到標(biāo)準(zhǔn)差時(shí)導(dǎo)致的波動(dòng)值求解異常;
所述基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值,包括:
基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述安全因子,計(jì)算所述預(yù)測(cè)值。
基于上述方案,述預(yù)測(cè)值,包括:
利用如下公式計(jì)算所述預(yù)測(cè)值y;
其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動(dòng)系數(shù);所述β為所述安全因子;所述σi為所述特征的標(biāo)準(zhǔn)差。
基于上述方案,所述根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值,包括:
確定用于計(jì)算所述預(yù)測(cè)值的推送信息特征;
確定用于計(jì)算所述預(yù)測(cè)值的用戶特征。
基于上述方案,所述確定用于計(jì)算所述預(yù)測(cè)值的用戶特征,包括:
確定各種用戶特征的可信度;
基于所述可信度,選擇用于計(jì)算所述預(yù)測(cè)值的用戶特征。
基于上述方案,所述確定用于計(jì)算所述預(yù)測(cè)值的用戶特征,包括:
從各種用戶特征中選擇出一個(gè)或多個(gè)非加工用戶特征,作為用于計(jì)算所述預(yù)測(cè)值的用戶特征。
本發(fā)明實(shí)施例第二方面提供一種推送信息粗選裝置,所述裝置包括確定單元、計(jì)算單元及選擇單元;
所述確定單元,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
所述計(jì)算單元,用于計(jì)算所述特征的標(biāo)準(zhǔn)差;
所述確定單元,還用于確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
所述計(jì)算單元,還用于基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
所述選擇單元,用于基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
基于上述方案,所述確定單元,還用于確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述計(jì)算單元,具體用于基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
基于上述方案,所述確定單元,具體用于確定安全因子,其中,所述安全因子用于防止所述標(biāo)準(zhǔn)差異為特定值或未獲取到標(biāo)準(zhǔn)差時(shí)導(dǎo)致的波動(dòng)值求解異常;
所述計(jì)算單元,具體用于基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述安全因子,計(jì)算所述預(yù)測(cè)值。
基于上述方案,所述計(jì)算單元,具體用于利用如下公式計(jì)算所述預(yù)測(cè)值y;
其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述 波動(dòng)系數(shù);所述β為所述安全因子;所述σi為所述特征的標(biāo)準(zhǔn)差。
基于上述方案,所述確定單元,具體用于確定用于計(jì)算所述預(yù)測(cè)值的推送信息特征;確定用于計(jì)算所述預(yù)測(cè)值的用戶特征。
基于上述方案,所述確定單元,具體用于確定各種用戶特征的可信度;基于所述可信度,選擇用于計(jì)算所述預(yù)測(cè)值的用戶特征。
基于上述方案,所述確定單元,具體用于從各種用戶特征中選擇出一個(gè)或多個(gè)非加工用戶特征,作為用于計(jì)算所述預(yù)測(cè)值的用戶特征。
本發(fā)明實(shí)施例提供的推送信息粗選方法及裝置,在進(jìn)行用于粗選的預(yù)測(cè)值計(jì)算時(shí),將計(jì)算特征的標(biāo)準(zhǔn)差,并確定對(duì)應(yīng)特征的波動(dòng)概率,而標(biāo)準(zhǔn)差和波動(dòng)概率能夠用于計(jì)算出修正該特征對(duì)應(yīng)的權(quán)值的波動(dòng)值。這樣的話,有利于目前歷史推送數(shù)據(jù)較小的推送信息在標(biāo)準(zhǔn)值波動(dòng)較大的情況下,也能有機(jī)會(huì)作為被粗選出的推送信息進(jìn)入后續(xù)精選的再次選擇;能夠解決現(xiàn)有技術(shù)中部分推送信息因歷史推送數(shù)據(jù)少,但是推送效果佳的訂單在粗選中被篩選掉,導(dǎo)致最終沒(méi)能選擇出推送效果佳的推送信息,提升了粗選的精確度。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例提供的第一種推送信息粗選方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的第二種推送信息粗選方法的流程示意圖;
圖3為本發(fā)明實(shí)施例提供的第一種推送信息粗選裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的第二種推送信息粗選裝置的結(jié)構(gòu)示意圖;
圖5為本發(fā)明實(shí)施例提供的預(yù)測(cè)值的計(jì)算示意流程圖。
具體實(shí)施方式
以下結(jié)合說(shuō)明書(shū)附圖及具體實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)闡述。
實(shí)施例一:
如圖1所示,本實(shí)施例提供一種推送信息粗選方法,所述方法包括:
步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
步驟s120:計(jì)算所述特征的標(biāo)準(zhǔn)差;
步驟s130:確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
步驟s140:基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
步驟s150:基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
本實(shí)施例所述的推送信息可包括廣告等信息。這里的廣告可包括社交廣告等各種類型的廣告。本實(shí)施例所述的推送信息粗選方法,可以應(yīng)用于各種推送信息的推送平臺(tái)中,也可以用于各種確定采用作為效果推送信息的選擇設(shè)備中。
在本實(shí)施例中所述步驟s110將根據(jù)推送信息的歷史推送數(shù)據(jù),這里的歷史推送數(shù)據(jù)對(duì)應(yīng)于廣告可包括歷史廣告數(shù)據(jù)。這里的歷史廣告數(shù)據(jù)可包括點(diǎn)擊了或觀看了或執(zhí)行廣告期待的轉(zhuǎn)換行為的種子用戶、行為有效期及點(diǎn)擊率、轉(zhuǎn)換率、廣告投放位、廣告投放時(shí)間等各種基于推送信息在推送過(guò)程中形成的各種數(shù)據(jù)。所述轉(zhuǎn)換行為可包括下載應(yīng)用(application,app)、購(gòu)買(mǎi)對(duì)應(yīng)的推送信息中推廣的各自服務(wù)、商品等推送信息希望用戶執(zhí)行的操作。
在本實(shí)施例中步驟s120中計(jì)算的標(biāo)準(zhǔn)差為針對(duì)某一特征的標(biāo)準(zhǔn)差。這的標(biāo)準(zhǔn)差為:該特征為指定值時(shí),歷史推送數(shù)據(jù)中操作結(jié)果的標(biāo)準(zhǔn)差。這里的操作結(jié)果用于表征特征為指定值的用戶是否執(zhí)行了該推送數(shù)據(jù)期望的操作的取值。例如,以廣告a為例,對(duì)應(yīng)的特征為年齡;若4個(gè)比特分別表示4個(gè)不同的年齡段。假設(shè)用戶c在第1個(gè)年齡段,則對(duì)應(yīng)于第1個(gè)年齡段的第1個(gè)比特為1,其他比特為0;則此時(shí)年齡這一特征的取值為1000。在計(jì)算標(biāo)準(zhǔn)差時(shí),若取年齡特征為1000的歷史推送數(shù)據(jù)的數(shù)據(jù)行,這些數(shù)據(jù)行中包括用戶是否點(diǎn)擊了廣告a的操作結(jié)果列。假設(shè)在操作結(jié)果列中以“1”表示點(diǎn)擊了該廣告,“0”表示未點(diǎn)擊該廣告。例如,在歷史推送數(shù)據(jù)的數(shù)據(jù)行中有50個(gè)數(shù)據(jù)行的年齡特征的取值為1000,則提取這50個(gè)列的結(jié)果列作為樣本數(shù)據(jù),求解標(biāo)準(zhǔn)差。求解出的該標(biāo)準(zhǔn)差即為年齡特征在取第1年齡段的標(biāo)準(zhǔn)差。在計(jì)算預(yù)測(cè)值時(shí),會(huì)確 定出接收該推送信息的用戶集,提取這些用戶的年齡特征,例如,利用上述計(jì)算出的標(biāo)準(zhǔn)差,可以計(jì)算出在第1年齡段的用戶間推送,該廣告被點(diǎn)擊的概率值。再比如,該特征的取值為“性別為女”,該“性別為女”這一個(gè)特征的標(biāo)準(zhǔn)差為,歷史推送數(shù)據(jù)中女性執(zhí)行該推送信息期望的轉(zhuǎn)換操作的標(biāo)準(zhǔn)差。例如,女性點(diǎn)擊該廣告的標(biāo)準(zhǔn)差。
步驟s130中確定所述標(biāo)準(zhǔn)差的波動(dòng)概率,在本實(shí)施例中可以采用預(yù)設(shè)算法確定所述波動(dòng)概率,例如采用隨機(jī)算法確定所述波動(dòng)概率,這里的隨機(jī)算法包括高斯隨機(jī)算法。
在步驟s140中基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值。這里的權(quán)值為對(duì)應(yīng)進(jìn)行預(yù)測(cè)值計(jì)算的每一個(gè)特征的權(quán)值。
在本實(shí)施例中參與所述預(yù)測(cè)值計(jì)算的特征可包括推送信息的特征及用戶特征。這里的推送信息的特征可包括推送位、推送標(biāo)識(shí)。這里的推送標(biāo)識(shí)可為推送信息的序列號(hào);所述推送位可包括發(fā)布所述推送信息的發(fā)布位。這里的發(fā)布位可包括社交應(yīng)用上的信息發(fā)布位,例如,微信朋友圈、應(yīng)用登錄界面首頁(yè),再比如應(yīng)用頁(yè)面的頁(yè)首部位。當(dāng)然這里的發(fā)布位還可包括瀏覽器的首頁(yè)、瀏覽器的側(cè)邊廣告位及懸浮窗等。所述用戶特征可包括閱讀了該推送信息,點(diǎn)擊了該推送信息或執(zhí)行了該推送信息期待的其他轉(zhuǎn)換行為的用戶的特征。這些用戶特征可包括用戶的年齡、性別、職業(yè)、行為偏好、興趣愛(ài)好及消費(fèi)水平等各種能夠表征用戶特點(diǎn)的特征。
在本實(shí)施例中所述預(yù)測(cè)值可用于表征繼續(xù)發(fā)布該推送信息,用戶將執(zhí)行該推送信息期待的轉(zhuǎn)換行為的概率。例如,發(fā)布廣告a一段時(shí)間了,根據(jù)廣告a已發(fā)布形成的歷史廣告數(shù)據(jù),計(jì)算出所述特征標(biāo)準(zhǔn)差。在步驟s130中確定出波動(dòng)概率,在步驟s140中利用標(biāo)準(zhǔn)差和波動(dòng)概率修正權(quán)值,得到一個(gè)后修正后的權(quán)值,再利用修正后的權(quán)值預(yù)測(cè)出后續(xù)廣告a將被點(diǎn)擊的概率。
在步驟s140中具體可用入校公式計(jì)算所述預(yù)測(cè)值:
在上述公式中,所述y為所述預(yù)測(cè)值,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述σi為所述特征的標(biāo)準(zhǔn)差。在本實(shí)施例中利用的是邏輯回歸算法來(lái)計(jì)算所述預(yù)測(cè)值,在具體實(shí)現(xiàn)時(shí)還可以利用頁(yè)貝斯算法來(lái)計(jì)算所述預(yù)測(cè)值。其中
在具體實(shí)現(xiàn)時(shí),可以根據(jù)各個(gè)推送信息的預(yù)測(cè)值,進(jìn)行預(yù)測(cè)值大小的排序,然后選擇排序靠前的推送信息作為本次推送信息粗選的粗選結(jié)果;或者將預(yù)測(cè)值大于粗選閾值的推送信息作為本次推送信息粗選的粗選結(jié)果??傊趫?zhí)行完本實(shí)施例中所述的步驟s140之后,還可基于預(yù)測(cè)值選擇滿足預(yù)設(shè)條件的推送信息。這里選擇出的推送信息可作為效果推送的推送信息。這里的效果推送可為基于推送效果進(jìn)行付費(fèi)的推送操作。
在本實(shí)施例中因引入了標(biāo)準(zhǔn)差和波動(dòng)概率來(lái)修正權(quán)值,這樣的話,對(duì)于目前推送時(shí)間較短或推送量較小的推送信息,但是達(dá)到預(yù)期的推送效果的推送信息參與競(jìng)爭(zhēng),減少粗選的時(shí)后這些推送量較少的推送信息因?yàn)橥扑土枯^少導(dǎo)致被遺漏的現(xiàn)象,從而提升了粗選選擇出推送效果佳的推送信息。例如,廣告以訂單進(jìn)行標(biāo)識(shí),有些訂單才被投放到廣告平臺(tái),由于投放時(shí)間短或投放量少導(dǎo)致歷史廣告數(shù)據(jù)較少,若采用現(xiàn)有技術(shù)進(jìn)行訂單粗選,很容易將這些投放量或投放時(shí)間短的廣告篩選掉,從而導(dǎo)致粗選出的廣告并不是投放效果最好的一個(gè)或多個(gè)廣告,導(dǎo)致粗選的精確度低等現(xiàn)象。但是利用本實(shí)施例所述的信息處理方法,將通過(guò)撥動(dòng)概率及標(biāo)準(zhǔn)差的引入,減少因?yàn)闅v史推送數(shù)據(jù)少導(dǎo)致的數(shù)據(jù)撥動(dòng)性大,導(dǎo)致的將推送效果優(yōu)良的推送信息漏選的現(xiàn)象,提升了粗選的精確 度。
實(shí)施例二:
如圖1所示,本實(shí)施例提供一種推送信息粗選方法,所述方法包括:
步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
步驟s120:計(jì)算所述特征的標(biāo)準(zhǔn)差;
步驟s130:確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
步驟s140:基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
步驟s150:基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述方法還包括:
確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述步驟s140可包括:基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
在本實(shí)施例所述方法中還引入了波動(dòng)系數(shù),這里的波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍。當(dāng)一個(gè)特征的標(biāo)準(zhǔn)差過(guò)大時(shí),若采用前述實(shí)施例的所述方法就可能導(dǎo)致波動(dòng)值的取值過(guò)大的現(xiàn)象,在本實(shí)施例中引入了波動(dòng)系數(shù),波動(dòng)系數(shù)可用于與基于波動(dòng)概率和標(biāo)準(zhǔn)差得到的結(jié)果進(jìn)行乘積運(yùn)算,得到所述波動(dòng)值。在本實(shí)施例中所述波動(dòng)系數(shù)通常為大于0且不大于1的整數(shù)。若所述波動(dòng)系數(shù)取值為0,在本例子中則波動(dòng)值可為0,這時(shí)就不對(duì)權(quán)值進(jìn)行修正,忽略的因歷史推動(dòng)數(shù)據(jù)的數(shù)據(jù)量少導(dǎo)致的標(biāo)準(zhǔn)差浮動(dòng)大的現(xiàn)象。所述波動(dòng)系數(shù)可為預(yù)先設(shè)置的參數(shù),具體可根據(jù)歷史操作記錄得到的經(jīng)驗(yàn)值,也可以實(shí)驗(yàn)數(shù)據(jù)通過(guò)一次或多次實(shí)驗(yàn)得到的實(shí)驗(yàn)值,總之在計(jì)算本實(shí)施例所述推送信息粗選方法時(shí),可預(yù)先知道的一個(gè)取值。在本實(shí)施例中,引入了波動(dòng)系數(shù)調(diào)整所述波動(dòng)值,以避免所述波動(dòng)值過(guò)大或過(guò)小,以避免因特征值的波動(dòng)過(guò)大導(dǎo)致的計(jì)算結(jié)果不夠精確現(xiàn)象,進(jìn)一步提升了粗選的精確度。
圖2為本實(shí)施例所述推送信息粗選方法的另一個(gè)流程示意圖,具體包括: 提取推送信息特征和用戶特征,計(jì)算標(biāo)準(zhǔn)差;這里的計(jì)算標(biāo)準(zhǔn)差包括計(jì)算各個(gè)用于計(jì)算預(yù)測(cè)值的特征的標(biāo)準(zhǔn)差。在計(jì)算標(biāo)注差的同時(shí)或之前或之后,還將確定波動(dòng)系數(shù)、確定安全因子、確定波動(dòng)概率;接著,基于波動(dòng)概率、標(biāo)準(zhǔn)差、波動(dòng)系數(shù)及安全因子,計(jì)算預(yù)測(cè)值;最后對(duì)預(yù)測(cè)值進(jìn)行排序,形成排序結(jié)果;基于排序結(jié)果選擇預(yù)測(cè)值靠前的推送信息作為推送結(jié)果。
實(shí)施例三:
如圖1所示,本實(shí)施例提供一種推送信息粗選方法,所述方法包括:
步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
步驟s120:計(jì)算所述特征的標(biāo)準(zhǔn)差;
步驟s130:確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
步驟s140:基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
步驟s150:基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述方法還包括:
確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述步驟s150可包括:基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
所述方法還包括:
確定安全因子,其中,所述安全因子用于防止所述標(biāo)準(zhǔn)差異為特定值或未獲取到標(biāo)準(zhǔn)差時(shí)導(dǎo)致的波動(dòng)值求解異常;
所述步驟s140可包括:
基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述安全因子,計(jì)算所述預(yù)測(cè)值。
在本實(shí)施例中還引入了安全因子,若出現(xiàn)所述標(biāo)準(zhǔn)差異?;驑O端的情況,如何確定所述標(biāo)準(zhǔn)差異常,例如所述標(biāo)準(zhǔn)差的取值為特定值,具體如,所述標(biāo)準(zhǔn)差為0。在本實(shí)施例中所述未獲取到標(biāo)準(zhǔn)差也為一種標(biāo)準(zhǔn)差異常的情況下,通常若未獲得標(biāo)準(zhǔn)差將默認(rèn)所述標(biāo)準(zhǔn)差為0。若所述標(biāo)準(zhǔn)差為0,則可能導(dǎo)致波 動(dòng)值為0,在本實(shí)施例中將引入一個(gè)安全因子。所述安全因子通常為一個(gè)極小的正數(shù)。在本實(shí)施例中所述安全因子為小于預(yù)定值的常數(shù),例如,一般可為不大于千分之一的常數(shù),例如所述安全因子的取值為萬(wàn)分之一。
在標(biāo)準(zhǔn)差正常時(shí),因?yàn)闃O小對(duì)波動(dòng)值的計(jì)算干擾極小,當(dāng)表征差異常時(shí),所述安全因子因?yàn)闉闃O小的正數(shù),從而使得波動(dòng)值不為0,但是通常會(huì)使波動(dòng)值極小。這樣,通過(guò)安全因子的引入,電子設(shè)備在計(jì)算所述波動(dòng)值異常導(dǎo)致的預(yù)測(cè)值異常等現(xiàn)象。
作為本實(shí)施例的進(jìn)一步改進(jìn),以下特別提出一種基于波動(dòng)概率、標(biāo)準(zhǔn)差、安全因子及波動(dòng)系數(shù)的一個(gè)具可選示例。所述步驟s150可包括:
利用如下公式計(jì)算所述預(yù)測(cè)值y
其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動(dòng)系數(shù);所述β為所述安全因子;所述σi為所述特征的標(biāo)準(zhǔn)差。
顯然在本實(shí)施例中所述σi不能為0,否則會(huì)導(dǎo)致
在本實(shí)施例中同樣值得注意的是在本實(shí)施例中特征共有i個(gè),所述i的取值從1到i。這里的i為不小于1的整數(shù)。
通過(guò)上述公式,可以簡(jiǎn)便的精確的計(jì)算出進(jìn)行推送信息粗選的預(yù)測(cè)值,且在計(jì)算的過(guò)程中異常出現(xiàn)的概率較小,波動(dòng)值的取值范圍也可在控制范圍內(nèi);大大的提升了推送信息粗選的精確度。
實(shí)施例四:
如圖1所示,本實(shí)施例提供一種推送信息粗選方法,所述方法包括:
步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特 征及所述特征對(duì)應(yīng)的權(quán)值;
步驟s120:計(jì)算所述特征的標(biāo)準(zhǔn)差;
步驟s130:確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
步驟s140:基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
步驟s150:基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
首先本實(shí)施例所述推送信息粗選方法,為在前述實(shí)施例中任意一個(gè)技術(shù)方案上的改進(jìn),例如所述步驟s140可以采用實(shí)施例三中提供的公式計(jì)算所述預(yù)測(cè)值。本實(shí)施例與上述實(shí)施例不同的在于,所述步驟s110可包括:
確定用于計(jì)算所述預(yù)測(cè)值的推送信息特征;
確定用于計(jì)算所述預(yù)測(cè)值的用戶特征。
這里的推送信息特征可包括推送信息的發(fā)布位、發(fā)布時(shí)間、推送信息的時(shí)長(zhǎng)、推送信息的信息量及推送信息的標(biāo)識(shí)等各種信息。
這里的計(jì)算所述預(yù)測(cè)值的用戶特征,這里的用戶特征可包括用戶年齡、性別、膚色、國(guó)籍及職業(yè)等各種特征。所述i的取值在本實(shí)施例中可為推送信息特征和用戶特征的個(gè)數(shù)和。
在現(xiàn)有技術(shù)中通常進(jìn)行推送信息粗選時(shí),將僅依據(jù)推送信息特征來(lái)進(jìn)行推送信息的粗選,這樣導(dǎo)致的結(jié)果是忽略的用戶特點(diǎn)對(duì)推送信息的推送效果的影響,從而會(huì)導(dǎo)致推送效果佳的推送信息的預(yù)測(cè)值低的現(xiàn)象。首先,在本實(shí)施例中將引入用戶特征,將用戶特征作為計(jì)算所述預(yù)測(cè)值的特征。若結(jié)合實(shí)施例一至實(shí)施例三提供的技術(shù)方案,則所述xi可為推送信息特征或用戶特征的取值,以進(jìn)一步提升推送信息粗選的精確度。其次,在本實(shí)施例中將通過(guò)用戶特征的確定,選擇出用戶的少量用戶特征作為所述預(yù)測(cè)值的計(jì)算的用戶特征,而并非所有的用戶特征,這樣可以避免用戶特征過(guò)多,導(dǎo)致的計(jì)算量大的顯現(xiàn)。例如,在本實(shí)施例中將確定指定個(gè)數(shù)的用戶特征參與所述預(yù)測(cè)值的計(jì)算。這里的指定個(gè)數(shù)為事先確定的值,通常這里的指定個(gè)數(shù)為不小于1的整數(shù),優(yōu)選為2個(gè)或 2個(gè)以上的用戶特征。
在選擇所述推送信息特征時(shí)可以參見(jiàn)現(xiàn)有技術(shù),再此就不一一詳細(xì)介紹了,進(jìn)行所述用戶特征的篩選也有很多種,以下提供兩種可選方式:
可選方式一:
所述步驟s110中確定用于計(jì)算所述預(yù)測(cè)值的用戶特征可包括:
確定各種用戶特征的可信度;
基于所述可信度,選擇用于計(jì)算所述預(yù)測(cè)值的用戶特征。
在本實(shí)施例中所述可信度可為用戶特征的真實(shí)性或正確性的概率。確定用戶特征的可信度可以根據(jù)所述用戶特征的獲取方式進(jìn)行賦值得到。例如,所述獲取方式可包括基于用戶輸入確定的特征及電子設(shè)備自動(dòng)進(jìn)行信息處理整合得到的特征。例如,用戶在社交網(wǎng)絡(luò)中自行填寫(xiě)的性別、年齡及畢業(yè)院校等。所述電子設(shè)備整合的特征包括基于用戶操作確定的用戶行為偏好等特征。在確定所述可信度時(shí),還可根據(jù)用戶特征的特征屬性來(lái)確定。例如,電子設(shè)備統(tǒng)計(jì)用戶登錄關(guān)注某一話題的頻次信息,和用戶自行填寫(xiě)的頻次信息,這時(shí)可結(jié)合用戶特征屬性及信息來(lái)源。這個(gè)時(shí)候在確定所述可信度時(shí),由于時(shí)頻次信息電子設(shè)備的統(tǒng)計(jì)在大多數(shù)情況下將比用戶自行填寫(xiě)更加準(zhǔn)確;在進(jìn)行可信度賦值時(shí)就可以給若該頻次信息是電子設(shè)備自行統(tǒng)計(jì)的則賦予更高的值,若是用戶填寫(xiě)的則賦予較低的值。再比如針對(duì)用戶性別,電子設(shè)備可以通過(guò)用戶行為特點(diǎn)分析出該用戶是女性用戶還是男性用戶,但是顯然在社交比較透明的社交應(yīng)用中,或熟人社交中,用戶自行填寫(xiě)或好友填寫(xiě)的用戶性別,會(huì)比電子設(shè)備根據(jù)用戶行為特點(diǎn)更加精確,這個(gè)時(shí)候?qū)⒔Y(jié)合特征屬性和信息來(lái)源兩種方式為用戶特征進(jìn)行可信度賦值。在具體實(shí)現(xiàn)時(shí),確定所述用戶特征的可信度的方式還有多種,在本實(shí)施例中就不一一舉例了。
若可信度一旦確定,就可以根據(jù)可信度選擇用于進(jìn)行預(yù)測(cè)值計(jì)算的用戶特征,根據(jù)可信度從高到底,選擇出排序靠前的n個(gè)可信度對(duì)應(yīng)的用戶特征作為計(jì)算所述預(yù)測(cè)值的用戶特征,再比如選擇出可信度大于可信度閾值的用戶特征作為所述預(yù)測(cè)值的用戶特征。
可選方式二:
所述步驟s110中確定用于計(jì)算所述預(yù)測(cè)值的用戶特征可包括:
從各種用戶特征中選擇出一個(gè)或多個(gè)非加工用戶特征,作為用于計(jì)算所述預(yù)測(cè)值的用戶特征。
在本實(shí)施例中將用戶特征分為加工特征和非加工特征,這里的加工特征為基于對(duì)多個(gè)信息的處理得到的特征;而非加工特征可包括用戶自動(dòng)填寫(xiě)的特征,沒(méi)有進(jìn)行過(guò)信息二次整合等方式確定的。例如,通過(guò)身份證掃描得到的用戶的年齡、姓名、身份證號(hào)及原籍地址都是所述非加工特征。再比如,根據(jù)記錄著用戶每一次打開(kāi)應(yīng)用a的統(tǒng)計(jì)頻次,這個(gè)通過(guò)直接統(tǒng)計(jì)操作,并沒(méi)有和其他信息通過(guò)二次整合處理得到的特征,也可是非加工特征。所述加工特征可為確定出非加工特征以外的所有特征。例如,根據(jù)用戶購(gòu)買(mǎi)商品、服務(wù)及旅行的車票的預(yù)定等方法,確定出用戶消費(fèi)水平這一用戶特征,整合了用戶購(gòu)買(mǎi)行為、預(yù)定行為等,從而是所述加工特征。
由于非加工特征的非加工,即確定的直接性,通常其精準(zhǔn)度高于加工特征,故在本實(shí)施例中將非加工特征作的一個(gè)或多個(gè)作為計(jì)算所述預(yù)測(cè)值的用戶特征。這里的計(jì)算所述預(yù)測(cè)值的用戶特征的個(gè)數(shù)可為靜態(tài)的預(yù)設(shè)值,也可以為動(dòng)態(tài)確定的動(dòng)態(tài)值。例如,若在本實(shí)施例中將所有的非加工特征都作為計(jì)算所述預(yù)測(cè)值的用戶特征,則這個(gè)時(shí)候計(jì)算所述預(yù)測(cè)值的用戶特征的個(gè)數(shù)是動(dòng)態(tài)確定的。當(dāng)然,也可以預(yù)先確定一個(gè)預(yù)設(shè)值,從而多個(gè)非加工特征中選擇出預(yù)設(shè)值個(gè)非加工特征作為計(jì)算所述預(yù)測(cè)值的用戶特征。那么此時(shí)可能涉及到如何選擇部分非加工特征作為計(jì)算所述預(yù)測(cè)值的用戶特征,例如,可事先給非加工特征設(shè)置優(yōu)先級(jí),根據(jù)優(yōu)選級(jí)選擇若干計(jì)算所述預(yù)測(cè)值的用戶特征。
在本實(shí)施例中通??蓛?yōu)選出用戶的基本用戶特征作為計(jì)算預(yù)測(cè)值的用戶特征,例如,選擇年齡、性別、職業(yè)、所在區(qū)域及教育背景等用戶較為基本的信息作為計(jì)算所述預(yù)測(cè)值的用戶特征。當(dāng)然這些基本信息可能是用戶親自填寫(xiě)或好友代填的,可能屬于可信度較高的用戶特征,可將作為精確度較高的非加工特征被選擇作為計(jì)算預(yù)測(cè)值的用戶特征。
在本實(shí)施例中首先,引入了用戶特征來(lái)參與推送信息的粗選,從而解決了僅采用推送信息特征進(jìn)行推送信息的粗選導(dǎo)致的精確度低的現(xiàn)象,同時(shí)通過(guò)用戶特征選擇,將僅選擇部分用戶特征進(jìn)行計(jì)算,以減少信息量,避免降低粗選的效率,最后,在選擇用戶特征時(shí)可以根據(jù)可信度進(jìn)行選擇,也可以選擇非加工特征參與計(jì)算,不管采用哪種方式進(jìn)行用戶特征的選擇,都能夠再次提升計(jì)算的精確度。
實(shí)施例五:
如圖3所示,本實(shí)施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計(jì)算單元120及選擇單元130;
所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
所述計(jì)算單元120,用于計(jì)算所述特征的標(biāo)準(zhǔn)差;
所述確定單元130,還用于確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
所述計(jì)算單元120,還用于基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
所述選擇單元130,用于基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述確定單元110及選擇單元130的具體結(jié)構(gòu)可對(duì)應(yīng)于處理器或處理電路,所述處理器可包括應(yīng)用處理器、中央處理器、微處理器、數(shù)字信號(hào)處理器或可編程陣列等處理結(jié)構(gòu)。所述處理電路可包括專用集成電路。
所述確定單元110及選擇單元130可分別對(duì)應(yīng)于不同的處理器或處理電路,也可以集成對(duì)應(yīng)于相同的處理器或處理電路。當(dāng)確定單元110及選擇單元130集成對(duì)應(yīng)于相同的處理器或處理電路時(shí),所述處理器或處理電路可采用時(shí)分復(fù)用或并發(fā)線程等方式來(lái)分別實(shí)現(xiàn)上述確定單元110及選擇單元130的功能。
本實(shí)施例中所述計(jì)算單元120的具體結(jié)構(gòu)可對(duì)應(yīng)于計(jì)算器或具有計(jì)算功能的處理器等結(jié)構(gòu),將首先用于計(jì)算標(biāo)準(zhǔn)差,再利用標(biāo)準(zhǔn)差、波動(dòng)概率計(jì)算波動(dòng)值,利用波動(dòng)值和權(quán)值計(jì)算修正后的權(quán)值,最后基于修正后的權(quán)值及所述特征 的取值計(jì)算出所述預(yù)測(cè)值。
圖4所示,本實(shí)施例提供一種推送信息粗選裝置,包括處理器220、存儲(chǔ)介質(zhì)240、顯示屏250以及至少一個(gè)外部通信接口210;所述處理器220、存儲(chǔ)介質(zhì)240以及外部通信接210均通過(guò)總線230連接。所述處理器220可為微處理器、中央處理器、數(shù)字信號(hào)處理器或可編程邏輯陣列等具有處理功能的電子元器件。所述存儲(chǔ)介質(zhì)240上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令;所述處理器220執(zhí)行所述存儲(chǔ)介質(zhì)240中存儲(chǔ)的所述計(jì)算機(jī)可執(zhí)行指令可實(shí)現(xiàn)上述方法中的任意一個(gè);具體如,根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;計(jì)算所述特征的標(biāo)準(zhǔn)差;確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
在本實(shí)施例中所述標(biāo)準(zhǔn)差、波動(dòng)概率及預(yù)測(cè)值的相關(guān)描述可參見(jiàn)對(duì)應(yīng)的實(shí)施例,在此就不一一再詳細(xì)介紹了。例如,所述波動(dòng)概率可為隨機(jī)概率,例如,所述波動(dòng)概率等于高斯隨機(jī)概率值。
本實(shí)施例所述推送信息粗選裝置可為一臺(tái)或多臺(tái)進(jìn)行推送信息粗選的服務(wù)器的組成結(jié)構(gòu),該服務(wù)器可為位于廣告等推送信息平臺(tái)中的設(shè)備??傊?,本實(shí)施例中所述推送信息粗選裝置為前述推送信息粗選方法提供了實(shí)現(xiàn)硬件,同樣具有推送信息粗選精確度高的特點(diǎn)。
實(shí)施例六:
如圖3所示,本實(shí)施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計(jì)算單元120及選擇單元130;
所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
所述計(jì)算單元120,用于計(jì)算所述特征的標(biāo)準(zhǔn)差;
所述確定單元130,還用于確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
所述計(jì)算單元120,還用于基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述 預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
所述選擇單元130,用于基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述確定單元110,還用于確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述計(jì)算單元120,具體用于基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
在本實(shí)施例中所述確定單元110可對(duì)應(yīng)于人機(jī)交互接口,可利用所述人機(jī)交互接口接收工作人員輸入的所述波動(dòng)系數(shù)。當(dāng)然所述確定單元110也可對(duì)應(yīng)于處理器或處理電路,讀取預(yù)先存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)介質(zhì)中的所述波動(dòng)系數(shù),也可以對(duì)應(yīng)于通信接口,從而其他電子設(shè)備查詢或接收到所述波動(dòng)系數(shù)。
在本實(shí)施例中所述計(jì)算單元120具體將根據(jù)權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及波動(dòng)系數(shù)來(lái)計(jì)算所述預(yù)測(cè)值。這里的波動(dòng)系數(shù)、標(biāo)準(zhǔn)差及波動(dòng)概率都為計(jì)算波動(dòng)值的一個(gè)參數(shù)。具體的計(jì)算函數(shù)關(guān)系或方法可以參見(jiàn)實(shí)施例一至實(shí)施例四,在本實(shí)施例中就再重復(fù)了。
總之,在本實(shí)施例中通過(guò)波動(dòng)系數(shù)的引入,避免標(biāo)準(zhǔn)差過(guò)大時(shí)導(dǎo)致的預(yù)測(cè)值出現(xiàn)異常的現(xiàn)象,以提升計(jì)算的精確度。
實(shí)施例七:
如圖3所示,本實(shí)施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計(jì)算單元120及選擇單元130;
所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
所述計(jì)算單元120,用于計(jì)算所述特征的標(biāo)準(zhǔn)差;
所述確定單元130,還用于確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
所述計(jì)算單元120,還用于基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
所述選擇單元130,用于基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述確定單元110,還用于確定波動(dòng)系數(shù);其中,所述波動(dòng)系數(shù)用于限制所述波動(dòng)值的取值范圍;
所述計(jì)算單元120,具體用于基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述波動(dòng)系數(shù),計(jì)算所述預(yù)測(cè)值。
所述確定單元110,具體用于確定安全因子,其中,所述安全因子用于防止所述標(biāo)準(zhǔn)差異為特定值或未獲取到標(biāo)準(zhǔn)差時(shí)導(dǎo)致的波動(dòng)值求解異常;
所述計(jì)算單元120,具體用于基于所述權(quán)值、標(biāo)準(zhǔn)差、波動(dòng)概率及所述安全因子,計(jì)算所述預(yù)測(cè)值。
在本實(shí)施例中還引入了安全因子,這里的安全因子可為小于千分之一的常數(shù)等極小的取值。在本實(shí)施例中所述確定單元110對(duì)應(yīng)的硬件結(jié)構(gòu)可以參見(jiàn)前述實(shí)施例中確定所述波動(dòng)系數(shù)的硬件結(jié)構(gòu),但是不同的是本實(shí)施例中確定的安全因子。這里的標(biāo)準(zhǔn)差異常可包括標(biāo)準(zhǔn)差為預(yù)定的異常值,也可以未獲取到異常值,等滿足異常條件的標(biāo)準(zhǔn)差獲取情況。
當(dāng)然在本申請(qǐng)的各個(gè)實(shí)施例中所述安全因子,與所述波動(dòng)系數(shù)、標(biāo)準(zhǔn)差及波動(dòng)概率一樣是參與波動(dòng)值計(jì)算的因變量。
在本實(shí)施例中計(jì)算單元120將基于安全因子來(lái)計(jì)算波動(dòng)值,避免波動(dòng)值異常導(dǎo)致預(yù)測(cè)值的異常,減少計(jì)算過(guò)程中的異常情況的出現(xiàn)。
計(jì)算所述預(yù)測(cè)值的函數(shù)關(guān)系有多種,在本實(shí)施例中所述計(jì)算單元120用于利用如下公式計(jì)算所述預(yù)測(cè)值y;
其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動(dòng)系數(shù);所述β為所述安全因子;所述σi為所述特征的標(biāo)準(zhǔn)差。
當(dāng)然所述計(jì)算單元可以采用貝葉斯算法或邏輯回歸算法計(jì)算所述預(yù)測(cè)值, 不局限于上述公式。
總之,本實(shí)施例提供了一種具體如何計(jì)算所述預(yù)測(cè)值的裝置,在具有根據(jù)該預(yù)測(cè)值進(jìn)行推送信息粗選的精確度高的特點(diǎn)的同時(shí),還具有結(jié)構(gòu)簡(jiǎn)單、實(shí)現(xiàn)簡(jiǎn)便的特點(diǎn)。
實(shí)施例八:
如圖3所示,本實(shí)施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計(jì)算單元120及選擇單元130;
所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計(jì)算預(yù)測(cè)值的特征及所述特征對(duì)應(yīng)的權(quán)值;
所述計(jì)算單元120,用于計(jì)算所述特征的標(biāo)準(zhǔn)差;
所述確定單元130,還用于確定所述標(biāo)準(zhǔn)差的波動(dòng)概率;
所述計(jì)算單元120,還用于基于所述權(quán)值、標(biāo)準(zhǔn)差及波動(dòng)概率,計(jì)算所述預(yù)測(cè)值;其中,所述標(biāo)準(zhǔn)差和所述波動(dòng)概率用于計(jì)算得到修正所述權(quán)值的波動(dòng)值;
所述選擇單元130,用于基于所述預(yù)測(cè)值,選擇滿足預(yù)設(shè)條件的推送信息。
所述確定單元,110具體用于確定用于計(jì)算所述預(yù)測(cè)值的推送信息特征;確定用于計(jì)算所述預(yù)測(cè)值的用戶特征。
在本版實(shí)施例中所述確定單元110的硬件結(jié)構(gòu)與前述實(shí)施例提供的確定單元類似,值得注意的是在本實(shí)施例中所述確定單元110確定的用于計(jì)算預(yù)測(cè)值的特征包括推送信息特征和用戶特征。這里的推送信息特征可包括推送位及推送時(shí)間等各種推送信息,所述用戶特征可包括用戶各種形式的特征。
這樣的話,本實(shí)施例所述推送信息粗選裝置,在計(jì)算所述預(yù)測(cè)值不僅關(guān)注了推送信息特征和關(guān)注了用戶特征,沒(méi)有認(rèn)為的割裂用戶特征和推送信息特征,就避免了在進(jìn)行預(yù)測(cè)值計(jì)算時(shí),忽略了用戶特征對(duì)推送效果的影響,從而能夠再次提升推送信息粗選的精確度。
所述確定單元110對(duì)應(yīng)的可選結(jié)構(gòu)有多種,以下提供兩種可選結(jié)構(gòu):
可選結(jié)構(gòu)一:
所述確定單元110,具體用于確定各種用戶特征的可信度;基于所述可信度,選擇用于計(jì)算所述預(yù)測(cè)值的用戶特征。這個(gè)時(shí)候所述確定單元110也可對(duì)應(yīng)于處理器或處理電路,也可以對(duì)應(yīng)于比較器,例如通過(guò)比較器的比較選擇可信度大于可信度閾值的用戶特征作為計(jì)算預(yù)測(cè)值的用戶特征。
可選結(jié)構(gòu)二:
所述確定單元110,具體用于從各種用戶特征中選擇出一個(gè)或多個(gè)非加工用戶特征,作為用于計(jì)算所述預(yù)測(cè)值的用戶特征。在本實(shí)施例中所述確定單元110對(duì)應(yīng)的硬件結(jié)構(gòu)同樣可包括處理器或處理電路,通過(guò)將用戶特征非為非加工特征和加工特征,選擇出非加工特征的一個(gè)或多個(gè)作為計(jì)算預(yù)測(cè)值的用戶特征。
總之首先本實(shí)施例所述的推送信息粗選裝置,引入用戶特征計(jì)算所述預(yù)測(cè)值,基于這樣的預(yù)測(cè)值對(duì)推送信息的粗選結(jié)果具有精確度高的特點(diǎn);其次,通過(guò)用戶特征的篩選,可以避免因用戶特征引入計(jì)算導(dǎo)致的計(jì)算量大的問(wèn)題,再次,通過(guò)選擇可信度高的用戶特征或選擇非加工特征等能夠精確表征用戶特點(diǎn)的用戶特征參與計(jì)算,能夠再次提升所述粗選結(jié)果的精確度。
以下提供一個(gè)具體示例:
在本示例中的推送信息可為廣告,本示例基于上述實(shí)施例中記載的任意一個(gè)技術(shù)方案,提供一種廣告粗選方法。在本實(shí)施例中,
在本示例中,利用如下公式計(jì)算廣告的預(yù)測(cè)值y,這里的預(yù)測(cè)值可為該廣告被點(diǎn)擊的概率。
所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動(dòng)系數(shù);所述β為所述安全因子;所述σi為所述特征的標(biāo)準(zhǔn)差。所述rand_gaussian為服從高斯隨機(jī)分布確定的隨機(jī)概率。
α為波動(dòng)值的波動(dòng)系數(shù),當(dāng)α為0時(shí),波動(dòng)值則不起作用。
β是極小常數(shù),一般可以取到萬(wàn)分之一。
σi則是特征i取值為指定值的待處理數(shù)據(jù)的標(biāo)準(zhǔn)差;以下表為例進(jìn)行標(biāo)準(zhǔn)差求解說(shuō)明。在本示例中可能先根據(jù)歷史廣告數(shù)據(jù),確定出分類模型;再利用分類模型對(duì)數(shù)據(jù)庫(kù)中待投放廣告的廣告信息及待測(cè)用戶數(shù)據(jù)進(jìn)行處理,確定出用戶點(diǎn)擊該廣告的概率。這里的廣告信息及為待測(cè)用戶數(shù)據(jù)即為所述待處理數(shù)據(jù)。
在上述表中,中間5列稱作特征列,第1列為行序號(hào)列;第7列是分類標(biāo)簽列。前述i可為所述特征列的序號(hào)。在上表中1的特征列中“1”表示邏輯值為“是”,“0”表示邏輯值為“否”。例如,在第2列中,“1”表示是男性,“0”表示不是男性。
對(duì)第2列而言,是男性的記錄數(shù)有4條;且這4條記錄分別在行序號(hào)為1、4、5及6的特征行中,而這4行所對(duì)應(yīng)的分類標(biāo)簽分別是1、0、0、0,那么σi這里的計(jì)算就是計(jì)算(1,0,0,0)的標(biāo)準(zhǔn)差。當(dāng)然具體的求解標(biāo)準(zhǔn)差的方式不止這一種,這里盡是一個(gè)具體示例。
通過(guò)引入波動(dòng)值可以使得中小廣告的預(yù)測(cè)值產(chǎn)生一些波動(dòng),使得這些訂單能夠有參與競(jìng)爭(zhēng)的機(jī)會(huì),從而可以保障整個(gè)廣告系統(tǒng)的生態(tài)健康,而不至于產(chǎn)生極個(gè)別訂單占了絕大部分的曝光的現(xiàn)象。
于此同時(shí),還將利用上述公式在計(jì)算預(yù)測(cè)值時(shí),將粗選序中直接引入用戶特征,例如用戶的基礎(chǔ)信息如年齡、性別等用戶特征,和訂單信息,如廣告位、 訂單id作為特征。這里的訂單信息實(shí)質(zhì)上為前述實(shí)施例中提到的推送信息特征的組成部分。
圖5所示一種計(jì)算預(yù)測(cè)值的圖示,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。這里的訓(xùn)練數(shù)據(jù)即對(duì)應(yīng)著前述的歷史推送數(shù)據(jù)。在本實(shí)施例中都用01離散化各個(gè)用戶特征和廣告特征。例如,圖5中0100和1000兩個(gè)序列對(duì)應(yīng)了用戶的不同年齡或不同的年齡段。10和01對(duì)應(yīng)了不同的廣告。年齡*廣告表征了年齡對(duì)應(yīng)特征列與廣告對(duì)應(yīng)的特征列的笛卡爾乘積。圖5示中的x*x表示未示出的其他用戶特征或廣告特征。通常在進(jìn)行一個(gè)廣告的預(yù)測(cè)值計(jì)算時(shí),僅會(huì)出現(xiàn)一個(gè)廣告列,且用0和1分別表示對(duì)應(yīng)的用戶是否觀看該或點(diǎn)擊了廣告。
訓(xùn)練數(shù)據(jù)中的分類標(biāo)簽用于表征歷史廣告數(shù)據(jù)某一個(gè)用戶對(duì)該廣告是否執(zhí)行了點(diǎn)擊等轉(zhuǎn)化操作。例如,訓(xùn)練數(shù)據(jù)中包括用戶a點(diǎn)擊了廣告b的這一紀(jì)錄。那么在圖5中用戶a所在的訓(xùn)練數(shù)據(jù)行中,紀(jì)錄了用戶a的年齡,用戶a看的廣告,而對(duì)應(yīng)的用戶a所在的訓(xùn)練數(shù)據(jù)行中的分類標(biāo)簽將為“1”表征用戶a觀看了該廣告。
對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練得到了基于w和σ的訓(xùn)練模型。所述w表示權(quán)重,所述σ表示標(biāo)準(zhǔn)差。計(jì)算預(yù)測(cè)值y。圖中0.02表示一個(gè)示例中計(jì)算出的預(yù)測(cè)值y為0.02。在預(yù)測(cè)值對(duì)應(yīng)的數(shù)據(jù)行中的分類標(biāo)簽的取值表示的即為所述預(yù)測(cè)值,該預(yù)測(cè)值是基于對(duì)歷史廣告數(shù)據(jù)得到訓(xùn)練模型,確定推送該廣告被點(diǎn)擊的概率。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,如:多個(gè)單元或組件可以結(jié)合,或可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過(guò)一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機(jī)械的或其它形式的。
上述作為分離部件說(shuō)明的單元可以是、或也可以不是物理上分開(kāi)的,作 為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個(gè)地方,也可以分布到多個(gè)網(wǎng)絡(luò)單元上;可以根據(jù)實(shí)際的需要選擇其中的部分或全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各實(shí)施例中的各功能單元可以全部集成在一個(gè)處理模塊中,也可以是各單元分別單獨(dú)作為一個(gè)單元,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中;上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。