針對在線系統(tǒng)中的用戶動(dòng)作的定制化預(yù)測器的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及預(yù)測例如社交網(wǎng)絡(luò)系統(tǒng)的在線系統(tǒng)中的用戶動(dòng)作,并且具體地涉及針 對在線系統(tǒng)中的用戶動(dòng)作的定制化預(yù)測器的生成,特別地旨在加快在線系統(tǒng)內(nèi)的潛在用戶 交互。
【背景技術(shù)】
[0002] 在線系統(tǒng)通常向用戶呈現(xiàn)有用的信息并且允許用戶與在線系統(tǒng)交互。在線系統(tǒng)可 使用技術(shù)以在向用戶呈現(xiàn)信息之前確定用戶可能感光趣的信息。如果給他們呈現(xiàn)他們喜歡 的信息,則用戶更可能定期地訪問在線系統(tǒng)。在線系統(tǒng)經(jīng)常從廣告賺取收益。廣告商更喜 歡在由他們的用戶定期訪問的在線系統(tǒng)中做廣告。因此,用戶忠實(shí)度可確定使用在線系統(tǒng) 生成的收益。因此,在線系統(tǒng)向用戶呈現(xiàn)感興趣信息的能力通常影響通過在線系統(tǒng)賺取的 收益。
[0003] -些系統(tǒng)使用機(jī)器學(xué)習(xí)技術(shù)確定與單個(gè)用戶相關(guān)的信息以預(yù)測用戶動(dòng)作。例如, 如果機(jī)器學(xué)習(xí)模型預(yù)測用戶可能觀看某些內(nèi)容,則在線系統(tǒng)可選擇向用戶呈現(xiàn)該內(nèi)容而不 是其他內(nèi)容。另一方面,如果機(jī)器學(xué)習(xí)模型預(yù)測用戶可能對某些信息不感興趣,則在線系統(tǒng) 可選擇向用戶呈現(xiàn)的一些其他信息。
[0004] 然而,開發(fā)機(jī)器學(xué)習(xí)模型需要在線系統(tǒng)的開發(fā)人員的大量努力。通常,機(jī)器學(xué)習(xí)模 型的開發(fā)人員指定使用的機(jī)器學(xué)習(xí)技術(shù)、與機(jī)器學(xué)習(xí)模型相關(guān)的各種特征,并且提供用于 訓(xùn)練機(jī)器學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)。在復(fù)雜的在線系統(tǒng)中,開發(fā)人員可能不知道各種特征對預(yù) 測器模型的影響。通常,開發(fā)人員甚至可能不知道能夠在模型中使用的復(fù)雜系統(tǒng)中可獲得 的所有可能特征。此外,各種特征對模型的影響可隨著時(shí)間而改變。在技術(shù)方面的新開發(fā) 可能以不可預(yù)測的方式影響各種特征對模型的影響。例如,雖然未結(jié)合在線系統(tǒng)開發(fā)新技 術(shù),但是如果新類型的移動(dòng)技術(shù)是可獲得的,則系統(tǒng)的用戶可以表現(xiàn)得不同。在用戶行為方 面的變化能夠改變各種特征對模型的影響。當(dāng)考慮到他們自己在線系統(tǒng)的所有可能方面以 及能夠影響模型的外部因素時(shí),這對于機(jī)器學(xué)習(xí)模型的開發(fā)人員開發(fā)并且維持模型是困難 的。因此,傳統(tǒng)技術(shù)給機(jī)器學(xué)習(xí)模型的開發(fā)人員施加沉重負(fù)擔(dān)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的實(shí)施方式允許在線系統(tǒng)生成用于預(yù)測在線系統(tǒng)的用戶動(dòng)作的模型。例 如,諸如社交網(wǎng)絡(luò)系統(tǒng)的在線系統(tǒng)可使用模型預(yù)測用戶是否可能建立與另一用戶的聯(lián)系、 用戶是否可能評論圖像、或用戶是否可能加入社交群。這些模型在本文中也被稱為預(yù)測器。 社交網(wǎng)絡(luò)系統(tǒng)使用預(yù)測器選擇向社交網(wǎng)絡(luò)系統(tǒng)的用戶呈現(xiàn)的信息,例如,提出與用戶的潛 在聯(lián)系、選擇向用戶呈現(xiàn)的內(nèi)容、或向用戶推薦社交群。
[0006] 在實(shí)施方式中,在線系統(tǒng)接收請求以生成用于預(yù)測用戶是否可能采取特定動(dòng)作類 型的動(dòng)作的新預(yù)測器。例如,動(dòng)作類型可對應(yīng)于用戶喜歡圖像、用戶發(fā)送請求與另一用戶聯(lián) 系、或用戶加入社交群。請求指定動(dòng)作類型和用于識(shí)別動(dòng)作類型的成功或失敗的標(biāo)準(zhǔn)。例 如,如果動(dòng)作類型對應(yīng)于用戶發(fā)送請求以與另一用戶聯(lián)系,則動(dòng)作的成功實(shí)例(successful instance,成功情形)對應(yīng)于用戶發(fā)送請求以與由在線系統(tǒng)提出的潛在朋友聯(lián)系,并且失 敗實(shí)例對應(yīng)于用戶不能聯(lián)系到潛在朋友或試圖隱藏朋友建議。在線系統(tǒng)從用戶在一段時(shí) 間中與在線系統(tǒng)的交互中收集包括動(dòng)作類型的成功和失敗實(shí)例的數(shù)據(jù)。在線系統(tǒng)使用生 成的數(shù)據(jù)生成不同類型的一個(gè)或多個(gè)預(yù)測器。例如,一個(gè)預(yù)測器可使用線性回歸(linear regression),另一預(yù)測器可以使用邏輯回歸(logistic regression),并且第三預(yù)測器可 以使用提升樹(boosting tree)或權(quán)重決策樹。在線系統(tǒng)評估并且比較生成的不同預(yù)測器 的性能并且基于性能選擇預(yù)測器。在線系統(tǒng)將用于訪問生成的預(yù)測器的句柄(handle)返 回至預(yù)測器的請求者。因此,請求方接收針對動(dòng)作的定制化預(yù)測器而不用了解關(guān)于機(jī)器學(xué) 習(xí)的任何事情。
[0007] 在實(shí)施方式中,在線系統(tǒng)基于通過在線系統(tǒng)收集的新數(shù)據(jù)再生成新預(yù)測器以替換 現(xiàn)有預(yù)測器。新預(yù)測器能夠可以是使用完全不同的機(jī)器學(xué)習(xí)技術(shù)的新模型、或使用相同機(jī) 器學(xué)習(xí)技術(shù)但是具有在模型內(nèi)使用的新系數(shù)值的模型??梢灶A(yù)定速率定期地生成新預(yù)測 器。可自適應(yīng)地修改生成新預(yù)測器的速率。例如,如果在新預(yù)測器中觀察的性能相比于針 對動(dòng)作類型的現(xiàn)有預(yù)測器的改善低于閾值,則可降低針對該具體動(dòng)作類型的預(yù)測器的再生 成速率。
[0008] 在本
【發(fā)明內(nèi)容】
部分和以下詳細(xì)說明中所述的特征和優(yōu)勢不是全部包含的。鑒于附 圖、說明書、和權(quán)利要求,很多其他特征和優(yōu)點(diǎn)對于本領(lǐng)域普通技術(shù)人員將是顯而易見的。
[0009] 涉及方法、存儲(chǔ)介質(zhì)和系統(tǒng)的所附權(quán)利要求中具體地公開了根據(jù)本發(fā)明的實(shí)施方 式,其中,在一個(gè)權(quán)利要求類型(例如,方法)中提及的任何特征也能夠在另一權(quán)利要求類 型(例如,系統(tǒng))中要求保護(hù)。
[0010] 在實(shí)施方式中,根據(jù)本發(fā)明,提供了特別旨在加快在線系統(tǒng)內(nèi)的潛在用戶交互的 計(jì)算機(jī)實(shí)施的方法,包括:
[0011] 通過在線系統(tǒng)接收用于生成預(yù)測器的多個(gè)請求,每個(gè)請求指定通過在線系統(tǒng)的用 戶執(zhí)行的動(dòng)作類型和用于識(shí)別動(dòng)作類型的成功實(shí)例的標(biāo)準(zhǔn);
[0012] 為與動(dòng)作類型相關(guān)聯(lián)的每個(gè)請求,通過在線系統(tǒng)生成用于該動(dòng)作類型的預(yù)測器, 該生成包括:
[0013] 識(shí)別包括通過在線系統(tǒng)用戶執(zhí)行的動(dòng)作類型的多個(gè)成功實(shí)例和多個(gè)失敗實(shí)例的 訓(xùn)練數(shù)據(jù)組;
[0014] 使用識(shí)別的數(shù)據(jù)組訓(xùn)練一個(gè)或多個(gè)候選預(yù)測器,其中,每個(gè)候選預(yù)測器包括機(jī)器 學(xué)習(xí)模型;
[0015] 通過對包括由在線系統(tǒng)的用戶執(zhí)行的動(dòng)作類型的多個(gè)成功實(shí)例和多個(gè)失敗實(shí)例 的測試數(shù)據(jù)組執(zhí)行每個(gè)預(yù)測器來評估每個(gè)候選預(yù)測器的性能;以及
[0016] 通過比較一個(gè)或多個(gè)候選預(yù)測器的性能選擇用于動(dòng)作類型的預(yù)測器;以及
[0017] 將與生成的預(yù)測器對應(yīng)的句柄返回至所選擇的預(yù)測器的請求者。
[0018] 計(jì)算機(jī)實(shí)施的方法可進(jìn)一步包括:
[0019] 接收來自在線系統(tǒng)中運(yùn)行的處理的針對預(yù)測器的請求,請求指定用戶信息的實(shí)例 和句柄;
[0020] 對用戶信息的實(shí)例執(zhí)行與指定的句柄對應(yīng)的預(yù)測器;以及
[0021] 將預(yù)測器的結(jié)果返回至請求處理。
[0022] 優(yōu)選地,動(dòng)作類型的成功實(shí)例對應(yīng)于存儲(chǔ)在線系統(tǒng)中的指示響應(yīng)于給用戶呈現(xiàn)允 許用戶采取該動(dòng)作類型的動(dòng)作的用戶界面用戶采取該類型的動(dòng)作的信息。
[0023] 具體地,請求進(jìn)一步指定針對失敗實(shí)例的標(biāo)準(zhǔn),其中,動(dòng)作類型的失敗實(shí)例對應(yīng)于 存儲(chǔ)在線系統(tǒng)中的指示響應(yīng)于給用戶呈現(xiàn)允許用戶采取該動(dòng)作類型的動(dòng)作的信息用戶未 采取該類型的動(dòng)作的信息。
[0024] 動(dòng)作類型的失敗實(shí)例可對應(yīng)于存儲(chǔ)在線系統(tǒng)中的指示用戶提供表示不喜歡在與 動(dòng)作類型關(guān)聯(lián)的用戶界面中呈現(xiàn)的信息的輸入的信息。
[0025] 優(yōu)選地,每種類型的動(dòng)作瞄準(zhǔn)在線系統(tǒng)中表示的實(shí)體。
[0026] 具體地,對應(yīng)于動(dòng)作類型的實(shí)體是在線系統(tǒng)的用戶、社交群、或圖像之一。
[0027]候選預(yù)測器能夠是基于線性回歸(linear regression)、邏輯回歸(logistic regression)、提升樹(boosting tree)、權(quán)重決策樹之一的機(jī)器學(xué)習(xí)模型的類型。
[0028] 計(jì)算機(jī)實(shí)施的方法進(jìn)一步可包括為動(dòng)作類型的每個(gè)生成的預(yù)測器:
[0029] 將生成的預(yù)測器的性能與該類型動(dòng)作的現(xiàn)有預(yù)測器的性能比較;以及
[0030] 響應(yīng)于生成的預(yù)測器的性能超過現(xiàn)有預(yù)測器的性能,利用生成的預(yù)測器替換現(xiàn)有 預(yù)測器。
[0031] 計(jì)算機(jī)實(shí)施的方法可進(jìn)一步包括,為每個(gè)動(dòng)作類型,定期地生成新預(yù)測器:
[0032] 將新預(yù)測器的性能與之前生成的預(yù)測器的性能進(jìn)行比較;以及
[0033] 響應(yīng)于新預(yù)測器的性能超過之前生成的預(yù)測器的性能,利用新預(yù)測器替換之前生 成的預(yù)測器。
[0034] 優(yōu)選地,基于新預(yù)測器的性能與之前生成的預(yù)測器的性能的比較確定定期生成用 于每種動(dòng)作類型的新預(yù)測器的速率。
[0035] 具體地,響應(yīng)于新預(yù)測器的性能相比現(xiàn)有預(yù)測器的性能的改善低于閾值降低定期 為每種動(dòng)作類型生成新預(yù)測器的速率。
[0036] 在也能夠要求保護(hù)的又一實(shí)施方式中,提供了計(jì)算機(jī)實(shí)施的方法,包括:
[0037] 通過在線系統(tǒng)存儲(chǔ)多個(gè)預(yù)測器,每個(gè)預(yù)測器用于預(yù)測在線系統(tǒng)的用戶是否執(zhí)行某 種類型的動(dòng)作,每個(gè)預(yù)測器與用于確定該類型動(dòng)作的成功實(shí)例的標(biāo)準(zhǔn)相關(guān)聯(lián);
[