習模型的多個規(guī)則?;跈C器學習模型的規(guī)則的實例可以包含成果、一個或多個特征和成 果概率。作為經(jīng)由機器學習模型做出的預測的示例,可以向機器學習模型提供針對給定事 件的多個特征,并且基于特征的存在機器學習模型可以輸出概率或預測。作為更具體的示 例,預測用戶是否將查看視頻Y(成果)的機器學習模型可以被提供有該用戶位于美國、過 去查看過音樂視頻X并且已經(jīng)將其默認語言設置為英語(特征)的數(shù)據(jù)。機器學習模型可 以規(guī)定針對每個特征的權(quán)重,例如,.5作為位于美國,.9作為查看過音樂視頻X,以及.3作 為將默認語言設置為英語。因此,機器學習的模型可以基于與規(guī)則相關聯(lián)的特征預測用戶 將查看音樂視頻Y的權(quán)重為1. 7。概率值可以被歸一化以通過任何適用的方式表示百分比 或概率。本文中的實例可以包含成果:"用戶是否將查看視頻Y",特征:"位于美國"、"查看 視頻X"和"默認語言英語",以及預測9"(歸一化)。應當理解,成果、特征和/或概率 可以通過任何適用的方式來表示,諸如哈希值、整數(shù)表示、布爾分類、歸一化(例如,轉(zhuǎn)換成 歸一化概率的概率值、轉(zhuǎn)換率、百分比等)。作為一個示例,針對"選擇視頻X"的成果可以 由哈希值" e0dl23e5f 316 "表示。
[0043] 在步驟220,基于機器學習模型的規(guī)則的實例可以被轉(zhuǎn)換成基于可搜索特征的索 引中的條目?;诳伤阉魈卣鞯乃饕械臈l目可以包含與一個或多個令牌相關聯(lián)的成果和 成果概率。令牌可以基于規(guī)則中包含的特征。繼續(xù)先前的示例,模型可以基于各特征預測 成果"用戶將查看視頻Y"的概率為〇. 9?;诹钆频乃饕梢园ㄅc成果"用戶將查看視 頻Y"相關的令牌位置:美國,查看的視頻:X和"語言:英語"以及概率〇. 9?;诹钆频乃?引可以使相同令牌與其他成果相關,每個成果具有其自己的概率。例如,相同令牌可以與具 有概率0. 8的成果"用戶將查看視頻Z"相關。
[0044] 基于可搜索令牌的索引可以是反向索引或者倒排列表,使得其作為被配置為存儲 從內(nèi)容(例如,詞語、數(shù)目、值等)到數(shù)據(jù)庫文件中位置、文檔或文檔集的映射的索引數(shù)據(jù)結(jié) 構(gòu)。基于可搜索令牌的索引可以允許快速全文本搜索并且可以是數(shù)據(jù)庫文件本身而不是其 索引。
[0045] 在步驟230,在圖2b中,查詢可以被檢索。查詢可以基于由人類用戶、計算機、數(shù)據(jù) 庫、軟件、應用、服務器等導致的事件而生成。如這里所使用的,項(term)查詢可以包括可 以用于搜索索引以基于一個或多個事件的出現(xiàn)獲得一個或多個成果的概率的任何輸入。例 如,當用戶選擇給定視頻時,選擇的特性(例如,視頻的標識、視頻的題目、用戶的位置等) 可以被用作用于針對用戶將搜索其他視頻以接下來觀看的成果及其相應概率來搜索索引 的查詢的基礎。查詢的結(jié)果例如可以預測用戶將選擇視頻B的概率為0. 2、視頻C的概率為 0. 1以及視頻D的概率0. 4。
[0046] 在一個實現(xiàn)方式中,查詢可以基于令牌的子集公式化,該令牌的子集可以在步驟 240例如基于事件來標識。例如,針對"車"的關鍵字搜索已經(jīng)由加拿大的用戶在5:07PM ET 提交,其中用戶瀏覽器的語言設置被設置成"法語"??梢员粯俗R的令牌的子集可以包括關 鍵字:車、位置:加拿大、時間:5:07PM ET和語言:法語。在步驟250,這些令牌可以被用于 針對與索引中相同或相似令牌相關的成果以及概率來搜索索引。例如,與查詢相關聯(lián)的令 牌可以是:
[0047]
[0048] 這些令牌例如可以對應于索引中的以下條目,其可以使用標準索引搜索技術來高 效地檢索:
[0050] -個或多個成果(以上視頻)可以例如基于其相應的成果概率從以上結(jié)果中選 擇。如上所示,成果視頻F具有被選擇用于接下來查看的最高概率。因此,視頻F的鏈接可 以被提供給用戶。類似地,接下來最高排名的(最高可能)視頻(視頻R和視頻A)也可以 被呈現(xiàn)。
[0051] 本公開主題的各實現(xiàn)方式可以在各組件和網(wǎng)絡架構(gòu)中實現(xiàn)并與其一起使用。圖3 是適于實現(xiàn)本公開主題的各實施方式的示例計算機系統(tǒng)20。計算機20包括總線21,該總 線21將計算機20的主要組件互連,諸如一個或多個處理器24、存儲器27 (諸如RAM、R0M、 閃速RAM等)、輸入/輸出控制器28和固定存儲裝置23 (諸如硬盤、閃速存儲裝置、SAN設 備等)。應當理解,可以包括或可以不包括其他組件,諸如用戶顯示器(諸如經(jīng)由顯示器適 配器的顯示器屏幕)、用戶輸入接口諸如控制器和相關聯(lián)的用戶輸入設備諸如鍵盤、鼠標、 觸摸屏等,以及本領域已知用于通用計算設備或與其結(jié)合的其他組件。
[0052] 總線21允許中央處理器24與存儲器27之間的數(shù)據(jù)通信。RAM通常是其中加載了 操作系統(tǒng)和應用程序的主存儲器。ROM或閃速存儲器可以包含其他代碼,控制基本硬件操作 (諸如與外圍組件的交互)的基本輸入-輸出系統(tǒng)(BIOS)。通過計算機20駐留的應用通 常存儲在計算機可讀介質(zhì)上并經(jīng)由其進行訪問,諸如固定存儲裝置23和/或存儲器27、光 驅(qū)動、外部存儲機構(gòu)等。
[0053] 所示的每個組件可以與計算機20集成或者可以是分離的并且通過其他接口訪 問。其他接口(諸如網(wǎng)絡接口 29)可以經(jīng)由電話鏈路、有線或無線局域網(wǎng)或廣域網(wǎng)連接、專 有網(wǎng)絡連接等與遠程系統(tǒng)和設備的連接。例如,如圖4所示,網(wǎng)絡接口 29可以允許計算機 經(jīng)由一個或多個局域網(wǎng)或廣域網(wǎng)或其他網(wǎng)絡與其他計算機通信。
[0054] 許多其他設備或組件(未示出)可以通過相似方式連接,諸如文檔掃描儀、數(shù)碼相 機、輔助、補充或后備系統(tǒng)等。相反地,不需要呈現(xiàn)圖3中所示的所有組件以實踐本公開。 組件可以通過與所示不同的方式互連。諸如圖3中所示的計算機的操作是本領域已知的并 且在此說明書中不進行詳細描述。用于實現(xiàn)本公開的代碼可以存儲在計算機可讀存儲介質(zhì) 中,諸如存儲器27、固定存儲裝置23、遠程存儲位置或本領域已知的任何其他存儲機構(gòu)中 的一個或多個。
[0055] 圖4示出了根據(jù)本公開主題的一個實施方式的示例布置。一個或多個客戶端10、 11 (諸如本地計算機、智能電話、平板計算設備、遠程服務等)可以經(jīng)由一個或多個網(wǎng)絡7 連接至其他設備。該網(wǎng)絡可以是局域網(wǎng)、廣域網(wǎng)、因特網(wǎng)或一個或多個任何其他適當?shù)耐ㄐ?網(wǎng)絡,并且可以在包括有線和/或無線網(wǎng)絡的任何適當平臺上實現(xiàn)。客戶端1〇、11可以與 一個或多個計算機系統(tǒng)通信,諸如處理單元14、數(shù)據(jù)庫15和用戶接口系統(tǒng)13。在某些情況 下,客戶端10、11可以與用戶接口系統(tǒng)13通信,該用戶接口系統(tǒng)13可以提供對一個或多個 其他系統(tǒng)(諸如數(shù)據(jù)庫15、處理單元14等)的訪問。例如,用戶接口 13可以是提供來自 一個或多個其他計算機系統(tǒng)的數(shù)據(jù)的用戶可訪問網(wǎng)頁。用戶接口 13可以向不同客戶端提 供不同的接口,諸如人類可讀網(wǎng)頁被提供給web瀏覽器客戶端10,并且計算機可讀API或 其他接口被提供給遠程服務客戶端11。用戶接口 13、數(shù)據(jù)庫15和處理單元14可以是集成 系統(tǒng)的一部分,或者可以包括經(jīng)由專有網(wǎng)絡、因特網(wǎng)或任意其他適當網(wǎng)絡通信的多個計算 機系統(tǒng)。處理單元14例如可以是分布式系統(tǒng)(諸如,基于云的計算系統(tǒng)、