搜索引擎、內(nèi)容遞 送系統(tǒng)等)的一部分,該分布式系統(tǒng)還可以包括數(shù)據(jù)庫15和/或用戶接口 13或者與之通 信。在某些實(shí)現(xiàn)方式中,分析系統(tǒng)5可以提供后端處理,諸如存儲的或獲取的數(shù)據(jù)在被遞送 到處理單元14、數(shù)據(jù)庫15和/或用戶接口 13之前由分析系統(tǒng)5進(jìn)行預(yù)處理。例如,機(jī)器學(xué) 習(xí)系統(tǒng)5可以向一個或多個其他系統(tǒng)13、14、15提供各種預(yù)測模型、數(shù)據(jù)分析等。
[0056] 在本公開主題的實(shí)現(xiàn)方式收集關(guān)于用戶的個人信息或者可以利用個人信息的情 況下,用戶可以提供有控制程序或特征是否收集用戶信息(例如,用戶的表現(xiàn)評分、用戶的 工作成果、用戶提供的輸入、用戶的地理位置和與用戶相關(guān)聯(lián)的任何其他相似的數(shù)據(jù))或 者控制是否和/或如何從可能更與用戶相關(guān)的教學(xué)課程提供者接收教學(xué)課程內(nèi)容的機(jī)會。 另外,某些數(shù)據(jù)可以在其被存儲或使用之前通過一個或多個方式進(jìn)行處理,使得個人可標(biāo) 識信息被移除。例如,用戶的標(biāo)識可以被處理使得不能夠針對用戶確定個人可標(biāo)識信息,或 者與教學(xué)課程相關(guān)聯(lián)的用戶的地理位置可能在獲得位置信息的地方被泛化(諸如到城市、 ZIP編碼或國家層次),使得用戶的特定位置無法被確定。因此,用戶可以控制信息如何關(guān) 于用戶進(jìn)行收集并且由教學(xué)課程提供者使用。
[0057] 上文描述出于解釋的目的已經(jīng)針對特定實(shí)現(xiàn)方式被描述。然而,上文所示論述不 旨在窮盡或限制本公開主題的實(shí)現(xiàn)方式到所述的具體形式。鑒于上文的教導(dǎo),許多修改和 變化也是可能的。為了解釋本公開主題實(shí)現(xiàn)方式的原理及其實(shí)踐應(yīng)用,選擇并描述了各種 實(shí)現(xiàn)方式,由此使得本領(lǐng)域的其他人員能夠利用那些實(shí)現(xiàn)方式以及可以適于特定用戶預(yù)期 的具有各種修改的各種實(shí)現(xiàn)方式。
【主權(quán)項(xiàng)】
1. 一種由計(jì)算機(jī)化的機(jī)器學(xué)習(xí)系統(tǒng)實(shí)現(xiàn)的方法,所述方法包括: 從由所述計(jì)算機(jī)化的機(jī)器學(xué)習(xí)系統(tǒng)生成的機(jī)器學(xué)習(xí)的模型接收多個規(guī)則,每個規(guī)則包 括成果、一個或多個特征以及由所述機(jī)器學(xué)習(xí)的模型針對所述一個或多個特征和所述成果 預(yù)測的成果概率;以及 針對所述多個規(guī)則中的每個規(guī)則,生成針對基于令牌的索引的條目,所述條目包括: 基于所述規(guī)則的所述一個或多個特征的一個或多個令牌; 所述規(guī)則的所述成果;以及 所述規(guī)則的所述成果概率。2. 根據(jù)權(quán)利要求1所述的方法,其中所述規(guī)則基于文檔的未索引的語料庫。3. 根據(jù)權(quán)利要求1所述的方法,其中所述條目與文檔相關(guān)聯(lián)。4. 根據(jù)權(quán)利要求1所述的方法,其中多個所述一個或多個令牌基于查詢。5. 根據(jù)權(quán)利要求1所述的方法,其中所述機(jī)器學(xué)習(xí)的模型使用由一個或多個用戶對成 果的先前選擇被訓(xùn)練。6. 根據(jù)權(quán)利要求1所述的方法,其中所述基于令牌的索引是從由反向索引和倒排列表 組成的組中選擇的一個。7. -種由計(jì)算機(jī)化的機(jī)器學(xué)習(xí)系統(tǒng)實(shí)現(xiàn)的方法,所述方法包括: 接收查詢; 基于所述查詢標(biāo)識至少一個令牌; 將至少一個標(biāo)識的所述令牌匹配到機(jī)器學(xué)習(xí)的基于令牌的索引中的至少一個索引的 令牌; 基于至少一個匹配的所述令牌標(biāo)識至少一個成果;以及 基于至少一個匹配的所述令牌和所述至少一個成果提供針對所述查詢的結(jié)果。8. 根據(jù)權(quán)利要求7所述的方法,其中所述提供針對所述查詢的所述結(jié)果進(jìn)一步基于成 果概率。9. 根據(jù)權(quán)利要求7所述的方法,其中所述查詢基于關(guān)鍵字。10. 根據(jù)權(quán)利要求7所述的方法,其中所述查詢基于文檔的點(diǎn)入。11. 根據(jù)權(quán)利要求7所述的方法,其中所述查詢基于事件。12. 根據(jù)權(quán)利要求7所述的方法,其中所述提供針對所述查詢的結(jié)果基于多個成果,每 個成果與成果概率相關(guān)聯(lián),并且進(jìn)一步包括基于所述多個成果的相應(yīng)成果概率對所述多個 成果進(jìn)行排名。13. -種由計(jì)算機(jī)化的系統(tǒng)實(shí)現(xiàn)的方法,所述方法包括: 從由所述計(jì)算機(jī)化的機(jī)器學(xué)習(xí)系統(tǒng)生成的機(jī)器學(xué)習(xí)的模型接收多個規(guī)則,每個規(guī)則包 括成果、一個或多個特征以及由所述機(jī)器學(xué)習(xí)的模型針對所述一個或多個特征和所述成果 預(yù)測的成果概率;以及 針對所述多個規(guī)則中的每個規(guī)則,生成針對基于令牌的索引的條目,所述條目包括: 基于所述規(guī)則的所述一個或多個特征的一個或多個令牌; 所述規(guī)則的所述成果;以及 所述規(guī)則的所述成果概率; 接收查詢; 基于所述查詢標(biāo)識至少一個令牌; 將至少一個標(biāo)識的所述令牌匹配到機(jī)器學(xué)習(xí)的基于令牌的索引中的至少一個索引的 令牌; 基于至少一個匹配的所述令牌標(biāo)識至少一個成果;以及 基于至少一個匹配的所述令牌和所述至少一個成果提供針對所述查詢的結(jié)果。14. 一種系統(tǒng),包括: 處理器,所述處理器被配置為: 從由所述計(jì)算機(jī)化的機(jī)器學(xué)習(xí)系統(tǒng)生成的機(jī)器學(xué)習(xí)的模型接收多個規(guī)則,每個規(guī)則包 括成果、一個或多個特征以及由所述機(jī)器學(xué)習(xí)的模型針對所述一個或多個特征和所述成果 預(yù)測的成果概率;以及 針對所述多個規(guī)則中的每個規(guī)則,生成針對基于令牌的索引的條目,所述條目包括: 基于所述規(guī)則的所述一個或多個特征的一個或多個令牌; 所述規(guī)則的所述成果;以及 所述規(guī)則的所述成果概率。15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述規(guī)則基于文檔的未索引的語料庫。16. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述條目與文檔相關(guān)聯(lián)。17. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中多個所述一個或多個令牌基于查詢。18. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述機(jī)器學(xué)習(xí)的模型使用由一個或多個用戶對 成果的先前選擇被訓(xùn)練。19. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述基于令牌的索引是從由反向索引和倒排列 表組成的組中選擇的一個。20. -種系統(tǒng),包括: 處理器,所述處理器被配置為: 接收查詢; 基于所述查詢標(biāo)識至少一個令牌; 將至少一個標(biāo)識的所述令牌匹配到機(jī)器學(xué)習(xí)的基于令牌的索引中的至少一個索引的 令牌; 基于至少一個匹配的所述令牌標(biāo)識至少一個成果;以及 基于至少一個匹配的所述令牌和所述至少一個成果提供針對所述查詢的結(jié)果。21. 根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述提供針對所述查詢的所述結(jié)果進(jìn)一步基于 成果概率。22. 根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述查詢基于關(guān)鍵字。23. 根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述查詢基于文檔的點(diǎn)入。24. 根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述查詢基于事件。25. 根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述提供針對所述查詢的結(jié)果基于多個成果, 每個成果與成果概率相關(guān)聯(lián),并且進(jìn)一步包括基于所述多個成果的相應(yīng)成果概率對所述多 個成果進(jìn)行排名。
【專利摘要】公開了用于基于由一個或多個機(jī)器學(xué)習(xí)的模型生成的規(guī)則生成針對可搜索索引的條目的系統(tǒng)和技術(shù)。索引條目可以包括與成果相關(guān)的一個或多個令牌和成果概率。令牌的子集可以基于事件的特性進(jìn)行標(biāo)識。索引可以基于事件針對對應(yīng)于與令牌的子集相似或匹配的令牌的成果及其相應(yīng)概率而被搜索。<pb pnum="1" />
【IPC分類】G06F17/30
【公開號】CN105045799
【申請?zhí)枴緾N201510221966
【發(fā)明人】J·哈姆森, T·D·錢德拉, M·方圖拉
【申請人】谷歌公司
【公開日】2015年11月11日
【申請日】2015年5月4日
【公告號】EP2940606A1, US20150317357