技術編號:11627851
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明屬于機器學習技術領域,特別是一種結合馬爾科夫決策過程的動作知識提取方法。背景技術在機器學習中,許多模型如支持向量機、隨機森林、深層神經網絡已經被提出并取得了很大的成功,但是在許多實際應用中,這些模型的可實施性比較差。強化學習是一類特殊的機器學習,通過與所在環(huán)境的自主交互來學習決策策略,使得策略收到的長期累積獎賞最大;強化學習與其他機器學習方法的區(qū)別在于:不用預先給出訓練數據,而是要通過與環(huán)境的交互來產生;在管理科學領域,知識提取問題是采用統(tǒng)計學的方法來分析用戶的行為并找出特定的規(guī)則;在機器...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。