技術編號:6588274
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及一種基于免疫耐受機制的強化學習算法。背景技術強化學習是一類介于監(jiān)督學習和非監(jiān)督學習之間的機器學習算法,源于行為心理學,從80年代發(fā)展起來,目前被廣泛地應用于游戲比賽、控制系統(tǒng)、調度管理、機器人領域中,是機器學習研究領域的熱點。強化學習可以在未知模型的條件下,根據(jù)確定性或非確定性回報對環(huán)境進行學習。比較典型的強化學習算法有=Sarsa學習算法、Q學習算法、TD(A)學習算法。其中,TD(A)學習算法包括表格型TD ( λ )和基于值函數(shù)逼近的TD ...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。