聯(lián)合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經(jīng)可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯(lián)合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經(jīng)驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優(yōu)勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環(huán)境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優(yōu)于DDPG算法。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 午夜小视频男女在线观看 | 国产99视频在线观看 | 青青青国产免费线在 | 国产乡下三片 | 欧美日本免费一区二区三区 | 欧美劲爆第一页 | 一本到在线视频 | a免费毛片在线播放 | 亚洲欧美影视 | 好男人www社区影视在线 | 激情影院成人区免费观看视频 | 亚洲视频免费播放 | 日韩成人国产精品视频 | 亚洲一区三区 | 青春草视频在线免费观看 | 日韩精品成人a在线观看 | 成年人精品视频 | 男女真实有遮挡xx00动态图 | 中国一级毛片 | 国产草莓视频入口免费网站 | 小明永久免费视频 | 国产成人精品午夜免费 | 视频一区二区不卡 | 成人网18入口 | 日韩在线小视频 | 天天看天天干天天操 | 天天玩天天操 | 欧美一级高清免费播放 | 日日碰狠狠添天天爽爽爽 | 久久国产免费 | 欧美高清视频手机在在线 | 最新亚洲人成网站在线影院 | 国产免费看网站v片不遮挡 国产免费黄视频 | 精品一区亚洲 | 在线观看你懂得 | 日韩影院在线 | 国产成人a在一区线观看高清 | 欧美高清另类video | 欧美×x| 黄色私人影院 | 成人在线短视频 |