您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

如何将强化学习应用于连续动作空间?

如何将强化学习应用于连续动作空间?

处理这个问题的常用方法批评行为者的方法。这些自然扩展到连续的动作空间。基本Q学习在使用近似法时可能会有所不同,但是,如果仍然要使用它,可以尝试将其与自组织图结合起来,如“自组织图在强化学习中的应用”中所做的那样。本文还包含一些可能会有用的其他参考。

其他 2022/1/1 18:17:32 有451人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶