当前位置:新励学网 > 秒知问答 > ppo算法与ddpg算法区别

ppo算法与ddpg算法区别

发表时间:2024-08-16 14:21:30 来源:网友投稿

PPO是目前非常流行的增强学习算法。

DDPG也是解决连续控制型问题的的一个算法,不过和PPO不一样,PPO输出的是一个策略,也就是一个概率分布,而DDPG输出的直接是一个动作。DDPG是一种入门算法,效果远不及PPO。

免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。

如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!