论文
登录后可查看剩余解析次数。
标签筛选
对抗性运动先验
Adversarial Motion Priors Make Good Substitutes for Complex Reward Functions
发表:2022/3/29
对抗性运动先验复杂奖励函数替代风格奖励学习模拟强化学习自然策略转移
该研究提出使用从运动捕捉数据中学习的“风格奖励”替代传统的复杂奖励函数,以训练智能体实现更加自然和节能的行为。这种方法基于对抗运动先验,从而促进策略的真实世界迁移,证实了在无需复杂奖励的情况下也能实现有效控制。
02
Advanced Skills through Multiple Adversarial Motion Priors in Reinforcement Learning
发表:2022/3/23
对抗性运动先验机器人运动控制模仿学习多样化技能学习强化学习
本研究提出了一种增强型对抗运动先验(MultiAMP)方法,通过多种可切换运动风格简化了强化学习(RL)中机器人运动控制的奖励函数调优。实验证明,即便结合无运动数据的技能,机器人仍能同时学习多项风格和技能,且表现无显著差异,像是从四足模式切换到人形模式的复杂动作。
04