分享主题
鲁棒强化学习
分享背景
强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。
分享嘉宾
任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦
分享提纲
华为伦敦研究所决策与推理团队介绍
强化学习的相关背景知识与强化学习的鲁棒性问题
Wasserstein Robust Reinforcement Learning 论文解读
分享时间
(北京时间 ) 10月 10 日(星期四) 20:00
雷锋网雷锋网雷锋网