CVPR 2020 系列论文解读公开课第四期,就在4月23日(本周四)20:00 整(北京时间)进行。
AI科技评论出品
针对目前国际疫情形势越发严峻,无法现场参会进行学术交流的情况,AI研习社联合AI科技评论组织策划了顶会系列专题活动,这其中就包括【ICLR 2020 专题】系列活动。而【ICLR 2020系列论文解读公开课】更是其中重要的组成部分,除此之外,专题还包括系列论文文字解读,会议数据分析,会议资源下载等。
本次直播为【ICLR 2020 系列论文解读公开课】第八期,此论文录用为ICLR 2020 论文《 Action Semantics Network: Considering the Effects of Actions in Multiagent Systems》,我们有幸邀请到了天津大学王维埙博士,带来关于“动作语义网络,考虑多智能体系统中动作的影响”的分享。
论文地址: https://openreview.net/forum?id=ryg48p4tPH
讲师介绍
王维埙
天津大学一年级博士生,导师为郝建业副教授,研究兴趣为:深度强化学习,多智能体深度强化学习 及其 在现实世界的运用。曾在阿里巴巴(定向广告),网易游戏伏羲实验室进行实习,并在相应会议如:AAAI,AAMAS,ICLR,CIKM,DAI等上发表多篇相关论文,并获得DAI 2019 最佳论文奖。
更多信息请见个人主页:http://wwxfromtju.github.io
分享时间
4月23日(周四) 20:00整(北京时间)
分享主题
动作语义网络:考虑多智能体系统中动作的影响
分享背景
从Alpha Go起,深度强化学习引起了学术界与业界的广泛关注。多智能体深度强化学习(MADRL)因其在现实世界中广泛的潜在应用,近期成为了学界热点。
以往的工作为了促进多智能体的协调,将各种多智能体协调机制引入深度学习体系中,然而,它们并没有明确考虑多智能体之间的动作语义,即不同的动作对其他智能体的影响是不同的。
在这篇论文中,提出了一种新的网络体系结构,称为动作语义网络( Action Semantics Network),能够显示地表示智能体之间的动作语义。
本次分享将展示如何将动作语义网络与深度强化学习(DRL)算法相结合来提高它们的性能,并展示在星际争霸II、Neural MMO、逆水寒等游戏中的训练效果。
分享提纲
1.多智能体系统的基本介绍与当前深度多智能体的进展与相应研究
2.Action Semantics Network的研究动机
3. Action Semantics Network的网络介绍及相应实验效果,展示逆水寒的训练效果(星际争霸2, OpenAl Neural MMO)
如何报名?
方式一:
直达直播地址:http://mooc.yanxishe.com/open/course/793
方式二:
扫码添加【AI研习社顶会小助手】微信:AIyanxishe2,进群获取直播链接和直播PPT。
疫情拉开了大家的距离,但是学术交流是不会就因为疫情被阻挡的,我们愿架起这座学者之间的桥梁,以最短路径,让更多学者能更快的参与其中,促进学术交流,让知识真正流动!