毕业论文
您现在的位置: 框架 >> 框架市场 >> 正文 >> 正文

上海交大开源MALib多智能体并行训练框

来源:框架 时间:2022/5/7
机器之心专栏作者:上海交大和UCL多智能体强化学习研究团队基于种群的多智能体深度强化学习(PB-MARL)方法在星际争霸、王者荣耀等游戏AI上已经得到成功验证,MALib则是首个专门面向PB-MARL的开源大规模并行训练框架。MALib支持丰富的种群训练方式(例如,self-play,PSRO,leaguetraining),并且实现和优化了常见多智能体深度强化学习算法,为研究人员降低并行化工作量的同时,大幅提升了训练效率。此外,MALib基于Ray的底层分布式框架,实现了全新的中心化任务分发模型,相较于常见的多智能体强化学习训练框架(RLlib,PyMARL,OpenSpiel),相同硬件条件下吞吐量和训练速度有着数倍的提升。现阶段,MALib已对接常见多智能体环境(星际争霸、谷歌足球、棋牌类、多人Atari等),后续将进一步提供对自动驾驶、智能电网等场景的支持。项目主页:

转载请注明:http://www.0431gb208.com/sjszlff/163.html