复杂系统的跨学科探索 | 北京大学AI研究院多智能体中心学术冬令营招募
导语
北京大学人工智能研究院多智能体中心学术冬令营开始招募啦~
在这里,你不仅可以跟随中心的老师们进行项目的研究与学习,增加你的科研实践经历;更能丰富人生体验,提高你的独立自主能力和创新精神。
2022~就让北京大学人工智能研究院多智能体中心学术冬令营陪伴你开启新的一年吧~
北京大学人工智能研究院
WINTER CAMP
学术冬令营
时间:1月15日-2月21日
项目预计截止日期:5月31日
项目方向
项目方向
课题:该课题将探索如何控制两只灵巧手进行的合作任务,例如端盘子,揉圆子,转魔方等。我们将探索如何使用多智能体强化学习技术进行对双灵巧手控制的建模,并且从合作博弈的角度出发设计算法。
参考文献:https://openreview.net/pdf?id=7uSBJDoP7tY https://openreview.net/pdf?id=EcGGFkNTxdJ
课题:符合安全性的强化学习技术具有着重要应用,例如无人驾驶,机械制造等等。本课题将研究如何在一个多智能体系统中设计具有安全性约束的强化学习过程。我们将探索满足安全性约束的强化学习框架, 并探索如何针对一个多智能体系统进行安全性的学习。
参考文献:https://arxiv.org/abs/2110.02793
技能要求:熟悉强化学习基本概念,有调试强化学习算法相关经验。编程能力出众可破格。
时期:6-12个月。
课题:面向通用人工智能,智能体往往需要能够有同时完成多个任务的能力。本课题从数学建模的角度,对元强化学习建模并且设计学习算法,其目标使用分层强化学习,内层代表一个智能体由自身奖励函数驱动的强化学习,外层代表跨任务的学习约束,从而达到让智能体拥有元学习不同任务的能力。
参考文献:https://arxiv.org/abs/2112.15400
技能要求:熟悉强化学习基本概念,有调试强化学习算法相关经验。编程能力出众可破格。
时期:6-12个月。
DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning
AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning
[1] Chow Y, Ghavamzadeh M, Janson L, et al. Risk-constrained reinforcement learning with percentile risk criteria[J]. The Journal of Machine Learning Research, 2017, 18(1): 6070-6120.
[2] Prashanth L A, Jie C, Fu M, et al. Cumulative prospect theory meets reinforcement learning: Prediction and control[C]//International Conference on Machine Learning. PMLR, 2016: 1406-1415.
申请方式及其他
申请方式及其他