大脑中的值分布强化学习 | 周日直播·NeuroAI读书会
导语
神经科学和人工智能领域的多位著名学者近日发表 NeuroAI 白皮书认为,神经科学长期以来一直是推动人工智能(AI)发展的重要驱动力,NeuroAI 领域的基础研究将推动下一代人工智能的进程。文章发表后引发热议:神经科学是否推动了人工智能?未来的人工智能是否需要神经科学?
本着促进神经科学、计算机科学、认知科学和脑科学等不同领域的学术工作者的交流与合作,集智俱乐部联合北京师范大学柳昀哲、北京大学鲍平磊和昌平实验室吕柄江三位研究员共同发起了「NeuroAI」读书会,聚焦在视觉、语言和学习领域中神经科学与人工智能的相关研究,期待能够架起神经科学与人工智能领域的合作桥梁,激发跨学科的学术火花。
读书会线上进行,11月27日开始,每周日晚上19:00-21:00,持续时间预计10周。读书会详情及参与方式见后文。
分享内容简介
分享内容简介
本次分享将介绍强化学习的历史,并以RW模型为基础,在多臂老虎机问题中实现值分布强化学习算法。继而介绍值分布强化学习在大脑中存在的证据,以及如何从回归的角度理解值分布的强化学习。最后,将讨论值分布强化学习的生物学价值,以及如何有效利用奖赏的分布以提高算法的性能。
分享内容大纲
分享内容大纲
-
强化学习历史与值分布强化学习简介
-
值分布强化学习的算法
-
值分布强化学习的神经实现
-
值分布强化学习的计算理论
-
值分布强化学习的生物学价值
-
利用值分布强化学习促进探索
主要涉及到的核心概念
主要涉及到的核心概念
2. RW模型(Rescorla-Wagner Model)
3. 奖赏预测误差与多巴胺神经元
4. 相关脑区:腹侧被盖区,黑质,纹状体,眶额叶等
5. 相关算法:TD-learning,Quantile Regression, Expectile Regression
主讲人介绍
主讲人介绍
刘花卷,现就读于北京师范大学,认知神经科学与学习国家重点实验室,研究生三年级。本科毕业于同济大学。
潘登,现就读于牛津大学,实验心理学专业,博士生一年级。本科毕业于北京大学。
直播信息
直播信息
时间:
本次分享与读书会主题的关系
本次分享与读书会主题的关系
主要涉及到的参考文献
主要涉及到的参考文献
1.Dabney, W., Kurth-Nelson, Z., Uchida, N., Starkweather, C. K., Hassabis, D., Munos, R., & Botvinick, M. (2020). A distributional code for value in dopamine-based reinforcement learning. Nature, 577(7792), 671-675.
Lowet, A. S., Zheng, Q., Matias, S., Drugowitsch, J., & Uchida, N. (2020). Distributional reinforcement learning in the brain. Trends in neurosciences, 43(12), 980-997
Mavrin, B., Yao, H., Kong, L., Wu, K., & Yu, Y. (2019, May). Distributional reinforcement learning for efficient exploration. In International conference on machine learning (pp. 4424-4434). PMLR.
Dabney, W., Rowland, M., Bellemare, M., & Munos, R. (2018, April). Distributional reinforcement learning with quantile regression. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 32, No. 1).
Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.
Behrens, T. E., Woolrich, M. W., Walton, M. E., & Rushworth, M. F. (2007). Learning the value of information in an uncertain world. Nature Neuroscience, 10(9), 1214-1221.
NeuroAI读书会招募中
详情请见:
点击“阅读原文”,报名读书会