很长时间以来,实验化学家们一直致力于寻求两个问题的答案:(1) 如何更好的设计所研究的化合物/材料并探索新的可能性?(2)什么样的合成条件能优化所研究的化合物/材料的产率或者相关性质?譬如说,对于一个储氢材料来说,如何改变原料或者合成条件来最大化它的气体吸附量?
自然而然地,对大多数经常在一线实验室的科研工作者,人工智能听起来像是很好的助力,但是常常因为编程经验不足,亦或学习化学领域外的知识在早期巨大的时间投入,在实验室应用AI的场景还处于一个起始阶段。最近兴起的大语言模型的爆火,很大程度上来自于它的简单实用:不需要任何入门基础,但是却可以按照输入的文本指令化身成各种助手来完成一项项本来需要耗费很多时间的任务。
“大语言模型与多智能体系统读书会”第六期特邀了麻省理工学院(MIT)从事化学相关研究的博士后——郑志凌。本次分享会将从一个纯实验背景毫无编程与计算基础的“传统”化学家的角度,探讨大语言模型对于化学与材料科学的日常科研工作中的实际应用,展示它是如何帮助加速科研进展并推动新的实验方式。
第一部分将介绍大语言模型对于文献中文本与图片数据挖掘的具体应用。我们以材料科学中的金属有机框架(MOF)的合成为例,展示ChatGPT以及相关模型可以通过简单的提示词工程以高准确率完成从文献中的合成实验条件以及表征数据图片的提取,归纳,总结。值得一提的是,相比于其他以机器学习为主的方式,大语言模型的一个巨大优势是任何其他领域的研究其他材料或者化合物的科研工作者,可以通过类似的方式,仅仅修改具体的提示词,来完成其行业内具体的数据挖掘任务。其次,考虑到获得文献中的数据仅仅是一个开始,我们将讨论如何将这些数据,转换为对实验化学家有用的新知识,来助力实际的实验合成以及化合物探索。
第二部分,我们将目光放在大语言模型对于分子结构编辑,实验规划与指导,代码生成,实验数据分析的具体应用,并且将上述每个独立的智能体整合成一个团队来协作开发新MOF,从设计,合成到应用实现一个闭环,从而有效提升实验化学家的生产效率和研究进度。我们将紧紧围绕“大语言模型能为实验化学家在实验室中能带来什么?”这个问题,详细介绍多智能体系统如何与人类研究者合作,解决实验室中的具体问题,并展示这些“助手们”在实际应用中的表现和成效。
-
LLM 在合成实验条件的数据挖掘
-
LLM对于文献图片的识别和数据提取
-
微调LLM对于分子结构的编辑以及新分子的生成
-
智能体与人类合作下的实验规划和指导
-
郑志凌,现于麻省理工学院(MIT)从事博士后研究,导师为Klavs Jensen院士。此前于加州大学伯克利分校(UCB)获得化学博士学位,师从Omar Yaghi院士,以及康奈尔大学(Cornell University)获得化学与生物化学学士学位。
研究方向:金属有机框架(MOF)材料的设计,合成与应用,以及探索大语言模型作为自动化实验和新材料的发现与合成优化中的角色。
[1] Z. Zheng; O. Zhang; C. Borgs; J. T. Chayes; O. M. Yaghi, ChatGPT Chemistry Assistant for text mining and prediction of MOF synthesis. Journal of the American Chemical Society 2023 145 (32), 18048–18062.
[2] Z. Zheng; Z. He; S. Chheda; O. Khattab; N. Rampal; M. A. Zaharia; C. Borgs; J. T. Chayes; O. M. Yaghi, Image and data mining in reticular chemistry powered by GPT-4V. Digital Discovery 2024 3 (3), 491–501.
[3] Z. Zheng; A. H. Alawadhi; S. Chheda; S. E. Neumann; N. Rampal; S. Liu; H. L. Nguyen; Y.-H. Lin; Z. Rong; J. I. Siepmann; L. Gagliardi; A. Anandkumar; C. Borgs; J. T. Chayes; O. M. Yaghi, Shaping the water harvesting behavior of metal-organic frameworks aided by fine-tuned GPT models. Journal of the American Chemical Society 2023 145 (51), 28284–28295.
[4] Z. Zheng; Z. Rong; N. Rampal; C. Borgs; J. T. Chayes; O. M. Yaghi, A GPT-4 reticular chemist for MOF discovery. Angewandte Chemie International Edition 2023 62, e202311983.
[5] Z. Zheng; O. Zhang; H. L. Nguyen; N. Rampal; A. H. Alawadhi; Z. Rong; T. Head-Gordon; C. Borgs; J. T. Chayes; O. M. Yaghi, ChatGPT research group for optimizing the crystallinity of MOFs and COFs. ACS Central Science 2023 9 (11), 2161–2170.
2024年4月13日(本周六)晚上19:00-21:00
扫码参与大模型与多智能体系统读书会,加入群聊,获取系列读书会回看权限,成为种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动多智能体这一前沿领域的发展。
读书会成员均可以在读书会期间申请成为主讲人。主讲人作为读书会成员,均遵循内容共创共享机制,可以获得报名费退款,并共享本读书会产生的所有内容资源。具体见系列读书会详情:
大语言模型与多智能体系统读书会:大模型赋能机器人涌现群体智能
集智俱乐部携手西湖大学工学院特聘研究员赵世钰、浙江大学教授任沁源、鹏城实验室高级工程师崔金强,共同发起了「大语言模型与多智能体系统」读书会。
在本次读书会中,我们将讨论大模型与智能体的相关话题,内容涵盖大语言模型赋能下智能体之间的辩论、协作、模拟人类,以及实际场景中的多机器人协作等问题。我们已邀请到多名科研前沿学者进行分享,包括郭泰成、李国豪、钱忱、王镇海龙、徐玉庄、杨宗瀚、刘子君、Hongxin Zhang、张锦添、董益宏 、梁添、Yilun Du等,更多话题仍然在不断的招募补充中,如果您对大模型与多智能体系统感兴趣,欢迎加入我们,可以来做分享,也可以来交朋友,最重要的是一起来学习!
此次活动特别鸣谢Datawhale、Agents42。
Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命for the learner,和学习者一起成长。
Agents42
一个致力于推进AI Agents产学研融合及创新的生态开放平台。