AI for 科学设计:GFlowNet和量子计算探索未来丨周日直播·AI+Science读书会

导语
随着机器学习和优化算法的广泛应用,人工智能技术正在改变科学研究的方式。AI for Scientific Design作为一个新兴的研究领域,不仅可以帮助科学家分析大量实验数据,而且可以提供新的方法和工具来建模和预测自然现象。最近,GPT-4等大模型组成的AI智能体,已经可以手把手教你做化学实验了,选啥试剂、剂量多少、推理反应会如何发生,它都一清二楚。那么,AI for Scientific Design是否将成为科学发现的第五范式,本次读书会将和大家一起讨论这个话题。
本次分享由Mila的张鼎怀和哈佛大学的扈鸿业共同探讨生成流网络GFlowNet和强化学习RL在分子设计和量子控制中的应用,并阐述它们如何推动科学设计的突破和发展。
AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,从2023年3月26日开始,每周日早上 9:00-11:00 线上举行,持续时间预计10周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。


简介
简介
本次读书会由两部分组成:
第一部分,鼎怀将全面综述GFlowNet框架。这是一种新的概率机器学习框架,和强化学习同层次,可以应用于实验科学循环的建模、假设生成和实验设计阶段。鼎怀将分享综述性的介绍GFlowNet框架,尤其是与现有模型的联系,同时将介绍GFlowNet在化学、生物等领域的应用,以及如何更好地将GFlowNet方法整合到科学发现流程中,以加速科学发现的步伐并解决全球性问题。
第二部分,鸿业将介绍AI如何学习和控制量子系统。1980年代物理学家费曼曾说过“如果分子和原子是量子力学所支配的,我们不能用经典计算机来模拟它们,那为什么我们不用量子计算机来模拟它们”如何能够让经典的机器学习量子体系,以及量子体系可不可以真正的被经典机器有效的学习是一个重要的问题,深入浅出地给大家讲解经典世界和量子世界的不同,希望能够让大家理解量子力学给我们带来的机遇与挑战。此外,还会给大家简单介绍一些通过强化学习方案实现高精度量子门和设计量子纠错码的工作。
分享大纲
分享大纲
Part1:GFlowNet for Scientific Design
采样问题和科学发现
GFlowNet框架的出发点和系列算法
GFlowNet应用与挑战
Part2:量子世界的科学设计
AI如何从世界模型中学习
量子世界模型一览、量子计算机
如何良好控制和利用量子计算这一“性能怪兽”?
重要概念
重要概念
希尔伯特空间(Hilbert space)
投影测量(Projective measurement)
变分推断(Variational Inference)
量子纠错码(QEC)
马尔可夫决策过程(MDP)
马尔可夫链蒙特卡罗算法(MCMC)
主讲人介绍
主讲人介绍

张鼎怀是Mila研究所和蒙特利尔大学的一名在读博士研究生,此前于北京大学数学科学学院获得学士学位。他的研究关注于概率推断和探索方法的结合,包括在推断问题中引入探索机制来帮助采样和生成,以及通过引入结构化概率建模来帮助探索-剥削的权衡。他的工作广泛应用于各个机器学习领域,包括强化学习,图片生成,蛋白质设计,小分子合成,组合优化等。他的工作发表在机器学习相关的会议上。
个人主页:https://zdhnarsil.github.io/

扈鸿业是哈佛量子计划研究员(HQI Fellow),主要研究方向是量子计算和AI的结合,包括量子模拟与量子体系控制,量子实验噪声抑制,量子纠错码,量子机器学习,量子层析理论,generative model, reinforcement learning。2022年在加州大学圣地亚哥分校获得物理博士学位(导师尤亦庄教授),2016年在北京大学获得物理学士学位(导师吴飙教授)。主要研究兴趣为量子计算,变分量子算法,量子态层析理论,生成型神经网络与无监督学习,强化学习,量子纠错码,量子多体物理,量子最优控制理论等。博士期间曾获得UCSD物理系挑战奖,NASA-USRA费曼奖学金,幺正基金(unitary fund)奖金。
直播信息
直播信息
直播时间:
2023年4月16日(周日) 晚上 21:00-23:30

概念剖析
概念剖析
GFlowNet框架
GFlowNet框架,是一种新的概率机器学习框架,可以应用于实验科学循环的建模、假设生成和实验设计阶段。在探索大型搜索空间的挑战方面,GFlowNet通过学习从奖励函数间接给出的分布中采样来解决这个问题。这个奖励函数对应于一个非归一化概率,使得GFlowNet能够采样多样化、高奖励的候选方案。此外,作为一种基于网络学习的新型采样方法,GFlowNet还可以从数据中学习复杂系统的潜在因果结构,并用于生成新的有价值的候选样本。

目前机器学习方法面临的一个关键挑战是如何有效地探索非常大的搜索空间,这需要有估计可减少(认知层面上的)不确定性的技术,并生成多样化和信息丰富的实验集。GFlowNet就是为应对这一挑战而生的。它可以用于实验科学循环的建模、假设生成和实验设计阶段。

图2:使用GFlowNets促进科学发现的迭代实验循环。| 图片来源:GFlowNets for AI-Driven Scientific Discovery
GFlowNet通过学习从奖励函数给出的分布中取样,从而可以对不同的、高回报的候选者进行采样。同时,GFlowNet也可以形成高效和摊销的贝叶斯后验估计器,以已获得的实验数据为条件的因果模型。有了这样的后验模型,就可以提供认知层面上的不确定性和信息增益的估计,从而推动实验设计政策。GFlowNet可作为人工智能驱动科学发现的有价值工具,尤其是在面临非常大的候选空间情况下,可以获得廉价但不准确的测量,或昂贵但准确的测量。
量子体系和经典体系的辨析
想象一下,你正在玩一个赌博游戏,你抛硬币并猜测结果。在经典体系中,这个结果可以是正面或反面,且我们可以通过经典的物理法则来预测和计算可能的结果和概率。但是,在量子体系中,硬币不再是一个简单的二元选择,而是存在多个可能性状态的叠加。我们无法通过经典物理来预测硬币翻转的确切结果,而是需要使用量子力学的工具来描述和计算。

图3:量子计算到底跟经典计算有什么不同?| 图片来源:墨子沙龙
要想使得人工智能能够操纵量子体系,首先我们需要思考基于经典机器的人工智能体系能不能有效的学习和理解量子态。经典和量子体系有哪些不同?经典的机器学习方法在解决量子问题上又有机遇与挑战?本期读书会,我们将简单介绍关于随机测量的量子-经典接口方案的前沿结果,以及一些利用这个测量方案进行机器学习并发现量子物相的工作。对于量子体系的控制,制备高精度的量子门,发现更好的量子纠错码,是通往可纠错量子计算并实现量子优势的必经之路。在最后,我们会给大家简单介绍一些通过强化学习方案实现高精度量子门和设计量子纠错码的工作。
推荐学习资源
推荐学习资源
关于GFlowNet的前置知识
生成流网络(GFlowNet)是由图灵奖得主Yoshua Bengio提出的人工智能未来方向之一。GFlowNet是一种新的概率机器学习框架,旨在通过探索大的搜索空间和通过贝叶斯后验估计器来降低(认知层面上的)不确定性,从而改善科学发现。在2021年,Bengio以一作身份发表了长达70页的论文《GFlowNet Foundations》,详细介绍了GFlownet的研究。

图4:如何条件化 GFlowNet,在给定状态 s下,通过原始流(左)和转移流来创建一组新的流(右)。| 图片来源:GFlowNet Foundations
去年,Bengio及其学生张鼎怀等发表了一篇新论文《Unifying Generative Models with GFlowNets》,简要介绍了现有深度生成模型与GFlowNet框架之间的联系,并通过马尔可夫轨迹学习的视角提供了一个统一的观点,并进一步提供了一种统一训练和推理算法的方法。
关于量子计算的基础课程
加大圣迭戈分校:量子力学(英文-2021)

量子信息预读班

集智推文
推荐的GFlowNet学习路径和资源:
https://github.com/zdhNarsil/Awesome-GFlowNets
AI+Science 读书会启动

点击“阅读原文”,报名读书会





