Nat. Mach. Intell. 速递：Regression Transformer 支持分子语言建模的并发序列回归和生成

关键词：生成模型，Regression Transformer，多任务语言模型

论文题目：Regression Transformer enables concurrent sequence regression and generation for molecular language modelling

论文来源：Nature Machine Intelligence

论文链接：https://www.nature.com/articles/s42256-023-00639-z

生成模型（generative model）在自然科学中取得了巨大进步，但其可控性仍然具有挑战性。分子或蛋白质生成模型的一个致命弱点是归纳偏差（inductive bias），可能反映感兴趣的连续性质。

最近发表在 Nature Machine Intelligence 的这篇文章提出了一种将回归抽象为条件序列建模问题的方法，称为回归转换器（Regression Transformer，RT）。这是一种新型的多任务模型，可以在数字和文本标记的组合上进行训练，与 Transformer 中处理回归的规范方式不同。这为多任务语言模型引入了一个新的方向，无缝地桥接了序列回归和条件序列生成。他们证明，尽管使用标称尺度（nominal-scale）训练目标，Regression Transformer 在小分子、蛋白质和化学反应的性质预测中的效果，可能超过常规回归模型的性能。

更重要的是，用连续属性启动同一个模型，产生了一个强大的条件生成模型（conditional generative model），该模型在子结构约束的、属性驱动的分子生成基准中优于专门的方法。他们由交替的训练方案训练二分法，使模型能够基于期望的属性约束来修饰种子序列。此种多任务方法有望成为材料设计的基础模型。

图1. Regression Transformer 概览

图2. 用 Regression Transformer 进行属性驱动和局部优化的分子设计

编译｜朱欣怡

AI+Science 读书会启动

详情请见：

人工智能和科学发现相互赋能的新范式：AI+Science 读书会启动

推荐阅读

1. AI生成艺术的底层原理：非平衡物理的扩散模型

2. AI艺术的背后：详解文本生成图像模型

3. Nat. Commun. 速递：抽象表征从训练执行多任务的神经网络中自然涌现

4. 《张江·复杂科学前沿27讲》完整上线！

5. 成为集智VIP，解锁全站课程／读书会

6. 加入集智，一起复杂！

点击“阅读原文”，报名读书会

Nat. Mach. Intell. 速递：Regression Transformer 支持分子语言建模的并发序列回归和生成

AI助力科学家：利用AI代理模型和扩散模型辅助科学设计丨周日直播·AI+Science读书会

「未·未来」国际教育论坛开放课堂｜人工智能时代的系统设计

发表评论点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

Nature封面文章: DeepSeek-R1 通过强化学习激励的LLM推理

AI模拟细胞：让活细胞在大数据中自发涌现！

系统科学：超越相对论与量子力学的科学革命

Nature子刊：非线性动力学最新论文合集

清华大学崔鹏教授首创基于因果推理的大模型——极数（LimiX）大模型丨集智百科

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

Nat. Mach. Intell. 速递：Regression Transformer 支持分子语言建模的并发序列回归和生成

微信扫一扫,分享到朋友圈

AI助力科学家：利用AI代理模型和扩散模型辅助科学设计丨周日直播·AI+Science读书会

「未·未来」国际教育论坛开放课堂 ｜ 人工智能时代的系统设计

猜你喜欢

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

清华大学崔鹏教授首创基于因果推理的大模型——极数（LimiX）大模型丨集智百科

发表评论 点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

Nature封面文章: DeepSeek-R1 通过强化学习激励的LLM推理

AI模拟细胞：让活细胞在大数据中自发涌现！

系统科学：超越相对论与量子力学的科学革命

Nature子刊：非线性动力学最新论文合集

清华大学崔鹏教授首创基于因果推理的大模型——极数（LimiX）大模型丨集智百科

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

关注我们的公众号

「未·未来」国际教育论坛开放课堂｜人工智能时代的系统设计

发表评论点击这里取消回复。