合成生物学是本世纪最受关注的研究主题之一。从一个人的成长比喻来说,2010年之后的合成生物学进入了青少年时期。可能与充满烦恼和问题的「青春期」不同,合成生物学在过去十年蓬勃发展,并带来了许多新技术和具有里程碑意义的成就。


孟凡康,Tom Ellis

Imperial College Centre for Synthetic Biology

Department of Bioengineering, Imperial College London


注:本文整理自2020年10月14日发表在Nature Communication的COMMENT文章: The second decade of synthetic biology: 2010–2020文章篇幅有限,难免出现评述不准确或者不完整,还请见谅。

Cite:Meng, F. and Ellis, T. (2020) The second decade of synthetic biology: 2010–2020. Nat Commun, 11, 5174.


2020年,合成生物学已经20岁了。我们在第一个十年看到了很多令人印象深刻的研究成果和许多充满远见的思考。但在合成生物学的第二个十年,也就是2010年至2020年,当初的一些炒作真正地被它的成就所取代了吗?

这十年似乎有一个很好的开始。回顾2010年,当年引起全世界关注的合成生物学事件是J. Craig Venter研究所(JCVI)的研究团队完整地合成了一个细菌基因组[1]。这项具有里程碑意义的成就表明:DNA合成和组装可以扩展到兆碱基大小。但是,仅仅扩大DNA组装的水平还不足以实现该领域其他众多的野心。在2010年我们也看到了“Five Hard Truths for Synthetic Biology”的发表。这是一篇非常重要的文章,它揭示了在工程理念/技术上的缓慢进展正在拖慢合成生物学兑现可靠化、标准化和自动化设计的脚步[2]。

这些问题确实是该领域面临的巨大挑战。我们也可以在这十年首批合成生物学论文中明显地看到这些问题,比如一篇发表在Nature Communication的论文表明当转移到不同的大肠杆菌菌株中时,即使是我们认为的同一种微生物(不同的亚型),逻辑门基因线路的表现也会差异巨大,甚至会完全失效[3]。这带来了很多疑问:我们真的可以解决诸如底盘、噪音、代谢负担和元件干扰等棘手的合成生物学问题吗?我们真的能够像对电子电路工程一样对细胞进行工程设计吗?

答案是肯定的。这要归功于该领域的许多人,尤其是麻省理工学院的Chris Voigt,开展的一系列的工作。Nielsen等人在2016年发表了Cello,用于大肠杆菌中的逻辑基因电路设计,这是一种出色的端到端计算机辅助设计系统[4]。在过去十年中,这对于原教旨合成生物学家来说可能是最令人满意的一篇论文,因为它通过标准化、精细刻画和自动化设计在一定程度上实现合成生物学所许诺的工程设计理念。在此篇文章前后,Voigt的团队也发表了众多其他有关大肠杆菌合成生物学的基础论文,不断地为我们提供了众多遗传元件的设计算法,同时开发了多样的元件库并提供了详细的表征数据。

图1:从2010年到2020年,合成生物学具有里程碑意义的研究成果

虽然我们很容易关注到合成生物学的许多重要成就(图1),但是真正推动该领域发展主要有两点:1. 大量艰苦的技术工作提高了我们对遗传元件或者生物系统的理解程度和设计能力;以及2. 新技术的发现和创新让我们在设计、构建、编辑和共享DNA遗传元件上变得比以往都更加高效(图2)

图2:在过去的十年间,新的智能技术和工作方式加快了合成生物学的设计-构建-测试-学习过程。

的确,回顾十年来,最引人注目的莫过于用于工程生命相关的工具和技术的进步。过去许多研究组通过iGEM比赛来交换不同的基因元件:元件通过BioBrick克隆方法进行串联组装,然而这些元件的表征数据实际上很少可靠。构建表达载体也是一项缓慢的实验室工作,而且在导入细胞后的效果往往不如预期甚至完全没有效果。在细胞内编辑DNA的方法非常少,但是需求非常迫切。因此,最早在2011年和2012年出现的CRISPR基因编辑技术似乎更像是一种顺其而然的事情。2006年以来,George Church的实验室一直在进行将每个TAG终止密码子突变为TAA密码子的项目[5],希望最终能够省出一个密码子用于非天然氨基酸的高效引入。因此,他们对开发可以精确改变细胞内DNA的任何技术都非常感兴趣。他的团队和他的前博士后发表于2013年的两篇论文展示了CRISPR可以用于真核细胞,同时George Church研究组在随后的几年中在CRISPR上进行了进一步的创新,包括引发争议的基因驱动技术。不仅仅是切割DNA的工具,加利福尼亚的合成生物学研究团队发明了独特的dCas:dCas9与DNA结合过程的可编程性,使得我们可以定制化地对基因表达进行调控[6]。

虽然CRISPR毫无疑问是生物科学领域过去十年最重要的突破之一,但也许它的先驱TALENs(TAL-Effector核酸酶)在革新过去10年中合成生物学的发展方面值得更多的赞誉。TALENs本身模块化、可编程性的DNA结合能力以及可细胞内基因编辑的特点在2011年吸引了许多人使用这项新技术。但是,TALENs具有高度的序列重复性,对于习惯于经典DNA克隆方法、PCR甚至Gibson的人来说都是一记重重的耳光。如果想使用TALENs,我们一般需要购买大量合成的DNA,或者精通基于机器的DNA自动化组装过程,或者直接使用来自Addgene的Golden Gate Assembly TALEN克隆工具包。幸运的是,合成生物学领域的许多人尝试了一、二、甚至所有这三件方法,很快就看到了DNA的组装可以有多快。Golden Gate Assembly现在在基因构建过程中主导方法之一,通过Addgene共享的许多模块化克隆(MoClo)工具箱和遗传元件库已经改变了人们的工作方式,让我们可以基于彼此工作继续前进。很多公司和学术机构建立了专用于DNA自动克隆的设施,当然最重要的是,低廉的DNA合成现在比自己动手构建克隆更具成本效益。合成基因价格的大幅下降已经彻底改变了人们在生物设计上的工作方式。

基因合成成本的下降主要归因于一种新方法:在芯片上并行合成包含数千个寡核苷酸的“寡核苷酸池”,并与下一代测序(NGS)结合使用。这是方法在验证合成DNA的准确性上更具成本效益。这两项技术也使我们在合成生物学中的工作方式上发生重大变化,我们突然可以在一个实验中并行设计、构建和表征数十万个基因设计[7]。如果将基因设计的表征和NGS(例如barcoded RNAseq)偶联起来,此时数据分析将成为一种的新瓶颈,而不再是基因的设计和组装过程。在过去的十年中,这导致了合成生物学中数学方法与生物学之间关系的重大转变。在21世纪初期,合成和测试DNA设计缓慢而昂贵时,数学建模对于预测效果以及缩小设计空间上非常有用。但是现在很少需要这种方法了,因为数学在生物设计的重点转向了大型数据的统计分析,我们可以从数据分析结果中学习如何设计DNA。

在过去的十年中,超级计算工具还在分子建模和预测的领域开辟了新的领域。由David Baker领导的蛋白质理性设计突飞猛进。在这十年快结束的时候,David Baker研究团队让人工合成的功能蛋白成为了酵母细胞中基因线路的关键组分[8]。第一个Mycoplasma genitalium全细胞模型的发布[9]使得我们可以在一个细胞周期过程中模拟数百个基因的作用,而这促进Craig Veter团队在最小基因组工作上的进展,该项目在2016年达到了另一个里程碑:迄今为止拥有最小基因组的生命Synthia 3.0诞生了[10]。

国际Sc2.0计划也将合成基因组带入了真核生物,通过国际合作设计并构建了高度修饰且功能齐全的合成酵母染色体[11]。在2019年,大肠杆菌在合成基因组上也取得了进一步的进展:我们删减了基因组上的3个密码子,这使得我们可以在细胞内引入更多的非天然氨基酸分子[12]。同时我们还可以在生物中引入非天然核酸,并实现了非天然核酸-非天然氨基酸的编码与解码过程。

DNA也成为了一种存储数据的方式,最初只是在体外通过化学合成,然后又通过“分子记录仪Molecular Recorder”遗传系统将其存储在细胞中。分子记录仪主要是通过重组酶或者CRISPR在细胞生长过程中对基因进行修改来储存信息。我们可以将分子记录仪设置在益生菌中,这样一来益生菌便可以在肠道中进行健康监测。人工改造益生菌刚开始用来检测尿液来判断癌症,后续也转变为了疾病疗法,用于纠正代谢紊乱、感知和杀死病原体等等。制药行业最热门的基于细胞的疗法,即靶向癌症的CAR-T细胞疗法,也开始配备了合成生物学的传感和逻辑装置。合成生物学的传感和逻辑也发现了更多的医疗应用,比如用于检测埃博拉和寨卡病原体RNA的纸质生物感应器[13]。这些传感器大多通过新的模块化方法来设计复杂的核酸相互作用(例如Toehold Switch),同时使用无细胞系统来产生或者支撑相应的生化反应过程[14]。

医疗健康现在可以说已经取代了代谢工程,成为合成生物学应用的绝大多数选择,但这并没有阻止代谢这一领域的发展。耀眼的学术成就包括工程细胞固定CO2和氮,工程酵母产生类阿片和大麻素。许多研究所已经建立了生物铸造厂,证明了细胞的工程改造可以快速实现数十种不同分子的生物合成[15]。当然,利用合成生物学进行代谢工程的许多工作现在都在Amyris、Genomatica、Ginkgo和Zymergen等公司进行。

回顾十年,合成生物学的许多研究里程碑和新研究方向的确令人印象深刻,但是作为合成生物学研究人员,智能技术的进步使我们最为兴奋,因为这些技术可以推动该领域下一步的发展。但是,如果我们要寻找十年来最大的成就来证明该领域在2010年被炒作是合理的,那么全球数百家合成生物学公司的发展和估值则可以证明。现在,一个价值数十亿美元的行业立于我们眼前,该行业可以通过工程细胞生产化学药品、生物药物、蛋白质、益生菌,传感器、肥料、纺织品、食品和许多其他东西。这些不是现有的大公司转向了合成生物学方向,而是在大多数情况下在这一领域工作的博士后、博士和iGEM学生创立、领导和发展的公司。 

特别鸣谢:We wish to thank everyone who engaged with a July 2020 Twitter conversation on the most important achievements in synthetic biology from the last 10 years which helped to shape this article. A link to this conversation is here: https://twitter.com/ProfTomEllis/ status/1280982288797446144.


参考文献:

[1] Gibson, D. G. et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science 329, 52–56 (2010).
[2] Kwok, R. Five hard truths for synthetic biology. Nature 463, 288–290 (2010).
[3] Wang, B., Kitney, R. I., Joly, N. & Buck, M. Engineering modular and orthogonal genetic logic gates for robust digital-like synthetic biology. Nat. Commun. 2, 508 (2011).
[4] Nielsen, A. A. K. et al. Genetic circuit design automation. Science 352, aac7341 (2016).
[5] Lajoie, M. J. et al. Genomically recoded organisms expand biological functions. Science 342, 357–360 (2013).
[6] Qi, L. S. et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173–1183 (2013).
[7] Cambray, G., Guimaraes, J. C. & Arkin, A. P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005–1015 (2018).
[8] Ng, A. H. et al. Modular and tunable biological feedback control using a de novo protein switch. Nature 572, 265–269 (2019).
[9] Karr, J. R. et al. A whole-cell computational model predicts phenotype from genotype. Cell 150, 389–401 (2012).
[10] Hutchison, C. A. 3rd et al. Design and synthesis of a minimal bacterial genome. Science 351, aad6253 (2016).
[11] Richardson, S. M. et al. Design of a synthetic yeast genome. Science 355, 1040–1044 (2017).
[12] Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514–518 (2019).
[13] Pardee, K. et al. Paper-based synthetic gene networks. Cell 159, 940–954 (2014).
[14] Tinafar, A., Jaenes, K. & Pardee, K. Synthetic biology goes cell-free. BMC Biol 17, 64 (2019).
[15] Casini, A. et al. A pressure test to make 10 molecules in 90 days: external evaluation of methods to engineer biology. J. Am. Chem. Soc. 140, 4302–4316 (2018). 

复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:




推荐阅读


生命复杂性系列读书会
什么是系统生物学 | 集智百科
从麦克斯韦妖到量子生物学,生命物质中是否潜藏着新物理学?
合成生物学如何理解和构建生命复杂性?| 顶尖科学家访谈
加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!