导语
以诺贝尔奖得主为代表的精英科学家群体,引领了现代科学的发展方向,其学术生涯路线,对青年学者有启发意义。近日由国防科技大学李际超与美国西北大学王大顺、殷裔安及印第安纳大学Santo Fortunato等合作发表的论文,整理了 1900-2016 年间 545 位诺奖得主的论文发表与合作网络数据,对比发现诺奖科学家与普通科学家之间在论文发表、科研合作及创新研究上的诸多差异。例如被诺奖认可的研究工作往往出现在学者职业生涯早期,独立或小团队完成的工作更可能获得获奖,精英科学家在获得诺奖之后的新文章影响力可能下降等。本文是对这项研究的详细解读。

我们特邀论文第一作者李际超,在北京时间5月5日(周二)19:00-20:00做客集智俱乐部直播间,亲述论文故事,报名方式见文末。


论文题目:

Scientific elite revisited: patterns of productivity, collaboration, authorship and impact

论文地址:

https://royalsocietypublishing.org/doi/10.1098/rsif.2020.0135




那些荣获诺奖的明星科学家们


科研工作者不是躲在象牙塔里终日和瓶瓶罐罐、键盘机器打交道的书呆子,他们的研究工作能给社会提供巨大的价值。而其中的科学大牛、明星科学的影响不仅局限在科学界、更对全世界都作出了巨大的贡献。诺贝尔奖作为一个高含金量、最负盛名的科学奖项,为研究者去追踪那些明星科学家的学术生涯提供了线索和依据。

近日由国防科技大学的李际超与美国西北大学科学学与创新研究中心的王大顺、殷裔安及印第安纳大学的Santo Fortunato合作发表的论文融合了诺贝尔奖官网、维基百科词条、诺奖获得者个人网站及微软学术图谱多源数据,通过姓名消歧获取了545位1900年至2016年间自然科学(物理、化学、生理学或医学)领域诺奖获得者完整的论文发表及引文合作网络数据,基于此,将诺奖科学家与普通科学家的职业生涯进行对比分析,探究了诺奖科学家论文发表、科研合作及颠覆性创新的工作模式和规律。



数据收集

       

图1:数据收集与验证框架


论文作者首先从多个数据源如诺贝尔奖官网、维基百科词条、诺奖获得者个人网站,爬取收集并手动整理了每位诺奖科学家发表的论文,并将这些论文在微软学术图谱(MAG)数据库进行了匹配作为“种子”;然后,通过“种子+个人引文网络扩展”这一过程收集每个获奖者的整个论文发表列表;最后将所获得的数据集的准确性及完备性采用多种方法包括手动收集CV、谷歌学术、单位信息等进行了验证。


最终,几位作者收集了545位诺奖科学家的完整发文记录,共有93,394篇期刊论文,并人工识别了874篇诺奖论文(整个数据收集及验证过程工作量超过了1000小时)。



今日诺奖科学家,昔时当红少年郎


一个坊间常见的观点认为:学术大师往往在年轻时就已经展现出了傲人的资质。这一点在该研究的数据集中确实得到了体现,获得诺奖的科学家在学术生涯的早期——发表第一篇论文后的五年内——发表的论文数影响力(是否是同时期、同领域被引数量前1%的论文),都远远超过同领域的科学家。

       

图2:诺奖获得者在学术生涯早期的表现差异


从上图我们可以看到无论是发表论文数量(左图)还是论文的影响力(右图)物理、化学与医学领域中的诺奖得主(深蓝色)的表现均优于普通的科学家(蓝绿色)。其中,论文发表数量是普通科学家的两倍多,而影响力更是普通科学家的八倍。


但这些天资优异的少年天才并不是独来独往的独行侠,实际上他们与其他科学家合作发文的数量是普通科学家的1.77倍,而独立发表的论文数量并不是特别突出。

       

图3:获得诺奖的科学家-普通科学家在独立-合作发文数量上的差异。


虽然从上图我们可以看到,在独立发表论文数量上,获得诺奖的科学家(浅蓝色)与普通科学家(绿色)在化学和医学领域并无显著区别。但是,他们在学术生涯的早期独立完成的研究、论文往往更能获得诺贝尔奖的青睐。

       

图4:获得诺奖的科学家独立完成的论文(红色)获得诺奖的概率是合作论文(紫色)的2.16倍

 

学术大师与他们的奇迹年


作者通过控制变量法,证明了生长和优先连接两条假设是产生无标度分布的必要条件。不仅仅是如前文所说,获奖者学术生涯早期的独立工作获奖的可能性更大,而在科学家完整的学术生涯中,被诺贝尔奖认可的研究工作也往往出现在职业生涯的早期。

       

图5:研究工作发表的顺序(横轴)与文章影响力(纵轴)的累计分布


从图中我们确实可以看出获得诺贝尔的研究论文很有可能出现在研究者研究生涯的早起。但是如果我们考虑到诺贝尔奖颁奖的一个条件:只颁发给在世的学者。以及一个研究者的学术研究可能要经过十几年才能得到有效的公论。我们会发现这里存在着选择效应。如果研究者在晚年做出了重要的工作有可能会被诺贝尔奖排除在外。

就此问题,作者在排除诺奖获奖论文后重新绘制了上图,他们得出的结论令人吃惊。

       

图6:移去获得诺奖的论文后,研究工作发表的顺序(横轴)与文章影响力(纵轴)的累计分布


如上图所示,如果去除了诺贝尔奖带来的影响,我们发现一位科学家所发表的重要论文(上图中所示是Top3)其实在其学术生涯中出现的概率是等可能的。换句话说绝对的年龄与优秀的研究成果之间并没有必然的关系。也许,只有爱因斯坦的奇迹年发生在他26岁的时候,而对于其他科学家来说,他们的奇迹年可以出现在其学术生涯中的任何时候。

同样,我们也知道即便是资质极高学术天才也无法一生都引领着学术界前进的方向,每一名科学家都存在着他的奇迹年、“热手期”(hot streak)——一名科学家有影响力的重要论文集中出现的时间段。实际中,从该研究统计的数据来看88%的诺奖工作是在热手期完成的,这一时间段发表的学术成果获诺奖的概率是其他时间段发表学术成果的1.4倍。

相关阅读:
Nature 最新:你的创作高峰即将到来,赶快趁热打铁迎接“奇迹年”!

作者研究就发现,这些获得诺贝尔奖的科学家的重要研究论文往往是在热手期内依次接连出现。

       

图7:三个学科领域中高影响力论文出现概率相关关系的热力图


从图中我们能够较为明显的看到重要研究成果之间的关系。如果打乱论文之间的顺序关系,这样的相关性就会立刻消失。

       

图8:在打乱论文发表次序后,三个学科领域中高影响力论文出现概率相关关系的热力图(显然我们无法从图中看到任何关系)


在热手期这一现象中,诺奖科学家也确实表现的优于其他的科学家,热手期的长度是普通科学家的1.93倍。

       

图9:诺奖科学家的热手期持续概率(黄色曲线)与普通科学家(绿色曲线)的对比



谁能摘取璀璨的荣誉桂冠?


时至今日我们知道,科研工作者已经不再是某个躲在阁楼里在危险的边缘疯狂试探的“科学怪人”,科研工作往往需要团队成员的通力合作才能完成。这一趋势也同样存在与获得诺奖的作品中。

       

图10:学术论文合作者数量变化趋势

从图中我们可以看到,无论是获得诺贝尔奖的论文还是普通的对照论文,由一名研究者独立完成的比例大幅减小(深浅两种绿色所表示的曲线)而合作完成科研工作成为趋势。

但是诺贝尔奖显然无法授予每一个人,根据作者的研究发现论文一作获得诺贝尔奖的可能性更高,而且获得诺奖的论文也往往是由小团队撰写的,该现象同时也支持了2019年Nature文章《Large teams develop and small teams disrupt science and technology》的研究结论:小团队更容易做出颠覆式创新。

相关阅读:
Nature 封面文章解读:团队规模与颠覆性创新

       

图11:获得诺贝尔奖的研究论文(黄色)与同一时期近似的研究论文(蓝色)相比,无论是在团队规模(左图)还是在一作比例(右图)上都存在着明显的差异。



永恒的学术追求,不变的学术理想


获得诺贝尔奖对与任何一个科学家来说都可谓是极大的荣耀,但这样的一份荣耀并不一定会像火箭的助推器一般能让科学家的学术影响得以进一步的发展。而实际上,在一位科学家获得诺贝尔奖后的两年内发表的论文影响力反而会下降。

       

图12:获奖前后论文影响力的变化


以获得诺贝尔奖为时间分界点,与获奖前几年相比,获奖后的两年内论文的影响力存在着明显的下降现象,平均降幅为11.1%。对此现象,作者认为:“获得诺奖后,诺奖获得者单独撰写的论文数量急剧减少,团队撰写论文的比例稳步上升,表明在赢得诺贝尔奖之后,团队合作对于获奖者的职业生涯变得越来越重要”。

      

图13:获得诺奖前后四年,团队合作发表论文的比例变化。(黄色是获奖前,蓝色是获奖后)

 

此外,该研究也发现有不少的科学家在获得诺贝尔奖之后,改变了研究方向。以法国化学家让-马里·莱恩(Jean-Marie Lehn)为例,他与美国化学家唐纳德·克拉姆和查尔斯·佩德森一道因“发展和使用了可以进行高选择性结构特异性相互作用的分子”获得了1987年的诺贝尔化学奖。


图14:法国化学家让-马里·莱恩(Jean-Marie Lehn)和他的研究主题网络图 | 左图来源:维基百科


在研究主题网络图中,每一个节点表示一篇论文;节点间的连边则表示两篇论文中存在共同的引用关系。从图中我们可以看出让-马里·莱恩在七个领域都展开过研究。这些研究并不是让-马里·莱恩在同一时期同步展开的。根据作者的分析,让-马里·莱恩在获得诺贝尔奖以后,研究方向发生了有趣的变化。

     

图15:在1987年让-马里·莱恩获得诺贝尔奖以后,他的研究主题发生了变化


然而,作者进一步研究发现获得诺奖后诺奖科学家开展的课题研究并没有获奖前的关注度高,获奖前后新合作者数量、获得的资助也没有明显的区别。值得注意的是,尽管作者发现获奖后诺奖科学家文章影响力下降这一现象和研究方向转移都在同一时间发生(被授予诺贝尔奖),但这并不意味着两者之间存在因果关系。无论如何,这些结果凸显了诺奖科学家的坚定不移的科学努力,他们积极地寻求新的研究方向,而不受日益增加的职责和责任所带来的额外负担的束缚。



我们能找到那些“诺奖预定”科学家么?


通过前文分析我们发现那些建立了伟大功绩的科学家和别的科学家一样需要与他人合作、也存在着热手期。但他们往往在年轻时就做出了令人侧目的研究成果。我们也会发现有些研究刚刚发表就被以所谓的“诺奖级”来加以形容。抛开媒体炒作、舆论渲染的成份以外,这其实意味着我们可以在一个研究项目的得出成果的早期阶段就判断出该研究团队的潜在价值和影响力。


本文所提到的研究也许有助于我们去即时地发现科研领域中的无冕之王,而不再是等待着一年一度的学术界春晚——诺贝尔奖颁奖典礼。



参考报道及相关论文:


[1] 诺贝尔奖得主有哪些异于普通科学家的特质?
https://mp.weixin.qq.com/s/md_1UxgjYoJdhIskmBvCmA
[2]  Li J, Yin Y, Fortunato S, Wang D. Scientific elite revisited: patterns of productivity, collaboration, authorship and impact. J R Soc Interface 2020, 17.
[3]  Li, J., Yin, Y., Fortunato, S. & Wang, D. Nobel laureates are almost the same as us. Nature Reviews Physics 1, 301–303 (2019).
[4]  Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Sci Data 6, 33 (2019).
[5]  Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Harvard Dataverse, https://doi.org/10.7910/DVN/6NJ5RN (2018).
[6]  Liu, L. et al. Hot streaks in artistic, cultural, and scientific careers. Nature 559, 396–399 (2018).
[7]  Wu, L., Wang, D. & Evans, J. A. Large teams develop and small teams disrupt science and technology. Nature 566, 378–382 (2019). 



作者:Leo

审校:李际超、刘培源

编辑:张希妍


集智科学家直播预告


我们邀请到论文第一作者李际超老师,在北京时间5月5日(周二)晚间,做客集智俱乐部直播间,从研究者角度来解读这篇论文。五一假期最后一天,一起追踪科学学前沿!

       


【直播时间】:周二(5 月 5 日)19:00-20:00 
【直播通道】:集智俱乐部B站直播间
https://live.bilibili.com/8091531

【报名互动】:讲座将在 Zoom 会议室进行
通过下方集智斑图系统报名,直播当天“集智俱乐部服务号”将通知你 Zoom 房间号。欢迎在集智斑图网站留言提问,提前让讲者看到!

 

扫描二维码,点击「我要听」,报名zoom会议室直播



推荐阅读


Nature物理:诺贝尔奖更偏好年轻的小团队吗?

集智科学家Nature刊文阐释失败的动力学机制:原来胜败早有信号

Nature人类行为封面:复杂演替系统中的幂律增长模式

Nature通讯:240万名演员职业生涯数据揭露演艺圈“潜规则”

加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!



👇点击文末“阅读原文”报名「我要听」,提前向讲者提问