导语


科研团队的组织结构与创新成果之间存在什么关联?在现代科学的探索活动中,团队的分工合作发挥着不可替代的作用,但人们对于科研团队结构和创新能力的关系仍然缺乏一致的、经数据检验的认识。近日发表于美国科学院院报(PNAS)的题为Flat teams drive scientific innovation的文章,通过研究大量学术论文对应的科研团队结构,发现扁平化团队相比层级化团队更能产生创新性研究成果。在这项最新研究中,研究者设计了能根据论文贡献声明文本,推断科研团队中扮演构思、领导角色的作者比例(Lead ratio,L-ratio)的机器学习模型,并据此分析了超过1600万篇学术论文对应的科研团队结构与多个团队表现指标的关系。分析结果表明,扁平化团队更能促进创新、更有利于培养新生代科研力量、更能保持长期影响力。这些优势在个体层面仍然显著:在同样大小、但结构扁平的团队中工作,个体更可能做出颠覆式创新的成果。这一研究从创新的角度揭示了扁平化科研团队对于科学持续进步的关键作用。


本文第一作者徐丰力是美国芝加哥大学知识实验室和曼苏埃托城市创新中心的博士后研究员。第二作者吴令飞是美国匹兹堡大学计算机与信息学院的助理教授,集智科学家社区成员。通讯作者 James A. Evans 是美国芝加哥大学社会学系教授、知识实验室主任。


论文一作徐丰力博士将在本周六(6月25日)的「计算社会科学读书会」上介绍该工作及相关研究。读书会已经启动报名,持续10-12周,详情见文末。


研究领域:科学学,团队结构,网络科学,计算社会学

刘志航 | 作者

徐丰力 | 审校

邓一雪 | 编辑



论文题目:Flat teams drive scientific innovation

论文链接:https://www.pnas.org/doi/10.1073/pnas.2200927119





1. 科研团队的结构:扁平化vs层级化



 

科研团队是现代科学的重要引擎,近数十年来科学探索的所有领域均观测到了科研团队的日益普遍和规模的稳定增长。尽管团队组织结构在经济、社会各项活动中的作用得到了广泛研究,但由于缺乏大规模的科研团队数据,人们对科研团队结构与科学创新之间的关系仍知之甚少。已有研究表明扁平化团队在产品销售、金融交易和医疗服务等场景中能更好地在团队成员间同步信息、协调注意力、适应不确定性和复杂性,从而取得更好的综合绩效。相比之下,层级化团队虽然加快了自上而下的信息传达效率,但往往会降低团队成员的协调能力,使得团队绩效更差并且收益分配更不平等。

 

那么科研团队的组织结构如何影响科学产出的呢?

 

图1. 扁平化和层级化组织对比图 | 图片来源:Forbes

 




2. 如何揭开科研团队的隐藏结构?




近年来,开放科学运动不断呼吁在学术论文中提供更透明、诚实、公平的学术贡献认定,促进了越来越多的知名期刊要求在发表论文中提供作者贡献声明,以期更准确地反应每位研究者对该学术论文做出的真实贡献。在本项研究中,徐丰力、吴令飞和James Evans三位研究者分析了2003 年至 2020 年间发表在 PNAS、Nature、Science PLOS ONE 上的89,575份学术论文的贡献声明文本,发现了 25 种最常见的学术贡献基于共同出现频率可以分为两大类别:(1)通过构思、指导和论文写作等活动领导科学研究;(2)通过数据收集、分析、学术讨论和论文修改等活动直接或间接地辅助科学研究(图2A)。而科研团队中个体成员在这两类贡献上的不均衡分布可以揭示其隐藏的层级结构。

 

具体来说,扮演领导角色的科研团队成员主要负责:“构思”、“设计”、“指导”、“监督”、“协调”、“解读”和 “写作”等研究活动;扮演直接辅助角色的科研团队成员涉及:“执行”、“分析”、“帮助”、“协助”、”准备”、“发展”和“收集”等研究活动。间接辅助研究活动则往往发生在研究开始之前或完成之后,包括:“参与”、“提供”、”贡献”、“评论”、“讨论”和 “编辑”。基于团队成员汇报的学术贡献,三位研究者计算得出了每篇学术论文(作者数量n)中扮演领导角色的作者比例(Lead ratio,L-ratio),从而量化了科研团队中隐藏的层级结构。其中,L-ratio的变化范围从1/n(最层级化的团队)到1.0(最扁平化的团队),较高的L-ratio表明团队成员在合作中广泛分享构思、设计、领导的机会,而较低的L-ratio表明团队中领导辅助的角色存在显著区隔。

 

图2.  科研团队中的隐藏层级结构。(A)89,575 份学术贡献声明中研究者贡献的共同出现网络,其中存在三个集群,包括“领导”(红色)、“直接辅助”(蓝色)和“间接辅助”(浅蓝色)。箭头代表了团队内影响力的施展方向。(B)通过展示领导型作者和辅助型作者对当前论文和整体科学的不同贡献水平来验证 L-ratio 。(C-D)通过机器学习模型对领导型作者和辅助型作者进行分类(精确率0.79,召回率0.793),并预测团队 L-ratio (皮尔逊相关系数0.66)。(E-F)团队成员的组成(E)和 L-ratio的分布(F),随着团队规模的变化而变化。

 

三位研究者发现,领导型作者的贡献与辅助型作者存在显著区别。领导型作者在引入参考文献、指导课题、作为第一作者引领研究以及作为通讯作者负责沟通方面比团队成员的平均水平高 10-20%。相比之下,辅助型作者对这些任务的贡献比平均水平低 5-10%(图2B)。同时,领导型作者在科研资历、学术影响、研究领域总数、发表文章总数等对整体科学的累积贡献方面也有显著优势。基于这些特征,研究者构建了一个机器学习模型,将学术论文的作者分类为领导型和辅助型角色(图2C),并能准确地预测科研团队的 L-ratio (图2D)。通过这个机器学习模型,三位研究者成功将科研团队 L-ratio 的分析扩展到了1950-2015 年期间发表的16,397,750篇没有贡献声明的完整学术论文样本中。

 




3. 扁平化团队

更有利于科学创新和新生代培养




研究发现,科研团队的层级结构和其科研产出间存在显著的相关性。在更为扁平,L-ratio更高的科研团队中,撰写出高度新颖性论文的概率显著更高。而层级化,L-ratio较低的团队则更可能遵循已有的研究思路,做出颠覆式创新的概率更低(图3A)。此外,领导型作者在 L-ratio 较低的层级化团队中论文发表效率更高,而辅助型作者则与之相反,在扁平化的团队中有更高的发表效率(图3B)。层级化团队的学术成果往往获得更多的短期关注,而扁平化团队的学术成果则在长时间尺度上有更大的影响力(图3C)

 

图3. 层级化团队与扁平化团队在科研产出上的差异。(A)撰写最新颖论文(前10%)的概率(红色)随着 L-ratio 的增加而增加,而遵循已有研究思路的概率(蓝色)则随着L-ratio 的增加而减少。(B)在L-ratio 较高的团队中,领导型作者的论文发表效率较低(红色),而辅助型作者的论文发表效率则有所提高(蓝色)。(C)高 L-ratio 团队的学术成果往往在20年后获得更多的长期引用(红色),但在10年内获得的短期引用较少(蓝色)。

 




4. 扩大科研团队的规模

以提高其创新能力是一个悖论




层级化的科研团队给处于领导地位的成员带来了显而易见的好处,但不一定能最大化辅助成员的生产力和创新潜力。这样的团队结构能提高领导型作者的产出效率,最大化短期引用,从而对冲了他们积累学术资历的风险。在某些情况下,层级化能以研究结果为导向,以最有效的方式分配科研资源,但这种结构往往以牺牲辅助型作者为代价,使他们难有机会扮演领导者角色,产出更少的论文,获得更少的学术认可。控制变量分析表明,当同一研究员从层级化团队转入扁平化团队时,他在相同情景下的创造能力将获得显著提升。

 

在关于团队分工的已有研究基础上,这项研究揭示了科研团队分工中隐藏的层级结构,并比较分析了团队结构对科研团队综合表现的影响。结果表明通过扩大科研团队的规模来提高其创新能力的做法可能会事与愿违。这一发现在科研基金常常以促进科学进步的名义推动科研团队扩大规模的当下尤其值得注意。在过去的半个世纪里,各科学领域中团队的层级化程度均有明显上升, L-ratio在0.5以下的层级团队比例从 1950 年的 50%上升到 2015 年的 70%,而这一趋势在受科研基金资助的科研团队中更加明显。在此背景下,这项研究通过揭示团队结构对创新能力的重要影响,为科研资助机构提供了关于扁平化科研团队的洞见,有力证明了其在培养新一代科学家成长、促进可持续的科学进步方面所发挥的关键作用。



计算社会科学读书会第二季


计算社会科学作为一个新兴交叉领域,越来越多地在应对新冠疫情、舆论传播、社会治理、城市发展、组织管理等社会问题和社科议题中发挥作用,大大丰富了我们对社会经济复杂系统的理解。相比于传统社会科学研究,计算社会科学广泛采用了计算范式和复杂系统视角,因而与计算机仿真、大数据、人工智能、统计物理等领域的前沿方法密切结合。为了进一步梳理计算社会科学中的各类模型方法,推动研究创新,集智俱乐部发起了计算社会科学系列读书会。


新一季【计算社会科学读书会】由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友参与。



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动



推荐阅读



点击“阅读原文”,报名读书会