导语


问渠哪得清如许,为有源头活水来。科研发展绝非无源之水,如果想做出新的科研成果,首先需要了解前人的优秀研究成果。然而另一方面,在科研中却也有不少被埋没后重新拾起的成果,所谓“领先一步是天才,领先两步是疯子”。近日王大顺团队的论文“科学研究中相互关联的影响力”,通过引文网络量化了上述发现,并提出了一个评价论文长久影响力的新指标,可用以提升对高影响力研究本质的理解,并预测未来潜在的高影响力研究。


关键词:引文网络,科学创新,论文影响力

郭瑞东 | 作者

梁金 | 编辑



论文标题:
correlated impact dynamics in science
论文地址:
https://arxiv.org/abs/2303.03646
 
该研究基于 Web of Science 收集的从1970~2014年的3000万篇论文,总引用数83亿次。研究考察一篇论文及其引用文献发表30年后的总引用数,分别表示为c。无论生物、化学及物理,在5、10及15年份之间,论文的参考文献引用数越多,该论文的引用数也越多(图1a-c)
 
然而,如果考察指标变为论文引用文献的平均引用数 ,那么会发现并非站在巨人的肩膀上就能取得成功。论文引用的文献平均被引用数越高,该论文的全周期引用数越低,两者呈负相关,也就是说,那些引用文章本身没什么影响力的研究,由于其创新性,可能在未来获得更多的引用数(图1d-f)
 
图1. 对科研引文网络中引用数相互关系的实证研究
 
之后考察在30年间达到同等引用量,原文和被引用文章发表时间的均值之间的差,该差值越小,说明该研究与之前的研究相隔越短,然而和 1d-f 中描述的趋势类似,都呈负相关(图1g-i)。这意味着一篇文章所引用论文的引用量与其自身总引用量有关,不仅衡量了参考文献的直接影响,而且解释了过去科学文献的新颖性。
 
作者还提出了能同时捕捉论文与其所引用论文之间长期正相关与短期负相关的量化指标,称为论文容量,计算公式如下:

 
通过对1970-2014年之间发表论文的评估,发现论文容量越大,成为引用量排名前五的论文的概率越大(图2a-c)且平均引用数更大(图2d)。这表明论文容量可以反映并预测高水平研究。通过比较诺奖研究论文和其他论文,发现诺奖研究普遍具有更高的容量(图3),也可以说明该指标的有效性。
 
图2:不同学科成为高水平研究的概率/论文引用数与论文容量的关系
 
图3:诺奖研究论文与其它论文的容量累积概率密度
 
该研究是首个系统性量化研究论文与其被引用文章引用数的科学学研究,研究结果挑战了这样一种普遍的观点,即新发现和科学影响之间存在着正相关,然而实际情况更为复杂。长期来看,论文所引用文章的被引用数越高,该论文的全周期(30年之内)被引用数越多,但在发表后最初几年,论文引用数与其引用文章的平均被引用数之间存在负相关。负相关背后的原因,在某种程度上意味着该研究不是追热点,而是比较独创性的研究。
 
在早期阶段就有突破性的论文,一直是具有挑战性的。一篇被高度引用的论文可能不是该领域的开创性工作。通过对引文网络的建模,该研究提供了一个可靠的量化指标,识别有潜力的研究,同时可以为理解复杂网络中度相关性的涌现提供一个通用的机制。
 
未来的研究,可以关注团队大小、成员多样性等指标与论文容量或更一般意义的创新性的关系,并研究某些科研团队持续产生高水平研究的动力学机制。


复杂系统视角下的科学学读书会


科学是研究实践、是理性精神,也是一个由学者、文献、科研项目、科学思想与灵感等一起构成的自组织、自生长的复杂系统。科学学则是一门学科,旨在深入理解科学研究的种种因素并推动科学发展。认知层面上,从复杂系统的视角研究科学,能否给我们带来对科学更深刻的理解?个人科研实践中,什么样的论文高引?怎样规划科研路线?哪些课题大有可为?

集智俱乐部组织了6期「复杂系统视角下的科学学」读书会,讨论科学学相关的科研进展和经典文献,形成了包括数十位相关领域的研究者和硕博在内的科学学社区。欢迎感兴趣的朋友报名加入交流讨论。



详情请见:
复杂系统视角下的科学学——系列线上读书会开放招募



推荐阅读

1. 2600万篇论文引用调查:科研界马太效应加剧,强强联合愈发普遍
2. 扁平化团队更能促进科学创新——PNAS刊文揭示科研团队的结构差异
3. 研究速递:创新更多发生在科研网络的边缘
4. 《张江·复杂科学前沿27讲》完整上线!
5. 成为集智VIP,解锁全站课程/读书会
6加入集智,一起复杂!



点击“阅读原文”,报名读书会