集智

导语

科学资助者,行业和公众都要求科学应该变得更具冒险精神,更加别出心裁且更具跨学科性。最近发布在arXiv上的一篇预印本论文却指出,在过去的几十年中,主流论文的比例增加了,别出心裁的论文的比例下降了,而跨学科论文的比例却保持不变。这种变化的原因是什么,它是否会对科学发展造成影响呢?本文将尝试讨论。

当前科学生产中的激励机制可能遏制科学进一步发展的一个因素。目前,科学界普遍采用的激励机制基于生产力因素,例如论文数量,质量因素(引用次数等)和累积指标(h因子及其变化等)。这些指标对于主流论文是有利的,而对于跨学科论文和出心裁(out-of box)型的论文却没那么友好。
在这种指标体系下,与难以理解并可能与学术圈的现有标准相抵触的新颖创意相比,增量式主流创意所面临的阻力要小得多。这些指标刺激了人们发表接近主流的论文,因为他们对职业的重视程度超过了对科学的纯粹进步的热爱。当前的激励机制不适合科学的进一步发展,最近有学者通过构建文献耦合网络(bibliographic coupling network),对这一现象做了更加深入的研究。
论文题目:
Theroleofmainstreamnessandinterdisciplinarityfortherelevanceofscientificpapers
论文网址:
https://arxiv.org/abs/1910.03628

如何识别出主流论文,跨学科论文和别出心裁论文

研究者使用1991年在美国物理学会 Physical Review 系列的 6 种期刊(ABCD 四个分刊以及 Physical review letters 和 Reviews of modern physics)上发表的所有论文数据,构建了文献耦合网络,如图 1(a)所示。
在文献耦合网络中,论文表示为节点,如果两个论文都引用了同一篇论文,则在两个论文节点之间定义一个连接, 连接的权重是两篇论文的参考文献列表的重叠部分长度。
文献耦合网络清楚地展示了相似科学领域的集群,也展示了不同期刊的领域偏好。图中,PRA 杂志用紫色表示,PRB 杂志用松绿色表示,PRC 杂志用蓝色表示,PRD 杂志用绿色表示,Physical review letters 用红色表示,Previews of modern physics 用棕色表示。
集智

图 1 (a)文献耦合网络;(b)文献耦合网络局部图,其中各节点的大小代表论文2年后的引用率;(c)文献耦合网络局部图,其中各节点的大小代表论文20年后的引用率

通过集群显现出的模式,研究者将论文划分为三种类型:主流论文跨学科论文别出心裁的论文在文献耦合网络中,跨学科的论文通常“链接”来自不同领域的作品,处在集群和集群之间; 别出心裁的论文出现在集群的外围,而主流论文通常出现在集群中心附近。
研究者截取了原始文献耦合网络的一部分,如图1(b)和1(c)所示,分别探究论文发表2年后和20年后年引用率的变化,图中节点的大小代表论文的年引用率。
显然,一篇论文在20年后的年引用率要比出版后前2年的年引用率要低。从长远来看,图 1(c)中引用率较高的论文出现在集群的外围(别出心裁的论文)和集群之间(跨学科论文),而集群中心的论文(主流论文)的引用率却下降得很明显。例如图中《Phycical Review Letters》的主流论文(红色)获得了较高的短期关注,但从长远来看不再占主导地位,而两篇综述(review)论文(棕色)却有着相反的趋势。
上述的引用变化,也就是科学进步的过程,是如何发生的?图2的示意图形象地描述了这种现象。

集智

图 2 “科学进步过程”的示意图

研究者把对科学(创新或突破)做出重大贡献的论文,都用节点表示。红色节点是已经发表的发现,灰色结点是迄今为止尚未发现(但却是可被发现)的科学事实。
黑色箭头指示哪个工作影响了哪个工作。绿色虚线连接了“可能的邻近点”,这是在给定当前知识状态下,可以在下一个时间段内发现的科学事实的集合,即下阶段的红色节点的集合。黑色虚线表示一旦取得新的进展,就打开了可能性:一旦有了新发现,对应的灰色节点就会变成红色节点。
增量式或小心翼翼的主流研究则如图2(b)所示, 它显示了图(a)中的新知识发现的后“邻域爆炸”现象。这和文献耦合网络中观察到的现象是一致的。

文献耦合网络上的时间趋势

集智

图 3 (a)各论文到其最近的聚类中心的最短距离分布;(b)各论文节点的度分布

衡量跨学科性的一个指标是论文到其最近的聚类中心的最短距离。据此,研究者调研了文献耦合网络随时间变化的趋势,如上图所示。
研究者统计出1981年,1991年和2001年,各论文到其最近的聚类中心的最短距离分布。发现随着时间的推移,分布向左移。这三年的分布在形状上很相似(尤其是分布曲线尾部的形状),这意味着存在论文向集群中心移动的趋势,但这会牺牲位于外围的论文的比例。
然而,位于集群之间的论文比例却没有发生变化。图3(b)显示了与图(a)对应的节点的度分布。从图中可以看出,度的分布向更高的方向变化。这意味着论文变得与其他论文越来越相似。
这意味着,随着时间的流逝,集群中心的论文变得越来越多,而衔接论文(位于集群之间的论文)的相对贡献却没有随时间发生变化。

论文引用次数的分布模式

集智

图4 (c)在不同的论文与最近聚类中心最短距离下,1991年发表的论文20年引用次数分布(d)在不同的度下,1991年发表的论文20年引用次数分布(e)“大距离”和“小距离”论文的20年引用次数的分布(f)“度大”和“度小”论文的20年引用次数的分布

研究者以1991年发表的论文为例,统计出三种不同分位数的论文,其20年引用次数随着到最近聚类中心的最短距离变化的曲线,如图 4(c)所示,图4(d)则是随着论文的度变化的曲线。
研究者描绘了这些发表于 1991 年的论文,在20年后引用次数相对于到最近聚类中心的最短距离分布的散点图,如图 4(c)所示,图(d)则为引用次数相对于论文度分布的散点图。研究者使用论文引用次数的“分位数”来追踪引用次数随最短距离变化的趋势。所谓“分位数”是指将一个随机变量的概率分布范围分为几个等份的数值点,50%分位数即平常所说的中位数。图(c)和图(d)分别显示了引用次数的50%、70%和90%分位数点在两种不同分布下的变化趋势。
从图中可以看出,50%分位数(蓝色),70%分位数(红色)和90%分位数(绿色)随距离和度值的增加而显著增加,这不仅意味着别出心裁的论文和跨学科的论文似乎得到了奖励(图4(c)中,距离较大时引用依然很高),而且意味着主流出版物在引用方面也得到了奖励(图4(d)中,度越大,引用越高)。
图4(e)显示了两类论文的20年引用次数的分布:到最近聚类中心距离较短的论文(红色),以及距离较远的论文(蓝色),引文分布明显向更大的中位数变化。图4(f)则显示了度值高(红色)和度值低(蓝色)论文的20年引用次数的分布。图4(f)也显示出了相同的模式:对于度值高的论文,引文分布具有较高的中位数。

用熵来衡量论文的跨学科性

集智

图 5 (a)论文20年后引用次数相对于PACS熵分布的散点图;(b)PACS熵相对于论文的参考列表分布的散点图;(c)论文20年后引用次数相对于PACS熵和参考列表长度比值的分布散点图

衡量跨学科性的另一个指标是PACS熵(根据物理与天文学分类纲要(Physics and Astronomy Classification Scheme),计算论文的引文的多样性,该值称为PACS熵)。图 5(a)显示了论文20年后引用次数相对于PACS熵分布的散点图,并用三种颜色的线描绘了引用次数的0.5、0.7和0.9分位数点的变化趋势。
研究者发现,PACS熵与论文的参考列表长度之间具有很强的相关性(ρ= 0.61),如图5(b)所示。为了控制参考列表长度对实验的影响,研究者又画出了该引用次数相对于PACS熵和参考列表长度比值的曲线图,如图5(c)所示。结果呈现出相反的趋势,各分位数都在下降,这表明PACS熵的解释能力可能会因参考文献的数量而大打折扣。

学科融合正在变得愈发普遍

最近,一篇发表在《Nature》的论文在跨学科问题上却有着不同的发现。论文指出,和以往相比,现在的科研论文所参考的资料来自更多的科研领域,论文的参考文献和引用的学科多样性都在增长,即学科交叉性正在增长,如图 6 所示。

论文题目:

Narrow work has broad impact

论文地址:

https://www.nature.com/articles/d41586-019-03308-7

集智

图 6 参考文献和引用的学科多样性随时间的变化曲线

然而,近几十年来新发表论文的跨学科性却下降了。如图 7 所示,泛科学期刊的下降速度超过了整体水平,跨学科性的下降可能是因为学科交叉性的上升。随着研究人群、科研论文以及知识的增加,不同学科会变得愈来愈融合。

集智

图 7 论文的学科差异性随时间的变化曲线

改变激励机制,促进科学发展

上面的结果表明,主流论文确实是从短期引用的绝对数量上获得回报,但从长远来看,许多别出心裁的论文和跨学科论文的表现更好。与外围论文或集群之间的论文相比,集群中心附近的引文率随时间推移呈下降趋势。从时间趋势看,从1981年到2001年,主流论文的比例显著增加,而跨学科论文的比例实际上保持不变。别出心裁的论文数量在减少,而主流论文却在增加。
导致这一现象的原因可能与当前的论文激励机制有关:当前的激励机制几乎专门奖励主流科学的生产。被引用次数或 h指数的重要性日益提高,这些指标刺激了人们发表接近主流的论文。此外,进行突破性研究的风险成本太高,即便社会对这种高风险/高回报的科学有很高的要求,它在学术界的发生率却非常低。
为了避免本文所报道的研究越来越趋于主流化,有必要考虑如何激励别出心裁的研究、跨学科的研究以及能够实际解决问题的研究。这种新的奖励机制可以考虑采用本文研究中提到的指标,例如论文到集群的距离,中介中心性的度量以及文献耦合网络中的度。不难想象,这会激励科研工作者对除自己以外的其他科学领域的发展保持开放的态度。

作者:鄢鹏高

审校:Leo

编辑:张希妍

推荐阅读

科学家为什么钟情艺术?因为数学和绘画、音乐有相似的美感

几何为万物赋能——建筑、医疗、动漫、游戏……

Nature 研究:所谓黄金年龄在科学家和艺术家身上可能并不存在

美可以度量吗?一种用复杂度指标刻画艺术品美感的尝试

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智