导语


“开放科学”是一个包罗万象的术语,涵盖了几乎所有关于知识创造和传播未来的讨论。这个术语在不同倡导者眼中有着截然不同的理解,因此在同一面旗帜下常常引发争论。这篇发表于2013年的综述文章提出开放科学的五种不同思想学派:公共学派(认为科学需要让更广泛的公众能够接触)、民主学派(认为每个人都应该有获取知识的平等权利)、实用学派(把科学看作一个可以通过某种方式进行优化的过程)、基础设施学派(将开放科学视为一项技术挑战)、测度学派(关注用不同的标准来评估科学影响力),希望能够为当前开放科学讨论中的主要思维模式提供清晰的概述,并为开放科学研究指明新的方向。

研究领域:科学学,开放科学,科学影响力

 Benedikt Fecher、Sascha Friesike | 作者

曹喆 | 翻译

李恺 | 审校



论文标题:

Open Science: One Term, Five Schools of Thought

论文地址:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2272036


目录

摘要

1. 导语

2. 公共学派:让科学普及成为一种义务

3. 民主学派:让研究成果触手可及

4. 实用学派:让研究更高效

5. 基础设施学派:建筑最重要

6. 测度学派:寻找科学成果的替代衡量标准

7. 讨论





摘要




开放科学是涵盖多种关于未来知识创造与传播假设的总称。通过系统性文献回顾,本文构建了一个包含五种开放科学思想流派的框架:基础设施学派(关注技术架构)、公共学派(关注知识创造的可及性)、测度学派(关注替代影响力评估)、民主学派(关注知识的获取途径)以及实用学派(关注合作研究)





1. 导语




如今,似乎没有哪个科学家没有听说过“开放科学”这个术语,它在很多学术会议上都会以某种方式被讨论。“开放科学”已成为科学界的一个热门词汇,学者们达成一致共识:未来的科学需要更加开放。事实上,学者们对“开放科学”这个词本身持有不同的理解——从公众获得公共资助知识的民主权利(如:开放获取学术出版物),到弥合科学与社会之间的鸿沟(如:公民科学),再到开发用于协作的免费工具(如:科学家使用的社交媒体平台),一系列议题都包含在内。从这个角度看,“开放”几乎可以指代一切:知识创造的过程、结果、研究个体,甚至科学研究与社会的关系。


对“开放科学”理解的多样化,甚至是一定程度的模糊性,是可以理解的。毕竟,直接受到影响的利益相关者本身就非常多元化,包括各个领域的研究人员、政策制定者、平台程序员和运营者、出版商以及感兴趣的公众。通过对“开放科学”相关文献进行梳理,我们希望提供一个关于这个新兴议题多元发展方向的概览,总结其中的核心观点和重要见解,并指出值得进一步关注的问题。


在研究开放科学相关文献时,我们发现了其中反复出现的动机和论证模式,这些模式大致形成了五种相对独特的“思路流派”。我们并不声称这些流派之间存在明确的界限,但我们相信,这篇综述能够为当前开放科学讨论中的主要思维模式提供清晰的概述,并为开放科学研究指明新的方向。在这篇文献综述中,我们还希望能识别出五种思想流派中的代表性学者和思想家。


表1包含了五种思想流派及其核心假设、相关利益群体、核心目标,以及为实现这些目标所使用的工具和方法。



需要说明的是,这篇综述不仅参考了传统的学术出版物,鉴于主题的特殊性,还涵盖了科学博客和报纸文章。我们的目标是为读者呈现出一个简明扼要的当前讨论全貌,而非罗列出与此主题相关的所有经过同行评审的文章。接下来,我们将详细介绍这五种思想流派,并为每个流派提供相关的参考文献。





2. 公共学派:让科学普及成为一种义务




公共学派的倡导者认为,科学需要让更广泛的公众能够接触。其基本假设是,社交网络和 Web 2.0 技术一方面让科学家能够开放研究过程,另一方面也使他们能够为有兴趣的非专业人士准备研究成果(见表2)


因此,我们将公共学派的开放性划分为两个不同的方面:一是研究过程的可及性,二是研究成果的可理解性。这两个方面都涉及科学家与公众之间的链接,并将开放性定义为对更广泛受众的一种投入。接下来,将结合相关文献对这两个方面进行更深入的阐述。



研究过程的可及性:人人都能成为科学家吗?


将这个问题看作是一个曾经隐秘的研究过程变得透明并对普通人开放的浪漫科学形象,似乎是颇具情感色彩的。然而,考虑到通信技术不仅允许对研究过程进行持续记录,还能使分散的外部个体参与其中,显而易见的是,曾经被排除在外的公众现在可以在研究中发挥更积极的作用。在这个意义上,衍生出一个流行术语是“公民科学”,即非科学家和业余爱好者参与研究。早在1978年,生物化学家 Erwin Chargaff 就已经使用这个术语来倡导一种由热心业余爱好者主导的科学形式。如今,这个术语的含义没有改变,只是在现代通信技术的背景下被赋予了新的意义。


在 Hand(2010)的研究中,提到了一项叫做Rosetta@Home的分布式计算项目。在这个项目中,志愿者用户在计算机空闲时提供计算能力,以虚拟地折叠蛋白质。相关的软件还允许用户观察他们的计算机如何拉扯和扭曲蛋白质,寻找合适的构型。通过观察这些过程,许多用户提出了加快这一过程的建议。研究团队对这些意外的用户参与做出了反应,应用了一种新的界面,推出了一款名为Foldit的在线游戏,让用户以游戏的形式参与蛋白质折叠。Hand指出:“通过利用人脑解决问题,Foldit将BOINC的分布式计算概念提升到了一个全新的水平。”在这种特定情况下,公民的参与使得研究过程在大规模公众层面上变得更快。在这方面,公民科学是一种“利用”志愿者力量的有前景的工具。然而,也可以对业余爱好者对研究分析部分的实际影响质量提出质疑。Catlin-Groves(2012)与Rosetta@Home项目持相同观点,她预计公民科学在大规模生态或生物多样性监测方面具有最大的潜力。当然,这可能只局限在Catlin-Groves的研究领域(自然科学)及其评论文章所发表的期刊(《国际动物学杂志》)所属领域。但明显可见的是,公民应当被视为一个大规模的志愿者团队,而非真正的科学家。


确实,大多数公民科学项目遵循的是一种自上而下的逻辑,其中专业科学家推动项目进展,主导过程和分析,而业余爱好者并不是合作伙伴,而是免费的劳动力。Irwin(2006)甚至指出,大多数公民科学项目不太可能让业余爱好者具备显著影响研究的技能和能力。Powell 和 Colin(2009)也批评了非专家在研究中的影响力不足:“大多数参与性活动并未使公民超越一次性活动或几周/月的参与,也没有培养公民的参与技能,使他们能够独立地与科学家或政策制定者互动。”


作者进一步介绍了他们自己的公民科学项目——纳米尺度科学与工程中心(NSEC),这个项目最初也只是一个一次性的活动。然而,项目结束后,大学开始与一个公民科学家小组保持频繁的对话。这些公民科学家与领域专家进行交流,参与科学研究。尽管作者并未详细说明公民如何具体影响研究政策,但他们展示了一种兴趣爱好者与专业人士之间的底层互动关系。目前,关于公民在研究过程中的主动参与模型的研究仍然不足。未来的研究可以聚焦于公民参与的新领域(如:“软科学”中的公民科学)或公民科学的替代组织模型(如:需要多少自上而下的组织)


另一个尚未探索的领域是科学的众筹。众筹是一种已经在创意产业中得到广泛应用的融资原则。通过在线平台,个人互联网用户可以向他们选择的项目提案提供资金支持,如果项目获得足够的资助,就可以实现这些提案。捐赠者通常会获得一些非金钱性的回报。类似的模式也可以应用于科学研究:公众直接通过经济贡献来资助研究提案,并以某种形式获得回报(如:访问研究结果)。科学众筹使公众能够直接影响研究的边缘,但几乎不会在研究过程中发挥作用。不过,它可能成为除传统的机构和私人资助之外,推动研究兴趣的一个新决定性力量。未来的研究可以探讨项目提案成功的因素或科学众筹的实际潜力。



研究成果的可理解性:让科学变得易懂


第二个公共学派领域是指科学对更广泛受众的可理解性,这主要涉及科学传播。相较于公民科学关注公众对研究的影响,这个子领域则强调科学家有责任让更广泛的受众理解科学。Tacke(2012)曾在一篇博客文章中热烈地号召,“走出象牙塔!”


在这方面,Cribb 和 Sari 提出了改变学术写作风格的要求。他们认为:“科学在本质上是复杂的,好的学术写作应该简单、干净、清晰。”随着科学受众不断扩大和研究话题趋于专业,学术知识的传播方式也需要随之调整。


在实践层面,许多作者提出了一些科学传播工具。例如,Weller和Puschmann(2011)将Twitter描述为一种合适的工具,可以引导用户获取相关文献,也可以作为替代影响指标的来源。在《(微)博客科学?关于新型学术传播形式的潜力与限制的笔记》((Micro)Blogging Science? Notes on Potentials and Constraints of New Forms of Scholarly Communication)一文中,Puschmann进一步探讨了当今科学家的角色及其沟通需求:“科学家必须能够向更广泛的公众解释他们的工作,以争取政策支持和资金,这些工作成果往往存在不确定性,甚至有风险,并且因科学问题的复杂性而加剧。”作为新型学术公共论证的合适工具,作者提到了科学博客或在会议期间使用Twitter。Grand等人(2012)也指出,通过使用Web 2.0工具并积极进行公众互动,研究者可以成为公众人物及其信息的诚实传播者。


虽然许多研究者已经关注了科学传播的新工具和形式以及观众的期望,但在数字化社会中,研究者角色的变化仍然需要进一步探讨。例如,如何应对一种新的公众压力形式,要求研究者及时沟通并将研究成果以公众易于理解的方式呈现。这就提出了一个合理的问题:研究者是否真的能够在研究复杂问题的同时,将这些研究成果整理成容易理解的信息?还是说,学术知识的经纪人和媒介正在兴起?此外,将研究结果转化为容易消化的内容存在哪些潜在风险?





3. 民主学派:让研究成果触手可及




不同于公共学派倡导大众参与和理解科学,民主学派更加强调研究成果的可获取性。该学派认为每个人都应该有获取知识的平等权利,尤其是对于由国家资助的研究成果,它们都应该免费开放。其中,主要涉及科学数据和学术出版物的开放获取。


开放数据


关于科学中的开放数据,Murray-Rust(2008)将“开放”前缀的含义与开源软件的常见定义相关联。在这种理解下,科学数据的使用权不应归于学术期刊,而应属于科学共同体:“我坚信这类数据理应属于社区,而不是出版商,因此开始引起对这一问题的关注。” Murray-Rust 认为,期刊对文章的补充信息(通常是数据)声明版权是一种障碍,这样做阻碍了可能的数据再利用。他指出,“关键是要认识到,补充信息通常由原作者制作,在许多情况下是计算机的直接输出。审稿人可能会使用这些数据来评估出版物的科学有效性,但我不知道有哪个编辑要求对补充信息进行加工处理”。作者支持这样一种观点:文本、数据或元数据可以在无需期刊进一步明确许可的情况下被重复使用(见表3)。除了验证研究之外,期刊没有必要对补充信息声称拥有权,而其他研究人员则有这种需求。



根据 Murray-Rust 的理解,数据不应该是“免费的”,而应该是“开放的”,以便在原始创作者未预见或未预料到的研究中被重新使用。在科学领域中,开放数据的理念是以研究者为中心的;它创造了一种环境,促进了有意义的数据挖掘和来自多篇论文的数据聚合。简单来说,开放数据可以促进研究之间的协同效应,并防止数据收集的重复。在这方面,Murray-Rust 不仅批评了当前的期刊系统和对支持信息的隐瞒,还暗示了开放数据的生产潜力。不过,需要指出的是,Murray-Rust 所描述的协同效应潜力主要适用于自然科学(或至少是数据相对标准化的研究领域),或者是那些中间研究产品(如数据)对其他人有生产性用途的领域。


类似于 Murray-Rust 的观点,Molloy(2011)批评了当前的期刊系统,认为这个系统阻碍了科学数据的最大传播。她详细阐述了当前期刊系统固有的障碍:“这些障碍包括无法访问数据、出版商或数据提供者施加的使用限制,以及数据发布形式难以重用,例如,数据注释不充分或‘隐藏’在无法修改的表格中,如PDF文件。”她建议按照开放知识基金会的开放性定义处理数据,即数据应以整体形式提供,复印成本不超过合理范围(最好通过下载),并且格式方便且可修改。


除了 Murray-Rust(2008)和 Molloy(2011),Vision(2010)以及 Boulton 等人(2011)首次将开放数据的责任归咎于研究人员。Vision引用了Campbell等人(2002)的一项研究,该研究表明,即使是在被要求的情况下,也只有四分之一的科学家会共享他们的研究数据,而拒绝分享数据的最常见原因是所需的工作量。对此,Vision提出由数据创建者自己维护的学科数据仓库。这样,科学家们只需上传一次数据,而不是在每次请求时都要处理。尽管Vision强调了最小化作者提交负担的必要性,但并没有建议具体的激励措施来鼓励科学家上传数据。而在关于科学家分享行为的实证研究中,Haeussler(2011)发现,数据分享确实与某种形式的回报密切相关。


尽管开放数据拥有巨大的潜力,但为什么尚未取得突破性进展?是期刊系统及其支持的信息实践存在问题?是研究人员不愿意共享数据?还是缺乏有效的激励机制?又或者是数据存储库过于复杂?在开放数据的障碍问题上,存在明显的认知分歧,有必要对这个问题进行进一步的实证研究。未来的研究可以关注研究人员对开放数据的抵触、期刊及其支持材料的作用,或者设计合适的在线数据存储库和元数据结构。开放数据面临的种种障碍也说明,对这一问题的研究需要采取整体性的视角。


开放获取学术出版物


当谈到学术出版物的开放获取时,争论往往不太以研究者为中心。Cribb 和 Sari(2010)主张科学知识的开放获取是一项人权(见表4)。他们认为,知识的创造和分享之间存在差距:虽然科学知识每五年就会翻倍,但对这些知识的获取依然有限,导致世界某些地区仍然处于信息闭塞状态。他们指出:“随着人类迈入21世纪,许多学者指出一个令人担忧的趋势——世界正在分化为那些能够轻松获得知识及其成果的人和那些无法获得的人。”对他们而言,免费获取知识是人类发展的必要条件。在图书馆和信息科学领域的开放获取研究中,Rufai 等人(2012)持相同观点,认为经济低收入国家“必须进入开放获取的领域”。在金融危机时期,开放期刊系统以及由此带来的平等获取知识的机会可能是一个合适的解决方案。此外,Phelps 等人(2012)认为开放获取学术出版物是发展的催化剂,而仅限于少数订阅者的有限获取则是发展的障碍。他们一致将开放获取定义为“尽可能广泛的信息传播”。



除了发展的理由,Phelps 等人(2012)提到了一种相当普遍的开放获取逻辑:“有观点认为,由纳税人资助的研究应该免费向公众开放,以避免纳税人实际上为研究支付两次费用。”这里的“为研究支付两次费用”指的是,公民不仅间接资助了政府资助的研究,还需要为从公共图书馆获取相关出版物支付费用。


Carroll(2011年)也批评了在数字技术和网络不断发展的时代,传统的订阅制学术期刊效率低下的问题。他认为,随着互联网的普及,期刊的价格本应大幅下降,但实际上却大幅上涨。他进一步指出,“开放获取”将改变期刊出版中的权力平衡,极大地提高学术交流的效率和效果。通过摆脱订阅费的资金模式,“开放获取”重新调整了版权的分配,使得出版物可以被广泛再利用,同时也确保了作者和出版商能够获得他们应得的荣誉。





4. 实用学派:让研究更高效




实用学派的支持者认为,开放科学是一种使研究和知识传播更加高效的方法。换句话说,开放科学把科学看作一个可以通过某种方式进行优化的过程。例如,可以通过将知识创造过程模块化、开放科学价值链、引入外部知识以及利用在线工具进行合作来实现优化。在这种情况下,“开放”这一概念与开放创新理念中的公共生产过程非常相似。



Tacke(2010)在研究开放创新与开放科学的关系时,提出了一些有趣的观点。他把开放科学的理念与开放创新的思路相结合。就像开放创新一样,作者将外部知识引入生产过程的“外向型”原则和从以往封闭的生产过程中产生的溢出效应的“内向型”原则应用于科学研究。在这个过程中,Web 2.0被视为一个促进合作研究的沃土,而“集体智慧”被认为是解决当前科学问题的必要条件。他指出:“仔细观察科学现象会发现类似的情况:问题变得更加复杂,往往需要共同努力才能找到解决方案”。


Tacke 引用了 Hunter 和 Leahey(2008)的研究,他们考察了过去70年合作趋势的变化。研究发现,在1935年至1940年期间,只有11%的文章是由多位作者合作完成的,而在2000~2005年间,这一比例几乎达到了50%。Tacke认为,这是由于研究问题的复杂性随着时间的推移不断增加,这些问题只能通过多位专家的共同研究来解决。事实上,Bozeman 和 Corley(2004)在一项关于研究者合作的实证研究中发现,合作研究的一些最常见原因是获取专业知识、汇聚不同类型的知识以及提高生产力。除了研究问题复杂性增加和研究者对生产力的追求,Tacke 还指出了技术进步对合作的推动作用。Web 2.0 让几乎所有人都可以参与知识的创造。因此,除了生产力的追求和研究过程的复杂性增加之外,出现的沟通和合作支撑技术也应被视为促进合作研究的重要因素。


与之相应地,Nielsen(2012)认为,开放性预示着科学实践在不久的将来将发生一个关键性的转变——从封闭式转变为协作式。他通过引用多个集体智慧的例子来支持这一观点,比如“多面体”项目(Tim Gower 在他的博客上发布了一个数学问题,然后由一些专家共同解决)或“银河动物园”项目(一个在线天文学项目,业余爱好者可以加入,帮助进行形态分类)。他强调了在线工具在这一发展中的关键作用:“表面上看,在线工具使我们集体更聪明的观点,与当前某些圈子中流行的‘互联网降低了我们的智力’的观点相矛盾”。


Nielsen展示的合作知识发现的例子,让我们可以推测合作研究在规模和质量上的广泛多样性——无论是像“多面体”项目那样的小规模专家合作,还是像“银河动物园”项目那样的大规模公众合作。Nielsen还强调了开放数据的重要性,并提倡全面的科学共享:“我们需要想象一个科学信息共享已经实现的世界。在这个世界里,所有的科学知识都在线提供,并且以计算机可以理解的方式呈现。”显然,Nielsen对开放科学的愿景是建立在一些条件之上的,比如更广泛地使用在线平台、让非专家参与发现过程,以及科学家愿意共享的态度。Nielsen的集体研究概念也与科学实践中的许多深刻变化相关,更不用说计算机能够理解所有格式知识的技术能力了。


Haeussler(2011)在一项针对科学家的实证研究中,探讨了研究人员的信息共享行为。她运用社会资本理论的观点来解释,为什么即使在个人需要付出一定成本的前提下,人们仍然愿意分享信息。她提出的开放科学理念与信息的自由共享紧密相关,曾在研究中提到:“我的研究表明,与社会资本相关的因素会影响所请求信息的竞争价值对科学家分享或保留信息决策的影响。”如果科学家期望询问者能够回报他们,他们更有可能分享信息。这意味着,科学家的分享行为并不是纯粹的利他行为——这在开放科学的文献中经常被视为理所当然。相反,它更多地建立在一种非金钱性的回报体系上。这些发现引发了一个问题,即如何加快信息共享的过程,从而使得开放科学的基本要求得以实现。科学实践的改变需要科学文化的根本性变革;在上述情况下,就是激励信息共享的机制。


Neylon和Wu(2009)在他们关于开放科学要求的普及文本中,更详细地讨论了有助于加速科学发现的Web 2.0工具。他们认为,这些工具——无论是社交网站、电子实验室笔记本,还是受控词汇——都应该帮助科学家完成他们已经在做的事情,而不是设计者认为他们应该做的事情。Web 2.0工具的实施应该与现有的科学实践紧密相关。在这方面,科学工具只有在与研究实践结合的情况下才能促进科学发现。作者认为,最明确的目标是“使捕捉研究记录变得更容易,以便将其纳入论文并从中链接”,但作者并没有进一步阐述如何将潜在的工具集成到研究者的工作流程中。


本章提到的作者展现了Web 2.0时代科学实践的前瞻性观点。未来的研究应进一步关注开放科学的结构性需求、激励科学家分享信息的潜在动因,或者将软件工具纳入现有实践中的可能性。关于开放科学的预期一致性仍然缺乏实证研究。





5. 基础设施学派:建筑最重要




基础设施学派将开放科学视为一项技术挑战(见表6),关注支持新兴研究实践的技术基础设施,主要包括软件工具、应用程序和计算网络。这一主题的文献通常以实践为导向,并针对具体案例展开,重点在于促进特定研究实践的技术要求(例如开放科学网格)



在2003年,Nentwich首次提出了“网络科学”这一术语,用来描述将信息和通信技术应用于科学研究的趋势。作者将网络科学置于Web 2.0的背景下,既指代了促进科学家之间合作与互动的技术进步,也提到了类似于开源开发的文化变革。前文讨论的开放科学实践大多可以理解为个人与现有工具之间的相互作用。在这方面,技术基础设施几乎是本章所有识别出的学派中的一个循环元素。试想一下,如果没有在线数据仓库,就没有开放数据;没有基于网络的实时编辑器,就没有协作写作。无论以何种方式,正是新技术的可能性改变了既有的科学实践,甚至创造了新的实践,例如替代指标或科学博客。


尽管如此,由于在开放科学的背景下,呈现出明显的基础设施趋势,我们决定将“基础设施学派”作为一个独立且超越性的思想体系纳入考虑。在本章中,我们将不列举众多的开放科学项目及其技术基础设施,而是聚焦以下两方面:
  • 分布式计算:利用许多用户的计算能力进行研究
  • 科学家的社交与协作网络:促进研究人员之间的互动与合作


分布式计算


分布式计算应用于科学的一个例子是“开放科学网”(Open Science Grid)。这是一个位于美国的大型分布式计算基础设施,支持许多不同的高吞吐量科学应用,通过这些应用形成多领域集成的分布式科学系统(Altunay等,2010)。简单来说,开放科学网通过将多台计算机连接到一个高性能计算网络,来支持大规模、数据密集的研究项目,这些独立的计算机通过互联实现高吞吐量的目标。开放科学网为科学家和研究人员提供了一个合作研究环境,使他们可以共同解决分布式计算中的问题。


因此,仅将开放科学网的功能局限于其计算能力是不完全准确的,因为它还提供了存储资源、软件堆栈,并使用了通用的操作服务。然而,它的核心优势在于许多单独计算机的计算能力,这使得科学家们能够实现数据密集型的研究项目、高吞吐量处理和共享存储。因此,使用开放科学网的典型项目通常是CPU密集型的,包含大量独立的任务,需要大量的数据库访问,以及来自远程服务器的大量输入和输出数据。


Foster(2003)认为网格计算作为关键的计算基础设施,其重要性日益增加:“在问题日益复杂、理解和技术不断进步,以及互联网出现的推动下,当今的科学不仅依赖于个人实验者和理论家的努力,还依赖于计算、数据分析和协作。”Foster进一步强调,在分布式、通常是松散协调和虚拟的团队中,实现大规模资源共享的潜力,并非全新的概念。早在1968年,Multics操作系统的设计者便设想了一个作为公共服务运行的计算设施。不过,Foster认为,新的变化在于技术进步带来了这些网络公共服务的性能提升。


分布式计算让科学家几乎不再依赖单个计算资源来进行研究。这就像是给研究者提供了一个高效的计算网络,让他们不受限于本地的资源。考虑到大数据的重要性,科学计算将成为未来科研的重要基础设施。可以说,科学计算的目标就是通过将许多独立分散的计算机互联起来,提高整体的计算性能。


社交与协作网络


第二个,更加以研究者为中心的基础设施趋势,专注于那些促进本地分散的个体之间互动的平台,并通过实施Web 2.0工具来实现协作。以myExperiment为例,De Roure等人(2008)提出了社交虚拟研究环境(Social Virtual Research Environment, SVRE)的四个关键功能:
  • 首先,SVRE应当方便管理和分享研究对象。这些研究对象可以是研究人员使用和重复使用的任何数字商品(例如方法和数据)
  • 其次,它应当具备激励机制,鼓励研究人员公开他们的研究对象。
  • 第三,环境应当是开放和可扩展的——这意味着软件、工具和服务可以轻松集成。
  • 第四,它应当提供一个实施研究的平台。在作者看来,实施研究是使平台成为真正的研究环境的关键。研究对象不仅被存储和交换,而是用于实际的研究过程(De Roure等,2008)


当然,这种对SVRE的描述并不排除大规模计算(实际上第三项能力支持整合额外的服务)——不过,它明确地聚焦于研究人员之间的互动和合作。此外,作者对“虚拟社会研究”的定义显然包含了大量的额外工具和服务,以支持协作研究。这意味着(直接或间接地)存在集成的大规模数据存储库,使研究人员能够首先将他们的数据公开。


Nentwich 和 König(2012)在本书中也有提到,他们指出了科学家们可以使用的其他社交网络平台,如 ResearchGate、Mendeley、Nature Networks、Vivo 和 Academia.edu。作者表示,目前的学术社交网络主要是为科学家提供服务的,并且尚未出现集中于单一平台的趋势。并且,科学家们也在使用一些多功能的社交网络(如Facebook、LinkedIN或Xing),这些平台被用于建立主题专家组(不仅仅是科学家),进行自我营销或交换工作机会。在《学术界进入 Facebook?社交网络在学术领域的潜力》(Academia Goes Facebook? The Potential of Social Network Sites in the Scholarly Realm)一文中,作者进一步详细阐述了社交网络对科学家的作用,包括用于科学合作的工具,如合作写作环境。





6. 测度学派:寻找科学成果的替代衡量标准




测度学派关注的是用不同的标准来评估科学影响力。影响因子,一项衡量期刊影响力的指标,曾一度对科研人员的声誉建立、资金获取和职业发展有着决定性的影响。因此,在关于开放科学和未来科学如何进行的讨论中,存在着一个重要问题:在数字时代,我们该如何衡量科学影响力


测度学派的倡导者对当前的影响因子提出了以下担忧:
  • 同行评审过程耗时,这个过程通常需要很长时间来完成。(McVeigh, 2004; Priem和Costello, 2010)
  • 影响因子与期刊有关,而非直接与文章相关。这意味着,影响因子的高低更多地反映了期刊的声誉,而不是单篇文章的质量。(McVeigh, 2004)
  • 新的出版形式很少能获得影响因子。例如,在线开放获取期刊、博客等新兴出版形式通常不符合期刊格式,因此无法计算影响因子。(Weller和Puschmann, 2011; Priem等, 2012; Yeong和Abdullah, 2012)


测度学派主张采用一种更快的影响力测度方法,除了传统的出版物,还包括科学贡献在社交网络上的覆盖情况。其基本原理是:随着学术工作流程越来越多地迁移到网络上,曾经不被察觉的行为,比如阅读、书签收藏、分享、讨论和评价,都在网上留下了痕迹,这为衡量科学影响力提供了新的依据。这种新的影响力测度方法被统称为“替代计量”(altmetrics)(见表7)



Yeong和Abdullah(2012)指出,altmetrics(替代计量)与webometrics(网络计量)不同。作者认为,webometrics 相对较慢、结构松散且封闭,而 altmetrics 依赖更广泛的衡量指标,包括推特、博客、讨论和书签(例如mendeley.com)。altmetrics 不仅关注最终的成果产出,还关注研究和合作的过程,从而衡量不同形式的影响力和使用模式。不过,作者没有进一步说明如何评估科学过程而非成果。一种可能性是衡量在社交网络中出现的新形式的研究文档(例如科学博客)或数据集(例如开放数据)的影响。


Priem 等人(2011)提到,替代计量指标的可能数据来源包括网页、博客、下载量、社交媒体(如 Twitter),以及互动式参考管理工具(如CiteULike、Mendeley和Zotero)。通过对214篇文章的案例研究,他们提出了两个开源在线工具——CitedIn和Total Impact,作为衡量科学影响力的潜在替代方案,因为这些工具基于来自更广泛学术出版物数据。同时,他们强调,目前仍需要对替代计量指标的可比性进行研究。


尽管许多作者已经认识到在数字时代需要新的衡量标准,并且需要一种比网络计量学更结构化和更迅速的替代方案(Yeong和Abdullah, 2012),但对此问题的研究仍处于起步阶段。目前几乎没有关于替代计量指标可比性的研究,更没有关于它们潜在操控和网络效应的研究。此外,替代计量学在科学界尚未得到广泛应用,这引发了一个问题:是什么阻碍了它们的广泛实施?一个可能的原因是现有期刊系统的紧密结合,包括其归档、注册、传播和认证学术知识的基本功能(Priem和Hemminger, 2012)。因此,未来的研究还应关注科学的整体过程、其变革力量以及相应的限制。





7. 讨论




“开放科学”是一个包罗万象的术语,它涵盖了几乎所有关于知识创造和传播未来的讨论。这个术语在不同的倡导者眼中有着截然不同的理解,因此在同一面旗帜下常常引发许多争论,但这些争论的动机和目标各不相同。尽管本文暗示了“开放科学”这一术语在概念上存在一定的模糊性,但我们并不提倡一个精确定义的概念,因为这样做可能会从一开始就阻碍富有成效的讨论。因此,我们提出五种(或多或少)不同的学派来概述主要的讨论并阐明它们的核心目标和论点,这种分类可以作为组织全面综述和定位常见论点的起点。


尽管开放科学从最广泛的意义上涵盖了有关未来知识创造和传播的所有内容,但本文描述的所有观点并不一定都是新颖的。事实上,许多需求和论证在互联网和数字时代到来之前就已存在。有些人甚至会认为,科学本质上就是开放的,因为研究的目的就是要发布结果,从而使知识公之于众。然而,现代通信技术确实为科学带来了新的活力。合作研究形式的兴起、共同署名的科学文章数量增加、社交网络上的新型出版形式、各种在线研究工具的出现,以及开放获取期刊的出现,都见证了“新时代的曙光”。


科学在未来几年无疑面临着巨大的挑战。知识的创造和传播方法的创新与深刻的系统性变革息息相关,例如科学影响力的变化、研究者日常实践的改变(比如新工具和方法的应用)、出版行业的变化(比如如何应对替代出版形式)等。对此,本文不仅应当深入探讨不同开放科学领域中的各种发展,还应当揭示这些变革的复杂性和相互关联性,从而强调研究未来研究的整体性方法的必要性。例如:如果没有相应的报酬,如何能够主张广泛实践开放数据?如果平台使用起来过于复杂,如何期望研究者进行在线协作?如果写博客对研究者的声誉没有影响,为什么研究者还要投入时间和精力去写呢?


本文所述的各项进展标志着科学环境的深刻变化。尽管这些变化的主要伴随现象(如开放获取、开放数据、公民科学或合作研究)对于数字时代的知识产业来说可能已经迫在眉睫,并且受到大多数从业者的欢迎,但它们仍然依赖于全面的实施。这包括精细的研究政策、便捷的研究工具,最重要的是,研究人员的积极参与。在许多情况下,开放科学就像是传说中的电动车——确实是一项明智但成本高昂的选择,最好还是停在邻居的车库里;虽然大家都同意这一点,但却希望其他人先迈出第一步。



面向未来的科学学读书会招募中


科学是研究实践、是理性精神,也是一个由学者、文献、科研项目、科学思想与灵感等一起构成的自组织、自生长的复杂系统。科学学这门学科,旨在深入理解科学研究的种种因素并推动科学发展。科学的迅猛发展在积累科学知识的同时,也遭遇诸多社会、伦理、政策问题:开放科学的范式如何影响科学研究的实践?阶层、性别、种族、国家等视角如何揭示科学不平等的起源?期刊编辑和审稿人如何塑造当今的科学活动?科学人口结构、人才激励、科技人才流动如何影响科学发展?AI大模型如何重塑科学研究的各个环节?

为了思考和回应科学的多元化挑战、科学开放性面临的危机,以及新兴技术对科学的冲击,集智俱乐部联合美国匹兹堡大学博士后崔浩川、东南大学副研究员孙烨、田纳西大学信息学院助理教授李恺、纽约大学阿布扎比分校博士研究生刘逢源、南京大学地理与海洋科学学院研究员古恒宇,共同发起「面向未来的科学学读书会」,这是继「复杂系统下的科学学读书会」之后的新一季科学学读书会。读书会从2024年8月25日开始,每周六晚19:00-21:00,持续时间预计8-10周。欢迎感兴趣的朋友报名参与!


详情请见:面向未来的科学学读书会:探索开放科学范式,揭示科学不平等的起源



推荐阅读
1. Science长文综述:什么是科学学
2. 3700万篇论文构建学科网络,揭示全球科学产出的隐藏结构
3. PNAS 速递:同行评审机制鼓励新颖研究
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5. 龙年大运起,学习正当时!解锁集智全站内容,开启新年学习计划

6. 加入集智,一起复杂!



点击“阅读原文”,报名读书会