本次分享围绕开放科学背景下的数据质量与论文撤稿进行展开。在数据质量部分,讲者以大型免费学术资源索引OpenAlex的机构信息缺失现象可能原因、潜在影响和应对为例探讨开放科学背景下普遍存在的数据质量问题。在论文撤稿部分,讲者希望围绕研究开放科学是否能促进问题论文撤稿追问其中的深层原因与运行机制。最后嘉宾将会围绕上述分享内容进行圆桌讨论,希望能激发大家的思考与科研灵感。
为了思考和回应科学的多元化挑战、科学开放性面临的危机,以及新兴技术对科学的冲击,集智俱乐部联合美国匹兹堡大学博士后崔浩川、东南大学副研究员孙烨、田纳西大学信息学院助理教授李恺、纽约大学阿布扎比分校博士研究生刘逢源、南京大学地理与海洋科学学院研究员古恒宇,共同发起「面向未来的科学学读书会」,这是继「复杂系统下的科学学读书会」之后的新一季科学学读书会。读书会从2024年8月25日开始,每周六晚19:00-21:00,持续时间预计8-10周。欢迎感兴趣的朋友报名参与!
分享简介
开放科学势不可挡,对高质量开放数据资源的需求也愈发强烈。2022年1月,大型免费学术资源索引OpenAlex上线,该平台集成了Microsoft Academic Graph, ORCID, Crossref, Unpaywall等数据源,构建起科研成果、作者、机构等不同主体之间的关联,现已成为最受欢迎的开放科研信息数据平台之一。尽管该平台具备数据规模庞大、免费公开等优势,但同时也有学者发现该平台存在一定的作者机构信息缺失问题。机构信息作为科学计量研究和科研评价的基础性数据,向上可以支撑国际合作和跨国比较等国家层面的研究,向下可以支撑科研人员流动等个体层面的研究,机构信息本身更是机构排名和机构评估等最重要的数据来源。可见,OpenAlex平台的机构信息缺失现象是一种值得关注且亟待解决的数据质量问题。本场分享将聚焦于OpenAlex数据平台的机构信息缺失现象展开研究,围绕其可能原因、潜在负面影响及应对方案进行分析,并扩展至开放科学背景下普遍存在的数据质量问题展开讨论。
分享大纲
-
导入:开放科学背景下的开放数据
-
论文解读:OpenAlex中缺失的机构信息
-
核心术语
开放数据(Open Data):指可以被任何人自由使用、修改、共享的数据,通常以标准化的格式公开发布,便于机器读取和自动处理。这类数据常常来自政府、研究机构和公共组织,旨在促进透明度、创新以及公共资源的高效利用。
开放研究信息数据平台(Open Research Information Data Platform):“研究信息”是指与研究的进行和传播相关的信息(有时称为元数据),包括但不限于文献元数据,与研究软件、研究数据、样本和仪器相关的元数据,基金和资助信息,机构和研究贡献者的信息 等。“开放研究信息”是指可以免费访问且没有重用限制的研究信息 。“开放研究信息数据平台”是指承载开放研究信息的数据平台。
数据质量(Data Quality):指数据的准确性、一致性、完整性、及时性和可用性等。高质量的数据意味着数据能够反映真实情况,且在分析和决策中具有可靠性。
参考文献
Zhang, L., Cao, Z., Shang, Y. et al. Missing institutions in OpenAlex: possible reasons, implications, and solutions. Scientometrics (2024). https://doi.org/10.1007/s11192-023-04923-y
分享人
张琳,武汉大学信息管理学院信息管理科学系教授,博士生导师,武汉大学科教管理与评价中心主任。主要研究方向为科学计量与信息计量,科学学、科技政策与科教评价。
曹喆,武汉大学信息管理学院在读博士生,主要研究方向为科学计量学与科技政策评价。
分享简介
当前,开放科学运动蓬勃发展,开放获取是其中重要一环。开放获取是否能够促进问题论文的撤稿?是否能够降低问题论文的学术影响力?关于这一问题的讨论对问题论文的学术净化有着重要意义。此外,开放科学的其他维度,诸如开放数据、开放同行评审等,是否同样有可能对问题论文的撤稿过程产生影响?本场分享将结合开放科学的特征,对开放科学的各方面影响论文撤稿的深层原因与运行机制进行讨论,试图分析开放科学和论文撤稿之间的内在联系。
分享大纲
1. 各领域中透明度和可信度的关系探讨
2. 开放获取对论文撤稿的影响分析开放数据、开放同行评审对论文撤稿的影响
核心术语
开放科学(open science)
开放获取(open access)
撤稿时滞(retraction time lag)
撤稿后被引(post-retraction citation)
参考文献
Zheng, E. T., Fang, Z., & Fu, H. Z. (2024). Is gold open access helpful for academic purification? A causal inference analysis based on retracted articles in biochemistry. Information Processing & Management, 61(3), 103640.
Zheng, E. T. & Fu, H. Z. (2024). A comparative study on characteristics of retracted publications across different open access levels. Journal of Data and Information Science, 9(2), 22–40.
主讲人:
郑尔特,谢菲尔德大学信息学院在读博士生。主要研究兴趣为开放科学、科研诚信和替代计量学。
李恺,田纳西大学信息学院助理教授,博士毕业于德雷克塞尔大学。主要研究兴趣为科学软件和数据对于科学的影响。
崔浩川,美国匹兹堡大学博士后。研究兴趣和方向:计算社会科学、网络科学、科学学。
参与方式
本次分享将于2024年9月28日(本周六)晚上20:00-22:00在腾讯会议进行,也可以点击下方按钮预约直播。
扫码参与面向未来的科学学读书会,加入群聊,获取系列读书会回看权限,成为科学学社区的种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动科学学社区的发展。
科学是研究实践、是理性精神,也是一个由学者、文献、科研项目、科学思想与灵感等一起构成的自组织、自生长的复杂系统。科学学这门学科,旨在深入理解科学研究的种种因素并推动科学发展。科学的迅猛发展在积累科学知识的同时,也遭遇诸多社会、伦理、政策问题:开放科学的范式如何影响科学研究的实践?阶层、性别、种族、国家等视角如何揭示科学不平等的起源?期刊编辑和审稿人如何塑造当今的科学活动?科学人口结构、人才激励、科技人才流动如何影响科学发展?AI大模型如何重塑科学研究的各个环节?
为了思考和回应科学的多元化挑战、科学开放性面临的危机,以及新兴技术对科学的冲击,集智俱乐部联合美国匹兹堡大学博士后崔浩川、东南大学副研究员孙烨、田纳西大学信息学院助理教授李恺、纽约大学阿布扎比分校博士研究生刘逢源、南京大学地理与海洋科学学院研究员古恒宇,共同发起「面向未来的科学学读书会」,这是继「复杂系统下的科学学读书会」之后的新一季科学学读书会。读书会从2024年8月25日开始,每周六晚19:00-21:00,持续时间预计8-10周。欢迎感兴趣的朋友报名参与!
详情请见:面向未来的科学学读书会:探索开放科学范式,揭示科学不平等的起源