AI科技评论报道
编译 | 王晔
自30年前arXiv创立,社会信息传播模式发生了巨大的变化——并不总是向好发展。arXiv创立者Paul Ginsparg讨论了电子预印本的学术经验是怎样为更加广泛的信息共享提供参考的。
三十年前,arXiv创立之时,许多人都对互联网的潜力持乐观态度,认为它可以培养了解更多资讯的公民,并创造公平的信息竞争环境。在arXiv这样的新平台上,学术界引领了这一潮流。但是现在,这些最初的理想似乎难以实现,政治上的两极分化因信息“回声室效应”而加剧,甚至对什么是客观证据也不再达成共识。在如此危急情况之下,也许我们学术界可以重拾30年前的领先地位,通过展示如何负责任地、有成效地分享信息,重燃新的希望。
1
在其早期,arXiv实施了卫生和内容相关形式的质量控制,后者随着arXiv对公众透明度的增加而变得越来越重要(更多关于arXiv的历史见下文)。这里的 "卫生 "指的是浅层次的——文本应该可以提取;参考文献、作者和摘要应该包括在内;不应该有分散注意力的行号或水印,等等——可以直接自动进行检测。在内容方面,arXiv早期实施了一种最低标准的质量控制,雇用了一批活跃的科学家,对收到的稿件(通常只根据标题和摘要)进行扫描,并迅速判断它是否对目标研究群体有合理的兴趣。这种监督是为了保护读者不受离题内容的影响,并保持与最低学术标准的一致性。它还预见到一直存在的风险,即邪恶分子的行为不一定符合社会的最佳利益,这种风险在后来的几年里或许没有得到社交媒体公司的足够重视——见证了自由流通的虚假信息所带来的高风险的社会损失。
2
十年后,arXiv需要一个合适的机构,以继续其从短期的软件实验过渡到更长期的可持续服务。在学术交流领域,传统的参与者是机构图书馆和专业协会。2001年,我选择了进入康奈尔大学图书馆(1981年在此获得物理学博士学位),理由是图书馆不会与自己的期刊出版业务有潜在的利益冲突。尽管是出发点是好的,但随着时间的推移,这种配合变得越来越糟糕。大学图书馆的主要任务是为其内部社区提供由他人认证的内容,而arXiv的职权范围是向全球研究人员社区传播有时难以辨别出处的资料。
2019年,康奈尔大学内部对arXiv的监督从图书馆转移到了计算机和信息科学,但长期规划受到了大流行病相关问题的阻碍。也许arXiv会在康奈尔内部找到一些新的平衡点,也许专业协会会利用自己的出版经验,帮助创建一个更加分散和可持续的长期资源。arXiv仍然是许多全球研究社区的主要研究交流模式,提供了必不可少的基础设施。每天的提交率正在迅速增长(见图;主题由arxiv.org上使用的标准缩写标明),预计2021年的新文章总数约为19万篇。不管arXiv未来的具体情况如何,预印本的传播不再是异端,目前传播量增加的趋势不太可能逆转。
3
4
但是,与更广泛的社会中的信息共享问题最相关的预印本使用量的飙升是由COVID-19大流行引发的bioRxiv和medRxiv的增长。这些预印本服务器在大流行的第一年就容纳了超过10,000篇文章(bioRxiv的数据;medRxiv的数据),这种增长很可能成为其他研究领域的一个转折点。回顾1995年《新英格兰医学杂志》关于预印本的一篇社论,它表达了合理的公共卫生关切,因为 "互联网上关于健康问题的许多信息,如药物的风险和各种食物对健康的影响,都是不确定的来源 "。尽管近期似乎加强了对其的关注,但我想说,迄今为止多种证据表明,开放预印本的分发并不是当前问题的根源,而且在许多情况下可以帮助缓解这些问题。
与COVID-19有关的向bioRxiv和medRxiv提交的材料并没有造成重大的公共卫生危害(尽管可以肯定的是这些资源比arXiv受到了更严格的审查 )。相反,最严重的非法者反而发表在传统的参考文献中。其中包括一篇颂扬羟氯喹优点的文章(其出版商发布了一封关注信,但没有撤回),以及其他基于捏造数据的研究,这些研究很快被《柳叶刀》和《新英格兰医学杂志》撤回。也许这些杂志和其他杂志的编辑会因为在出版前看到更多的专家公开评论而受到启发:迄今为止,已经有超过120篇经同行评审的COVID-19文章被撤回或撤销。相比之下,一项以预印本形式发布的COVID-19研究,高估了先前的感染率,并很快被媒体报道,专家们很快说明了其统计学上的缺陷。一份预印本报告了关于药物地塞米松的严格临床研究的结果,导致该研究在作为期刊出版物出现之前的半年内被使用,可能挽救了许多生命。而正是这篇预印本对实际的健康危害进行了反击,纠正了长期以来假定的(落下的)飞沫和(空中的)气溶胶之间的5微米界限背后的错误观念,并表明需要对COVID-19传播的健康预防措施进行更有效的修订。
5
雷锋网雷锋网雷锋网