arXiv25岁了,现在它准备重新定义论文开放发表行业
编者按: 在互联网时代的早期,天文学家、物理学家、数学家、计算生物学家和计算机科学家在一个网站上自由发表自己的工作成果。这个天堂般美好的网站对用户免费,并且延续至今,它就是arXiv。在那里,学者可以贴出自己论文的pdf格式版本——在被出版商看上之前。
ArXiv即将迎来自己的第25个生日,这意味着它必须思考自己的未来并向新的方向迈进。建立ArXiv的最初目的是快速和免费地发布关于黑洞、介子和贝叶斯统计方面的论文,今天看来,它扮演的角色已经远远超过了创始人当初的设想。然而,ArXiv的用户界面设计以今天的标准已经相当陈旧。奥杨·列格(Oya Rieger),arXiv的程序总监说:“在光鲜的外表下,我们的用户服务承受着不小的压力。”
上月起,arXiv管理层就一系列用户体验相关的问题进行了问卷调查。引发最多争议的问题是arXiv(1)是否应该改革文章发表流程,(2)允许读者评价文章和发表评论——这是主流社交网站支持的时尚功能。
若arXiv这一最早的论文开放发表网站进行升级,则很可能导致科学家们对“开放发表”这一概念的重定义,并对未来数字时代的科学出版行业带来深远影响。换句话说, arXiv必须选择向谁提供更满意的服务——前沿领域科学家还是追求时尚用户体验的普罗大众?
arXiv的重要地位通过历史数据可见一斑。截至2014年,在该网站共收到论文超过100万篇。仅2015年,arXiv就收到了10.5万篇论文投稿,并提供了1.39亿次论文下载服务。对诸多前沿领域的大批科学家来说,arXiv已经成为他们了解最新学术动态的第一选择。纽约大学天文学家大卫·霍格(David Hogg)说:“我会在学术会议的PPT上加上我自己论文的arXiv编号,因为我知道任何人,哪怕没有收费的数据库访问权限,都可以在arXiv上下载阅读我的论文。”
阅读公开使得科学知识的广泛传播成为可能,并加速了科学的发展。一位理论物理学家在arXiv上发表自己关于弦理论的文章,他的同行可以在第一时间对理论的可疑之处进行尖锐质疑。如果物理学家把文章投给传统出版商,那么这篇文章要经过冗长的审稿和出版流程才能上线并被其他物理学家看到。
加拿大滑铁卢圆周理论物理研究院的理论物理学家丹尼尔·戈茨曼是arXiv的一位版主,同时也是该网站物理学科顾问委员会的主席。他说:“在很多物理分支学科,arXiv已经成为主要的论文发表场所。当然,人们仍然会向传统期刊投稿,但是人们这么做,很大程度上只是因为他们想走一遍同行评议流程并获得反馈意见。”在arXiv上发表论文很快成了学术界约定俗成的惯例。
出版速度和出版质量的冲突
arXiv管理层明白自己对广大科学家的重要性,因此他们想做的更好。arXiv最初是一个只具备最基本功能的简陋网站。二十世纪九十年代初,加利福尼亚大学伯克利分校的天体物理学家乔安妮·科恩(Joanne Cohn)开始在互联网上公开散发自己的物理论文——它们被称为“预印本(preprints)”,即之前没有在传统学术期刊上发表过的文章。
但是,随着这种做法的流行,科学家们很快发现自己的电子邮箱中收到的预印本数量暴涨。为了让科学家免除自己存储这么多预印本的负担,美国新墨西哥州洛斯阿拉莫斯国家实验室的物理学家保罗·金思帕(Paul Ginsparg)建立了一个名为arXiv的网站来接纳所有科学家投递的文章,并允许所有互联网用户免费阅读。
(译者注:如果有N个科学家,每个科学家向其他的N-1个科学家发送k篇论文,那么所有科学家邮箱中的论文总数是N×(N-1)×k篇。而N个科学家,每人把自己的k篇论文提交到arXiv,则arXiv的服务器只需要保存N×k篇论文就可以让每个科学家阅读其他人的所有文章,这个数字相比N×(N-1)×k要小得多。)
今天,arXiv的绝大多数后台代码都是该网站最初建立的时候写成的那个版本。为了升级arXiv的后台程序,管理层组成了一个网站架构技术工作组,并花了3周时间征集用户意见。征集用户意见的通知被贴在arXiv的首页上,有点象维基百科首页的捐赠请求,但它请求用户提供意见而不是金钱。 来自全世界的用户提交了3万5千份反馈意见。
用户对诸如搜索功能和文章提交流程的意见将决定arXiv的未来。可以肯定的是,无论如何,arXiv必将继续和其他论文开放发表网站一道,推进科学出版的免费化和快速化。作为科学论文开放发表网站的元老,arXiv这次改版很可能会对 biologists’ bioRxiv等后辈网站产生显著影响。
科学出版的未来,取决于在两个相互矛盾的要求之间成功取得平衡:出版速度和出版质量。 传统学术期刊的同行评议制度至少在理论上能够排除绝大多数没有多少价值的文章,但是同行评议制度非常耗费时间,这影响了科学知识传播的速度,并推迟了新发现的产生。类似arXiv的预印本网站基本上取消了同行评议制度,以求提高科学文章出版的速度,并使更多的文章能够与公众见面,而不是被几名同行评议专家在审稿阶段拒绝。
目前, arXiv对论文的提交和发表采取“尽可能不干预”的中立策略 。比如,一名用户提交了一篇关于圈量子引力的论文,该领域的专家会收到一封包含了论文摘要和作者信息等数据的邮件。戈茨曼说:“如果看上去没有不妥,版主会直接让这篇文章与公众见面。”若版主发现了摘要中的明显问题,则会有专家来阅读全文,并在回复中给出修改意见。目前arXiv拥有150多名专家作为各领域的版主。
因为基本没有同行评议制度,论点较为新颖,价值尚待评估的论文,会与报道重大成果的论文一起出现在版面上。科学家们可以在arXiv发表自己早期的工作,然后根据反馈进行完善,并在传统权威学术期刊上发表最终版本。许多用户认为,arXiv应当坚持这种“来者不拒”的论文接收与发表流程,除非论文实在太差或者存在科研不端行为。
霍格说:“详细评估论文的学术价值是传统期刊的事情。arXiv应当专注于自己的优势领域,即尽可能广泛地接收论文,不管它们是否已经在传统期刊上发表。” arXiv对论文学术价值的中立态度是网站的核心价值 , 因为对传统学术期刊的一个普遍诟病,就是编辑和审稿人会有意无意地选择那些符合学科当前主流理论的文章进行发表,或者对来自名牌科研机构的文章青睐有加 (当然,大多数期刊在同行评议中实行双盲制,审稿人不知道作者是谁,同时作者也不知道审稿人是谁。)
戈茨曼作为一名arXiv的版主,同样厌恶传统的同行评议出版流程,这不仅仅是因为同行评议给他带来了更多的工作负担:“对文章学术价值的严格评判将会拒绝很多论文,而这些论文可能对某些读者有审稿人意识不到的价值。我们是否应该减少评判是个很有意思的问题。”
扩展学科领域还是增添评论功能?
用户调查还询问用户arXiv是否应该增加评价和评论功能。列格说:“目前,我们没有添加这些功能的计划。但是如果用户有明确需求,我们会进行考虑。”
伊莎贝拉·拉巴,加拿大卑诗哥伦比亚大学的数学家,同样担心恶意刷屏者,但她的视角落在女性和少数族裔上。“在其他因素都基本相同的情况下,一个个人博客下面的回复会因为博主的性别而有显著不同,这一点毫无疑问。对学术论文开放评论会导致现实世界中的性别和种族偏见涌入专业领域。”
她不希望自己论文下面的评价中夹杂着各种与专业无关的偏见。当其他人在谷歌搜索自己名字时,arXiv很可能出现在搜索结果的前列,这样,这些偏见将被其他互联网用户看到,对她产生潜在影响。“如果有人在红迪网上骂我,不太会有人把这个娱乐社交网站上的话当真。但是arXiv是严肃的开放发表网站,它上面的评价产生的影响和娱乐社交网站不可同日而语。”
拉巴希望arXiv继续坚持自己的核心优势,同行评议由传统期刊执行,其他第三方网站承担学术论坛的功能。
阿比盖尔说:“我认为arXiv应当坚持自己的核心优势,即充当一个几乎所有科学论文都能在上面开放发表的平台。资源总是有限的,因此arXiv应当致力于为更多的科学领域提供服务,而不是添加时尚的功能。”
目前,最终用户调查结果报告尚未产生,因此除了阿比盖尔和拉巴之外的34998个用户怎么想我们无从得知。但是至少有一点是肯定的:如果这些用户觉得他们的意见没有被认真倾听,他们会让arXiv知道,以快捷、免费和公开的方式。
“DeepTech深科技”是由麻省理工科技评论创建的一个新科技内容品牌。更多内容请关注官方微信公众号:mit-tr