论文检索+学术社交——天玑学术网想做国内版researchgate | 36氪
如果学术交流渠道更公开便捷一点,18世纪牛顿和莱布尼兹的微积分之争会不会是全然不同的局面?不过,哪怕今天国外的facebook、twitter或是国内的微博、人人流行甚广,许多学者之间的交流恐怕仍停留在web 1.0形态,甚或是范围有限,全在线下完成,少有线上学术圈内外的交流。
德国的researchgate率先打破这一现状。类似于科学家的facebook, researchgate为科学家们提供分享研究成果、学术著作的空间,同时,科学家还能参加一些线上的科研论坛或兴趣小组。现在,中科院计算机研究所开发的天玑学术网想成为垂直计算机科学领域的国内版researchgate。
以论文检索工具为切入点,天玑学术网在工具的基础上搭建学术社交平台——学者个人微博的构建、学术动态的更新、关注的论文与话题、与其他学者的交流讨论。
社会化搜索
作为天玑学术网的用户之一,果壳网架构师苑明理告诉我,出于研究需要,他常会在维基百科上搜索一些专业名词,然后阅读词条的参考文献,再从专业文献内的知识点拓展开去。针对研究者的调研需求,天玑学术网也为计算机科学领域内的专业词汇设置了类似维基百科的词条页面。在热点概念下,列有名词解释,了解此概念的入门综述文章和重要论文,以及此概念研究成果的重要作者。如果你需要长期跟踪了解一个概念的演化,还可以选择“关注”这个概念。
和普通搜索引擎的pagerank算法不同,天玑学术引擎使用的是面向权威度和多样性的两阶段排序模型。具体来说,就是首先使用mutualrank模型来对权威度进行建模,权威度考量标准为论文引用量以及作者信息。再利用基于引用关系的论文和作者差异度指标的pdrank模型对论文和作者进行排序,摒除冗余结果,把权威度高、覆盖面广的调研结果优先返回给用户。
天玑学术引擎的数据来源涵盖acm、ieee、dblp、citeseer,以及众多国外学者的个人博客。天玑学术负责人郭嘉丰告诉我,他们收入的数据基本上是国外计算机科学研究领域内比较前沿的论文。但很多国外的论文需要付费阅读,他们会检录一些学者公开发布在个人博客上的文献,克服付费的障碍,扩充数据来源。目前数据库内的论文储量接近1000万。
垂直学术的社交网络
与完善工具相比,建构活跃度高的社区要更为困难。从三月份起,天机学术陆续在各高校张贴海报推广网站,但20天内用户增量大约为七八百人。问起郭嘉丰他打算如何让用户从单纯的搜索行为转向社交进而产生用户粘度时,他说到几点用户引导机制:
1.在搜索结果中呈现相关的书签喜欢等按钮,并把论文已有的评论直接展示出来,给用户呈现相关的社交元素;
2.在用户查看论文详细页面时,也有相关的评论信息,如果论文可以在线阅读,用户可以直接看到在线阅读和讨论的按钮,但是非登陆用户点击会被要求登录,这也是基于用户想直接阅读的话,吸引他们注册;
3.在页面顶部的其它版块,如事件、网盘等,也是在用户使用的时候进一步引导他们进入社交网络的途径。
目前天玑学术设置了多个社交入口,有个人微博、学术问答、团队协作、学术活动、网盘等。个人使用后,感觉各个入口并列的设计不够合理,模块之间的内在联系比较弱,如何引导用户很自然地在几个模块之间过渡使用,仍待详尽考虑。
郭嘉丰认为,目前天玑学术最能吸引的是计算机领域的研究人员、高校老师、学生(更主要是研究生)以及工业界相关的研发人员,因为大家需要查论文、读论文,相互交流,从别人那里发现前沿技术动态。
从更广泛的社会背景来说,“大数据”时代下,搜索、挖掘、分析和推荐等技术成为了很多行业的需求,不仅是电商,还有生物、医学、天文等都面临大规模的数据,需要计算机科学技术作为内在支撑。越来越多的商业公司开始自行投入研究,或和研究机构合作,利用大数据来产生价值。这部分商业机构或科研机构的研究者构成天玑学术的主要用户。
评价体系之辩
提到现有的学术评价体系,郭嘉丰说,他们也有考虑过希望自己的网站能为学者和机构等提供一些较为客观的学术评价指标。比如通过完善数据,提供从论文角度对学者评价的指标(如h-index,g-index这些公认的指标)。国外已有被认可的系统archive,主要是物理和计算物理界的学者在上面直接发布自己最新的论文,计算机界的也有一些。但是国内学者的研究论文一般直接投稿到某个期刊或是学术会议。如果要投入一个在线学术平台,公开自己的研究成果,根据引用量和关注度进行排名,如何保障这个平台的信誉,避免成果被抄袭,这里面还是有很多问题存在的。
目前,天玑学术关注的内容仍局限于团队成员擅长的计算机科学领域,但郭嘉丰表示未来可能会向其它领域拓展。移动端的天玑学术搜索也已上线。