前沿 | 人工智能法官:英美科学家开发出用于审讯的计算机程序(附论文)
选自卫报
机器之心编译
参与:李泽南
伦敦大学学院(UCL),谢菲尔德大学和美国宾夕法尼亚大学的最新研究表明,人工智能已经可以分析法律证据与道德问题,进而预测审讯结果。
该算法分析了 584 宗有关酷刑和侮辱,审判不公与侵犯隐私的英文案卷。
在 20 世纪 60 年代,有科学家曾经预测,电脑将有一天能够预测司法判决的结果。随着近年来计算机科学的发展,人工智能程序在进行高度复杂的任务。它们在电影,电视节目和音乐上「猜你喜欢」时正在变得越来越准确。而现在,一项英美科学家的开创性研究告诉我们,人工智能可以用来预测审讯结果了。
伦敦大学学院(UCL),谢菲尔德大学和宾夕法尼亚大学的科学家刚刚发表的最新研究表明,人工智能已经可以分析法律证据与道德问题,进而预测审讯结果。这项研究的成果可以帮助人们提高法庭审判的准确性。
人工智能「法官」在分析欧洲人权法院涉及酷刑,虐待,有辱人格和侵犯隐私的案件中做出的判定中有五分之四与人类法官的判决相同。
研究人员的程序审查了包含 584 个案件的英文数据集,有关「人权公约」中的第 3 条(涉及酷刑或侮辱虐待的案件,250 起),第 6 条(保护公平审判权,80 起),以及第 8 条(隐私和家庭生活,254 起)。选择这些案件的原因是他们是代表基本权利的案件,同时存在大量的公布数据。在研究中,人工智能程序分析所有信息,并提出自己的司法判决。在其中 79% 的案子里,人工智能提出的判决与当时的法庭判决一致。
Nikolaos Aletras 博士是这项研究的领导者,他是伦敦大学学院计算机科学系的研究员。Aletras 说道:「我们不认为人工智能会在司法领域代替法官或者律师。」在这项研究中,为了防止计算机学习出现误差和偏见,「违法」与「不违法」的案例各占 50%。
人工智能「法官」在分析欧洲人权法院涉及酷刑,虐待,有辱人格和侵犯隐私的案件中做出的判定中有五分之四与人类法官的判决相同。(图片:Getty Images)
在这个项目的开发过程中,研究小组发现欧洲人权法院对于判决更多依赖非法律事实,而不是纯法律依据。这表明,欧洲人权法院的法官们相比「形式主义者」而言,在法律理论上更加的「现实主义」。根据历史研究,其他的高等法院也是如此,例如美国最高法院。
这项研究佐证了其他一些有关高等法院判决影响因素研究的观点,Aletras 说道:「目前我们还需要学习更多数据,以进一步的研究改进我们的算法。但我认为它可以成为一个有效的工具,用于判定哪些案件违反了『欧洲人权公约』。」
伦敦大学学院的计算机科学家 Vasileios Lampos 博士,同时也是研究报告的共同作者,解释了这项研究的开创性:「之前的同类研究通常根据犯罪本身和政策立场来预测判决,而我们第一次使用法院编写的案卷来进行分析。」这项研究发现,预测法院判决的最可靠的方式是通过分析案卷中所使用的语言以及文本中提到的话题和情景。案文中「情景」部分包括案件中事实背景的信息。通过组合案件所涵盖的「话题」中提取的信息,分析数据中有关人权公约相关三条的「情景」,最终实现 79%的准确性。
Lampos 表示,他们的人工智能程序目前缺乏训练数据:「我们认为这项研究的成果将能提高那些高级法院的工作效率,但是目前看来,我们需要收集更多的文件和法院案卷进行测试。在理想状况下,我们使用那些向法院提交的文件来测试和改进我们的算法,而不是公开的判决文本。但目前我们缺乏这样的数据,只能使用法院公开的部分案件摘要。」
在司法领域,律师们早已将人工智能应用到了工作中,这些程序可以执行一些复杂的任务──例如搜索概念而不是简单的关键字──这可以极大地缩短判断文件与案件是否有关的时间。今年五月,IBM 发布了人工智能律师 Ross,通过使用 Watson 的计算能力为人们提供法律建议。IBM 的这项技术最近已被 Baker&Hostetler 律师事务所采用,这家律师事务所主要处理破产案件。
Ross 使用 IBM 的 Watson 人工智能平台(图片:Getty Images)
但目前看来,最高法院的法官们还不能将这种新技术应用在判决上。 Aletras 等人的这项研究已发表在了 PeerJ Computer Science 上。
论文:预测欧洲人权法院的司法裁决:自然语言处理的观点
作者:Aletras, N, Tsarapatsanis, D, Preo?iuc-Pietro, D, Lampos, V
摘要:自然语言处理和机器学习近期的发展为我们提供了工具,可以建立预测模型用以揭开法庭审判的原理。这项研究可以让律师和法官受益,他们可以利用我们的模型作为工具快速审案,或从已知信息中获取要点帮助判断。本文中,我们第一次系统性地研究了仅通过分析文本内容来预测欧洲人权法院的司法判决。我们制定了一个二元分类任务,在分类器中输入从案例中提取的文本内容,目标输出是关于是否存在违反人权公约的条款的实际判断。文本信息使用连续字序列(contiguous word sequences),即 N-gram 和话题来表示。我们的模型可以准确预测(平均 79% 正确率)法院的判决。我们的实证分析表明,案件的形式事实是最重要的判决因素。这与法律现实主义的理论一致,这表明司法决策受到事实情况的显著影响。我们同时发现,事件的话题内容是这种分类任务的另一个重要特征,我们通过定性分析进一步探讨了这种关系。
©本文由机器之心编译, 转载请联系本公众号获得授权 。
?------------------------------------------------
加入机器之心(全职记者/实习生):hr@almosthuman.cn
投稿或寻求报道:editor@almosthuman.cn
广告&商务合作:bd@almosthuman.cn