谷歌公布两项AI实验成果:一项让人“与书对话”,一项可测试单词联想力
4月13日,谷歌宣布了其研究部门的两项最新人工智能(AI)实验成果,允许网络用户涉足语义和自然语言处理。于谷歌而言,公司的主要产品是谷歌搜索引擎,多以文本运行,而这些AI方面的进步也成为了业务的一部分,并且以此为目标——出品能够理解并分析人类语言元素的软件。
相关网站现在起将提供任意交互式AI语言工具的服务,谷歌称之为语义采集体验。AI的主要子领域是“词向量”,这是一种自然语言的理解,它将“语义相似的短语映射到附近的点上,这是基于概念和语言的等价性、相似性或相关性”。“这是一种让算法能够根据实际语言使用的实例来学习单词之间关系的方法”,著名的未来学家、谷歌研究院的工程总监Ray Kurzweil和产品经理Rachel Bernstein在一篇博客文章中阐述到。谷歌已经在这里的一篇论文中发表了关于这个主题的研究,并且他们还在TensorFlow平台上提供了一个预先训练的模块供其他研究人员进行实验。
此番公布的两项公开实验中,第一项叫做“与书对话”。它可以让你和训练好的机器学习算法进行对话,该算法可以针对提问从人撰书面文本的相关段落作出表面回答。正如Kurzweil和Bernstein所描述的那样,与书交谈可以让你“做一个陈述或问一个问题,而这个工具会书中找到句子作为回应,而非依赖于关键字匹配。”他们还补充说到:“从某种意义上说,你是在与书对话。通过书的回应,帮助你确定是否感兴趣,是否阅读它。”
“与书对话”应用界面
从我使用web界面的经验来看,它是一款非常整洁、超美观的产品。假设你问它一个问题——“为什么天空是蓝色的?”,你会得到很多不同的答案,而这些答案无一例外都在清晰的文本中显示出来,这些答案来自于相关主题的书籍,诸如内容为“随着波长的减少,大气中的分子在光线散射时会变得更强”。然而,与使用标准谷歌搜索引擎截然不同的是,你操作的时候必须点击一个链接并解析文章或网页,“与书对话”算法才会为你所用。
“支撑这项技术的模块至少经历了10亿次对话训练,比如对句的同时要学会鉴别如何做出最像样的回复。”Kurzweil和Berstein解释说,“一旦你提出了问题(或者做了一个陈述),这些工具就会在超过10万本书的内容中搜索所有语句,找出那些根据句子层面语义合乎你问题的答案。你所输入的文字和你所得到的结果二者之间,没有预先框定的规则。”
当然,正如您可能怀疑的那样,它有局限性。这个工具更适合回答原始的事实性问题,而且在处理复杂的地缘政治问题或现代文化、历史重要性的话题时表现不佳。但就作为一个简单的网络工具,谷歌表示它可以帮助改进诸如Gmail智能回复一类的产品。“与书对话”不乏是一种以自然语义来探索网络的有趣方式,它同时让我们瞥见到,当人工智能真正成熟到可以处理几乎所有我们抛出的查询时,未来的交互界面会是什么样子。
谷歌重磅发布的两个实验中的第二个更具互动性——这是一款叫做Semantris的游戏。游戏侧重于测试玩家的单词联想能力,其智能程度就像“与书对话”一样,并根据你输入的答案对屏幕上的单词进行打分。举个例子,你有一个由10个单词组成的列表,如果Semantris呈现“bed(床)”这个单词在列表上面,你可能会输入“sleep(睡眠)”作为回应。Semantris将对这10个单词进行排序,并根据它认为“床”与“睡眠”之间的语义关系与列表中的其他单词的关系进行比较。
值得一提的是,很多这类似的谷歌实验也是公司收集用户数据的方法之一,通过给用户提供丰富的文字相关信息,来帮助推送它的技术。这似乎是Semantris的案例,但无论如何,游戏是测试你自己能力的一种有趣方式,也顺道看看软件如何智能判断单词之间的联系。你也可以玩一玩类似Tetris的游戏,通过输入文字来清除屏幕上的方块,根据你自己的假设,去猜想屏幕上彩色方块上的文字和你要输入的答案之间有没有关联。
无可厚非的是,“与书对话”和SEMANTRIS的设计,旨在用来测试软件的语义理解能力。
细数谷歌众多过往的AI实验,像最近可以让用户训练自己基本算法的受教机器工具,以及以前那些专注于涂鸦和音乐制作的小程序,这些web游戏和工具都是很有价值的AI互动方式,更容易应用于现实世界当中。AI,正如“机器学习”、“神经网络”这样的术语一样,通常对于不知道来龙去脉的人们来说,听起来是一个抽象概念,又或在某种程度上,它意味着世界上最强大的软件应用程序和平台想要混淆掩盖搜索引擎下那些不可告人的秘密。但是通过这类似的实验,谷歌以一种对每个人都受益的方式揭开了AI技术的神秘面纱。
注:本文由数据观编译自The Verge网站,作者/Nick Statt ,译者/黄玉叶,图片来源于原文配图。转载请务必注明来源、出处及作者等信息。
责任编辑:陈近梅