与机器对话,语音激活的人工智能更令人兴奋
几十年来,科幻电影一直在想象未来人们可以像与家人和朋友交谈一样和机器对话。然而在现实中,使用声音和机器交流还很困难,iPhone上的智能语音助理Siri就常理解错用户说的话。但这正在改变。当语音助手Siri或Google Now听懂你的要求并执行时,越来越多与移动设备的对话体验就会带来惊喜。
简单说,机器语音识别技术将会变得更好,这将完全改变人们与计算设备互动的方式。未来几年语音和说话识别领域将令人兴奋。以下方面令人期待。
语音识别会变得更好。过去语音识别总是达不到我们的期望,如今在此领域已经有一些重大技术突破。在过去的18个月里,商业语音识别技术已经显著改进了30%。以此来看,这比过去15年取得的成就还要大。这些改进部分是受结合大型数据库的深度学习方式推动。
深度学习被用来创建具有任务准确性的系统,比如处理图像分析、语音识别和语言分析。然而该领域大多数领先公司的平台并不能被顾客使用。DeepMind和Vicarious公司就属此类。有几家公司能提供依靠深度学习的应用编程接口(API)。Alchemy的应用编程接口就能使用深度学习进行图像和语音分析。
随着更多的语音使用信息能被获取,语音识别的准确性将会越来越好。这就是“人工智能的良性循环”,使用语音界面的人越多,就会有越多的信息被收集,算法就会工作得越好,于是就会在准确性上带来显著的改进。
Siri, Cortana和Google Now不会是仅有的智能语音助手。随着各种类型的计算设备在我们身边出现,我们将更多依靠自然的界面与它们互动,比如语音、触摸和手势。过去开发一个智能语音界面是一项复杂的工程,你只有拥有苹果、谷歌或微软这些大公司的开发团队时才有可能。然而如今由于出现了一些快速增长的云端式应用编程接口(如MindMeld),开发者不需要在自然语言处理上有很高水平就可能为任何应用和网站创建智能语音界面。
因为这是人工智能研究最复杂的领域之一,所以从事研发的公司不会很多。在消费层次,谷歌、苹果、微软、百度和亚马逊在语音搜索技术上投入重金以完善网络语音搜索。
对其他没有这么大实力的公司来说,它们可能利用云服务创建智能语音功能。为有语音识别功能的应用提供云端应用编程接口的公司有Expect Labs、Wit.ai和api.ai。Siri的创始人在Viv工作,但他们还没有推出一款产品,因此它是否与新一代语音应用有关还不清楚。
计算机将不间断地聆听我们,就像《星际迷航》中的计算机那样。机器已经比人类看得更好,识别得更好,也能听得更好。最终它们也将理解得更好。一个计算机持续聆听的世界会是什么样的?它将肯定改变我们和设备互动的方式。
在一个会议室里,自动或可穿戴设备能听懂我们的谈话并理解我们需要什么,这最终将成为标准。这个新世界将会出现,因为我们都期望随时随地对信息了如指掌。现在它看起来奇怪,但它会在智能语音界面安装到各种应用后不久发生。目前那些在智能家居上进行投入的公司如三星和Comcast在该领域领先,但其他技术公司也在尝试,如亚马逊的Echo和Jibo。
研究者将开发普及性智能。随着人工智能越来越接近理解人类的全部知识,它们将在回答各种问题上表现更好。最终,机器学习技术将被用来帮助计算机科学家开发一个通用智能助手,其能理解大部分人类知识。人类的知识尽管庞大,但并非无限。随着深度学习技术更好地从大规模数据库中提取模式,人工智能研究者开始研发一种普及性智能模式。
人工智能会变得更聪明但不会毁灭人类文明。关于人工智能有许多制造出来的恐慌。尽管科幻电影迷能想象到人工智能带来的危险后果——比如自动引爆核弹头,自动驾驶模式时停下来重启,或基于人性是所有问题根源的结论毁灭人类,但这些臆想的成份太大,我们离这种极端情况还非常遥远。
现在人工智能系统还远未到具有自我意识,人工智能更多的还是一些自动化程序,距离与人类大脑竞争还非常遥远。人类更可能是从不断改善的人工智能中受益,提高生活和工作质量。
【作者Tim Tuttle是Expect Labs公司的CEO。来源TC,并综合其他信息。】