奇点机智:模拟用户点击直达第三方应用,为用户打造专属AI语音助手“小不点”
说到语音交互,大家首先想到的或许就是今年大火的智能音响——各大科技巨头纷纷布局,并以其为载体,掌控着家用科技产品的入口。
此外,苹果的Siri、微软的语音助手Cortana(小娜)、谷歌的Google Assistant、科大讯飞和中国移动联合开发的灵犀语音助手等,无需通过智能音响,在手机上即可实现日常的语音交互。
不同于智能音响将场景缩小到了智能家居和车载设备这些语音环境相对简单、识别难度低、操作命令更直接的命令,语音助手需要时时刻刻面对人们的需求,其“场景”变化是非常复杂多样的。
在这个过程中,语音助手如Siri糟糕的用户体验不断被用户所诟病,例如效率不如自己动手操作、对话场景的识别不佳、容易答非所问等。
对此,来自北京的创业团队奇点机智则研发了一款专为Android生态打造的语音控制系统“小不点”。
下载App后,用户即可语音操控手机应用中的各项功能,内容可以涉及如餐厅介绍、酒店预订、打车订票、淘宝购物、视频播放、微信聊天等各类日常生活的需求。
以给好友发送红包为例,只需对着手机说“给丽丽发十元红包”,手机就会自动跳转到微信好友搜索丽丽,并打开发红包自动填入金额,完成发送。如果是通过图形界面进行操作,我们需要通过微信搜索好友,然后点击进入对话框,选择发红包功能,并点击输入红包金额。
对此,奇点机智联合创始人&CTO林德康认为,相比图形界面,语音的好处就是带宽更大,“图像界面的菜单是很有限的,我们往往会把常用的功能放在首页,而平时接触比较少的就会‘藏’得比较深”。
相比同类语音助手,林德康表示,
Siri之所以鸡肋,很大程度上是因为传统的CUI(人机对话界面)扩展功能缓慢、需要冗长的业务谈判来整合第三方API。例如微信没开API接口,其他的语音助手就不能实现语音付款功能。即使是目前做的最好的亚马逊Alexa平台,接入这一块也只是做了浅层的尝试。
一旦遇到目前还没有实现的App操作,“小不点”所具有的智能学习功能则可以发挥作用。
当用户激活学习功能后,只需按照平时的步骤操作,“小不点”会自动记录,用户日后再次下达指令后,就可以自动完成所有操作和跳转。
“小不点”自主学习功能
这也就意味着,“小不点” 不仅可以对用户开放,同时也可以提供给硬件集成商和应用开发者,开发者则需要按照调用次数来进行付费。
今年8月,“小不点”已经上线了小米、华为、联想、oppo和vivo的应用商店,并学会了对200多款应用程序进行控制操作。
据悉,这项功能则主要依托于团队在语音识别、自然语义处理、机器学习以及动作模拟技术。“我们首先通过语音识别,把用户的声音翻译成文字;再把文字进行解析,理解用户背后的意图。如果搜的是附近的餐馆,系统就会去比如大众点评里查找,如果是附近的游泳池,就会通过百度进行搜索”,林德康告诉猎云网(微信:
ilieyun
)。
奇点机智联合创始人&CTO林德康
创业前,林德康已经在Google工作了12年,他曾是Google搜索问答系统的创始人和技术负责人、Google研究院高级管理科学家。在自然语言处理及理解领域共发表过90余篇论文,研究总计被引用超15000次,曾任ACL2002程序委员会联合主席、ACL2011大会主席、ACL2007北美分会执行委员。
创始人兼CEO邬霄云毕业纽约州立大学计算机博士,北京市第十二批“海聚工程”创业类特聘专家,拥有1年雅虎实验室、8年谷歌研究院工作经验的资深科学家,拥有深度学习、自然语言处理、互联网大数据、分布式计算的丰富经验,回国前负责美国应用搜索公司 Quixey.com 搜索部门。
2015年底,邬霄云回国创业,并获得真格基金100万美元天使轮投资,以及襄禾资本和NEA 500万美元A轮投资。
据介绍,奇点机智现有不到40人的团队规模,成员来自于Google、Microsoft、Facebook等企业,毕业于北大、清华、浙大、西交、北航、UCLA等校,80%为工程师。目前,下一轮融资正在开放接洽中。
产品:小不点
公司:北京奇点机智信息技术有限公司
网址:
https://www.naturali.io
#《赋能万物 智领未来》2017年度CEO峰会暨猎云网创投颁奖盛典#将在11月28-29日于北京丽都皇冠假日酒店举行,现奖项投票已全面开启,点击或复制链接为喜欢的公司以及投资机构投票。