思必驰DUI 平台正式开放注册 语音交互系统还有很长的路要走
思必驰智能语音交互平台DUI 此前经历了漫长的沉寂研发,7月,思必驰揭开DUI的面纱,8月,正式将DUI上线,9月7日,思必驰终于正式开放出DUI 的平台注册。
1、
现场,思必驰创始人高始兴介绍了 DUI 的生态布局。
2013 年,思必驰发布国内第一个口语对话系统平台——思必驰对话工场。2015 年,开始专注垂直场景的一站式解决方案: AIOS。2016 年初,思必驰开始策划 DUI 平台,年底 DUI 升级成为公司重大战略方向之一。
高始兴表示,2014 年转型以来,思必驰专注赋能物联网 3 年,赋能无数智能终端。
这位创始人还记得他们的第一场发布会——4 年前的9月7日 ,中关村3W 咖啡,一场面向移动互联网开发者为主的平台的发布会。四年时间,思必驰一直专注于将语音对话能力搭建在平台上,赋能给移动互联网的开发者。但那个时候,移动互联网产业还在中前场发展,没有人想象到下半场具体什么样子。整个物联网大产业还在非常早的早期,不像现在有爆品、产品的普及度很高,包括整个产业链的成熟度,人工智能的成熟度、落地速度和质量等。
自2014年至 2014 年,高始兴表示,团队明显感受到整个物联网市场速度在加快,语音人工智能落地的速度在加快。于是,2014 年,思必驰将高速增长的教育业务做了剥离 。
这样从时间轴上看,2012 年、2013 年,思必驰启动面向移动互联网、物联网大市场的业务。 2014 年彻底转型,专注在物联网的大市场上(All in AI)。 2013 年,思必驰发布国内第一个口语对话系统:对话工场。
可以说, 思必驰这几年一直在根据市场的发展、市场的需求在调整具体产品和业务定位——三次定位、三次调整。
-
2014 年,软硬一体化车萝卜,将语音人工智能落地到创新端
-
2015 年开始深度耕耘细分市场
-
2016 年开始专注做 DUI 平台
此外,高始兴提到思必驰创建的两支基金—— 一个是天使基金,一个是 10 个亿的成长基金。到现在为止,思必驰基金孵化、赋能、投资了 7 家企业,包括车萝卜、慧声、 爱医声等公司 。
2、
思必驰 VP赵恒艺 进一步解释了DUI 平台的核心是什么 ?为什么做好一款 AI 产品会这么难?
在赵恒艺看来,当前行业的主要矛盾,实际上是技术提供商的定制效率,与B 端客户产品迭代的需求不能够被很好地满足。为了解决这个矛盾,思必驰推出了DUI 平台。
据雷锋网了解,DUI平台是思必驰首个全链路对话定制平台,内置AI技能商店,面向开发者提供完整的智能对话交互方案,支持快速自定义开发,主打智能车载、智能家居、智能机器人、手机助手等应用场景。
DUI相关技术负责人对雷锋网表示,DUI平台主要由产品和技能两大板块组成,包含四个子系统,第一是天机系统,支持实时的数据监测和系统反馈预警,包含数据源、数据平台、应用层;第二是青囊系统,包含运营监控、问题反馈、项目管理;第三是玲珑系统,支持跨平台、离线使用;第四是紫薇系统,包含接口资源平台,兼容AVS服务。
DUI语音对话定制的独特性在哪里呢?赵恒艺对雷锋网表示,我们支持从唤醒到识别,到语义解析,到对话管理等一系列各个模块的定制。同时,根据技能进行独立的定制,会有一个很高的扩展性。
此外,赵恒艺强调,DUI不仅支持多种形式的对话,还可以跨技能,针对各种技能之间、业务之间的跳转,以及内部技能和外部技能一系列的整合,我们都做了很好的融合。在语音合成上,既支持自己的定制,也可以提供 SSML 语言,对合成音进行个性化的标注。DUI 即将推出个性化合成音的定制,通过简单的几句自己的录音,就 可以生成一个自己的合成音。这仅仅需要几个小时的时间。
赵恒艺对雷锋网表示,技能定制是整个 DUI 核心环节,DUI 平台提供的语音识别模型不仅是通用的语言模型,思必驰在这个基础上,更是将所有技能独立得训练成个性化的语言模型。同时,我们这个训练的过程很短,分钟级的训练,我们就可以 刷新这样一个语言模型。云端发布后,马上就可以使用。
实际上,自思必驰首次预告、推出DUI语音回话定制平台,雷锋网 (公众号:雷锋网) 便有跟踪报道,此次与之前最大不同,在于GUI 交互和对话交互的融合。
比如说,赵恒艺举例称,假设搜索附近的酒店,可能会出现 N 个搜索结果,而针对这些酒店的不同特性,会存在不同信息筛选点,比如四星级、五星级,均价 300 到 500 元的不同 ,以及从哪儿到目的地去,是收藏第几个等等,非常多 GUI 的组建,都需要让对话管理和GUI 进行非常好的结合,也正因此,思必驰创造性地开发出DUI 控件,将 GUI 和 DUI 进行融合,使得每个 Button 都可以与意图对应起来。
“在安卓系统内,DUI 提供不同架构,无论前端APP的交互技术方案如何变化,都可以找到方式,使得对话管理与GUI 场景化具体融合。”赵恒艺称。
3、
刚刚加入思必驰的原阿里iDST总监、现担任思必驰VP、思必驰北京研发院院长的初敏博士,目前主要专注于拓展语音技术在物联网外的新业务、新场景的落地。她于现场再次强调,加入思必驰的最大原因,就是双方有着共同的梦想,认为智能的交互模式在未来会变得越来越重要。
初敏表示,目前的语音交互与对话智能,相对来说处在天时地利人和的时间点了,并且技术本身的效果已经开始呈现。
一方面,对深度学习来说,包括对数据的采集和获取的能力变得更强。从这点来讲, 其实是因为有了数据驱动以后,才会有了机器学习。
第二方面是要多尝试,初敏表示,今天现场的很多演示,实际在2000 年前后、初敏刚进微软的时候就有了。目前大家不论是在电脑、还是移动端所做的的所有事情都是很自然的,是随着移动设备的普及而逐渐变为自然而然的需求。
当然,初敏表示,语音交互到目前还没有出现真正特别成功的案例,原因上,初敏表示,一方面是由于行业规模还没达到, 可能还需要两到三年的时间。
其次,语音交互是一个大的系统的合成,而不是某一个单元。 这个技术要求可以运用在任何场景、任何产品,必然是一个庞大的系统工程。
。