云知声董事长 CTO 梁家恩:目前学术圈没有任何秘密,我们的优势在于快速「做出来」
4 月 27 日,硬蛋 AI+产业峰会亮相 2017GMIC 大会(全球移动互联网大会),在北京国家会议中心拉开帷幕,同时与云知声借此机会,共同主办以「智能家居创新产业生态」为主题的 AI+产业创新的万物互联大会,探讨智能居家新生态。
并就目前智慧生活产业发展的问题和不足进行探讨,希望藉此统一行业技术和通信标准,打通产品和品牌之间的互联、互通、互认程度低的壁垒。应硬蛋科技邀请,我也有幸参加了此次会议,并在会后对云知声董事长 CTO 梁家恩先生进行了专访。
结合硬蛋平台强大的产业链优势,实现技术落地
早在 2014 年,人工智能尚未进入快车道的时候,云知声就确定了战略方向——云端芯,与著名芯片厂商高通的合作就是其中重要的一步。在云知声看来,它们最终的目标是要打通云端和终端的连接,最终从云端回到终端,实现技术落地,是必须要做的事情。
梁家恩直言,云知声一直致力于提供成熟的产品解决方案,而硬件部分并非其优势所在。要想与硬件完美结合,寻找一个拥有强大产业链优势的平台至关重要。
在 4 月 27 日举办的《中国智能家居创新产业生态》发布会上,硬蛋科技与云知声发布了详细的合作计划,双方将从产业链角度进行合作共建「中国智能家居创新产业生态」。打破目前行业各自为战闭门造车的落后模式,通过聚合智慧生活圈产业链的优质资源,构建自主、可管可控、可持续发展的智慧生活产业生态体系。
硬蛋作为科通芯城旗下子公司,是中国最大的 iot 创业平台,汇集了 2W 个创新企业、1.4W 供应商以及 2000Wiot 粉丝,在硅谷、香港、北京、上海等多个城市拥有自己的科技体验厅。依托供应链独有的资源优势,硬蛋将为其输送大量下游创新公司,此次与硬蛋的合作,梁家恩认为将很好的完成技术与硬件衔接。
智慧生活是云知声比较看好的市场
在商用领域,云知声主要专注于智能家居、智能车载系统、互联网教育以及医疗四个方向的布局。
进入到 2017 年以来,智能车载成为了各家 AI 企业关注的焦点。4 月 6 日,人工智能公司出门问问,与大众汽车集团(中国)在北京召开以「AI MEETS AUTO」为主题的媒体发布会,宣布合作伙伴关系,共同研发并应用车载人工智能(AI)技术。
就云知声是否也将和出门问问一样,更加偏重智能车载系统,以及未来它们的发展方向,梁家恩讲到:「在智能车载系统方面,实际上云知声一直在为各大车企提供相关技术支持,目前已经占据了大概 60% 的后装市场;医疗领域云知声目前已经与 30 多家三甲医院建立了合作,比如协和医院;早在 2015 年云知声就成立了教育子公司,并且大力引进了资深教育专家;在这几个领域之中,云知声比较看好的是智慧生活市场。」
随着 IoT 时代的到来,智能家居成为了各大传统家电品牌和创新团队关注的焦点。未来人们的生活会发生改变,智能生活将成为人们生活的常态。各家企业也在争相布局向智能家居方向转型。
在谈到在智能家居领域的布局时,梁家恩自豪的讲到:「经过多年的深耕,目前云知声已经与包括美的、格力、海尔、长虹、海信等众多大型家电厂商建立了合作关系,并且实现了量产。」
据国家工信部数据显示,2017 年全球智能语音产业规模将达 112.4 亿美元,复合年均增长率达 35.1%。2012 年至 2020 年,中国智能家居市场年增长率达到 25% 左右,而 2020 年市场规模将达到 3576 亿元。巨大的市场潜力,也是云知声之所以看好智能居家市场非常重要的原因。
降噪、远场识别、方言识别是技术难点
相比手势等其它方式,语音交互更方便也更符合我们日常的沟通习惯。而亚马逊、谷歌、微软、Facebook 等行业巨头纷纷以语音为入口,布局人工智能物联网解决方案,其也必然是智能家居的必争所在。
谈到目前语音交互在技术方面所遇到的难点,梁家恩认为:降噪、远场识别、方言识别是三个技术难点。
以目前电视机的语音交互为例,平时大家在使用语音控制的时候,应用更多的解决方案还是通过遥控器来实现,这显然与真正意义上的语音交互有所差距,要想更进一步,实现远场识别是技术发展的趋势。
而想要实现远场识别,在梁家恩看来,实际上考验的还是降噪能力。目前存在的技术壁垒在于,单麦克风很难解决降噪问题。那么是否和我们想的一样,多放置几个麦克风就轻松搞定了呢?答案是否定的。
梁家恩进一步讲到,采用多个麦克风的解决方案,的确可以提升聚焦能力,但对计算的要求比较高。另外,更多的麦克风,在老化程度上必然有所不同,也很难放入居家设备中,而灵敏度高低对于算法影响非常大。目前云知声采用的是双麦克风方案,而 Google Home 也同样选择了这样的解决办法。
方言识别是各家语音交互企业所面临的共同难题。目前包括云知声在内,普通话、粤语、英语等语言识别成功率普遍令人满意。而带口音的普通话、英语俚语以及一些小众方言,识别起来比较困难,只能靠大数据积累去完成,这个过程无法一蹴而就。另外在语义识别方面,由于不同领域要求的知识体系不同,需要结合垂直领域去进行优化。
云知声的优势在于快速「做出来」
相比其它语音交互解决方案提供企业,云知声的竞争力是什么?面对这样尖锐的问题,梁家恩并不避讳的回应:「目前学术圈里是没有任何秘密的,我们并不认为有什么计算方法我们看懂了,其它人居然没看懂,我们的的优势之处在于能够快速在工程上得以实现。」
最后提及企业定位问题,为什么云知声选择面向 B 端而非 C 端,比如不做 app,梁家恩说:「云知声定位于 AI 方案服务商,app 并不是云知声的强项,也并非我们的定位。我们认为 AI 应用有两个大方向:Iot 交互与大数据智能,分别对应智慧生活和智慧服务两块。」