从思必驰的战略思考观语音人机交互的行业格局
思必驰 - 龙梦竹
在6月29日的早上,我去到位于北京中关村梦想实验室大楼的思必驰拜访,坐在我对面的是思必驰的市场负责人龙梦竹,人机交互的基础是语音、人脸、手势、瞳孔、指纹等多种识别方式,而思必驰是专注语音识别的公司,一般而言,思必驰都是直接面向硬件企业,作为 人工智能 最底层的工具,并没有直接面对消费者的产品。
思必驰的选择
思必驰团队的早期是从事教育方向的口语研究,在2012年转型做语音识别,瞄准的方向是智能车载、智能机器人和智能家居三个领域,三个领域里面智能车载的市场渗透率最大,达到45%。而同样从事语音识别的云知声则专注于智能家居、科大讯飞则专注于智能教育模块。龙梦竹认为思必驰在早期从事了多年的口语教育工作深知教育类型产品最大的天花板是政府关系,思必驰作为 创业 企业,更希望从市场化的层面俘获自己的市场份额,汽车需量的蓬勃发展带动了车载设备的需求激增,车载环境下任何手动的操作都是不安全的因素,智能车载的语音智能因此具备强需求属性。
人工智能的未来看法
我们在看到,硬件的屏幕在越变越小,从PC大屏到智能手机;识别方式变得越来越智能,手机开锁方式从密码到图形,再发展到现在的指纹;人机交互方式变得越来越智能,社交工具微信推动了语音替代文字。当屏幕从小到无,语音成了新的人机交互中介,而微信的普及、苹果手机的Siri应用让大家逐渐适应了语音交互方式。
语音智能目前分三种,一种是闲聊的,目前市场是针对儿童陪伴的机器人都是闲聊为主,没有目的的闲聊;第二种是问答型机器人,这种机器人的特点是科普问答,它能够根据你提问中的词条进行分析并解释,这种机器人用于银行接待、景点解说较多;第三种是任务型机器人,这种机器人有较强的语义解析能力,类似一个管家,你语音调控一个管家完成对应的任务,车载型机器人就是任务型机器人的代表。
龙梦竹认为人工智能未来的两个方向是:
①随着算法技术完善和计算机能力增强,机器人不仅仅是停留在被动式输入学习的低智能层面,开始具备自我学习,自我完善的主动式、深度学习能力;
②以往都是语音智能、手势智能、人脸识别、瞳孔识别各自独立,没有深度的合作和融合,由于各个模块底层的通信协议都不同,这个调试融合的工作往往需要产品端企业去多方协调,但是我们看到上海交大实验室开始牵头做多模块的融合对接工作,这是未来的趋势,从单一智能到全面智能。
龙梦竹的烦恼
思必驰深圳对外的商务负责人是 雷雄国 ,其他非深圳地区几乎都是龙梦竹负责对外站台、品牌推广的工作,在她的朋友圈,不乏看到她国内各种场合的演讲,她戏称已经锻炼了一上飞机就能熟睡的本领。思必驰技术总部在苏州,目前大部分的人才却积聚在北上广深,思必驰尽管处于发展的风口,却面临人才难觅的困境,团队发展将近200人,而技术研发占到了将近80人,作为创业团队,如何把有限的精力集中到对的方向一直成为思必驰团队调整的驱动。
思必驰团队也做过业务上的 【瘦身】 ,SDK应用云平台在2016年前曾经提供免费的接口,免费的原因是为海量的潜在合作方提供初尝试体验,然而,2015年海量的硬件创业企业背后时参差不齐的技术对接员,在接入过程中免不了频繁的咨询和技术服务,而这些付出却没有迎来对应的业务增长,很多智能硬件未能经得住市场的考验, 【照单全收】 的经营策略在大浪淘沙的市场环境下显然是低配,思必驰在2016年初毅然砍掉了免费的SDK应用云平台这块 【赘肉】 ,转而精耕细作的长远合作。
如果从订单业绩上显示这个变化,可以简单的理解为思必驰仅面向大客户服务。例如其中一款针对远场识别,声源定位等领域所面临的技术难点而推出的“环形6+1远场麦克风阵列”软硬一体化解决方案至少订购是1000套起。除此之外,面向APP的语音服务等 【兼职】 业务思必驰也以专注的姿态给婉拒了。
环形 6+1 远场麦克风阵列
深度学习
人工智能的魅力之处莫过于机器能够深度学习,深度学习的基础是成熟的算法能力和海量的大数据信息,我们看到不同企业因自己优势和属性而定向渗透的趋势。例如:阿里的电商属性,其人工智能方向会专注电商领域,百度的科普属性,其人工智能会在科普类有建树,科大讯飞有政府的支持,会在方言保护、语音智能上有突破,而搜狗在词汇上有优势,其人工智能系统也会基于现有的优势。思必驰也不例外,基于45%的车载智能系统大数据,已经足够为他们产品更新和学习提供后续、稳定的数据基础。