灵聚智能张胜:新兴领域发现越来越多技术问题要解决,说明方向找对了
灵聚智能 创始人 张胜 是个老媒体人,93年一触电脑深似海,爱上计算机技术不能自拔,后来办公室电脑坏了他也能帮着修。97年,张胜进入IT媒体和游戏领域,一做就是十几年。
“当年看到Siri的宣传片,我被震撼到了,心想 人工智能 已经这么厉害了!不过,后来才发现是过度营销,把我给骗进人工智能这个领域。”张胜笑着说。
灵聚智能是一家专注语义分析、 知识图谱 以及认知计算的公司,可以理解为 机器人 的大脑部分。2017年2月21日,亿欧造访灵聚智能在广州的办公室,同张胜聊了聊他在公司决策上的心得和对人工智能的看法。
无为而治的创业思路
首先,何为机器人大脑?目前灵聚智能在语音合成和语音识别上的合作商是科大讯飞,语音的识别和合成就是信息输入和输出的两个环节,而语音识别后的文字需要理解含义,并做出最贴切的反应,这一步就是灵聚智能所要解决的。
由于做的是上游技术,灵聚智能的业务便直接对接机器人公司,典型合作商例如软银机器人公司,两款机器人Nao和Pepper灵聚都是战略合作伙伴,其中Nao目前唯一配套的商用化解决方案就是灵聚的。当然,由于技术本身不受限于产品形态,目前灵聚智能的技术也对接给汽车、智能家居、玩具等类型的公司。
据张胜介绍,公司在2015年就实现了特定场景下的多轮交互,即人同机器人对话时可以就一个话题连续问答,大大提升了人机交互的体验感。
笔者在现场体验了灵聚的技术,机器人在多轮对话中表现出色,可以就某一个话题持续完成问答,其内容也并非完全引用网络数据,而是有所精简。在笔者问机器人简单的计算问题时,它竟然反问了回来。张胜表示:“这些都是有考虑到交互的问题, 正所谓AI即UI,比如数字20以内的计算问题,我们认为提问者并非真不知道答案,所以有几率触发反问,增加趣味性 。”
不过,最让笔者震惊的是, 灵聚从2012年创立,一直到2016年9月份都是9个人的团队 ,目前也只是扩展到十几人。而利用如此少的人力,能做到惊艳的交互效果,张胜给出的原因是:专注。
张胜认为:“创业要做什么取决于三点:第一点就是掌握的资源,包括人脉、财力等等;第二点是未来的方向,决定以后企业发展的深度;第三点是落脚点,也就是千里之行始于足下。”
基于以上三点,张胜当时发现自己掌握的资源很适合做人工智能底层技术,从方向上他根据摩尔定律预见到机器人产业在三到四年后会有一个爆发,于是选择了 人工智能大脑 技术,埋头苦干起来。
“我们虽然不做硬件,但是很多硬件公司跟我们合作,反而是达到了利益最大化,这有些类似道家的无为而治,并非不做,而是遵循规律,做我该做的。但是如果我做硬件,不单资金投入高,风险也更高,所以事实证明当时选择的方向是正确的。”张胜说到。
人工智能孤立技术有待融合
虽然不做硬件,但是灵聚毕竟同机器人公司是唇齿相依的关系,所以张胜对于机器人乃至人工智能都有一些见解。
张胜认为,应用层面上,目前大家的窘境就是过度吹嘘自身技术,但是在落地这一步上做得不够,成了商家孤芳自赏秀技术,但消费者不买账。
“人工智能整体是在发展初期,从AI在国际象棋上战胜人类到围棋上击败人类,其实没有本质上的变化,我们不能太乐观。而人工智能现在适合做的事情是给人们一些生活质量上的提高。所以我跟合作商说,你不要吹它是多么强大的机器人,就说是一款能讲故事的玩具,等消费者去发现更多的功能。”
在技术层面上看,人工智能的很多技术过于孤立,没有交融起来,而多项技术交融所带来的体验提升是大于孤立技术相叠加的,这也是灵聚智能技术研发的思路。
张胜直言,其实团队在深入时发现了越来越多的问题,例如语义分析涉及的自然语言处理技术尚未解决最核心的难题。不过,反过来思考,在一个新兴领域初创企业发现越来越多的问题也说明公司的研究方向找对了。张胜笑道:“ 一个在新兴领域以研发为主的创业企业,很快发现自己需要解决的问题越来越少,要么是非常牛,要么就是走错了路。 而如果是成熟行业进行创业的企业,发现需要解决的问题越来越多就不一定是好事,要么是创业前的功课没做足,要么就是在红海中发现了蓝海,这都是需要审时度势的。”
张胜虽然不负责公司技术层面具体算法,但是却对技术方向有把控,对技术思路三缄其口的他笑称, 数学和哲学给予了他解决问题的思路:很多公司使用 大数据 或干脆人工写代码的方式,但通过数学的思维和哲学的总结,可以找到很多简便的“解题方法”。 据了解,灵聚目前正在攻克的是初步实现不限定场景下的上下文动态对话,也就是功能服务和闲聊完全合一的功能,公司会在功能开发完成后对外公布。
本文作者宋少卿,亿欧专栏作者;微信:zzb0930(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。