发布多模态交互机器人,完成1.5亿元Pre-A轮融资的物灵科技,如何打造自己的技术壁垒?
7月5日,物灵科技在京城地标世贸天阶举办了以“点物赋灵”为主题的品牌暨新品发布会。
会上,物灵科技发布了两款新品——具备多感官交互能力的“Luka Hero”,以及轻巧便携、面向更广泛大众市场的“Luka Baby”。
同时,物灵科技联合创始人和首席执行官顾嘉唯宣布了另一则重磅消息:物灵科技已经获得1.5亿元人民币Pre-A轮融资。
完成Pre-A轮融资,估值5亿
据雷锋网 (公众号:雷锋网) 了解,物灵科技系上市公司东方网力的子公司,据东方网力6月发布的公告显示,为使得物灵智能获得较为充裕的资金以开展服务机器人及人工智能硬件的技术研发及产品化,东方网力同意 博雍智动 以 人民币 1.5 亿元 向物灵智能增资。
结合物灵智能的实际经营情况及后续发展规划,物灵智能本轮增资前估值为人民币 3.5 亿元, 本轮增资后估值为人民币 5 亿元 。
本轮增资完成后,物灵智能的股权结构如下:
发布多模态交互机器人
据雷锋网了解,2016年9月在北京成立的物灵科技是一家专注于人机交互的消费科技产品公司。由前百度人工智能研究院人机交互负责人、前微软研究院研究员顾嘉唯与前极路由、大街网联合创始人丁衣及东方网力董事长刘光共同创立。物灵的核心团队来自谷歌、微软、百度、华硕、讯飞等行业巨头。
物灵以东方网力多年累积的视频技术平台、智能算法和大数据为基础,基于深度学习的模型,全面布局人工智能的多项核心技术:计算机视觉CV、自然语言与语音NLP、情感计算AC等,结合物灵的灵性交互技术来创造生产一系列的消费类AI产品。
在发布会现场,顾嘉唯介绍了物灵“伙伴关系式交互”理念——LingUI,以情感计算、注意力系统、行为驱动三大核心技术为基础,结合了“万物有灵”的品牌理念,为此,研发团队专门打磨发布了100多个“Ling Moment”,让机器人在和小孩交互过程中更具“灵性”。
物灵科技于2017年底推出的“Luka”开创了绘本阅读机器人这一全新品类。据物灵科技提供的数据显示,上市仅半年,Luka在京东平台智能机器人绘本阅读机器人产品销量排名第一,用户好评率达到99.8%以上。
作为提升儿童用户交互教育启蒙体验的解决方案,物灵将“多模态、多感官的交互”概念应用到了智能产品中。物灵科技将“点读”交互方式搭载到了Luka Hero上。发布会现场,物灵产品负责人也邀请一位小女孩现场演示了Luka Hero的点读功能,用手指轻点绘本中的文字,Luka Hero就会识别出文字并进行讲解。
通过视觉、听觉、触觉并重的多模态交互,Luka Hero使绘本内容不再局限于“听得见、看得懂”,更能“摸得到”。Luka Baby经用户研究而设定的尺寸使其更加便携,方便让儿童随时随地都能快捷操作使用。
据透露,绘本阅读机器人Luka Hero和Luka Baby已于各大电商平台和线下体验店同步上市。
当下面向儿童早教市场的消费级AI硬件已经品类众多,至于为什么选择AI+IOT to C儿童启蒙教育领域作为切入口,顾嘉唯表示:
首先,下一代科技变化的底层主要来自于AI的变化,而AI的最终目的是为了解决效率和降低成本,也一定会带来新终端整个消费的变化。其次,顾嘉唯认为AI的技术变革会带动“人、车、家”这三大场景的变化。最终会选择“家”是因为为“车”这个场景东方网力已经投资过了,如“智车出行”“奇点汽车”。
而“人”这个场景,他之前在百度、微软已经做过很多前沿的跟人相关的产品,但后来发现很难作为一个独立的产品存在,可穿戴设备更多会沦为手机的桌面而不是一个独立的终端设备。后来他们发现,”家“这个场景更重要,纯度更高,所以选择这个场景切入,打造更能落地的产品。“我们坚守的逻辑是提供给用户好的体验商品,而不是提供给用户一个有足够噱头的demo,有噱头的demo我们以前都做过。”
物灵科技CEO顾嘉唯指出:“物灵科技正在将人格化属性和关系式交互体验赋予更多人工智能产品,使之可通过对真实世界的感知、理解、思考、决策、执行,完成与人类间更舒适的交流,从而真正实现‘点物赋灵’。”
发布会后,物灵科技CEO顾嘉唯接受了雷锋网的采访,就物灵科技的核心技术和竞争优势进行了回复,雷锋网编辑整理如下:
问题一:我有一个关于技术方面的问题,您今天提到多模态学习,据我所知多模态学习在学术界仍然是一个待突破的难题,处于研究阶段。单就其中一个技术而言,语音识别或者计算机视觉,每一个领域都有很多的挑战存在。所以我想问一下物灵在技术和算法方面有哪些创新?
顾嘉唯: 我们来分清两个概念,一个概念是多模态学习,一个是多模态交互。我们之前做的是多模态交互,现在做的是多模态学习。
就像你所说的,绝大多数做多传感器模态学习的都在学术领域,创办CMU学校的AI实验室的教授也一直在做这件事,我们投了他的做机械抓手的公司。大家都在不断的做多模态学习这件事,但今天在应用领域找不到太多的机会,所以我们首先做的是多模态交互。
Luka是一个很典型的多模态交互,我们通过计算机视觉从一个稳定的模态开始提供用户价值,当你翻开任何一页绘本,它能特别准确的识别到那个绘本,准确率能够达到99.98%以上。在识别的同时我们从感知到认知走,图像结构化做好以后就可以提问,让结构化的问题变成手指可以触达的问题。
我们在尝试着把视觉的内容做完以后再做知识图谱,把知识图谱落到视频对话当中去完成一个闭环。我们用两个相对稳定的模态当中的细分技术,结合多模态交互。这就是差异,我们不是用开放的逻辑做所谓的多模态的学习,而是用一些封闭的相对较稳定的垂类的计算机视觉完成多模态的交互。
我们并不是没有做前面这些学术界的事情,内部的算法当中正在不断的攻克这些难题。因为前面这件事情对于一个全能性的全场景都能做的机器人公司来说非常重要,但是难度很大,为什么我们要持续融资,是因为这块的投入是很大的,这些技术上的投入对于一个产品能力很强的公司来说一定能创造价值,对于纯技术收入的公司不一定能够创造价值。
问题二:大公司在技术方面的实力非常雄厚,如果百度也做类似的服务机器人,作为一家创业公司,你们怎么跟他们竞争?
顾嘉唯: 有很多跟我们类似的AI创业公司,大家都在做干大公司干的事——芯片、算法不断的迭代、平台化,这就导致有一些难度。
创业公司都很勇敢,因为资本上都很能融钱,先不说我们,先说大框架当中其他的公司,也在做跟别人竞争的事,有挑战,但是大家都很勇敢。
为什么商汤这样的公司能跑出来?是因为他在一个细分领域打造的非常垂直。哪怕BAT进入到他那个领域,也是很难的,这就是领跑优势。这就回到为什么我们一开始持续深耕这样一个很小的很细分的但是有持续用户价值的场景的原因,这是很重要的。
本质上大公司和小公司最大的区别,尤其是对AI行业而言, 一是人才,人才对应着算法 。你有多少人才就决定着你有多强的算法。其实创业公司绝对竞争力也不是那么明显的,因为大家都在融钱,同时很多在AI行业打磨了很久的人,他还是很在意场景的,他很在意你有没有端到端的场景优势,能不能在里面打磨出一个很好的技术闭环。这个时候创业公司比大公司在产品化的效率上会更高。这是第一件事。
二是平台级AI机器人的能力 。平台型的技术还是让大公司去做,因为它们越来越便宜,看一下阿里云或者百度的所谓AI平台型技术输出的能力非常非常便宜,所以我们很坚定的认为我们会跟大公司合作平台型的AI技术,尤其是在语音环节我们一定会跟大平台合作。我们在上面做好我们的产品体验、我们的渠道、我们的口碑,这是最关键的。
第三件事,我们是不是真正收集到了足够细分领域的算法。 这件事大公司和小公司在数据上没有绝对的竞争优势,因为很多AI所用的垂直数据大公司一点都没有,它是从零开始积累的,所以他们跟我们一样,并没有真正的竞争优势。我们打的不是他们核心业务的盲点,而是打的团队竞争力。
另外, 今天创业公司很大的一个优势在于它的游走能力很强, 找机会不断拓品的能力很强 。大公司的决策机制决定了在AI时代这样一个有非常多不确定因素的环境当中,它进行调头一定会受到影响。这跟互联网早期是一样的,谁都没有找到搜索引擎这样一个伟大的模式,谁都没有找到电商这样一个一本万利的模式,小公司具有非常快的调头能力,非常快的适应能力。
。