码隆科技创始人兼CEO黄鼎隆:新零售全视觉方案的正确“解法”
4月17日,以“进击•融合”为主题的猎云网&AI星球2018年度人工智能产业峰会在深圳大中华希尔顿酒店隆重召开。此次峰会由猎云网&AI星球主办,锐视角、猎云资本、猎云财经、创头条、蜂巢协办。上百位人工智能行业顶级专家、知名投资人和精英创业者与会,就当前国内人工智能行业的创新变革与机遇展开交流。峰会现场干货满满,座无虚席。
码隆科技创始人兼CEO黄鼎隆在会上做了以《一眼洞穿:新零售场景的纯视觉解法》为主题的演讲分享。黄鼎隆认为在零售市场,RFID、重力感应等等带来的运营成本会大大高于一个简单的摄像头。而为什么一个摄像头就可以让一个柜子变成智能货柜,实际上是摄像头背后的数据使他变成了一个云端大脑,正如玛隆研发的ProuductAI。
为商品识别设计而生的ProuductAI能做到3点。
一、商品是无穷无尽的,大家总是有没有见过的商品。ProuductAI可以做到只要给他商品,只要这个商品带有一定的包装。它就可以马上就可以把这个商品检测出来,即使它之前没有见过,对商品识别的事情可以做到举一反三。
二、如何对噪音数据进行有效的处理问题上,玛隆科技曾在Webvision比赛上,码隆科技获得第一名,击败了其他全球一百多个科研机构,包括著名的公司、Google赞助的公司等等。噪音数据处理也是玛隆科技很有特色的技术。
三、商品背后有各种各样的属性和场景,拿拍照一件衣服来说,ProuductAI会给出衣服的各种属性,比如衣服的领型、袖型,是什么风格,是不是小清新,它上面有什么图案,颜色是什么,等等的属性都可以识别出来。
以下为演讲实录,猎云网(微信:
ilieyun
)整理删改:
大家好!
码隆科技4年前开始做的时候,说我们要做商品识别。当时投资人不明白,什么是商品识别?好像都是做人脸识别,识别人脸用在安防或者金融,商品识别是什么?4年前我们也说不大清楚,我们只是有一个感觉,我们认为人工智能最大的应用场景应该在实体经济,而不仅仅是在跟安全相关的场景。
实体经济中,各个行业围绕不同的商品在运行的,比方说纺织服装也围绕服装产品运行等。如果我们开发一个人工智能,这个人工智能像各个行业的专家一样看懂商品,这个人工智能一定非常有用。我们当时抱着这样的信念,一直持续地做商品识别这方面的研发。很幸运的得到了很多投资人的支持,过去每年都完成了一轮融资。
刚才主持人提到新零售的风潮起来,新零售在零售的场景是各种各样的产品,以前要人识别商品,然后收多少钱。现在AI比人做得好,所以我们推出基于商品识别技术对新零售的解决方案。今天很高兴趁这个机会来给大家介绍我们怎么用商品识别的人工智能技术来给新零售赋能。
首先看一段视频。这是一个普通的冰柜,我们在冰柜上面简单的加了一个摄像头,这个冰柜就变成智能冰柜,用户取出里面的商品之后,自动识别出用户拿了什么。也可以适配各种复杂的产品,比如拿出来看一下,不喜欢放回去等等。只是通过简单的摄像头就把这样的传统冰柜变成智能的冰柜。放错位置的也可以识别出来。
要做到这样的智能货柜只需要给柜子装一个摄像头,这是我们在北京拿了一个开放式的货架,在现场演示各种商品的识别。大家在市场上有看到一些智能货柜,智能货柜通常都需要非视觉的方式,比如重力感应、RFID,这是成本,重力感应模块的成本比较高。
如果是需要RFID,射频的标签是需要持续消耗,还需要比较高的运营成本,或者需要高清的摄像头。运营过程中需要收集无噪声的数据,需要上货人员精准上货,柜子的尺寸是固定的。这是市面上的智能货柜。我们认为的智能货柜不需要这么复杂,就是柜子加摄像头。我们可以省去重力感应模块成本,省去电子标签的持续消耗,只需要普通摄像头,我们在训练端只需要普通的数据就可以,各种尺寸的柜子都可以适配。
为什么我们可以做到?一个摄像头就可以让一个柜子变成智能货柜?因为摄像头的背后连上非常聪明的大脑,我们放在云端的大脑,这是一个叫ProuductAI这样的大脑。
ProuductAI是最懂商品的AI,是专门为商品设计的人工智能。这样的商品识别的AI为什么可以做到这样?基于几个原因:
1、商品识别技术领域的持续投入,我们过去4年只专注做一件事情,就是做商品识别的人工智能技术的研发。我们应该是这个世界上投入研发资源最多的公司。像AlphaGo,它看了很多棋谱,它开发出超越人类的能力,脱离棋谱,创造出创新的下棋方法。而ProuductAI现在在数十亿的数量的商品的数据的训练下,它现在也演进出了一个能力,这个能力就是世界上所有的商品,哪怕它没有看过,它也能够把这个商品检测出来。因为商品有一个特点,商品是无穷无尽的,你总是有没有见过的商品。而现在ProuductAI只要给他商品,只要这个商品带有一定的包装。大家可以现场扫二维码,或者点网页,可以提交任何商品的照片,ProuductAI马上就可以把这个商品检测出来。这是现在世界上唯一可以做到这个事情的人工智能,对商品识别的事情上它已经可以做到举一反三了。
2、在商品识别的世界有个问题。商业的世界是没有绝对干净的环境,这给这个技术带来一个困难,我们收集到的数据总是带有噪音的数据,很难获得绝对干净的数据,如何对噪音数据进行有效的处理,这是我们非常有特色的技术。我们的任务是训练AI识别出图片里面有什么,有一个叫Webvision比赛上,码隆科技获得第一名,全球一百多个科研机构、著名的公司参赛,Google赞助的比赛,码隆脱颖而出,获得第一。把这样的技术用在货柜,就会带来非常非常有用的特性,我们可以把货柜本身作为一个商品数据的收集与训练器,如果是其他的技术,你可能需要把其他的商品放到一个盒子里面,要保证非常干净的背景是要拍摄各种各样的图片,你才能去训练一个模型,而我们不需要。我们把这个商品放在柜子里面,虽然柜子的背景很复杂,有各种干扰,没有关系,这些干扰的数据足够让我们训练出非常好的识别模型。
3、商品识别的理解能力,你放一个商品仅仅认出来不够,商品背后有各种各样的属性和场景,比如衣服为例,你仅仅识别出这是一件衬衣,这不够。大家扫描这个二维码可以到页面识一下,你可以随意拍摄一个人的衣服或者上传自己的自拍照,我们会给出衣服的各种属性,比如衣服的领型、袖型,是什么风格,是不是小清新,它上面有什么图案,颜色是什么,等等的属性都可以识别出来。它像专业的服装设计师一样可以看懂衣服这个商品。另外商品所处的场景非常重要,一个智能货柜,这个柜子摆在会议室还是游乐场,还是摆在火车站是不一样的。而ProuductAI也具有对商品识别的能力,大家扫描这个二维码或者登录这个页面,你拍现场的图片试一下,ProuductAI马上就会告诉你在会议的现场,对于场景的理解也是ProuductAI高出别的AI很多的能力。
针对商品不同属性和不同场景的识别能力,我们还可以在智能货柜上衍生出很多不同的能力。如果它占这么一块地方,它的增值不应该仅仅是卖货部分,还有新的商业模式。比如精准广告,如果在货柜上放一个屏幕加摄像头,这个摄像头可以识别出货品前面的人,它是穿着运动衣的男孩,我们就给他推送脉动。如果是穿情侣装的情侣,就推优乐美。这样可以进一步提升货架的商业价值。我们的收费模式非常简单,我之前给大家演示了一个货柜,但是我们卖的不是货柜,而是解决方案。解决方案根据你的柜子或者场景,大柜子需要多一些摄像头,小柜子需要小的摄像头。我们的收费按照摄像头的个数,每个摄像头每个月50元,所以是各种尺寸、各种场景的柜子都可以改造成智能的货柜。
ProuductAI的功能远不止如此。我们看到刚才的货柜,AI在里面做的事情是收银员,收银员是看一眼知道你收多少钱。收银是最后一步,收银之前还需要导购,给你购物的建议,你需要店长来决定这个店进什么货、怎么进行陈列,还需要生产商品,生产前还需要进行商品原材料的选购,再之前还要进行商品的设计。而ProuductAI是可以在整个链条的每个环节进行赋能。
下面再举一些其他的例子,基于ProuductAI,刚才的是SKU几十个、几百个的场景。这是基于ProuductAI给大型超市,几十万SKU的超市做的无人结算的解决方案。你只要把货品放到购物车,你推着购物车到结算的地方,只需要通过一个摄像头就可以识别出购物车里面各种各样的商品,你可以随意摆放,瓶子无论是横着还是竖着放,甚至倒着放都可以。罐子也是如此。可以看到这里面的场景很复杂,由于我们对噪音数据的处理能力,像这样放在塑料袋的苹果也可以准确识别有多少个苹果。
收银之前的导购,这是我们开发的另外一个原形,我们把ProuductAI和可穿戴设备结合起来,我们在Hololens开发的设备,你戴上眼镜可以看到顾客身上穿的衣服卖多少钱、是什么牌子,你可以看到它身上黑色体恤和店里的牛仔短裤搭配,你就可以给顾客推荐相应的搭配商品。通过这种方式可以快速把初级导购变成高级导购,也是AI赋能的场景。
虽然演讲的开始就给大家演示了货柜,我还是想强调我们并不是货柜的生产者,我们是智能零售的赋能者,不管你是货柜的运营商还是货柜的生产商还是超市还是其他的零售商,我相信ProuductAI都可以帮到你们,如果大家感兴趣可以扫描二维码来进行商务接洽。谢谢!