码隆科技王海鹰:解析AI商品识别应用,我们痛并快乐着
码隆科技是一家专注于商品识别的人工智能图像识别公司,商品识别包括了很多层面,包括了商品的品类、属性等等,属性又能分为宏观和微观层面。码隆科技商务副总裁王海鹰着重分享了行业类的深度解决方案——无人货柜的案例。
关于技术和应用的思考,王海鹰说,码隆科技也经历了从技术到项目再到产品化的过程,这是一个痛并快乐着的过程。她分享了两点体会:
第一,我们真正在去做AI或者做前沿技术落地的时候,我们是经历了一个由表及里的过程;
第二,真正价值的体现需要一步一步实现,我们在谈到落地的时候,我们需要以点及面,先把痛点问题逐一突破,再联结起来看整体行业的革新。
王海鹰:各位好,非常高兴今天能够应亿欧邀请参加这个活动, 前面的嘉宾也提到了一个让我们整个AI行业在近一两年里面深入内心的一个词,就是“落地”。
人工智能从13、14年,AlphaGo开始,整个行业的兴起到现在, 我们越来越多关注从技术本身转化为关注AI技术带来的商业价值、应用场景、商业场景。 所以今天我分享内容也会从“落地”这个方向上展开。
快速介绍一下码隆科技,码隆科技是一家成立于2014年,致力于人工智能图像识别的一家公司。码隆科技从成立之初就一直专注在做商品识别,从人工智能图象识别的角度上讲,人脸识别是大家比较熟悉的,那另外一个范畴就是物体识别的场景——也就是我们所从事的商品识别。
今天我也会跟大家分享一下,商品识别到底是什么?大家可以看到,刚才讲到了计算机视觉有一个很广泛的应用, 我们把它分一下类,包括人体识别、物体识别(商品识别),还有场景识别。 码隆专注于商品识别。
商品识别包括了很多层面,包括了商品的品类,到底是快销品还是3C商品,还是服装服饰等 。
除此之外, 还包括一些商品的基本的属性,包括在什么地方生产的,包括外观是什么样子的,还有规格、商标等,这样一些商品自带的属性内容。
再进一步看的话,这些商品的属性又会有很多的层面,比如说从外观或者说是宏观的层面上我们可以识别出很多内容。 除了宏观还有一些个体上的,比如对于一个商品,哪怕是一瓶饮料,也会有很多品牌,每一个品牌可能都有不同的包装。比如像我们在服务可口可乐、蒙牛的时候,可口可乐他们每一个季节都有不同商品包装替换,还有一些主题性的,有些大的IP,他们包装都会更换,所以对于一个商品个体本身也有很多属性的变化。
大家日常生活当中看到的更多是宏观的属性,而当我们关注商品和物体本身区别的时候, 我们也会看到一些微观的场景,比如说显微成像,X光成像 ,这方面码隆也会有关注。
今天因为讲的是并不是技术本身,更多在说的是商业应用,这样的技术跟商业场景,或者跟我们一些行业的应用怎么结合。AI技术与行业应用真正的结合到落地,会经过怎么样的过程。码隆是2014年成立,到现在是四年多的时间,我们也经历了从技术到项目再到产品化的过程,这是一个痛并快乐着的过程。
首先大家可以看到,对于人工智能来说,最基础的是关于算法的科学研究,在码隆的团队里面,我们专门有一个算法团队,算法团队的工作也分成两类职能,一类职能更多是衔接我们商业的项目和衔接一些产品的支撑,还有一部分是由科学家组成的研究团队,他们更多的是做一些底层技术研究,这边列出来得比如弱监督学习、物体检测、细粒度识别分析等领域,都是他们重点攻关的方向。码隆科技致力于人工智能赋能传统行业,这是我们必须要去做的一件事情,我们要保持技术的领先性,这是一个创造性的过程,要不断迭代和提升才有可能站到行业前沿——以此提供更好的服务,赋能更多得企业客户,创造更多得应用场景。
有了这些科研成果,我们的算法模型出来之后是不是真的马上能够面向市场呢?显然不是的,我们要经过一个技术产品化的开发过程。对于码隆来说,我们在整个识别应用过程中,用两年多的时间研发了一个叫做ProductAI的技术平台,这是集成各类商品识别技术的平台,我们通过这个平台提供了一百多个基础识别模型,针对各个垂直领域,比如有专门做服饰识别的,有专门做家具识别的。此外还包括搜索服务,通用搜索只是一个方面,如果想去做更精准或者更垂直的应用搜索是要分品类的,在码隆的ProductAI技术平台上,我们是把它细化成成了服饰搜索、家具、家居的搜索,都是有专门的垂直搜索应用。
在这个过程当中,我们以这种API、SDK的合作形式服务了很多客户和合作伙伴。在过去两三年当中,我们用这样的方式,以平台化、通用化的服务与我们的客户碰撞出来了很多商业应用场景。 在这些商业应用场景里,我们通过技术赋能,帮助他们去创造一些产品,其中也包括各类ToB和ToC的应用。
随着不断的探索,我们发现应该进一步往端到端的产品化方向去做。因为做了太多定制化项目之后,我们可以大量总结出来一些共性的需求,利用AI技术去解决一些行业的痛点问题。
之前在做纯平台化产品的时候,我们一天要接到近百个电话,其中包括五花八门的各类需求,我们去做分析的时候,会发现顺应现在的AI大火之势,大家可能为了AI而AI。经过审慎分析之后,我们发现有的时候AI并不是适用所有的场景,也不是所有的场景应用了AI就一定是最经济的,只是提高了效率,但是成本可能过高,并不一定是最优的选择,所以我们也会把这个去伪存真,把一些伪需求去掉。通过这样一些项目的积累,或者这样一些经验的总结之后,我们会把它梳理成一些我们可以未来长期固化下来,标准化的一些产品,所以我们会进入到一个真正的技术和产品落地的场景。
大家现在看到的就是码隆已经在做的一些行业类的深度解决方案。大家第一个看到的是智能货柜,一会儿我会把它作为今天主要的案例跟大家分享,分享我们在整个研发智能货柜的产品过程当中,我们的一些心得和体会。
另外很重要的场景是在商超,在推动技术到商业的过程中,我们希望从一些更扎实、精细的点,由点及面做一些真正可以落地,可以真正产生商业价值的事情,比如自主结算、资产保护和辅助称重 。 我们的技术现在已经在国内和国外的超市进行了落地应用,让B端客户感受到在不提升很大成本的情况下大大提高效率,让C端用户充分感受到技术对生活体验的提升和优化。
同时,我们也有门店洞察的解决方案,我们专注于商品识别,微软提供人脸识别 ,我们共同打造了这样一个解决方案,在保证隐私和数据安全的前提下,让门店和管理者更加系统化地了解自己的顾客。我们在与客户合作过程中,遇到了很多类似这样的需求。
前面这些更多是在智慧零售的方向,同时我们也依旧以平台为介质继续提供技术赋能的服务, 大部分的客户是各类电商平台,我们的技术可以支持他们在自己的产品重快速的实现以图搜图和相似推荐等一些功能 ,我们的标准的接口可以帮助这些电商平台在最快两三天之内就可以把整个图像搜索的引擎搭建起来。
另外还有对商品的深度识别,这边的应用不是在零售场景下,而是我们另一个专注的纺织服装行业。 码隆不仅可以识别服装本身的颜色、款式,我们也在深入到生产端去做一些纤维检测。比如我们每一件衣服旁边都会有一个标签,这个标签里面都会标注含纤维的比例,这部分内容都是要经过专业的第三方机构检测,要人工通过显微镜下的成像一个一个去看,这对他们来讲也是一个很大的人力压力,一个资深的检测员需要有三到五年的培训和工作经验,我们现在是通过人工智能的方式进行辅助识别,将一个切片的识别时间由半小时降到秒级。所以这部分是深度识别的应用的一些场景。
码隆科技商务副总裁 王海鹰
刚才从整体架构上介绍了我们正在做的事情,接下来分享一个具体的例子析——关于智能货柜的解决方案。从最初的无人货架开始,应该说是2016年的时候开始无人货柜也算席卷了中国一圈,新的商业场景吸引了大量的资本和创业者。如今大家回过头会发现,无人货架的商业模式中有一些先天不足。无人货架的一些企业倒掉了,但还有一些在继续坚持和探索,大家更多在往新技术的角度考虑,不能光靠考验人性来实现商业价值,我们还是要提供一些技术和能力,帮助大家真正让整个新的场景成立,我们做商品识别,我们自然而然就开始进入到这样一个项目当中。
整个无人货架或者无人零售这个概念,从个体来讲,更多强调是用户消费者的体验,我们认为无人了,没有人去干扰你,可以自助的选择商品是一种更自然的消费体验过程。我们从2017下半年正式开始做这个产品,我们经历了一个从超级兴奋,到非常困苦,再到希望重燃的过程。这次概念初兴之时,大家都认为找到了下一个风口,所以我们非常兴奋投入到这件事情里面去。但实际上我们做进去以后才发现,这是一个复杂的过程。
我们大概是在2018年3、4月份的时候,我们第一台样机已经出来了,我们当时很有信心,因为我们算法很牛,我们很快把样机做出来之后放到市场上做验证,其实验证过程当中,是蛮多痛苦的。 我们发现这里有很多我们意想不到的问题,锁的问题,节电的问题,安全的问题。我们才意识到,作为一家人工智能公司,我们更多擅长做软件和算法层面的事情,真正要把这个算法应用到实地场景当中,离不开整个冷柜硬件的介质,有很多实际的复杂情况发生。很多问题并不是我们擅长能够解决的。 我们曾经异常兴奋,我们可以把算法很好的移植到硬件当中去,我们应该很快就能赚到钱了。实际上我们发现不是这样,因为算法再好,如果没办法持续的在这样介质或者在这样环境当中去运行,商业价值就没办法体现。
后来我们就开始找合作伙伴,我们找硬件的合作伙伴,运营的合作伙伴。最后我们确认了与海尔的合作。市场上很多硬件厂家与算法技术公司的合作,可能更多采取是OEM的形式。所谓OEM的形式就是公司直接采购硬件厂家的柜子,定义好产品之后,厂家只是去组装,组装好了之后把它放到市场上去。投入市场才会发现,硬件厂商帮他们组装出来的硬件,前面说到的这些问题依然会存在。而我们跟海尔的合作模式是一种联合开发的模式,并不是OEM而是跟海尔成为纯粹的合作伙伴,我们一起打磨我们硬件, 我们会发现算法的识别是受制于环境的影响,所以你在一个冷柜里面要去考虑灯光,摄像头等各种各样问题。比如说防雾的问题,比如色温的问题,比如曝光值的问题等等一系列问题,都必须跟硬件厂家做非常紧密的配合,双方都贡献自己的专业知识和经验,才能找到解法。 我们一次又一次做实验,到底什么样的曝光值是能够稳定的,硬件层面上可以稳定住,同时又能符合我们算法识别的要求。海尔的产品质量认证体系是非常严格的,他们有40多项质量认证体系,为了通过整个认证体系的认证,符合标准,联合开发团队共同探索出一个方式能够让海尔的生产人员去验证摄像头的各项指标,各方面指标是既符合算法识别要求,同时又是硬件的厂家能够接受的,甚至连这样一些测试标准和测试方法都是码隆跟海尔一起研发探索出来的。
就智能货柜这个产品来说,其实我们做的是一个既To B又To C的工作。因为智能货柜是给终端消费者使用的,大家看到也都是终端消费者多嗨多爽,实际上真正要实现这个嗨,实现这个爽,并且能够稳定、持续的享受下去的话,我们在背后做了大量的工作。所以我想说,AI技术在真实应用场景的落地,不仅仅是一个优化消费者购物体验的过程,也是和行业上下游不断合作,从无到有的一个创造性的过程。
接下来,也想在另外一个层面上跟大家分享,也还是从智能货柜这个层面来说,到底AI识别的未来是什么?或者价值是什么?计算机通过将商品识别认出来是一瓶可乐,还是矿泉水,还是酸奶,识别出来以后可以直接实现付费这样一个购物体验,是否仅限于此?大家可以看到,这是我们做的货柜,是一个整体解决方案,一个端到端的产品,如果仅仅有这样购物的体验是不够的, 我们要去考虑整个价值链当中,消费者仅仅是最后一环。再往前面要考虑运营上货的需求,你要考虑运营商的需求,再考虑品牌商的需求,还有一些新物种平台运营的需求。在各个层面我们需要满足他们不同的需求。
大家看到我们的智能货柜,针对品牌商客户来说,这个柜子首先是一个数据采集器,要能够通过数据的采集实现对实时销售动态库存的了解,包括一些补货信息、客单流量,是需要通过货柜把这样的数据采集上来,此后,我们可以实现的是后面这样一些数据的管理,包括纯净度管理、陈列规范、设备监测等,一些IOT层面的管理。到最后面我们有了这样数据的搜集、分析之后,可以支持他们再做一些品牌策略上的决策。
其实最初的时候,我们只是做了一个核心系统,当时我们认为只要我们把最擅长的做好就可以了。实际上大家看到,我们真正完成这个产品的时候,包含了前端的摄像头、灯光的控制,包括云端或本地的整个识别系统,还有数据终台以及后端商品运营和商户运营商的管理系统——这才是整个最终完成的产品化的解决方案的系统,比我们最初预想的要复杂的多得多,却也实用的多得多。
码隆科技商务副总裁 王海鹰
我想用这两句话结束我的演讲。 第一,我们真正在去做AI或者做前沿技术落地的时候,我们是经历了一个由表及里的过程 ,真的要做到深度关联垂直行业各个层面的时候,我们才能真正实现技术的落地。
第二,真正价值的体现需要一步一步实现,我们在谈到落地的时候,我们需要以点及面,先把痛点问题逐一突破,再联结起来看整体行业的革新 ,做好商品视觉数据结构化,这样数据的价值才能够挖掘和体现出来,才是真正落地的价值。
今天我讲的内容就是这么多,谢谢大家。
本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。