博云视觉陈杰:用图像大数据,助力人工智能产业落地
5月16日,由枣庄市人民政府主办的第四届山东省互联网大会在枣庄市会展中心开幕,亿欧承办了 人工智能 专场,分享嘉宾包括中科院-自动化所研究员-宗成庆教授、亿欧-联合创始人-王彬、百度- 云计算 事业部总监-闫东、中科汇联-董事长-游世学、翼菲自动化-研发总监-孙同亮、好买衣-联合创始人-谭宏冰、云从科技-联合创始人兼CEO-姚志强、英飞尼迪-山东基金总经理-丁晓波、 博云视觉 -创始人-陈杰。
人工智能在汽车、安防、警务、医疗、金融等各个行业都有落地,它在每个行业里面有哪些发展?后面的投资机会在哪里? 本次圆桌讨论环节主题就是“人工智能的产业落地思考”,参与讨论的两位嘉宾分别是博云视觉创始人陈杰博士、英飞尼迪山东基金总经理丁晓波先生。
陈杰博士是北京大学计算机应用技术专业博士,在计算机视觉领域发表论文24篇,申请国家发明专利19项,获得教育部技术发明一等奖。 以下内容根据陈杰博士的讲话速记整理(有删减) 。
看好 图像大数据 的未来
陈杰 :博云视觉成立于2015年12月,当时是依赖于北京大学围绕图象搜索方面的技术,思考进行产业化的落地。从2010年开始,我跟我原来在北大的团队一直在做一项国际标准的制定,这项标准当时瞄准的是, 未来在移动互联网时代,图像 大数据 一定会在五年内成为大数据的应用。
在这个背景下,2010年我们制定了这项国际标准,做完这项标准之后,我们的专利技术也占了整个国际标准中的一半以上。后来我们把这项技术在国内推广,百度、腾讯都采用了这项技术。2015年的时候,我们就思考把这项标准化的技术落地到实际中,成立了博云视觉这家公司。
博云视觉成立一年多的时候,我们围绕视觉大数据技术,在各个行业,包括 新零售 、安防、医疗、金融等各方面进行思考:哪里有图象大数据?哪里对图象大数据有需求?我们做了很多实践,过去一年中,也看到了很多产业化的具体落地。
初创企业没有数据怎么办?
主持人 :作为初创企业,有数据才能把算法做好,但一开始就没有数据怎么办呢?
陈杰 : 人工智能只是一项技术,肯定要在数据基础上解决问题。 当然数据那一方也有它的需求,光有数据,没有技术也不行,两者本身就是可以结合在一起的。
数据可以分两种,一种是来自于国家的数据、各个行业内的数据,它们的归属方都是国家。比如说来自于交通、电力、医疗行业,都是公有的数据。针对这种数据,我们会和传统行业进行合作,通过我们的技术,解决海量数据中的精准识别。
另一种是个体的数据,就像BAT可以通过平台整合数据,或者是一些其他App来做数据整合,在这个数据基础上做挖掘分析,甚至可以在数据基础上建立自己的模式,再进行发展。
对于我们初创公司来说,当前的模式不做数据,没有数据的积累,但我们还是面向这类B端的用户,开放我们的技术,目前开放成一个公有云的平台,所有数据方的那些应用可以记录到我们的平台。
举个例子,我们有一个用户是做红酒搜索识别的,一款红酒,我需要精准了解它的年份、产地、价格、酒瓶等信息。三年前刚合作时,它的数据量只有十万这种量级,但是我们提供这样一个搜索引擎,基本可以做到拍一张照片上传到云端,直接就可以返回数据中心。
我们合作之后,他们也在建立数据集合,目前已经达到500万量级,针对红酒这种垂直类的应用、特别刚性的标准数据。目前我们也在商讨,基于这一类积累下来的红酒数据,怎么做未来数据的变现。这是我们在非国家类数据上的合作方式,也是我们作为技术公司没有数据,光有技术的运作方式。
选择怎样的领域,才能不被巨头吃掉?
主持人 :无论图片、语音还是技术,巨头都掌握着最好的资本、最好的人才。要选择怎样的一个领域,才能够不被巨头吃掉呢?
陈杰 :在人工智能这个方向,从技术的角度看,大家都是平等的。核心在于是否解决了需求,其实是看数据的来源。从这个角度看, 即便是小体量的公司,也跟百度一样处于同样的起跑线,只不过你有你的领域,他有他的领域。
在具体应用上,各行各业都需要这样的技术,能够解决他们的需求,巨大的市场一定可以容忍你做更多细化的应用。所以我觉得我们的机会也非常多,可以在很多细分的领域找到一个切入点。
从目前的技术到集成、到芯片,得走多久?
主持人 :你们的产品,你觉得从目前的技术到集成、到芯片,还得走多久?
陈杰 :当初做这个产品的时候,它是一个很基础的工具,各行各业都可以用。我们当时做这项标准的时候,面向的是一个芯片化的应用,我们希望将来所有的终端设备上,包括手机、摄像头、 机器人 都有这款芯片,但是这个芯片不是 深度学习 ,是另外一款做图象特征的提取的芯片。
我们这么多年积累下来,所有算法都是芯片级的算法。我们的重点是做基于图象特征,面向大数据的应用中搜索引擎类的产品。如果要面向定制化,可能这个搜索引擎在用的时候,是一个很通用的搜索引擎,但是到目前为止,图象搜索的用户体验不是很高,所以我们觉得肯定要垂直到各个行业当中。
在过去一年,我们也是在各个行业去推,用户初步用的时候,大概准确率、性能只有50%~60%,但是这个指标已经算高了;第二步的目标就是通过另外一个定制化的服务,把50%~60%的性能做到90%,甚至更高的准确率。
过去一年服务各个行业之后,我们为了提升优化的质量和响应的速度,自己会开发数据处理工具,包括算法训练工具等。各种工具做完之后,可以把我们自己对客户的服务周期,从原来的好几个月缩短到一周内,实现标准化到定制化产品的转变,帮助用户解决最终需求。
落地传统产业,具体的合作模式是什么?
主持人 :对于传统企业来说,是直接做一个专门做人工智能的部门,还是主动跟技术公司合作建立分公司,还是说直接购买技术?最后会是哪一种模式呢?
陈杰 :我有一个案例,是电力行业,可能是一个相对封闭的市场。他们内部出现了一个痛点,大家知道电线经常会受到外力的干扰,尤其春天的时候,大家都在施工,可能因为吊车施工,电线会掉落,所以电力每年都是上百亿的损失。
他们的做法是,在一个城市里面装几千个摄像头,监控电线周围的环境,看看有没有吊车出现,或者有外力干扰的行为出现。现在有8000个摄像头的数据,靠人工的方式,雇了五六十个人,24小时天天看,可以想象人工成本是非常高的。但是他们没有这方面的人才,也没有这方面的技术去解决这个痛点。
有两种方式,一种是找高校合作,一种是找企业合作。过去找高校合作有一个大问题,高校可能更倾向于研究问题,包括深度学习,高校都不愿意研究这种问题,因为它没有研究的价值。所以遇到这种问题的时候,公司层面应该更能解决。
我们大概一个月前介入,因为有大量的数据,我们快速实现了迭代,大概一个月的时间就把这个准确率做到了90%多,人工监控基本都能去掉。
他们希望能组建一个人工智能的事业部,因为这个行业里面数据太多了,都需要处理。但他们也遇到一个问题,算法人才不好招。所以最好的做法还是保持服务的方式,我们提供这样的服务帮助他们去解决问题。
能抓到“老鼠”的技术都是好技术
主持人 :后面的哪些技术能够进入人工智能的浪潮,成为它的辅助,推进它一直走下去?
陈杰 :我是做人工智能技术出身的,在深度学习之前,我本身不是研究深度学习技术的,但是这一波浪潮确实引起了极大的关注。
人工智能只是一个工具,只不过这种工具特别适合现在大数据时代的需求,能解决大数据里面的种种问题,大家能感觉到它带来的福利,不像以前的算法整了半天,这个好一点,那个差一点,都不怎么样。
但是运用到一定阶段的时候,也会发现一些瓶颈。 我们得出一个给论,在各个行业都有类似的结论:深度学习可以做到70%、80%、90%的准确率,传统的方式可能做到50%、60%,两者结合就有可能超过90%。
我们是两种方式合在一起用,最终是一个整体的解决方案,会达到一个高于90%的准确率。所以我觉得深度学习是带动一系列的,传统的技术也不一定没用,结合在一起都能用。
但是有些特定的领域,比如说 无人驾驶 ,或者是室内定位导航,这些技术都不是深度学习的技术能够做的。所以并不是说深度学习什么都能解决,但是我觉得深度学习能解决大数据里面所面临的很多问题,在结合传统技术以后,能解决更多的问题。 我觉得所有的技术没有好坏,能抓到“老鼠”的都是好技术。
本文作者李鹏,亿欧专栏作者;微信:lip19910214(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。