商汤科技张果琲:没有城市视觉中枢,安防场景定制化算法只是轻量级应用
3月23日,由雷锋网 & AI掘金志主办的「第二届中国人工智能安防峰会」在杭州召开。
峰会现场,商汤科技智慧城市综合业务事业群副总裁张果琲发表演讲《智能城市的视觉中枢》。
当大部分厂商都在往前端、边缘走的时候,商汤却另辟蹊径,致力于打造智能城市的视觉中枢。
张果琲表示,这是因为商汤认为AI算法需要场景化,而场景化的过程中需要有一个中枢来进行赋能。只有具备这样一个中枢,智慧城市才能持续发展稳步落地。
张果琲指出,要想让AI场景化,助力行业解决大量问题,必须让算法持续演进。这个过程需要一个强大的平台进行集中训练,高效率低成本地推演出新的算法,这正是商汤近年来重点关注的方向。目前商汤的平台已经能够让算法进行自学习,基于场景的增量数据不断学习,持续优化。
张果琲介绍,迄今为止商汤已经拥有超过700家合作伙伴,产品也已经在十几个行业相继落地。商汤一直坚持用人工智能赋能百业的理念,而实现这一目标的最佳途径就是中枢赋能。
以下是张果琲的现场演讲内容,雷锋网做了不改变原意的整理与编辑:
大家好!今天我给大家分享的主题是《智能城市的视觉中枢》。我们认为,智能城市中需要一个视觉中枢,才能保证我们的技术持续落地,以及城市智慧化的持续发展。AI算法需要场景化,而场景化的过程需要有中枢赋能。
来自普华永道的数据显示,到2030年人工智能技术将给全球带来15.7万亿美金的增长,促进全球生产总值增长14%。由此可见,我们从事的行业拥有巨大的发展潜力。
具体到中国,已经连续三年将人工智能写进了政府工作报告。现在安防行业的年收入规模大概在五千亿左右。2030年中国将在人工智能理论、技术与应用方面达到世界领先水平,成为世界主要人工智能创新中心, 人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
我们用人工智能技术进行信息化分析。信息化有几个关键步骤,传统技术解决的是采集、传输和存储,接下来我们要做的是分析和反馈。我们现在已经采集并存储了大量信息,也能够随时获取,但如何利用这些信息呢?一方面需要大数据技术,另一方面需要人工智能技术。信息化的数据分析阶段需要用到大量技术和设备。
商汤科技初创于香港中文大学多媒体实验室,有超过20年研究积累,到现在为止有2800余名员工,150余名博士,商汤也是全球融资规模最大的人工智能初创公司。
我们有超过700家的合作伙伴,在智慧城市、手机、互动娱乐、智能汽车等各个方面都有技术赋能。非常荣幸在2018年9月份商汤科技成为智能视觉国家新一代人工智能开放创新平台,由科技部部长亲自授牌,成为继BAT和科大讯飞之后的第五大平台。2018年11月份我们的创始人还有幸参加了习近平总书记在北京主持的民营企业家座谈会,就人工智能技术做了汇报,并且提出了一些产业发展的建议。
智慧城市现在面临一个很大的问题。
城市级的整体解决方案需要面对非常多的对象,大型城市有上千万人口,上百万辆车,还有更多非结构化的对象。
城市的范围也很广,面积很大。客户采集的数据存储时间又长——现在要存储30天,以后可能是60天、90天。面对这么多挑战,如何用人工智能来解决呢?
一是要快,提高信息处理的速度;二是要在海量大数据中提炼有价值的信息。所以在快的基础上我们还要往下走。同时,快的基础上还需要准。
在一个城市里,通过视觉我们能感知到很多数据。包括智能摄像头、智能相机、IoT等前端设备都可以获取数据。
接下来,通过边缘盒子、引擎和中心端云处理的架构可以实现对数据的认知,看懂数据。之后再反馈到应用中,指导业务改善效率。
但这个过程还不完整,它还只是一个轻量级的智能,我们还需要对其进行场景化的定制。要想让AI场景化,帮助我们解决大量问题,必须让算法持续演进。这个过程需要一个强大的平台进行集中训练,高效率低成本地推演出新的算法,这正是商汤近年来重点关注的方向。
目前商汤推出的自学习系统,已经可以通过超算平台针对每一个场景和业务定制算法,并让其基于场景中的增量数据不断学习和优化,将算法开发的成本降得很低。你会觉得它是一个活的系统。衍进是我们实现整个中枢的关键。
一个城市视觉产品体系分哪几层呢?最底层是基础设施,SenseParrots深度学习平台是我们跑深度学习算法、训练人工智能的基础条件,GPU超算中心则给我们提供了算力。算法孵化器的作用在于持续不断地根据场景中的数据产生新的算法。
训练算法需要大量的算力,在边缘端无法实现。数据回流到云端后,我们通过自动化的流程,只需要输入目标就能得到想要的算法,全程只需要很少的人工介入。
上面一层是终端。我们会把基础设施训练好的算法放到终端上,跟芯片结合。只有将算法和芯片结合,才能产生最大的效率,同时以最低的成本推动其应用落地。
再上面一层是引擎。去年我们在商汤AI大会上发布了方舟这个万路级的城市视觉开放平台,今天这个平台已经升级到了十万路,除了视频还接入其他数据。这是一个大的区域级、城市级的视觉中枢,在这个视觉中枢上我们还可以开放API,帮助所有合作伙伴和厂家实现各种各样的行业应用。
这个城市级视觉开放平台可以部署在阿里云、华为云等通用架构上。当然,商汤也有自己的架构。它最核心的特点是可以实现增量训练和算法模型升级。我们知道,算法的泛化是非常困难的。而方舟系统可以用高效、低成本的方式持续不断地为客户提供算法,满足他们的需求。
下图展示了一些典型应用场景,大家都很熟悉,我就不再多做介绍了。
商汤到目前为止已经有超过七百家的合作伙伴,我们在十几个行业都有落地,主要提供我们核心的计算平台,视觉中枢系统,为所有应用行业的客户提供AI赋能。商汤一直坚持用人工智能赋能百业的理念,而实现这一目标的最佳途径就是中枢赋能。
商汤现在的业务已经遍布全国,在全国32个省市自治区、中国台湾地区都实现了项目建设,而且视觉中枢在北上广深一线城市都有项目落地,落地之后都接入了近万路视频进行分析。
现在大家对视觉技术和算法的需求正在不断升级。过去几年,人脸识别在行业中的应用非常广泛,公安系统新建了大量人脸识别摄像头,但更多过去城市建设遗留下来的摄像头我们还无法充分利用。我们希望能把这些摄像头和新建的人脸摄像头都应用起来。
我们在上海和深圳都实现了基于上万个摄像头的ReID查找,取得了非常好的效果。
我们现在已经可以做到,在模糊的视频里实现人体的高精度检索。
我知道,很多同行也公布了一些亮眼的成果,但其中很多是在特定数据集中得到的结果。就和2015年前后的人脸识别一样,虽然在学术数据数据集上取得了突破,但要在真实场景中达到同样的效果,还需要三到五年的演进。
商汤通过汇聚万路级的视频,在中心进行增量训练和处理。我们发现,基于城市级的数据,算法可以得到大幅优化,城市里的摄像头对数据进行适配后再来搜索人体,准确率可以提升几个量级。人体搜索的过程中还会关联人脸识别摄像头和大量场景监控摄像头,形成一个大网。
过去完成这项工作,需要几百个工作人员盯着几百台电脑看几千小时视频,花半年时间才能找出想要的数据。现在只需要九台服务器花十天时间搜索几千万张图片就可以达到非常好的效果。但这还不够,如果对算法进行持续不断地优化,还可以将时间按数量级缩小。
智慧城市的升级就是要构建一个城市的感知网和中枢,目前以视觉数据为主。这个中枢能够沉淀数据并升级算法,帮助我们更好地理解和预测城市的行为,进而指导各个行业的生产,保障城市高效安全运行。最终打造一个有温度,更适合人类居住的城市。
关于中国人工智能安防峰会
由雷锋网 (公众号:雷锋网) & AI掘金志主办的「2019中国人工智能安防峰会」,是业内极具影响力的AI安防论坛,致力于推动中国“AI-安防”落地融合与“学术-产业”的应用交叉。
延续上一届峰会的高水准、高人气,2019中国人工智能安防峰会再度站在算法、工程和产品的最前沿,引导安防行业认知再升级。这是海康、大华、华为、阿里、腾讯以及多个AI独角兽,因“AI安防”首次同台,峰会现场也聚集了海内外1000多位政企管理层和技术研究员,共同探讨2019年的AI安防智能技术部署、前沿算法应用与商业战略布局。
本次峰会共设置“城市大脑与边缘计算”、“世界顶尖算法应用”、“前端动态识别与智能视频云”、“城市AIoT与边缘智能引擎”四大议题,出席的15位演讲嘉宾分别是:
上午场:阿里巴巴华先胜、海康威视浦世亮、大华股份殷俊、地平线张永谦、深瞐科技陈瑞军、商汤科技张果琲、浪潮商用机器张琪。
下午场:香港科技大学权龙、原松下(新加坡)研究院申省梅、华为余虎、触景无限肖洪波、旷视科技安洋、千视通胡大鹏、腾讯李牧青、中科院自动化所王金桥。
雷锋网版权文章,未经授权禁止转载。详情见。