宇视首席架构师姚华 7 年实践:揭秘“安防+AI”的道与术
3月31日,由雷锋网主办的AI盛会 ——「2018中国人工智能安防峰会」,在深圳科兴科学园国际会议中心落下帷幕。
在上午场的演讲环节中,宇视科技副总裁、首席架构师姚华发表了主题为《安防+AI的探索与实践》的主题演讲。他曾主导搭建了宇视安防产业总体架构,并参与指导580余个平安城市、330余个智能交通等重大项目。
姚华认为,AI已经成为公共安全政策中最热门的关键词。AI正在加速安防IT化3.0。安防具有很强的包容性,可以吸纳一切先进的技术为其所用,包括前两年热门的云计算、大数据,以及现在的AI。单一技术很难实现用户需求,多种技术的融合才能真正实现用户需求。
虽然安防行业里,算法已经开始大量应用,但是用户需求和环境适应性还在持续演进。在这样的背景下,AI对安防行业提出了7大挑战: 对前端、存储系统、图像智能分析、大数据、安防行业标准、业务应用、信息安全的挑战。
以下是姚华演讲实录,雷锋网做了不改变原意的编辑:
大家好,我是宇视科技的姚华。我今天的演讲题目是“安防+AI的探索与实践”,来跟大家谈谈这几年从事的AI安防相关工作。
AI已成为公共安全领域最热门的词汇,正如李子青教授在开场演讲中说的这句话:现在安防企业不讲AI都不好意思说自己是安防企业。
自2014年起,公安、政府就逐渐加大在社会治安、公共治安等领域的信息化投入,而信息化建设的关键词就是大联网、大数据、信息安全互联网、人脸智能、视图库等。
当前的环境下,人工智能正在加速安防IT化3.0。
作为最早提出安防IT化的公司之一,宇视科技在IT3.0时代的目标就是:看得清、看得懂、看得稳、看得快。
看得清:随着摄像机光学传感器的持续更新迭代,目前1080P,之后还会演进到4K甚至8K的阶段。
看得广:除了GB/T-28181的不断完善外,再到CA/T1400视图库的联网应用,以及图像安全或者视频安全处理。
看得懂:数据如何高速应用
这便是安防IT化3.0需要去完成的。
AI进来后,大家都知道前端的边缘计算和后端的云计算,全流程里面的数据也都有一个深度的变化。
过去只有视频,到现在还有图片,如果前端GPU性能较强的话,图片会越来越多,后端的图片的传输、存储、带宽、峰值都会有变化。后续的流程还包括结构化、RFID信息和物联网信息分析等,全流程变革还是比较巨大的。
我们在AI时代,既要看到AI对单产品变化提出的需求,也要看到AI对整个系统的影响。
人工智能对安防系统的七大挑战
但AI的应用,仍旧对安防行业提出了诸多挑战。
我们今天只讲主要的七大挑战: 对前端的挑战,对存储系统的挑战,对图像智能分析的挑战、对大数据的挑战、对安防行业标准的挑战、对业务应用的挑战以及对信息安全的挑战。
以AI对前端的挑战为例,摄像机和AI如何在人脸抓拍当中能够做得更快更好,前期我们都做了大量的探索。我们要解决算力和前端功耗工程性和产品性中的一些矛盾,以及在复杂环境下能够正常工作,这些都是对前端的重要挑战。
虽然现在算法已经开始大量应用,但是用户的需求和环境的适应性还是在持续演进。不是我们挑战安防标准,是安防标准要更快地让大家在标准下互联互通,让标准能够快速地在产品上落地,还有让标准更快成熟,这需要我们整个行业的人共同完成。
随着数据种类的变化,用户的业务需求和对数据分析的需求也越来越多,之前的视频阶段,我们做的只是提供看、存、查、管这些基础业务,但是现在有了这些结构化数据,各种各样的组合分析会产生非常重大的数据反应。这些需求的变化对后期的业务应用和行业生态链都会制造较大的挑战。
还有AI对存储的挑战,存储对象由原先的视频变为现在视频+图片+结构化+半结构化,我们的写读原来是10:1,为什么是10:1?一般来说,存视频的时候只要不出案件是不会去看的,所以对于存储来说,只是完成了保存不丢、查起来高效的模式。
但是当我们有这些图片结构化、半结构化数据时,想把这些数据做业务挖掘的时候,就需要1:1的模式。这里带来的挑战是,各类数据混存模式下,大量小文件导致普遍存储性能下降的问题。这个问题对很多存储系统是非常具有挑战性的。
此外,AI激活了原始数据,读写需求大量提升。分析、清洗后产生的新数据,价值大幅提升,对可靠性要求也大大提升。原来大家说大多数据都是垃圾数据,因为只要案件不发生,视频就是垃圾。但是存储了结构化数据以后,经过清洗后,它就变成了高价值的数据。
海量不同价值的数据保存后还有一个问题,所有的东西不可能不计任何代价去做,肯定是要有一个合理的存储TCO,TCO是整体的购买成本、运维成本、后期成本。
前面几位专家都提到了AI对视频图像智能分析的挑战,就是算法并行的需求。
我们能不能用一个相机就把行人检测、人数统计、机动人越线这些事情全部给做了。或者我用后台的智能分析,用一个GPU把这个库的画面全都做了,目前还不能做到一个GPU上同时跑多个算法。
目前市场上的公司在只能达到一个GPU并行跑一种算法的水平,算力也只能应用在一项任务当中。
假设派出所有很多服务器资源分别供商场和地铁出入口两套AI系统使用,按照目前的运算,其实这两个算力的资源是不能完全共享的,所以产品不均衡会导致计算资源的浪费。随着我们智能建设的增长,人脸、视频结构化的大量应用,会导致现在机房建设和机房能耗大幅度提升,如何做好这里面的平衡,也是我们作为厂家和技术提供商需要去考虑的。
安防行业从来没有拒绝过前沿技术,永远是张开双臂欢迎。那么最终哪种技术能够真正落地,还是要看实际应用情况。
此外,好AI更需要好的架构与产品。整个业界看法是,智能业务在计算存储平台和后端算力。
目前整个行业里有两种架构来做,第一种是多厂商,按1400标准来说,现在还没有把各个很细节的阶段之间的接口标准定义好。比如从前端A算法放在B算法的前端,C算法放到D智能后端,还有E智能业务。
很多客户反馈希望产品最终可以达到这个状态。
但现阶段要做到这些接口完全开放,可能还需要一段时间,可能是一年可能是好几年,甚至有可能是十年。
因为算法也是在不断地迭代更替,芯片也在不断更替,有些是通用方案,有些是专用方案,接口怎么定义,对行业来说永远是新的命题。
还有一种方案是,所有的应用案件加前后端,但它的数据是开放的,标准接口,这样就能给各个行业调度。
这两种方案方向并不代表哪个更优,只是在整个行业中,我们只能依据现有行业具体的实际情况去达到最优解。用户最终想要的结果是,产品和架构是不是带来最好的TCO效果。
宇视在SMV(安防视觉)架构上,底层是物联网基础设施,包括智能摄像机、智能卡口、电警等等,在上层是智慧化平台服务,有时空地图引擎、视图智能分析引擎、时空大数据引擎、视图云存储,这中间有一个UNISEE是输出接口。再往上属于应用平台,包括综合治理业务、公共安全业务、公安和交警业务、大安防业务。左右两翼是视频信息安全体系和安防标准,这个整体架构可以保证AI在安防业务的落地。
2016年10月,宇视第一次提出SMV安防机器视觉战略。从“让监控变得简单”到“云监控、易安防”,再到安防IT化,整个宇视的基因一直是从系统端的角度来解决安防行业的痛点需求。在产品解决方案的整体思路上,则是单产品要做到最优,自由产品的组合是要比别的组合产品效率更高。
接下来我谈谈几个产品设计的AI思考。
核心产品的代号叫“关山”,主要的产品是昆仑——视图数据中心一体机、秦岭——超融合视图云存储、燕山——视频安全准入网关、潼关——人脸速通门、函谷——深度智能摄像机、天目——智能抓拍单元。
我讲讲一个摄像机的测试。
前面已经谈到了摄像机的设计,我们的Myriad2算力是0.2T FLOPS,TX1是1T的运算能力,Myriad的功耗是2W,TX1是15W,我们会更倾向用2W的方案来解决前端的应用,来做人脸抓拍、并发40人脸检测、关键信息结构化。
这是昆仑2代产品
它应用了主流的英伟达和英特尔方案。这是一个集群应用,上面主要有通用计算板卡、智能计算板卡和大数据板卡。单机最高能做到640路人脸比对,单机最高的80路人、车、非机动车活动目标提取。
我们可以看到,之前的产品出现了噪音过高、功耗过高的问题。在用户的机房里,持续运营能力、业务能力,以及长期转化能力比较差。在新疆就遇到过一个情况,有一个厂商的智能计算服务器都烧毁了。
这提醒我们,做算力要保持平衡,让机器跑得太快就可能会出现故障。我们还用了一些集群的调度,让每一个CPU都能够被调度来做集群运算。GPU目前还不能做到像X86这样的模型用虚拟化方案,深度卷积算法需要访问GPU的内核,如果在中间加一层则会影响到效果。
随着算法迭代,对内核的要求不一样,目前大部分做的还是没有中间做虚拟化的方案。当然有些厂家做池化方式,但是具体效果还没有看到,从我个人经验看,目前的算法加中间一层可能会影响效率。所以设计这个东西的时候会考虑到高融合、高性能、高可靠。
还有一点是李子青老师提到的,需要大人工数据来做分析,我们现在做到千亿级的数据量,在设计规划和思考中,产品和用户应用和未来发展要结合起来。
我们的AI系统在鄂尔多斯的人员管控、广西来宾的人像核查系统等得到了应用。现在宇视的标定机房的月电费是28万多,今年扩建之后功耗要达到60万人民币一个月。对于算法、算力来说,我们最希望看到的是有厂商进行测试,最后会发现时间越久,几个厂家测的越相近。
AI的技术对我们未来的应用是很多的,我的演讲就到这里。 雷锋网 (公众号:雷锋网) 雷锋网
。