商汤科技副总裁杨帆:安防行业需要具备强大自我进化能力的 AI

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

商汤科技副总裁杨帆:安防行业需要具备强大自我进化能力的 AI

2018 年 3 月 31 日,由雷锋网主办的 AI 盛会 ——【 2018 中国人工智能安防峰会】,在深圳科兴科学园国际会议中心正式举行。

在会议上,商汤科技联合创始人、副总裁杨帆对商汤科技在 AI+ 安防领域的相关动态和一些思考进行了分享。他表示,AI 发展的核心还是在技术创新,但在技术落地的过程中要深刻把握行业需求;对于商汤科技而言,AI 不仅应用于安防,也应用于智能手机互联网金融等多个领域。

此外,杨帆对自训练系统在行业实际场景中的重要性进行了强调,他认为,面对大规模复杂的场景化应用,自训练系统是唯一的解决之道,它也体现了 AI 的自我进化能力。未来,包括更加精准的人脸识别、人脸行人结合、增量训练、千亿量级检索,所有这些系统都基于纯粹无监督的自训练系统达成;只有这样才能够为 AI+ 安防行业提供最大的价值。

以下是杨帆演讲实录,雷锋网 (公众号:雷锋网) 做了不改变原意的编辑:

大家上午好!今天很荣幸有机会在这里聊一聊商汤科技在安防领域所做的事情。

今天谈到人工智能,我们讲算法、算力,其核心还是技术创新。技术通过不断地向前迈进,并与行业需求相结合,为行业带来更大的价值空间和核心动力,进而推动 AI 技术真正在一些行业落地,解决我们的实际问题。

每次演讲,我都要提到商汤在博士人数和论文发表数量上的优势,因为它们体现了商汤的核心原创能力。核心原创为什么如此重要?今天,有人说人脸识别技术已经很成熟了,2014 年计算机人脸识别准确率就超越了人类肉眼,现在 4 年过去了,技术水平已经接近极限。但是,相信在座安防行业的从业者,每天听到的是”你的产品怎么识别不准”,”怎么找错了”,”是否能在夜光下做更好的识别”等等。今天大家提了很多想法和概念,但是在实际场景中真能做好吗?AI 技术确实在帮助公安系统持续不断地提升效率,但是做得还远远不够,仍然有非常大的进步空间,这就是我认为原创技术非常重要的原因。

拥有技术之后,需要关注的是如何让技术持续获得进步。只有在算法、算力、核心平台等方面进行长期性、持续性的积累储备,才能帮助我们走得更加遥远。

第三步是什么?是对于行业的理解。我们需要对行业有较深的认知,通过不断跟行业需求磨合,确保技术叠加在正确的方向,确保技术真正能给行业带来价值和改变。

商汤在技术落地过程中,涉猎很多行业,安防只是一部分。很多人不理解,说你们搞得这么不专注,精力分散,是否能把事情做好呢?通过这几年实践,我们积累了一些独特的认知。举个例子,比如说网络视频广告业务方面,商汤是目前国内最大的互联网视频及直播平台供应商,90% 以上的直播和短视频分享平台都是我们的客户。现在,随着中国视频直播平台走向全球,在俄罗斯、印度、非洲等地提供服务,商汤作为技术供应商可以通过全球不同地区的人脸数据,来提升人脸识别的技术能力。这种能力用在安防领域,就是提升了技术的适配性,让产品有了更大的覆盖性,由此可见看起来毫不相关的视频广告业务,也能给安防领域技术提升带来价值。

另一个例子,商汤还是许多手机厂商的服务供应商,OPPO、vivo、小米、华为等都是我们的客户,我们提供从前端的视觉感知、图象优化、智能相册,到智能认知的全套系统。这些技术能给安防带来什么价值呢?它能帮助我们理解,如何让算法更小、更快,并在不降低精度的情况下进行算法优化,让智能芯片或智能相机具备更加强大的能力。我认为,不同行业之间无论是数据还是技术应用上,最终会产生交叉兼容性,提升这些能力可以帮助我们在真正困难的问题上走得更远。

当然,光有这些技术还不行,落地需要跟场景进行有效结合,根据客户的真实需求定义产品。很重要的一点是,思考如何跟行业的上下游厂商共同打造更好的生态,让 AI 技术给这个行业带来价值。安防是一个非常复杂的系统,从前端到后端,从相机、传输、存储到智能分析,再到应用反馈、公安实战需求,每个环节都需要非常专业的理解能力和技能。我认为不会有任何一个厂商,能把这一套的每个环节都做得很好。怎样才能给客户提供更有价值的服务?需要所有人共同的合力,大家每人都做自己最擅长的事,形成产业闭环,一同提供更好的服务和更好的产品。

过去的三四年,随着国家政策支持,我们看到人工智能技术为安防行业带来的巨大改变。同时,安防领域也有很多新的需求出现,这些需求对 AI 的分析能力提出了更高的要求和挑战。比如,在整个场景中利用人脸识别,利用结构化的分析技术进行线索查找、轨迹还原,一人一档建设等,甚至超越视频之外的多维度数据之间的关联,这都对我们提出了新的挑战。

智能安防领域现在有大量的人脸识别技术落地,从省到市到县,在各个场景下发挥了重大价值。我一直在想,下一步是什么?今天安防的市场很大,未来这个市场会更大,之后再下一步是什么?随着核心技术能力的提升,未来在更大规模、综合性的场景,通过由事到人、由人到人、由人到事这些深层次的关联,进行更加深层次的信息挖掘和关联性挖掘,将会成为可能。

大家都知道商汤技术做得好,2013 年我们提出 DeepID,2015 年 10 月我们人脸识别技术的系统误报率控制在 E-5 次方量级。2017 年,我们在互联网金融行业进行手机人脸识别,误报率是 E-9 次方量级,对于人脸识别准确率的提升是每年两个数量级。

以抓拍机为例,每天每台平均抓拍的人脸数在 1000-2000 左右,如果希望做到一万路级别布控,误报率需要降低到 E-11 次方量级,这样一天能产生 100 多个误报。然而,我们通常不是对一天的内容进行搜索,而是三个月一个周期。这样,如果需要在总共一百天,一万个摄像头拍摄的内容中,比较准确地定位出目标人,技术的要求则要更高。

商汤的目标是在人脸识别准确率上,每年保持两个量级的提升,2018 年要提升到 E-11 次方量级,我认为未来还有更大的提升空间。当然,这里会存在一个问题,准确率的提升一方面源于算法的进步,另一方面是得益于不断累积的数据量。但是,数据累计从一万提升到十万非常容易,从一百万提升到一千万就很困难,当已经有了十亿的数据,如何提升到一百亿的数据?这是非常难的。要让技术提升保持高速,唯一解法是自训练系统。系统利用来业务场景系统中的真实数据进行训练,并在无监督的情况下进行数据反馈,能增强算法在实际应用场景的提升,为该场景提供最大化价值。

应用自训练系统进行技术提升具备如下几个方面的价值。首先,当面临更大规模、更加复杂的场景化应用的时候,确保技术有持续不断的改进空间,能随着技术积累持续进步。第二,可以避免大量的人工标注,能把性能提升的成本降到最低。第三,来自于业务场景的性能技术的提升,能确保根据算法得出的解决方案,对于该场景是最佳结果,并能够定制化地提供解决方案。第四,因为所有的解决方案,最终在客户那端完成全闭环,可以很好的解决数据安全问题。

如何进行自训练技术提升过于细节化,今天暂且不讲。我来说说训练结果,在 32GPU 或者 8 卡服务器上,通过 3 天快速反馈,商汤可以得到精度 96.46% 的世界最好结果,超过 Google NAS 和 MIT Meta-QNN,在这过程中是没有人工干预的。这样一套网络结构,如果通过科学家去设计,由人进行迭代和研发可能需要一年时间。

希望未来能有更多真正具备强大自我进化能力的 AI 进入行业,不断提升 AI 在安防行业的价值,包括更加精准的人脸识别、人脸行人结合、增量训练、千亿量级检索,所有这些系统都基于纯粹无监督的自训练系统达成。

最后,回到前面讲的内容,商汤希望把这样的一些核心、创新、有价值的技术能力,通过服务的形式标准化、模块化,并在此基础上,与上下游的合作伙伴共同打造更加完整、更加有价值的服务生态,最终为安防行业提供更多帮助。同时,希望通过技术的持续创新和改变,让今天基于事后的,在小范围、小场景内,孤立零散的抓捕、抓逃应用,未来可以扩展成为综合的、城市级的整体智能化保障和服务。这是我希望的在未来三年或者五年中能达到的目标,谢谢大家。

商汤科技副总裁杨帆:安防行业需要具备强大自我进化能力的 AI

随意打赏

锤子科技副总裁商汤科技融资商汤创始人商汤 安防科技副总裁徐立商汤ai安防商汤科技
提交建议
微信扫一扫,分享给好友吧。