专访清华大学王生进教授:做好 AI 科研,做精 AI 技术,做强 AI 产业,做成清华人的 AI 理想!
编者按:
“行人再识别(ReID)”可能成为继人脸识别算法之后又一个“热点”算法。(行人再识别又称行人重识别)
随着人脸识别技术在各场景的广泛应用,后者对人体特征和身份核准的算法需求更为“理性”,对非人脸识别技术的刚性需求日益迫切。
“行人再识别(ReID)”算法技术在这个时机点走进了AI算法的时代视野。
当前诸如旷视、依图、商汤、云从等AI独角兽企业,刚刚将安防监控调整为机器视觉的华为、视频监控巨头海康、大华等厂商都在各类学术期刊、科技媒体等渠道发表“行人ReID”相关技术论文和相关产品和应用方案。
特别值得关注的是,2019年10月22日,由深圳市政府直接主办的首届全国人工智能大赛拉开帷幕,大赛共两大主题赛事,其中一项就是“行人重识别(ReID)”。
从相关学术论文资料了解,十年前清华大学媒体大数据认知计算中心的科研团队就开始了“行人再识别ReID”研究,2010年开始获得国家自然科学基金资助。多次获得国际国内优秀论文和相关知识产权认证。
适值清华大学109周年校庆之际,雷锋网AI掘金志采访到清华大学王生进教授,走进了 “行人再识别ReID”研究成果丰硕的研究室,走进了清华人的AI算法世界。
王生进教授带领的清华AI团队的学术研究与成果
1985年,王生进毕业于清华大学无线电电子学系,前往国外留学后,2003年回国到清华大学电子工程系从事人工智能、机器学习和图像处理领域的科研和教学工作,先后参与了十多项国家纵向项目和数十项企业横向项目的研究和开发工作。
其现任清华大学电子工程系博士导师,清华大学媒体大数据认知计算研究中心主任,紫为云·清华AI使能平台首席科学家,北京信息科学与技术国家研究中心跨媒体智能创新团队负责人,危爆物品探测与扫描国家工程实验室副主任,中国图像图形学会视频监控与安全专委会主任。
他提出了基于深度网络的特征空间正交优化理论及深度特征学习方法,以解决深度特征冗余的问题;
他首次提出一种特征图层配准方法,有效解决了非刚体行人再识别中的特征配准问题;
他提出一种融合表观与步态特征的基于选择排序学习的行人再识别方法,有效利用时空信息融合提高了行人再识别性能;
他指导的博士生郑良的博士论文获得中国人工智能学会2017年优秀博士论文,相关研究获得了2018年国际模式识别学会ICPR2018最佳论文奖。
2019年10月,其主导研究的“跨视域行人再识别的特征学习理论与计算研究方法”还获得“第九届吴文俊人工智能科学技术自然科学二等奖”,团队成员包括郑良、田奇、李亚利、孙奕帆。
王生进教授组织创建了国内大型多镜头测试数据集和训练数据集Market-1501,所构建和发表的该研究领域三个大型公开数据集总下载量逾13600次,单篇论文谷歌学术引用超过1000次。
随着行人再识别技术的不断突破,跨视域摄像机行人目标跟踪的瓶颈问题或能得以更好解决。
在2017年第十六届中国国际公共安全博览会(CPSE安博会)政府管理论坛上,王生进教授发表了题为《人像态视识别及其在智能视频监控中的应用》的报告,提出了人像态视识别的概念,丰富了跨媒体智能理论框架,指导和推动了跨媒体智能在公安警务、社会治理、AI医疗、智能制造、AI商业等领域的应用。
王生进教授获得2019年第九届吴文俊人工智能科学技术自然科学二等奖
王生进教授所带领的清华AI算法团队,致力于计算机视觉、智能视频和生物特征识别理论、方法和技术的研究,在人脸识别和行人再识别ReID研究领域取得了多项国际前沿成果。
2006年、2008年,他们分别获得了北京市科学技术奖和国家科技进步奖,参与制定了中华人民共和国公共安全行业标准《安全防范系统生物特征识别应用术语》和国家标准《安全防范视频监控数字视音频编解码技术要求(SVAC)》。
除人脸、行人再识别算法技术研究外,清华团队在车辆、场景与物体、掌纹生物特征识别,语音识别,文字识别,辅助驾驶,机器视觉,工业智能等方面也有诸多的算法研究成果,建立了跨媒体的多维智能算法体系。
采访问答实录
AI掘金志: 国内这几年出现的人工智能企业,有一个相似的特点:大多是从院校、实验室出来的学科带头人,他们在科研方面都做到了世界顶尖水平,但在市场实践中都表现得差强人意。针对产业界与学术界的人工智能研究,作为清华AI科研人如何认识和理解?
王生进教授: 学术研究侧重理论,关注技术的前沿性探索,从研究中寻找并构建相关的方向、方法与理论体系。
产业研究侧重应用,依据相关技术理论实现产品化、应用化落地的方法与流程体系,并且关注实现的成本。
这两种研究可理解成上下层的关系,也是各有所长,互为因果,相互促进的关系。
对于做学术研究的人来说,大家的侧重点是理论研究和技术研发,所以在产品化、系统化、商业化方面,起初的关注度不会很强,在实践中边学边进步,也算正常,流行说法是新常态。
做产品和应用系统研究的企业如果要持续发展,需要重视前沿理论和方法的支撑,需要投入一定的基础研究,在关键技术突破的时候才能迅速抓住机会。
当前,很多AI企业都是从院校实验室走向市场的,这是科技变革与社会进步相结合的产物,他们当前在市场中取得成就总体上还是很值得认可的,推动了AI技术的进步,促进了“智能+”产业的发展。
当然,在发展过程中,会存在一些问题或不足,刚开始的进展都很顺利,自然会导致企业宣传或市场行动会“积极”些,使得大家的期望更高了些,就会给人有一种“差强人意”的感觉。
所以, 在落地的环节,我个人的认识是“术业有专攻”,敬畏人性,尊重常识,让企业家或能够成为企业家的人去做产业化。
也正是因为认识到这一点,此前我也参与推动了紫为云AI使能平台。
AI掘金志: 为什么要参与推动紫为云AI使能平台?为什么选择这个时间点切入市场?近期获得了什么成绩?
王生进教授: 科学研究的目的,是为产业的发展服务,也是为人类的美好生活服务。但科学理论的成果要与产业中的产品系统、应用系统等研究结合在一起,才能实现它的重要价值。
当前国家大力推动高等院校科技成果转化也正好印证了这一点。
紫为云·清华AI使能平台,就是让AI领域的科学理论成果导入产品研发、应用研发的平台,是推动理论研究与产业落地上下层结合的使能者。
中国人工智能产业要取得大发展,最终要靠应用层的各类企业掌握相关的核心技术,完成理论与应用的结合,才能实现各类AI应用的百花齐放效应。
目前的现状是人工智能产业链上应用层的很多企业缺乏算法等核心技术,这些企业对AI核心算法技术的强烈需要是紫为云AI使能平台得以创建的前提。
2019年4月27日,紫为云首席科学家王生进宣布正式推动紫为云AI使能平台
作为清华人,肩负厚德载物校训,如果能倾尽所学帮助企业打通AI算法技术瓶颈,构建AI应用创新的能力体系,实现各类企业在行业AI应用创新的目标,进而可以推动中国AI应用创新的全面发展,为国家“智能+”、新基建战略的实现添砖加瓦。
这将是清华人做人工智能科研的最大价值体现,也是清华团队创建紫为云AI使能平台的初衷。
近期,我们AI团队在广东某社会治理项目中完成了日处理千万级人脸动态聚类(含戴口罩人脸识别)的内测,取得了可圈可点的成绩。
AI掘金志: 视频应用从最初关注视频监控图像的清晰度,发展到人、车等AI识别,再到ReID等技术,谈谈未来AI产业(技术)的变化趋势?
王生进教授: 从图像的角度, 视频监控的图像清晰度已发展到一个新阶段,基于高清图像通过AI算法技术做图像识别,数据的智能处理,提取与应用是技术发展的新维度,ReID等技术则是这个维度上的新分支。
例如,清华团队针对行人再识别研究领域中缺少符合实际场景需求的数据集的瓶颈问题,组织构建并发表了该领域大型多镜头测试数据集iLIDS-VID, Market-1501&MARS,成为该领域的典型标准测试数据集。
从安全的角度, 视频监控系统是各类用户实现安全管理、效率管理、业务管理的技术保障基础。同时,安防系统自身也需要确保安全。
这种安全从最初的硬件设备系统安全,软件平台系统安全,发展到系统的网络安全。现在人工智能、大数据技术的逐步展开,对数据的安全防护需求日益上升,尤其用户对数据信用安全的需求将成为系统集成商的核心竞争力之一。
从数据的角度, 视频图像的数据化应用,可以形成知识图谱,可以协助用户进行决策推理,而随着数据认知能力的上升,将使系统具备一定能力的意识与灵感,这将促进更多AI智慧应用功能的实现。
AI掘金志: 复盘当前AI算法市场格局,为更好实现产品化并应用落地,企业研发团队、市场团队应该做些什么?
王生进教授: 基础算法技术已经有了很大的发展,目前更多在于推进算法的落地应用。
从分支发展看,各类算法团队在加强大数据量算法、小样本算法、ReID等算法技术的研究,这是根据不同行业、不同场景的用户需求,逐步进行算法技术的细分研究。
这对算法团队数据量的积累,特定场景小样本数据的研究能力,细节上的优化能力等方面是一个考验。例如,清华团队围绕特种人群的小样本人脸识别研究成果已在广州落地得到了应用。
结合场景,不断进行技术创新。用户场景下的数据往往是多维的(例如视频、图像、步态、行人、语音、文字等),这将考验团队跨媒体多维智能算法的研究能力,我之前在《人像态视识别及其在智能视频监控中的应用》报告中提出的人像态视识别新概念,就属于多维智能算法的应用思路。
清华团队在跨媒体多维智能算法方面有着丰富的技术积累,不仅在人脸、行人、步态、车、场景与物体等方面的算法研究取得了诸多成果,还在掌纹生物识别,语音识别,文字识别,辅助驾驶,机器视觉,工业智能等方面有诸多的算法研究成果。
当面向场景的智能机器人或智能交互应用中AI算法不再单一被应用,而是以“算法族”的模态被运算,随着场景应用的复杂性,对于算法技术研究的要求会更多,其中的探索空间会更大。
这是研究的一个方向,也是未来应用的方向。
需要指出的是,要实现从算法到应用落地的过程,关键是人和“团队”。
它需要一个能深度理解行业需要,客户需求,并能有效推动产业应用落地的专业团队,我们在构建清华“紫为云·清华AI使能平台”时就深刻认识到了这一点,认识到“技术+市场+管理”的重要性。
“紫为云”的另一位联合创始人是一位从事智能视频监控领域20年的业界资深人士,曾获得过“40年改革开放中国安防卓越人物奖”, 主要由他带领团队来完成应用落地的工作。
AI掘金志 : 新基建对AI应用落地有着深远影响,AI企业在新基建中将担当重要角色,紫为云作为清华AI使能平台,如何看当前的机遇与未来的挑战。
王生进教授: 人工智能是一个系统工程,它的应用领域特别多。
在2017年《新一代人工智能发展规划》的政策基础上,人工智能被列为国家新基建的重点工程推动,这意味着人工智能全方位,大规模应用落地的时间点正式开启,各类AI企业将成为各种行业创新应用的弄潮儿,这对AI产业会形成一股巨大的推动力,也会进一步促进AI算法技术的研究。
对紫为云来说,国家推动新基建的人工智能、大数据中心、工业互联网这三个关键点,与我们AI使能平台的核心技术优势契合,这将形成更大的成长动力。
国家在政策层面指出了产业和企业发展的方向,并为技术研发和应用创新提供了有利的政策和资源环境,清华人更有信心在人工智能大发展的时代,把AI科研做好,把AI落地应用推动好,为企业AI使能,为产业AI使能。
AI掘金志:在偌大的 视频监控AI算法圈层中,紫为云AI使能平台在其中扮演什么角色?
王生进教授: 当前AI市场的规模有很多种说法,总体上规模还不到想象的那么大,未来的市场伴随越来越多的新场景应用涌现,市场空间和规模还是很大。
虽然安防属于AI应用落地比较早的行业,但AI在安防行业场景的应用还是处于早期阶段,主要还是重点部位的视频结构化,大规模的应用还正在展开。
从当期正在制定的几个公安部行业标准来看,AI的安防应用还处于关键窗口期。
在这个阶段,无论是一些AI独角兽企业,还是传统的安防大型企业,不论是BATH,或者是各种维度上基础层、技术层、应用层的AI企业,每一家企业都有自己的优势和特长,各自都有自己专注的重点和方向。
大家都是AI产业长跑跑道上的选手和伙伴,大家都在朝着AI为产业升级、为人类美好生活服务的愿景努力前行。
紫为云AI使能平台也是这条长跑跑道上的选手和伙伴之一,我们在产业市场上,秉持开源、使能的理念,更在乎能支持更多的企业具备AI能力,让他们在各自的行业里推动更多的AI产品和创新应用。
在人工智能时代,让AI技术“平民化”;让AI技术更简单、更便捷和更安全;让AI使能更多企业、让AI使能更多产业;把AI技术落到场景实处,为社会应用服务,让人们的生活通过AI变得更加便捷和美好。
这是清华人的AI理想! 雷锋网雷锋网 (公众号:雷锋网)
。