对话云天励飞首席科学家王孝宇:技术进步需要学术界和工业界不断协同

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

日前,人工智能领域顶级赛事「AI 赋能视界」2020 年全国人工智能大赛正在如期进行,吸引到了全国最优秀的人工智能人才、团队、项目落地。

2020 年全国人工智能大赛由深圳市人民政府主办,深圳市科技创新委员会、鹏城实验室和新一代人工智能产业技术创新战略联盟联合承办,云天励飞、平安科技、腾讯科技、深圳巴士集团共同协办。

此次大赛协办单位之一云天励飞常被外界称为机器视觉赛道上的一匹黑马。

创立于 2014 年的云飞励天是一家兼具 AI 算法、AI 芯片和大数据平台的「全栈式」AI 技术公司,2020 年不到半年时间内完成了超 20 亿元的融资,并已进入上市备案辅导阶段。11 月 14 日,云天励飞更是在高交会期间发布「自进化城市智能体」,宣布成立「自进化城市智能体生态联盟」,剑指城市级市场。

云天励飞致力于以智能化技术改造物理世界,打造面向公共安全、新商业、智能超算、AIoT 等领域的产品和解决方案,广泛应用于全球一百多个城市和地区。在这背后,是人脸识别算法精度的不断提高,其中与算法相关的核心部分正是由首席科学家王孝宇博士负责。

借此机会,雷锋网有幸与云天励飞首席科学家、2020 年全国人工智能大赛 AI+ReID 赛道技术委员会成员王孝宇博士进行了一次深入对话。

对话云天励飞首席科学家王孝宇:技术进步需要学术界和工业界不断协同

“ReID 需要我们不断去摸索”

2020 年全国人工智能大赛新增了「AI+无线通信」、「AI+遥感影像」两个赛道,也对去年已有的「AI+ReID」赛道进行了升级。

ReID 全称 Person Re-identification,即行人重识别。

简单来说,这种技术是指在多摄像设备网络下,利用计算机视觉对行人进行检索,利用步态动作、身体特征等较为全面的信息在图像或视频序列中识别人、物。

ReID 是当前学术界的一大研究热点,同时也是一大难点。王孝宇博士表示:

以前学术界的 ReID 数据集过于简单,其假设实际上在现实中不一定会成立,比如说假设整个人都是无遮挡的,甚至是完全可以看得见正面的。

在学术界的很多数据集上 ReID 的表现似乎已经很好了,但实际上要在工业界落地很难,原因在于 ReID 涉及多个维度,如行人的衣着、人脸、年龄、身材等以及遮挡、时间和空间维度,相比人脸识别难度更大。

王孝宇博士解释说:

生活中,我们时常会因为发型、身材、穿着相似而认错人。假如我们熟悉的人某天穿了一件新衣服,仅仅看背影我们都有可能认不出来,更不要说用机器去识别,所以这项技术本身是不简单的,需要我们不断去摸索。

虽然 ReID 赛道是建立在上届大赛的基础之上的,但相比去年难度系数更大,要求选手结合贴近于公共交通、公共场所等真实、复杂的场景,基于极具规模的 ReID 数据集,设计算法并进行训练,从而解决更为严峻的视角、光照、遮挡等问题。

此次大赛 ReID 数据集的规模不仅比目前公开的 ReID 数据集大 N 倍、难度更高,还增加了行人属性、半监督/无监督学习等选择。

对话云天励飞首席科学家王孝宇:技术进步需要学术界和工业界不断协同

作为 AI+ReID 赛道技术委员会成员之一,王孝宇博士对此的看法是,数据集贴合现实场景,就能够反映出实际应用时的情况。此次比赛通过对数据集难度及多样性的增加,使得学术界能够和工业界不断协同,推动 ReID 技术的进步。

一个例子是,该赛道做出的一处升级是在决赛阶段新增口罩遮挡识别。

虽然戴口罩的情景在现实中一直广泛存在,如医院里医生戴口罩,或某些人为隐藏身份戴口罩,但在王孝宇博士看来,这样的设置不仅是因为疫情期间戴口罩的数据更易收集,也是大赛关注学术研究贴合多场景实际应用的表现。

他表示:

其实数据集一直以来对学术研究的推动作用是非常大的。加大数据集的难度,就是给予学者启发,毕竟还有很多问题没有解决,而学术研究是一个追问的过程,如果问题都发现不了,就不会有好的研究,也不会有好的方法出来。

“大赛设置的意义在于让整个业界有收获”

为进一步落实科技部、工信部支持深圳建设国家新一代人工智能创新发展试验区和人工智能创新应用先导区「双区驱动」的工作要求,加快推动深圳在人工智能、网络通信等科技创新领域建设步伐,2020 年全国人工智能大赛应时而生。

实际上,包括底层硬件和通用 AI 技术和平台在内的人工智能被列为「新基建」细分领域之一,已受到重点关注。国家提出的十四五规划也强调了在优势研究领域设立科学家工作室、引进 1 万名海外高层次人才回国创新创业等人才政策。在谈及产业与人才政策对科技行业的影响时,王孝宇博士表示:

产业政策推动了整个行业的进步,人才政策能起到一种辅助作用。可以说,产业政策的影响是长期的,人才政策的影响则是短期的。

自然,人工智能发展需要学术研究与产业一线的进一步连接。王孝宇博士认为,要在学术界和工业界之间搭建桥梁,一方面要有统一的定义,不要“鸡同鸭讲”;另一方面则要沟通各自的算法在数据集上的表现如何,用同一种语言对话。

谈到这里,王孝宇博士举了一个例子:2013 年 Google 收购了 DNNresearch 公司。该公司由深度学习鼻祖 Geoffrey Hinton 教授于 2012 年建立,其核心员工包括 Geoffrey Hinton 教授的两个优秀学生 Alex Krizhevsky 和 Ilya Sutskever。

作为前 NEC Labs 首席研究员、前 Snap 资深科学家、Snap 研究院创始人之一,王孝宇博士曾在学生时代经历过数次国际赛事,作为过来人,他也谈到了对竞赛的看法:

总体来说,竞赛经历过一个过程。比如说美国在 2013 年之前,竞赛的基本模式是参赛者拿着自己发明的算法去展示结果,从而给学界以启发。但是到后来,参赛者为了拿到第一,开始融合各种方法、模型,虽然结果很好,但并没有产出令人眼前一亮的方法。

因此,在王孝宇博士看来,此次大赛设置的意义在于让整个业界有收获。他所希望看到的是,参赛者不仅仅是为了获奖,而是本着加深对技术理解的原则参赛,尝试用创新的方法解决现有问题,这样才能让业界有收获,形成正向循环。

2020 年全国人工智能大赛立足国际视野,营造人工智能创新创造氛围,促进产业、学术、资本、人才等创新要素融合发展,获得了人工智能竞赛圈的广泛关注。目前大赛已进入到决赛阶段,最终三个赛道哪些团队将胜出,我们拭目以待。

雷锋网 (公众号:雷锋网) 雷锋网雷锋网

对话云天励飞首席科学家王孝宇:技术进步需要学术界和工业界不断协同

随意打赏

提交建议
微信扫一扫,分享给好友吧。