8月顶级 CV 大会:ICIG 2019——人工智能时代的图像图形前沿研究
雷锋网 (公众号:雷锋网) AI 科技评论按: 2019 年 8 月 23 日至 25 日,第 10 届国际图像与图形会议(International Conference on Image and Graphics,简称为 ICIG)将于中国北京举行,会议由中国图象图形学学会主办,清华大学、北京大学和中国科学院自动化研究所承办,并得到了国际模式识别协会(IAPR)的支持。
ICIG
ICIG 每两年一次,是中国图象图形学学会主办的最高级别的系列国际会议,迄今已经成功举办了九届。会议重点关注关于图像、视频和图形处理的创新技术,以及促进创新、创业和网络化相关工作。
本次会议的主题为「人工智能时代的图像图形前沿研究」,将邀请国内外图像图形学领域的 3 位著名学者作大会特邀报告,集顶刊顶会论文报告、前沿科技产品展示、6 个前沿专题论坛。
3 个特邀报告
-
报告题目一——《The Shape of Deformations》
如果一个框架由三个「棒」(相同长度)在一个共同点上相交所组成,其中我们感兴趣的是表示框架的方向和「形状」。方向是相对于参考系的旋转;而「形状」是相对于参考系的变形。事实证明,任何框架都可以通过莫比乌斯变换转换为任何其他框架。
该观点揭示了旋转是单位四元数。单位四元数是广为所知的,并且在空间旋转的表示中非常有用,因为它们在变量中是连续的,在连续表示中至少需要四个坐标的意义上是最小的,并且它们具有允许允许测量变形量的自然度量,即角度。莫比乌斯变换的观点也揭示了这是该项工作新的一面,变形是双曲面上的点。所以「形状」可以被描述为双曲空间中的一个点。这是一种表示,就像单位四元数一样,是连续的、微小的,并且具有允许测量变形量的自然度量。
报告者:柏林工业大学,Marc Alexa
-
报告题目二——《Improved Scene Understanding by Combining Sight and Sound》
在传统的计算机视觉研究中,我们谨慎地剥离和忽略了原声带;同样,在传统的音频分析上忽略了视频中可用的视觉信息。本报告将描述如何通过在视频中使用视觉和音频来获得更好的场景理解;并用一个例子说明,如何使用显示说话者面部的视频来增强音频分析;同时,报告中还会用「视频监控」案例来展示音频对场景活动理解的加强作用。
报告者:希伯来大学,Shmuel Peleg
-
报告题目三——《Low quality fingerprint recognition》
指纹识别是最广泛使用的生物识别技术之一。尽管其应用广泛,但低质量指纹的识别率,例如老年人的指纹、犯罪现场的潜在指纹以及非常干燥或潮湿的手指指纹,仍然远不能令人满意。本报告将介绍研究者们最近在低质量指纹识别方面取得的进展,包括指纹增强、皮肤畸变校正和稠密配准。
报告者:清华大学,周杰
2 个讲习班
-
Visual SLAM and 3DReconstruction
《Visual SLAM》 :Visual SLAM 是 3D 视觉和机器人领域的基本问题,可以在未知环境中同时恢复姿势和 3D 结构,它具有广泛的应用。本教程将首先介绍一些基本概念和原理,如相机模型和多视图几何,然后介绍 VSLAM / VISLAM 的主流框架以及一些重要的模块,如特征跟踪、姿势估计、束调整和循环闭包。此外,课程还将推出新的增强现实 VISLAM 基准,介绍一组基于 VSLAM / VISLAM 技术的 AR 应用程序。
讲师:浙江大学,张国锋
《基于图像的三维重建》 :由于计算机视觉在 20 世纪 70 年代成为一门独立的学科,在 50 年的研究中,图像的 3D 表示,即 2D 图像的场景 3D 重建一直是计算机视觉研究中的经典和基本问题。近年来,随着图像采集设备的不断发展,利用数码相机、街景车、无人机等设备获取大量高分辨率图像变得方便。如何通过这些图像构建我们的 3D 世界已成为许多应用的迫切需求。因此,在理论和应用层面,基于图像的三维重建已成为计算机视觉研究人员的热点。本教程将介绍基于图像的 3D 建模的基本流水线和关键算法,包括运动结构,多视图立体声,点网格划分,语义建模等。此外,我们将展示文化遗产数字化的几个 3D 重建演示,智能城市,高清地图和基于 3D 地图的视觉重新定位。
讲师:中国科学院自动化研究所,申抒含
更多关于讲师信息:
张国锋
https://www.cad.zju.edu.cn/home/gfzhang
申抒含
https://vision.ia.ac.cn/Faculty/shshen/index.htm
-
Plenoptic Face Analysis
人脸分析是机器学习和计算机视觉领域的重要研究课题之一。它在智能手机、金融支付、公共安全、互动娱乐等方面具有广泛的应用。通过编辑、合成和生成新的人脸图像,不仅可以提高原始人脸图像的质量,而且可以增加人脸数据规模,从而提高现代人脸识别系统在复杂环境中的鲁棒性。
全光面部分析包含视觉面部图像的收集、重建、编辑、解释和识别。研究内容大致分为理论和应用。理论研究包括图像采集、深度学习、转移学习、弱监督学习等,应用研究涉及人脸对齐、人脸轮换、表情合成、属性编辑等。基于视觉信息获取和深度学习框架,教程深入分析了全光面部分析的理论和应用。
首先,基本部分将从全光计算摄影、视觉拓扑认知、概率生成模型和身份保存结构等方面介绍深度全光人脸分析所涉及的主要理论和方法。然后,应用部分将深入探讨特定的应用场景以及面部生成、面部旋转、年龄合成、光场成像等方面的最新进展。相关研究发表在几个顶级期刊和会议上,如 IJCV,IEEE TPAMI,TIP,TIFS,ICCV,CVPR,ECCV,NeurIPS,AAAI。
Plenoptic Face Analysis 讲师
2 个技术竞赛
一、智能交通视频图像增强处理竞赛
-
竞赛背景
视频和图像传感技术在智能交通中应用越来越广泛,这些应用的效果很大程度上依赖采集图像的质量。然而,智能交通系统运行环境复杂,在雾/雾霾等恶劣天气下采集的视频或者图像会发生严重的质量退化,难以满足实际应用需求。因此,需要采用图像增强算法对在雾/雾霾、雨、雪等恶劣天气下采集的低质量图像进行去噪增强处理,以改善图像的视觉效果、提升后期图像识别的精度。
此项竞赛依托第十届国际图象图形学学术会议,由北京和普威视科技股份有限公司冠名支持,旨在吸引国内外图形图像领域及智能交通领域的研究人员,结合计算机领域的技术优势和智能交通领域的专业知识,共同搭建具有实际应用价值的服务于智能交通领域的图像增强技术。参赛获胜队伍可获得获奖证书和奖金,同时和竞赛组织者合写一篇总结论文发表于顶级刊物。
该竞赛作品提交截止至 8 月 5 日,在 8 月 12 日将公布竞赛结果,并在 8 月 23 日至 25 日 ICIG 2019 大会期间进行竞赛颁奖。
-
数据集
竞赛方提供了一组训练集和验证集,该训练集和验证集来自「Benchmarking Single Image Dehazing and Beyond」。训练集和验证集共包括 5500 张合成的雾图、清晰的图像以及深度信息,之后还有一个由 20 张真实世界的轨道交通监控雾霾图像组成的测试集会发布。
-
竞赛流程
-
训练:提供图像去雾/雾霾的训练集,但不限定训练集。
-
验证:提供图像去雾/雾霾的验证集,验证集与训练集由不同图像和参数合成得到。
-
测试:测试集稍后公开发布,但与验证集性质相似。
-
环境:不限定测试环境。
-
评测:参赛方在规定时间提交测试集处理结果,获胜者需提交图像去雾/雾霾处理代码,由组织方在测试代码并得到最终的处理效果和处理速度,两者排名均靠前者为优胜,所有评测结果均在网上及时发布。
二、小目标与遮挡物体检测竞赛
-
竞赛背景
遮挡和小物体是物体检测任务的难点之一,尤其是在监控、自动驾驶和视觉感知的应用场景中。因此,该 Workshop 特别设置了遮挡图像识别和小物体检测两个竞赛单元,从而更好的促进计算机视觉领域的发展。
-
小目标检测数据集
数据集基于虚拟仿真环境创建,模拟无人机在低空飞行时,对城市道路上行驶的多种车辆进行航拍并收集可见光图像。识别目标为公路上的车辆,其中包括 12 种车辆(BMW、Nissan、Mustang、Mini、Volkswagen、Policcar、Lincoln、Tazzar、Jeep、Truck、Bus、SUV),并且同时考虑四种成像条件:两种天气条件(晴天和雾天)以及两种光线条件(白天和黄昏)。
特别强调,图像数据中树木或建筑物对目标车辆有不同程度的遮挡,对于极其严重的被遮挡目标(遮挡率超过 90%),依然给出其 BoundingBox,即该遮挡目标包含于被识别目标 GroundTruth 中,参与最终模型评估。
-
遮挡目标检测数据集
遮挡目标检测数据集包含了人、车、船、飞机四个大类,每类训练和验证集包含 10 张真实遮挡图像,50 张多源仿真图像以及 1000 张同源仿真图像,测试集约 500 张(以实际数量为准,详见文档更新)。其中多源仿真图像指来自于各种游戏、仿真数据集等场景的遮挡图像,同源仿真图像为使用本实验室仿真平台生成的遮挡图像。数据集标注包含了图像中对应类别的全部物体,被遮挡物体的遮挡面积等信息。
雷锋网 AI 科技评论 雷锋网
。