2018 公开课盘点学术篇:链接优秀年轻 AI 学者,「大讲堂」让新生 AI 学术力量被看见
雷锋网 (公众号:雷锋网) AI 科技评论按: 2018 年,AI 研习社为大家呈上了一系列公开课,让更多的 AI 学术人员得以分享、传播自己的研究成果,也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识,为国内人工智能长期持续发展的氛围出一份力。
作为主打 AI 学术的「大讲堂」,该栏目至今已产出 124 期分享内容。在刚过去的春节,我们整理了 其中热度排在前十的公开课 ,然而这远远无法覆盖这其中的众多精华内容,为此,我们决定追加整理 10 场热度排在前二十的「大讲堂」公开课内容,以飨读者。
1. 标准化技术在训练深度神经网络中的应用
分享嘉宾:
黄雷,北京航空航天大学计算机学院博士,曾于 2015 年 10 月至 2016 年 10 月在密歇根大学安娜堡分校 Vision & Learning 实验室做关于深度学习模型优化方面的研究。主要的研究领域为深度神经网络中标准化技术,半监督学习,非参主动学习及相关方法在计算机视觉和多媒体领域中的应用。目前已发表学术论文十余篇,包括 CVPR,ICCV 和 AAAI 等。
分享内容:
标准化技术目前已被广泛应用于各种深度神经网络的训练,如著名的批量标准化技术 (Batch Normalization, BN) 基本上是训练深度卷积网络的标准配置。装配有 BN 模块的神经网络模型通常比原始模型更容易训练,且通常表现出更好的泛化能力。
本次 GAIR 大讲堂报告人将阐述标准化技术应用于训练深度神经网络中的主要动机以及介绍一些主流的标准化技术,除此之外报告人也将讲解其沿着这个方向发表在 AAAI 2018 的论文《Orthogonal Weight Normalization: Solution to Optimization over Multiple Dependent Stiefel Manifolds in Deep Neural Networks》。
回看网址:
https://www.mooc.ai/open/course/478
2. 基于网络功能模块的图特征学习
分享嘉宾:
郑文琛,微众银行人工智能项目组专家工程师和副总经理。主要研究方向为结构化数据的特征学习和迁移学习,已在相关研究领域发表了 60 余篇顶级会议和期刊论文,并拥有多项专利和技术。
在图数据特征工程的成就获得国际人工智能顶级会议 IJCAI 2018 年的 Early Career Spotlight,在迁移学习应用于用户行为识别的成就获得国际会议 ICCSE 2018 年的最佳论文奖。是 Cognitive Computation 杂志的副主编。同时也是多个顶级人工智能国际会议的编委会委员和研讨会的组织者。
分享内容:
图是一种常见的数据结构,可以被用于许多不同的预测任务。如何从图数据学习有效特征是个重要的问题。我们的新概念是从点和边出发,拓展到更高阶的子图结构(比如路径、子图)来帮助图特征学习。这些高阶的子图结构通常具有不同的功能,事实上在一起共同构造了整个网络,所以我们称这些高阶的子图结构为网络功能模块(Network Functional Blocks)。在这次分享中,我将用语义相关度搜索(Semantic Proximity Search)作为一个应用例子,来介绍我们最近在探索不同粒度的网络功能模块、以进行有效图特征学习的一些进展。
回看网址:
https://www.mooc.ai/open/course/560
3. 计算机视觉当中的零样本学习(Zero-Shot Learning)
分享嘉宾:
管界超,中国人民大学信息学院大数据分析与智能实验室 2018 级直博生,方向是机器学习与计算机视觉。本科就读于中国人民大学数学系。
分享内容:
机器学习中,传统的图像分类问题依赖大量带标签的训练样本。繁琐的标注工作大大增加了图像收集的人工成本,从而使得小样本的机器学习方法,特别是其中的零样本学习(Zero-Shot Learning)成为了近期机器学习的重要研究方向。零样本学习旨在没有带标签数据的情况下,通过对已知类别的映射学习获得泛化能力强的学习器(分类器),再推广到未知类上实现较好的分类效果(所以称为零样本或者是零标签学习)。
回看网址:
https://www.mooc.ai/open/course/629
4. 语义分析介绍及跨语言信息在语义分析中的应用
分享嘉宾:
邹炎炎,新加坡科学设计大学博士在读。主要研究方向为自然语言理解
分享内容:
word embedding 是很常见的 input feature,能够很大程度地提升模型的性能。另一方面,关于 output 对模型性能的影响,关注度并不是很高。在本次分享中,将介绍一下关于 output embedding 对于 semantic parsing 的影响。
回看网址:
https://www.mooc.ai/open/course/544
5. 混合比例估计(Mixture Proportion Estimation)及其应用
分享嘉宾:
余席宇,悉尼大学,FEIT,四年级博士生,优必选悉尼 AI 研究院学生。北京航空航天大学控制科学与工程学士,硕士。主要研究方向为矩阵分解,深度网络模型压缩以及弱监督学习。
分享内容:
在大数据时代,标注足够多的训练样本往往耗费巨大。弱监督学习方法往往能够减轻对正确标签的过度依赖,达到与监督学习相近的性能。然而,在设计弱监督学习方法时,我们需要理解无标签样本的分布情况(比如 semi-supervised learning),或者带噪声标签样本的噪声大小(比如 learning with label noise),这些问题的本质就是混合比例估计。因此,混合比例估计在弱监督学习中占有至关重要的作用。本次公开课,余席宇同学将分享他在混合比例估计中新的研究成果,以及其在弱监督学习,迁移学习中的延伸应用。
回看网址:
https://www.mooc.ai/open/course/493
6. 点击率预估问题中的深度兴趣网络
分享嘉宾:
周国睿,北京邮电大学模式识别实验室硕士,目前就职于阿里巴巴,主要研究定向广告的排序相关工作,导师是爱可可爱生活老师,主要研究方向为 NLP,推荐系统等。工作曾在 KDD、AAAI、CIKM 等会议发表。
分享内容:
随着硬件能力的提升,提高了实际使用的模型复杂度的上限,深度学习在各个领域飞速发展。近期在点击率预估问题上也有许多新的深度模型算法迸发。本次主要介绍阿里妈妈定向广告中预估算法的演进,包括深度兴趣网络,兴趣演化网络等工作。
回看网址:
https://www.mooc.ai/open/course/571
7. 时空大数据和深度学习在交通事故预测上的应用
分享嘉宾:
周逊,于明尼苏达大学计算机系获博士学位。现为美国爱荷华大学商学院管理科学系助理教授。主要研究方向为时空数据挖掘和分析,城市计算,地理信息系统。多篇论文发表于 KDD, ICDM, CIKM, TKDE 等国际顶级会议和期刊,并多次担任其程序委员会委员和审稿人。联合主编 Encyclopedia of GIS 第二版。
分享内容:
交通事故预测是一个重要且困难的研究问题。在较大时空范围内的预测尤其困难。主要原因是交通事故在时空上相对稀疏,以及不同地理环境 (如城乡) 造成的时空异质性 (spatial heterogeneity). 本次公开课将讨论利用深度学习模型和时空大数据预测交通事故的最新工作。同时还将介绍其他时空数据挖掘和城市计算的研究问题及相关进展。
回看网址:
https://www.mooc.ai/open/course/576
8. 闲聊对话中的句式控制
分享嘉宾:
柯沛,清华大学计算机系在读博士,导师是朱小燕教授,主要研究方向为自然语言生成、对话系统,其研究工作曾在 ACL 上发表。
分享内容:
对话生成是近年自然语言处理领域的热门方向之一,如何控制回复的属性(如情绪、风格等)以提升回复质量和交互体验成为学术界和工业界共同关注的话题。在本次分享中,讲者将分享对话生成可控性的最新工作。
回看网址:
https://www.mooc.ai/open/course/527
9. 一种新型光幕传感器 Light curtain sensor 在机器人避障和无人驾驶中的应用
分享嘉宾:
王建,Snap 公司 Research Scientist,卡内基梅隆大学博士,导师是 Aswin Sankaranarayanan 教授和 Srinivasa Narasimhan 教授,主要研究方向为计算机视觉,三维视觉,计算摄影等。其研究工作曾在 CVPR、ICCV、ECCV、ICCP 等发表并且多次获得 oral presentation 机会。
分享内容:
像 LIDAR 这样的 3D 传感器经常用于今天的道路场景理解。让我们简要地看看它是如何被使用的。在 GPS 和 IMU 帮助的情况下,我们将大量的捕获的点云注册到预先构建的或累积的 3D 地图,然后使用复杂的、计算量大且存储密集的深度学习方法来检测和分割运动的障碍物。这些方法被证明是有效的,但是,对于一些简单的问题,例如:「一个物体切入我的车道吗」?或者「人行道上有人吗?」所有这些计算是不必要的。
我们提出的「可编程光幕」传感器(light curtain sensor)对于机器人和无人车避障问题提供了一种替代解决方案,几乎不需要计算开销,同时具有高能效和灵活性。在本次公开课中,讲者将分享其关于光幕传感器的设计。
回看网址:
https://www.mooc.ai/open/course/561
10. AI 艺术与道子智能系统
分享嘉宾:
高峰,2007 年获得英国伦敦大学学院(University College London)计算机科学学士学位,本科毕业设计工作是人工智能领域计算机人脸表情识别技术。2018 年获得北京大学计算机科学博士学位,主要以人工智能前沿技术研究探索计算机科学与绘画艺术交叉领域。现为清华大学未来实验室博士后,主要研究领域为科技与艺术交叉学科,探索人类未来生活中人工智能技术在安防、医疗健康、教育、艺术等领域的应用。多篇论文发表于国际顶级多媒体会议 ACM Multimedia、IEEE 会刊、国内核心期刊《计算机学报》等,相关研究成果已成功应用于中国美术家协会、雅昌集团等单位。
分享内容:
高峰博士的《基于人工智能的绘画分析理论与方法研究》获得国家自然科学基金青年科学基金项目立项,研究期限 2019 年 1 月至 2021 年 12 月。此项目主要研究内容:基于人工智能的绘画分析理论与方法研究。计算机科学与绘画艺术的交叉研究,不仅有利于人工智能的发展,也有利于绘画艺术的文化创新。本项目通过机器学习方法特别是深度学习技术将绘画相关信息定量化,从而进行分析与探索。具体来说,是从鉴、绪、读、赏、创、育六个部分展开。「鉴」指利用深度学习技术设计针对相似性绘画图像检索的有效特征。「绪」指设计融合边缘特征与局部不变性特征的针对区分绘画笔触特点的图像特征。「读」指利用机器学习方法设计多任务辅助及从细节、局部、整体入手的多范围架构来区分绘画风格与画家特点。「赏」指结合深度学习技术设计基于生成对抗网络针对中国画用笔用墨特点的绘画风格迁移算法模型。「创」指将绘画风格迁移模型应用于辅助绘画创作及可视化分析呈现。「育」指面向绘画教育的智能人机交互方法及基于反馈的认知模型。并构建和标注高质量相关图像数据集,开拓基于人工智能的计算机科学与绘画艺术相结合的跨学科交叉领域研究。
分享网址:
https://www.mooc.ai/open/course/618
雷锋网 AI 科技评论 雷锋网
。