「GAIR 大讲堂」大牛、学霸们的精华分享一次看个够
雷锋网 AI 科技评论按
:2017 年,在 GAIR 2017 大会成功举办后,雷锋网旗下宣布成立了一个全新的高端学术分享品牌「GAIR 大讲堂」。在过去的一年里,GAIR 大讲堂通过举办高频次的学术分享活动(包括线上和线下),实现了学术专家、AI 业者与高校学术青年之间的深度交流。以下是我们的年度盘点。
国际顶会论文解读(线下)
AAAI 2018预讲会哈工大场(上)
AAAI 2018预讲会哈工大场(下)
内容简介:本次 AAAI 2018 预讲会邀请了来自全国各地 15 所高校和研究单位的老师和同学分享他们在 AAAI 2018 中接收的 25 篇论文,内容覆盖有聊天机器人、语义依存图、文本摘要、机器翻译、信息抽取、表示学习等多个领域的最新研究成果。会议吸引了 200 多名老师和学生来此参会并进行交流。
CVPR 2017 专场
CVPR(国际计算机视觉与模式识别会议)是 IEEE 举办的年度学术性会议,会议主要关注计算机视觉与模式识别等方面的技术内容。在各种学术会议统计中,CVPR 有着非常强的影响力和高排名。在美国夏威夷举办的CVPR 2017 大会上,学术界和工业界都给予了极高的关注度,无论是收录的论文数和参会人数都刷新了 CVPR 的历史纪录。
CVPR上海交大专场回顾
内容简介 :
吴佳俊 (MIT EECS 系三年级博士生)分享了 A Point Set Generation Network for 3D Object Reconstruction from a Single Image,提出的点云生成网络解决了如何用深度神经网络从单张图片中恢复重建三维物体这个难题。
汪洋 (阿里巴巴人工智能实验室资深算法工程师)分享了阿里人工智能实验室入选的论文:Contextual Attention-based Memory Networks for Scene Labeling。
论文提出了一种 Episodic CAMN 方法,并在该方法的基础上定义了一种由全卷积神经网络和带有反馈连接的注意力机制记忆网络构成的统一框架来实现上下文信息的选择和调整。
杨蕊 (上海交通大学研究生)分享的是 Video Segmentation via Multiple Granularity Analysis,讲解了视频目标分割传统方法,以及该论文中提到的新方法遇到的挑战,比如视频模糊,有遮挡,形变,和光照等因素影响。
林天威 (上海交通大学研究生)分享的是 Single Shot Temporal Action Detection,并且利用该论文中提到的方法获得CVPR举办的ActivityNet Challenge 2017两项冠军。
王敏思 (上海交通大学博士生)分享的是 Recurrent Modeling of Interaction Context for Collective Activity Recognition,论文提出了一个基于多层次递归神经网络的群体行为识别算法,在群体行为数据库Collective-Activity获得了目前很好的识别精度。
CVPR清华专场回顾
内容简介 :
段岳圻 (清华大学自动化系三年级博士生 )分享的论文题目是:Learning Deep Binary Descriptor with Multi-Quantization 。 他分别从四个方面介绍了他的论文研究:背景介绍,文章方法,实验结果,参会心得。
孙刚 (Momenta 研发总监&联合创始人)分享的论文题目是:Squeeze & Excitation Networks。这篇论文作者提出了一种新颖的神经网络模块称为Squeeze & Excitation(简称SE),以此大幅提升模型的精度。
郑贺亮 (中科大&微软亚洲研究院联合培养博士生)分享的是:Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-Grained Image Recognition。论文中设计一种RA-CNN的网络结构,将不同尺度的重要区域综合起来进行分类,实现了定位和精细化特征学习之间的相互促进,在精细化物体分类的任务上取得非常理想的结果。
邱钊凡 (中科大&微软亚洲研究院联合培养博士生)分享的题目是:Deep Quantization: Encoding Convolutional Activations with Deep Generative Model。论文中提出了基于深度生成模型的卷积层特征的提取整合方案,并将最终得到的全局特征应用在不同分类问题当中。在图片精细分类和视频动作识别两个问题上,该方法均体现出较好的性能。
CVPR哈工大(深圳校区)回顾
内容简介 :
左旺孟 (哈尔滨工业大学计算机学院教授、博士生导师)分享的论文题目是:Deep learning models for image restoration and depth enhancement 。文章设计了一种新的去噪CNN网络,并结合半二次分裂方法将其推广应用于广义的图像复原问题的求解。
黄伟林 (码隆科技首席科学家)& Matt Scott(码隆科技联合创始人兼 CTO)分享的主题是:CVPR WebVision 挑战赛分享与展望。他们共同分享了参加竞赛的算法思路和方法方面的相关经验,以及针对现实场景中非人工标注数据的训练和学习技术的探索。
陈晓智 (清华大学博士)分享的是:Multi-View 3D Object Detection Network for Autonomous Driving 。论文中提出了一种多视角三维物体检测网络(MV3D),通过融合激光点云和 RGB 图像来实现物体的三维定位与检测。
李琛 (浙江大学博士)分享的主题是:Biological Human Skin Color Model: from Theory to Applications。李博士和团队其他人在CVPR 2017 发表的两篇论文《Radiometric Calibration from Faces in Images》和《Specular Highlight Removal in Facial Images》中利用人脸肤色的生物学模型先验知识,在高光分离、相机响应函数校准这两个问题上,效果取得显著提升。
NIPS 2017 专场
继 CVPR 2017 会议在报名人数以及论文收录等方面创下多项「历史第一」之后,计算神经科学顶级学术会议之一——NIPS(神经信息处理系统大会)在文章收录结果仅仅公布 10 天之后,官方数据显示注册名额已满。人工智能关注度又上升了一个高度。
NIPS 清华专场回顾
内容简介 :
NIPS 2017 共收到 3240 篇论文投稿,有 678 篇论文被选中作为大会论文,比例 20.9%,其中有 40 篇被选中进行口头报告(oral),112 篇选为 spotlight 进行展示。这些数字刷新了大会历史记录。
陆洲 (北京大学数学科学学院大四本科生)分享题目是:The expressive power of neural networks : A view from the width。这篇论文从宽度入手,分别从宽度带来的相变,以及宽度与深度对效率的影响来做实验,得到了关于神经网络表达能力的新结果。
邓志杰 (清华大学计算机系人智所博士生)分享题目是:Structured Generative Adversarial Networks。该论文提出结构化生成对抗网络(SGAN) 来解决半监督条件产生式建模问题。
陈键飞 (清华大学计算机系人智所博士生)分享题目是:Population Matching Discrepancy and Applications in Deep Learning。主要介绍了他们在NIPS 2017上提出的样本匹配差异(PMD)。
汪跃 (北京交通大学理学院博士生)分享的是:Finite sample analysis of the GTD Policy Evaluation Algorithms in Markov Setting。这篇论文中首先证明了在数据来自于马尔科夫链的情况下,鞍点问题的期望意义下和高概率意义下的有限样本误差,进而得到了更接近于实际情形下的GTD的算法的有限样本误差分析。
单小涵 (中国科学院计算技术研究所博士生)分享的是:Influence Maximization with epsilon-Almost Submodular Threshold Function 。论文中提到了一种近次模函数,并以这类函数作为阈值,研究通用阈值模型下的影响力最大化问题。
学术青年分享会(线上)
达观数据张健:文本分类方法和应用案例
内容简介:此次分享中,张健按照 NLP 概述、文本分类的传统方法、深度学习在文本分类中的应用和案例介绍四个板块,结合在达观数据的系统设计和应用经验,分享了他的见解。
优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法
内容简介:对于图像编辑任务,现在面临的两个重要的挑战分别是:如何提升生成图像的质量和如何灵活控制生成图像内容。如何解决,王超岳带来详细解读。
极限元算法专家:深度学习在语音生成问题上的典型应用
内容简介:深度学习在语音生成和语音增强上的新颖应用方法
Video ++孙兆民:人工智能行业报告——视频内容识别行业分析
内容简介:这份报告并非针对人工智能领域全局观,而是解构视频行业,围绕国内视频内容识别这一垂直领域的创业公司展开讨论,从市场、产品、技术、商业模式、人才等多个维度出发,浅析人工智能技术在视频中的发展方向。
搜狗研究员讲解基于深度学习的语音分离
内容简介:语音分离的目标就是从环境等干扰中分离出主说话人的语音,本文介绍的是基于深度学习的语音分离。
如何用超大规模真实驾驶视频数据集做端到端自动驾驶
内容简介:文章中主要分享的是基于徐华哲和他的同学们发表的 CVPR 2017 的收录文章「End-to-end Learning of Driving Models from Large-scale Video Datasets」,这是对端到端自动驾驶的一个尝试。
BasicFinder 标注平台数据科学家吴昊:从数据采集与标记行业看数据与深度学习之关系
内容简介:本文主要介绍的是数据规模、数据质量等与深度学习算法之间的关系,以及为算法做数据准备的一些经验。
中科院曹婍:基于深度学习的社交网络流行度预测研究
内容简介:本文主要介绍的是目前网络信息流行度预测研究的进展,以及中科院博士生曹婍提出的基于深度学习技术的端到端流行度预测框架(DeepHawkes 模型)。该工作已被国际会议 CIKM 2017 录用并发表。
香港科技大学施行健:深度学习用于短临降雨预报的一个基准和一个新模型
内容简介:本文介绍了 NIPS 2017 论文: Deep Learning for Precipitation Nowcasting: A Benchmark and A New Model 中提到的核心算法模型。该论文的作者之一施行健给我们详细讲解了论文中的核心思想以及模型的演进过程。
清华大学冯珺:当强化学习遇见自然语言处理有哪些奇妙的化学反应?
内容简介:本文介绍了如何利用强化学习技术,更好地解决自然语言处理中的两个经典任务:关系抽取和文本分类。
多伦多大学博士生赵舒泽: 如何在FPGA上实现动态电压的调节?
内容简介:本文介绍了其中一种降低 FPGA 能耗的方法——基于自测量的 FPGA 动态电压调节解决方案。
浙大博士生刘汉唐:带你回顾图像分割的经典算法
内容简介:本文第一部分介绍的是传统视觉的图分割算法,第二部分是近几年流行的深度学习算法中的经典技巧。
新的一年雷锋网 (公众号:雷锋网) 「AI科技评论」会持续输出更多优质内容,感谢大家的关注和支持。
。