SIGKDD 三大核心奖项出炉,裴健、杨强分获创新奖及杰出服务奖
雷锋网 AI 科技评论消息,2017 SIGKDD 的三大奖项——创新奖(2017 SIGKDD Innovation Award),杰出服务奖(2017 SIGKDD Service Award)以及十年最佳论文奖(Test of time award)已于日前公布。其中,ACM SIGKDD 新一任主席、加拿大西蒙弗雷泽大学计算机学院教授裴健博士荣获 2017 SIGKDD 创新奖;香港科技大学教授杨强博士荣获 2017 SIGKDD 杰出服务奖;而十年最佳论文奖则被康奈尔大学 Thorsten Joachims 的《Training Linear SVMs in Linear Time》所摘得。
2017 SIGKDD 创新奖
ACM SIGKDD 创新奖是知识发现与数据挖掘领域(KDD)的最高荣誉,授予对这一领域做出重大技术贡献的研究人员。根据评审要求,其研究成果必须在数据挖掘理论或商业数据挖掘系统的开发上能够产生深远的影响。
历届 SIGKDD 创新奖的获得者都是数据挖掘领域的杰出研究者,曾经获得这一奖项的华人包括:
-
韩家炜(Jiawei Han)博士(2004 年):美国伊利诺伊大学香槟分校计算机系教授,ACM、IEEE Fellow。值得一提的是,韩家炜博士是裴健教授在加拿大西蒙弗雷泽大学的博士导师。
-
俞士纶 (Philip S. Yu) 博士(2016 年):美国伊利诺伊大学芝加哥分校特聘主任教授、清华大学数据科学研究院院长。
裴健(Jian Pei)是 ACM SIGKDD 新一届大会主席、加拿大西蒙弗雷泽大学计算机学院教授、ACM 和 IEEE Fellow、加拿大研究讲席教授(Canada Research Chair, Tier I)。他的研究兴趣集中在研究和开发针对新颖的数据密集型应用的高效数据分析技术。他的研究领域包括数据挖掘、web 搜索、信息检索、数据仓库、联机分析处理、数据库系统及其在社会网络和社会媒体、医学信息学、商业智能等领域中的应用。
2000 年以来,他出版了一本教科书和两本学术专著,发表了 200 多篇论文,多次担任国际会议的程序委员会委员和组织委员会委员。此前裴健教授还由于对数据挖掘方面的重大技术贡献和对社会及数据挖掘社区的杰出服务获得 2015 年度的 SIGKDD 杰出服务奖(SIGKDD SERVICE AWARD)。他是 IEEE Transactions on Knowledge and Data Engineering (TKDE) 的前任主编。
官网在公示这一消息时,也阐述了裴健博士的获奖原因:
「(裴健博士)在数据挖掘及应用领域的基础研究,尤其是模式挖掘与空间数据挖掘方面做出了突出的贡献。他是多种模式增长方法的主要提出者,包括FP-growth和PrefixSpan,这些工作已经被业界广泛接受和应用,并且被数据挖掘教科书及开源软件工具包所采用。作为数据挖掘领域被引用次数最多的作者之一,他极为高产的出版物被引用了七万多次。」
一直以来,裴健博士以多种方式参加 KDD 大会的组织工作,并于过去四年 SIGKDD 执委会担任要职。
在裴健博士当选为 SIGKDD 新一届大会主席之际,雷锋网 (公众号:雷锋网) AI 科技评论对其做了一次专访,当时他表示,「非常感谢 SIGKDD 会员对我的支持和鼓励。我会和新一届的 SIGKDD 执委会一起,进一步推进 SIGKDD 的工作,为学术界和产业界提供更好的服务。」而本次获得 2017 SIGKDD 创新奖,更是对裴健博士在学术领域的又一次肯定。
实际上,裴健博士在 2015 年就获得了当年的 SIGKDD 杰出服务奖。而今年的杰出服务奖则由香港科技大学计算机系主任杨强教授摘得。
2017 SIGKDD 杰出服务奖
2017 SIGKDD 杰出服务奖主要授予在知识发现及数据挖掘领域作出重大服务贡献的个人或团队,包括主办会议、主持学术团体等服务性工作,并在数据挖掘教学及财务性事务等方面的工作。
该奖主要奖励对知识发现及数据挖掘领域作出重大服务贡献的个人或团队,考察的 因素主要包括主持学术团体、主办会议等服务性工作,教育学生、研究者和实践者,资助研发活动,为传播技术信息提供专业志愿服务,并通过知识挖掘应用为社会做出贡献,改善全球性医疗、教育、灾难/危机管理及环境等议题。
曾经获得该奖项的华人学者除了此前提及的裴健博士(2015 年),还有:
-
吴信东(2004 年):美国路易斯安那大学教授,国家“千人计划”入选者、长江学者,IEEE、AAAS Fellow。
-
Ying Li(2012 年):目前担任新加坡电信公司 Singtel 旗下全资子公司 Dataspark 的 CTO,1993 年获不列颠哥伦比亚大学博士学位。
-
Wei Wang(2016 年):UCLA 计算机系教授,1999 年获得加利福尼亚大学计算机系博士学位。
获得 2017 SIGKDD 杰出服务奖的杨强博士是香港科技大学计算机系主任,IEEE 、AAAI 、AAAS 和 IAPR Fellow。
杨强博士在服务和推动数据挖掘和人工智能领域作出了突出贡献,与 ACM 也有着长期紧密的联系和合作。杨强博士曾担任 ACM KDD 2010 的程序委员会联合主席,ACM KDD 2012 大会主席,以及 IJCAI 2015 的程序委员会主席。此外,他还担任 ACM IUI、ACM RecSys、IEEE Big Data 等多个会议的大会联合主席,也是多个重要奖项的评审委员会成员,如今年的Test of Time Award评审委员会。
一直以来,杨强博士致力于推进 SIGKDD 在中国的发展,推动中国数据挖掘和机器学习的研究。在他的牵头下,KDD China 于 2016 年成功在北京举办,联合后续的 10 个 KDD China 系列活动,有效地拉近了中国数据挖掘研究与世界科研的距离。
此外,他在迁移学习理论和实际应用领域有着世界领先的研究成果,并积极推进数据挖掘和机器学习的工业应用,牵头成立了包括华为诺亚方舟实验室、微信联合实验室等多个研究机构。
去年,杨强博士受邀来到 CCF-GAIR 2016 的现场并做了主题演讲;而在今年 CCF 主办、雷锋网和香港中文大学(深圳)合办的 CCF-GAIR 全球人工智能与机器人峰会上,杨强教授担任了程序委员会主席,并担任主会场的 session 主持人。在与雷锋网 AI 科技评论的交流过程中,杨强教授一直强调 AI 学术的前沿工作也要从工业界获得灵感,甚至鼓励老师们到工业界工作一段时间。
「在工业界,老师能跟着商业人才和业务人才学习如何构建一个完整的商业闭环,能够把一个技术,比方说无人驾驶或者计算机视觉,和真正的产业结合起来,发挥作用。这个不仅仅是说技术可以在工业界不断提高,把准确率率提高百分之多少的问题,更重要的是说,能够给技术找到一个合适的场景,能和一个业务链条紧密结合起来。 」
得益于杨强博士在推进数据挖掘领域产业化的突出贡献,获得今年的杰出服务奖也算得上是实至名归了。
2017 SIGKDD 十年最佳论文奖
十年最佳论文奖授予的是在过去十年间 KDD 大会上,对数据挖掘领域产生重大影响的论文,康奈尔大学计算机系教授 Thorsten Joachims 博士的《Training Linear SVMs in Linear Time》获得今年的这一荣誉,理由如下:
支持向量机(SVM)是用于高维数据和稀疏数据最受欢迎的机器学习技术之一,但在高效性上存在不足。目前比较流行的做法受到超线性缩放行为的影响,使其在大数据集上呈现效率低下的表现。此论文提出了第一个线性 SVM 的通用训练算法,利用简单的切割平面算法来训练收敛的线性 SVM。和以前的方法相比,算法具有几个优点。首先是可操作性,非常简单易用;其次,这种方法比现有的大分类问题的分解方法要快几个数量级;再者,该算法具备与训练误差相关的停止准则,也就是说,可以避免耗费时间解决优化问题;最后一点是,该算法可以处理大数据集的序数回归问题。这一研究开辟了多个研究领域。由于数据只需要少量连续迭代,因此能够使用外核内存的并行实现,此外,该算法在原则上也可以应用于具有核函数的 SVM 中。
摘要:在文本分类、词义消歧和药物设计等应用中,SVM 已经成为高维度稀疏数据最突出的机器学习技术之一。这些应用涉及大量的例子 n 以及大量的特征 N,而每个例子只有 s << N 个非零特征。本文提出了一种用于训练线性 SVM 的切割平面算法,能够用于分类问题的训练时间 O(sn)和用于顺序回归问题的 O(sn log(n))。该算法能够成为 SVM 优化问题的一种解决方案。此外,切割平面算法比大型数据集的 SVM-Light 等分解方法要快几个数量级。
论文链接: https://www.cs.cornell.edu/people/tj/publications/joachims_06a.pdf
8 月 13 日至 17 日,第 23 届 SIGKDD 将在加拿大哈利法克斯举行,后续两个重要奖项——SIGKDD Dissertation Award 及最佳论文将于接下来的几天颁布。雷锋网届时将带来更多一线消息,敬请期待。
。