记AI英雄风云榜先锋奖获得者:实践者颜水成
文 /丁广胜
颜水成教授的办公室不大,摆满了各式各样的工程样机。
我先行一步来到办公室,门口的智能门铃 已 发现了我的到访,颜水成教授赶忙前来,这是 360目前主打的一款智能硬件产品,由颜水成领衔的360 人工智能研究院提供技术 支撑 。 目前 360在售智能硬件产品达到数十件之多,这也是颜水成来到360的初衷和使命。
“ 不以结婚为目的的恋爱都是耍流氓 ”他以此幽默的比喻人工智能落地实践的重要性,他认为学术界研究人工智能像谈恋爱,而在工业界做人工智能 更 像婚后生活。
三年以来,颜水成担纲的 360人工智能研究院发力视觉、语音、语义和大数据四大方向,向业务部门提供技术支持,重点推出了运动、交互、视觉、决策四大AI引擎。
三年过去,颜水成作为横跨学界和工业界的 AI 实践者 ,如何理解二者的 “爱恨情仇”,又如何一步步成为大师?用他自己的话说,“我们那代人运气 不错 , 现在很多计算机视觉领域的大家熟知的科学家都出生于 76年前后,李飞飞、吴恩达、孙剑等等”
那运气之外呢?
学术界追求极限
念旧的 颜水成 在 北京大学数学 科学学院 呆了 9 年 ,学习计算数学( Computational Mathematics )和应用数学,虽然 身 在 数学系,但 跟随导师 程乾生教授 主要 研究模式识别和机器学习相关的课题。
而真正 与人工智能结缘,则是在 2001 年进入微软亚洲研究院实习, 启蒙 师从李子青( Stan Z. Li) ,李子青是人脸识别和智能视频监控专家,在 2000 年辞去新加坡南洋大学终身教职,加盟微软亚洲研究院,并在微软研发了人脸识别系统 EyeCU 。
颜水成的整个 PHD 期间,几乎都是在微软亚洲研究院渡过的, 后来主要 师从张宏江博士,张宏江是世界多媒体研究领域一流的科学家,被称为计算机视频检索研究领域的 “开山鼻祖”,他也是微软亚洲研究院的创始人之一。
周志华、颜水成、梅涛等如今活跃的科学家都曾是张宏江的门徒 , 图为张宏江
“微软的氛围非常好, 非常自由同时方向非常多 ,以至于我当时在计算机视觉和机器学习两个方向都有非常广的涉猎 ”。 期间与 何晓飞 ( 前滴滴研究院院长 , 现飞步科技 CEO) 一起将 Subspace Learning 与 Manifold Learning 两个 非常 火爆 的领域 巧妙而简单地 串联起来, 两人 后来一 共 发表了 4 篇单篇引用过千的论文, 在这个领域 产生了广泛 的 影响 。
但到了不得不作出选择的时候,如果选择留着微软,颜水成觉得可以一眼看到三年、五年之后的样子, 还是 应该去海外走一走,他首先来到了香港中文大学汤晓鸥教授的实验室,继续从事人脸识别相关的研究工作。 因为汤晓鸥 教授 当时 往返 北京和香港 两地,在这期间颜水成就带领大家一起推进项目研究, 他的领导能力得以培养和 锻炼 ,为日后奠定了基础。
在短短的一年 多时间 之后,颜水成 又继续 前往伊利诺伊大学香槟分校( UIUC ),师从美国工程院院士、计算机视觉华人鼻祖黄煦涛 (Thomas Huang) 教授,在这里他见到了一 群算法和 编程能力 能都 超级 棒的学生 , 其中包括大家后来熟知的周曦 、 韩旭 以及 JianchaoYang , 见证了 与这群人一起投 9 篇 C VPR 中 7 篇,剩余的 2 篇又快速中其他会议的 完美经历 。
绕了一圈,尘埃落定。
颜水成返回亚洲,进入新加坡国立大学,开启了最高产的八年学术生涯,他认为这里比美国和中国都具 有 优势,在美国一个教授需要花大量的时间写项目申请,并且命中率非常低,而在中国,年富力强的教授可能需要花太多的时间应付学术之外的事情, 无法最大化利用 宝贵的时间。
在新加坡则没有这些顾虑,颜水成 约 一年 写一个项目申请 , “在新加坡的八年是我做学术最专注的八年,而且产出非常大” , 其团队 多次是 CVPR 和 ACM MM 两个会议论文全球最多的团队 。 他的团队是 最早参加计算视觉核心竞赛 PASCAL VOC 并 获冠军 的 亚洲 团队, 2010-2012 连续三年获得物体识别子项的 冠军。 同时其团队也 多次参加 ImageNet 竞赛并获冠军,期间提出的 Network-in-Network 模型中的 1x1 卷积成为后续几乎所有计算机 视觉 CNN 变种模型的基础模块。
目前,他在国际高质量期刊和会议上共发表 了约 600 篇高质量学术论文,论文引用过 4 万次, H-index 92 ,当前他是新加坡 Computer Science & Engineering 领域 H-index 最高的学者, 2014 、 2015 、 2016 、 2018 四次入选全球高引用学者 ( TR Highly-cited researchers ) 。
新加坡国立大学
在颜水成看来,在学术界就是追求极致,更多的是对技术和产品的憧憬,或者不停的进行技术升华,大多数时候并不需要真正把产品落地。
就这样,颜水成萌生了投身工业界的想法。
工业界在商言商
后来的故事想必大家就熟知了,颜水成在来 360公司交流时与360 一拍即合,一 边 是深入学术研究十余年的技术大拿,一 边 是求贤若渴希望筹建 AI研究院的企业 , 2015年颜水成选择北上,投身工业研究的序幕就此拉开。
在工业界,颜水成开始 “ 在商言商 ”, 他 把多年的技术积淀回归商业,产品落地成为工作的核心。他认为这时候最重要的是学术思维向工业思维的转变。
他幽默的将 这种转变 比喻为两个人谈恋爱,两个人谈恋爱是必修课,但婚后的生活才是本质, “ 不以结婚为目的的恋爱都是耍流氓 ”,在工业界必须以产品落地为自己的指导思想。
独特之处在于,颜水成还身兼新加坡国立大学副教授,这样跨领域的背景让他的研发工作更加从容, 2016年,人体分割技术(Human Segmentation) 在手机上 展现可商用的可能性 ,欧洲的一支研究团队 开始 展示,颜水成团队感兴趣但无奈对方要价太高, 这个时候他联合了自己的 NUS 实验室,得益于此前的技术积累,只花了一个月的时间就取得 了 成功,开始在手机上应用人 体 分割技术。
他将学术研究和工业实践结合在一起,撞出了火花。
他还建议身处学术界的教授在选择课题时,应该多拥抱工业界的需求,真真正正的瞄准社会价值,对于学生而言,大部分人最终都将进入工业界,真正有用的课题也对学生的长远发展颇有益处。天马行空的秀 demo ,很难产生价值,但他也承认,这个时代需要有人探寻科学的边界, 很多实验室经常会探索出令人惊喜的东西。
对于李飞飞、李佳、张潼等 AI专家重返学界,颜水成提到,学界和工业 界 的区别有目共睹,关键是能否和自己的价值观和追求所契合,如果有偏差选择离开是必然,但他相信这些科学家 的理念已经渗透进所在的企业 , 未来肯定会产生积极的作用。
请回答 2019
“人工智能行业会朝着更理性和更垂直的方向走”。
颜水成坦言,在火热的自动驾驶赛道,去年的时候大家普遍面向 L4/L5 ,今年我们可以明显的感知到,大家回归理性,更多的人选择专注在受限场景,港口、高速、公园等。
而另一方面,计算机视觉公司会变得更加重视场景,成为一个整体的方案提供商,而不只是一家 “纯粹”的只提供 SDK 输出或者技术的提供商,大家需要长远考虑。
变得更理性更专注是颜水成对行业趋势的总结, “ 2016 年的时候,只要是一家人工智能公司,大家就疯狂的投, 2017 年的时候,大家会看这家公司有没有落地潜力,但是到了 2018 年和 2019 年,大家开始真正的重视一家人工智能公司赚钱的能力。”
从技术的维度,颜水成期待 2019 年 AI 芯片和 5G 的真正爆发,过去两年,大家只是尝试和探索, 2019 年我们 希望 看到 AI 芯片和 5G 快速的产品化推进。
移动通信网络技术演进
我们注意到, 2019 年将是 5G 应用元年逐渐达成行业共识,今年在全球范围内将有 30 多款 5G 手机上市, 5G 网络作为第五代移动通信网络,其峰值理论传输速度可达每秒数十 Gb ,这比 4G 网络的传输速度快数百倍,整部超高画质电影可在 1 秒之内下载完成,随着 5G 技术的诞生,用智能终端分享 3D 电影、游戏以及超高画质节目的时代已经向我们走来。
颜水成指出, AI 芯片的规模应用将使得计算机视觉行业再次迎来机遇,有了 AI 芯片和 5G 这两剂“强心针”的加持,在资本寒冬到来的当下,尽管充满挑战,但他依然看好人工智能行业的发展,“大家投了那么多年,该考虑商业回报了”。
不过,对于那些进展缓慢的人工智能项目,未来一年将会相当难熬。
后记:
一个有趣的观点
“ 现在很多计算机视觉领域的大家熟知的科学家都出生于 76年前后,李飞飞、吴恩达、孙剑等等。”
这让作者想到了马尔科姆 ・格拉德威尔在《异类》中谈到,“比尔・盖茨和史蒂夫・乔布斯都出生在1955年,1955年前后正是计算机革命的时期,如果你出生太早,就无法拥有个人电脑,如果出生太晚,计算机革命的好机会又被别人占去了,那些奇才异类,他们之所以神奇,得感谢机遇的眷顾。”
一个评语
“ 「网易 2018中国AI英雄风云榜」 商业创新人物先锋奖的获得者是周曦和朱珑,我非常看好这两位年轻的科学家,他们能够抛去 学术 光环, 在商业领域 脚踏实地一步一个脚印的往前走,他们的公司可能不是发展最快的,但未来一定会取得非凡的成就。 ”