继小米后,Facebook F8大会也要走直播
雷锋网获悉,2月28日,受疫情影响,Facebook宣布取消F8开发者现场大会,大会原计划于5月5日至6日在加利福尼亚州圣何塞召开。
Facebook开发者平台和项目总监Konstantinos Papamiltiadis在官网发表声明称:“这是个艰难的决定……但我们需要优先考虑开发合作伙伴、员工和帮助举办F8大会的每个人的健康和安全。”
这并非 F8 大会的第一次缺席,2009年、2012年 和 2013 年 Facebook 都没有举办 F8 大会。不过,这次虽然因为疫情的不可抗力使线下活动未能成行,并不意味着 F8 就彻底失约了,他们决定采取现场主持、远程直播的方式与开发者见面,具体参与方式也会在未来几周公布。
新冠病毒的肆虐,已经让Facebook取消了多次会展活动,比如原定于3月在旧金山举行的全球营销峰会,上周Facebook还宣布退出3月份在旧金山举行的游戏开发者大会和PAX East游戏展会。
AI开始登上舞台
F8大会是Facebook 专为全球开发者举办的盛会,2020年是第十一届。第一届F8在 2007 年召开,其后每年一次。F8是Facebook每年最大的活动和最重要的宣传窗口,去年的大会吸引了来自全球的5000多名开发者、从业者参加。F8基本流程就是扎克伯格的主题演讲开场,话题一般都是怎么酷炫怎么来,包括人工智能、太阳能飞机、卫星等,然后由相关负责人发布新产品,宣讲新理念,秀一把技术实力。首届 F8上,Facebook 就宣布开发者的应用可以进驻信息流,还能向用户推送通知,这被看作是 Facebook 生态开放的起点。
近几年,AI也不断成为F8大会的热词。在2016年30分钟的主旨演讲中,扎克伯格公布了Facebook未来10年的发展路线图。他表示,Facebook未来会专注于三项技术:连接性,人工智能和虚拟现实。在AI方面,Facebook迈出了重要一步——在前一年对开发者开放的Messenger平台基础上,新增聊天机器人功能。
然后第二年的F8上,Facebook推出了Messenger 2.0版本,整合M虚拟助手部分功能,提升聊天机器人的使用体验;为了建立技术影响力,FB还发起了开发者论坛计划(Developer Circles),对所有开发者免费开放,并且与IT培训平台Udacity合作定制培训项目。
贾扬清
此外,这一年还有一个重量级发布是Caffe2开源深度学习框架。Facebook AML实验室的 Andrew Tullock和贾扬清(其时Title是Facebook AI平台工程主管)上台介绍了Caffe2轻巧、易用和可扩展的特性。
Caffe2是核心作者贾扬清博士在读期间的作品Caffe的升级版,也是当时Facebook机器学习的核心技术之一。码完代码,贾扬清就把Caffe开源了,这是世界上第一个深度学习开源框架,谷歌的TensorFlow是2015年底才开源的,而这个框架,贾扬清也有份参与开发,2013年时他就在谷歌实习。
而这不是Facebook最早开源的深度学习框架,由 Yann LeCun领导的Facebook 人工智能研究院(FAIR)之前已经推出Torch,后来在2017年1月又推出了PyTorch。
FAIR和AML(applied machine learning,机器学习应用小组)是Facebook两大分工不同的AI实验室。前者偏向基础研究,后者更关注落地。2018年1月,Yann LeCun卸任,两大实验室都由前IBM首席数据科学家Joaquin Candela负责。
知道这个背景,也就更好理解贾扬清曾在Hacker News发表的评论:“PyTorch适合于研究、实验和特别的神经网络,Caffe2偏向支持工业级应用,主要面向移动端……未来我们也将加强互操作性。”
AI 开源进程加快
2018、2019两年F8 大会都因为数据泄露丑闻而蒙上一层灰色阴影,因此两次大会上隐私都是非常重要话题,FB谈到了不少如何改造 Messenger,Facebook 和 Instagram 的内容,2019年扎克伯格PPT上更是有一句话:未来是私密的(The future is private)。
当然,AI技术也依然是重头戏。2018年F8 第二天,Facebook宣布了好几个AI开源项目的进展,包括PyTorch、ONNX、ResNext,以及新开源了PyTorch中的自然语言理解库Translate、ELF OpenGo、一个打《星际争霸》的AI,这些项目资料都可以同一年推出的“Facebook.ai”官方网站上找到。
其中最大的新闻要数将在未来数月内开源PyTorch 1.0 AI框架。贾扬清在知乎上将这一版本形容为“Caffe2 + PyTorch = PyTorch 1.0”,也为前一月Caffe2和PyTorch突然合体的下一步作出了解释。
值得一提的是,Caffe2和PyTorch合体没进过什么铺垫,2018年4月1日,Caffe2通过GitHub宣布已经将全部代码并入PyTorch,这件事迅速成为深度学习圈一个重磅新闻。
当时Facebook表示,PyTorch 1.0结合了Caffe2和ONNX(开放式神经网络交互系统)面向生产和PyTorch面向研究的特性。贾扬清的知乎回应提到,FAIR 当时有一半项目在使用PyTorch,产品线都在使用Caffe2,两边都有优化效率的动力。
PyTorch 1.0后来在2018年10月正式发布。2019年F8大会上,Facebook更迭了Pytorch 1.1。除了平台本身之外,Pythorch 去年还新增了许多新项目,比如BoTorch ,一个贝叶斯优化工具;CrypTen,一个保护隐私的 ML 框架;Captum,一个模型解释和理解库。
在Facebook AI产品阵列,ONNX是一个关键项目,它是一个深度学习模型的标准,可使深度学习模型在不同框架之间进行转移,由Facebook和微软在2017年9月联手推出。据贾扬清所说,初版代码也是他写的,还帮助搭建了团队。
2018年F8大会上,Facebook宣布它会在升级后支持更多的工具,包括Core ML, 百度的PaddlePaddle, 高通的SNPE, Google的TensorFlow和微软的Cognitive Toolkit等。
其时有评论认为,ONNX是一次众公司组成联盟对谷歌和它的TensorFlow的一次狙击。截至2018年初,亚马逊、AMD、ARM、华为、 IBM、英特尔、Qualcomm都已经支持ONNX。
但现实总是比想法更骨感。百度算法工程师mileistone当时评论说,联盟里的强者就像战国时期的六国其实都有小九九,比如caffe2和亚马逊的MXNet都不支持导出模型,而PyTorch不支持导入模型,还很难与TensorFlow“秦国”势均力敌。
何恺明
ResNext 是深度残余网络,核心作者是当时在微软实习的何恺明及其同事,他们凭此在2015年的ImageNet图像识别大赛中一鸣惊人,且获得2016年CVPR最佳论文奖。2016年8月,何恺明加入FAIR继续研究ResNext。F8大会时视频行为识别模型Res 2+1宣布开源,同时用于理解视频的ResNext 3D模型也将在6月后开源。
2019年8月,何恺明团队推出了ResNeXt-101模型,据称,利用Instagram上的用户标记图片作为预训练数据集,省去了人工标记数据的巨额成本,而且使用中只需微调,性能即超越了ImageNet任务的SOTA水平。
田渊栋
在F8大会上,围棋AI ELF OpenGo也宣布开源训练代码,测试代码及训练出来的模型(224x20),核心作者田渊栋也是一个活跃在知乎上的一个大神,当时在知乎上写说,“我们用两千块GPU训练约两到三周后得到的围棋AI,基本上超过了强职业的水平。我们和韩国棋院合作进行了一次测试,给这个AI单卡每步50秒搜索时间(每步搜索8万个局面),给人类棋手任意长时间思考,结果AI以14比0完胜。”
田渊栋现任Facebook 人工智能研究院研究员,重点研究深度强化学习及其应用、深度模型的理论分析等。他2013 年博士毕业于 CMU 机器人研究所,2013-2014 年在谷歌无人驾驶部门任研究员。
一年后的2019年2月,ELF OpenGo又有一波信息开源,FAIR 公布了与它相关的最新功能与研究成果、Windows 平台可执行版本,以及 ELF OpenGo 在 87000 场专业围棋对弈当中的归档分析信息。
今天开源可以说是无处不在。当我们通过智能手机上网时,其实就使用了许多开源软件,包括基于开源的操作系统(Linux,Darwin)、Web服务器和数据库。秉持着交流分享的初心,AI研习社、雷锋网和GMIC预计联合推出以“AI+开源”为主的开发者峰会——「GMIC*AI源创全球开发者峰会(北京)」,我们计划于4月29日在北京召开。
中国每2.3个人工智能学习者或工程师中就有一位使用过Pytorch。雷锋网 (公众号:雷锋网) 也已经向Pytorch的核心作者发出邀请,请他向中国开发者介绍Pytorch的技术特色和最新进展,与Google 、微软、阿里、腾讯、百度、亚马逊等企业的框架大神、核心开发者一起分享和探讨人工智能框架的心路历程和发展趋势。
。