154 万 AI 开发者用数据告诉你,中国 AI 如何才能弯道超车?
从三年前年薪25万只是白菜价,到去年华为以年薪最高达201万招揽顶尖应届毕业生,AI这把星星之火已然燎原,AI开发者也成为各大企业拥抱AI及数字化转型的关键。
同时,在近几个月的特殊时期下,AI奔赴“战疫”一线,从AI病毒传播模型预测、AI语音输入病例、到AI无人机监管等实践,再次证明数字经济时代,AI带来的自动化革命处于高速进行时阶段,“无AI,不科技”的应用也正全面渗透日常。
根据CSDN最新官方数据统计,在CSDN超过3000万的注册开发者中,689万开发者有阅读、撰写与研究AI技术行为。其中,精准聚焦AI学习及应用的开发者人数达到了154万。
基于此,为了更好地了解其背后技术趋势与人才走向,并帮助所有有志于AI的开发者成长及就业,CSDN发布了《中国AI应用开发者报告》。
在此篇章中,特别聚焦分析中国AI开发者画像特征、技术及行业增长、地域分布等,旨在帮助更多的开发者及相关行业深入了解AI技术及应用发展趋势。
AI正在吞噬软件
“Software is eating the world.” 犹记得在2011年,原网景创始人、硅谷著名投资人Marc Andreessen曾说道。
彼时随着PC、智能手机等计算设备逐渐成为通用工具,也得益于硬件成本的大幅降低和硬件技术的标准化,全球的科技行业走向了软件开创的新纪元。
而亲身经历这一转变的典型公司就有曾被讥讽为“一个书店晚上业余做IT”,到后来“一个IT公司顺便卖书”的亚马逊。
近十年后的今天,科技行业再次发生了改变,曾经的软件吞噬世界,而现在已演变为AI正在吞噬软件。
中国AI十年演进:2016-2018大爆发,2019年进入平静期
然追溯驱动这场变革的源点AI,始于1956年达特茅斯人工智能夏季研究计划,其间既有兴盛,又历寒冬。
不过相较而言,早期在国外 Google 相继收购 DNNresearch 与 DeepMind、Facebook 寻得Yann LeCun 担任人工智能实验室负责人、亚马逊借助机器学习改造部分业务等以科技巨头为首的人工智能协同推进发展下,国内的人工智能风起于青萍之末,行走于荆棘之间。
直到近十年,中国AI开始从过去偏于理论的学术研究,真正地落地到产业界。
对此,CSDN通过对2009年至2019年这10年来AI相关数据进行统计发现:60年前诞生的AI概念似乎爆发于一夕之间。
其中,2016年作为一个截然不同的时间节点,人们似乎只看到了 AlphaGo 战胜顶尖围棋选手们、Master 在人机“世纪大战”中以60胜0负的战绩将人工智能的关注度推到了前所未有的高度,以至于AI成为家喻户晓的关键词。
却往往忽略,AI之所以能普及的背后源于卷积神经网络、深度学习、机器学习等基础技术的平稳进阶与强力结合。对于这个科技世界最为敏感的技术开发者们,也正是得益于此,才完全清晰地知晓了如何摆脱只有“人工”没有“智能”的应用研发手段,从而AI产业也吸引了越来越多的开发者加入。
随后的几年间,在诸多政策的支持下,如2017年,国务院印发了《新一代人工智能发展规划》,提出了面向2030年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,AI开发者数量几乎翻一番。
不过,从AI技术10年演进中,也不难发现,2018-2019年间,AI整体发展出现了微小的下滑趋势,这也正如狗尾草科技人工智能研究院院长邵浩曾在中国开发者大调查对AI现状点评道,“在经历了2019年的行业低谷期之后,无论是行业巨头还是新兴独角兽,都开始审视AI能够切实落地的场景。
从企业AI现状中能够发现,很多企业还停留在信息化阶段,AI所能发挥的优势还不够明显,但有趋势可以看出一些新兴的AI形态逐渐得到了认可和落地,例如RPA、对话系统等。”
互联网行业AI大变革
据脉脉大数据显示,当下,这些公司主要聚焦于以软件为主的IT互联网领域,而相应的该行业的AI开发者占比人数最多,高达80.1%。
除此之外,金融业、制造业也聚拢了不少AI开发者,占比8.4%,这也意味着,这些传统的行业也正在向AI加速转型。
开发者对AI技术趋势的感知
在此趋势下,AI的应用开发者们所运用的工具利器也随着产业的落地而发生了改变。
深度学习比机器学习更热门
在AI细分领域上,开发者主要聚焦于深度学习、计算机视觉、机器学习等主要领域,而这些技术在时下早已成为智慧城市、智能家居、智慧物流等场景中最为常见的基础支撑技术。
AI工具框架大比拼:OpenCV远超TensorFlow、Torch/PyTorch,国产PaddlePaddle进入TOP10
在技术应用层面上,对于最为直观的工具,莫过于OpenCV了。这位相对更老牌的OpenCV虽广泛应用于AI领域,却也不局限于AI。
彼时于1999年1月,怀着为计算机视觉提供通用性接口的OpenCV首个测试版的发布,实现了帮助AI开发者们在人工智能时代下快速构建精巧的应用。在20年的演进中,OpenCV已经广泛应用于自动驾驶、相机校正、工业检测系统等场景中。
除此之外,在AI开源框架领域中还有一个既定事实是,TensorFlow、PyTorch基本两分天下,从技术能力到生态建设,它们能给AI落地提供有力支撑,可以满足大部分企业在其中构建自己的AI应用的需求。
相比之下,TensorFlow 算得上是AI工具中的一匹黑马。2015年,Google 正式将用于机器学习和深度神经网络方面研究的 TensorFlow 开源。至今仅用了不到5年的时间,素有“AI界的安卓系统”之称的 TensorFlow 就成为了一线开源机器学习框架。
根据最新的数据统计,老牌的跨平台计算机视觉库OpenCV凭实力一路飙升到了第一名,成为全国AI开发者最喜爱的AI工具框架。其次是TensorFlow。
继而,紧随静态深度学习框架TensorFlow之后的是Torch/PyTorch。论其两者,有不少相似之处,但要问为何Torch/PyTorch的使用率比TensorFlow少很多。
究其原因,一方面,Torch/PyTorch虽然灵活,但PyTorch在2017年才开源的时间上落后了TensorFlow一大步;另一方面,TensorFlow在GPU的分布式计算上优异表现,让不少公司及开发者更愿意尝试TensorFlow。
另外,在以上主流的AI工具框架之列,也可以看到国产深度学习框架/平台的崛起:
其一是排在第9名的飞桨(PaddlePaddle):作为中国首个唯一开源开放、功能完备的深度学习平台,百度的飞桨可同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,支持万亿乃至更高量级规模参数的高效并行训练,也是最早提供如此强大的深度学习并行技术的深度学习平台,通过技术创新做到高效、稳定、成本低廉。
其二是排在第13名的腾讯NCNN:NCNN是一个为手机端极致优化的高性能神经网络前向计算框架。基于NCNN,开发者能够将深度学习算法轻松移植到手机端高效执行,开发出人工智能App。
其三是位列第15名的Face++/Brain++/MegEngine(天元):三者都是旷视的平台及工具。在技术框架迭代的过程中,旷视于2019年1月从技术与场景两大维度做了战略升级,并将在人脸识别、面部分析等方面具备完整视觉技术服务解决方案的云端视觉服务平台Face++进一步地做了升级,演变为更为系统化的AI算法引擎Brain++。
而就在前不久,旷视正式开源其AI生产力平台Brain++的核心组件 -- MegEngine(天元),共约35万行代码,包括C++、CUDA和Python的代码。对此,旷视表示,正在通过开放Brain++,尝试为AI打造一套Visual Studio,将AI能力带给更多开发者。
整体而言,百度飞桨以较为完备的端到端开源深度学习平台生态处在国内领头羊的位置;旷视的体量相对小一些,但其灵活高效等优势让其具备很强的多平台多设备适应能力;NCNN在同类框架中,跨平台兼容性也是最好的。
当下,随着飞桨、NCNN、Face++/Brain++/MegEngine荣登AI开发者常用的TOP20工具之列,无疑也在彰显国产化的中国力量。
而在百度、腾讯、旷视乃至更多企业相继入局之下,国产深度学习框架/平台市场开始出现博弈之势,不过,从中我们也发现,作为国产的深度学习框架的代表,百度的PaddlePaddle在历经四年的迭代之后仍处于AI开发者常用框架的第9名。
在此之下,国产工具该如何实现突破?中国的AI又将如何实现弯道超车?
对此,CSDN创始人&董事长、极客帮创投创始合伙人蒋涛表示,中国AI的希望在于应用,AI真正进入各行各业落地,需要百万掌握AI应用开发能力的工程师、产品经理和行业专家。
AI相关技能开发者地域分布现状
在地域分布上,本次报告公布了最新AI相关技能开发者Top20的地区排名:北京稳居第一,其次第一梯队的还有广东、上海、浙江、江苏。
AI相关技能开发者分布TOP5城市:北京、上海、深圳、杭州、广州
从数据可以看出,无论是更广泛的互联网企业,还是更聚焦的AI公司,北上广深一线城市均是他们的首选,从而吸引的AI爱好者占比也相对较高。
其中,在探讨北京对AI感兴趣的开发者数量为何是上海的一倍多、乃至杭州三倍多时,我们发现,位居全国前列的AI相关研究单位及高等院校如北京大学、清华大学、中科院等均坐落于北京,为各大企业、研究所提供了最为直接及高效的AI培养与输出。除此之外,作为智慧城市的重要城市之一,北京聚集了众多优质人工智能企业。
同时,新一线城市如南京、西安、成都、杭州、武汉等成为AI爱好者的第二大聚集地。
此外,因地理位置等因素,如沈阳、大连等城市更多的是聚焦在传统的制造业上,因此从事或关注相关行业的AI的开发者相对较少。
不过,相较而言,除了北上广深外,随着阿里巴巴、网易、华为杭州研究所等巨头以及不少创业型企业纷纷落户杭州,杭州的科技竞争力也愈发强盛,在AI应用层面,开发者关注的活跃度也相比其他新一线城市要高。
AI开发者画像:已呈年轻化趋势,本科学历背景占比最高
随着AI应用场景的普及,AI人才早已呈现供不应求的现状。就此,一个月前,教育部官网发布了《教育部关于公布2019年度普通高等学校本科专业备案和审批结果的通知》,审批结果显示,中国人民大学、北京化工大学、北京邮电大学、北京师范大学、中国传媒大学、复旦大学等179所高校新增了人工智能专业,这其中还并不包括与人工智能相关的大数据、智能科学、自动化等方向。
24岁以下开发者占比高达51%
AI初长成,高校加强AI人才的培养,带来的人才必然呈现年轻化的趋势,这一点从数据上也可以看出。据调查显示,24岁以下的AI开发者成为人工智能行业的主力军,占比高达五成;其次,经验较为丰富的24-35岁AI开发者也不在少数,占比38%。
不过,35岁以上的AI工程师相对较少,只有11%。
这一趋势走向也与现下整个互联网的人才年龄趋势相吻合,此前,据CSDN发布的《2019-2020中国开发者调查报告》显示,在软件开发领域,30岁及以下的开发者人群占比在8成以上。在传统与创新观点的碰撞中,科技行业的年轻化未尝不是一件好事,其也将为科技的迭代落地带来更多的可能性。
不过,在这个伴随着高薪而来的高压力IT领域中,男多女少的比例成为常态,对于AI行业亦然。此前,AI界知名大佬、斯坦福视觉与学习实验室(SVL)负责人李飞飞坦言:“即便是在自己的实验室里,仍然招募不到足够多的有色人士和女性。尽管现在要比过往典型的人工智能实验室更加多元化,但它仍然大多数是男性。”
AI行业,本科生占比最高,博士/博士后稀缺
在国家大力推动素质教育的前提下,各行各业的招聘门槛均有所提升。在兴起的AI行业中,无论是大厂还是创业型公司,很多的企业的招聘对于学历要求都是本科起。
据最新的数据统计,AI人才中43.6%拥有本科学历,其次硕士占比28.4%,高学历的博士/博士后人数最少,仅有2.8%。
而这一比例与整个软件开发者学历分布占比有所不同,在更广泛的软件开发者群体中,具有本科学历的开发者占比66%,硕士研究生、博士研究生仅占11%、1%。相较而言,AI领域的人才对于学历的要求会更高一些。
算法工程师、数据分析师成为AI开发者的首选
细分来看,在具体的职位方面,AI技术栈中算法工程师比例最高,占比48.4%。而此前,邵浩在中国开发者大调查对AI现状也点评道,从就业角度来看,由于算法工程化才是商业落地的核心关键,因此算法团队的规模在近半数的企业中仅保持在个位数,另一方面,拥有扎实工程化能力的算法工程师更受青睐。
从这个数据中,可以看出算法工程师颇为热门,但侧面也体现出其竞争也更为激烈。对此,身处该行业中的一名从业者赵一鸣在《算法工程师的危机》一文中表示:
对于一般的算法工程师,主要有两个方面的危机。
一方面是来自人的竞争,大量的毕业生和培训生涌入这个行业,人才缺口被迅速填满甚至饱和,未来的竞争会更激烈;
另一方面则是来自机器的竞争,大量算法工程师会很快被他们每天研究的算法所代替。这两者互相恶化,AI人才市场终会变成一片红海。
除了算法工程师,很多开发者在进入AI行业中也选择了数据分析师、机器学习工程师、数据挖掘工程师职位,占比分别为32.4%、6.1%、6%。
AI招聘依然遵循金三银四、金九银十的定律
那么,在AI浪潮之下,对于AI开发者而言,何时适合找工作?据《中国AI应用开发者报告》中AI人才招聘与求职的趋势显示,一方面,常规的金三银四、金九银十依然是每年的招聘旺季,人才市场流动旺盛;
另一方面,需要实时关注行业动态,伺机而动,如据2019年1月-2020年2月AI人才招聘趋势图显示,11月期间,业界对AI人才的招聘需求达到最高峰,随之在12月带来了一波求职小高潮。
另外,根据数据调查,我们发现,或受春节假期以及疫情影响,2020年1月,无论是企业招聘还是人才求职,趋势走向稍显低迷。随着2月各大企业远程复工的开启,AI相关的人才招聘状态虽有恢复,但其速度仍不及求职的需求。
十年AI,爆发于一夕,崛起于脚下,探索于未来
目前AI正处于寒武纪的大爆发阶段,而据最新的数据显示,37%的AI开发者入行已有6年以上的时间,而刚入行工作0-3年的AI开发者人数占比最多,达到了38%。而在年轻化趋势之下,这一占比将会越来越高。
这也意味着,随着AI和传统行业以及日常生活的加快融合、开源技术生态在中国的日益普及,以及越来越多资源拥抱AI,更多的算法与技术、应用的结合下,未来属于AI时代。
而AI时代,属于为其开疆拓土的AI应用开发者们。 雷锋网雷锋网雷锋网 (公众号:雷锋网)
。