未来属于提出问题的人
软件工程思想家杰拉尔德·温伯格曾经给「问题」下了个定义:问题,就是理想状态和现实状态之间的差别。
我们的工作,就是应对问题的挑战。问题可能是「我想要产品检测更准确」,「我想要快速完成重复的任务」, 或者,「我想要沙漠变成绿洲」。
「我想要沙漠变成绿洲」这个问题,是高鸿志提出来的。他是个大学生,来自甘肃省古浪县。在这个紧贴腾格里沙漠的县,有几位被称为「治沙六老汉」的固执老农,用 38 年造林 21.7 万亩,在风沙中一寸寸夺回耕地,保护农田。
「治沙六老汉」三代治沙人合影 | 图片来源:视觉中国
高鸿志也想做同样的事。不过作为自动化专业的学生,他想换一种方法。他和朋友们开发出栽种和养护树苗的智能机器人,这些小家伙能在复杂沙漠地形中,找到合适的地方栽下树苗;在巡视林地时能识别树苗根部,精准浇水和施肥。
成为时代楷模的「治沙六老汉」凭借毅力和人定胜天的信念,靠双手阻住了风沙的脚步;在人工智能(AI, Artificial Intelligence)的帮助下,高鸿志找到了解决问题的新方法,让新时代的治沙人,有了新的眼睛和新的手脚。
那么,AI 是怎么帮人解决问题的?
01、 智能时代的操作系统
AI 是计算机科学的分支,它尝试让机器去做到那些传统上只有人能做到的事情——听起来很简单,但是要实现却很困难。自上世纪五十年代 AI 的概念提出以来,这个蕴含希望的领域让人们激动了两次,又失望了两次。直到 2006 年,多伦多大学的杰弗里·辛顿教授提出一种基于多层人工神经网络的机器学习方法,AI 才迎来了第三次发展浪潮。
人工神经网络模仿了神经元相互传递信号的方式,它会在训练数据的帮助下逐渐学习,做出的判断越来越准确。而多层神经网络,是在数据输入层和结果输出层之间,夹着更多 「隐藏层」的神经网络。各层中的神经元彼此相连,构成类似大脑皮层的复杂结构。
这种让多层神经网络从训练数据中学习的方法,就是大名鼎鼎的「深度学习」。它是目前最受重视的机器学习方法,也是近年来 AI 迅速发展的基础。无论是打败李世石的 AlphaGo, 还是能听懂我们说话的小度音箱,都是基于深度学习技术;处理人类的自然语言、看到和识别物体、转换不同数据形式,都是深度学习技术能够分担人类工作的领域。
简单人工神经网络和深度人工神经网络
在这项技术发展的早期,往往是研究者自己编写神经网络,经由数据训练,转化成能解决问题的深度学习模型。很快地,人们把构建深度学习模型的几个必要过程提炼出来,形成稳定通用的组合,构成「深度学习框架」。它们隐藏了复杂的底层工作,大幅降低深度学习的使用门槛。因其重要,框架被称为「智能时代的操作系统」,成为大多数 AI 用户的入口。
许多 IT 企业都以开放源代码的方式发布了自己的深度学习框架,希望能将 AI 引入更多行业中。在世界上,谷歌的 TensorFlow,Meta(原脸书)的 PyTorch , 百度的飞桨 PaddlePaddle,亚马逊的 MXNet 都拥有大量用户,吸引了大批开发者和研究者;2020 年以来,国内又相继出现了旷视 MegEngine、清华大学 Jittor、华为 MindSpore、一流科技 OneFlow 等等一批开源深度学习软件框架。
但是,并不是所有的框架,都适合所有企业和场景。
网易云音乐就碰到了独特的问题。作为规模巨大的音乐社区,网易云音乐希望能向用户推荐合口味的音乐、歌单甚至直播。但是它的数据很特别:类型多,规模大,动态程度高。网易云音乐的数据类型从声音、数据条目直到文本都有,9,000 万首歌,28 亿个歌单,还有 2 亿活跃用户每天产生的海量评论和互动,数据关系高达千亿级别以上。
经过连番测评,大多数框架都败下阵来。最终,网易云音乐以「飞桨图学习」(PGL, Paddle Graph Learning) 组件为基础升级了推荐系统,提升了冷门歌曲分发、云村广场、陌生人一起听等等业务场景的效率,最高甚至提升了近一倍。
百度飞桨是目前国内最受欢迎的开源深度学习框架,综合市场份额第一。但是,飞桨想做的并不仅仅是框架。它的目标是成为 AI 时代的基础设施,让 AI 能力成为即需即用的资源,像电,像自来水,像移动互联网。
只有 AI 能力灵活可用且随时可得时,它才能真正发挥作用,真正帮助各行各业跨入 AI 时代。那些在行业中真正实践的人,那些面对真正问题的人提出需求、定义问题,AI 就能以强大的能力,帮助他们解决。
在互联网高速发展的时代,IT 企业中都会有产品经理,他们是发现需求、定义问题,再组织资源去解决问题的人。好的产品经理可遇不可求。今天,在 AI 的帮助下,产品经理更需要的是懂得如何运用前沿的 AI 技术,更好更容易地解决问题。
时代变了,关键在于能不能提出好问题。
02、 有 AI 的未来
世界是由提出问题的人推动的。提出一个好问题,往往比找到答案更重要。当莱特兄弟不再模仿鸟类飞行,而开始研究空气动力学的时候,人类才真正能飞翔。
那么,有 AI 的未来会是怎样的?
百度飞桨认为,AI 应该帮助各行各业提升能力,更便捷地解决问题。AI 能力应该像大工业生产那样标准化、模块化、自动化,让任何人都能容易地学习和使用。
这也是目前 AI 平台面临的普遍问题。正如亨利·福特所说,「如果我去问人们想要什么,他们会说想要更快的马。」技术的发展往往先于大众认知,有问题的人们未必意识到 AI 可以帮助他们解决问题;AI 技术的门槛还是偏高,人们未必会容易学会使用 AI 来解决问题。
飞桨想要解决这些问题,成为智能时代的增长引擎。从 2016 年开放源代码以来,飞桨一直致力于与开发者社区、与各种行业和企业合作,提供针对行业独特需求的 AI 能力,优化与硬件的适配,以及降低学习和使用门槛。
北京大兴区长子营镇有一座植物工厂,厂长李开一个人最多可以照看 100 亩地——是过去的 5 倍。提供助力的,依然是 AI:计算机视觉组件不仅会自动识别蔬菜是否健康、能否采收,还能及时发现害虫。搭建这样的系统也并不困难:飞桨提供了 EasyDL 零门槛 AI 开发平台 ,将构建深度学习模型的过程转变成搭积木般的活动。
这是相对简单的 AI 能力。在其他内容更繁杂、上下游更多样的行业,飞桨使用另一种策略:开发预训练大模型,并针对任务和行业优化,形成基础能力、任务能力、行业能力的组合。
提高 AI 的「智力」,关键在于算法、数据和算力。解决问题能力强的深度神经网络,需要大量数据和强大计算能力的支撑。神经网络会通过学习训练数据,在内部为一些变量赋值,这些变量被称作「模型参数」,是深度学习模型解决问题能力的关键。而预训练大模型,就是参数很多的、用大量数据预先训练好的深度学习模型,可以帮用户降低创建和训练 AI 模型的成本。
更强的计算能力,更多的数据,这是「大力出奇迹」的思路,往往有效。从 2019 年到 2021 年,模型参数的数量每年都增加一个数量级:微软的 T-NLG 有 170 亿参数, OpenAI 的 GPT-3 有 1,750 亿个参数,谷歌的 Switch Transformer 的参数更是达到了 16,000 亿。
大模型参数数量的迅速攀升
同样迅速猛增的,是大模型的训练成本。GPT-3 使用了 285,000 个 CPU 核心,10,000 个 GPU, 以每秒 400Gb 的高速网络连接 GPU 服务器;这样的配置,足以在全球超级计算机排行榜前五中占据一席。在超大算力的需求下,GPT-3 训练一次就要用掉 19 万度电,花掉 460 万美元。
这样的发展是不可持续的。虽然大模型通用性强,但提升效果所需的成本增加得更快。而且,通用性强并不意味着在具体问题上表现更好。
用户以为自己想要更快的马,但是他们真正想要的是更快、更安全、更方便的交通工具;用户使用某种工具,是为了解决某个问题。市场营销大师西奥多·莱维特曾说:「用户不想要四分之一英寸的钻头。他们想要的是个四分之一英寸的洞。」
AI 大模型要与应用场景匹配,才能更好地解决问题。所以,飞桨文心大模型将能力分了类。基础大模型沉淀知识与认知推理能力,任务大模型为特定任务优化,行业大模型再叠加行业特有的数据和知识,来让 AI 获得更好的认知,帮助人们做出更好的决策。在 5 月 20 日的 Wave Summit 2022 深度学习开发者峰会上,飞桨文心大模型一口气发布了十个大模型,涉及多种专项任务,以及能源电力和金融两个垂直行业。
与行业合作,让能源电力和金融领域的任务提升效果,意味着强大的 AI 能力开始帮助人们解决重要问题了。
但是这还不够。工具要易学易用,才能广泛使用;飞桨文心大模型还配套了开发套件、API 以及内置了文心大模型能力的 EasyDL 和 BML 开发平台,努力降低使用门槛,争取让人人都可以成为 AI 开发者。开放良好的生态,才能带来更多创造,文心大模型共创共享飞桨生态,推出大模型创意和探索社区旸谷;飞桨平台已经凝聚 477 万开发者,服务 18 万个企事业单位,创建 56 万个解决问题的 AI 模型。依托飞桨这个平台,百度协同产学研培养了超过 200 万 AI 人才。
飞桨的目标很明确:让更多人意识到,AI 可以帮助人们解决问题;让更多人知道,如何使用 AI 来解决问题。
03、 未来属于提出问题的人
毕竟,世界是以问题来组织的。世界不在乎学科门类,只是向人们抛出挑战。
未来正在变得越来越快,越来越不确定。适者生存,未来属于能敏锐地发现问题、提出问题的人。
然后,他们将和 AI 一起,面对世界的挑战。
提出问题的人,将不仅是政治家、商业领袖或学者;他们可能是创业者,小团队,行业专家,以及任何想把世界变得更好的人。