第四次产业革命源于人工智能(趋势解读20k字)
第四次产业革命源于 人工智能 (趋势解读20k字),附“数据简化DataSimp”技术描述、学会及社区1k字。欢迎关注、收藏、转发新媒体“数据简化DataSimp、科学Sciences”微信号、头条号,转载请写出处: 秦陇纪10“数据简化DataSimp 、 科学Sciences”公众号、头条号译编 ,投稿QinDragon2010@qq.com也欢迎加入。
目录
A. 第四次产业革命:始于人工智能( 6.7k 字)
C. 人工智能2.0时代序幕开启 书 ( 6.5k 字)(略)
D. 第四次产业革命 之 人工智能 常识、机遇和挑战 (4 .8 k字)
E. 数据简化DataSimp技术描述、学会及社区(1 k 字)
本文通过对第四次产业革命、人工智能概念常识、应用类型、产业智能化的概述,让大家认识到当今之趋势,以及人工智能细分领域和机遇所在。文末附秦陇纪10数据简化DataSimp技术描述、学会及社区。
文章摘要: 谷歌 首席执行官桑达尔?披猜去年底说「最近十年,我们一直在建立一个移动优先(mobile-first)的世界,而接下来的十年里,我们的将转向人工智能优先(AI-first)的世界。」原文作者:David Kelnar,译者:徐婧欣,标签:深度学习、机器学习、人工智能。
「最近十年,我们一直在建立一个移动优先(mobile-first)的世界,而接下来的十年里,我们的将转向人工智能优先(AI-first)的世界。」(Google CEO Sundar Pichai,2016年10月)
从Amazon和Facebook到Google和Microsoft,世界上最具影响力的技术公司的领导者都在表现出了对人工智能(AI) 极 大的热爱。那么什么是AI?为什么如此重要?为什么会在现在成为热点?虽然人们对于AI越来越感兴趣,但是只有专家才能真正能够理解这个领域。我们的目标是使更多人接触到这个重要领域。
首先我们要解释AI以及「机器学习」等关键术语的含义,阐述成果最丰富的AI领域「深度学习」是如何运作的,并对AI解决的问题及为什么这些问题很重要进行探索。我们还会分析,为什么二十世纪五十年代发明的AI技术会在今天迎来它的时代。
作为风险投资人,我们一直在寻找能够为客户和公司创造价值的新潮流。我们相信AI会是一种比移动化和云计算更重要的变革。Amazon的CEO Jeff Bezos表示,「很难说在接下来的20年,AI会对社会造成怎样的影响。」无论你是客户、行政人员、企业家还是投资人,我们希望这篇文章能够不同于那些天花乱坠的宣传,真正为你解释为什么这个新型潮流对我们来说如此重要。
一、什么是AI?
人工智能:关于智能程序的科学。
1956年,达特茅斯学院的助理教授John McCarthy创造了「人工智能」(AI)一词,指那些能够表现出智能行为的硬件和软件,用John McCarthy的话说,就是「制造智能机器,尤其是智能计算机程序的科学和工程。」
基础的「AI」已经存在了几十年,在特定环境下通过基于一定规则的程序呈现基本的智能行为。但是取得的成绩是有限的,因为用于处理很多现实世界问题的算法是很难人工进行编程的。
在进行医疗诊断、预测机器故障或是测定特定资产的市场价值等复杂活动时,会涉及到上千个数据组和变量之间的非线性关系。在这些情况下,我们很难用现有的数据得到「最佳」预测结果。而在其他领域,包括在图像中识别目标和语言翻译等,我们甚至无法创建规则来描述我们寻求的特征。我们怎么可能编写一组适用于所有情形的程序,来描述一只小狗的外貌呢?
进行数据优化和功能特征等复杂的预测时会遇到一些困难,假使我们将这种困难由程序员那里转移到程序呢?这就是现代人工智能的责任。
机器学习也属于AI技术,所有机器学习都属于AI,但AI并不只是机器学习(见表一)。从人们对AI的兴趣可以看出对机器学习的热情,这一领域的发展非常迅速并且意义重大。
有些问题对于人类来说非常复杂,而机器学习可以帮助我们将一部分负担转移给算法,来解决这些问题。1959年,AI的先驱Arthur Samuel曾经写道,机器学习是「一种赋予计算机无需明确编程就能学习的能力的研究领域」。
大部分机器学习的目标都是针对特定使用情况开发预测引擎。算法会接收到某一领域(比如一个人在过去看过的电影)的信息,对投入进行权衡,做出有用的预测(一个人在未来喜欢不同电影的可能性)。通过赋予「计算机学习的能力」,可以利用算法完成最优化的任务,最优化也就是通过衡量可用数据中的变量,对未来进行准确预测。我们还可以更进一步,将特征详述的任务也交给程序来做。
机器学习算法要经过训练。算法首先接收到例子,并且已知这些例子的输出,记录下预测输出与真实输出的差距并调整输入的权重提高预测的准确性,直到得出最优值。因此,机器学习算法最典型的特征就是,预测的质量会随着经验的丰富而提升。我们提供的数据越多(一定程度上),预测引擎能得出的结果就越优化。(见图二、图三,需要的数据集的规模非常依赖于环境,从以下例子中我们无法笼统概括。)
机器学习的方法有超过15种,每一种都使用不同算法结构,依据得到的数据实现预测最优化。「深度学习」是其中一种方法,在新的领域取得了突破性成果,我们将在下文中对此方法进行探索。此外一些没有受到很多关注的技术也很有价值,它们适用于更广泛的使用情形。除了深度学习外,「随机森林」也是一种最有效率的机器学习算法,可以创造很多决策树,使预测最优化;
「贝叶斯网络」使用概率性方法分析变量及各变量之间的关系;在支持向量机中输入的是类别化的案例,它可以创造模型,把新的输入分配到各个类别中。
每一种方法都有优势和不足,所以要结合起来使用(一种组合方法)。哪种算法会被选择出来解决某一特定问题,取决于可用数据集等因素的性质。实践中,开发者倾向于通过实验观察哪些算法是有效果的。
机器学习的使用案例根据我们的需求和想象而不同。拥有正确的数据后,我们可以建立算法实现各种目的:根据某人之前的购买记录推荐购买产品;预测汽车装配线上的机器何时会发生故障;预测电子邮件地址是否错误;估计信用卡交易欺诈行为的可能性;还有很多其他目的。
深度学习:将特征详述工作交给算法
即使使用 随机森林、贝叶斯网络、支持向量机 等普通机器学习方法,也很难编写出能很好地完成特定任务的程序,从理解语音到识别图像中的对象。因为我们无法以实际、可靠的途径来详述特征。例如,如果想要编写计算机程序来识别汽车的形象,我们无法在算法中详述汽车的特征,来确保在所有情况下都能准确识别。汽车的形状、大小和颜色多种多样,位置、方向和形态也有所不同。背景、灯光和很多其他因素都会影响对象的外表。一组规则中需要包含的变量太多了,即使我们能够全部包含进去,这种解决方案也不具备延展性。我们需要为每种需要识别的对象都编写一组程序。
深度学习(DL)已经彻底改变了人工智能世界。有超过15种实现机器学习的方法,深度学习就是其中一种,所有深度学习都属于机器学习,但是机器学习并不只是深度学习。(图4)
通过深度学习,程序员可以不必完成特征详述(根据数据定义需要分析的特征)或最优化(如何权衡数据以实现准确预测)的任务,而是全部交给算法来完成。
那么如何实现这些呢?深度学习的突破点在于模拟大脑,而不是模拟世界。我们的大脑会学习做有难度的事情,比如理解话语和识别物体,而且并不是通过详尽的规则而是通过时间和反馈来学习。小的时候我们体验这个世界(比如看见一张汽车的图片),做出预测(汽车!)然后收到反馈(没错!)。我们没有通过一组详尽的规则,而是通过训练进行学习。
深度学习使用的就是这种方法。将人造的、以软件为基础的计算器连接在一起,类似于大脑中的神经元。它们组成了一个「神经网络」,接收输入并进行分析、作出判断,如果判断正确,就做出通知,如果输出是错误的,算法就会对神经元之间的联系做出调整,改变未来的预测。最初网络会出现很多次错误,但随着我们输入数以百万计的例子,神经元之间的联系就会得到调整,最终几乎在所有情形下,神经网络都会做出正确的判断,这也就是熟能生巧。
通过这个过程,我们现在可以:
识别图片中的元素;
实时语言翻译;
语音控制设备(通过 Apple Siri、Google Now、Amazon Alexa 以及 Microsoft Cortana);
预测基因变化会对DNA 转录产生怎样的影响;
分析客户反馈中的情感;
通过医学影像探测肿瘤。
深度学习并不能用于解决所有问题,其通常会需要利用大型数据集进行训练,需要广泛的处理能力来训练和运行神经网络。「可解释性」也是一个问题,要知道神经网络如何实现预测是非常困难的。但是深度学习使程序员从复杂的特征详述工作中解放出来,为一系列重要问题提供成功的预测机制。深度学习最终会成为AI开发者的强大工具。
二.深度学习是如何工作的?
既然深度学习如此重要,了解其工作的基本要素也是非常有价值的。深度学习需要使用一个人工「神经网络」,即一组相互连接的「神经元」(基于软件的计算器)。
一个人工神经元至少会接收一个输入,其会以此为基础进行数学计算,得到输出结果。输出结果会依赖于每个输入的权重和神经元中的「输入-输出函数」的结构(图 5)。输入-输出函数会发生变化,神经元可能是:
一个线性单元(输出与总加权输入成一定比例);
一个阙值单元(输出可分为两个等级,根据总输入是否高于特定值确定其等级);或者Sigmoid 单元(输出不断变化,与输入变化不成线性关系)。
当神经元相互连接时就会产生神经网络,一个神经元的输出会成为另一个神经元的输入(图6)。
神经网络会组成多层神经元(所以会有「深度」学习)。「输入层(input layer)」接收信息,如一组图片,网络会对此进行处理。「输出层(output layer)」负责提供结果,多数活动都发生在输入层和输出层之间的「隐层(hidden layers)」上。神经网络上每一层的每个神经元的输出都是下一层的一个神经元的输入(图7)。
下面就以一个图像识别算法为例,在图像中识别人脸。将数据输入神经网络,由第一层来识别局部对比的模式等「低等级」特点,如轮廓。图像穿过网络后,会逐渐提取其中的「高等级」特点,从轮廓到鼻子,再到面部。(图8)
在输出层,通过训练神经网络会得出关于图片属于某一类的可能性(人脸:97%;气球:2%;树叶:1%)。
训练神经网络的方式就是将大量带有标记的例子展现在它们面前,可以检测出来错误,算法也会对神经元之间联系的权重进行调整,来完善结果。多次重复这个优化过程,就可以部署系统并对未标记的图像进行评估。
以上是一个简单的神经网络,但是结构可以变化,且多数比较复杂。变量包括同层神经元之间的连接;区别每层神经元的数量;神经元之间的联系向上一等级网络输出(递归神经网络)。
设计和完善神经网络需要大量的技能,步骤包括为特定应用组织网络、提供合适的训练数据集,根据进展调整网络结构,以及结合多种方法。
三. AI 为什么很重要?
AI要处理的是非常有深度的难题,因此非常重要,这些问题的解决方案可以应用于那些对人类幸福感非常重要的部门,从健康、教育和商业到交通、公共事业和娱乐。二十世纪五十年代起,AI研究就关注了五个领域:
推理:通过逻辑推理解决问题的能力。
知识:表现关于世界知识的能力。(理解世界上的一些特定实体、事件和状况;具有某些特性的要素;可分类的要素。)
计划:制定和实现目标的能力(世界的未来有一种特定状态是我们所期待的,可以通过一系列的活动影响到通向这种状态的过程)。
交流:理解书面和口头语言的能力。
感知:根据视觉影像、声音和其他感官输入对与世界有关的事情进行推理的能力。
AI的价值可以体现在很多方面,这些能力的进步带来的不只是发展而是变革。AI的应用事例包括以下方面:
推理:法律评定;金融资产管理;财务应用处理;游戏;自主武器系统。
知识:医疗诊断;药品研发;媒体推荐;购买预测;金融市场贸易;欺诈防范。
计划:物流;行程安排;导航;物理和数字网络优化;预见性维护;需求预测;库存管理。
交流:声音控制;智能代理,助理及客户支持;书面及口头语言实时翻译;实时转录。
感知:自动驾驶;医疗诊断;监控。
接下来几年,几乎所有部门都会在更多流程中应用机器学习。比如简单的企业功能,如一家公司中的人力资源(HR),就即将应用机器学习;
员工招聘可以更有目标性,可以使用智能工作匹配和部分自动化评估功能;
通过人员需求和缺席的预测性计划可以强化员工管理;
如果能够推荐更适合员工的学习内容,员工学习也会更有效果;
通过对员工离职风险的预测可以减少人员变动。
机器学习将变得正规化,成为开发人员标准工具的一部分,能够完善并重塑现有流程。
机器学习的后续影响会超越即时影响。深度学习促进了计算机视觉的发展,例如可以实现车辆(轿车和卡车)自动驾驶。那么其又会带来哪些影响呢?目前在英国有90% 的人和 80% 的货物是通过公路运输的,如果使用自动驾驶车辆会产生以下影响:
安全(90% 的交通事故是由驾驶员的疏忽引起的)
雇佣(英国有220万运输及物流行业的员工,年薪约为570亿英镑)
保险(Autonomous Research预计,之后英国的汽车保险费用将下降63%)
部门经济(客户将使用按需交通服务,代替自己的汽车);
汽车生产能力;城市计划;规则及其他。
四.为什么现在会是 AI 的时代?
AI研究始于二十世纪五十年代,为什么在经历了多次失败以后,现在迎来了转折点?新算法的产生、数据通知能力的提升、更好的训练算法的硬件以及促使开发者使用AI技术的云服务。
1. 经过改进的算法
尽管深度学习并不是新技术,首个有效多层神经网络的详细说明发布于1965年,但是在过去十年里算法的发展确实对深度学习产生了很大影响。
由于卷积神经网络(CNN)的发展,我们在图像中识别物体的能力也得到了提高(图9)。受到动物视觉皮质的启发,神经网络中的每一层都是特定模式存在的过滤器。2015年,微软的基于 CNN 的计算机视觉系统(准确度:95.1%)在图片中识别物体的能力超过了人类(准确度:94.9%)。「据我们所知」,他写道,「我们的成果的表现首次超过了人类。」CNN 更加广泛的应用还包括视频和语音识别。
同时,递归神经网络(RNNs)出现后,语音和字迹的识别能力也在迅速提高(图10)。RNNs的反馈联系能够确保数据进入一个循环,这不同于只能正向输送的常规神经网络。有一种强大的新型RNN叫做 「长短时记忆(LSTM)」模型 。通过附加的联系和存储单元,RNN能够记忆几千个步骤之前看见的数据,并通知以下解释,这对于语音识别来说非常有价值,对下一个词的解释可以从前面的单词那里得知。2012年开始,Google 开始使用LSTM来支持Android系统中的语音识别,仅六周前,微软的工程师宣布,他们的系统误字率为5.9%,这是首次大致等同于人类的水平。
2.专门化硬件
绘图处理器(GPUs)是专门的电子电路,极大削减了深度学习所需的训练神经网络的时间。
训练神经网络广泛应用了矩阵计算方法。所以对3D游戏有用的GPUs非常适合加速深度学习的发展,一个简单的GPU就能够将训练效率提升5倍,在较大的问题上,收获或许增加了不只10倍。如果结合上那些为了广泛使用深度学习框架而调整的软件开发装备,训练速度会有更大的提升。(图11)
3.大规模数据
用于深度学习的神经网络通常都需要利用大型数据组进行训练,从几千个例子到几百万个例子。幸运的是,数据的创造和可用性在以指数方式增长。现在,随着进入数据的「第三次浪潮」,人类每天会产生2.2艾字节(23亿千兆字节)的数据;世界上所有数据中有90%都产生于过去的24个月。
数据创造的「第一次浪潮」开始于二十世纪八十年代,涵盖文档和交易数据,可以联网的台式PC的普及也加速了这次浪潮。接下来是数据的「第二次浪潮」,是非结构化媒体(电子邮件、照片、音乐和视频)的一次爆发,普及化的智能手机联网后会产生网页数据和元数据。现在我们正在迈入数据的「第三时代」,工业和家中都可以部署机器传感器,创造额外的监控、分析和元数据。
假定今天我们创造出的大量数据都是通过互联网传送的,膨胀的网络交通就会成为大量增长的数据量的防火墙。1992年,人类每天传送100GB的数据,而到了2020年,我们每秒就将传送61,000GB 数据(图12)。
我们能够使用的通用数据越来越多,专业数据资源加速了机器学习的进程。例如ImageNet,是一个可以自由使用的数据库,拥有超过一千万个带标签的图像。这个数据库加速了对象分类深度学习算法的发展。
4.云服务
行业内顶尖的云计算供应商会提供云端的机器学习基础架构及服务,能够促进开发者对机器学习的使用。
Google、Amazon、Microsoft和IBM都会通过提供云端基础架构(建模和迭代环境、可扩展的「GPUs即服务」和相关托管服务)来降低开发机器学习功能的成本和难度。
此外,他们提供的云端机器学习服务(从图像识别到语言翻译)范围也在扩大,开发人员可以直接在自己的应用中使用这些服务。Google机器学习提供了一些很容易获得的服务,包括视觉(物体识别、明确内容检测、人脸检测和图像情感分析);语音(语音识别和语音文字转换);文本分析(实体识别、情感分析、语言检测及翻译);以及求职(列举工作机会以及资格匹配)。Microsoft Cognitive Services 能够提供超过21种视觉、语音、语言、知识和搜索领域的服务。
5.利益和创业
在过去五年里AI领域的公共利益增长了六倍(图13),风投公司对AI公司的投资也大幅增加(图14)。我们已经进入了一个良性循环,机器学习领域的进步正在吸引投资、创业以及注意力。而后者又会反过来加速机器学习的发展。
五.前景如何?
机器学习能带来的利益是无穷的,我能够看到的就包括从无人驾驶汽车到人机互动的新途径。还有很多利益没有这么明显,但是能够提供日常的业务流程和客户服务的能力和效率。
有时我们的期望过高,超出了短期的发展潜力,我们希望未来能够真正认识AI,随着机器学习被用于改善和重新设想现有的系统,希望我们能够认识到AI的价值。
历史上,产业革命会通过新的能量来源和传动装置改变生产和交流方式。18世纪80年代,第一次产业革命通过蒸汽动力实现了生产自动化。19世纪70年代,第二次产业革命通过电力实现了大量生产。20世纪70年代以来,第三次产业革命通过电子工业和软件技术实现了生产及通讯的自动化。现在,软件遍布整个世界,信息处理成为了价值创造的首要来源。机器学习使我们的世界更加智能化,将产生历史性的利益。
腾客2016年4月28日消息,一年一度的GMIC大会于今日开幕,在下午的全球智能机器人大会上, 地平线机器人技术创始人兼CEO余凯 发表了开场演讲,认为 人工智能将成就第四次产业革命 。余凯称人工智能将成为世界上的新物种,人类花3到6个月可以学到的技能,在未来5到10年都会被人工智能取代。
余凯称,过去人类所有的进展实际上都是以人为中心,包括用技术去延展你的体力、脑里,使人走得更快,看得更远。但是今天AlphaGo是跟你下棋,它是自主做决策,是一个自助行为的实体。所以说,像AlphaGo这样的人工智能是一个新的物种,它的一个核心特征就是这种自主决策的行为。
另外,人工智能也会逐步替代人的一些简单的工作。在取代人类工作方面,余凯认为如果是一个人大概花3个月到6个月的时间能够学习到的技能,在未来5到10年的时间都会被机器所替代,比如说驾驶。
余凯认为,大脑系统是未来机器的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力,这些核心离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。余凯称,宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。目前,人类已经在深度学习上取得了很大的进展。(小羿)以下为演讲实录:
余凯:大家下午好!我们很多人说这次可能是一个新的产业革命,第四次产业革命,从蒸汽机时代到电器时代到信息时代,我们这次是人工智能时代。为什么说这是一次新的产业革命呢?我们觉得回顾过去十几年的历史,从PC互联网到移动互联网,到我们现在比如说我们叫AR、VR的时代,我们看到很多的信息、内容、服务,包括物理世界所存在的这些实体,比如说嘀嘀打车把每个出租车什么司机,是哪个车号,现在在哪个地方,往哪个地方走都线上化了。所谓物理世界和虚拟世界的界限也比较的虚化了。
比如说我们思考阿尔法狗(AlphaGo)这件事情,它跟我们以前技术的进展很大的不一样是说,过去所有的进展实际上都是以人为中心,去延展你的体力、脑里,使你走得更快,看得更远。但是今天阿尔法狗是跟你下棋,它是自主做决策,这样一个自助行为的实体。这样的话是一个新的物种,它的一个核心特征就是这种自助决策的行为。它会在生活、生产很多的方面,它在逐步替代人的一些简单的工作。比如说我们会看到,如果是一个人大概花3个月到6个月的时间能够学习到的技能,这样的技能在未来5到10年的时间都会被机器所替代,比如说驾驶,过去可能少数人具有一个专车司机,未来每个人都会等效的有一个专车司机,因为每一个车在15年到20年的时间里面应都是自动驾驶的。
我们把Robot翻译成机器人,你在这个机器后面承载的一个人的概念,这个概念它实际上跟Robot的本意有可能不一样。比如说我们查剑桥的辞典,我们查Robot这个词讲的是什么意思?讲的是它可以自动完成一定任务计算机控制下面的机器。所以Robot讲的是 智能机器 ,它跟人这个词并没有一个必然的关联。
我们想有没有机器人这样一个词?其实是有的,我相信在座的各位用的是手机的操作系统是安卓的,我们查安卓这个词,意思是长得像人的Robot。安卓是一个人形机器人,它实际上在一个很宽泛概念里面非常小的一个例子,但是在更宽广的语境下面讲的是智能机器,智能机器当然有各种各样的多样化的。在中国的语境下面有的时候你会问这样一个问题,这个是Robot?这个它当然是一个机器人,它可以自助的跟你交互。长城会的兄弟们放了一个机器人在我们公司调戏了它一个礼拜,如果你在它周围走动的时候,它眼睛会一直看着你,跟着产生很有意思的互动。它显然是机器人,它也是Robot。
我问大家这个问题,这个是不是一个Robot?这个是不是一个安卓的?我记得日本的石黑浩教授每年都会来我们这个会场,至少一次,带着他的美女机器人,我们很多的记者也会去报道,说日本的机器人技术怎么样怎么样了。我在这里面想澄清一点,就是我们有一些媒体记者需要他们的知识,如果你稍微了解一下,实际上在台的后面的某一个小房间里面,有一个小女生坐在电脑面前,它实际上所有的交互都是这个小女生来控制的。它的语音识别,甚至它的反馈,都是后面的小女生来完成的。所以这样的一个形态的东西,它完完全全是一个木偶。
这些机器人它没有人的形状,但是它们能和你交互,可能成为你生活中的陪伴,或者是家庭里面的一个中控。这样一个智能交互的设备它当然是Robot,但是它不是安卓的。
我们看这些玩具,这些所有的品类在生活中无处不在它们今天只是我们叫功能型,但是未来它应该是变成它们装上传感器,配上算法,有控制系统,它可以自助的行为决策。未来所有这些品类,它们都会变成Robot,都会变成无处不在的自助的机器。所以这是一个大的趋势。在移动互联网以后,比移动互联网更大的未来,是无处不在的万物互联,无处不在的万物智能。所以AI Inside它将无处不在。
这样两个图像放在一起,你们有什么感想?在几个星期前有一个新闻,当然全世界都在关注,就是关于阿尔法狗,在那个礼拜关于同一家公司谷歌有另外一个新闻,在座的各位可能也关注到了,谷歌在考虑把他们的一个公司给卖掉,谷歌为什么会做出这样的选择?我们比较这两个图像,另外一边是人类的近亲,它的谷歌,它的肌肉,它更强大,更灵活,但是它还在丛林里面找香蕉吃。人类已经征服太空。人类有非凡的大脑,使人类变得卓越,变得不同。
大脑的系统无疑是未来Robot的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力。这些核心实际上离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。
深度学习的算法和传统的AI的算法一个很大的不同,AI的算法到了数据大到一定程度的时候,不一定效果不断的变好,但是深度神经网络的算法,你可以看到它不断的提升。比如手阿尔法狗它产生数千万盘棋局的数据,通过它不断的学习深度神经网络,从职业的二段也不知道到职业的多少段,据说是职业13段这样的水平,它的水平在不断的提高,这就是大数据和深度结合所带来的变化。
我们看到因为深度学习的发展,过去在图像领域,在语音领域所引领的,不断去突破它的极限,使它的识别错误率不断的降低。这是语音识别深度神经网络代替深学模型。后来端到端的学习带来语音识别率继续的提升。这是我们看到最近在端到端的深度神经网络在语意的处理和理解上面所取得的进展。
我们最近看到,前面我们看到很多感知方面的进展,从阿尔法狗我们看到,从感知到行为决策,深度学习,进入后一个十年发展的趋势,如果你只是感知,不做任何决策,其实你并不改变这个世界,只有在环境中不断的做决策,去调整,去优化你长期的收益,这个机器才能变成自主行为,并且改变世界的技术。
同样的技术不光是在棋的对局,自动驾驶可以看作是汽车和环境的博弈。这样一个博弈你在每时每刻在连续的做决策,比如说你是加速,你是左还是右,因为你每一次决策,你周围的环境会发生改变,这些你需要连续做决策,最后优化的是一个长期的收益,就是从A地到B地足够的高效,足够的安全。
未来机器人大脑的构架,一种想法完全在云端处理,但是这样会带来问题,比如一个汽车在行使过程中突然有小孩横穿马路,你把数据传导云端,云端处理来回来,如果这个网络不稳定怎么办?说到这种实现和处理,我们自然会想到用什么树立起。我们手机和电脑上都有CPU,我们刚才讲的无处不在的人工智能所需要的这些感知、认知和控制,它需要这些东西是些专用的处理器。你会问,你这个问题有点奇怪,人类的大脑看起来是一个通用的处理器,在座的各位我不知道多少会认为大脑是通用还是专用处理器?认为大脑是通用处理器的举个手?是专用处理器的举个手?就更少了。
1、人工智能 概念 和价值
人工智能(Artificial Intelligence) 英文缩写为 AI ,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是 计算机科学 的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。1956年 夏季 , 麦卡赛、明斯基、罗切斯特和申农 等年轻科学家在美国DARTMOUTH学会共同研究和探讨用机器模拟智能的问题,首次提出“人工智能”这一术语,名称来源于 雨果·德·加里斯 的著作。
人工智能 是 对人的意识、思维的信息过程 的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,“人工系统”就是通常意义下的人工系统。“智能”涉及到诸如意识(CONSCIOUSNESS)、自我(SELF)、思维(MIND)(包括无意识的思维(UNCONSCIOUS_MIND))等问题。 尼尔逊教授 “人工智能是 关于知识的学科 ――怎样 表示知识 以及怎样 获得知识 并 使用知识 的科学。”另一个美国麻省理工学院 温斯顿教授 “人工智能就是研究如何 使计算机去做过去只有人才能做的智能工作。 ”这些说法反映了人工智能学科的基本思想和基本内容,即 人工智能 是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
人工智能科学 极富挑战性,研究使计算机来模拟人的某些 思维过程和智能行为 (如学习、推理、思考、规划等)的学科,人工智能是一门边沿学科,属于自然科学、社会科学、技术科学三向交叉学科。 AI 涉及学科 :哲学和认知科学,数学,神经生理学,心理学,计算机科学,信息论,语言学、控制论,不定性论 、 仿生学,社会结构学与科学发展观等十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等。其 研究范畴 :自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法等。
人工智能研究目标 是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。[1] AI是计算机学科分支,称为二十世纪 七十年代 世界三大尖端技术( 空间技术、能源技术、人工智能 ), 二十一世纪 三大尖端技术( 基因工程、纳米科学、人工智能 )之一。近三十年来,AI迅速发展,在很多学科领域都获得了广泛应用和丰硕成果,已逐步成为一个独立分支,在理论和实践自成一个系统。我国AI已经上升为和 计算机科技、软件工程 并列的 一级学科 ,在计算机领域、在机器人、经济政治决策、控制系统、仿真系统中得到应用。2、人工智能科学发展阶段
1956年,在美国达特茅斯(Dartmouth)学院,约翰·麦卡锡(John McCarthy,1971年度图灵奖获得者)、马文·李·闵斯基(Marvin Lee Minsky,1969年度图灵奖获得者)、克劳德·艾尔伍德·香农(Claude Elwood Shannon,信息理论之父)、纳撒尼尔·罗彻斯特(Nathaniel Rochester,IBM第一代通用计算机701主设计师)四位学者发起举行“人工智能夏季研讨会”,指出“人工智能”研究目标是实现能模拟人类的机器,该机器能使用语言,具有概念抽象和理解能力,能够完成人类才能完成的任务并不断提高机器自身。从1956年“美国达特矛斯会议(DARTMOUTH CONFERENCE)”提出人工智能学科算起,61年来发展成为一门广泛的交叉和前沿科学。全世界几乎所有大学计算机系都有人研究这门学科,学习计算机的大学生也必须学习这样一门课程。北大清华甚至有人工智能系,但是效果并非很好。
DARTMOUTH会议后的7年中,AI研究开始快速发展.虽然这个领域还没明确定义,会议中的一些思想已被重新考虑和使用了。CARNEGIE MELLON大学和MIT开始组建 AI研究中心 。 研究面临新的挑战:下一步需要建立能够更有效解决问题的系统,例如在"逻辑专家"中减少搜索;还有就是建立可以自我学习的系统。
1957年AI程序 "通用解题机"(GPS ) 第一个版本进行了测试。这个程序是由制作"逻辑专家"的同一个组开发的。GPS扩展了WIENER的反馈原理,可以解决很多常识问题。两年以后,IBM成立了一个 AI研究组 。HERBERT GELERNETER花3年时间制作了一个解几何定理的程序。
1958年,当越来越多AI程序涌现时,MCCARTHY宣布了他的新成果: LISP语言 ,成为AI史上的突破。LISP到今天还在用,LISP意思是"表处理"(LIST PROCESSING),它很快就为大多数AI开发者采纳。
1963年MIT从美国政府得到一笔220万美元的资助,用于研究机器辅助识别.这笔资助来自国防部 高级研究计划署(ARPA),已保证美国在技术进步上领先于苏联.这个计划吸引了来自全世界的计算机科学家,加快了AI研究的发展步伐。
AI测试 竞赛 : LOEBNER(人工智能类):1991年美国科学家兼慈善家勒布纳设立的对图灵测试的第一种实践,分金银铜三等奖,用文本、音频、视频模仿人类迷惑人类裁判。大多数都不能成功欺骗多名人类裁判。以人类的智慧创造出堪与人类大脑相平行的机器脑(人工智能),对人类来说是一个极具诱惑的领域,人类为了实现这一梦想也已经奋斗了很多个年头了。
以后几年出现了大量程序。 "SHRDLU"是"微型世界"项目 的一部分,包括在微型世界(例如只有有限数量的几何形体)中的研究与编程。在MIT由MARVIN MINSKY领导的研究人员发现,面对小规模的对象,计算机程序可以解决空间和逻辑问题。60年代末STUDENT解决代数问题,"SIR"可以理解简单的英语句子.这些程序的结果对处理语言理解和逻辑有所帮助。
70年代 专家系统 可以预测在一定条件下某种解的概率。由于当时计算机已有巨大容量,专家系统有可能从数据中得出规律。专家系统的市场应用很广。十年间,专家系统被用于股市预测,帮助医生诊断疾病,以及指示矿工确定矿藏位置等。这一切都因为专家系统存储规律和信息的能力而成为可能。
70年代许多新方法被用于AI开发,如 MINSKY的构造理论 。 另外DAVID MARR提出了机器视觉方面的新理论,例如,如何通过一副图像的阴影,形状,颜色,边界和纹理等基本信息辨别图像。通过分析这些信息,可以推断出图像可能是什么。1972年同时期另一项成果是提出 PROLOGE语言 。
80年代期间AI前进更为迅速,并更多地进入商业领域.1986年,美国AI相关软硬件销售高达4.25亿美元。专家系统因其效用尤受需求,象数字电气公司这样的公司用XCON专家系统为VAX大型机编程.杜邦,通用汽车公司和波音公司也大量依赖专家系统。为满足计算机专家的需要,一些生产专家系统辅助制作软件的公司,如TEKNOWLEDGE和INTELLICORP成立了。为了查找和改正现有专家系统中的错误,又有另外一些专家系统被设计出来。
美国人工智能协会 基金会、私人公司研究人员热潮。150多所像DEC(它雇了700多员工从事AI研究)这样的公司共花了10亿美元在内部的AI开发组上。其它AI领域也在80年代进入市场。其中一项就是 机器视觉 。MINSKY和MARR的成果如今用到了生产线上的相机和计算机中,进行质量控制。尽管还很简陋,这些系统已能够通过黑白区别分辨出物件形状的不同。到1985年美国有一百多个公司生产 机器视觉系统 ,销售额共达8千万美元。
80年代AI工业不全是好年景。86-87年AI系统需求下降,业界损失近5亿美元。像TEKNOWLEDGE和INTELLICORP两家共损失超过6百万美元,大约占利润的三分之一巨大的损失迫使许多研究领导者削减经费。另一个令人失望的是国防部高级研究计划署支持的所谓"智能卡车"。这个项目目的是研制一种能完成许多战地任务的机器人。由于项目缺陷和成功无望,PENTAGON停止了项目的经费。
1996年2月10~17日,GARRY KASPAROV以4:2战胜“深蓝”(DEEP BLUE)。但是,到了1997年5月3~11日,GARRY KASPAROV以2.5:3.5输于改进后的“深蓝”。IBM公司研制的深蓝(DEEP BLUE)计算机战胜了国际象棋大师卡斯帕洛夫(KASPAROV)。计算机以它的高速和准确为人类发挥着它的作用。人工智能始终是计算机科学的前沿学科,计算机编程语言和其它计算机软件都因为有了人工智能的进展而得以存在。
2003年2月GARRY KASPAROV 3:3战平“小深”(DEEP JUNIOR)。
2003年11月GARRY KASPAROV 2:2战平“X3D德国人”(X3D-FRITZ)。
2016年4月AlphaGo战胜人类围棋手。12月底到2017年1月,AlphaGo升级版战胜108名世界围棋手。
3、人工智能 应用 领域(机遇与挑战)
人工智能的 研究范畴 : 自然语言理解、语言的学习与处理,知识获取表示、知识处理系统,自动推理和搜索方法、智能搜索,推理,规划,机器学习,组合调度问题,感知问题,模式识别、逻辑程序设计、自动程序设计,软计算,不精确和不确定的管理,人工生命,计算机视觉、神经网络,智能机器人、复杂系统,遗传算法人类思维方式等方面。最关键难题是机器的自主创造性思维能力的塑造与提升。
人工智能 实际应用领域 主要有:专家系统、机器翻译、智能控制、 定理证明 、 博弈 、 自动程序设计,自动规划 、 智能搜索引擎、 机器人学,语言和图像理解,遗传编程 , 计算机视觉和图像处理、机器翻译和自然语言理解、 机器视觉,指纹识别 、 人脸识别 、 视网膜识别 、 虹膜识别 、 掌纹识别 , 数据挖掘和知识发现、遗传编程机器人工厂、自动程序设计、航天应用、庞大的信息处理、储存与管理、执行化合生命体无法执行的或复杂或规模庞大的任务等等。
机器翻译 : 是人工智能的重要分支和最先应用领域,机译系统的译文质量离终极目标仍相差甚远;而机译质量是机译系统成败的关键。中国数学家、语言学家周海中教授曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题。人类尚未明了大脑是如何进行语言模糊识别和逻辑判断,故而 机译 很难 达到“信、达、雅”的程度 。智能家居之后,人工智能成为家电业的新风口,而长虹正成为将这一浪潮掀起的首个家电巨头。[3]模式识别 : 采用$模式识别引擎,分支有2D识别引擎,3D识别引擎,驻波识别引擎以及多维识别引擎;2D识别引擎已推出指纹识别,人像识别,文字识别,图像识别,车牌识别;驻波识别引擎已推出语音识别;3D识别引擎已推出指纹识别玉带林中挂(玩游智能版1.25)。
自动工程 : 自动驾驶(OSO系统)、印钞工厂(¥流水线)、猎鹰系统(YOD绘图)。
知识工程 : 以知识本身为处理对象,研究如何运用人工智能和软件技术,设计、构造和维护知识系统;
智能模拟 : 机器视、听、触、感觉及思维方式的模拟:指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,逻辑推理,博弈,信息感应与辨证处理。
AI 实现方法 : 一种是工程学方法(ENGINEERING APPROACH),这种方法用传统 编程技术 ,使系统呈现智能的效果,不考虑所用方法是否与人或动物机体所用的方法相同。它已在一些领域内作出了成果,如文字识别、电脑下棋等。另一种是 模拟法(MODELING APPROACH) ,不仅要看效果,还要求实现方法也和人类或生物机体所用的方法相同或相类似。如遗传算法(GENERIC ALGORITHM,简称GA)和人工神经网络(ARTIFICIAL NEURAL NETWORK,简称ANN)均属此类型。
AI 规划问题 :智能 Agent 必须能够制定目标和实现这些目标。他们需要一种方法来建立一个可预测的世界模型(将整个世界状态用数学模型表现出来,并能预测它们的行为将如何改变这个世界),这样就可以选择功效最大的行为。
情感计算 等 社交 : KISMET具有表情等社交能力的机器人,情感和社交技能对于一个智能AGENT是很重要的。首先,通过了解他们的动机和情感状态,代理人能够预测别人的行动(这涉及要素 博弈论、决策理论以及能够塑造人的情感和情绪感知能力检测)。此外,为了良好的人机互动,智慧代理人也需要表现出情绪来。至少它必须出现礼貌地和人类打交道。至少,它本身应该有正常的情绪。
机械学习 : 从使用者和输入数据等处获得知识,从而可以解决问题减少错误,提高解决问题的效率。对于人工智能来说,机械学习从一开始就很重要。1956年,在最初的达特茅斯夏季会议上,雷蒙德索洛莫诺夫写了一篇关于不监视的概率性机械学习:一个归纳推理的机械。
自然语言处理 : 自然语言处理如翻译、应答、聊天机器人、客服等。
机器感知、计算机视觉和语音识别
:
机器感知指能够使用传感器所输入的资料(如照相机,麦克风,声纳以及其他的特殊传感器)然后推断世界的状态。计算机视觉能够分析影像输入。另外还有语音识别、人脸辨识和物体辨识。
E. 数据简化DataSimp技术描述、学会及社区(1 k 字)
1、 数据简化DataSimp技术描述( 4b 字)
数据简化DataSimp合伙人或XX岗位(研发岗参考本蚊及文本分析一文的二级标题)。
1)技术研发部(重点收简历):核心的 数据分析DA、NLP、DL 开发 技能,Windows/Linux/Android/iOS平台、OA、App软件开发基础,熟练的 Java/C++/Python编程 技能和Github/Git协作编程与同行审核习惯;
2)市场客服部(研发部兼职):搜集客户资料、面见客户、形成客户需求分析文档,跟踪反馈,面谈、电邮、电话、邮寄沟通服务;
3)行政后勤部(合伙人兼职):高级的全系列文档搜集整理技能,OA软件界面和操作体验实验,公司法律财会物业文书基础。
投递简历前,如果对编程目标不清楚,可以参考上图6,或实用文本分析工具▼网站,我们需要实现一个功能集合大于此网站的应用程序系统。愿景①是跨平台的分析系统,先开发文本的明文分析系统(后续开发加密文本分析系统),实现 输入需要分析的文本 、文档、文件夹 ,就可以得到 可选定的 分析结果 ,使用极其简单、功能极其强大。这也是当前数据简化DataSimp筹备收简历的主要方面,合伙人和员工均可。
2 、数据简化DataSimp学会及社区( 6b 字)
筹备之数据简化DataSimp学会及社区。数据简化DataSimp学会分多个专业领域组,由普通会员和会士组成。会士则由资深数据分析专家组成学会分组委员会,会士认证采用“场景-方案-答辩制”2年一次,以推动全领域数据简化工作的有序进行。数据简化DataSimp社区由学会和贡献者共同维护,包括:学会版块、开源社区、活动版块。
●学会版块:数据简化DataSimp学会各领域工作组的主要版块,发布工作动态和成果。未来择优出版为期刊。工作组主要有:社会信息简化需求大组、数据简化需求大组、技术实现与分析评估组(分为文本简化、图像简化、音频简化、视频简化、机器数据简化、过程控制逻辑简化等数据简化小组)、系统与哲学思维简化大组等。
● 开源社区 :由数据简化DataSimp学会资深程序员贡献运维,使得社会信息简化技术人员可以熟练掌握各类大数据组件、系统、工具在数据简化方面的原理、架构、部署、应用场景、维护、应用和开发技巧等。。数据简化DataSimp爱好者可以自助提交并发起讨论,以推动程序简化技术、提高数据简化效率。旨在通过详细讲解和实战演练,能够帮助企业技术人员掌握最有效的数据简化技能。
●活动版块:数据简化DataSimp学会线上线下发起的讲座、问答、竞赛、考察、管理等活动。
当今社会信息爆炸、数据爆炸、垃圾信息和数据爆炸,请大家行动起来,加入我们数据简化学会和社区,一起为人类社会的信息世界和数据世界优化、简化、提高效率做贡献。详情落地前发文宣传,敬请期待。
QinDragon2010@ DataSimplification and Sciences ,Wechat and Toutiao Public Account,2017.02.16Thu-26Sun:
LIFE
Life begins at the end of your comfort zone. -- Neale Donald Walsch
THE DAY
The strength of purpose and the clarity of your vision,along with the tenacity to pursue it,is your underlying driver of success. -- Ragy Tomas