麦肯锡:使用人工智能技术的五大障碍

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
麦肯锡:使用人工智能技术的五大障碍

人工智能 就像个不断移动的标靶,而企业要做的就是努力“正中靶心”。

当然,当我们看到Alexa、Siri以及AlphaGO不断占据新闻头条的同时,不得不承认的另一个现实情况是——包括机器学习、深度学习等在内的诸多人工智能技术仍然存在非常多的局限性,这还需要我们投入巨大的精力和时间去克服。

为此,在今天的文章中,我们将全面探讨人工智能技术目前面临的障碍以及对应的解决方法。

据 麦肯锡 全球研究院在最近的研究报告(相关文章《麦肯锡在全球调研分析了160个案例,给出5个行业的34个AI应用场景》)中指出,行业中的领导企业往往更青睐于对人工智能技术的投资和应用。

因此,要提升企业在未来的竞争力,就必须要有能力掌握更为充分的信息以应对人工智能难题。换句话来说,我们不仅需要理解AI在促进创新、洞察力以及决策、推动营收增长乃至改进效率水平等层面的现实意义,同时也有必要深入了解人工智能还无法实现价值的领域。

挑战、局限与机遇:从深度学习技术谈起

可以说,深度学习是人工智能领域目前最受关注的发展成果,利用包含数百万个分层构建的模拟“神经元”的大型神经网络,它正在帮助我们提升分类与预测的准确性。其中,最常见的网络被称为卷积神经网络(简称CNN)与递归神经网络(简称RNN)。这些神经网络能够通过 数据 训练,并配合反向传播算法实现“学习”。

虽然这一技术已经取得了一系列进展,但需要注意的是,其中还有最关键的一步,就是如何将人工智能方法与问题和可用数据匹配起来。由于这些系统是“训练”而来,而非编程而来的,因此其学习过程往往需要大量标记数据才能准确执行复杂的任务。然而,获取大规模数据集往往相当困难,即使能够实现,标记工作也需要巨大的人力投入。

此外,我们很难判断深度学习训练所使用的数学模型要如何才能达成特定的预测、推荐或决策要求。这就是“黑匣子”问题,即使模型能够支持实现既定的目标,但效用恐怕也将十分有限。考虑到这一点,用户有时候的确需要了解这背后的运作原理,以及为何在特定情况下某些因素的权重要比其它因素更高等等。然而,这并不容易。

基于此,下面我们列举了人工智能技术及其应用目前存在的五大局限,以及与之对应的解决方案:

1、需要大量的数据标记

大多数现有的AI模型都是通过“监督学习”训练而成的。这意味着人类必须对样本数据进行标记与分类,但这一过程很可能存在一些难以察觉的错误。强化学习与生成式对抗网络(GAN)是解决这一问题的两个重要手段。

强化学习。强化学习是一种无监督学习的方法,它允许算法通过反复试验完成学习任务。有点像是“胡萝卜加大棒”的简单训练方式:即对于算法在执行任务时所做出的每一次尝试,如果其行为获得成功,则给予“报酬”(例如更高的分数); 如果不成功,则给予“惩罚”。经过不断重复,使得学习环境能够准确反映现实情况,从而提升模型的效能。

目前这一方法已经广泛应用于游戏领域,AlphaGo就是一个典型例子。此外,强化学习还拥有在商业领域应用的巨大潜力,比如,通过构建一套人工智能驱动型交易组合,从而在盈利与亏损之间学习发现正确的交易规律; 比如,打造产品推荐引擎,以积分方式为销售活动提供决策建议; 甚至以按时交付或减少燃油消耗作为报酬指标,开发运输路线选择的软件等等。

生成式对抗网络。生成式对抗网络是一种半监督学习的方法,通过两套相互对抗的神经网络,不断完善各自对同一概念的理解。以识别鸟类图像为例,一套网络负责正确分辨鸟类图像,而另一套网络则负责生成与鸟类非常相似的其它图像对前者进行迷惑。当两套网络的表现最终趋于稳定时,其各自对鸟类图像也拥有了更为准确的认知。

生成式对抗网络能够在一定程度上降低对数据集数量的要求。举例来说,通过训练算法从医学图像当中识别不同类型的肿瘤时,以往科学家们往往需要从人类标记的数百万张包含特定肿瘤类型或阶段的图像当中提取信息并创建数据集。但经过训练的生成式对抗网络就可以通过绘制逼真的肿瘤图像,从而训练肿瘤检测算法,在此基础上将小型人类标记数据集与生成对抗网络的输出结果相结合,快速完成学习。

2、需要海量的数据集

目前,机器学习技术要求训练数据集不仅包含人工注释信息,同时在体量上也需要够大、够全面。而深度学习也要求模型能够对成千上万条的数据记录进行学习,才能获得相对理想的分类能力; 甚至在某些情况下,其需要学习的数据要达到数百万条才能实现与人类相近的判断准确率。举例来说,如果希望让自动驾驶车辆学会如何在多种天气条件下行驶,就需要在数据集当中输入可能遇到的各类不同环境条件。

然而,在现实应用中大量数据集往往很难获取。对此,一次性学习(One-shot learning)是一种能够减少对大型数据集需求的技术,只需要利用少量现实的演示或示例(在某些情况下甚至只需要单一示例)就可以完成学习,快速掌握新技能。如此一来,人工智能的决策行为将更接近于人类,即只需要单一的样本就可以精确识别出同一类别的其它多种实例。

具体而言,数据科学家们首先会在变化的虚拟环境中预先训练出一套模型,使其能够利用自身的知识顺利找到正确的解决方案。一次性学习通常被认为是计算机视觉中的对象分类问题,旨在从一个或仅少数几个训练图像中学习关于对象类别的信息,并且已经成功应用到包括计算机视觉和药物研发在内的具有高维数据的领域。

3、 “黑匣子”问题

可解释性对于人工智能系统绝不是什么新问题。随着深度学习的逐步普及,其应用范围将不断扩大。但这也意味着,更为多样化以及更前沿的应用往往存在着更严重的不透明问题。

规模更大、复杂度更高的模型使得人们很难解释计算机作出某项决策的原因。然而,随着人工智能应用范围的扩大,监管机构将对人工智能模型的可解释性作出严格规定。

对此,目前有两种新的方法用以提高模型的透明度,分别为与模型无关的解释技术(Local Interpretable Model-Agnostic Explanations,简称LIME)与关注技术(attention techniques)(如图2)。

LIME方法是在一套经过训练的模型当中,确定其作出某个决策过程中更多依赖的那部分输入数据,并利用可解释代理模型对此进行预测。这种方法通过对特定的数据区段进行分析,并观察预测结果的变化,从而对模型进行微调,最终形成更为精确的解释。

注技术(attention techniques)则是对模型认为最重要的输入数据进行可视化处理,并分析这部分数据与所作出决策之间的关系。

 除此之外,还有另一种方法——广义相加模型(简称GAM)(简称GAM)。线性模型简单、直观、便于理解,但是,在现实生活中,变量的作用通常不是线性的,线性假设很可能不能满足实际需求,甚至直接违背实际情况。广义加性模型是一种自由灵活的统计模型,它可以用来探测到非线性回归的影响。通过对单特征模型的利用,它能够限制不同变量的相互作用,从而确保每项特征的输出更容易被加以解释。

通过这些方法,我们正在慢慢揭开人工智能决策的“神秘面纱”,这一点对于增强人工智能的采用范围具有极为重要的现实意义。

4、学习模型的“通用性”

与人类的学习方式不同,人工智能模型很难将其学习到的经验举一反三。因此,即使在相似度很高的案例中,企业也必须多次投入资源来训练新的模型,而这就意味着新的成本。

解决这个问题其中的一种的有效方式是迁移学习。即把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。在人工智能领域,就是通过训练人工智能模型完成某项任务,并将其迅速迁移至另一项类似但有所不同的任务环境中来实现“举一反三”。

随着迁移学习的逐步成熟,其将能够帮助企业更快构建起新型的应用程序,并为现有的应用程序提供更多功能。

举例来说,在创建虚拟助理时,迁移学习能够将用户在某一领域(例如音乐)的偏好推广到其它领域(例如书籍)。再比如,迁移学习还能帮助石油天然气生产商,扩大AI算法训练规模,从而对管道及钻井平台等设备进行预测性维护。

另一种方法,是利用能够在多个问题当中应用的广义性架构。譬如DeepMind在AlphaZero当中就设计了一套对应三种不同游戏的架构模型。

5、数据与算法中的“偏见”

如果输入的数据掺杂了人的偏好或者某些数据被忽略、某些数据被偏重,那么就有可能使得算法结果存在“偏见”。在具体的应用中,有可能造成错误的招聘决策、不当的科学或医疗预测、不合理的金融模式或刑事司法决策,甚至在法律层面引发滥用问题。但是,在大多数情况下,这些“偏见”往往难以被察觉。

目前,业界正在进行多项研究工作,从而建立最佳实践以解决学术、非营利与私营部门所面临的这一实际问题。

企业应该如何击中“移动中的标靶”

要解决上面提到的这些局限性难题,我们还有很长的路要走。然而,事实上,人工智能面临的最大局限可能在于我们的想象力。下面,麦肯锡为希望利用人工智能技术实现飞跃的企业领导者提出了一些建议:

做好功课,紧盯目标,并随时跟进。虽然大多数高管并不需要了解卷积神经网络与递归神经网络之间的区别,但也要对目前它们所能实现的功能有大致了解,在掌握其短期发展的可能性的同时着眼未来。

了解数据科学与机器学习专家提出的专业知识,同时与AI先行者们进行交流,补齐自己的短板。

采用精准的数据策略。人工智能算法需要人为的帮助与引导,为此,企业可以提前制定全面的数据策略。该策略不仅需要关注对来自不同系统的数据进行汇总的技术,同时还应关注数据可用性,以及数据的获取、标记、治理等任务。

虽然如上文所说,一些方法可以减少AI算法训练所需要的数据量,但监督式学习仍然是目前的主流。同时,减少对数据的需求并不意味着不需要数据。因此,企业最关键的还是要了解并掌握自己的数据,并考虑如何对其加以利用。

打通数据,横向思考。迁移学习技术目前仍处于起步阶段。因此,如果您需要解决大型仓储体系的预测性维护问题,您是否能够利用相同的解决方案支持消费产品?面对多种销售渠道,适用于其中之一的解决方案是否也能够作用于其它渠道?因此,要让算法能够“举一反三”,还应该鼓励业务部门进行数据共享,这对于未来人工智能的应用将具有非常重要的意义。

主动当一个先行者。当然,只是单纯跟上当前的人工智能技术还不足以保持企业长期的竞争优势。企业领导者需要鼓励自己的数据科学工作人员或合作伙伴与外部专家合作,利用新兴技术来解决应用问题。

此外,要随时了解技术的可行性与可用性。目前各类机器学习工具、数据集以及标准应用(包括语音、视觉与情绪检测)类训练模型正得到广泛应用。随时关注相关项目,并对其加以利用,将有效提升企业的先发优势。

这两年来,虽然人工智能技术已经令人们变得兴奋不已,但实际上目前它的发展所需要的技术、工具与流程还没有完全成形,研究人员正积极解决各类最为棘手的现实问题,作为企业,现在应该做的就是抓紧时间了解AI前沿所发生的一切,并以此为基础定位组织与学习思路,最终利用甚至推动由此带来的一切可能性。

随意打赏

麦肯锡人工智能报告中国人工智能技术大数据与人工智能麦肯锡 人工智能人工智能核心技术人工智能技术应用人工智能识别技术人工智能的发展人工智能芯片人工智能大赛
提交建议
微信扫一扫,分享给好友吧。