对生成式AI的风险到了该“重新思考”的时候了

虎嗅网 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

从创造栩栩如生的艺术到如同真人般的精度模仿人类语言，生成式AI正在改写创新和自动化的规则。AI大模型训练的高耗能、AI对语言情感和伦理道德的把握程度、AI对假消息和公众舆论的操纵、生成式AI在人类创新创造中的角色……在生成式AI加速奔跑的今天，有些问题依然值得我们细细思考。近日，国外一档专门探讨AI发现的栏目《AI Uncovered》总结了生成式AI发展过程中值得重新思考的10个问题，一起来看看。

一、碳足迹

生成式AI大模型的运行会消耗大量电力，从而产生更多的碳足迹（Carbon footprint，也称“温室气体足迹”）。因我们的活动而释放到大气中的温室气体和有害气体，也被视为人类的污染足迹。人工智能大模型的运行所消耗的电力越大，产生的污染就越多，最终给人类的生存家园带来巨大的风险。

根据2019年进行的一项研究，使用GPU训练Transformer模型的过程，耗电量惊人，将会导致约313吨二氧化碳的排放，这一数量相当于55个美国人平均一年电力消耗产生的碳排放量。而这项研究中训练的Transformer模型已经拥有2.13亿个参数。如果模型的参数更多，则需要的电力也更多，产生的碳足迹和环境污染更加难以忽视。

二、虚假信息

生成式AI拥有捏造信息的能力，客观数据的偏差或主观需求的操控都有可能让生成式AI生产出充满迷惑性的虚假信息。 这些虚假信息充满迷惑性，让人一眼觉得是真实信息，但事实上是虚构的，这使得区分事实与假消息变得具有挑战性，这是当今社会的一个紧迫问题。信息时代，错误信息和虚假信息像野火一样传播，预先训练的大语言模型，例如ChatGPT，表现出有限的适应性，只能对已有的信息进行总结和判断，无法跟上新出现的信息。

尽管这些人工智能系统的创造力令人印象深刻，但缺乏人类与生俱来的对真相的洞察力。如此发展的后果，就是很容易传播假新闻，制造假视频，并有可能借此操纵公众舆论，弱化我们对在线内容的感知和信任能力。打击人工智能生成的虚假信息，需要拿出切实可行的技术解决方案，并结合事实审查制度、媒介素养培育、批判性思维养成以及优先考虑准确性高、透明度高的人工智能系统开发等。这些都是解决这一挑战的重要组成部分，单一的技术升级无法解决这一复杂的挑战。

三、缺乏语境理解

生成式AI有生成连贯文本的能力，但在真正的理解方面却存在不足。深入了解其生成的内容，会发现这些AI模型仅具有有限的能力来掌握上下文的意思，这就导致有可能出现错误的响应。生成式AI通过学习模式预测序列中的下一个单词，以此来处理庞大的数据集，但它缺乏对人类解释语言的深刻理解，无法真正理解生成话语背后的情感或细微差别，这种限制可能会导致其提供表面上看起来正确但实际上错误的文本。

上下文理解不正确不仅会影响AI做出正确的判断，也会导致使用AI的用户产生反感，极大削弱了用户使用AI的热情。解决AI大模型缺乏语境理解问题是推进人工智能系统研发的一个关键挑战，目前研究人员正致力于改进模型，提高模型的上下文理解能力，使AI交互更加自然、准确，以达到真正理解用户需求的目的。

四、数据依赖

生成式AI的研发和训练通常需要数百GB甚至TB的数据。大模型的研发对数据的质量和数量要求极高，数据的有效性是影响语言模型能否发挥作用的重要因素，数据不足或不相关的数据过多会严重影响大模型运行的效果，例如在基于生成式AI的问答系统中，如果训练数据与手头的特定任务缺乏相关性，则大模型的干预能力会直线下降。比如用不相关或质量差的材料教某人外语，学习过程就变得很艰巨，最终的结果也会受到影响。

这便是生成式AI的数据依赖性对其训练和运行的影响。所以训练人工智能大模型离不开高质量的数据集，必须提前策划如何获取与模型训练相关的数据集，这对模型是否成功而言至关重要。这也凸显了如今生成式AI研究的严峻挑战，确保人工智能系统能够有效地在各种背景和场景中提供准确的响应，需要仔细地选择和准备有效的数据集。

五、潜在的舆论操纵风险

在信息爆炸的今天，假新闻已变得司空见惯，而生成式AI的出现正在加剧这一问题。生成式AI有能力制作让人高度信服的虚假文章，并在社交媒体发布虚假视频，当各种形式的虚假信息充斥网络，这对网络信息的可信程度提出了严峻的挑战，同时任何人都可以获得和使用生成式AI，这也让有恶意动机的个人更容易利用AI传播虚假信息操纵公众舆论，谋取私利。

显然，研究者们开发生成式AI的目的不是为了给犯罪提供便利，而是想协助人类激发他们的创造力，实现生成式AI的个性化发展。但是带有恶意动机的人对生成式AI的错误使用无疑会对数字系统的安全性和完整性构成重大威胁。

六、对人类生存的威胁

一些专家对生成式AI构成的潜在生存威胁表示担忧，他们担心随着生成式AI越来越先进，理论上它们会被利用，去做一些伤害社会和人类的事情，比如出于政治目的操纵公众舆论，制作虚假视频抹黑竞争对手，开发新的武器伤害他人，甚至还有可能因为错误的信息导致AI系统做出损害人类的决策或者给出错误的指导意见，从而达到AI对个人的潜在操控。

我们已经见证了社交媒体对公众舆论的影响，而生成式AI可能会将这种舆论操控升级到前所未有的水平，这会给人类的生存带来威胁，使人类处于危险的生存空间中。

七、专用模型的前景

特定领域的专用模型在某些任务的处理上性能优于GPT-4。AI大模型经常被区分为最大和最强大，但随着AI大模型的不断发展，它的使用者们开始认识到规模并总是等同于优势，尽管通用大模型拥有数十亿甚至数万亿的参数，看起来很强大，但它们对计算资源的无尽需求往往超过了芯片生产或扩展的速度，这给服务器容量带来了沉重的负担，并导致特定业务的模型训练时间过长。

与现在世界广泛应用的通用大模型GPT-4相比，一些小众领域的专用AI模型在特定任务中表现出了卓越的性能，这些专用模型经过微调，可在特定领域表现出色，展示了定制AI大模型的优势和广阔前景。这些专用模型经过广泛的训练，数据集有可能挑战当前各类LLM （语言大模型）的霸主地位，例如OpenAI的GPT-4，Meta的LLama 2或Google的Palm 2。此外，这些专用模型由于规模较小，其实更易于管理，运行效率也更高，还可以在训练期间针对特定用例进行定制。

八、存在偏见

生成式AI有可能放大预先存在的偏见。这些偏见来源有很多，超出公司控制范围的训练数据、训练使用生成式AI的目的等都会造成其存在偏见。有问题的训练数据将某些职业与特定性别联系起来，造成性别偏见，或延续种族刻板印象，产生歧视。训练生成式AI的数据来自算法，而算法本身可能带有偏见，这些带有偏见的数据在使用时自然也影响到了生成式AI发挥作用。

此外，系统可能被故意设计成表现出偏见，例如优先考虑正式写作而不是创意表达或仅迎合某些行业，从而无意中强化了现有偏见，排除了不同的观点。监管不足、社会公正系统失衡或财务激励措施不合理，都有可能导致偏见持续存在，想要解决这种偏见，就需要采取一套全面的方案，包括道德设计、观点多样化和强有力的监督，以此促进公平和公正的AI技术发展。

九、本质上不理解伦理

生成式AI的快速发展引发了人们对伦理问题的担忧。AI与人类互动之间的法律伦理和安全问题成为大家热议的对象。

生成式AI缺乏对伦理问题的内在把握，它们通过学习分析大量数据集、辨别模式和关联来作出判断，发挥作用，在这些过程中都不具备对人类社会内在的道德理解，缺乏这种道德理解，很可能会导致AI模型生成存在道德问题甚至是冒犯性的内容。

在生成式AI的研发和使用中要如何避免出现这种道德问题，关键在于开发者和运营商，需要对他们建立明确的道德准则，并纳入监督和干预机制中，用清晰的规则来约束生成式AI的开发者和运营商，明确道德责任的主体。此外，人类专家的指导也是解决这种道德挑战的有效方式，他们能够做出关键决策来减轻AI生成内容造成的危害。

十、是否会取代人类的创造力

AI可以通过融合现有概念产生新想法的方式来复制人类的创造力，这种方式与人类创新有些类似。相似的创新方法让一些人认为人工智能可以轻易取代人类，但这并不准确。虽然人工智能系统可以从数据中学到内容生产模式，但真正的人类创新，本质是一种综合经验、情感和独特视角的能力。

从目前的研发情况来看，生成式AI的内容生产模式还不能取代人类创新创造，并且开发生成式AI的核心目的是增强人类的创造力而不是取代它，AI只是一个有价值的合租者，协助创意过程并提供灵感。保留艺术和创新中不可替代的人类接触，仍然是生成式AI对创新创造领域发挥有效作用的关键。

本文来自微信公众号：中国企业家杂志（ID：iceo-com-cn），整理：吴莹