由人工智能生成的网站面世，新闻业要变天了？

虎嗅网 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

本文来自微信公众号：德外5号（ID：dewaiwuhao），作者：张春华，原文标题：《第一家完全由人工智能生成的新闻网站面世，新闻业的“游戏规则”正被改写？| 德外视窗》，头图来自：《华盛顿邮报》

连拘谨保守的“灰色贵妇” （The Gray Lady），现在都成了生成式AI的“信徒”。

据报道，《纽约时报》使用ChatGPT创建了一个情人节消息生成器，用户只需输入几个提示，就可以得到一封自动生成的情书。

全球第一家完全由人工智能生成的新闻网站NewsGPT也已经露面 ，它没有记者，所以号称没有偏见，每周7*24小时提供“准确可靠”的资讯。

新闻业难道要变天了吗？现在这么说还为时尚早。本文汇总了牛津大学路透研究院记者Marina Adami和独立记者Jessica Patterson对多位行业专家的访谈，一起来听听业内大咖怎么说。

新闻业的“游戏规则”正在被生成式AI改写

几家知名媒体已经使用或计划使用生成型人工智能了：BuzzFeed宣布将AI用于其著名的个性测验游戏；《纽约时报》使用ChatGPT创建了一个情人节消息生成器，用户只需输入几个提示，它就会给你自动生成情书。德国出版巨头Axel Springer和英国出版商Reach最近在地方新闻网站上发表了AI撰写的首批文章。

有意思的是，意大利媒体IL Foglio向读者发起了一个“挑战”：从3月第2周开始，它将在其日版中发布由AI撰写的短文，届时，谁能在一周内揪出每篇“机器人文章”，就可以将一份免费订阅和一瓶香槟酒领回家。

值得注意的是，全球首个完全由人工智能生成新闻报道的平台NewsGPT已经面世，该网站没有记者——因此， 它声称，没有偏见 。根据NewsGPT首席执行官艾伦·利维（Alan Levy）的说法，该平台的推出将改变了新闻业的“游戏规则”。他认为，“长期以来，新闻业一直受到偏见和主观报道的困扰，NewsGPT将为观众提供事实和真相”。

在技术加持下，NewsGPT实时扫描来自世界各地的新闻来源，以创建准确、最新和公正的新闻报道和报告。根据一份声明，该网站的人工智能算法分析和解释来自多个来源的数据，包括社交媒体、新闻网站等。

并且，NewsGPT声称不受广告主、个人观点的影响，可以每周7天、每天24小时为观众提供准确可靠的新闻。

“我们相信每个人都应该获得公正和基于事实的新闻，”利维说，“通过NewsGPT，我们正在实现这一目标。”

NewsGPT的推出可能会改变新闻行业的游戏规则，并标志着新闻行业进入一个新时代。

媒体人会被AI“抢饭碗”吗？

来势汹汹的生成式AI会抢走媒体人的“饭碗”吗？这个担忧似乎并不是空穴来风。因为Buzzfeed最近计划用AI来生成测验游戏，同时削减一定比例的员工。德国出版巨头Axel Springer的CEO也坦承，该公司准备降本增效，用AI取代部分记者。

“有些职位可能会完全消失，但是，AI融入新闻生产也会创造新的岗位，比如自动化和人工智能编辑、计算科学记者、编辑室工具经理和人工智能道德编辑等。”新闻AI专家Marconi说， 媒体人应该在开发新的AI工具中发挥作用，比如可以编写编辑算法、将新闻原理应用于新技术。

他还表示，“新闻行业必须积极参与人工智能革命。媒体有机会成为这一领域的主要参与者，因为他们拥有AI开发所需的最有价值的资产——用于训练模型的文本数据、还有用于创建可靠系统的道德原则。”

随着生成人工智能模型的兴起，数字媒体公司和公众可获得的信息呈指数级增长。一些专家预测，到2026年，90%的在线内容可能是AI生成的。Marconi表示，物联网数据的爆炸式增长创造了一个信息过载的世界。“现在的信息比历史上任何时候都多，所以过滤无用信息变得更加困难。”

因此当今新闻业面临的另一个重大挑战是 信息过滤 。记者要掌握计算科学，不仅要负责撰写故事，还要负责编辑算法。Marconi说：“现在必须专注于研发新的新闻编辑系统，不仅能够过滤噪音、区分事实和虚构，还要能找出需要重点强调的东西。”“这些系统要根据新闻原则来开发，并保证全天候工作。”

AI与新闻业的未来并不明朗

ChatGPT核心的局限

《金融时报》AI编辑Murgia认为，生成型AI工具的工作原理是根据某些内容和数据进行训练，进而生成新的输出，有助于综合信息、进行编辑，但不能提供原创内容，也不具备分析能力。 “没有什么能取代有原创能力的人。” 他补充道。

AI极易造成错误信息、假消息泛滥

无论是ChatGPT，还是谷歌新推出的生成型AI “Bard”、苹果的新一代“Bing” （必应）都经常犯事实性错误。

微软承认：“人工智能可能会出错……必应有时会歪曲信息，你可能会读到听起来可信，其实是不完整、不准确或不恰当的内容。”

《麻省理工技术评论》的Melissa Heikkilä写道： “众所周知，AI语言模型经常胡说八道、颠倒黑白。AI善于预测句子中下一个词，但根本不理解这个句子的意思。”

彭博传媒首席数字官Julia Beizer也认为AI面临的最大挑战是准确性。“媒体的职责是为读者提供基于事实的信息。人工智能很有价值也很实用，但很明显，还不足以作为准确的信息源”。

《体育画报》与AI初创公司Jasper&Nota合作，从自己的内容库中生成故事，然后由人类编辑。然而，这些作品中存在“许多不准确和虚假之处”。美国科技网站CNET悄然上线了几十篇AI撰写的文章，结果被读者揪出了很多基础性错误，目前正因为错误、抄袭等原因而受到审查。

虽然作为AI专家，Marconi长期倡导媒体人工智能，但他仍认为AI也对新闻媒体和整个社会造成了风险： “新一代生成型人工智能在精确计算方面并不准确。未经检查的算法会为信息生态系统带来重大风险”。

因为AI可以在几秒钟内创建大量内容，包括音频、代码、图片、文本、仿真特效和视频。“问题是，他们根本无法承诺真实。”《卫报》的Emily Bell写到，“转瞬之间，用ChatGPT制作的完全可以乱真的假新闻就能充斥互联网。”

AI还可以创建假新闻网站。 美国媒体教育科研机构Poynter Institute的教授Alex Mahadevan是媒介素养教育项目MediaWise的负责人，他用ChatGPT只花了几个小时就创建了一个假的新闻网站，包括新闻、代码、编辑政策、员工等等。他说： “任何具有基础编码能力的人都可以使用ChatGPT制造虚假的新闻网站，完全能以假乱真。”

对此，Marconi建议：“媒体应该进行研究、并与学术机构和科技公司合作，通过更新AI工作流程来监测技术的演变，以识别错误内容。”

AI夺走了搜索流量，抢了媒体的“蛋糕”

ChatGPT这样的生成型人工智能可以让用户无需访问新闻网站，即可得到所需的信息。谷歌新推出的AI聊天工具Bard在三月底的测试中，只提供查询的答案，没有提供新闻来源的链接。测试者要求提供《纽约时报》最重大新闻的摘要时，Bard只给出了内容摘要，没有提供引用链接，仅在结尾写到：“欲了解更多信息，请访问《纽约时报》网站”。

微软首席执行官Satya Nadella在接受采访时表示：“在必应聊天上，我认为人们没有意识到，一切都是可以点击的。”他指的是必应提供了用户通往信息源（媒体网站）的链接。

但是，媒体高管质疑，有多少用户会点击这些链接？Marconi说：“谷歌和必应等搜索引擎加装摘要生成功能，可能会影响媒体的流量。如果搜索引擎用户可以直接得到查询的答案，那他们还有什么必要进入媒体的网站？这可能会影响新闻媒体的广告收入和订阅收入。”

ChatGPT引发的法律和道德问题

首先是知识产权问题 ，这里既涉及媒体的知识产权，也涉及AI的版权问题。

ChatGPT等生成型人工智能是用网上抓取的内容来训练的，其中既有开源数据库，也有受版权保护的内容。

由此引发了两个问题，其一：人工智能公司是否有合法权利从网上抓取内容并输入其培训模型；其二，就是彭博首席技术官Beizer的问题，“媒体和创作者应该如何得到补偿？”

《新闻人物：人工智能和新闻业的未来》一书的作者弗朗西斯科·马可尼在2月15日的一条推文中表示：“ChatGPT接受了来自顶级来源的大量新闻数据的训练，这些数据为其人工智能提供了动力。目前还不清楚OpenAI是否与所有这些出版商都达成了协议。未经许可抓取数据违反了出版商的服务条款。”

后来，他还在推特上说，OpenAI如何使用来自Reddit的4500万个出站链接来训练GPT2。他写道：“这是OpenAI发布的用于训练GPT2的WebText顶级域名列表（来自Reddit的4500万个出站链接的废弃数据）。我的主要问题是，在没有明确许可和归属的情况下，训练人工智能使用网络内容是否公平？”

新闻媒体联盟执行副总裁兼总法律顾问Danielle Coffey表示：“我们有价值的内容不断被用来为他人创造收入，我们必须得到补偿。”

今年2月，Getty图片社在特拉华州起诉人工智能艺术公司Stability AI，指控其侵犯版权。

对此，OpenAI却表示，出于培训目的使用受版权保护的作品构成了合理使用。它还承认，人工智能开发人员可能面临“巨大的法律不确定性和合规成本”。

另外还有 新闻的职业道德问题： 彭博首席技术官Beizer还质疑AI工具在新闻业的进一步应用将动摇媒体存在的基础——用户的信任。“如果我们在内容创作中使用人工智能，应该如何向用户披露才能获得信任？”

对此，美国科技媒体《连线》已经制定了相关政策，对使用AI的目的以及编辑流程进行了清晰的限定，以确保新闻产品质量。

《新闻公报》律师JJ Shaw认为，“人工智能的法律和道德问题，包括知识产权和侵权问题、内容验证和审核问题，以及打破现有媒体收入模式的问题，使得AI与新闻业的关系前景很不明朗。”

人工智能十年发展简史

AI辅助新闻生产并不是新生事物。计算科学记者、AppliedXL公司联合创始人Francesco Marconi说，过去十年间，人工智能经历了三次创新浪潮：自动化阶段、增强阶段和生成阶段。

第一阶段，“重点是使用自然语言生成（NLG）技术，自动生成数据新闻，如财经报道、体育报道和经济指标等”。无论是路透社、法新社、美联社等全球性媒体，还是较小的媒体都有相关新闻实践。

第二阶段，重点转向通过机器学习和自然语言处理来分析大型数据集并揭示趋势，这就是“AI增强”报道。阿根廷《国家报》（La Nación）于2019年开始使用人工智能来支持其数据团队，后来与数据分析师和开发人员合作，建立了一个AI实验室。

第三阶段，即当前的生成型人工智能（比如ChatGPT、谷歌Bard、微软新一代搜索引擎Bing等）。它的基础是能大规模生成叙事文本的大型语言模型。这项新技术为新闻业带来了重大改变。现在，我们可以让聊天机器人就某个主题写更长的、平衡的报道，或者从特定的角度写评论，甚至可以要求它模仿知名作家或著作的风格。

目前来看，正如Polis/LSE新闻研究项目负责人查理·贝克特（Charlie Beckett）所说，“人工智能并不是从头到尾完全自动化的内容生产：它是一种增强，为媒体人提供更快工作的工具，让他们有更多时间花在人类最擅长的事情上。”

本文来自微信公众号：德外5号（ID：dewaiwuhao），作者：张春华