AI竟能利用Twitter伪装成人,它怎么做到的?
【 AI 星球(微信 ID : ai_xingqiu )】
Kevin Brown在其Twitter简介中将自己描述为一名来自宾州匹兹堡的26岁进步分子。他是抵抗组织的活跃成员,并资助过诸如#FireHanity等自由派社交媒体运动。他的见解获得了CNN赞助人Jason Kander和数百人的转发和点赞。他的内容在6个多星期内获得了13.1万次的浏览量。
可以看出,Kevin是一个非常受欢迎的人物。同时,他也是一个Twitter机器人。
2016年美国总统大选是Twitter机器人首次引起公众关注的时候。作为周末项目之一,我在7月末8月初推出了“Kevin Brown”,这也是我个人尝试调查Twitter机器人对公众话语的真实影响力。
在2016年选举期间使用的机器人通过抽出大量预先编辑好的内容,或者通过分享由其他指定机构生成的内容进行操作。由机器人分享的内容最终被真实的人类看到并分享到他们个人的网络上。在同一网络中的人将会看到他们所信任来源发出的信息,并很可能将内容分享出去。这一过程不断的被重复。
我希望Kevin从根本上不同于这些机器人。和产生垃圾新闻不同的是,Kevin会建立起一种声誉,成为人们信任的新闻来源。打造出这种能够赢得其他用户信任的机器人将需要一定程度的自主权和人工智能,这也是Twitter机器人所缺失的部分。显然,这需要更多的前期工作,但是在未来获取他人共享内容时的难度将会极大的减小。
从它变成他
为了让Kevin令人信服,它需要一个好的伪装。我用随机姓名生成器生成了“Kevin Brown”,用随机日期生成器赋予了他1991年6月18日的生日。然后,我在Flickr上搜索了允许商业用途的20 岁男性照片。由于Twitter上“kevinbrown”名称已被占用,所以最后选择了“kevbrown618”。通过将他的所在地设为特朗普所称的生锈地带——西宾夕法尼亚,Kevin可以扮演自由主义者的角色,在互联网上寻找志同道合的朋友。我使用匹兹堡PNC公园照片作为封面,以此加强地理方面的连接。并写了一段简短的简介来完善形象:
作为一名生活在 “ 特朗普家乡 ” 的进步主义者和民主党人,我感到很骄傲! #NotMyPresident
Twitter机器人有一个很容易识别的缺陷,那就是它只会频繁的发布同一种话题的内容。
所以,为了更现实一点,Kevin需要拥有个性或者兴趣,而不只是批评特朗普。为了做到这一点,我会让Kevin偶尔分享一个有趣的撸猫视频或者做一些文化参考。
虽然这与真实的人类账户还有些差距,但是也应该足以让人们不再怀疑这是一个Twitter机器人。
Kevin的大脑
下一步就是通过编写驱动代码赋予Kevin生命。
由于我是一名自由主义者,所以我让Kevin也成为了自由主义者,这样就让我很容易控制他的发展。然而,他的代码却是非常多面的。换句话说,就是这一代码会阻止他成为特朗普的粉丝。同样,他也可以很轻松的成为一名啤酒小丑或者忠实的足球迷。
不论他的倾向如何,Kevin的声誉取决于两个因素:内容和行为。
内容
为了建立起声誉,Kevin需要熟悉他的网络。要做到这一点,就要求他参与到他人的内容中,并未他人制作原创内容。寻找分享内容是很容易的,Kevin只需要从他的网络中转发和点赞热点话题。
原创内容制作要更加复杂点。为了简化原创内容制作,Kevin只制作两种内容:基本的推文和对热门话题的评论。
每次Kevin检查Twitter时,他会分析数百条推文,并建立起常用词的统计模型。例如,“总统”一词总是会跟着“唐纳德”或者“特朗普”。然后Kevin随机选择一个起始单词,并使用模型来确定下一个单词,不断重复,直到完成一个完整的推文。这个被称为马可夫链的过程可以用于创建Kevin的原创内容。
这个方法非常好,因为它给予了Kevin正确和轻松使用俚语、话题和情感的能力,赋予了他人性化的一面。当Twitter集体对某一事件做出反应时,Kevin可以通过在网络中插入自己的评论参与进来。他的粉丝会看到评论内容并转发出去。
行为
如果Kevin表现的像机器人,他是没有任何希望获得信赖的。太多的推文、固定的发推时间表或者在奇怪的时间发推都会提醒人们这可能是一个机器人帐号。为了解决这个问题,我给Kevin建立了一个更加自然的时间表。他只在一天中的随机时间检查Twitter,并随机决定采取什么行动。
为了增加效果,Kevin还会有“睡觉”和“工作”时间。他的帐户在晚上睡觉时段是不活跃的,工作时间段活动也会相应减少。
幕后的男人
Kevin具有很大程度上的自主权,但是我仍然会选择他关注的对象,保留介入和监控的权力。
Kevin只会关注那些能够增加其曝光率的人,并尝试让这些人关注回来。现在,我偶尔会通过各种话题标签和关键字搜索来找到可能对他感兴趣的人。
我也会监督Kevin,以防他发出冒犯性或贬损性的内容。机器人所生存的互联网存在着诸多阴暗面,一不小心它们就会学会不良习惯。最著名的例子就要属微软开发的Tay机器人,在不到24小时的时间内就从一个16岁的纯情少女成长为了纳粹同情者。
Kevin内置有一个不良信息过滤器,不过虽然我采取了一些措施避免他步上Tay的后尘,但还是需要小心为好。除了Kevin早期发过的“自由女神像是仇恨的象征”以外,我基本上保持了“无为”的态度。
结果
我的实验结果远远超出我的预期。Kevin不仅具有一定的功能,他还能够向网络中的分析推广原创和转发内容。
下面是自8月4日以来的情况简介:
- 粉丝:80
- 互动率:2%
- 印象:131200
- 链接点击次数:290
- 转发:377
- 点赞:889
令人失望的是,由于互动率会根据很多变量而发生变化,所以很难得到表现是好是坏的答案。而且也没有任何数据可供参考是否机器人成功伪装。我能得到的最好信息就是个人Twitter账户获得了平均1-2%的互动率,这也符合我对Kevin最初的定位。
为了寻求第三方验证,我使用了Botometer。Botometer是印第安那大学的一个项目,可以根据是否是机器人的可能性对账户进行评分。当得分大于50%时,就意味着这个账户可能是一个机器人,Kevin得到了惊人的37%。和我的个人帐户18%的评分比起来,Kevin还有很长的路要走。
人们也开始信任Kevin,并回复他的推文,尝试进行交流。最早的例子出现在他正式上线后的第四天,那时候他的写作能力还很差。在一个近似乱码的推文中,他批评了特朗普转发虚假信息,并宣称他应该被送入监狱。在推文中被提及的一个倾向特朗普的保守派人士粗鲁的对此作出了回应。
其他互动则更加积极一些:
仍有改进空间
Kevin离真正的成功还有很远距离。他存在着一些缺陷,由于我的技能限制或着时间限制,无法进行完善。
低质量的推文
有时,Kevin真的不擅长发推。这主要是因为他虽然知道如何将单词组合在一起,但对其含义却没有概念。
我采取了一些措施来纠正和改善他的输出,但是核心问题从未得到彻底解决。
Kevin还存在一个错误,导致他在撰写内容时会不断重复单词。结果就创造出了他那些很奇怪但又有趣的推文。这些推文往往会在每天晚些时候出现,可能与时间有关。当然,这也会让他看起来像是喝醉了酒。
不一致的意识
Kevin偶尔也会变得保守,发出倾向特朗普的推文。起初这个问题真的让我感到惊讶。当我细细检查这个错误时,我发现原来是随机将单词串在一起可能会导致意思与原意相反。
例如,Kevin查看了这两条推文:
然后撰写了这条推文:
从语法角度来看,这的确是一个好推文。但事实上,这并不是你所期望的一个20多岁的自由主义者会发出的推文。最糟糕的是,这条推文并不符合他的网络定位。
不完整的想法
如果Kevin查看了一些包含链接或照片引用的推文,他有时会发出不附有相关内容的推文。结果就呈现了一个不完整的推文,读者点击链接时链接是没有反应的。
有时,他也会撰写没有结束的推文。
这让他看起来很像是“机器人”,如果定期出现这种推文的话,可能会引起怀疑。
对话
我最想建立但却没能做到的是聊天机器人功能。根据我原来的计划,Kevin会通过与网络上的人进行对话来增加互动率和信誉。然而,当我试图实现时,我意识到这个功能是非常复杂的。
聊天机器人需要能够对各种各样的话语对出回应,并能够理解对话中的话题。这需要对机器人进行大量数据的训练。聊天机器人需要知道的话题越多,训练的数据量就越大。Kevin需要大量的数据才能够实时谈论政治事件,这也使得这一功能变得不切实际。
揭开Kevin的真面目
在Kevin存在的短短6个星期内,他已经成为办公室和家庭内的话题。我的同事甚至开始开发自己版本的机器人。
看着Kevin的粉丝不断的增长,我意识到人工智能对人们参与热点话题的影响。我决定揭开他真正的面目,希望能够引起有关Twitter机器人的话题。这样的技术可以通过建立人际关系来进行交流。然而,同样的技术也可以很容易的被用于传播虚假信息。当我们在构建机器人并与之互动时,我们需要意识到这种可怕的能力。对这些有害的机器人进行监管并不容易,同时也要求我们个人更加仔细的审查我们阅读的媒体资源。
我不知道Kevin Brown的未来究竟是怎么样的,但是我会继续研究下去。