对于美国大选,为何不同 AI 系统会给出不同的预测结果?
日前,全球关注的美国总统大选终于尘埃落定,出乎意料的结果将此次预测大选结果的人工智能系统也推向了前台,即此前一直参与大选预测的由印度企业开发的MogIA AI系统、硅谷创业公司的Unanimous AI系统和微软的Bing Predicts AI系统。
其中MogIA因为成功预测特朗普当选,尤其是在其他两个人工智能系统均预测希拉里会当选的情况下,更被喻为人工智能的神话,当然,相比之下,另外两个AI系统似乎成为了笑话。那么问题来了,为何同是AI系统,会产生截然不同的结果?
首先我们不妨简单看看这三家AI系统是如何来做此次美国总统大选预测的。
先看此次大选预测中的胜者MogIA。其预测的方法是直接从Google、YouTube和Twitter等网站上搜集近2000万个数据点,对其做出分析,并预测出结果。
MogIA不同于其他AI的地方在于,其算法是完全由自己建立的,其中既不舍弃任何数据点,也不参杂任何人为意见,只由其独立学习并自主完善,尽量确保预测结果的客观性。
尽管如此,MogIA系统公司创始人Rai不得不承认,目前AI系统对“讽刺表达”、“反话”的识别能力有限,网民们的言论可能被系统错误解读的。
比如,即使特朗普的Twitter账号下有大量的网民互动,也不代表这部分网民倾向于支持特朗普,但相关话题的活跃度会被AI系统归入民意预测依据。对此,有分析认为,MogIA 明显是一个有利于特朗普的AI系统。
和MogIA基于社交网络的数据进行预测不同,Unanimous A.I.的方法是直接以人为分析对象,即通过询问参与的选民一组类似的问题,如:“如果希拉里担任总统,失业问题将如何改善?”
参与预测的选民可从五个答案中选择,即“大幅改善”、“略微改善”、“大幅加剧”、“略微加剧”以及“没有任何变化”。此外,可选的答案还有“希拉里胜算很大”、“希拉里略胜一筹”、“特朗普胜算很大”、“特朗普略胜一筹”以及“不相上下”。
需要说明的是,在Unanimous A.I.进行的预测中,有45个选民参与,其中46%为民主党人,24%为共和党人,30%在党派上保持中立或属于其它党派。
从设计的问题和选取的对象看,由Unanimous AI开发的swarm AI-UNU的预测则明显倾向希拉里。不同于MogIA以互联网数据为分析对象,UNU直接以人为分析对象并使用了一种所谓的“集群智能”的技术。
即在实际预测中,一组随机选取的适龄参选的公民会被提问,参与者按照自己的回答倾向牵动球体。在这一过程中,参与者往往会根据球位置的变化而不断变化自己的选择——当发现多数人也支持自己的选择时,他可能会更加坚定地牵引;而当发现球大大偏离自己希望的方向时,他可能会放弃或减小牵引力,直至最终达成“共识”。
至于Bing Predicts,微软在 2014 年推出了人工智能预测引擎 Bing Predicts,基于自身浏览器 Bing 中的数据以及相关的社交媒体趋势,利用机器学习技术对未来进行预测,从今年年初开始,它就持续对最初的党内初选和之后希拉里和特朗普的总对决进行预测。
而出乎意料的是,Bing Predicts 所预测的结果完全是一边倒,9 月就显示希拉里将以超过 70% 的概率当选,到了 10 月这个概率更是达到了 89%,特朗普当选的概率仅为10%。
可以说微软的Bing Predicts几乎将胜算全部压在了希拉里身上。对于如此高的胜算率预测,有外界分析认为,这和微软是希拉里幕后金主的背景密切相关。
不知业内看了上述三家AI系统的预测方法作何感想?
众所周知,尽管人工智能相当复杂,但最终起决定因素的主要是数据(包括设定的参数)和算法。
具体到此次参与美国总统大选预测的三套AI系统,从上述的简单介绍中,我们不难发现,从数据的角度看,MogIA的采集的数据量更庞大、丰富和客观,尽管如此,皮尤研究中心(Pew Research Center)数据显示,其采纳的Twitter用户多为非农村、非西班牙裔黑人,年龄在29岁或更低。
而这些人并不是特朗普的支持者,因为后者多为50岁或更高年龄的白人。那么问题来了。如果大量的特朗普支持者之前并不使用Twitter,只是在近期才开始通过Twitter来支持特朗普,特朗普的Twitter数据就有可能存在偏见。
言外之意,即便是如此丰富的数据中,也存在着相当不可预见的临时数据变量,也就是说虽然MogIA成功预测了美国总统大选的结果,依然不排除其中偶然的因素,毕竟其中重要的数据来源之一(Twitter)存有偏见。
如果说MogIA的数据采集依然存有偏见的话,那么Unanimous AI采用“集群智能”技术搜集数据的方法更带有偏见性,并通过问题的设定和对象的选取得到了充分体现。
再看算法。现阶段有关算法的讨论大多集中于人类在算法设计中所起的作用,也就是说算法的设计者是否会将自我意识强加于算法中。
就像是上面提到过的由印度人Sanjiv Rai开发的MogIA系统,它所使用的相对简单的算法客观上可能就更有利于特朗普而非希拉里。
至于Unanimous AI,过于复杂的以人为分析对象的算法,又极易产生“人”最常具备的偏见。就像 John Mannes 所说:“一个充满偏见的世界能产生偏见的数据,而偏见化的数据又会继续得到偏见化的 AI框架。”。那么最终导致的结果就可想而知了。
其实,就在人们过于注重AI在此次美国总统大选表现的时候,美国纽约州立大学石溪分校政治学教授 Helmut Norpoth,分析了自 1912 年起的历届大选并归纳出两个预测模型:初选模型和摇摆效益模型,而且就凭它成功预测了由 2000 年起的五届总统大选,而他更预测特朗普的胜率达 97%。
而美国政治史学家 Allan Lichtman 也透过归纳历届大选而在 1981 年提出“入主白宫的 13 个关键”,并成功预测其后 30 多年的八届总统大选。这 13 道是非题其实是反映施政成效,得分愈低就会选输,而Allan Lichtman 就因此也同样断言特朗普将会胜出。
综上所述,我们认为,此次美国总统大选的AI预测之战,无论是赢家还是输家,其背后反映出的AI在数据和算法上或因主观或因客观,均存在难以避免的缺陷,并导致最终的结果也存在相当偶然的因素,所以神话即笑话,笑话即神话。
但传统预测模型在此次预测中并未在AI面前失去其自身的价值,甚至更加可靠,这无疑为未来AI在垂直行业中,“传统+现代”相得益彰模式的应用提供了很好的启示。
更多有意思的观点,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App