被AlphaGo击败的李世石,用8年重建崩塌的世界
输给AI,有种感觉是,我整个世界都塌了。
李世石在最近接受《纽约时报》采访时说道。
2016年,这位曾14次获世界冠军的韩国棋士代表人类出战Google的AlphaGo,最终以1:4告败。
他当初在接受邀请时,觉得那会是一次“好玩”的经历:
好玩的前提是我觉得会赢。我从未想过自己会输。
那可能是AI技术在ChatGPT登场前,其中一个最重要的高光时刻。
现在离ChatGPT的发布过去了不足两年,我们已看到多个领域被AI影响,而生活更多方面似乎也被埋下了改变的伏笔,我们总忍不住想要去推测和畅想未来的AI。
也许,比其他领域更早受到AI冲击的围棋界,能帮助我们看到一种已经发生的可能性。
击败人类后,AI在进一步去“人味”
我没有办法再去享受围棋,所以我就退役了。
和AlphaGo对战的三年后,李世石正式宣布退役。
对于5岁就开始学围棋的李世石而言,围棋不仅是竞赛,而是一种艺术,一种棋手个性和风格的延伸,但在AI时代,它却“沦为”了算法的效率游戏。
在这三年间,其实还发生了另一件事。
2017年,DeepMind宣布了新版的AlphaGo——AlphaGo Zero。
AlphaGo诞生自神经网络对人类高手3000多万手数的学习和自我练习,但AlphaGo Zero却是从一开始就脱离“人味”,训练期间不接触任何人类棋谱,单纯靠自己和自己下棋训练。
只用了三天,AlphaGo Zero在迎战AlphaGo时就已经以100:0取胜。
《大西洋月刊》称其为“不需要从人类身上学习任何东西的AI”。
在围棋中,有一种手法看起来简单或无关紧要,但长远却能造成致命威胁,有人会说那就像是“幽灵”般。
而AlphaGo和AlphaGo Zero的棋谱,却难以理解到直接被视为“外星文明投下的一本神秘指南”。
美国职业棋手Michael Redmond于2017年表示,人类学习围棋其中一个重要的手段是搭建一个故事:“那是我们沟通的方式。它是一件非常人性的事。”
这也许也呼应了李世石的观点,在下棋时,棋手也展现了他们作为人的一部分。
Redmond补充说,据他自己的观察,人类棋手初见“AI味”棋路时很可能直接“举手投降”:
AlphaGo下棋的方式,总让人觉得很“非人性”,面对这样的棋局,我们甚至很难投入其中。
李世石作为其中一位最早经受到冲击的围棋高手,久久不能释怀。
他开始执迷于AI。
退役后,除了开设自己的围棋学院、出书和推出基于围棋的桌游外,李世石还开始做关于AI的演讲:
我算是很早开始面对AI的问题,其他人也将会经历。那未必会有开心大团圆结局。
对于他来说,AI最让人担心的地方在于,它可能会改变人类的价值观:
过去,人们会对创造力、原创性和创新充满敬畏,但自从AI出现以来,这些很多都已经消失了。
并不是所有人都同意这个讲法。
人机共创这些年
AI毁灭了围棋圈所有存在的秩序,然后开始重建。
在康奈尔大学研究人工智能的围棋爱好者Jiuheng He说道。
在很多围棋学院里,用AI来学习围棋已经几乎是所有棋手都要经历的过程。
在香港一家围棋学院里,Ng Chee Man会为学生提供iPad来用AI学习围棋。
每次到学生下棋,AI都会展示出“最佳走法”建议,同时,系统也会记录下学生哪些步下得好,哪些不好。
去年,在《美国国家科学院院刊》上刊登的一篇研究指出,自从AI进入围棋圈后,人类棋手的判断能力获得了提升。
早在2016年,在AlphaGo打败李世石前,曾在不公开测试中对决AlphaGo的樊麾也有过类似经历。
虽然落败,但樊麾说AlphaGo让以他一种全新的方式去看待围棋,提升他的技巧,让他的世界排名快速跃升。
2023年的研究则以1950年至2021年积累的棋谱为基础,包含了580万手数的数据。
研究人员发现,在AlphaGo击败李世石前,人类棋手的判断质量在66年中都保持平稳,基本不变,但在2016、2017期间,棋手的判断质量开始爬升。
换言之,人类棋手虽然未必能击败AI棋手,但他们的判断能力的确有所提升。
看到人类棋手能如此快速地适应,将这些新走法融入自己的方法中正式让人非常振奋。
这些结果表明,人类将适应这些发现,并在它们基础上大大地提升自身潜力。
DeepMind首席研究科学家、AlphaGo项目负责人David Silver对这个研究评论道。
曾被AlphaGo于2017年击败的柯洁,也曾于2023年表示自己除了比赛外,已经很少和真人练习了,并认为AI甚至已经成为了围棋创造力的源头:
创造性不是你随便做一件什么不同的事情,创造性必须投入实战并得到检验,现在围棋创新的大部分是AI来完成,我们想下一些和以前不一样的棋,大概率会输,因为AI通过大量实战,得出和之前不同的思维,这才是创造力。
除此以外,另一位职业棋手的表现也尤其引人关注。
韩国棋手申真谞是首位夺得世界冠军的00后棋手,常被棋迷称为“申工智能”,因为他正是通过长时间进行AI训练和研究著称。
今年2月,申真谞于25届农心杯击败中国主将辜梓豪,实现了单赛季六连胜,跨赛季16连胜,超越了其前辈李昌镐。今年3月,他谈论了自己和AI的关系:
我觉得我和AI现在是朋友关系。
我和比我更优秀的AI一起学习。
AI和人类的思路是完全不同的,AI通过数学算法解决问题,借鉴AI的思路使我受益良多。
现在,中国、韩国、日本的职业选手,都会用AI来训练。
“AI味”启示录
正如在生成式AI时代下,一些设计师和作者需要因为作品中包含的所谓“AI味”而进行繁复的自证,在融入AI已久的围棋界也一直在面对“AI味”衍生出来的各种议题。
在现时围棋比赛中,常常都会配有AI推测胜率和AI推荐最好的走法。观众在观赛过程中也因此能获得一种“主动性”,拥有多个观赛的角度。
2022年,中国棋手李轩豪在对决申真谞过程中,很多决策都和AI最优判断预测前三符合,因此被队友杨鼎新质疑其有用AI作弊之疑。
生于95年的李轩豪在用AI训练上“朝九晚九,全年无休,确实很用功”,因此棋路有时会被视作有所谓的“机器味”。
对于质疑,中国围棋协会进行了调查,最终认定这一指控没有证据,杨鼎新作出了处罚。
但用AI作弊的情况也的确存在。
2020年,韩国13岁的职业棋手金恩持被发现在线上比赛中的落子与AI推荐有高达92%的重合。经过调查后,最终认定其作弊 (且本人也承认了) ,被罚禁赛一年。
2022年,中国棋手刘睿智被判定AI作弊,是中国首次正式因AI作弊而被处罚的职业棋手。和金恩持相比,刘睿智已经懂得规避“AI味”,只是在一些关键点用了AI。
为了应对,各国的比赛也是在不断改进反AI作弊机制。
与此同时,也有人利用了“AI味”来击败AI。
2023年,美国业余棋手Kellin Pelrine击败了围棋AI KataGo。
KataGo是现有开源最强围棋AI之一,韩国也会用它来训练棋手。
Pelrine利用了名为FAR AI的程序和KataGo对决了超过100万局,最后FAR AI找到了KataGo的弱点,并在人机对决中践行且获胜了:
那个策略算不上小儿科,但也不是特别难学。
然后,他也用同样的方法击败了另一个比较厉害的围棋AI Leela Zero。
策略关键在于要创造一个大的“圈”来围住对手一组棋,然后可以突然把一子下到另一个不相关的角落,去干扰AI。
Pelrine说,如果是人类棋手,看到那个圈肯定就知道有问题,但AI并不会留意到。
这个弱点看起来有点“取巧”,是不是让AI去进行针对性地训练就能打上补丁?
《自然》上周一篇报道援引了今年一篇预印本论文指出,面对专门找AI弱点的程序,模型的漏洞并非想象中容易修复。
这次被“针对”的还是KataGo。研究人员用三种不同的策略来让KataGo反击能力更强:
-
让KataGo通过自我对弈学习如何应对攻击;
-
迭代训练,用攻击程序攻击KataGo,把漏洞反馈给KataGo,让它通过自我对弈或其他方式学习应对,然后再用攻击程序攻击KataGo,往复循环;
-
从头开始训练一个新的围棋AI系统,采用不同的神经网络模型。
虽然这些训练在一定程度上帮助了KataGo提高防御能力,但攻击程序依旧能发现漏洞,分别以91%、81%和78%的胜率击败KataGo。
这些攻击程序本身不是出色的围棋AI,人类也能轻松击败。
当然,这里的关键不是去比拼到底是人类厉害还是AI厉害。
重点是,对于围棋这个AI曾“颠覆”的领域,并且经过那么多年的应用与改进,其AI依旧存在很多问题。论文作者Adam Gleave说道:
如果我们在像围棋这种单一领域里也没法解决这个问题,那在短期里,想在ChatGPT之类模型修复越狱的可能性似乎很小。