人工智能,也应该学会遗忘
人工智能,也应该学会遗忘
每日科技前瞻
· 刚刚
人类大脑和遗忘的过程中,有可能藏着颠覆现有AI技术的秘密。
人工智能,也应该学会遗忘
图片来源@视觉中国
文 | 每日科技前瞻
我们的故事还是从AlphaGo这里说起,无他,我实在是太喜欢这个小家伙了。
在AlphaGo的棋盘招式中,偶有出现之前出现在棋谱里的招式。他通过强化学习,“记住”(至少是我们认为那个意义上的记住)了围棋的局面较优解。这样超凡的学习能力和“记忆力”(虽然运行方式和人类的记忆不同)是AI在这些方面超越人类,出类拔萃的保障之一。
如果把我们代入人工智能的视角,有了这样的记忆力,我们将看到一个学习成本空前降低,创造力勃发的世界。但是当我们有限的记忆芯片被填满之后呢?我们不得不撞上一个名为“遗忘”的问题。
人们有在互联网上提出“被遗忘”的权利,那在人工智能眼前呢?
人工智能,也应该学会“遗忘”。
遗忘,不止应该是对人类
人们似乎永远无法完全控制自己的记忆,我们都知道忘记一些事情是什么感觉。即使是那些拥有非凡记忆力的人,也无法确保自己的记忆能够保持多长的时间。
也正是因为此,我们发明了纸笔,发明了硬盘,发明了各种各样能够把我们的记忆以物质记录的方式存留下来的方式。人工智能,也是我们“记住自己”的一种方式。
但是我们的记录与记忆是有选择的:谁都不想把那些不好的回忆在自己的脑海里留存太久,谁都不会去刻意记住生活中繁杂的细枝末节。我们保留了有用的、有价值的记忆,而忘记了价值较低的信息。我们对于这些记忆的物质承载工具大多也是这个态度。
同样,对于AI也应该是这样的,我们应该有能力让一个人工智能忘记它所见证的一切。
“遗忘”对人工智能机器人来说势在必行
计算机中的存储器通常用来描述其存储需要回忆的信息的能力,以及存储这些信息的计算机的物理部件。例如,当计算机的工作存储器不再需要某个任务时,在人类的干预下,它会“忘记”数据,从而释放出计算资源用于其他任务。
这也同样适用于人工智能。不过,机器学习算法并不善于知道什么时候保留旧信息,什么时候丢弃过时的信息。比如,非常科幻的“连接主义人工智能”,就面临着几个与“遗忘”有关的问题。比如过度拟合,即学习机器从过去的经验中储存过于详细的信息,从而妨碍了它概括和预测未来事件的能力。
关于这样的“过度拟合”问题,在国外的TowardsDataScience 论坛上,有一位极客为我们分享了他用程序跑出来的例子。
他首先使用sklearn 的“ make _ classification”函数生成一个数据集。并将这些数据集生成的点分成两种颜色,并且放置在同一个平面直角坐标系内,如图所示。
注意红点和蓝点的颜色有所区别
在这项实验中,过度拟合的定义是:反映该模型学习输入的示例,但不能推广到其它示例。比如,在这个系统中,他通过过度拟合要求电脑绘制红色点的存在边界,在编写完相应的程序并且运行之后,电脑给出了这样子的回答。
结果
他确实“忠实”地帮我们把红色点与蓝色点区分开了,但是其发现的模式毫无意义,因为生成这些点的规律和自己拟合出来的结果根本就不是一个东西。这样拟合出来的模型,根本没法用。
没有经过“遗忘”提纯,过度拟合的出来的数据,就像人类的“经验主义与教条主义”,比如炒股找类似图形判断未来走势,比如不结合实际情况去找别人的解决方案……不懂得随机应变与因势利导,只会死套公式找公式化的解决方案,但是这样的方案很多时候并不存在。
要解决这样的过度拟合难题,“遗忘”就势在必行。
目前有一项技术叫做长短期记忆网络(LSTM)算法,它使用特定的学习机制来决定在任意一个节点哪些信息需要记住,哪些需要更新,哪些需要关注。用香港科技大学相关领域的专家Edwin Chen的话来说,LSTM应该达到这样的状态:
“当场景结束,模型应该忘记当前场景的位置,所处时间,并重置任何特定场景的信息;然而,如果场景中的一个角色死亡了,机器则应该继续记住他不再活着的事实。因此,我们希望机器能学习掌握一个相互独立的遗忘/记忆机制,这样当新信息进来时,它知道什么观念该保留什么该丢弃。”这些遗忘的过程,应该在没有人工干预的前提下独立完成。
对于人类来说,遗忘不仅仅是一次失败的记忆,还是一个积极的过程,可以帮助大脑获取新信息并更有效地做出决策。
对于人工智能来说也是如此。
遗忘或许是AI进步的关键
我们先做一个看起来不是那么恰当的比喻,所有“记忆”的物质承载都是有承载上限的,日记本写满了就没法再记,硬盘的容量塞满了也放不下更多的东西。如果放任所有你看到的信息都记在你的电脑硬盘里,它可能很快就会被塞满,然后“写入”这个类似于“记忆”的东西就会罢工不干。
如果教一个说中文的孩子学习英语,孩子会很容易把学习中文的方法应用到英语的学习中(虽然这两者不属于同一语系,但是中间还是有相通的部分,同一语系中的相通部分更多,所能“借鉴”的经验也就更多),比如名词,句子构建,语序区别,同时忘记那些不相关的东西,比如口音,语调,没必要的俚语,我们人类可以同时进行遗忘和学习,并且总结他们之中的共同经验,放弃实际应用中毫无必要的细枝末节。
但是机器人的处境可不一样,如果训练神经网络学习英语,则他会通过“深度学习”整出一个适用于英语的学习方式。这让他在学英文的时候有了无可比拟的优势,但如果还想同时教它中文,对中文内容的学习将覆盖神经网络以前为学习英语所获得的知识,因为这与之前的学习方式矛盾,如果存储内存一定,那么只好删除所有内容并重新开始。
其实这也很好理解,现在的神经网络不允许AlphaGo在一个深度学习过程中同时学会围棋和五子棋,尽管他们棋具都很相似,但是规则大不同。如果用围棋的下法去下五子棋会速败,用五子棋的下法去下围棋会给自己挖出一个大坑。这被称为“ 灾难性遗忘 ”,也是神经网络的一个局限。
算法不能选择忘记什么,目前只能依靠人来对信息进行筛选,这是人相比机器的思维优势之一。通过选择性遗忘的提纯,AI可以更好地去理解人类的命令,解决更多的实际问题。比如在语音识别中摒弃各种干扰的声音,抓住最核心的内容,并且通过最正确的方式将其实现。
如果只是进行大量数据持续的收集,而没有简单的方法通过“遗忘”提纯数据,那人工智能也仅仅是在有限的容量上,在一个狭隘的角度里堆砌和发展我们的智慧成果而已。
因此,学会遗忘是人工智能面临的重大挑战之一,可能也是这个行业破局的关键所在。人类大脑和遗忘的过程中,有可能藏着颠覆现有AI技术的秘密。
忘记该忘记的,改变能改变的
医疗机器人进行医疗诊断,智能家居设备监控我们的行动,安全机器人通过视频摄像机和热成像进行巡逻。面对这些海量存储的数据,决定一个机器人什么时候应该忘记,是一个深刻的人类挑战。
但是如果成功了呢?
前面我们提到了,因为过度拟合的存在,让AI在对未来做出逻辑判断时可能会出现失真的问题。如果我们把“遗忘”这把钥匙交给了人工智能,让他们通过合理的选择性遗忘,走出了过度拟合可能存在的问题。那么,我们拥有一个“百科全书”式的AI时,它(或者应该是他)能通过各种被记忆与遗忘提纯的数据,对未来进行精准的预测吗?
这是人们一直在期待的图景,也是我们隐隐害怕的图景。
阿西莫夫有一篇短篇科幻小说,叫做《最后的问题》。书中的“超脑”在一代一代的开发之后,就有了这样解答问题的能力。如果能够将这样的人工智能制造出来,并且处于完全的控制之下,对于人类社会来说可能都是一场意义非凡的飞跃。
忘记该忘记的,改变能改变的,刈除杂草,才有新生,此之谓也。
2篇资讯
每日科技前瞻
这个人很懒,还没有个人签名。
最近资讯
- 人工智能,也应该学会遗忘
- 当科技遇见体育:新体育,以科技之名
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
钛粉02992 赞赏了
什么才是真正安全的“辅助自动驾驶”?
昨天 -
宗旭 赞赏了
与华为分手、且长期亏损,AI芯片撑不起寒武纪千亿市...
约4天以前 -
subey 赞赏了
抑郁症患者:深渊之中的自救
2021-08-13 23:55 -
hriyWn 赞赏了
5G时代系列谈:(四)应用之囿
2021-08-09 21:01 -
subey 赞赏了
互联网精神,不止崩于酒局
2021-08-09 08:42 -
钛粉49477 赞赏了
“中国需要什么样的资本”——一位投资人的反思
2021-08-06 09:50 -
hB9jMz 赞赏了
一个SaaS和物联网的新物种实践(下)
2021-08-03 10:51 -
钛粉54886 赞赏了
转型内容平台,迷你创想如何激励用户内容创作?
2021-08-01 12:50 -
钛粉07496 赞赏了
艺术家尹朝阳:NFT是一种新的交流方式,它可能代表...
2021-07-30 21:35 -
钛粉47967 赞赏了
安防厂商竞争加剧:华为份额不断提升,海康威视地位将...
2021-07-25 18:58 -
钛粉11165 赞赏了
教育「双减」政策正解,都在教育部「答记者问」里了
2021-07-25 12:43 -
钛粉26647 赞赏了
拿什么来拯救低迷的暑期档?
2021-07-22 20:43 -
钛粉55081 赞赏了
柴米油盐之上的柯文思 | 钛度专访
2021-07-22 17:09 -
钛a61422 赞赏了
云计算的牌局上,出局的巨头们不愿退场
2021-07-18 19:32 -
钛粉82019 赞赏了
致命的宠物托运
2021-07-16 10:56 -
钛粉30083 赞赏了
夫妻店,做汽车配件批发,能不能上云?
2021-07-13 09:58 -
钛粉13874 赞赏了
“深喉”发声,复盘社区团购死亡之路
2021-07-09 16:50 -
钛粉91954 赞赏了
“深喉”发声,复盘社区团购死亡之路
2021-07-09 16:46 -
hYrSeb 赞赏了
谁说电脑已死?
2021-07-01 18:18 -
subey 赞赏了
90后女程序员:身在大厂,心系创业
2021-06-11 13:24 -
钛粉27544 赞赏了
鸿蒙成败,在于生态
2021-06-08 17:41 -
钛粉22420 赞赏了
涿州楼盘停工下,被“不交房”拖住的生活 | 钛媒体...
2021-05-11 21:08 -
钛粉71674 赞赏了
台积电南京扩产惹争议:28纳米芯片制造“黄金线”之...
2021-05-11 16:16 -
钛粉25859 赞赏了
360被曝入局造车,周鸿祎看重了智能汽车哪块蛋糕?
2021-04-28 13:32 -
钛粉15018 赞赏了
新消费品牌如何“爆款中国”?
2021-04-26 12:08 -
钛粉46336 赞赏了
万字深扒“极端女拳”组织,谁在互联网上“引战”?
2021-04-26 01:00 -
钛粉65387 赞赏了
马云投资和自产的媒体,究竟在阿里生态中扮演着何种角...
2021-04-23 20:57 -
钛粉46198 赞赏了
万字深扒“极端女拳”组织,谁在互联网上“引战”?
2021-04-22 17:36 -
钛粉46653 赞赏了
万字深扒“极端女拳”组织,谁在互联网上“引战”?
2021-04-22 09:16 -
乔邦主 赞赏了
“异常流量”是互联网广告行业顽疾?秒针认为智能技术...
2021-04-16 21:10 -
钛粉54090 赞赏了
涨价拯救腾讯视频?
2021-04-11 20:53 -
钛粉38514 赞赏了
k12公司学霸君被传“倒闭”,创始人回应:在继续努...
2021-04-03 15:51 -
钛粉80481 赞赏了
女仆桌游馆:兼职半年,她陪伴过300多个孤独的人 ...
2021-04-03 07:49 -
钛粉38730 赞赏了
教育创业还有什么机会?
2021-03-29 14:21 -
钛粉38440 赞赏了
“超级App工厂”:教育赛道探索,进度如何?
2021-03-29 14:19 -
钛粉38714 赞赏了
k12公司学霸君被传“倒闭”,创始人回应:在继续努...
2021-03-29 14:17 -
hSmXxU 赞赏了
如果格局决定了人生,那到底什么决定了格局?
2021-03-26 12:02 -
钛粉03456 赞赏了
荣耀何时可以铸就属于自己的荣耀?
2021-03-26 10:25 -
钛粉92228 赞赏了
房产行业巨变后走向何方?居理买房网认为“深度导购”...
2021-03-18 16:58 -
钛粉36095 赞赏了
日均工作20小时、放弃未婚夫,那些逆流创业的女人们
2021-03-08 11:58 -
钛粉74059 赞赏了
孤独陈睿,放弃仪式抵抗
2021-02-25 00:16 -
钛粉35141 赞赏了
马云和他的三个“赌王”朋友
2021-02-22 13:09 -
钛粉12618 赞赏了
中国认知智能行业报告
2021-02-19 14:10 -
钛粉05059 赞赏了
陆奇万字演讲:中国经济形态与东南亚相似,创业创新易...
2021-02-09 11:08 -
钛粉69389 赞赏了
视频号是微信小游戏弯道超车的大好机会
2021-02-07 13:58 -
钛粉67426 赞赏了
我在抖音生产主播,投入一个亿,只挣两百万
2021-02-07 03:18 -
钛粉45533 赞赏了
在虚拟影院边看电影边社交是种怎样的体验?
2021-02-04 12:44 -
钛粉80055 赞赏了
能睡眠遮噪还能听音乐,1MORE ComfoBud...
2021-01-30 02:56 -
钛aB1IyM 赞赏了
“俗”人李子柒
2021-01-27 22:21 -
钛粉65171 赞赏了
敬“墨茶”一篮草莓,希望他在远方没有病痛和穷苦
2021-01-24 10:14 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
Oh! no
您是否确认要删除该条评论吗?
猜你喜欢
分享文章