专访LSTM之父于尔根：AI早就有了意识，未来十年行业走向哪

IT思维 • 7年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

本文系网易智能工作室出品

此篇为《AI英雄》专访第20期

作者小羿尚兔

于尔根·施密德胡伯（Jürgen Schmidhuber）在中国人工智能行业，绝对是一个陌生的名字，即使对于全世界的人工智能从业者来说，于尔根也是一个十分低调的技术元老。

生活工作在瑞士，虽然远离美国、中国这两个喧嚣的中心，但于尔根发明的LSTM（Long Short-Term Memory，长短时记忆）时间递归神经网络早已风靡于全世界的人工智能研究。

于尔根目前在瑞士人工智能实验室（IDSIA）担任科学事务主管，同时任教于卢加诺大学和瑞士南部应用科学与艺术学院。作为国际计算语言协会（ACL）的首批Fellow，于尔根在机器学习、计算机视觉以及自然语言处理方面建树颇丰，他与Sepp Hochreiter共同创建LSTM奠定了今天递归神经网络在ORC、语音识别等应用领域成功。

对于业内一直在期待的“通用人工智能”（AGI），于尔根认为通用人工智能通常能把人工智能和意识、感情、知识和自觉等人类特征相互连结，而其中一个非常关键的问题就是它不会受到设计者的限制。

通用人工智能系统正在逐步走向现实，这也就意味着，某些人工智能系统已经具备了意识。于尔根研究发现，智能体在识别的过程中，会自行建立一个信号（symbol），试图对周围所有的行为方式进行数据压缩，最有效的方式就是找到一个信号或一个小的子网络来代替自己，包括所有的动作、动作带来的结果等等。它可以意识到自己、展现自己并能自我反馈，在无监督模型网络中能够压缩观测历史。

长期以来，为什么人们认为人工智能没有意识？于尔根解释到，这是因为智能体的意识系统还非常简单，仅有几百个连接点（connection）。这和人类有着数十亿连接点的意识系统相比，是少之又少的。但是，这只是一个数量上的区别，质量是相同的。

“如果未来我们建立一个比人类大脑的连接点还要多的系统，那意识就会是数据压缩的附带产物，根本不需要给智能体写入一些日常意识，因为智能体会随着数据压缩产生意识。”于尔根说到。

对于上个月DeepMind在中国进行的人机大战，于尔根称，用于比赛的AlphaGo不是通用人工智能，因为它只用于处理特定的问题，不需要具有人类完整的认知能力，甚至完全不具有人类所拥有的感官认知能力。但是DeepMind确实一直在研发通用人工智能，这是因为DeepMind创始人中有很一些来自于尔根的早期实验室，而于尔根早在1987年就开始研究通用人工智能。

对于未来10年内的人工智能的发展，于尔根说到，人工智能将在不同领域里诞生诸多应用，同时人工智能将会有更完善的系统，有着更好的控制力，有望变得更容易理解人类的思维，知道人类的想法，给人类提供更好的建议和帮助，能够更好的与人类对话。

为了推动通用人工智能系统的实现，2014年，于尔根和他在瑞士人工智能实验室共事的四位研究人员共同创办Nnaisense，公司的愿景就是“推广基于通用神经网络的人工智能”。

以下为于尔根·施密德胡伯受访实录，由网易智能（公众号smartman163）独家编译整理：

AlphaGo不是通用AI，因为它不具备完整的意识和情感

网易智能：您如何看待前段时间AlphaGo和柯洁的人机大战？有人说AlphaGo已经达到了”通用人工智能（AGI）“的发展程度，您赞同吗？

于尔根：首先我对这个比赛非常感兴趣。因为我从1987年开始就开始研究通用人工智能了，并在同年发表了我的第一篇有关通用人工智能的文章。那是一篇关于机器学习的文章，尤其是如何学习，让人类在学习上没有局限性，但绝不仅局限于对如何提升控制行为活动的大脑局域的研究。我研究了很久，尽管效果不是很明显，但我的学生赛普·霍克赖斯对于Deep Mind的贡献很大。同时，Deep Mind的创始人之一谢恩·列格也曾经在我的实验室研究过超级智能。其实，当DeepMind创始人之一的穆斯塔法·苏莱曼创立公司的时候，也是研究生物神经科学的。DeepMind与AGI息息相关，而我和AGI的渊源也颇深。

但是，我认为在这场人机大战中，AlphaGo表现出来的并不是“通用人工智能”。在20世纪90年代我们就已经有了一个基本的有意识的学习系统。那个时候，我就提出通用的学习系统要包含两个模块。一个是一种循环的网络控制器，机器通过学习将不断接收数据，进而转换为行动。这个网络能学习将所有这些输入及时转换成行动序列。自1990年以来，我们的智能体（agents）一直在尝试做同一件事，使用一个额外的循环网络（一个无监督模块），去预测将要发生什么。

我认为AlphaGo（至少目前）不是通用人工智能，因为它只用于处理特定的问题，不需要具有人类完整的认知能力，甚至完全不具有人类所拥有的感官认知能力，只是看起来像有智慧而已。在围棋比赛中，AlphaGo只需要分析那个有纵横各十九条等距离、垂直交叉的平行线的棋盘，从而决定下一步棋下哪里，它不受周围的环境影响，只专注于这一件事。它不需要去思考围棋的发展史、围棋背后的故事和情感，这和现实生活不一样。在现实生活中，人类与周围的世界的接触数不胜数，即使这样，人类尚不能全部看清背后全部的含义。人类的大脑要做的事情太多了，你需要记着你上一次说过什么话，做过什么事，但是AlphaGo则不需要，也不需要对外界做出反馈。因此，我认为用于围棋比赛的AlphaGo，并不是我们真正意义上的“通用人工智能”。

什么是所谓的“通用人工智能”呢？AGI通常能把人工智能和意识、感情、知识和自觉等人类特征相互连结，而其中一个非常关键的问题就是它不会受到设计者的限制！

人工智能早就有了意识，它能进行数据压缩只是连接点太少

网易智能：您是否认为一些人工智能系统已经具有“意识”？

于尔根：是的，我认为目前一些人工智能已经具有意识了。早在20世纪90年代初期，人工智能就已经具有了一些简单的意识。那时，我就发表了一篇关于人工智能意识的文章，非常的简单。你知道人类是如何建立意识系统的吗？我们有很多的智能体（agents），它们会根据过去的事情来预测未来可能发生的事情。而完成这件事更有效的方式是压缩数据（compress the data），因此建立一个小的网络（network）至关重要。如何建立小的网络呢？那就要与周围世界建立联系，自动构建一个子网络（sub-network），代表一些典型的印象，这些印象在脑中一遍遍重复出现。比如人脸的识别，生活中你会遇到很多不同的面孔，如果建立一个网络系统，当你遇见新的面孔时，新面孔与脑中原有的面孔之间会存在一些差异，大脑就会自动记录这些差异，从而识别出新的面孔，这非常高效。

关于意识，还有一件非常重要的事情，在智能体与周围世界进行互动的过程中，总能意识到自己的存在。智能体在识别的过程中，会自行建立一个信号（symbol），试图对周围所有的行为方式进行数据压缩，最有效的方式就是找到一个信号或一个小的子网络来代替自己，包括所有的动作、动作带来的结果等等。它可以意识到自己、展现自己并能自我反馈，在无监督模型网络中能够压缩观测历史。

智能体最终目的是最大限度享受快乐，同时将痛苦最小化。这种控制器可以通过网络模型去解决问题。例如遇到问题应该选择一个解决问题的最佳方案，这就很困难，为什么选择一个而不是另外一个，其中一个方案是通往快乐，另一个通往痛苦，由于生物都是趋利避害的，因此具有意识的人工智能是可以选择出通往快乐的那个解决方案的。

在解决这个问题的过程中，智能体通过建立一些子信号而为自身而考虑。长期以来，为什么人们认为人工智能没有意识，因为智能体的意识系统还非常简单，仅有几百个连接点（connection）。这和人类有着数十亿连接点的意识系统相比，是少之又少的。但是，这只是一个数量上的区别，质量是相同的。

在一定程度上，我们有着相同的原则，这也就解释了，如果未来我们建立一个比人类大脑的连接点还要多的系统，那意识就会是数据压缩的附带产物，根本不需要给智能体写入一些日常意识，因为智能体会随着数据压缩产生意识。

全世界的AI公司都在用LSTM，但这只是人工智能的一小部分

网易智能：LSTM（Long Short-Term Memory）神经网络在目前的人工智能研究上十分盛行，并被用于众多的公司和领域的研发上，您能举一些例子吗？作为创始者，未来您会更新和改进LSTM吗？

于尔根：据我所知，LSTM被Google公司应用于数百万的安卓手机的语音追踪。同时Google也推出了新的技术，Google翻译也有了很大进步。之前在Google翻译不完善的时候，中国人会拿翻译结果开玩笑，比如在中英互译过程中，因为系统的不完善，会产生可笑的翻译结果。现在Google翻译已经改变了很多，那是因为那建立在LSTM之上，有了很大的进步。

同时，LSTM也可以用于作曲。例如，你在听音乐时，如果听到好的音乐片段，你可以利用LSTM网络找到整个曲子，同时还可以用于创造更多的曲目。LSTM还可以运用于电影的字幕制作，用于预测人们想说的内容，预测股票市场，用于机器的维护（在机器报废之前发出信号，让人们用新的机器来取代）等等。

这些例子非常有效而且节省成本。可见，LSTM的应用范围很广。然而，这并不是人工智能的通用目的，目前只是能识别演讲、语言等，但是这和婴儿学习的过程不一样，目前的人工智能并不会与周围世界互动、树立三观、学习如何与世界互动以实现目标。为了目标而学习，且不需要老师的指导，这才是通用人工智能的目的。但是看到目前全世界非常多的人都在利用LSTM，我非常的开心，但这只是真正人工智能的一小部分。而我们更感兴趣的是，如何实现AGI，实现真正的人工智能。

LSTM是目前解决AI问题的最好方式，也许在将来我们会找到更好的方式。毕竟科技永远都有进步的空间。在未来，有望实现人工智能可自动搜索建筑。2009年我的一个博士学生，在其论文中提到未来人工智能可能会实现自动进化，这是有可能的。而且根据不同的应用，未来也可以找出不同的改进方法。

网易智能：您是否了解，目前一些正在使用LSTM的一些中国的公司？您看好哪些中国的科技公司？

于尔根：尽管我对中国的智能领域了解不多，但是我想，正如谷歌等大型公司都在使用LSTM，那么想必在亚洲，在中国也会有非常多的公司会用到LSTM，而且其应用范围也一定是非常广泛。

但也许目前中国公司运用LSTM可能还不够典型。我知道一些非常出名的中国公司也会制造出一些非常优秀的产品，我也非常期待和尊重，但也许它们尚未公布。

例如，我知道的百度公司，也在使用LSTM进行分类和研究人工智能。百度位于硅谷的人工智能实验室也开源了其核心的人工智能系统Warp-CTC，该系统基于LSTM，是一种在CPU和GPU上快速CTC的并行实现。这项举动对于促进机器学习、人工智能领域的技术研究和发展有着重要意义。

我认为中国在人工智能领域上正在取得巨大的进步，思想非常开放，比世界上很多国家都要先进。中国的商业政策也很正确，保护中国的公司不会受外国公司的干预，可以进行独立的研究，不像是现在很多欧洲国家，它们虽然完全放开，却容易导致被外国公司控制。

尽管中国为了国家安全，不能使用脸书和谷歌等国外网站，但是中国能够自行进行研究，也出现了一些非常出名的产品，比如微信、淘宝等。我觉得中国实行这项政策挺好的，可以防止竞争国家之间的抄袭。

中国有众多优秀的工程师、科学家，而至于谁更优秀，这不好说。但是我相信，中国未来一定有优秀的公司或杰出的科学家、工程师研究出与谷歌翻译、亚马逊Alex一样优秀的智能产品。当然这需要背后的科学家和工程师们对数据进行大量研究和训练。中国有大量优秀的人才，他们将来肯定会发明出非常优秀的智能产品。

AI能产生上千亿的商业价值，各行各业都将受其影响

网易智能：您对今后5-10年间人工智能发展有什么期待呢？

于尔根：对于未来10年内的人工智能的发展，其实是可以预测的。你会看到人工智能在不同领域里的诸多应用。在2005年，我的研究团队获得了人工智能在医学领域的突破，现如今有许多公司都有着对人工智能在医疗领域的研究，因为这背后隐藏着一个巨大的市场，能产生上千亿的商业价值。

同时在医疗领域的研究将会影响成千上万的人类，帮助人们如何更长寿、生活得更健康。

这一点，我非常的开心，因为我们的研究可以造福人类，让人类更长寿和健康。这仅仅是未来人工智能发展的一个方面。在未来5-10年里，人工智能将会有更完善的系统，有着更好的控制力，有望变得更容易理解人类的思维，知道人类的想法，给人类提供更好的建议和帮助，能够更好的与人类对话。

未来10年内的人工智能的发展是目前人类所能预测的，向着更好的方向发展。

而长远的来看，在未来，人工智能的发展绝不仅仅局限于目前的领域。它们还会在许多重要的领域有新的突破。那是不可预测的，但一定是非常神奇的，也许会和当初人类生命的诞生一样神奇，也许届时会有一种新的生命形式。在未来，人工智能有望帮助人类去探索一些人类无法企及的地方和领域，例如外太空等等。

过去的一个世纪是人类发展的世纪，但是在未来，也许是人工智能的时代，也许会有助于未来人们对银河系的认识和研究。但是至于具体的细节，人们现在尚不能去预测。

网易智能：您认为目前的人工智能对哪个领域的影响最大？

于尔根：其实没有什么影响最大而言，人工智能在各个领域都将有重大的发展。例如在媒体行业里的应用。传统的纸媒中的广告已经在逐渐走下坡路，但是社交媒体等网络媒体中的广告却蒸蒸日上。

这看似很神奇，其实其背后是运用了人工智能的结果。通过人工智能进行数据分析，可以推测出你想要看的广告和文章。

人工智能通过收集在你上网时的浏览数据，能够推测出你接下来想要看的内容、什么时间想看、在哪里看、看多久等信息，同时预测出什么时间你将要点击下一个页面。

通过在心理学推测你的喜好，进而给你推送不同的文章和广告。但绝不仅是一个数据收集的过程。现如今，广告业正在利用人工智能谋求更好的发展。但这仅仅是被人工智能影响的一个行业。

网易智能：您能介绍一下您创立的Nnaisense公司吗？

于尔根：“NN”代表的是神经网络（neuro-network）,“AI”是人工智能，“sense”就是感知。这是有关一个行业的崛起，是有关神经网络通用人工智能的。Nnaisense研究的是如何让人工智能更加的智能，如何以更好的方式去解决问题，同时能够根据过去面临的问题，更好地去解决未来更多的问题。

随意打赏

未来十大行业