当AI遇见艺术，又会碰擦出什么样的火花？

猎云网 • 7年前扫码分享

20世纪90年代中期，道格拉斯·埃克曾在Albuquerque担任数据库程序员，同时也兼职做做音乐。在能源部旗下的实验室忙完一天的编程工作后，他会在本地的小酒吧唱上一曲他自称的“受朋克影响的蓝草音乐”。但是，他真正想做的事情是将他白天和晚上的工作结合起来，创建一个可以制作他们自己歌曲的机器。“我这一生唯一的目标就是将AI和音乐结合在一起，”埃克说。

这是个看似天真的野望。埃克从小在离布卢明顿不远的小镇长大，后来又在布卢明顿的印第安纳大学攻读硕士学位。在这期间，他向道格拉斯·霍夫斯塔特诉说了自己的想法。霍夫斯塔特是一位认知科学家，他曾写过一本关于思维和机器的书，获得过普利策奖。但是，霍夫斯塔特给埃克泼了一盆冷水，坚持认为，即便是时下最新的人工智能技术依然处于发展的早期。但是，在接下来的20年里，混迹于学术界的边缘，埃克始终未曾放弃过这个念头。最终，AI的发展赶上了他的野心。

去年春天，在谷歌进行了几年的研究工作后，埃克又提出了与多年前向霍夫斯塔特提出的类似想法。这一次，他的想法促使了Project Magenta的成立——这是一个由专门研究如何教导机器创造他们自己的音乐，以及其他各种艺术形式（包括素描、视频和笑话）的谷歌研究人员组成的团队。凭借智能手机、应用和互联网服务构筑的帝国，谷歌已然涉足通讯业务，并且埃克认为Magenta是谷歌通讯业务的一个自然延伸。

“我们的工作本质上是在为人类创造新的沟通方式，”埃克在采访中说道。

越来越多的研究旨在利用最近刚刚成熟的一系列AI技术来生成艺术，而埃克的项目只是其中的一部分。这些被称为深度神经网络的复杂数学系统可以让机器用过分析大量数据来学习具体的行为。比如，通过识别数百万张自行车照片中的常见模式，神经网络可以认出自行车。这也是Facebook识别在线照片中人脸的原理，是Android手机识别语音指令的原理，也是微软Skype进行语言翻译的原理。但是这些复杂系统同样也可以创造艺术。比方说，通过分析一组歌曲，他们就可以制作相似的声音。

正如埃克所言，这些系统至少正在向这一目标前进——虽然还很遥远——但总有一天，机器可以立即创作出一首新的甲壳虫乐队歌曲或者无数甲壳虫乐队的歌曲，每一首听上去都和原声带相似，却有带着点不同的味道。但这种景象——与其说创造艺术不如说是破坏艺术——并不是埃克所追求的目标。除了单纯的模仿之外，还有许多其他途径值得探索。埃克的最终愿景，不是取代艺术家，而是希望为艺术家提供全新的创作工具。

在20世纪90年代，在新墨西哥州的小酒吧里，埃克曾将Johnny Rotten和Johnny Cash的歌曲组合在一起。现在，他正在开发软件来做这相同的事情。通过使用神经网络，他和他的团队正将来自不同乐器的声音混杂在一起——比如巴松管和击弦键琴——能够发出从未有人听过的声音，从而创造出新的乐曲。

当AI遇见艺术，又会碰擦出什么样的火花？

就像神经网络可以通过分析成百上千的猫咪照片来学会识别猫咪一样，神经网络也可以通过分析无数音调来识别巴松管的音乐特征。它可以创建一个标志巴松管的数学表达式或者向量。因此，埃克和他的团队已经将各种乐器的音调输入到神经网络系统以供其学习，为每一种乐器创建向量标识。现在，只需在屏幕上移动按钮，他们就可以组合这些向量来创造新的乐器。这种新创造的乐器可能47%来自巴松管，而另外的53%来自击弦键琴。改变这些百分比，就又是另一种新乐器了。

几个世纪来，管弦乐团指挥将各种乐器的声音层叠在一起创造出恢弘的气势。但是这种新乐器则是另一回事。埃克和他的团队并不是将声音层叠起来，而是将声音组合起来，从而创造出从未存在的独特声音，为音乐家带来新的工作方式。“我们正在开发新一代电影摄像机，”埃克说，“我们也在开发新一代电音吉他。”

这个特殊项目被称为NSynth。虽然NSynth刚刚起步，但是在全球的艺术和技术领域，很多人已经开始关注用神经网络和其他AI技术开发新的艺术形式。“这种研究在过去几年里如雨后春笋般涌现，”洛杉矶摄影师兼艺术家亚当·弗里斯说，“这是一种全新的审美。”

在2015年，谷歌内部的另一组研究人员开发了一种新的工具——DeepDream，利用神经网络基于现有的摄影照片创作出令人难以置信的幻觉影响图像。这一工具在谷歌内部和外界激发了新的艺术形式。如果该工具分析一张狗狗的照片，然后发现这只狗的部分毛发看上去跟眼球有点相似，那么该工具就会增强这部分毛发，并且不断重复这个步骤，结果就是一只满身覆盖旋涡般眼珠的狗狗。

与此同时，一些艺术家——如知名的多媒体表演艺术家特雷弗·帕格伦，或是名声稍弱的亚当·弗里斯——正在以其他方式探索神经网络。今天1月份，帕格伦在旧金山的一个旧海事仓库中呈现了一场表演，通过可以跟踪我们行动方式的神经网络来探索计算机视觉的伦理。比如，当前卫派克洛诺斯四重奏的成员在舞台上表演时，神经网络可以实时分析他们的表情，猜测他们的情绪。

工具虽然是新的，但其背后的态度一如既往。纽约大学教授艾莉森·帕里什是诗歌创作软件的开发者，她指出艺术家自上世纪50年代开始就已经开始借助计算机来进行创作。“就像杰克逊·波洛克发现新的绘画方式——打开油漆罐并将其喷洒到他身下的画布上一样，”她说，“这些新的计算技术为艺术家创造了一个更广泛的调色板。”

一年前，David Ha仍是高盛集团（东京）的交易员。在午餐时间，他开始摆弄神经网络，然后将这些结果发布到化名博客上。除此之外，他还创建了一个神经网络，可以学习书写其自己的日本汉字，这些中文字符更像是画出来而不是写出来的。

很快，埃克和其他的谷歌研究员发现了这个博客。现在Ha已经是Maganta的一名研究人员。通过一个名为SketchRNN的项目，他正在构建可以进行绘画的神经网络。通过分析成千上万个由普通人创作的数字素描，这些神经网路可以学习绘画猪、卡车、船或瑜伽姿势等。它们并不是在复制人类的作品。它们可以自己进行创作，以数学方式识别画出来的猪的样子。

然后，你可以要求这些神经网络，比方说，画一只长者猫咪脑袋的猪，或者在视觉上去掉一条马腿，或画一辆看上去向狗的卡车，或者在随机的波浪线上画一艘船。与NSynth或DeepDream相比，这些看上去可能不太像是艺术家会用来创作新作品的工具。但是如果你有机会跟这些神经网络交互，你会发现它们本身就是艺术，是Ha开发的活生生的艺术作品。AI不只创造新的艺术形式，AI也创造新的艺术家。

随意打赏

什么样的火花擦出火花