微软研发绘图机器人 根据文字描述画出相应图像
本文系网易智能工作室(公众号 smartman163)出品。聚焦AI,读懂下一个大时代!
【网易智能讯 1月22日消息】微软近日推出了一项新的模仿类似艺术家的人工智能技术―一个“绘图机器人”。机器人能够根据文字描述创建一个与之相对应的图像,而且它也增加了细节,这些细节甚至超越了本身而不仅仅在所对应的文字里出现的内容。“这些现象可以说明,人工智能具有自己的想象力”,一名在微软公司的工作人员说道。
“如果你在必应引擎去搜索关于一只鸟的信息,你会得到一个与鸟类相关的图片。但是在这里,图片是由计算机逐个像素地从头开始创建的,“微软公司在华盛顿州雷蒙德市微软研究实验室深度学习技术中心的首席研究员兼研究经理何晓东在微软最近的一篇公告中表示。 “这些鸟可能在现实世界中都不存在,而它们只是代表了我们研发的人工智能对鸟类想象力的一个方面的描述。”
研究人员说,机器人能够生成各种图像,包括从“普通的田园场景”,如放牧家畜,甚至包括对“浮动双层巴士”的想象图。
微软方面表示,该机器人已经在配对图像和标题的数据集上进行了培训,该培训能够使其理解如何将相应的单词与图像进行匹配。 例如,当标题上写着“鸟”时,它先学会画一只鸟,然后通过机器学习来理解鸟的图像应该是什么样的。
何晓东说:“这是我们相信机器可以学习的根本原因之一。”
绘图机器人的技术由两个机器学习模型组成,一个是从文本描述生成图像,另一个是使用文本描述来判断生成图像的真实性。 前者试图从后者获得虚拟的照片,但后者不想被愚弄。所以通过互相之间内部的“竞争”,两者结合起来便能够共同创造更高质量的图像。
它尤其擅长从更复杂的句子中绘制图像,而其他技术可能会从标有“鸟”的标题中画出一只鸟,例如,如果您要求它画一只绿色的皇冠,黄色的翅膀和红色的肚皮,那么质量就会下降。在微软研发该项技术之前,一般的结果便是生成一个模糊的“绿黄色微红的鸟”,微软的工作人员解释说。
尤其有趣的是,当没有提到具体的细节时,机器人如何填补信息空白。事实就是,基本上,由于其能够记忆训练数据,它会拥有一点自己的常识来发展想象力。在搜索鸟类的这个例子中,即使没有在文本中说明,机器人通常会画一只坐在树枝上的鸟,因为最初赋予它进行学习记忆的图像通常显示类似的东西。
根据最近的一篇研究报告,微软方面还指出,与现有技术相比,这种新型机器人生成的图像质量相较以前提升了近三倍。
当然,这不是第一个研发出来的与艺术相结合的人工智能技术。
这两者结合有时会产生出色的结果,比如Google的人工智能机器生成的图像展现了其具有艺术表现力的潜能。谷歌还有一个神经网络,可以猜测你正在绘制什么,他们还拥有一个自动绘图机器人,并定期地详细介绍它如何在帮助机器进行绘制的研究。
Facebook也一直在开发神经网络来制作飞机,汽车和动物等小图片,甚至用它从照片中创建自己的Bitmoji形象。
对于微软来说,教一个机器人根据文本来画出相对应的图像这项技术代表着它已经达到了在这个计算机视觉和自然语言处理领域所需要的技术。
这包括CaptionBot的自动写入照片字幕的开发,以及可以回答人们询问图像的问题的技术,如图中对象的位置或属性,这是对盲人有帮助的事物。
至于人工智能艺术家在现实世界中如何为人类服务,微软公司有一些想法。
这表明该机器人可以作为画家或室内设计师的素描助手,或者可以作为声控美化照片的工具来被使用。 (“Cortana,请你为我画一只鸟”,也许它能做到?)
何晓东表示,随着计算能力的增强,该技术可能会对电影动画制作有所帮助,从而减少动画师在电影后期制作所需的手工劳动量。
但该技术还没有达到我们能够用它完成所提出的要求的程度。
如果仔细观察这些图像,它们几乎都会有缺陷,我们可以很明显地看出来它们是由机器创造的,而不是人类:例如上图中的蓝喙鸟,水果和奇形怪状的香蕉图(见上文)。
然而,随着它的进3倍速度能力的提高,绘图机器人代表了人工智能发展的里程碑,微软公司相关人员说道。
(选自:TechCrunch 编译:网易智能 参与:付曾)