Facebook人工智能技术可生成动态虚拟世界

百度百家 • 9年前扫码分享

Facebook人工智能研究院在今年GTC大会上展示一项新的神经网络技术，基于文本描述就能生成动态图像。比如输入"beach"，就能画出一副看起来像海滩的的画，输入“beach -clouds”，就会出现云，下一步再输入“sunset beach -clouds”，然后生成一幅有橘红色晚霞的海滩图像。

对于并不了这些概念的大众来说，神经网络就是一种模拟人类大脑的一种算法。Facebook将某些词语和图像的关联关系进行大量的训练，训练过程可能需要输入上百万幅图像。神经网络一旦训练成功，返回结果就非常迅速。Facebook 的人工智能最大的突破在于通过文本输入可以组合不同的图像，不仅能识别图像的个别元素，还能动态删除或更换这些要素，比如上面说的云或者晚霞。因此，该技术可能引入自然语言用户界面，即用户用语音描述自己想要的图像。

该人工智能系统目前是使用2D将图像呈现出来，然而3D渲染或许更有价值。在虚拟现实“metaverse ”世界，使用文本或语音就能渲染出想要的3D场景，或许并不遥远。此前科技媒体YOTOVR报道，谷歌下属的人工智能公司DeepMind正在研发一种可以玩3D游戏的神经网络系统。

就目前而言，直接渲染3D对象还存在一些技术方面的障碍：第一，系统需要被训练识别3D对象，而不仅仅2D对象，这需要计算机视觉和3D计算方面的技术突破。第二，现在互联网上还没有足够多的3D数字资产用以训练3D神经网络。要解决这个问题，需要研发人员找到一种识别2D和3D组合对象的方法，另一方面随着VR/AR的普及，互联网上3D数字资产数量会爆发式增加。

在不远的将来，VR和人工智能技术相结合，你只需要语音描述一下就能创作出自己的虚拟世界。