Facebook人工智能技术可生成动态虚拟世界
Facebook人工智能研究院在今年GTC大会上展示一项新的神经网络技术,基于文本描述就能生成动态图像。比如输入"beach",就能画出一副看起来像海滩的的画,输入“beach -clouds”,就会出现云,下一步再输入“sunset beach -clouds”,然后生成一幅有橘红色晚霞的海滩图像。
对于并不了这些概念的大众来说,神经网络就是一种模拟人类大脑的一种算法。Facebook将某些词语和图像的关联关系进行大量的训练,训练过程可能需要输入上百万幅图像。神经网络一旦训练成功,返回结果就非常迅速。Facebook 的人工智能最大的突破在于通过文本输入可以组合不同的图像,不仅能识别图像的个别元素,还能动态删除或更换这些要素,比如上面说的云或者晚霞。因此,该技术可能引入自然语言用户界面,即用户用语音描述自己想要的图像。
该人工智能系统目前是使用2D将图像呈现出来,然而3D渲染或许更有价值。在虚拟现实“metaverse ”世界,使用文本或语音就能渲染出想要的3D场景,或许并不遥远。此前科技媒体YOTOVR报道,谷歌下属的人工智能公司DeepMind正在研发一种可以玩3D游戏的神经网络系统。
就目前而言,直接渲染3D对象还存在一些技术方面的障碍:第一,系统需要被训练识别3D对象,而不仅仅2D对象,这需要计算机视觉和3D计算方面的技术突破。第二,现在互联网上还没有足够多的3D数字资产用以训练3D神经网络。要解决这个问题,需要研发人员找到一种识别2D和3D组合对象的方法,另一方面随着VR/AR的普及,互联网上3D数字资产数量会爆发式增加。
在不远的将来,VR和人工智能技术相结合,你只需要语音描述一下就能创作出自己的虚拟世界。