追光动画袁野:基于数据的自动化和智能化使动画创作有效降低成本
追光动画联合创始人、产品技术负责人袁野
钛媒体:科技和动画影视的结合会产生什么样的变量?追光动画技术总监袁野给出的答案是,基于数据驱动的自动化和智能化可以为动画创作团队更好的降低成本。
12月11日下午,追光动画技术总监袁野在2015钛媒体T-EDGE峰会上发表演讲。他表示,在其最新发布的《小门神》30秒预告片中,所有的画面和传统的电影拍摄不一样,这是电脑一桢计算算出来的。从传统意义而言,每天每个动画师只能完成1秒的制作量。
然而基于大数据的驱动,追光动画可以积累每天的巨大的数据量,通过对这些数据精确的一些分析和研究,然后把它用到整个制作系统里面去,去发现一些重复性的、不需要人工参与的环节,并用自动化的操作来代替人工操作,并使得机器具有自动学习的能力,从而使系统更加智能化,降低人员成本。
袁野以动画制作当中的“毛发系统”和“绑定系统”为例进行了详解,他表示,在毛发制作环节中引入机器学习系统后,整个片子里差不多10%的毛发镜头全部是机器自动完成的,不需要人工参与。而绑定系统和现在最流行的玛雅比较起来,基本上可以达到它5—6倍的效率。
此外,袁野在现场还透露了追光在VR动画电影上的制作方法。他表示,在VR 电影中,由于这种VR内容带来的这种本身的沉浸感,他会改变大家的一种观影习惯,而这种观影习惯的改变一定会带来原来传统的电影的一些叙事语言和镜头语言叙事方式,因此必须为VR的内容重新设计一些属于VR的这种镜头语言。
“一些简单的数字也可以看到一些差别,一般现在的电影平均的一个镜头长度是3—5秒,但是在我们VR短片里面大量的使用长镜头,全篇5分多钟只有5个镜头,最长一个镜头长度是112秒。因为他的难度很大,所以我们一边在开发整套的系统,一边再去进行制作。”袁野表示,这使得我们最终一遍画面制作过程中可能还要耗费更多的时间,才完成这部片子。
以下为袁野在2015钛媒体T-EDGE峰会上的演讲全文,经钛媒体编辑:
在最新的《小门神》30秒预告片中,30秒差不多每秒24桢,所有的画面和传统的电影拍摄不一样,这是电脑一桢计算算出来的,后面为了完成复杂的动画电影的制作,我们为它打造了一个非常先进的动画制作系统,和传统的动画制作系统有相同的地方,也有不同的地方,而相同的地方就是我们也是基于这种目前世界上最先进的这种动画制作软件去做的开发。
针对他们的一些不足,比如在绑定系统和毛发系统,我们发现现在就算是世界上最好的软件也不能满足我们的需求,所以我们这两块集中精力都开发了自己的绑定系统和毛发系统,其中绑定系统和现在最流行的玛雅比较起来,基本上可以达到它5—6倍的效率,所以对于一个动画师来讲,他就可以在实时的状态下调动画,这些都是传统的3维动画公司都会去做的,包括皮克斯,迪斯尼都会去做。
从自动化到智能化,人力用在点子上
除此之外,我们既然强调我们互联网基因,所以我们是把很多这种科技界的最前沿的技术也引入到动画制作过程中,我们这套技术系统的核心是基于数据驱动的自动化和智能化的一套系统。
现在大家都在强调数据驱动,在整个动画制作过程中,我们差不多《小门神》一共有10万个版本,大概有每天每个动画师只能完成1秒的制作量,每天的数据量是巨大的,我们基于对这些数据精确的一些分析和研究,然后把它用到我们的整个制作系统里面去,去发现这些问题,把一些在我们看来是一些重复性的,不需要太多人员参与的这种环节我们把它抽出来,用自动化的操作来代替人工操作,在自动化的基础上,我们还把机器学习这个技术也放到我们的系统中来,对于一些人可以去学习人的一些操作习惯,再让我们的系统更加智能化。
比如说在我们的毛发制作环节,在我们机器学习系统引入之后,我们可以看到,整个片子里差不多10%的毛发镜头全部是机器自动完成的,没有人去参与的,同时我们也会对把云计算和群集的智能管理放在我们系统中来,追光动画本地差不多有七八百台渲染节点,云端高峰的时候调动两千台左右的节点,全部的任务管理和运行都是自动完成的,我们的CPU和整个机器的使用效率在整个片子两年的制作时间里基本上可以达到95%以上的效率。
正是因为有了这些强大的技术支持,所以我们的艺术人员才能够专注于精益求精,精确的打磨每一个细节,在这种情况下,我们是用差不多行业内比较领先的公司,像迪斯尼,皮克斯这种他们1/3的人员,1/10的成本以及更少的制作周期之内,我们完成了一个同等品质的动画电影作品。
VR动画《再见,表情》是怎样讲故事的
其实第三支短片我们要在本月26号发布的这支短片是全CG制作的故事性的VR短片,这也是国内第一支这种类型的短片叫《再见,表情》,我们在制作的过程中就发现,他不论在技术和在艺术上,都有很多的地方需要我们去探索的,比如说从制作量上来讲,大家会看到,他基本上同传统电影相比他的工作量是成倍增加的,不论是计算量还是制作工作量都很巨大,同时由于这种VR内容带来的这种本身的沉浸感,他会改变大家的一种观影习惯,而这种观影习惯的改变一定会带来原来传统的电影的一些叙事语言和镜头语言叙事方式。
在VR上基本上不可用了,我们必须为VR的内容重新设计一些属于VR的这种镜头语言,一些简单的数字也可以看到一些差别,一般现在的电影平均的一个镜头长度是3—5秒,但是在我们VR短片里面大量的使用长镜头,全篇5分多钟只有5个镜头,最长一个镜头长度是112秒。因为他的难度很大,所以我们一边在开发整套的系统,一边再去进行制作,差不多是花费了10个月的时间,大概追光动画有50余个制作人员参与,一共动画有193个版本,大概调动了300万和小时的渲染时间,这是我们最终一遍画面制作过程中可能还要耗费更多的时间,才完成这部片子。
其实不管是实拍的VR内容还是CG制作的VR内容也好,都是处于刚刚起步阶段,技术上都非常欠缺,我们落在CG制作VR内容上来看基本上没有一个流程可以支撑现在的VR内容制作,为了这些东西我们重新开发了在立体平面显示器上也可以接入奥克拉斯这种设备,让动画师调动画的时候直接在奥克拉斯全景预览调出来动画,因为制作量非常巨大,所以我们针对资产的精度和渲染的深度信息优化我们做了大量的研发工作,也重新开发了一个全新的针对全景VR内容的渲染器。
VR里面讲故事还有一个很有意思的特点,当你戴上VR眼镜以后,你一定想跟周围的事物有一个互动,但是我们又不想让他去破坏我们故事的节奏和引导观众观看的过程,为了这个需求我们还独立开发了一个单独的一个带有一定互动性的播放器,基于这种互动播放器去播放出来的视频,它可以做到对于人的这种声音的引导,一些简单的交互,也是为了更好的去进行讲故事。
在VR里面其实大家现在大家谈得比较多的一点就是眩晕感,不管怎么样,有很多非常好的这种影视作品,如果直接用VR把它翻译成VR作品的话,带来的直接感受就是一戴上就晕,可能大家看两分钟都不止,20秒就不看了,为了解决这个问题,我们不断尝试,也总结了一些经验。
首先是摄像机方面,原来传统电影里用到的一些物理位置的移动,这些东西,包括这些镜头的角度旋转,在VR里面基本上都被我们放弃掉了,把这种控制权交给用户,尽量不使用传统电影里面的摄像机抖动营造手持拍摄效果,这个会产生强烈的眩晕感,拍摄的时候我们都希望说,在整个拍摄场景里尽量找到相对静止的物体,让观众观看VR影片的时候能有一个相对的参照,此外还有一些包括通过声音,光线,物体的移动,来引导观众注意力的技巧。(本文首发钛媒体,根据袁野在2015钛媒体T-EDGE峰会上的演讲全文整理)