Netflix:大数据对影视创作影响力巨大 互联网TMT数据 | 中文互联网数据研究资讯中心
许多Netflix的订阅用户也许都有这样的感受,他们在几个星期以前的某个星期五打开Netflix设备,恰巧看到Netflix推荐栏目上推荐了一档名为“女子监狱”的电视剧,并点击开始观看第一集剧情,然后纳闷着怎么从未听说过这部剧的名字。我们都知道,Netflix的其他原创节目,包括电视剧“纸牌屋”和“发展受阻”,都曾获得过巨大的市场效益,但与“女子监狱”相比,这些剧所取得的成功则显得有些逊色。
“女子监狱”为何会如此成功呢?其答案和其他许多问题的答案如出一辙,那就是数据。Netflix不需要花费数百万美元宣传新节目并引导用户转台收看,因为它深知用户会参考其推荐栏目并尝试观看这些推荐的新剧,它也知道用户一定会喜欢这部新播电视剧。据该公司在周一召开的盈余电话会议透露,与Netflix之前播出的电视剧相比,在剧集播出的第一周内,“女子监狱”的收视率更高,而且该片的整体播放时间也更长。
当然,一部剧的成功,如女子监狱,并非完全依赖于数据,它必须有一个好剧本和一流的演技,此外,该剧根据回忆录而改编,而非普通电视概念的演绎结果。但不可否认的是,数据也的的确确帮助Netflix分析对这部剧感冒的观众群体以及剧情的演绎方式等。可以说,随着数字电视的发展,电视行业本身必须获得转型,其应该更像是一个网页,不仅可以分析访问者的行为,而且还可以通过数据了解页面布局或用户体验带来的细微变化。当然剧情内容是王道,但若要适应观众的口味从而获得成功,任何一个细小的因素都是极为重要的。
在被问到哪类观众喜爱观看何种节目时,Neflix高管的回答可谓含糊其辞。不过,我们只要通过查看该公司引以为豪的节目推荐系统背后的数据分析,即可了解一二。根据该公司的一位前数据分析师在去年 Hadoop 峰会上的演示,我们可以看到Netflix的追踪数据如下:
订阅用户超过2.5千万
每天播放次数约3千万(该数据包括用户每次快退、快进和暂停视频的次数)
仅2011年最后三个月,流媒体视频观看时间已超过20亿小时
每天收视量约400万
每天搜索量约300万次
地理位置数据
设备信息
观看的日期和星期(目前的分析表明,电视剧在工作日较受欢迎,而电影在周末则获得更多人观看)
来自第三方的元数据,如尼尔森
来自 Facebook 和 Twitter 的社交媒体数据
此外:
“Netflix数据应用的一个最有趣的方面可能在于其对电影本身的尝试分析。Netflix现在已经可以捕捉JPEG图像并记录视频字幕开始滚动的确切时间,此外Netflix正在计划准备扩大对影片其他方面因素的分析,如音量、颜色和场景等可以反映观众喜好的视频特征。”
我们并不了解在剧情内容创作中数据的影响力到底有多大,但其应该都是一种数据采集类型,也是与用户快进和倒带动作相关的因素。这些数据可以反映出的内容远比传统元数据能够折射的内容要来的多,而且传统元数据一般是在决定要推出一档节目时才会被列入考虑范围,对此,纽约时报媒体记者David Carr在今年四月发表了一篇文章中并做了详细的阐述(其引用了以上数 据点 作为Netflix对数据关注的案例)。当然这种数据采集和Epagogix的数据分析模式也不相同,Epagogix采用人为分析和算法的方式来预测电影剧本的票房收入。
可以说,要搞清楚观众喜爱看的节目类型,似乎是一件非常容易的事情。例如,从Netflix和“女子监狱”的案例,我们可以几乎就可以看到预测模型的结果,这些预测模型对高收视率节目,如监狱风云、火线、黑道家族、护士贝蒂、嗜血判官、单身毒妈等剧进行了深度的分析。对此,我们也可以从系列剧、监狱剧、犯罪剧、黑色幽默剧、女主剧等剧集找寻数据分析的影子。
但是过分依赖数据是否会导致剧情内容的单调和公式化?对此大众的说法不一。在预测飞机引擎何时会失效,或判断一封电邮是否是 垃圾邮件 时,内容流程的重复并无问题,但如果是谈到原创和创新,内容的重复则显得黯然失色。例如说,推出黑色幽默类的监狱剧应该不会惨遭失败,但要红透半边天却不太可能。
当然,我们不要小看这些数据,他们也许是最后剧集成功与否的重要因素。想想平时我们是如何与 互联网 或移动设备上的内容进行交互的。例如,如果对一个话题或帖子感兴趣,我们会点击这个话题或帖子的标题进行阅读,但如果该篇文章的前400字内容都在吹嘘无关紧要的事情而远离重点的话,或者其页面设计很烂抑或是被大量广告轰炸,那么我们肯定会选择直接退出。如果是受到页面广告的影响,相信读者很有可能会离开并且不再返回,因为除此之外,受众还可以在其他许多地方查找其想要阅读的信息。
无论是Netflix、DirecTV还是有线电视,只要提供电视播放,对这些数据分析都是一样的。某个时刻,我们可以假设导演也必须开始思考以何种方式显示片头字幕。在节目播放的时候,有没有哪些因素会让观众决定暂停观看或彻底放弃?我们是否应该避免某些因素防止观众在观看节目中作出快进动作?我们是否应该增加哪些内容使得观众愿意倒退重新观看?(题外话:女子监狱的确是一档好剧,但另一方面该剧到处充斥着性爱和赤裸画面。)
当然,我们现在讨论的还是 大数据 ,大数据可以帮助你的节目获得成功,例如你可以讲述一位雅皮士足球父亲作为一名生态恐怖分子而充满神秘和冒险的一生,相信这类节目将比别的节目更有趣更有看头的多。