七牛云储存李靖:究竟怎么才能将数据玩转,回到场景?
9月23日,亿欧网在北京万达索菲特酒店举办 2015年中国O2O创业创新大会 ,本届“2015年中国O2O创业创新大会”,邀请到百度、京东、赶集网、大众点评、饿了么、河狸家等最具代表性O2O企业的22位大佬做主题演讲,高榕资本、经纬中国、钟鼎创投、君联资本、德同资本、蓝驰创投、真顺资本、熊猫资本等9家著名投资机构合伙人,以及包括餐饮、生鲜、体育运动、医疗健康、B2B和汽车等6大领域24个精选项目参会。
以下为李靖的现场演讲实录整理(有删减)
李婧:今天我选了一个很酷的话题讲体育,我本身不是一个很强的体育爱好者。我们是从云的角度去看体育,看互联网+体育,看自媒体+互联网体育的发展。先看来几组数据,我们跟IDC联合出的白皮书里面提到,在2020年全球的数据存储的规模我们会达到44.1ZB,我们现在一个文件,一个照片达到大概1点几兆,兆离Z差的很远。 在2020年全球存储规模将达44.1ZB 。其中图片、音频、视频的数据2020年全球是34.5ZB。也就是说,这样的多媒体、自媒体的数据占全球的90%。在2020年,中国的数据占五分之一, 从中国智能手机发展可以看到,智能硬件的发展也是非常快的 。
互联网时代三大特性:第一是服务在线化的,第二,流媒体增多,第三智能化。
体育有几组数据,2013年体育产业市场估值1.2万亿,体育是一个非常大的市场,占全国GDP0.63%,看PC端的发展,覆盖人数超过2.7亿。七牛从去年开始,平台上产生大量的体育、互联网产品。对于原有媒体,之前的咨询走直播的路线,以后将会往更宽的方向去走,目前受众很多,已经有一定的用户基础。体育社交是基于某项健身或者垂直类活动的体育社交。 现在很流行的三件套:打卡、社交、分享。 除此之外,还有在线教练,形式是体育跟在线教育去配合,这一类平台上也有不少。 体育用品是一种电商变形,关键是把线上线下链条打通 。我们看到了一系列的可穿戴设备,像手环跟体育也有密不可分的关系,我们平台也有体育票的产品。对于单项体育应用,我们认为这种垂直类的体育互联网产品在增多,像舞蹈类、高尔夫球类、高拍、足球。我们认为在 互联网时代三大特性:第一是服务在线化的,第二,流媒体增多,第三智能化。
我强调一下流媒体的方式,体育这个产业跟流媒体的结合是相当密切的。 体育是动作型的,它表现出来需要在互联网在线化的时候,沉淀下来的是最自然的交互原呈现的数据 。呈现的数据是什么?是图片,是音频,是视频,我们称之为非结构化数据。所以当我们做体育类、互联网产品的时候,这种商业模式从业务的层面结构呈现交互,交互下面呈现非结构化的数据。 随着网络的发展,视频、音频会走向一个趋势,流媒体的技术在体育类的产品里面一定起到一个非常重要的作用 。
健 身类的产品在迅速增长
去谈体育富媒体化,我们来看健身类,在运动社交类作为普遍增长速度比较快的一款互联网产品。我们看到平台上很多的产品已经表现出来每个月富媒体访问量呈倍数增长,这说明目前的时代,对健身的要求是越来越重要,做这个PPT的时候,留心了一下身边朋友并没有考虑到健身的APP, 现在他们都在做打卡,聚圈子去跑步,一起健身,约教练这种,这是运动社交,然而,健身类的产品在迅速增长。
我们再看体育教育和在线的应用,他们对于视频的存储和直播需求更强烈,我们前面提到直播类的产品,现场直播和回看是对视频最基本的要求。此外,截图和剪切这个层面上,这属于视频处理的。
用户访问习惯。我并没有过度关注,首先看一周和平均一天的访问量,这里面的不同人群选择不同的体育互联网产品。有咨询类、健身类、运动社交类,也有垂直类别的。我前面提到的几种都概括到了PPT上,观察一周图片,我们可以看到图片视频,文本非结构化的访问曲线,每周并没有非常突出的时间点。也就是说,大家对体育类的关注是按单周作为一个周期观察的。其中下班后到凌晨是一个比较集中的时间段。
非结构化数据已经占到90%以上
回到体育数据的概念。体育其实是运动型的,它是人类的肢体语言,所以它在互联网沉淀下来被人们接受,那是一种自然交互语言的沉淀,我们称为非主流化数据。文本、图片、音频、视频包括大家拍的照片都是非主流化数据,在商业过程中通过交互完成对业务部分的补充。同时人们对图片、视频的访问又会产生新的用户行为,从运营角度看在线数据的沉淀,叫做日志,我们叫做日志型的数据。还有一类是用户二维表,用户信息是最普遍的数据,所占的比例越来越少,我们叫结构化的数据。以上三类,我们去分析全球数据的比例的时候,我们看到 非结构化数据已经占到90%以上 。也就是说非结构化对半结构化数据的挖掘和应用,决定你这个商业未来的发展。
气象数据与体育,有着密不可分的关系,反映在现实生活中实天气不好不跑步,反映在网络世界,虚拟世界用户利用它来做什么呢?七牛有一个客户,我们跟他联合开发他们所有的气象数据,通过气象数据跟其它的行业做融合,产生更多应用,比如跟保险行业去合作,数据显示去年降水与淹车的数量关系, 可以帮助保险公司在同类降雨,预警下做出预防和预告 。
运动类产品怎么应用?根据气象数据开发自己的API,通过调研这些接口,比如说过去在这个天气情况下有多少人参加了比赛。同时针对两类不同数据的融合产生对未来行为产生判断。其实昨天在来北京之前,我去了上海交大,七牛跟它联合大赛,将全部交通数据的开放。在我看来越来越多不同的行业数据融合在一起,有企业贡献的,有国家开放的,国家现在把越来越多的数据开放给企业。国家和企业数据融合在一起,使得我们越来越多第三方的服务基于这些数据去开发,帮助互联网企业提供更多的数据分析服务。
究竟怎么才能将数据玩转,回到场景?
其实讲了很多数据的融合案例。 究竟怎么才能将数据玩转,回到场景? 从技术的场景或者是从真正产品模式的场景分类并不多,并不像商业模式分的那么细。PDC由编辑产生内容,达人产生内容的,或者现场产生内容的,或者数据的角度产生数据,以上三种,由信息流、流媒体推送到PC端,进一步的结果促进运营,使得一站式的服务线上线下的数据打通。那么针对三种数据的产生的场景,一站式的数据应该包含什么呢?首先是数据的集中,先把数据集中起来对它进行分析,对它进行处理,也就是所谓的存储。然后我们要针对不同的数据,相应的算法,对数据进行处理。比如图象识别,再直播类最精彩的剪辑、切片。云的识别也会用到大数据的分析,作为一站式服务数据处理的一部分。 最终这些数据处理的结果,还是二次的数据分发给终端用户,都是一站式的数据服务。
七牛在这里面所做得是什么?我们其实基于数据,为客户提供一站式的服务 。我刚才提到环型的数据理念,举个例子,下面大熊是我们的客户,燃是我们比较早的合作伙伴,它用的七牛的服务解决大量的图片、存储、对图片的处理、以及图片一个分发,这里面未来回产生更多的应用,把气象数据整合起来,把交通数据整合起来,不同行业的数据在这里面能够产生更多的好玩的想法。
非结构化数据,对它的利用是决定这个商业是否成功关键性的因素
我没有列的体育类的客户,类似大江跟体育就有很大的关系,大江在做视频的社区,打造自己的生态,存储就是用我们七牛。最后说一下简单说七牛,七牛2011年成立的,我们目前已经有28万用户了。积累的非结构化的文件数据是1600亿,每天的访问次数应该达到750亿左右。我们覆盖了终端网3.7亿,占全国网民的大概50%,前面提到的步步高、大江、OPPO都是我们的客户,很多体育类的客户,像虎扑都是七牛的客户。再说一下七牛的数据理念,前段时间在上海开一个大会讲数据如何重构未来,在会中, 我们看到数据对企业越来越重要,通过那个大会得出一个结论。尤其非结构化数据,对它的利用是决定这个商业是否成功关键性的因素。 那么怎么利用它呢?,首先积累它,其次分析它,得到它的结果,用它的结果作用在你的运营中,进一步迭代和发展。这就是我的全部发言内容,谢谢。