诸葛IO CEO 孔淼:DI平台如何帮助企业提高分析效率
7月6日下午,由36大数据联合搜狐科技、物联中国、至顶网、人民网、泡泡网等多家媒体共同举办的“大数据商业应用与创新峰会”在北京火爆召开。这场行业盛会吸引了来自IBM、亚信数据、聚合数据、诸葛io、互利科技、神策数据、海云数据、万象等众多公司的业界 精英参与。来自全国各地的大数据领域人员欢聚一堂,围绕着大数据行业热点和和发展趋势进行了巅峰对话和交流,就大数据的商业应用和价值实践进行深度探讨和分享。
诸葛io创始人CEO孔淼把“大数据时代”与“数据智能时代”进行了拆解。他先从宏观层面为大家解读了目前互联网的进程,他引用了凯鹏华盈(KPCB)“2010年-2015年间数据与数据存储成本对比”曲线图,并把1990年至2016年数据平台经历的三波浪潮进行了划分。他说,数据分析正在从一个独立工种,变成业务工作流本身的一部分,数据即平台的时代已经到来。在不远的未来,数据分析会成为每一个业务人员必备的一项技能。诸葛io是一站式的采集和分析平台,可以让业务人员轻松的驾驭分析,并且有着自动化的分析报告,目前已经有超过8000家企业在注册使用。
诸葛io创始人CEO孔淼现场演讲
以下为演讲速记:
诸葛io是一家比较年轻的大数据公司,但是我和我的合伙人都是做数据挖掘的,数据不仅仅是爬虫,我还黑了很多接口,把全部数据都下载下来了。在这个过程当中,其实我们发现企业的数据决策还是依赖外部数据?因为这是个拼流量获取的时代,大家都需要对数据进行完全的画像分析做用户获取。我们在这个过程当中发现很多企业的内部数据根本并没有做好分析,同时也没做好结构化的采集。
大家都知道现在叫DT时代。从十年前开始喊大数据时代来了,到现在还在喊大数据时代来了,什么叫大数据呢?从1990年到2016年大数据,只是因为我们的数据越来越丰富,每一个时代都比之前的时代数据容量更大。我认为它主要经过三波浪潮,第一波浪潮,当时整个计算机的应用,包括软件应用都是企业级的,不是面向消费者太多的,那个时候就已经有数据分析了。那个时候主体还是企业解决方案,帮你提出一套分析方法。比如说系统的业务数据,并且当时的软件可能都跟浏览器的服务方式,所以是集中式的软件,当时的存储也非常贵。
大家都知道比尔盖茨说过32兆的软盘就可以装下整个世界,但是大家可以想一下现在整个数量已经非常大了。我相信在座比较资深的都听过企业的解决方案,大家可以看到右边这个图,从我们要分析的数据再到KPI拆解,这是当时数据处理的方式,典型的就是微软他们这些大的企业。但是当第一波浪潮面临一些挑战,从二十年前所有的用户都在线下,到十年前都是在网站互联网开始起来的,再到五年前,现在差不多像安卓应用已经出来了,再到差不多三四年前,再到现在讲的AR、VR,再到未来我们不知道会发生什么,包括未来很多特别的硬件。
我们可能产生的生活服务方式,把互联网作为一个信息传播的基础方式以后,从信息化(微信、微博)开始,现在的创意都是O2O各种各样的服务。所以数据的沉淀量非常大。背后的发展就是数据的存储成本,你可以看到从2011年到2015年整个数据的存储量增长非常快,现在已经接近百亿级PB量。
这个时候面临第二波大数据浪潮开始思考一个问题,这么大规模的数据量,怎么把它存储下来?在数据爆炸的时代。它也带来另外一个问题数据都变成了孤岛没有打通。这个时候大数据架构出现了,把数据都拉到平台上面来,等待着BI团队解决;这个时候大数据发展带来了标准,有没有比较大的存储或者是分布式计算的平台,能够把这些数据可拓展性的存储下来,给数据团队做分析;这个时候Hadoop的处理架构,它能够提供非常丰富的处理功能,讲究数据分析功能,所以你看到右边是大数据架构的时代。从应用数据、多数据源,从各种数据管道到分布式存储,再到内存计算。
但是在浪潮的时候会发现一个问题,我们的核心是把爆炸式的数据都存储下来,然后等待着分析。刚刚又讲到人口红利结束和经济增长放缓,我们整个社会中第三产业已经被互联网所颠覆,大家可以想像一下外卖和打车,以前都是在线下,现在是通过线上。一方面是把以前的大数据搬到线上,现在又形成新的大数据。所以当人口红利结束的时候意味着你不能走流量了,你不能指望着靠活动推广拉新的,过去可能因为经济增长,你不太关心流失率,特别是很多传统的快销品和零售品牌。当你发现经济增长,甚至说逐步放缓更快的时候,你会发现一个问题,我没有考虑过流失率这个问题,我只考虑怎么增长,我的企业怎么维持增长。所以我应该去做分析,过去的数据分析都用于做广告的投放,现在在关注已有用户群的价值挖掘。
背后另外一个问题是让大数据品牌已经变的不再那么新鲜。一个企业面临更大的问题是什么?我曾经看过有一个人出了一张图,数据分析是个金字塔,90%从采集到分析的过程,10%是整个分析的过程。所以他用某种特殊的方式去解决采集的问题,但是这个图压根儿就是错的,因为更多的企业根本不知道怎么分析。在很多公司里面,现在整个分析过程是怎么样的呢?变成业务人员需要向BI人员提需求或者找程序员提需求,想知道昨天某个渠道来的用户有没有持续留存下来或者它的转化率怎么样,你把这段话表达给BI分析师,这显然是非常低调的方式。
所以本质原因是因为数据团队的人是做数据的人,他关心的是如何把大规模非结构化的数据处理成特征,把结构化数据整合,对整个数据进行分析。但是他根本不知道业务员想要什么,大多数企业是缺少专业分析的人,很多员工没有在大公司呆过,这个时候他找你的BI团队沟通的时候是一种探索,每一次探索你帮我找日志用户的行为,你再帮我写一个脚本,看看这一类用户大概产生的订单量是什么样的。
这个时候带来了整个行业对于第三波浪潮的探索,甚至是说数据分析师就不应该存在。所以这个时候引发一个问题,我们应该从采集数据,不是说数据能存下来,而是等待处理,如何驱动分析,驱动商业决策,这个时候有一个概念叫DI,DI和BI最大的区别是什么,BI是如何把各种数据的来源,各种数据汇总处理基于业务建模,DI更注重的是整个分析背后的结果,对商业决策,对我的市场运营,对我的整个产品,对我的人事、财务各方面的影响。
所以企业不同角色的人,他的需求是不一样的。比如说之前我跟淘宝的BI老大聊过,在这些比较大的企业里面,他们不是看订单或者是看什么UV等等这些数据。比如说这个阶段从公司融资肯定看的是各个区域产生的毛利率等等。如果下一个阶段关心的是算法,关注的是用户的回流和重复访问。所以第三波浪潮带来DI的概念,我们更应该注重一站式的数据采集和分析的过程,而不是提供非常多功能的数据平台,这个时候是大而快的情况下,我们更注重的是如何帮助不同部门的人,它能快速的看到它该看的指标。而不是说找BI的人进行沟通,它下一步要基于各种业务模型或者是分析经营去建模。
所以像DOMO和Looker这类公司最大的特点,快速直接给各个业务部门的人呈现他要的目标,这样他在分析过程当中,不再需要其他方面的人。所以数据分析会成为每一个业务人员必备的一项技能。大家想一想现在的大数据都是做可视化,但是更重要的是要驱动增长和优化决策。数据正在从工作流外的使用转变为商务应用本身的一部分。你把很多指标采集上来以后是没有意义的,变成必须有分析师,变成我们需要的分析场景。不同行业,比如说互联网行业、政府行业等等,不同的角色,不同部门的人做执行的这些人,有不同的活动目标,比如说是做朋友圈投放的推广、电商、做客户的成功关怀和产品的功能模块衡量,这四个纬度一结合才能得到明确的分析目标和指标。一旦我们能把目标在不同的场景中衡量和确定,下一步就是AI。我们未来要对所有的数据进行自动化的分析,分析本来就不应该是人做的,分析就是找规律。就好象一个棋谱,不管是最开始的算法是通过穷举还是阿尔法狗整个神经网络的计算方法来做。
今天的数据是数据驱动高效决策。诸葛io是一站式的采集和分析的DI平台。我们从过去都是为了把数据采下来,而诸葛io整个采集是以用户为中心,我们本质是做用户行为分析。因为所有的数据对于我们面向的和用户相关的服务类的企业,包括APP开发者和传统的行业来说,你的数据是用户产生的。我们采集的数据并不是放在那里或者是做技术报表,而是记录用户的每一次行为过程,不管是只打开一下APP或者是产生了购买行为,还是他一直纠结买不买。我们有安卓、IOS、网站、H5,包括你的ERP数据库里面所有的数据都从用户中心导到诸葛io分析平台里面去,并且我们会给你一个行为关系。未来是自动化的分析,所以你必须要有用户的行为,才能让他自动跑规律。
我们还提供了强大的分析引擎,让业务人员轻松驾驭分析。把很烦琐的写脚本,变成简单点两下。比如说我要找到打车的人,做一个简单的划分,这个用户群就出来了。因为你找一个技术提一个需求,可能他写代码就花一段时间,一天解决一个需求。但是这个效果还是非常慢的,因为你一直在等待。多纬交叉分析也是一样的,我看某一个分类的购买转化或者是来源带来电商类的购买转化,还是阅读类带来用户的阅读频次整个转化率的分析,其实也是一样的,去进行一些交叉。比如说直接给你一个结果,每一个文章的分类转化率到购买的转化率最高。你点这个数字可以看背后的人到底是谁,如果你现在用通用的诸葛io分析平台可以看到是整体留存。我想看用户到底有没有持续打车,过去也是要转化是让技术人员做,其实还是通过业务平台全部可以做到。
这个解决的是提高分析效率,很多人不懂分析怎么办。诸葛io在整个过程中,我们会帮助你把不同行业细分的指标模板配置好,诸葛io分析平台不同的决策,不同的行业可能不一样。比如说是阅读类的,它的CEO关注这个指标,再到电商类的可能是订单相关的指标,再到产品部门关注的是活跃度,这些东西都是可以自定义往上加的。比如说最热门的商品分类和SKU,比如说市场部门,你的广告投放转化率。
当我们帮很多业务人员树立目标之后,再给他一个非常强大的分析引擎,他们从目标到执行自己可以做,这个时候还有一个考虑,我不想自己分析怎么办?诸葛io一直在研究是新的智能化分析的引擎。现在我们像对产品的评估、牛市预测,我们都已经有背后的引擎在计算,告诉你哪些用户流失更高,告诉你这次产品迭代到底好不好,我们一直在跑这样的数据,可以直接生成自动化的分析报告。当你看到这些报告之后需要干吗,需要应用。我需要执行新的投放策略,我们把数据进行导出,诸葛io其实是一站式的采集到分析和应用。
诸葛io所做的案例,我们讲一下分答。我们是见证了分答从最开始的单声道到最终的热门,整个过程诸葛io一直在陪伴它的成长。最开始是我问一个问题给钱,分答的很多用户在线上完成经验的交流。在分答提的问题要付费,你会发现答主对于知识的反馈率和使用率要高于提问用户,他们单独分享出来就得到了分答的案例,快速迭代。他们试着邀请王思聪实现爆炸性的增长,这整个过程你可以看到从数据源到探索,要有很强的BI团队来做。但是这个过程中诸葛都是做数据分析和做产品的小朋友一起做的,并不是全部利用诸葛io做的。
其实这个过程也帮助他们极大的提高了分析效率,也让我们非常高兴和自豪的是,我们真的帮助了我们的客户。很多人会问,你们诸葛io自己用吗?其实诸葛io我们自己也一直在用,我们开会的时候,你要做这个功能之前先要把使用频次提上去,因为我们每个人都能快速的看到诸葛io的用户是怎么使用的。
截止到我们上线一年已经有超过8000家企业注册使用,每个月有近100亿的事件处理量,而且我们也是一家SaaS公司。包括像墨迹天气、罗辑思维从上线前到招聘,需要招到有诸葛io分析技能的人,再到易车、创业邦,我们希望帮助更多的企业增长。如果大家觉得我讲的这些东西非常有价值的话,希望你关注我们的公众号,关于分析和数据引领我们的案例,希望大家能够多多交流,一起更多的在大数据领域进行更多的探讨,谢谢。
End.