专访神策数据 CEO 桑文锋:在数据私有化领域,如何做到“特立独行”?

加速会  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

编者按:本文来自于“互联网数据官”(微信号:internetcdo),36氪经授权发布。互联网数据官(iCDO)推出了一款与中国最优秀的互联网数据公司的掌门人对话的栏目,分享行业的观点、对数据的理解、对客户的观察,以及对增长的思辨。本次采访的是神策数据的创始人兼CEO,桑文锋先生。

关于神策数据的“特立独行”

iCDO: 之前你是百度的技术高手,一直在为百度的底层数据提供技术服务,什么原因要从百度离开,并进而创立了自己的大数据公司呢?

桑文锋:我在百度工作八年,从2007年进入百度到2015年离开。这八年里有七年多的时间,都是在做数据这块的工作,所以对数据非常有激情,也很有感情,更有“感觉”。任何老百度人在选择离开百度的时候一定是非常纠结的,我也不例外,毕竟是百度给了我们一切。不过最终考虑离开百度有两个原因,一是仍然希望能够有机会去尝试不同的事情,希望能在不同的领域去发掘自己的技术能量和潜力;另一个原因是我始终认为数据是最有价值的资产,所以觉得自己何不做一些能够让数据直接产生价值的东西。

其实最初还是想利用数据做一些2C的事情,并不是一开始就想做2B,因为觉得2B主要是靠关系去拿客户,我们做技术的哪儿有关系呀。所以一开始完全考虑的是做2C这块。

正好那个时候,我的一个发小给我打电话,问我要不要一起做一个相亲网站,他看好相亲这个事情,因为今天“光棍”和“剩女”确实很多。我从数据的角度上想,相亲也不错呀,做一个相亲大数据,用数据技术解决匹配问题,是一个不错的方向。

不过,后来仔细想,这个市场不够大,就算我做得很成功,做成TOP1又能怎么样,估值也不过1.5亿左右,不是一个大事感觉。

包括创业过程中和一些投资人碰撞,和我们几个小伙伴碰撞,决定还是要做一个能够让数据直接带来效果的产品。我们经过了非常多的论证,也研究了各种可能性,最终归结到一点,我们决心做一个可以私有化部署的数据产品,一个可以私有化部署的互联网用户行为采集和分析产品,或者可以简单的理解为,我想做一个私有化部署的Google Analytics。

为什么这么定位?因为GA毕竟是统计分析领域做的最好的,市场份额至少是最高的。但为什么我们跟GA不一样,我们要强调私有化部署呢,那是因为2014年我在百度的时候,曾经做了一个项目,就是要把百度的这种大数据能力输出到外面的一些企业去,但在沟通的过程中我发现,我们想让这个客户把它的数据放到百度的平台里面,其实很难说得动,比如有一些银行啊,还有一些大企业都不愿意将自己的数据纳入第三方。那时我就想,如果我以后出去创业,一定要支持私有化部署。

iCDO: 私有化部署很显然是神策数据与其他同行的一个显著性的差异点。互联网数据官的读者朋友们也有人专门建议我问文锋,你们跟其他类似厂商(比如GrowingIO,诸葛IO等这样的公司)有什么显著的区别。很显然你的答案肯定会是私有化部署。不过,私有化部署并不是大家的共同选项,反而是神策的一个“特立独行”之举。企业数据系统的私有化部署,其实是有很多困难的,比如,部署本身很难,此外,部署之后的维护、升级,用户的灵活性等,都有很多难关要克服。神策为什么有“勇气”瞄准私有化部署领域呢?

桑文锋:是的,私有化部署并不是一个普遍选项,所以我们才更要选择这么做。当然,我们不是意气用事,我们做了很多分析,而且也结合了我们自己的很多优势。

14年底15年初,SaaS是非常火的,因为它有两个明显的好处:维护成本低、掌握企业数据。但我对这个的看法不同:首先,维护成本是能用技术手段来解决的,包括如何更好的维护分布式这种复杂的系统,并让其健康的运行,这些对我和我们这个团队来说不是一个大的问题;其次,就掌握客户的数据这点来说,在国内大家对数据安全还是比较顾虑的。你拿到客户的数据,客户难道就不知道很重要吗?我们还是要从客户的需求出发,提供私有化部署,客户不用担心我会出卖他们的数据,因为我们不会获取其用户的数据。

我们从成立以来定位就是做私有化部署,私有化部署的客户在我们客户里面占2/3。像中邮消费金融、聚美优品、秒拍、小黄车等等,都是我们私有部署的客户,其实这些标杆类的客户一般选私有化比较多。

iCDO: 有没有友商跟进呢?如果他们也在做私有化部署呢?

桑文锋:我是这么看这个问题的,就是一个策略如果有效,对手不可能不跟,但是私有化部署对技术的挑战还是很大的。举个例子,SaaS方式就像依山建一所房子,然后客户要求在平地上再建一套房子,怎么办?你直接把那依山而建的搬过来,最后可能就是个缺胳膊少腿的房子,这里的问题是维护代价就比较大。所以对原本只做SaaS要转成私有化部署的情况下,技术上本身的挑战就很大,而神策因为一开始定位就是私有化部署,从开始就建了帐篷,不管在山上搭还是在哪里搭,都可以很好地去支撑。

所以从这一点上来说,即使有竞争对手也去支持私有化部署,我觉得跟我们这种方案的成熟度一定不同。比如部署周期,我们部署周期会比较短,单机版远程部署仅需30分钟左右,集群版也仅是1~3个小时。另外,维护其实是一个更大的环节,我们部署方案出问题的概率非常低,即使出了问题,我们也有完善的处理方式。所以看似简单的一个私有化部署,想要真正把它玩转,要把这些分布式的服务做好,这本身就是神策的一个优势。

iCDO: 但关于私有化部署,争议是很多的,所以,您是否也认同业界所说的私有化部署的弱点?

桑文锋:私有化部署总体来说维护成本会比SaaS高,但我觉得最后是要看投入产出比的,你只要能够划得来就可以了,同时,我们神策数据不追求低价,我们更认同711便利店的理念,就是在相应价格上的物有所值;其次,私有化部署无法拿到客户的数据,但是这一点对神策的定位来说并不是问题,因为我们立足帮助客户打造数据根基,而非获取客户数据。

iCDO:可是私有化部署毕竟比SaaS要复杂,这是物理决定的,你得在客户的环境中一个一个去做,很难规模化。你们有什么更好的方法去解决这个问题?

桑文锋:是有更好的办法的,这里包含两点:一是产品和部署环境要标准化,如果你去部署的每家都是独立的一套,并且有很多定制化的需求,那你处理起来每一个都是独立的样本,维护代价就非常大,所以我们要求产品和环境的标准化,后续的维护就可以标准化的处理;

二是我们本身系统里面有专门的自动化运维系统,是中间很重要的一个环节。其实对于大数据系统,很多时候大家仅关注数据“如何采,怎么传,怎么存,怎么查,怎么可视化”这五层。但实际仅有这五层还不行,额外还得有三块:监控、元数据、调度器,要把这些东西结合起来才能稳定地运行,比如某一块是数据采集出了问题,还是传输出了问题,还是查询出了问题,并且它有问题的时候可以自动恢复等等。所以这些东西真正做好才是维护性比较强的。

iCDO: 每个企业的生产环境和营销环境可能都不尽相同,既然要做私有部署,那么意味着肯定存在相当繁重的定制化工作吧?

桑文锋:这里面就是定制化的问题,首先我不相信一个SaaS类的软件或是一个分析工具能够解决你所有的问题,我甚至觉得SaaS类和分析工具仅能解决一少部分问题,还有许多是需要个性化独立处理的。神策提供的是PaaS SaaS模式的服务,我们将数据底层建好后,客户可以在此基础上做二次开发,并且我们面向的客户大都是互联网公司,本身就有开发能力,做二次开发并不难,这也就很好的解决了个性化需求的问题了。

专访神策数据 CEO 桑文锋:在数据私有化领域,如何做到“特立独行”?

神策希望帮助客户建立数据根基,用windows做类比来说,windows作为一个操作系统做了两件事情:一是对各种硬件、CPU、内存、磁盘、网络等的管理,二是它提供了一层API,可以让第三层应用层开发QQ、outlook等应用。

专访神策数据 CEO 桑文锋:在数据私有化领域,如何做到“特立独行”?

对比神策来说,首先是把各种各样的数据源采集回来,建好底层;其次提供PaaS平台方便用户二次开发;第三层就是各种应用了。大家普遍看到的神策分析的部分,只是一种应用,基于这个PaaS平台同样可以去做推荐,去做推送,去做风控或是做其他挖掘都是可以做的,从这三层去考虑,对于windows做类比的话就更能清楚神策这个价值了。

iCDO: 为了能够实现这种私有化部署及定制,神策肯定需要深入客户的业务,对客户的业务进行梳理之后才能进行定制吧?如果是这样,这种深入业务进行梳理工作的一般周期大约会是多久?

桑文锋:是的,肯定要对客户的业务进行深入了解和梳理。时间周期一般在半天到两天左右。因为互联网产品还是会垂直分类的,比如互联网金融是一类,电商是一类等等,每个类别下都是有共性的。如果没有共性,每一个都是独特的,那这个代价实在是太大了。一旦掌握了这种共性,我们能对每一家都是独特的,但对我们自己来说,是可以更高效的去解决问题。

所以进一步说,如果每一家都建自己的数据团队,然后去摸索,其实我认为并没有发挥出团队的威力,这也是我去年的时候写过一篇文章,就是在大数据时代,每家都需要一个大数据部门吗?其实是不需要的,这就好比在电气时代,每家都要做个发电厂吗?其实也不需要,你可能更多的时候需要的是能够把电用好的一个人就可以了。

关于行业和客户

iCDO: 你怎们看待今天的企业在数据使用上的痛点?比如,大家现在对于数据普遍比较重视,但是实际上你会发现很少有企业真正很好的利用起来了数据。

桑文锋:这里需要从互联网公司和传统公司两个角度去看:互联网公司一是采集数据的方法有问题,对数据源的重要性意识不够,比如我们最开始的时候不管数据源头是怎么样的,然后通过在中间做复杂的ETL,再建立数据质量管理,等我们做了几年之后发现这种思路有问题,不管怎么做就做不好,所以我们痛定思痛,这也是我在百度很重要的一个心得——就是数据源很重要,我们需要从源头尽量让数据规范标准起来。比如之前我在百度做的数据采集审核系统,每次变更一个字段或变更一个什么东西都能去审核管理起来,从源头去结构化,让源头不放水,源头放水了后面就很难做,这是第一个数据源的问题;

二是数据采集的优先级问题,数据工作在团队内的优先级不高,数据团队推不动工程团队,比如数据采集需要工程团队和数据团队打配合,往往工程团队忙着迭代功能,数据的优先级就会被弱化或是应付了事。所以我们现在跟一些客户去沟通的时候,一般尽量找那个能够调动工程团队资源的人,因为只有他认可,才能把这个事情做好。

从传统企业来说,同样归结为两个问题:一是IT化程度不够,IT化是数据化的前提条件,数据没有采集的温床,也就没有根基;二是数据意识不强,虽然认识到了数据的重要性,但在实际工作中,仍然凭感觉做事。

iCDO: 所以是不是其实客户可以分成两类?一类就是他已经意识到数据的重要性,也懂得利用数据去提升效率和效果,但是缺少好的解决方法,即意识已经到位,能力有所欠缺;另外一类是可能连意识都还没有到位,希望通过大数据解决所有问题,并希望尽快看到高收益高回报?

桑文锋:我是这么看的,越初级的客户越会是第二类。认知比较浅的话,要的东西就会越飘,越要求高大上。就像现在人工智能比较火,越是不懂的可能要的越是天花乱坠,懂行的更清楚如何可行的看某一个问题,部分利用人工智能,部分利用正常的IT系统,按人配合去把它做好。所以从这点上来说,我觉得如果一个客户他要的很荒唐,这也是需要我们这样的数据从业者去引导他们的地方,我们不能被客户牵着走,我们本身是需要普及整个数据化进程的。中国这种数据化进程是一步步往前走的,但是现阶段底子还是很差,所以这也是我们为什么将“建立数据根基”作为神策定位的原因。

iCDO: 神策现有的客户中,哪些会比较接受数据驱动运营的理念?

桑文锋:目前的客户可以分成三类公司:一类是BAT还有硅谷回来创业的公司,这种公司就是在挑工具,只要工具能够解决问题就可以,不需要讲理念;第二类是其他类型的创业者,之前没有数据驱动的理念,这个时候就需要我们去灌输整个体系了,包括他在实际工作中应该关心哪些指标,应该如何做分析等等;第三类就是互联网 企业,这些企业许多时候是高层站得很高,但是一线员工的意识和能力比较有限,这个时候我看到的这种特征是自上而下来push的,所以导致的结果就是执行周期比较长,当我们遇到这样的客户,会进行更多的培训,进而培育市场。

iCDO: 现在很多用户会认为分析不能解决实际问题,中国现在更需要能够落地要执行甚至帮你执行的解决方案,您怎么看?

桑文锋:这个问题特别好,其实这是一个恶性循环,分析不能解决实际问题的最主要原因就是数据采集没做好,那后面的环节就都受影响了。许多公司在做数据分析时的一个很大的问题就是靠需求驱动,比如老板要一个数据,分析人员就处理一个数据,下次要了另一个数据,就再单独处理,根本没有数据体系的建设。

专访神策数据 CEO 桑文锋:在数据私有化领域,如何做到“特立独行”?

我们可以从四个方面来考虑这个问题:首先,我们要做好数据采集,这是根基;其次是做好数据建模,比如神策一直强调的一个模型,就是event-user模型,其实就是最重要的两张表,一张表记录用户做了什么,另一张表记录用户有什么属性;三是各种分析方法,比如漏斗分析等,界面上点选几下就可以实现,而不是让工程师花数周时间专门开发;最后是指标体系,围绕产品从拉新、留存、变现等各个角度来看,我们需要关心哪些指标。所以我觉得真正去建好一个数据体系,应该分成四层,即“采集、建模、分析方法、指标体系”。

iCDO: 您一直提到神策的愿景是帮助企业建立数据根基,这里其实很大程度上是对数据源的有效把控,但数据源在采集的时候,该采什么数据或者哪些数据是对公司有用的,这些问题神策是怎么考量和解决的呢?

桑文锋:我对数据有一个看法,数据这个事情想要做好是需要经验的,没有经验真的是很难做好,因为会不断的踩坑,比如哪些字段要采集,哪些不要采,然后该用什么系统,涉及哪些系统组件,其实都是一个一个坑。即使你想好了,然后推动业务部门去配合你,工程部门配合你开发,业务部门配合去用,其实这里面都是一系列的坑。

这也是神策的一个价值,神策是一个80%产品 20%咨询,我们有一个强大的分析师团队,还有一个客户成功团队,基本上就是分析师团队在部署之前会帮助客户去梳理他的业务,然后围绕业务里面有哪些关键的行为事件,事件里面涉及哪些关键的维度,再去决定部署,只有这样的话,才能把这个底子打好,否则你凭空产出分析或工具去用,可能也只有10%的功能客户会埋单。

iCDO: 中国人很着急,花钱买了你神策的东西,或是Adobe的东西(比如AdobeOmniture等),就希望能够立即看到效果——能够马上看到企业组织在工作流程或方式上的改变;另外一种心态则是,我花了5万元买了你的产品,你的产品必须给我带来超过50万额外的销售作为回报,否则你的产品就是“忽悠我的钱”,您怎么看这个问题?

桑文锋:我是这样看的,中国确实有一个大的背景,就是中国的人力便宜,在这种情况下,大家许多时候能用人顶上,干嘛还要用你这个第三方工具呢,还得额外花费成本,然后大家就不愿意为效率付费,这是一个问题;另外一个问题是流量很便宜,许多时候获取流量太容易了,粗放型的也能活得很好。

但现在我觉得这两个条件都不具备了,已经被打破了,首先人力变得越来越贵,就拿咱们数据分析这个领域来说,招人非常困难,很难招到合适的人选;其次,流量红利没了,做广告带来的收入又不是纯利,亏多少就是一个问题。所以从这些因素就逼迫着互联网企业要精耕细作,要挖掘好已有的用户群,并想办法把它利用好。

所以在我看来,互联网统计分析其实经历了三个阶段:最开始是流量阶段,这个阶段大家只关注访问量就够了;到了第二个阶段,是用户阶段,我们开始关心DAU、MAU等一类指标,但仍然不需要深挖;而现在我觉得已经是第三个阶段,就是订单阶段,我们要关心一个用户怎么转化进来的,来了之后怎么去盘活他,所以整体数据分析的需求都变强了。

同时,确实如你所说,我们希望尽快看到效果,这也是一种趋势,而且我觉得最后按效果付费会占到很大的比例,虽然这个过程比较着急,但我觉得一定会进入这个阶段,可能还需要3~5年的时间。

iCDO: 目前Sensors Analytics采集的数据主要是用户行为数据,其他类型的数据也可以采集吗?比如业务数据,线下数据等?

桑文锋:都是可以采集的,比如客户的业务数据,线下数据,服务端数据等,这些数据都能采集过来。从我们的理念上来说,大数据总结成四个字就是“大”、“全”、“细”、“时”,这里面的“大”主要指宏观的大,实际采集上我们并不用关注它;“时”指高实效,实时的数据,这个我们一般也忽略它,我们更多的是考虑一个“全”,一个“细”。其中“全”,就是指多种数据源,不管是客户端的、服务端的、线上线下的、或是各种设备的,将数据全量采集。其次“细”,就是强调多维度,采集过来用户一个提交按钮,用户一次浏览,他相关的维度“who、when、where,how、what”信息也采集起来,这才能建立一个好的数据底子,之后的分析也会变得容易很多了。

另一方面,这个数据不一定是来自于APP或是服务器模块,也有可能来自各种各样的传感器、视频、麦克风等等,未来是一个传感器时代,或者叫物联网时代,不管是虚拟的还是物理的,这些数据我们都应该去做采集,这个阶段一定会到来。

其实,这也是为什么,神策数据的英文名字是“SensorsData”,就是传感器数据嘛。我们认为未来一定是传感器的世界,神策也在采集传感器数据方面做更多的工作。

iCDO: 会不会存在客户不需要你去采集数据,他采集好的数据提供给你们,然后你们来为他们做预处理?

桑文锋:我认为未来会有的,因为数据采集手段是多种多样的,我觉得以后通上电的这种设备,各种各样的传感设备都能采集到数据,比如就像我们看这个灯泡,其实它是在60赫兹以及相关条件等作用下在闪烁,这里面也会涉及数据,以后也可以采集到,而如果客户已经有了这些数据,交给我们的就是如何建好数据仓库这一块。即使到了一个新的阶段,对于神策的定位来说,我们还是要帮我们的客户把数据根基建好。

iCDO: 有一些企业比如说像Martech(Marketing Technology)这个领域,他们会直接把数据输入到应用场景中去,用机器规则来实现一些业务上的操作、管理和应用,神策有准备做这个吗?

桑文锋:神策是处理数据流的,不会做流程与控制。但是神策是能够给这些系统提供弹药的,比如神策有用户分群的分析功能,我们可以把满足某些条件的用户抽取出来,并提供到对应的营销系统里面去使用它。所以这些公司其实跟神策去结合起来,是可以事半功倍的。

iCDO: 中国的商业环境是这样,大家更重视应用层面,会轻视后台的作用,您怎么看这个问题?

桑文锋:我相信其实美国也是一步步迭代出来的,我们现在看到美国互联网环境很开放,接口很开放,大家都是组件式的,但我觉得在六七十年代美国刚使用这种大型机的时候,他们也是做全套系统的,但是后来竞争越来越激烈,就会要求你做好某一块儿。这是我比较认同百度的一个理念,把事情做到极致,你可以少做一点,但是要把它做到最好。我觉得开放只是时间问题,可能就这3~5年的时间。到那个时候,后台的作用大家不仅不会轻视,反而一定会成为刚需。

iCDO: 预测下五年后的神策,您希望是什么样?

桑文锋:五年后的神策,我希望完成了愿景的70%。神策的愿景是希望花十年的时间重构中国互联网的数据根基,现在神策做了两年了,服务300多家客户,离目标还远,但这个速度是指数级增长,是会越来越快的。

iCDO: 希望神策早日达到自己的目标。感谢文锋

桑文锋:谢谢!



随意打赏

360私有化最新进展大数据应用领域神策数据桑文锋私有化退市神策数据神策分析特立独行
提交建议
微信扫一扫,分享给好友吧。