GrowingIO,一家以技术为核心的大数据创业公司
作者:覃超
开门见山: 张溪梦的公司 GrowingIO – 移动互联网大数据分析平台www.growingio.com
公司的主要业务,是帮助客户公司去收集web和移动端的 raw logging data,然后从这些数据中提炼出有用的业务信息。创新点在于:
他们提供的工具(SDK)不再硬性要求客户公司的程序员去手动埋点。因为埋点这个操作本来就不是程序员喜欢去干的事情,另外埋点的逻辑源于商务或者运营部门,所以在创业公司里的精确埋点通常是可遇而不求的事情。我自己在Facebook Messenger工作,我们iOS和Android都有大量的埋点工作要做,主要用于用户数据采集和用户行为分析等,但是我作为开发者觉得这些工作十分痛苦。GrowingIO的采用的方法很“神奇”,只需要植入SDK,然后在他们的控制台用鼠标点点,来表明哪些控件(e.g. 按钮,网页,移动页面等)你最为关心(这个操作可以交给业务部门做),GrowingIO便会记录和最后呈现那些控件的相关信息。同时他们还会针对业务类型给出专业的商业分析数据页(data dashboard)。
张溪梦多次强调自己的公司要做成中国少有的技术驱动型的公司。他画的一张图给我留下了十分深刻的印象:
他把自己的公司核心设定为技术,在技术之外才是产品,运营,销售等。所以如果你是醉心于技术的人,这个公司将会成为你的一个很好的选择。
另外,GrowingIO对于数据的收集量最大,所以infrastructure都是能够处理大数据的架构。我很不喜欢说这是一个做大数据的公司,因为我个人一直认为大数据是一个公司在做业务的时候会碰到并需要解决的问题,而不是一种技术或是一种概念。但中国创业圈的有趣之处则是一个个概念会被吹得飞起。比如之前的SNS,O2O,到现在的大数据,皆如此;这里我先打住。GrowingIO需要处理的数据量绝对庞大,而且其后端使用的技术和架构都是和国际接轨的大数据处理框架,外加一批来自LinkedIn和硅谷的技术牛人。
下面是来自GrowingIO技术合伙人叶玎玎的叙述:
目前我们整个技术栈分为前中后三部分。
前端是两大块:第一块是数据收集部分,我们提供 Web,iOS 和 Android SDK,目标是在不需要开发人员打点的情况下系统能自动收集用户的行为数据,同时不影响网站和 App 的使用体验,所以这需要在更高纬度去开发 SDK。另一块是我们自身的产品,我们使用 React,Less 和 Webpack,基本算是一个 SPA。
中端也有两大块:一块是网站本身后台,大部分是使用 Play Scala 框架,还拆了一些微服务,用 Scalatra 写的,数据库部分用的是 Slick。至今为止我们 API 部分峰值接受请求量在 10K/s。
后台部分我们分几套系统,数据会首先汇聚于 Kafka,根据数据的热度不同会由 Spark 处理流向不同的地方,目前实时数据在 ElasticSearch,Warm 数据在 HBase,冷数据直接存在 S3 中。
覃超大魔王精简版:“需要Web前端,iOS 和 Android 的人才来开发他们的SDK,另外也需要后端人才(特别对于大数据感兴趣的技术牛人)。主要用的是 Scala on Play framework (注意,Scala很新很吸引人),另外有用到 React,Less,Kafka,ElasticSearch,HBase等。考虑到Scala在国内没什么人用过或者有经验,所以玎玎 (这字真难打)表示只要肯学,之前是做Java或者Python或者PHP或者Node.js后端的都可以申请。其实我有时会想:如果不是我自己有了创业项目,我也考虑过要加入的。
投资方面
公司背后的投资团队绝对强大:Reid Hoffman,邵亦波的经纬创投,还有Scott Sandell的NEA(New Enterprise Associates)。注意:最后这个投资人在 The midas list 上名列前茅。
位置
公司的地点在北京,不过你若是在硅谷或者国内的其他城市都可以。具体位置是在北京东北四环左右。
最后
公司的创始团队:
http://growingio.com/team
公司的招聘页面:
http://growingio.com/joinus
Simon Zhang 关于公司的补充:
大家好,我是Simon,我们从美国刚回来建立和移动互联网分析的产品,帮助企业做到数据化运营,提高营收和价值。数据分析有若干个痛点,流程缓慢复杂,需要各种不同专业能力的人才。一般的企业很难在短时间之内建立一套有效率的数据分析体系。希望我们的团队能够利用先进的技术在未来帮助很多企业用数据分析大幅度地提升效率。如果大家有兴趣考虑我们的公司,请联系我们!
我们的产品和Flurry有很大的分别,他们更是一种粗线条的数字计数工具,和针对企业的商业数据分析还是有很大的不同的。而且Flury是广告平台,有数据交易的部分,DMP。我们的产品专注第一方的数据,不会把数据分享用做广告平台,或者参与数据交易。
Cofounder之一的 Jonathan Wu 的补充:
大家好!Data to the people 是我的梦想!也是我创业的原因。我是Jonathan,GrowingIO的联合创始人。同Simon回国一起创立公司GrowingIO,我们最先解决的问题就是数据难以整合难以分析的问题。这个就需要我们有一个强大的数据团队来支撑实时数据抽取,实时数据流,历史数据处理和数据清洗,数据聚合,数据挖掘的完美结合。我们希望能够帮到企业对业务数据维度和业务数据指标的分析。希望有共同梦想的您加入我们这个初创团队!Data to the people!
最后介绍一下自己,我从毕业开始就做数据仓库的开发,一直都在为企业的分析平台搬运数据。在国内做了5年之后去了美国,接着为美帝的eBay和Linkedin的分析师准备数据,做数据分析平台,和自动化工具。在Linkedin Simon的团队从数据工程师做到了分析平台的技术总监,目前在GrowingIO负责搭建数据平台。
Cofounder之一的 叶 玎玎 关于技术的补充:
Play 我们是做对外产品时用的。内部很多微服务我们用更轻的 Scalatra + Akka,Ruby 党过来,看了 Scalatra 和 Spray 后选了前者。
End.