在线教育大数据营销平台实战(搭建篇)
作者介绍:TigerHu,某在线教育企业大数据营销产品负责人,主导数据产品线和营销 CRM 产品线。
-
用户数据体系:用户分析应用、用户标签、用户行为数据、用户基本信息主数据等; -
营销数据体系:营销分析应用、营销分层标签、渠道特征数据、营收转化相关的主数据等; -
学习数据体系:学习分析应用、学习偏好标签、学习行为数据、学习素材基础数据等。
大数据平台的构建是从底层解决业务面临的数据问题 , 一定是需要一个时间周期的,因此其对业务的贡献不会立刻显现,而业务感知不到数据的赋能势必会影响老板对数据团队的资源投入,怎么解决这个死循环?下面作者将详细阐述在该在线教育企业数据化能力构建初期,如何利用神策分析和内部数仓的结合来构建支撑数据化运营平台的 MVP 方案。
一、初期痛点及神策解决方案
-
负责埋点的产品要和公司 80% 的研发打交道,极大消耗个人精力; -
各端研发人员日常工作节奏最熟悉的是其对应端的产品经理,方便把控版本节奏。
-
数据不准确造成数据权威性丧失,“用数据说话”可能就变成了一句笑话; -
用户一旦对系统产生怀疑,便会种下一颗邪恶的种子,挽回成本大增。
-
先排除是统计口径问题造成的数据误差; -
对数据链路进行校验; -
校验上报的事件及属性是否符合埋点设计文档; -
统计排查事件属性是否存在大量未知情况
三、数仓与神策分析结合构建 MVP 方案
-
启动订阅的机器需与部署神策分析的机器在同一个内网,且必须可以解析神策分析服务器的 host; -
Kafka 客户端版本要选择与部署的神策分析兼容版本; -
只有私有部署版支持通过 Kafka 订阅数据;
-
T+1 处理机制,一般是在凌晨进行数据加工处理,并导入神策系统; -
为了保证内部 Data pipline 工具的统一化,基于 spark 重构了 FormatImporter 方法; -
同步操作脚本自动化,加入统一 workflow 进行管理和监控。
以上便是该在线教育企业的数仓与神策分析共同构建数据化运营平台的完整方案。