浅谈数字化转型中的数据展现、分析和合规问题

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

编辑导语:2021年是数据隐私保护的元年,这一年以来,隐私的保护受到了重视。企业在数字化转型中也应当注重隐私数据是否合乎规定,不泄露他人信息。本文列举了几个案例,分析数据对产品的价值以及我们需要明确的问题。

浅谈数字化转型中的数据展现、分析和合规问题

一、从“数据驾驶舱”和“大屏”谈起

不知道是不是电动汽车在国内更普及的原因,越来越多的国内项目招标的时候,都模拟电动车的设计,规划了“数据驾驶舱”或者“大屏”的需求。 令人寻味的是,这种项目里最贵的不是软件,而是硬件,是LED的屏幕 (各位不了解行情的,可以自行翻一翻相关材料)。

可想而知,LED屏幕或者驾驶舱是需要一个至少几百平的大汇报厅去布置。软件里最贵的,不是SQL语句,而是UI设计。我能够理解“数据驾驶舱”和“大屏”在数字化转型过程中,门面的地位和作用。在这里,“UI设计”实际上应该称为“室内设计”,需要和大厅的装潢相适应。

我并不是在吐槽,因为确实这个场馆正常也要安装LED屏幕,不算是浪费。 但这种趋势实际上是代表了硬件项目,由软件厂商做总集成的现实。 这种现实的背后,是经营主体更加重视数据化转型,数据在业务经营中的重要性的地位在不断地提高。

往下再探一层,其实我们会发现,数字化转型在国内,仍然处在一个非常初级的阶段。这个表现就是经营主体花了大量的成本在“数据驾驶舱”和“大屏”, 错误的把“数据展现层”的应用当成了“数据决策层”的应用

我讲得更直白一点,业务决策根本不需要“数据驾驶舱”和“大屏”。

二、“中国式报表”的隐忧

除了“数据驾驶舱”和“大屏”,还有一个很有意思的设计是“中国式报表”。就是你不能说这个BI没用,你只能说这种报表让数据更华丽了。但数据就是数据, 从来没有人会认为穿着“高级定制”的数据质量更好。

“中国式报表”呈现了一种冗余设计,核心表现是表格复杂,信息量大,表头混乱。为了做表而做一张表,是不是很像为了加班而加班的我们?

“中国式报表”的问题在于,缺少对问题的预判和分析结论。就好像写论文,没写开题报告、论点和结论,只有论证。大而全的报表内容,承认了繁重的工作量,但却不解决问题。

很多和数据有关的产品,成了“呈现原始数据”的产品,而不是“聚焦+决策”的产品。 这也是经营主体,在在数字化转型中,数据中心“建了不如不建”的原因所在。

三、实现数据aPaaS能力的美好愿望

夯实数据能力的关键,是快速“聚焦+决策”问题。 于是,有人想到在报表的能力上,增加“数据模板”和“实时报表”两个模块,这是很多自助型报表工具诞生的原因。

把复杂问题聚焦在几张主题报表上,只关心和主题相关的数据,把中国式报表作为数据源,通过“托拉拽”完成数据的可持续化的运营。 这里面产品售卖的就不仅仅是数据采集和加工,同时也看产品方对行业数据的理解能力。

让客户主动“托拉拽”可能是一个美好的愿望,这种产品教育,可不是打打字就能很快完成的。 aPaaS的模式可能还要很长一段时间,才能成为主要选项被大家认可。 业务方需要定制化产品的情况,还会持续。

总之,在产品初期阶段,我想至少应该有简单主题数据模板的能力,这种产品才能商业化。

四、描述数据质量的三个维度

从BI分析像技术底层部分观察,“大数据计算”这个词已经被售前们用烂了,各个公司张口闭口就是大数据计算和人工智能,殊不知产品只有几个核心读写库,技术水平、运营能力都难上桌面。

大数据最基本的衡量指标应该是数据量、准确性和实时性。 数据量是处理能力,数据库级别的处理能力,和数据集群分库分表的难度是不一样的,这是第一个难度级。

准确性是指数据采集和清洗的能力,这个能力可能是和RPA技术相关,可能是和IoT技术相关,也可能是和接口标准的组织能力相关,这是第二个难度级。

最后,实时性是反应在数据实时计算、实时查询的能力。分析型数据库的性能、成本控制、数据结构的设计是第三个难度级。

数据的质量是数据分析的基础,“大数据计算”能力虽然不懂行的人不会深究,但是对照看来,很多厂商其实都“挂羊头卖狗肉”。能力就处在数据库的存取+筛选排序的程度。很难说这样的公司具备大数据解决方案的能力。

五、“接口费”和产品化的矛盾

另一个经常遇到的问题是,有一些行业有“接口费”这一说,基本上是负责核心业务服务商的遗留问题。

有的项目里,数据源的对接是很大一块成本。我见过一个老的核心产品的核心收入就全部都是接口费。对于这种额外成本,目前这个阶段很难避免,新的下游的业务完全依赖产生数据的核心业务系统, 而核心业务系统基本上是被业务厂家绑架的状态, 换也换不掉,也无法顺利升级,就是一个接一个的收“接口费”。

在之前的文章里,有讲到产品要做到业务的上游和下游去,在数据源上,也要争取数据源的上游和下游的拓展。 核心业务系统,就是核心产生数据,数据量最大的业务。 “接口费”和产品化的矛盾可能只有在核心业务被其他业务系统蚕食的那一天,才能避免。

六、产品不提供算法到底行不行

数据量在时间的统计尺度下,积累3~5年才可能会有算法的需求。所以 时间尺度下,数据没有积累,是基本上不用考虑依靠算法去提高产品竞争力的。

在有了3~5年历史数据积累的情况下,还要再判断这个业务算法,解决的是存量问题还是增量问题。存量问题就是和过去3~5年变量一致的样本数据,增量问题就是需要依靠新的变量做预测的业务。 算法很难对增量问题测得准,需要依靠关键岗位的关键判断,才能准确产出。

所以产品可以有算法,但没必要过分关注算法,有时候程序和流程的优化效果会远远大于算法带来的价值。

七、2021年是数据隐私保护元年

从数据呈现、决策,讲到数据技术和算法,最后这部分是数据采集的合规性。 2021年我会把这一年定义成“数据隐私保护”的元年。 《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》两个重要法规,均在2021年正式生效。

凡是和数据沾边的开发者,都应该守好数据合规的底线,数据保护是开发者、业务方、使用者共担责任,任何人不能以任何理由,在当事人未经许可的情况下,擅自收集或泄露私密数据。

目前听到很多“多邦安全计算”、“隐私计算”等等技术,都没有很明确的合规定义。建议所有数据产品开发者,审慎看待数据业务,在法律允许的范围内开展业务,不漠视数据安全的风险,一丝不苟做好数据安全“等保”

八、写在最后

定义好客户是产品价值的原动力,明确你的客户是谁很重要, 明确你的客户的客户是谁,更重要。

#专栏作家#

稀奇先生,公众号:稀奇星球,人人都是产品经理专栏作家。拥有十余种标准化产品规划经验,7年TO G业务老兵、智能化解决方案产品专家。

本文原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0

给作者打赏,鼓励TA抓紧创作!

随意打赏

提交建议
微信扫一扫,分享给好友吧。