冯一村:让大数据落地——大数据可视分析思维
自2013年起,海云数据创始人及CEO冯一村先生开始创立海云数据。在短时间内,带领团队核心成员形成较强战斗力,凭借海云数据自主研发的核心技术——图易 大数据 生态产品决策平台及行业可视分析决策产品——智警,在业内形成巨大影响。冯一村先生在大数据行业的影响力伴随海云数据的蓬勃发展与日俱增,曾多次受邀参与大数据领域的讲座及成果报告,并受聘于中国民航大学担任客座教授。曾先后获得了大数据行业领军人物奖和行业领军人才奖等荣誉奖项。
关于海云数据
海云数据是中国大数据 可视分析 的领导者,提供企业级大数据整体运营与分析服务,依托于计算机数据视觉、数据算法等技术,探索大数据的潜在商业价值,为不同行业客户提供基于数据交互可视化的整体产品,真正实现将大数据应用于分析、决策和预判领域。今天,海云数据以其国际级的数据可视分析团队,产品被公安及航空行业所广泛使用,并进一步推动了大数据可视分析的商业应用市场空间。
以下是海云数据创始人、ceo冯一村的现场分享:
首先,我给大家分享一个案例,这个案例是海云数据很早期的一个项目。2014年初左右,我们给某家银行做数据可视分析的产品,帮助用户去运营数据。这个项目实际上给了海云很大的启发,帮助海云从数据可视化走向数据可视分析这样一条道路,也让我本人能够真正认识到大数据的价值。
在这个案例中,有一个连线图,它代表某账户向某账户打款。举个简单的例子,比如北京的同学向深圳的某某同学打款,打了100万,我们就会连一根线过去,线的粗细和金额是相关的。当我们给这家银行部署上去以后,大家都觉得很好看这个效果图还是蛮酷炫的。实际上,客户并没有将海云数据当做数据分析类公司,而是当做数据可视化公司。简单点说,海云数据做美工比较好。
在我们给客户部署上去一个星期左右,客户来电说你们的软件出问题了。当时,我们只有不到15名员工,这对于创业团队来说,还是很紧张的。这家银行是海云数据的标杆客户,但是在上线的一个星期以内就出现了严重的bug,对于我来说肯定是很难接受的。
后来我就问行长,这个软件出了什么样的问题。他说自己从事金融行业二三十年了,当行长也快十年了,偶尔有一两天是这种情况也能认可,但是从上线的第一天到现在都是这种情况,每天都有几百根线在早上的时候向这几个点打款,我有点不相信。我们银行的数据是不可能错的,要错也是你的数据或者软件错误。
那真实情况是什么呢?实际上,真实的情况是在每天早上9:30~9:33,中午的12:30~12:33,大约有2600多个账户向有关联的100多个账户同时打款,而且这个数据已经持续发生了80多天。后来,银行将这个数据异常的案件移交到北京市金融局后,经查实,这个案件是典型的P2P非法集资。它的庄家要求在早上9:30和中午12:30,这两个时间节点的三分钟内必须同时打款,承诺周回报率为20%或者30%。
这个案例引发了海云数据的深刻思考。要知道银行是有反洗钱中心监控系统的,同时也有反欺诈中心监控系统,我们的系统为什么没有发现呢?而且这个案例并不是第一天就出现了,它已经持续出现了80多天。
后来我们意识到,这家银行无论是反洗钱中心还是反欺诈中心,它背后的这些数据和系统全部都是以统计型的数据来呈现的。意思是什么呢?就是它的数据都是画了一些饼状图、柱状图,显示每天有多少人向多少人打了款,所占的百分比是多少等等。设想一下,在这个案例当中,早上有2000多笔汇款,中午有2000多笔汇款,两次加起来一共只有接近6000笔的汇款量。6000笔的汇款量对于一家银行每天的汇款量来讲,可能连百分之零点零几都不到。这样的数据量怎么可能被客户所认知或者重视呢,要知道统计型的数据会欺骗你的。
在我们国家,数据的真实性和数据的统计口径一直是一个非常严重的问题。 统计型数据是有欺骗性的,一些真正有价值的数据会被隐藏到百分比当中。
从这里我们也能想到,可视分析是什么?
可视分析就是对大数据的一种全新认识,是一种认知能力,它不是BI,也不是饼状图和柱状图,更不是一些图表。按照逻辑的思维方式,它是 人对数据思考的节点, 这里面也真正回归了我们对大数据的思考。
我们知道,今天所有人都在说大数据,所有的企业都说自己是大数据企业。那什么才是真正的大数据,大家对大数据的认识到底是什么样的呢?我不禁想起了一个成语叫“盲人摸象”。现在很多人对大数据的理解其实是相对比较片面的,他摸到了一个象鼻子,就说是大象,他摸到了象腿,也说是大象。而真正的大象是什么呢?真正的大象是你眼睛看见的全貌,它是长着四肢,拥有象鼻子、象尾巴、象耳朵的这样一个动物才叫做大象。就像我们人类的眼睛,是人与数据交互的过程,它是一种全新的认知能力和认知方式。
最近,有几个朋友也在问我,他说大数据到底有没有边界。我们最后讨论出来结果是,大数据是没有边界的。大家对大数据的认知,其实已经是一种共识了。就像多年以前,电刚刚被发明一样,很多人都会去想,电能够应用在什么地方。电可以变成一个灯泡,可以变成电动汽车,可以变成各种各样的应用。很多公司或者个人都会为电去努力应用。但是到今天,我们都知道,没有人会去谈电会用在什么地方,电会变成什么样的应用,因为电在我们的生活中已经无处不在了
数据也是如此,今天我们很多人都会去想什么是数据,数据怎么去应用,数据能够应用在什么样的地方,大数据能够给我们带来什么样的价值。但是在三十年后,数据就会像我们生活中的电一样,无处不在,所有人都会运用数据,所有人都离不开数据,数据会变成我们日常生活中的一种方式。但是在到达那一天之前,我们需要对这样一个世界、这种生活方式或者工作状态有一个全新的认知。我们需要一种新的生存能力去理解大数据,而大数据可视分析就具备这种能力。
大数据可视分析是一种认知能力,而不是简单地做成饼状图或者柱状图,把它呈现出来就结束了。所有人都需要和大数据或者机器去交互,去理解数据、利用数据。所以,我们必须要利用可视化分析这样一种方式。
数据可视分析在国内,坦率说还处于刚刚起步阶段。北大的可视分析专业的学生也才刚刚研究生三年级,有的也才刚刚毕业。而在国外,无论是斯坦福还是伯克利等学校,数据可视分析这个专业都已经发展很久了。数据可视分析这件事情在国内和国外还是有很大差距的。所有可视分析是能够将大数据落地到行业当中去的一个重要标准。
我们在想,大数据的价值落地过程中,我们为什么一定要用可视分析这样一个思路呢?我们用其它的分析,例如关联分析或者时空序列分析不行吗?它们一样是可以的。这些分析方法以前也用来解决我们的业务价值问题,而现在为什么一定要用可视分析呢?
这张图片实际上讲的是用大数据看舆情雾霾的态势变化和信息传播规律。数据量实在太大、太杂,我们人没有办法直观理解和判断,没有办法全面去认知。我们就是在管中窥豹这样一个事件,就像我们对宇宙或者星星的认知是一样的,我们能够看见的其实只是星星中的一个很小的一部分。可视分析能够让我们以上帝的视角,去了解企业或者组织所拥有大数据的每一颗细的颗粒度。天上的每一颗星星,它都能以可视分析的方式,以客观的形式呈现出来,这就使得人与数据之间有了一种能够直观理解的方式,有了一个沟通的桥梁。
对数据的趋势、价值以及维度进行大致判断的时候,其实我们在这个基础之上再去做分析和关联,就会快很多,好很多。这也是NASA如此重视数据可视分析的原因。像CIA、Palantir这种类型的组织或者公司,如此重视数据可视分析,也是出于这种原因。
人是复杂型的动物,在人工智能还没有真正实现的那一天,所有的大数据都是需要人来理解它的,人要理解数据的价值、业务属性以及行业属性,这样才能够在此基础之上再去做分析和应用。而数据可视分析的原则,就是将这种关联分析、空间分析、时空序列分析等等多种分析手段与方式联系和应用起来,通过计算机视觉技术将这些分析转换成为能够在业务场景中应用、分析与决策的能力,这是认知大数据和实现数据价值的最后一公里,也是我们真正让大数据能够变现的价值最后一公里。在大数据落地的过程当中,有几个关键的维度属性必不可少,比如:业务属性、数据属性、算法属性,没有这些属性,我们的大数据肯定是停留在空中的楼阁。但是如何把这些属性串联起来,必定只有靠数据可视分析。
在数据可视分析的发展过程中以及大数据落地的过程中,海云数据还有很多工作要做,可视分析这个专业在中国的发展也有很多的工作要做。我相信在未来的大数据世界,可视分析就像数据一样,会在我们的生活和工作中无处不在。
/ 以下是部分Q&A内容 /
▎哪类传统企业对数据分析、可视化的需求和购买力更强更明确?
事实上,所有企业都需要可视分析,但受制技术成本及行业需求的考量,大型企业及市政管理部门是最为迫切的用户群,因为他们面临巨大的互联网、大数据转型压力。
▎数据可视化工具的同质化严重吗?
我们认为可视化是有其局限性的,这也是为什么海云数据如此重视可视分析,并在国内大力推广的原因。因为可视分析能够给用户创造价值,而可视化,虽然也有其意义,但毕竟是有限的。我认为可视化工具同质化蛮严重的,而且我认为工具类产品在国内也面临着巨大的商业模式挑战。
▎想知道冯老师对未来数据科技的发展怎么看?(比如:有什么新的技术会影响数据行业)
我认为Ai技术将深刻影响数据科技的发展。未来的Ai,绝不是一些简单的数字程序,它将是业务模式化的驱动,也就是说内容即代码。通过Ai,通过机器学习,更深入了解、预测,到最终作出决定,可能不需要按照人类大脑的神经网络去布局,而是通过机器学习,让智能化帮我们作出最终的判断,数据的价值将通过Ai得到突飞猛进的提升。
注:本文摘拓扑社,冯一村口述,版权著作权系原创者所有,转载请注明出处。数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
☞点击进入 海云数据 在数据观的企业栏目>>>
责任编辑:汤德正