TalkingData 崔晓波:信仰数据的人做的决策才是数据驱动的
一年一度的 TalkingData 智能数据峰会,已经成为 TalkingData 向世界展示其真知灼见的最佳窗口。
雷锋网了解到,如今,所有企业无一例外的面临着数字化转型带来的挑战和机遇,而 TalkingData 的多年前通过为移动互联网开发者提供 SaaS 经营分析服务起家,从数据的采集、处理到数据的分析,再到数据的应用与咨询,已经形成了一套以“智能数据平台(SmartDP)”为主的完整数据应用体系,构筑了一套以数据商业化平台、数据服务平台,及数据合作平台为核心的数据生态。 TalkingData 的战略转变不断让业界耳目一新,更日益形成 TalkingData 洞察趋势、判断产业、继而为更多合作伙伴主动提供解题思路的新模式。
雷锋网知悉,近日 2017 TalkingData 智能数据峰会隆重举行。TalkingData CEO 崔晓波在演讲中说:本次大会是智能数据峰会,就是要探讨智能与数据的关系。如今我们所有人都感觉到世界在变、社会在变、技术在变,我们今天就是要跟大家讲如何用数据的方法去洞察世界的变化,以及应对世界的变化。
以下内容由雷锋网 (公众号:雷锋网) 根据崔晓波演讲速记整理(有部分删减):
我们今天的主题是知机识变、有唐之盛,来这个会场之前我们都发了一个很酷的邀请函,很多朋友给我发来了贺信,说你们的邀请函很酷,清明上河图里面的人都活动起来了。我们今天的话题就想讨论一下,因为我们所有人都在感觉好像身边的世界在变、社会在变、技术在变。由于技术的高速发展,我们带来的各种各样的商品,已经由稀缺变得比较富足了,消费者的选择变得非常多。其实我们消费者也在变,90 后、2000 后在随后十年里就会主导市场。我们了解变化、了解客户、了解消费者,我们今天要跟大家如何利用数据的方法去洞察这个世界的变化,以及应对这个世界的变化。这两天我们准备了 100 多个演讲。希望能够给大家带来不同的角度和思考。
在过去的十年里面,中国的变革主要推动力是什么?是移动互联网、物联网。我们仔细去看过去六年的数据可以注意到,不管是移动手机的数量,还是爆发的物联网领域,还是可穿戴设备的增长都是指数级的,不是一年 10%、20% 的增长,更多是成倍成倍的增长。但是这种趋势,其实大家并没有意识到。
随着去年到今年人工智能技术(特别是感知计算,计算技术)的高速发展,整个世界数字化的速度在加快。我们通过人脸把模组的一些特征开始数字化,通过无人车测量街道和城市等等。所有这一切数字的爆炸速度其实已经到了一个难以置信的程度,截至到今天,我们每天产生的数据量就非常有可能达到 351EB。
但是如果我们将来的存储堆积起来,堆积整个中国的大地都做不到。如果我们的技术不能提高的话,我们就会在一个浩浩荡荡的洪流里面,不知道怎么取舍,不知道未来的世界会变成什么样。
然而大部分人的认知还是线性的,我每天见到小孩的时候,我没觉得这个小孩样子变化了。但是如果你突然把时间线拉长,一个月、两个月你再见到他你会觉得变化怎么这么大。实际上指数级增长前面都是有点欺骗性的。因为他刚开始增长的倍数虽然大,但是基数小,大家往往是感觉不到的。
这里我其实想给大家分享两个例子,让大家感觉一下,哪怕是专家也是固守原来的线性思维。20 世纪 80 年代的时候,那个时候 AT&T(美国电话电报公司)请了麦肯锡帮他们做一个决定,那时手机刚刚出现,所以他们要决定是不是要进入手机行业。麦肯锡给出的预测是,到 2000 年手机的数量不会超过 100 万部,为什么?因为手机非常的笨重和昂贵。但是实际情况是什么?2000 年手机就超过了 2 亿部。
另外一个例子,2009 年 Gartner 预言,诺基亚的手机和操作系统将在 2014 年统一市场,成为第一大操作系统,将会占据 40% 以上的出货量。而安卓将仅为 10% 左右,但是实际情况大家都知道,塞班在 2012 年就已经关门大吉了。安卓最后甚至超越了苹果,成为第一大手机操作系统。
我们仔细分析过这两个案例,我们发现,这些专家手里都有大量的数据证明,那个时候不管是手机,还是智能操作系统的增长都是指数级的。但是为什么还是会做出一个每年增长 10%、20% 的预测,这就是因为人的思维其实是线性的。
那么,举一个正面一点的例子,基因测序的例子,1991 年人类决定启动一个宏大的计划,就完成整个人类的基因测序组,这个计划整体投资了 60 亿美元,预计耗时 15 年。这意味着什么?大概应该是 2005 年能够把这个测序完成。但是实际情况是,时间过了一半,1997 年的时候整个测序的工作只完成了 1%。
那时候很多专家说花了这么多钱,但是这个项目肯定是失败了,肯定测不完。但是有一个人发现了一个规律,每年完成测序的数量是呈指数级增长的,最后实际情况是什么?大概花了十年左右,整个测序工作就完成了,预算只花了整体预算的一半,30 亿美金。
发现这个规律的那个人是谁?就是奇点大学的创始人。所以大家一定会觉得,这两个例子好象离我们很远,但是其实不是,因为在我们服务我们客户的过程当中,天天都可以看到这样的例子。会有很多客户说应该是这样,但是我觉得应该是那样,你必须把这个数据给我调整,对不起,这不是 TalkingData 应该做的。我们的客户应该是相信数据,信仰数据的,只有信仰数据的人和企业做出的决策才是数据驱动型的。
这种决策往往也是指数级的,这会贯穿我们今天所有的演讲。这是我今天跟大家分享的一个案例,让大家有点感觉。
看一组数据,人类的习惯在被改变,购物 70%、社交 100+ 分钟、外卖 2.87 亿、出行 30%。我不知道大家感觉怎么样?大家是不是感觉还不错?好像是这么回事,我看起来这个数据还挺舒服的?但是坦率的说,如果大家看到这组数据的时候没有异样的感觉,你们的思维就是线性的,这就是我们以前研究市场、研究消费者惯用的方法,因为我们已经习惯了用一种片面的、基于时间切片的、基于很小样本量的、基于非常弱的论据做出很多决定。
所以我们在过去五年里面,从企业、政府、各种各样的组织观察到的情况:他们只要看到这样的数据就做出一个非常大的决策。但是这真的是我们指数级的社会、世界里面应该采用的洞察的方法吗?当然一定是 NO,一定不是。那种方法是什么?如果我们面临这样一个世界,是在指数级变化,不停在变,但是我们收集数据的能力、速度、维度已经达到前所未有时代的时候,我们怎么理解这个世界?我们认为我们看世界的角度会发生很大的变化,我们以前看世界是由实体物质化,会向个数字虚拟化的方向去转变。
大家可能不太理解这句话,但是我可以给大家分享两个案例,因为大家都知道谷歌在做无人驾驶,我们参观过还是挺震撼的。它为了做无人车,放了很多勘测设备,包括无人车本身,然后在一个城市里面不断的收集数据,为什么收集数据?是因为避障吗?为了做模型吗?都不是,最后我们发现数字化的城市,他们把所有的建筑、街道、道路、树木、障碍物,甚至行人都是数字化表示的。
这是最好的方法,在虚拟的世界里面增强 AI 对世界的认知。我们也非常理解,如果你真的让一辆无人车上路跑的话,估计跑 10 万公里就会碰到故障,因为你怎么可能让 AI 迅速理解真实世界,所以我们要数字化、虚拟化,用方法帮助 AI 了解人类。所以这是我们看到的趋势。
所以,我们研究很多事物的方法和角度一定会发生非常大的变化,在现在的城市里面,政府其实非常需要一些与人相关的基础的数据,不限于他们的人工统计学信息,我们最近和国家统计局合作里面,包括第七次人口普查里面都发现有很多的痛点和以前做不到的事情。十年一次普查,抽样率 1% 到 3%,而且数据是非实时的,我们完全感觉不到一个城市是变化的。基于我们的项目,我们把所有的数据实时化、动态化的来表示,我们开始研究人在城市里面一天到底是怎么运动的、怎么交互的、怎么社交的、怎么通勤的,基于此我们会看到一些非常有趣的结论。
第一个结论,最近我们也看到了很多公司做出的一些结果,可以预测人的位置、预测人的行为,准确率百分之多少多少,其实这是不严谨的。因为你仔细到城市脉搏的地图里面看的时候,你会发现人是有模式的,他在工作日的时候模式非常固定,休息日的时候模式也非常固定,根据我们的模型预算,人有 30% 的时间是完全无法预测的。
为什么?因为人不是机器人,人有探索性,这是和人的心理学、社会学直接相关的。你去哪玩、你去哪购物其实是非常感性的决定,并不是理性的决定。在做真实世界研究的时候是不可以混淆这些概念的。
时空折叠,传统的方法看不到时空有折叠,但是你利用实时、可视化的方法把北京所有的人放在一个图里,实时的去观察他变化的时候,你会发现,真的有那么几群人,你别看他们地点都在一个区域,但是由于他们的作息时间、生活方式不同,他们生活完全没有交集,他们都在国贸出现,但是永远碰不到。这会对城市带来什么影响?非常大的影响,按照一个最基本的理论,这个城市会缺乏活力,为什么?因为不同阶层,不同性质的人没有交集。这对一个城市活力、创新、资源是非常不利的。
人群阶层,其实现在城市的诞生都是基于工业化的结果,因为工业化形成的时候,大量的人涌入城市,成为工人。但是在工业化时代,讲究的是中心网络供给,造成分配资源的时候我们就喜欢把所有的资源堆积一起,用所有中心网络的趋势分散到这个趋势。
比如说在北京形成了金融街、CBD、某某学区这种。根据我们的研究,我们利用不同的角度和方法对人的行为进行研究你会发现很有意思,人新的活动方式,生活方式,连接方式,他的手机位置,你仔细做聚类,分群研究的话,你会发现分群方法完全不一样。这是我们用 AI,机器学习的方法自动的把北京的所有人群做了归类。七类,这是机器学出来的,但是我们的人本实验室仔细分析他们属性的时候,我们觉得还是挺符合人的认知的。
这种方法以前从来没有过,它会带来城市治理思路的改变,会带来规划的改变,会带来公用设施的改变,我们分布学区、分布医院、分布各种各样设施的时候,不能像原来那种南城是一个阶层、金融从业人员是一个阶层,应该按他们的生活方式来分,这样城市才是有活力的。
所以,未来我们洞察城市的方法到底应该是什么样的?我们推出这样一个产品——城市透镜,大家可以看一下。我们会有越来越多的企业会像我们一样,通过丰富的环境和变化,通过城市透镜真实对世界可视化呈现,最后把这些观察和需求,基于 AI 动态模型相结合,在虚拟世界和现实世界转换中,增强我们对世界的感知和认知能力。
而这种感知和认知能力会改变很多商业,昨天和几个客户谈,如果我们有这样几个系统,选址就不需要这样做了,把选址四个点,实时洞察车流、人流,我可能都不需要很复杂就可以做出一个比以前更真实的决定。我坚信这种技术对地产、零售、银行、金融、人类、城市都会有非常大的影响。但是我们有了这样一个面向未来的工具,可以实时的用模拟化、数字化的方式观察到世界,是不是就够了呢?根据我们的发现和研究还远远不够。
所以,这是互联网公司特别容易犯的一个错误,互联网公司做大数据他们研究的是行为模式,他们会推个性化,其实他往往忽略了最重要的,这种形成后面代表着人的心理,人的动机,人的社会学到底是什么?这就需要很多人的智慧,人现在更理解人。
所以我们推出人本数据实验室,我们定位是跨领域的开放平台,用数据来了解我们的心智、身体和环境之间的关系。我们坚信即使我们可以用 AI 建立数据模型、了解城市、理解世界,但是人类的心智和情感并没有就此抹掉,依然是最重要的一部分。我们这样推动人和人的互相了解,才能改变我们看到的一切。
。