TalkingData CEO崔晓波:麦肯锡和Gartner都栽过的坑——数据坑

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
TalkingData CEO崔晓波:麦肯锡和Gartner都栽过的坑——数据坑

9月11日,以“知机识变 有唐之盛”为主题的T11 2017暨TalkingData智能数据峰会在北京举办。此次峰会吸引了来自来自斯坦福、哈佛、清华、人大、同济等高校和政府、研究机构的学者,以及来自IT、 大数据 、 互联网 、金融、地产、零售、教育等行业的技术专家与企业管理者参加。

本文节选了TalkingData CEO崔晓波的演讲,以下内容根据演讲速记整理(有部分删减):

我们今天的主题是知机识变、有唐之盛,来这个会场之前我们都发了一个很酷的邀请函,很多朋友给我发来了贺信,说你们的邀请函很酷,清明上河图里面的人都活动起来了。我们今天的话题就想讨论一下,因为我们所有人都在感觉好像身边的世界在变、社会在变、技术在变。由于技术的高速发展,我们带来的各种各样的商品,已经由稀缺变得比较富足了,消费者的选择变得非常多。其实我们消费者也在变,90后、2000后在随后十年里就会主导市场。我们了解变化、了解客户、了解消费者,

我们今天要跟大家如何利用数据的方法去洞察这个世界的变化,以及应对这个世界的变化。 这两天我们准备了100多个演讲。希望能够给大家带来不同的角度和思考。

在过去的十年里面,中国的变革主要推动力是什么?是移动互联网、物联网。我们仔细去看过去六年的数据可以注意到,不管是移动手机的数量,还是爆发的物联网领域,还是可穿戴设备的增长都是指数级的,不是一年10%、20%的增长,更多是成倍成倍的增长。但是这种趋势,其实大家并没有意识到。

随着去年到今年 人工智能 技术(特别是感知计算,计算技术)的高速发展,整个世界数字化的速度在加快。我们通过人脸把模组的一些特征开始数字化,通过无人车测量街道和城市等等。所有这一切数字的爆炸速度其实已经到了一个难以置信的程度,截至到今天,我们每天产生的数据量就非常有可能达到351EB。

但是如果我们将来的存储堆积起来,堆积整个中国的大地都做不到。如果我们的技术不能提高的话,我们就会在一个浩浩荡荡的洪流里面,不知道怎么取舍,不知道未来的世界会变成什么样。

然而大部分人的认知还是线性的, 我每天见到小孩的时候,我没觉得这个小孩样子变化了。但是如果你突然把时间线拉长,一个月、两个月你再见到他你会觉得变化怎么这么大。实际上指数级增长前面都是有点欺骗性的。因为他刚开始增长的倍数虽然大,但是基数小,大家往往是感觉不到的。

这里我其实想给大家分享两个例子,让大家感觉一下,哪怕是专家也是固守原来的线性思维。 20世纪80年代的时候,那个时候AT&T(美国电话电报公司)请了麦肯锡帮他们做一个决定,那时手机刚刚出现,所以他们要决定是不是要进入手机行业。麦肯锡给出的预测是,到2000年手机的数量不会超过100万部,为什么?因为手机非常的笨重和昂贵。但是实际情况是什么?2000年手机就超过了2亿部。

另外一个例子,2009年Gartner预言,诺基亚的手机和操作系统将在2014年统一市场,成为第一大操作系统,将会占据40%以上的出货量。而安卓将仅为10%左右,但是实际情况大家都知道,塞班在2012年就已经关门大吉了。安卓最后甚至超越了苹果,成为第一大手机操作系统。

我们仔细分析过这两个案例, 我们发现,这些专家手里都有大量的数据证明,那个时候不管是手机,还是智能操作系统的增长都是指数级的。但是为什么还是会做出一个每年增长10%、20%的预测,这就是因为人的思维其实是线性的。

那么,举一个正面一点的例子,基因测序的例子,1991年人类决定启动一个宏大的计划,就完成整个人类的基因测序组,这个计划整体投资了60亿美元,预计耗时15年。这意味着什么?大概应该是2005年能够把这个测序完成。但是实际情况是,时间过了一半,1997年的时候整个测序的工作只完成了1%。

那时候很多专家说花了这么多钱,但是这个项目肯定是失败了,肯定测不完。但是有一个人发现了一个规律,每年完成测序的数量是呈指数级增长的,最后实际情况是什么?大概花了十年左右,整个测序工作就完成了,预算只花了整体预算的一半,30亿美金。

发现这个规律的那个人是谁?就是奇点大学的创始人。所以大家一定会觉得,这两个例子好象离我们很远,但是其实不是,因为在我们服务我们客户的过程当中,天天都可以看到这样的例子。 会有很多客户说应该是这样,但是我觉得应该是那样,你必须把这个数据给我调整,对不起,这不是TalkingData应该做的。我们的客户应该是相信数据,信仰数据的,只有信仰数据的人和企业做出的决策才是数据驱动型的。

这种决策往往也是指数级的,这会贯穿我们今天所有的演讲。这是我今天跟大家分享的一个案例,让大家有点感觉。

看一组数据,人类的习惯在被改变,购物70%、社交100+分钟、外卖2.87亿、出行30%。我不知道大家感觉怎么样?大家是不是感觉还不错?好像是这么回事,我看起来这个数据还挺舒服的?但是坦率的说,如果大家看到这组数据的时候没有异样的感觉,你们的思维就是线性的,这就是我们以前研究市场、研究消费者惯用的方法,因为我们已经习惯了用一种片面的、基于时间切片的、基于很小样本量的、基于非常弱的论据做出很多决定。

所以我们在过去五年里面,从企业、政府、各种各样的组织观察到的情况:他们只要看到这样的数据就做出一个非常大的决策。但是这真的是我们指数级的社会、世界里面应该采用的洞察的方法吗?当然一定是NO,一定不是。那种方法是什么?如果我们面临这样一个世界,是在指数级变化,不停在变,但是我们收集数据的能力、速度、维度已经达到前所未有时代的时候,我们怎么理解这个世界?我们认为我们看世界的角度会发生很大的变化,我们以前看世界是由实体物质化,会向个数字虚拟化的方向去转变。

大家可能不太理解这句话,但是我可以给大家分享两个案例,因为大家都知道谷歌在做 无人驾驶 ,我们参观过还是挺震撼的。它为了做无人车,放了很多勘测设备,包括无人车本身,然后在一个城市里面不断的收集数据,为什么收集数据?是因为避障吗?为了做模型吗?都不是,最后我们发现数字化的城市,他们把所有的建筑、街道、道路、树木、障碍物,甚至行人都是数字化表示的。

这是最好的方法,在虚拟的世界里面增强AI对世界的认知。我们也非常理解,如果你真的让一辆无人车上路跑的话,估计跑10万公里就会碰到故障,因为你怎么可能让AI迅速理解真实世界,所以我们要数字化、虚拟化,用方法帮助AI了解人类。所以这是我们看到的趋势。

所以,我们研究很多事物的方法和角度一定会发生非常大的变化,在现在的城市里面,政府其实非常需要一些与人相关的基础的数据,不限于他们的人工统计学信息,我们最近和国家统计局合作里面,包括第七次人口普查里面都发现有很多的痛点和以前做不到的事情。 十年一次普查,抽样率1%到3%,而且数据是非实时的,我们完全感觉不到一个城市是变化的。基于我们的项目,我们把所有的数据实时化、动态化的来表示,我们开始研究人在城市里面一天到底是怎么运动的、怎么交互的、怎么社交的、怎么通勤的,基于此我们会看到一些非常有趣的结论。

第一个结论,最近我们也看到了很多公司做出的一些结果,可以预测人的位置、预测人的行为,准确率百分之多少多少,其实这是不严谨的。因为你仔细到城市脉搏的地图里面看的时候,你会发现人是有模式的,他在工作日的时候模式非常固定,休息日的时候模式也非常固定,根据我们的模型预算,人有30%的时间是完全无法预测的。

为什么?因为人不是 机器人 ,人有探索性,这是和人的心理学、社会学直接相关的。你去哪玩、你去哪购物其实是非常感性的决定,并不是理性的决定。在做真实世界研究的时候是不可以混淆这些概念的。

时空折叠,传统的方法看不到时空有折叠,但是你利用实时、可视化的方法把北京所有的人放在一个图里,实时的去观察他变化的时候,你会发现,真的有那么几群人,你别看他们地点都在一个区域,但是由于他们的作息时间、生活方式不同,他们生活完全没有交集,他们都在国贸出现,但是永远碰不到。这会对城市带来什么影响?非常大的影响,按照一个最基本的理论,这个城市会缺乏活力,为什么?因为不同阶层,不同性质的人没有交集。这对一个城市活力、创新、资源是非常不利的。

人群阶层,其实现在城市的诞生都是基于工业化的结果,因为工业化形成的时候,大量的人涌入城市,成为工人。但是在工业化时代,讲究的是中心网络供给,造成分配资源的时候我们就喜欢把所有的资源堆积一起,用所有中心网络的趋势分散到这个趋势。

比如说在北京形成了金融街、CBD、某某学区这种。根据我们的研究,我们利用不同的角度和方法对人的行为进行研究你会发现很有意思,人新的活动方式,生活方式,连接方式,他的手机位置,你仔细做聚类,分群研究的话,你会发现分群方法完全不一样。这是我们用AI,机器学习的方法自动的把北京的所有人群做了归类。七类,这是机器学出来的,但是我们的人本实验室仔细分析他们属性的时候,我们觉得还是挺符合人的认知的。

这种方法以前从来没有过,它会带来城市治理思路的改变,会带来规划的改变,会带来公用设施的改变,我们分布学区、分布医院、分布各种各样设施的时候,不能像原来那种南城是一个阶层、金融从业人员是一个阶层,应该按他们的生活方式来分,这样城市才是有活力的。

所以,未来我们洞察城市的方法到底应该是什么样的?我们推出这样一个产品——城市透镜,大家可以看一下。我们会有越来越多的企业会像我们一样,通过丰富的环境和变化,通过城市透镜真实对世界可视化呈现,最后把这些观察和需求,基于AI动态模型相结合,在虚拟世界和现实世界转换中,增强我们对世界的感知和认知能力。

而这种感知和认知能力会改变很多商业,昨天和几个客户谈,如果我们有这样几个系统,选址就不需要这样做了,把选址四个点,实时洞察车流、人流,我可能都不需要很复杂就可以做出一个比以前更真实的决定。我坚信这种技术对地产、零售、银行、金融、人类、城市都会有非常大的影响。但是我们有了这样一个面向未来的工具,可以实时的用模拟化、数字化的方式观察到世界,是不是就够了呢?根据我们的发现和研究还远远不够。

所以,这是互联网公司特别容易犯的一个错误,互联网公司做大数据他们研究的是行为模式,他们会推个性化,其实他往往忽略了最重要的,这种形成后面代表着人的心理,人的动机,人的社会学到底是什么?这就需要很多人的智慧,人现在更理解人。

所以我们推出 人本数据实验室 ,我们定位是跨领域的开放平台,用数据来了解我们的心智、身体和环境之间的关系。我们坚信即使我们可以用AI建立数据模型、了解城市、理解世界,但是人类的心智和情感并没有就此抹掉,依然是最重要的一部分。我们这样推动人和人的互相了解,才能改变我们看到的一切。


2017年8月25日,亿欧智库正式发布《2017人工智能赋能医疗产业研究报告》,该报告总结八大应用场景,从产品形态、业务模式、公司现状等角度对各场景进行深度解析,进而对我国医疗人工智能公司宏观数据和巨头企业布局进行盘点,最后提出“人工智能+医疗”未来发展机遇与挑战。了解更多报告内容,请点击: 《2017人工智能赋能医疗产业研究报告》

TalkingData CEO崔晓波:麦肯锡和Gartner都栽过的坑——数据坑

本文系投稿稿件,作者:Kian Gohar;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

本文被转载1次

首发媒体 亿欧网 | 转发媒体

随意打赏

talkingdata 崔晓波gartner魔力象限gartner曲线gartner麦肯锡大数据麦肯锡中国麦肯锡数据麦肯锡思维
提交建议
微信扫一扫,分享给好友吧。