星河互联CEO傅淼对话舍恩伯格:小企业如何玩转大数据?
近日,星河互联对外宣布了自己的战略升级计划——从1.0版本的“互联网联合创业平台”到星河互联2.0时代的“一站式互联网创业服务开放平台”,为互联网创业者提供项目创建、资金、联合创业、融资、空间、研发、招聘、市场、培训、创业保障、财务管理等一站式专业创业服务,并对所有创业者开放。
发布会上,星河互联CEO傅淼和“大数据第一人”维克托•迈尔-舍恩伯格进行了一场精彩的对话。独到的思考角度和切合创业实战的提问,详细的阐述和精彩的答疑,一次关于大数据的头脑风暴,满满的都是大数据火花。
以下为对话实录:
星河互联 CEO 傅淼
清华大学精密仪器系学士、硕士,美国南加州大学计算机工程学硕士。在中美两地互联网及IT领域有近二十年的成功经验,先后成功地投资过多家优秀的互联网企业,也曾为全球多家大型IT企业例如东芝、Gateway、联想集团、华为技术等公司提供咨询服务。
大数据应用本身就需要占用时间和资源,初创企业如何平衡?
傅淼: 首先维克托讲到,对初创企业来讲,应用 大数据的概念 ,能够让我们的创业更有效,成功率更高。但是对我们初创企业来讲,资金很少,各方面的资源很少,面临的压力很大,我们需要在最快的时间做出最正确的决策。反过来讲,你要收集大数据,要管理这样的数据,要分析这样的数据,本身也意味着在资源、时间上的投入,如何在这两者之间取得一个平衡?
维克托: 这是一个非常好的问题,也是一个非常重要的问题。作为创业者你们所面临的问题是,每一天都有十件最重要的事情,你只有时间做其中的5件,所以你必须要选。在一定程度上,这种选择总是会犯错误,但是你还是要努力去试,你不要太担忧选择正确的事,因为你选择太多了,没有办法下决定,不要这一天过去了,你还没有做任何的决定。我的第一个建议,如果你需要做决定就去做,而且快速做决定,分配你自己的时间资源,哪些事需要做,哪些事不需要做。
第二点,如果你有这样的能力得到外面的帮助和指导,你一定要用。苹果非常著名,在90年代的时候,它失去了方向,因为他们有一个规则,他们不接受所谓发明的东西,不是苹果发明的我们就不接受,来自其他公司的东西他们不用,这是很糟糕的态度,新创企业更是如此,好的态度是倾听别人的指导,接受别人的指导,接受来自外面的帮助,更多的是听从外面的建议,尤其是对于那些愿意对你伸出援助之手的人。
下面我要讲的是数据,作为一个初创企业,一定要保持长期的思维,因为在你初创企业的时候,你太专注于眼前了。如果你心中总不忘远方的话,至少你能思考数据的价值怎样在长期帮助你,如果你不收集数据,不存储数据的话,你在未来就没有办法利用它。即便是说现在没有做任何客户数据的大数据分析,但是至少也应该捕捉这些数据,存储这些数据,因为你有可能在未来,有必要使用它,而且在未来有可能对你的价值非常大,这就是我的三个观点。
相关性和因果性在处理实际问题时该如何区分应用?
傅淼: 第二个问题,你作为大数据领域顶尖的思想家,你提出了关于大数据领域的一些很先进的理念,其中很重要的一个就是在大数据时代,我们关注的是,事件之间的相关性,而不是之间的因果关系,我觉得这个可能是你非常核心的理念,这个无论在学术界还是产业界引起了很多的争论。很多看过大数据时代这本书的人,对这个问题也有很多的看法。对于一个创业者和CEO来讲,我们需要知道,我们发现了问题,我们发现了相关性,但我们需要解决这个问题的时候,需要知道哪个是原因,哪个是结果,这方面有很多的困惑和争议,希望维克托给大家更深入的一些解释。
维克托: 确实在这方面大家有很多的争论,这是很好的事情,我们人类,我们想要理解世界,这一点是我们人类与生俱来的,我们特别想知道世界发生着什么,为什么。我们是怎么样理解世界的呢?我们观察,我们通过用眼睛看,之后我们就试图看到因果关系,但是事实是,我们觉得我们看到了原因,但是事实上并非是真实的原因。所以我们对于世界真正了解的,远远不像我们想象的那么多。有些时候如果你不知道原因,你看到一种相关性,采取行动是非常合适的。
我举一个例子,比如说在医疗和健康行业的一个创业者,19世纪的一个匈牙利人,当时他在欧洲一家医院工作,那时候有很多女性生完孩子就发生一些感染去世了,所以他就有这么一种想法,是不是应该说,医生在接诊之前,应该好好把自己的手洗干净,这样的话,不要把细菌传给这些产妇,所以他就一直用这个来推理,他开始在自己的医院里,迫使每一个人都要洗手,死亡率迅速下降,几乎接近于零,完全成功,这是纯相关性对吗?所有的同事,整个欧洲所有的其他医院的医生说,我们才不洗手说,因为我们并不知道为什么洗手有助于降低死亡率,这是愚蠢的。这就意味着几十万女性就要无辜死去,而这完全是没有必要的死去。如果有一件事能够起到成效,你就该做它。
那么渐渐的你可以再仔细调查原因,但是作为一个初始的创业者,你看到一个相关性就要迅速采取行动,你一定要采取实用主义思维方式,要使用这样的相关性,不要那么固执愚蠢,就像19世纪欧洲的医生一样,不洗手,直到他知道所有的一切关联的时候。其实没有人在任何时候知道所有的一切。
创业需要速度,采样和统计分析相对大数据来讲速度更快,二者是否矛盾?
傅淼: 这就引出另外一个问题了,刚才我理解你的意思,行动的速度很重要,效率很重要,你有另外一个理念,效率比准确性更重要。但是整个大数据的核心的理念,现在我们面对的是一个完整的数据的集合,而不是靠早期,我们必须通过采样和统计分析的方法来了解世界。但是从另外一个角度来看,采样和统计分析已经非常成熟了,采样所需要的时间和收集整个大数据需要的时间,时间资源和效率是更高的,这两个理念之间是不是看起来有点矛盾?
维克托: 其实没有矛盾,只是不同的方法。如果你准确知道你所寻找的数据是什么,那么你就可以使用采样的方法;如果你没有这种能力综合全面收集数据,也可以采取采样的方法;如果你不得不采取采样的方法,情况仍然会是这样。
但是我们的观点是,在更多的情况下,我们能够收集更多的数据,能够捕捉更为全面的数据,如果我们能做到这一点的话,那么我们的力量,要比采样大得多,因为我们基本上已经接近全部的数据了,我们就可以让数据说话,我们可以使用数据创造问题,提出问题,而不仅仅使用数据回答我们已经有的问题。
我再次告诉你一件事,我不是一个很聪明的人,所以我往往并不能提出正确的问题。我觉得使用数据,我就可以得到数据的指导,走上正确的方向,引向正确的问题。大家想想,把数据当成是巨大的资源,它是一个导师,它是一个工具能知道你,它比任何所有其他的东西都更有力量。
傅淼: 以前我们用采样和统计分析的方法是为了解决寻找一个问题的答案,但是实际上往往更重要的是,发现更多的新的有价值、有意义的问题,而这个是大数据带给我们以前享受不到的对视野的开拓。发现新的问题,往往是作为一个创业者更重要的能力。
维克托: 是的。
如何在中国使用大数据?如何进行大数据领域的创业
傅淼: 我再问一个比较实用的问题。我们一直讲用大数据的理念和方法,怎么帮我们更好地创业,更成功地创业,同时还有一个问题,大数据领域,本身就是创业的一个很热的领域,那么现在在国内,比如说在中国,维克托对中国也很了解,在大数据领域本身作为一个商业领域来看,在这个方面有哪些你认为比较不错的机会可以跟我们在座分享。我们在座有一些 企业 本身就是从事大数据的行业,你对他们有一些什么样的建议?
维克托: 这个问题太好了,我可以提供某些专业知识,你们很多人都知道你们各自的行业。如果你们要愿意,有能力听取这样外部的反馈,你们可以做得更好。我不会作为教授来教你们怎么做,但是我曾经很多年非常热衷于关于中国的数据,其中有两个原因,一个是分析、统计技能等很多方面,来自于中国,可能是西方所缺少的。第二,让我感到非常兴奋的,比如说在新加坡,或者说卢森堡,这些都是小城市,卢森堡只有几十万的人,他们不可能有这样的规模,在中国有极大的规模,大数据是一种指数级的增长,随着数据量的增长,你们会具有这样巨大的优势。对中国来讲,并不仅仅有悠久的历史,而且也是非常强大的一个国家,你们有这样的属于自己的独特优势,这种规模可以给你们带来很大的作用。
创业公司只有“小数据”怎么办?
创业者提问: 我们想用大数据做一些决策或者是创业,但是我发现普通的创业者手里面可能没有大数据,只有小数据,非常局部的数据,我想问一下,小数据和大数据有什么关系,如果没有很全面的数据,数据还准吗?怎么利用大数据的思维在只有很小数据的时候能穿透我们数据的局限性,能做一个大数据的事情。
维克托: 非常感谢你,我想这是一个非常好的机会澄清一下关于大数据的问题,有很多人认为,大数据几十亿的数据才是大数据,不是这样的情况。实际上大数据是数据比较综合、全面的获得关于一个具体的现象,关于一个具体情况的数据,如果这个情况只有3000个数据点,你所收集的2999个数据点的话就是大数据的,这就意味着即使是一些小的创业公司也可以做大数据,也是很好的。
如果一个小的创业公司他们是做3D打印的,比如说给这些3D打印机加一些传感器,以便捕捉这些数据,随着时间推移,不断改进3D打印机。开始的时候,他们的传感器只是在几十个打印机上,这些传感器不断收集数据,每一秒、每一天、每一周、每一个月都要收集数据,实际上只有十几个打印机,他们就掌握全面的数据了。可能他们不知道其他的3D打印机发生什么情况,有什么问题,但是几周以后,他们就非常了解了,到底这十几个打印机会有什么样的情况。
所以大数据是一种相对性的概念,这种相对性的概念给我们带来一种能力,能帮助我们创业公司克服一些障碍。
傅淼: 这是一个很好的机会解释大数据的大到底是什么意思,并不一定是说绝对量上要特别大才是大数据,而是跟以前采样、统计的方法不同。你观察的数据从绝对量上不是很大,但是你观察的是全局,从全局的基础上做一些分析,对你下一步的工作做一些指导,这是大数据的概念。这种基于全局的分析和以前基于采样和统计的分析,是非常不同的思维方式,在解决问题和思维问题的看法的时候也是非常不一样的。
责任编辑:王培