数据垄断会不会导致互联网瘫痪?
\n编者注:福布斯的Jon Bruner最近对Tim O’Reilly进行了采访,双方谈到了
\n
\n互联网的数据垄断问题。认为数据垄断的可能性是真实存在的,但是会受到不断创新的数据收集方式的抑制。此外,由于人们对垄断的天然厌恶,即便其出现,可能也会成为创新企业的机会。
Google像下图这样的车跑遍了在全球的各个街道,Google借此掌握了一个先进的道路情况数据库。收集的这些数据将会成为其无人驾驶汽车的关键部件,而这个数据库要想从头复制一遍,其代价也许要高得令人生畏。但是Google所绘制的道路状况仍有机会让有些创新企业家用不同的方式进行绘制。
Tim O’Reilly上周跟我谈了互联网公司收购大规模专有数据集一事。“现在出现一股这样的势头,即数据在某些情况下成为垄断势力之源,”他告诉我,把数据比作“Intel Inside”之于市场准入门槛。他稍后补充道:“未来还会有很多创新,我相当可以肯定还有空间容纳更多这样的东西。”其风投合伙人Bryce Roberts以一篇文章跟进,预测了Web 2.0的终结—也即我们10年弹冠相庆的用户生成数据(博客、共享照片、留言板)的自由存在,正被密码保护阻隔在社交网络之外。
数据垄断的可能性真实存在,不过我认为其崛起会受到仅几年前才出现的数据收集方式的抑制。这个世界的数据不是一家运营商就能掌握的。
以Google Maps为例:通过派遣一辆辆的遥测汽车到全球各地,依靠高清晰照相机、激光测距仪以及GPS接收器来收集数据,Google已经建立了一个高度精确的道路数据库。这一数据对该公司开发商用自动汽车的的努力极为重要。如果这些汽车普及起来的话,Google将会由于道路数据的质量而拥有了巨大的商业优势,而对于后来白手起家想要依法炮制者来说,其代价将会是十分高昂的。
不过无论Google打算如何共享或者不打算共享这些道路数据,其所映射的道路就在那里,别的创新企业者还是可以去绘制自己的道路数据。实际上,Google收集道路数据的办法,也即购买和装配汽车,然后雇人驾驶穿行全球各地的每一街区,这种办法早已有点过时。你可以想象,下一个伟大的道路数据库可能是由照片共享网站上带地理标记的图片拼凑汇编而成的3D模型,或是来自于手机或车载资讯通的位置数据聚合而成,藉此可找到道路中心线和推断出速度限制。
当然,社交网络有点不一样:具有隐私意识的用户已经把海量的有价值数据提交给Facebook,然后用密码锁定起来,对于中立的网络爬虫来说其可达性没那么高。一旦你将个人生平和消费喜好交给了Facebook,Facebook当然就可以用它们去赚钱,不过这些个人资料和消费喜好仍旧可以存在于Facebook之外的世界。可以出现在各种各样其他的东西上,等待着另一家现在也许还没有出现的公司的接收。除非Facebook找到让你的生日归其版权所有的办法,其数据库的巨大价值一样可以为其他寻找相同数据的新公司提供巨大的激励。
而Facebook为了成为整个社交互联网的基础平台,不管怎样都会让自己的用户数据具备一定程度的自由度。只要用户允许,该网站的API允许外部应用以与用户类似的方式操作—发布状态更新,或者看到“like”。
通过截屏这种方式,你甚至无需得到用户许可就可以获取有价值的信息。我曾经写过脚本,通过提交正确的cookies来扮演一个名为 Testingoutsome Features 的Facebook成员,此人20岁,是阿尔图纳的宾州中央铁路公司的一位退休消防员,同时是生育运动的粉丝。一个人在自己出生15年之前就已经退休了,还有就是此人有几天每秒钟浏览多达10个人的档案,对于这些如此不协调的信息Facebook一点反应都没有。我还可以提取大概17.5万左右在萨拉·佩林的Facebook墙上留言的人位置信息—这些都属于倘若未经用户许可API访问不到的数据。诚然,Facebook可以突然关闭访问,让自己成为一座牢不可破、仅供自己享用的喧嚣之城,但实际上看,市场的某种东西让Facebook有理由把自己的部分数据泄漏出去。
某些很有前途的数据尚未被大规模收集,也不会像状态更新数据那样容易受到垄断。上周在Where会议上我交谈过的大多数人对于获取周边数据的新办法均感到兴奋。像Tim在接受我的采访中提到的Alohar Mobile这样的公司,希望收集我们不断释放出来的各类零散数据—比如通过智能手机的感应器收集我们的运动信息,通过Twitter feed收集我们的想法,然后将其转化为内容充实的数据集,据此可推断出一些有用的结论。其结果可能比你所认为的审慎数据还要有价值,因为周边数据可以被不断地收集,而且这些数据并不需要人定期地提供,比方说,到一家喜欢的饭店签到。这还提供了非常棒的背景信息—因为不断的测量使得理解行为变化更加容易。
大公司在获取周边数据方面显然更有优势(如果Facebook决定开始收集手机感应器以外的信息的话,其庞大的应用库会赋予该公司巨大的优势)不过从某方面看,这类数据要想垄断会更加困难。