自建SaaS数据采集引擎,“发源地”想打造B2B数据交易平台
根据《 2015 年中国大数据交易白皮书》透露的数据,2014 年中国大数据市场规模达到 767 亿元,同比增长 27.83 % 。预计到 2020 年,中国大数据产业市场规模将达到 8228.81 亿元。大数据市场的饼画得很大,但怎么交易始终是个问题,由于数据的特有属性,数据交易中存在的定价问题、敏感隐私等争议不断。
尽管问题犹存,随着大数据上升为国家战略,2015 年 4 月贵阳大数据交易所成立,同年 11 月,中国数字化营销服务产业联盟正式发布了中国互联网行业首部程序化营销标准,发源地 的创始人马建军认为,在政府背书、大数据交易行业标准化进程加快的情况下,建立一个 B2B 数据交易电商平台事不宜迟。
发源地于 2015 年 10 月上线,定位为大数据交易平台,以 B2B 模式切入数据交易市场,链接数据开发商及中小型企业。互联网开放数据、企业或机构的内部数据等数据源,经过发源地 SaaS 采集引擎接入后,以数据、API 和挖掘算法等形式沉淀在交易市场,提供给数据需求方,满足需求方对数据分析、API 调用、运营数据、客户营销等方面的数据需求。
马建军介绍说,目前大数据交易的线上线下渠道都非常低效,线上一般通过 QQ 群、威客、淘宝等平台进行交易,线下则采取客户端单机采集工具、百度等渠道搜集数据。对需求方来说,成本高、效率低,交易无保障,无法动态更新。对数据供应商来说,主要存在数据资源无法复用的问题。据马建军掌握的数据,现今数据交易的利用率还不到 30% 。
马建军认为,中小企业对数据的需求日趋增长,数据对公司运营发展甚至是刚需。比如说,某家 O2O 酒吧 APP 需要冷启动数据、生物制药咨询企业需要搜集数据源、支付产品需要自动化挖掘客户等等。
在发源地,作为 B 端需求者,你既可以购买现成的数据产品,也可以发布数据定制需求。作为 B 端数据供应商和开发者,你能在发源地平台供应源数据或者数据加工产品,也能拍下需求者的定制订单,购买发源地开发的数据加工应用增值服务。
一般的数据交易平台会通过收取交易佣金盈利,贵阳大数据交易所对每笔交易收取 40% 的佣金。马建军介绍,发源地目前并不会对数据交易双方收取佣金,一方面,这是为了吸引数据供需双方促成交易。另一方面,发源地认为,对于供需双方来说,被平台收佣不仅会增加成本,而且交易体验会变差。
取而代之,发源地希望通过增值服务盈利。在积累交易和数据的同时,发源地将会开发 SaaS 工具增值和交易流程增值的服务,为企业搭建私有云等。发源地现在已经能提供数据脱敏服务,但为了引流暂未收费,未来会在数据处理、数据储存、数据托管等服务上收费。马建军介绍说,数据经过脱敏合格后才能交易,但目前超过 60% 的数据供应商没有自己的数据脱敏技术和工具,即使有,也存在脱敏不全的现象,这时候就需要发源地提供脱敏服务帮助。
对于数据交易中的隐私争议,马建军认为,开放性数据源一般不存在这个问题,用户在网上自愿公开的信息是默认开放的,像八爪鱼、火车头之类的工具抓取的的这类公开数据很少存在争议。对于非开放型数据,用数据脱敏技术可以解决隐私问题。隐私问题能通过脱敏解决,数据版权问题也需关注。马建军强调,无论是开放数据源还是内部数据源,都存在数据版权问题,对于大平台的数据版权,发源地采取合作的方式,平台开发者使用 SaaS 引擎采集接入的互联网公开数据,发源地也会提供 “认领” 服务。
关于数据交易产品定价问题,发源地采取两种模式,已经成型的可以反复交易的数据产品,采取供应商或开发者定价的方式;需求方需要定制数据的,由需求方按照预算和估值定价,供应商或开发者进行 “抢单”,需求方验收完成后交易完成,交易动态会在发源地平台实时更新,通过 1:10 兑换的 “源宝” 虚拟货币也能为交易提供保障,尽量规避纠纷。
据发源地提供的数据,15 年 11 月上线至今,发源地已经积累了超过 4 万企业用户,共产生超过 900 笔交易(客单价最高 20 万)、调用 800 万次 API、沉淀超过 6000 个数据源。马建军对 36 氪作者表示,今年平台会争取实现 5000 万流水并实现盈利。
发源地现今的团队规模有十几人,创始人马建军拥有 8 年数据服务行业经验,曾供职腾讯研发、测试岗,团队人员来自 IBM、百度、阿里等公司。发源地目前正在寻求 1000 万人民币的 Pre-a 轮融资。
国内的大数据市场已经有几个先行者。例如已经登录新三板的 数据堂 为数据需求和供给提供对接平台,他们建立了网上数据商城 “Data Mall”。发源地模式较为接近 36 氪此前报道过的国外企业 Import.io (可从网站抓取数据的数据析取平台),这家平台刚获得 1300 万美元 A 轮融资》。