大数据落地的大挑战 明略数据在老环境中寻找新路径
“大数据”一词进入了十九大报告中,报告提出要“推动互联网、大数据、人工智能和实体经济深度融合”。换句话说,就是要把大数据这样的先进技术,落地到实际的行业应用和业务场景中,对实体经济发挥真正的作用,创造实在的价值。
从2015年起,“大数据”一词就被移出了Gartner的新兴技术炒作曲线。然而,据有关统计,截至2017年8月初,我国大数据领域有183家企业获得融资,其中A轮81家、天使轮51家,也就是72%的大数据企业仍处于创业初期,商业模式仍有待建立和稳定。
社会科学文献出版社2017年8月出版的《大数据应用蓝皮书:中国大数据应用发展报告No.1(2017)》(以下简称蓝皮书),蓝皮书认为,从应用的角度看,大数据并非一个全新的产业,而是与已有产业融合,对已有模式的改造、升级和替代。制约大数据发展的往往并不是大数据本身,而是大数据所应用的行业和领域原本存在的问题。
2017年10月,创立了三年的大数据与人工智能公司明略数据获得了2017 Venture50的“2017中国最具投资价值企业风云榜50强”。而在十九大期间,明略数据的“公安大脑”作为公安大数据一体化作战平台,为十九大安保维稳工作发挥了积极的作用。据悉,明略数据也在今年10月顺利完成了C轮融资。“在老环境中寻找新路径”,这是明略数据得以持续发展的心得。
- 有温度的交付:落地大数据 -
(上图为明略数据首席运营官唐日新)
明略数据首席运营官(COO)唐日新之前在IBM工作了15余年,主要从事政府行业咨询与销售工作。2014年离开IBM后没有多久,他就加入了明略数据。作为COO,唐日新具体负责组织大数据项目的实施和落地,包括组织建设及运营。
唐日新认为,新旧动能转换只能因势利导,只有新价值逐渐超过旧价值,才会真正发生变革。正如蓝皮书所述,“推动大数据应用的发展,需对不当的行业管理模式进行改革,对既有利益格局进行调整。即便在企业内部,大数据应用也不仅仅是个技术问题,而且是涉及业务流程重组和管理模式变革的问题。”
实际上这一轮的大数据创业,主要是基于国际上开源的Hadoop、Spark等开源大数据技术,因此大数据创业公司在技术上的差异化并不明显。而在把大数据结合行业场景,落地到具体的行业应用中时,又遇到了蓝皮书所描述的问题,因此大数据创业公司集体遇到了“冰点”。
在数据从哪里来、数据怎么用、成果谁买单这个大数据落地“三问”中,数据来源问题始终困扰着国内的大数据企业。实际上对于大数据产业来说,数据来源是整个大数据商业的起点和终点。如果数据不能让渡到大数据企业,而只能由产生数据的用户所有,那么大数据企业就只能最终成为服务型企业。
“信息产业归根结底是服务业,最终的用户交互界面,也就是服务交付的体验,决定了项目、产品或服务的成败。一个有温度的交付服务,能大幅提高大数据项目落地的成功率。如果可以有握手的界面,会更容易。”唐日新表示。
那么,明略数据是怎么做到“有温度”的交付呢?首先是本地化的交付,比如陕西的项目就由陕西当地的团队负责。目前明略数据在河北、武汉、南京等地都有区域中心或交付中心,从本地吸纳人才,向当地用户交付大数据项目。其次,在人才梯度队伍的建设方面,明略数据注重培养和孵化当地的人才,完成本地化的增值服务。再次,明略数据也会与地方政府产业基金合作,共建当地的区域中心,在承担社会责任的同时,也会对当地政府提出要求,推动政府职能的转变。
而在对交付团队的组织建设方面,明略数据尝试了类阿米巴组织模式的改造,把交付团队切分到最小作战单元,实行从项目经理到区域经理的负责制,用类似责任田、承包制的方式,激励项目团队像经营自己的企业一样去服务用户。
当然,明略数据本身有驻场数据科学家,解决“黑盒交付”的问题。也就是说以前的套装软件都是“黑盒交付”,安装结束后就再也不与用户联系;而大数据项目不能是交钥匙工程,必须由驻场数据科学家与用户一起,根据用户的业务场景切实把大数据落地到具体的业务中,这是大数据项目独特的地方。而现在虽然也有用户会要求开放源代码,但实际上也不会真正查看,只是以防不时之需,更多还是依靠驻场数据科学家或工程师解决实际问题。
- 平台化的交付:积累与沉淀价值-
2017年初,明略数据提出了“行业人工智能大脑”,到了8月22日就推出了以中国市场上首个企业级知识图谱数据库“蜂巢”、企业级人工智能统一入口“小明”为核心的行业人工智能大脑“明智系统”,并明确提出了把企业级知识经济作为大数据与行业应用相结合的新方向。
知识图谱是明略数据探索大数据商业模式的平台化产品。截至2017年4月,明略数据80多名人工智能科学家、220多名技术专家已为公共安全、金融、工业与物联网等行业积累了丰富的解决方案。例如,明略数据为公安机构提供SCOPA昆仑镜公安大数据分析应用系统,其核心是对全量数据的关联关系挖掘,可高效完成情报研判分析、重点人员管控、重大事件预测等警务工作。
MDP大数据处理和存储平台、DataInsight大数据分布式计算平台、SCOPA可视化大数据关联关系挖掘应用平台是明略数据自创业以来积累的技术平台。以一个中等省会城市为例,全省7000万常住人口、3000 万流动人口、各种关系 6-7 亿条,在这样的海量数据集上做研判时极难进行多层推演,而利用明略数据的大数据平台处理能力,可以秒级获得预测分析计算结果。
唐日新介绍说,行业人工智能大脑“明智系统”的推出,是对大数据技术服务进行产品化的尝试。尽管明略数据已经积累了多年的大数据技术,可以支持 500节点以上的超大集群、数据之间秒级交互、3秒内快速灾备恢复等,但对于大数据项目的实施和服务来说,之前还是比较依赖人工方式,需要依靠专家到现场为用户投产大数据应用。
而一个平台化的产品则不一样,现场专家从手工部署软件代码,到依靠一个平台化的产品来自动化或半自动化的部署软件代码。这样一方面能大幅提高软件部署效率、提高项目成功率、减少后期运维工作,另一方面还能把部署中积累的业务知识沉淀到平台中,从而丰富平台的业务场景。唐日新介绍,“明智系统”是一个iTunes的概念,为不同行业构建一个基础的平台,在上面可以开发各种行业APP应用,从而满足不同行业的个性化需求。
当然,与其它大数据平台相比,“明智系统”还把数据的对外输出进行了一个转换,把敏感的数据转换成为可以商品化的知识,而知识就可以复制到同行业的其它企业或其它行业。比如,明智系统在金融领域服务于金融监管、内控、风控部门,基于“企业、个人、机构、账户、交易、行为数据”构建金融行业知识图谱,挖掘隐藏在复杂网络之下的关联关系风险和资金流动异常,及时制止欺诈、洗钱、违规行为,有效防范和化解业务风险。从这个过程中提取的风险防控知识,就可以复制到公安行业、平安城市等场景中。
- 在老环境中寻找新道路 -
尽管目前明略数据已经拿到了C轮融资,但唐日新坦言现在大数据行业整体遇到了产业发展中的结构性问题。
首先,大数据技术难以创造出可量化的业务结果。对于公安、金融等领域来说,应用大数据技术可以看到显著的效果。在公安行业,由于人手有限,无法在庞大的视频、图片、地理位置信息等非结构化数据中进行大数据分析,那么大数据技术马上就能提高分析效率,从而直接提高业务成绩。而在金融行业,大数据技术可以起到防范金融风险的作用,也是立竿见影的成果。
但在其它行业和领域,大数据技术所起到的作用较为隐性,难以让用户实实在在感觉到对业务影响力。在工业领域,尽管预测性维护可以为用户带来维修成本的收益,但这只能通过项目实施后带来切实的维护成本的降低,才能让用户感受到大数据的价值,从而愿意为大数据技术付费。但对于大数据技术的定价,往往也就限定在所降低维护成本的上限,比如为用户节约了50万维护费用,那么用户往往也只愿意为大数据技术最高支付50万的费用。
其次,今天的企业用户正在经历从传统IT架构到移动互联网IT架构的转换过程中,企业用户的业务形态也正在快速变化中,而且不同企业用户的IT需求都层次不一、处于转型过程的不同阶段,甚至企业用户自己都不知道下一步的转型将要走向哪里。传统IT体系的边界比较清晰,不同的技术供应商各司其责,但在新的高流动性的企业业务形态下,大数据技术也没能很好的适应并开发出合适的产品,大数据技术供应商与企业用户都处于共同摸索的状态。
在这样的前提下,人工智能是一个可能的突破方向。通过大数据分析积累了行业知识,再把行业知识配置到人工智能引擎中,最后通过人工智能界面对外输出结果,从而让用户可以感受到大数据带来的影响力和冲击力,再结合大数据分析产生的实际业务效果,最终让用户可以认可大数据技术的价值。
换言之,不确定性的人工智能加上确定性的大数据分析、基于人工智能的辅助决策加上基于大数据分析的精准决策支持,以及人工智能的友好交互界面加上大数据分析的自动化引擎,这就是在企业的“老环境”中找到的“新道路”。
唐日新坦言,“明智系统”对于明略数据来说也是一个全新的尝试,之前的大数据技术都偏应用方向,可以带来短期的变现,而“明智系统”则是一个类iTunes的基础技术平台,还需要第三方技术合作伙伴在其上开发不同的应用,构建起了一个完整的生态,才能真正创造“明智系统”的价值。
好的消息是十九大报告已经发出了大数据技术要与实体经济深度融合的号角,明略数据作为大数据与人工智能行业的先行者,已经开始了深度融合的尝试,接下来在“互联网+先进制造”等新一轮政策的推进下,大数据产业有望迎来真正的海阔天空。
责任编辑:黄玉叶