数据观专访中科天玑程伯群:构建生态体系有利于大数据产业理性有序健康发展

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

2016年12月8日,为期三天的BDTC2016中国大数据技术大会在北京新云南皇冠假日酒店盛大开幕。为了更好地探讨大数据技术生态系统的现状和发展趋势,交流大数据技术实践经验,进一步推进大数据技术创新与应用,展示国内外大数据领域的最新成果,BDTC2016除第一天的全体大会外,还精心策划了16场专题技术和行业论坛,涵盖了大数据分析与生态系统、大数据云服务、HPC大数据、推荐系统、数据安全与隐私保护、人工智能、生物医药大数据、交通旅游与出行等主题、数据开放与政府治理高层沙龙。超过130位技术专家,将奉上100多场精心准备的技术演讲,与参会者聚而论道。

会上,数据观记者采访了中科天玑数据科技股份有限公司市场部总经理程伯群。他表示,构建一个合理有序的大数据生态体系,可以通过资源整合,避免资源浪费,可以促进大数据行业的理性、有序、健康持久的发展。

   技术的推广需要单纯一点

   记者:天玑团队是BDTC中国大数据技术大会创始人团队,做为天玑团队的一员,你们当初创立这个大会是基于什么样的初衷?

程伯群:在2000年之后随着互联网行业的快速发展,大数据技术就应运而生。在IT的PC时代,我们被沦为外商的加工厂,在网络时代我们也没有主动权,在看到大数据应用需求的时候,我们希望在大数据技术方面能和发达国家站在同一个起跑线上,甚至希望能做到弯道超车。

基于此,我们天玑团队积极参与大数据国际开源组织,在2008年联合高效科研机构和互联网企业,做了一个Hadoop技术沙龙,这就是现在这个BDTC大会的前身,后来很快就演变成千人技术大会。从08年到现在,已经走过来9年,大会也办了10期。

大数据大会一直没有正式的联合企业来做,主要是考虑企业进入的话,多少会涉及一些商业的氛围,不利于新技术的普及和推广。

   记者:您眼中的大数据生态体系的是怎样的?中科天玑在大数据生态体系构建当中扮演什么角色,又在做些什么呢?

程伯群:大数据生态体系从不同的角度来看,有不同的解读视角。例如:最简单的从数据角度来看,数据的生产——数据加工处理——终端数据消费,就构成了的一个简单的大数据生态体系。还有,如果从产学研角度来看,就是企业、科研教育和政府相互构成的一个大数据生态体系。

单纯从大数据产业生态看,我们可以用四个同心圆来表达。其中最核心的半径最小的圆可以用来表示大数据的核心技术,这个圆中包括理论、核心算法、软件、平台等;往外延伸,第二个圆就是大数据产品,包括大数据采集、存储、处理、分析和可视化等,支持大数据全生命周期管理;接下来第三个圆就是大数据应用,包括政府应用、行业应用、企业应用等;在应用之外第四个元,也就是最后一个圆就是大数据产业环境,包括资本、渠道、政策等。

中科天机是一个产业学研相结合的一个团队,虽然我们在不同的同心圆里面都有参与,但是我们重点参与的还是第一个圆——核心技术,我们通过大数据理论探讨和核心技术的研发,延伸到大数据产品落地,再联合同行一起构建行业解决方案,最后衍生到产业环境,包括政府政策咨询、上下游渠道拉伸及产业资本合作等。天玑团队愿意与政府、企业、同行一起,共同打造一个完整的生态体系。

  大数据时代,专注做自己最擅长就是竞争优势

   记者:中科天玑最初是以舆情热点分析、信息挖掘业务为起点的,在同类型竞争产品当中的优势在哪里?

程伯群:其实,中科天玑一直是专注智能信息处理的专业团队,当然包括舆情热点分析和信息内容挖掘,也包括当下的大数据和人工智能相关的技术。

说起舆情热点分析,首先要做数据采集,我们天玑在采集这块,就细分了很多小组,针对不同的采集通道,专门进行研究,包括网页、社交媒体、音视频网站以及相应的移动App等。比如对于视频网站的视频、字幕、弹幕、评论、播放量等,我们都安排有专门的技术小组进行分别负责。在有些比较难的方面,比如互联网金融监测,我们首先要实时动态的采集P2P网站上的金融产品、产品购买、产品评价等信息;再利用我们的技术进行还原、识别;数据还原之后需要用不同技术对采集回来的信息进行抽出;抽取的信息用我们自己研发的ICTCLAS分词包进行分词,在分词的时候,我们利用自己研发的OPENKL(开放知识库),对相关信息进行智能语义分析,然后通过相关的算法对相应信息进行预测预警等。

就舆情分析来说,我们的优势就在于,在该技术链条的每一个不同环节我们都能做到最好。这就是我们的核心竞争技术。

   记者:中科天玑研发人员占比70%,这存在什么样的想法?如此布局也是为了公司的某种生态体系构建吗?

程伯群:我们重点关注我们擅长的核心技术研发领域,其他的比如说市场,我们可以通过产业链上下游合作的方式去进行推动,这样就很自然的形成了这样的一个研发人员占比很高的状态。

天玑团队希望专注于核心技术的研发,并通过大数据产业生态体系构建自己的“天玑Inside”品牌。

   构建生态体系有利于大数据产业的理性、有序、健康发展

   记者:您觉得构建大数据生态体系能给大数据行业的未来发展带来什么?

程伯群:在大数据技术发展初期,有一些无序的存在,是合理的也是必要的。一个行业在发展的初期,有一些“野蛮”的因素,是有利于推动新技术的快速认知和发展,也有利于新技术应用的落地。

但是发展到一定的程度,就需要考虑生态环境的重构。构建一个合理有序的大数据生态体系,可以通过资源整合,避免资源浪费,每个人都做自己擅长的事情。

通过生态体系的构建,可以促进大数据行业的理性、有序、健康持久的发展。

  【 推荐阅读

   数据观专访美国特拉华大学终身教授高光荣:大数据发展应用需要填平三大“鸿沟”

“高性能计算以及大数据的发展和应用面临三大‘鸿沟’,一是超大规模计算的生态系统和大数据处理的生态系统之间的鸿沟,二是数据和有用知识的挖掘之间的鸿沟,三是发掘出的知识和能够真实产生的经济效益之间的鸿沟。填平这三大鸿沟,政府和企业任重而道远。”在接受记者采访时,美国特拉华大学电子与计算机工程系终身教授高光荣道出了自己的观点。

责任编辑:陈近梅

随意打赏

大数据金融专访
提交建议
微信扫一扫,分享给好友吧。