洞悉大数据的技术应用与价值,参加2015中国大数据技术大会的10大理由
从2008年至今,中国大数据技术大会(BDTC)已成功举办8届。放眼海外,中国大数据技术大会曾传递Google、Microsoft、Intel、Yahoo!、Facebook、LinkedIn、Cloudera、Hortonworks、Databricks等大数据先锋机构的第一手探索;聚焦国内,中国大数据技术大会更分享了百度、阿里、腾讯、华为、新浪、网易、京东、携程、360、小米、等知名机构的最佳实践。伴随着中国大数据生态系统的建立、发展和演变,中国大数据技术大会从一个仅60人参加的技术沙龙已发展到当下数千人的技术盛宴。
BDTC 历届嘉宾
12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办的2015中国大数据技术大会(Big Data Technology Conference 2015,BDTC 2015)将在北京新云南皇冠假日酒店如约召开。本届大会以“数据安全、深度分析、行业应用”为主题,聚焦大数据落地后各机构所面临的挑战和需求,将从学术探索、技术实践、产业应用、变现实战、数据交易、法律法规等多个方面对时下大数据生态圈进行全面剖析,旨在为更多机构的大数据实践提供成功参考。大会前夕,我们从议题角度总结了今年BDTC不可错过的十大理由。
理由一:深度的产业现状与趋势解读。中国计算机学会将在BDTC 2015上正式发布《2016大数据十大发展趋势预测》与《2015中国大数据技术与产业发展白皮书》。前两届大会——BDTC 2014和BDTC 2013上发布的两份报告得到了学术界和产业界的高度关注。今年,在大数据的产学研用继续深化更加务实之时,由百余位技术专家参与的《2016大数据十大发展趋势预测》以及中国大数据开放共享、中国工业大数据等多个篇章的《2015中国大数据技术与产业发展白皮书》,更加值得期待。除此之外,BDTC 2015基于技术和行业的发展设置了多场现状和趋势分析讲解,详情请查看具体日程(http://bdtc2015.hadooper.cn/dct/page/70042)。
理由二:内存为王,前行中的开源大数据生态系统解析。时下,为了应对海量数据所带来的挑战,分布式计算与存储系统的摸索主要存在两个方向:首先,让计算更接近数据存储端,从而解决网络瓶颈所带来的限制;其次则是随着内存价格下降,新一代内存计算时代已经来临。在内存计算探索上,业内最受关注的开源大数据计算框架无疑当属Apache Spark,当下已经在生产环境中得到了广泛的部署。然而作为一个高速成长中的开源项目,其未来发展方向无疑备受各个机构关注。因此,本次会议特邀请了Databricks公司联合创始人、Apache Spark首席架构师、Apache Spark PMC辛湜为大家分享Spark在2016年最新的Roadmap,消除机构前行中的障碍;同时,IBM数据和分析事业部大中华区大数据产品总监洪建勋还将分享“Spark数据和设计迎巨变”。在Spark之外,Hadoop仍然是生产环境部署最多的开源大数据处理框架,其生态系统中包含的数据仓库技术更是得到了长足的发展。在这个背景下,本次BDTC特邀请了Hadoop、HBase和Thrift项目的PMC成员和Committer、Kudu的发明人Todd Lipcon,Hortonworks Ted Yu为大家分享大型数据仓库Kudu和HBase的最新进展。除此之外,本次BDTC上,百度大数据部高级研发工程师衣国垒,京东集团云平台数据首席架构师杜宇甫,银联智慧CTO龙凯,中国计算机学会大数据专家委员会委员、南京大学教授黄宜华等专家还将分享基于开源技术的自主生态系统打造。
理由三:吞吐至上,剖析数据库50年衍变。在计算框架之外,业务更高的吞吐量需求同样催生着新时代数据存储系统的衍变。今年是数据库诞生五十周年,前三十年的数据库研究主要围绕数据模型、事务机制、索引结构、查询处理等核心技术展开,在大数据时代,IT热点从“计算”衍变为“数据”,高吞吐量的需求更给传统数据库带来了严峻的挑战。在本次会议“数据库分论坛”上,多场围绕新时代的数据库讨论将被展开,其中包括:南大通用CTO武新的《GBase 8t 高端OLTP数据库核心技术与客户价值》,西北工业大学教授李战怀的《新型存储架构下数据管理技术面临的机遇与挑战》,中国移动苏州研发中心大数据产品开发部高级工程师薛港的《PosgreSQL-X2的开发和应用》,华东师范大学教授钱卫宁的《基于可扩展事务处理系统的进展与研究》,以及Pivotal研发总监姚延栋的 《开源大数据引擎:分布式Greenplum数据库内核分析》。
理由四:深入挖掘,谈如何打造一个更易用的平台。对于任何机构来说,建立大数据平台的唯一目的就是对数据进行挖掘,从而更好地指导实践。因此,如何构建出一个更易用的大数据处理平台显然至关重要。本届BDTC不仅邀请了SQL-on-Hadoop项目Apache Kylin PMC成员、eBay软件工程师仲俭为大家分享Apache Kylin的大数据可视化实践;在全体会议上,中国联通集团公司信息化和电子商务事业部副总经理、总架构师、国家千人计划专家范济安, 京东云平台首席架构师刘海锋,普元信息技术股份有限公司CTO焦烈焱,IBM、华为、中国移动等机构的专家还将分享各机构内部的大数据平台构造实战。
理由五:安全可靠,基础设施架构与设计。软件之外,硬件技术的提升对于大数据应用实践的重要性不言而喻。同时,基于现有的商用服务器集群,如何更好地进行资源调度与管理同样至关重要。为此,本次会议特设置了“大数据基础设施分论坛”,届时,工信部电信研究院政策与经济研究所法律部主任肖德芳,Hulu软件技术开发资深研发主管梁宇明,Memblaze闪存系统负责人吴忠杰, 阿里云高级专家李超,企事录创始人李明宇,中科院计算所研究员、中国科学院大学岗位教授、博士生导师詹剑锋等专家将带来《大数据服务器技术探索与实践》、《Voidbox - Docker On YARN在Hulu的实践》、《用闪存存储技术应对大数据挑战》、《阿里云大数据平台探秘》、《海量小文件与超大文件并存情况下的存储系统评估与调优》、《BigDataBench:开源的大数据基准测试标准 》等专题报告。在资源调度和管理之外,数据安全同样是各个机构的重中之重,因此在本次大会的“大数据安全分论坛”,奇虎360高级技术经理张卓,启明星辰核心研究院资深研究员周涛,阿里巴巴集团数据安全部阿里数据安全小组总监郑斌(天明),腾讯安全云部助理总经理李旭阳,数美时代CTO梁堃等专家将联手为大家演练大数据时代的攻防实战。
理由六:人工智能,深度学习带来的新机遇。Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络。在过去一段时间,深度学习一直受限于主机的单机性能。而随着各种分布式算法的实现,各种优秀大数据计算框架的开源,深度学习正迎来一个高速的发展期。在BDTC 2015上,我们特设立了“深度学习分论坛”,地平线机器人(Horizon Robotics)高级工程师余轶南,阿里巴巴iDST语音组高级专家鄢志杰,微软亚洲研究院研究员洪春涛,华中科技大学教授白翔,厦门大学教授纪荣嵘等专家将结合学术与实践应用,为大家带来一场关于深度学习的深入探索。而在此之外,阿里巴巴iDST Principle Engineer金榕还将在全体会议上分享名为《Randomized Algorithms for Big Data: Making the Impossible Possible》的主题演讲。
理由七:时代前沿,互联网公司的最新成果。毋庸置疑,基于业务的需求,在云计算、大数据等领域,互联网公司一直走在时代的最前沿。因此BDTC 2015“互联网大数据分论坛”将探讨大量知名互联网机构的最新实践,其中包括:滴滴机器学习研究院高级研发总监刘威的《移动出行的大数据挑战》,百度主任架构师、机器翻译技术负责人何中军的《 互联网机器翻译》,京东商城大数据研发部负责人刘彦伟的《京东实时数据平台的实现和应用》,中国人民大学副教授窦志成的《大数据时代的互联网分析引擎》,国双技术副总裁黄勇坚的《挖掘用户行为大数据中的金矿》,北京拓尔思信息技术股份有限公司副总裁刘瑞宝的《大数据——互联网时代政府发展的引擎》,微众税银联合创始人兼COO曾源的《政务大数据在征信领域的应用》等。
理由八:精华体现,推荐系统实现的价值挖掘。大数据技术核心是人群分析,而推荐系统包括人群分析和数据变现等是大数据技术精华的体现。在本次大会的“推荐系统分论坛”上,百度基础架构部高级架构师沈国龙,FreeWheel技术副总裁李旸,新浪微博算法技术总监姜贵彬,京东数字营销大数据总经理万昊,猎聘网首席数据官单艺等专家将为大家分享《BML百度大规模机器学习云平台实践》、《FreeWheel基于大数据的新兴视频广告测量实践》、《大数据驱动下的微博社会化推荐》、《大数据技术在京东在线广告的应用》《运用增强学习算法提升推荐效果》等议题。
理由九:应用为王,深入各行各业的数据挖掘。历经数年发展,大数据产生的价值已毋庸置疑。因此,在BDTC 2015上,“医疗健康与生物大数据分论坛”、“交通与旅游大数据分论坛”、“教育大数据分论坛”、“金融大数据分论坛”、“网络与通讯大数据分论坛”、“工业与制造业大数据分论坛”、“社会治理大数据分论坛”等分论坛被设置,数十位专家将为与会者分享各个垂直行业宝贵的应用经验。
理由十:开放共赢,取之有道,数据交易及法规探讨。大数据分析和价值发挥离不了数据的供给,除了政府、大型互联网公司、电信运营商等数据富矿外,其他一些企业急需利用数据提升效率、获取新客户、增加销售额。但由于政策法规、市场机制等问题,数据流动一直效率不高,从而阻碍了大数据价值的充分发挥,“数据市场及交易”论坛将特邀中关村大数据产业联盟副秘书长陈新河,亚信智慧数据公司DataHub产品总监龚静,数据堂科技股份有限公司创始合伙人、副总经理肖永红,北京安理律师事务所管理合伙人王新锐,贵阳大数据交易所执行总裁助理王亚川等专家将集中讨论如何解决上述问题。
除此之外,大会期间,组委会开设了各种方便互动和社交的交流环节和场所,每一场精彩讲演之后都可以进行深入地提问和讨论。同时,历经八届,BDTC一如既往地履行着高规格的承诺, 对于已经或正在考虑进军大数据的公司,这绝对是一场不容错过的技术盛会。