阿里云发布“数加”平台,想把大数据一站式做全
阿里云在 2016 云栖大会上海峰会上宣布,开放阿里巴巴十年的大数据能力,发布了一站式大数据平台 “数加”。
“数加” 平台首批集中发布了 20 款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。
从数据采集来说,阿里云推出 Datahub,支持实时采集、适配开源,能让一些开源组件适用,同时提供客户端配合客户在低功耗、或者是高性能场景下的应用。而且它支持的日吞吐量在 PB 级,可线性扩展。
会上,还将大数据计算服务 ODPS 正式改成为 MaxCompute。据阿里云大数据事业部资深总监徐常亮介绍,在由数据库之父 Jim Gray 创办的排序基准评估竞赛 Sort Benchmark 中,阿里云把 100TB 数据的排序时间缩短到了 377 秒,打破了此前由雅虎、微软、斯坦福大学等公司与机构保持的纪录。并举例了墨迹天气的案例,他们在使用阿里 MaxCompute 以后,成本降低了 70%以上。徐常亮还透露,“接下来对存储继续降价 50%。”
再说实时计算的两款产品,其中一款是分析性数据库,特点就是快。能在毫秒级分析百亿的数据,而且它可以通过直联,做碰撞分析、多维分析、轨迹分析,有较多的应用场景。另外一款是流计算 StreamCompute,不仅仅是写一个简单的定义,同时也可以支持编程,这套系统也是阿里双十一大屏背后的最主要的计算产品。
大数据计算服务 MaxCompute(原 ODPS)、分析型数据库 Analytic DB、流计算 StreamCompute 共同组成了底层强大的计算引擎。
计算引擎之上,“数加” 提供了最丰富的云端数据开发套件,开发者可一站式完成数据加工。这些产品包含:数据集成、数据开发、调度系统、数据管理、运维视屏、数据质量、任务监控。
在数据分析环节,通过移动数据分析(Mobile Analytics)产品,开发者可快速搭建日志采集、分析系统;通过数加 BI 报表产品,3 分钟即可完成海量数据的分析报告;通过数据可视化产品 DataV,一星期就能做出双 11 同款大屏。
值得一提的是,基于 DataV,数加还发布了面向政府的行业应用产品 “郡县图治”。通过这款产品,县长可以在一个屏幕下统览全县各项经济民生数据,为政府决策提供辅助。
同时,对于时下大热的机器学习,“数加” 发布的机器学习工具,可基于海量数据实现对用户行为、行业走势、天气、交通等的预测。
最后到数据应用,“数加” 提供了规则引擎、推荐引擎、文字识别、智能语音交互等数据应用产品。
原创文章,作者:徐宁,如若转载,请注明出处:http://36kr.com/p/5042599.html
“看完这篇还不够?如果你也在创业,并且希望自己的项目被报道,请 戳这里 告诉我们!”