IBM 推出一站式数据分析服务 DataWorks,为企业数据嵌入“智能大脑”
当下,研发机器智能新技术的步伐在加快,或者换种更有说服力的说法是,现代科技研究的趋势在机器智能领域。信息技术公司正全力以赴,寻找一个理想时机将像 Apache Spark 等开源框架的数据分析服务应用到企业业务发展分析中。在这种趋势下,IBM 推出了推出基于大数据平台的一站式分析服务 DataWorks,为企业数据处理提供更加智能的服务。
IBM 的新项目 DataWorks 构建在 Apache Spark 和 IBM Watson 基础上,它的核心理念是在保证数据分析稳健性的前提下,优化数据处理速度与易用性。你可以把 DataWorks 理解为一种类似于 Google Docs 的数据分析工具,这样一来这个新项目就通俗易懂了。事实上,每个公司都有一个庞大的数据库,这些数据会处于不同的分散位置。加载数据和从来源迁移到目标通常是耗时而单调的任务,IBM 的 DataWorks 可以把公司的这些数据整合到一起,并将它放置到一个直观、方便得到的位置。这样一来,加载数据并将数据从不同来源迁移到不同目标就变得轻松了。
为了让数据在每个有需求的人那里都变得唾手可得,IBM 还设置了一个仪表盘,这个仪表盘可以显示因访问、使用者以及分类统计分解的数据信息。IBM 把这项技术称作“整理数据分类”。通过用自然语言进行搜索,用户可以在那些数据目录中打开特定的数据集,这比用传统方法要方便快捷的多。DataWorks 吸收数据的速度也比其他数据平台快得多,可从 50 Gbps 提升到 100 多 Gbps。
DataWorks 借用诸如 Pixiedust 和 Brunel 等技术,使得用户只用一行代码就可以使数据简单地可视化,以便开始分析、自动加载、剖析和分类数据,从而提高数据质量。可视化的数据可以形成关联和分类模式,使得在处理数据业务的用户可以快速获得新的洞察。
IBM 数据服务业务的副总裁 Rob Thomas 认为公司可以节省大量的人力开支。IBM DataWorks 实际上开创了一个数据生态系统,用户不必再接受特定的开放源码技能的培训了。DataWorks 最有效的应用领域是像零售业、金融服务业以及电信业等,但 Thomas 注意到一些中型企业也被这个平台所吸引。
据悉,不管是大企业还是小公司都可以通过 IBM 的 PaaS 云平台 Bluemix 获取 DataWorks 。传统的账单到期即付货币化结构是,任何人都可以接触并运行一个系统,时间可从数小时持续到数月。但是 IBM 认为数据分析也可以像移动运营数据计划那样,采用包月收费的模式。