惠普发布HAVEn平台 抢占大数据高地力图复兴

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

【IT商业新闻网讯】(记者 柳青)今年6月,惠普CEO梅格·惠特曼(Meg Whitman)带领公司一众高管亲临北京启动了“世界之旅”。在为期两天的活动中,惠特曼表示,“云计算、安全、大数据以及移动计算在改变着这个时代,也正改变客户使用和购买信息技术和服务的方式”。惠特曼把这些让整个IT行业和用户遇到前所未见的机遇和挑战的改变,定义为“IT新型态”。惠普将帮助客户应对“IT新型态”,提供完善的解决方案。

与此同时,惠普在美国拉斯维加斯举办的HP Discover大会上推出了新的数据分析平台HAVEn,目标是帮助企业用户克服通向大数据成功、收获数据分析回报路上的障碍。此举与上述计划遥相呼应,表明惠普意图在IT业快速变革的环境中迅速实现复兴,其旗下软件集团则是帮助公司达到目标的重要力量。

近日,惠普将HAVEn这一平台的发布会移至国内,IT商业新闻网记者受到邀请参与其中。在会上,惠普就HAVEn到底是一个怎样的平台,它能帮助企业实现怎样的目标等问题进行了详细的解读。以下是会议实录:

主持人:各位媒体朋友大家下午好!非常感谢大家今天来参加大数据HP HAVEn平台的发布会,我相信大家都参加过6月的惠普世界之旅,我们的CEO提到了IT新型态,包括大数据、移动互联还有安全,也承诺惠普的战略是帮助我们的客户提供解决方案迎接IT新型态的到来。在惠普世界之旅上,我们谈到了一个非常重要的话题也是我们今天主要探讨的话题,那就是大数据。我们今天请到了中国惠普副总裁、软件集团大中华区总经理于志伟先生,中国惠普软件集团首席技术官魏喜勇先生,以及石建强先生,他是惠普公司Autonomy大中华区的销售总监,也非常欢迎他今天来跟大家交流。下面我们把时间交给于志伟先生。

于志伟:大家好!我们开门见山直接进入到今天最重要的话题大数据的分析平台HAVEn。我们已经在美国发布了HAVEn,今天是在中国发布。

yuzhiwei

中国惠普副总裁、软件集团大中华区总经理于志伟

对在座的各位媒体朋友来说,很多时候看到了各个企业会面临各种各样的挑战。除了我们的经济方面的挑战之外还有数据挑战。在今天的很多企业中可以看到,数据是企业的资产,不断扩充的数据量成为它的资产的同时,也慢慢变得难以驾驭,因为数据增长非常快,量级从很久以前的GB到TB到PB,现在已经到了EB的规模了。每一个企业都会面临这种情况。而且我们发现在很多企业中能处理的数据都是传统意义的结构化数据,比如说存在于数据库里面的信息。但很多时候涉及到处理微博、邮件、视频、互联网上的各种类型的不同信息,就越来越成为挑战。而这些信息都是很多企业认可的信息也是他们决策的依据。怎么管控这些信息变成了企业的挑战。接下来还有一个安全管控方面,现在很多时候包括系统的后门和信息不经意的流失,特别是银行很多人的帐号信息流失给企业带来的损失是难以估量的,这些也是很多企业会面临的挑战。而且有的时候会看到关于数据集成的问题。以前谈到的数据集成是把很多数据汇总在一起,数据量大的时候需要两天或者是两个礼拜才能集成,但现在因为要进行实时的分析,必须要在两分钟、两秒钟集成。在美国一家医院对数据分析实时要求是能多快就多快,并且要用世界上最好的技术。当一个急诊的病人推进来的时候我要检测什么药物过敏,不能等一个小时,最好是一秒钟就知道什么样的状况。所有快速决策已经成为了很多企业的业务需求。

再看中国的情况,56%的中国受访企业说至少10%的预算会用于大数据。一般来讲如果企业把资源很大的一块放到一个东西上就说明这个东西对它来说很重要。而三分之一的受访企业坚信大数据是它的竞争优势。很多人都说大数据可以帮助我们的企业,都觉得从传统意义上的IT加速工具变成了业务转型的工具。很多人在谈到这个的时候说怎么才可以转型呢?是不是数据搜索得快了就可以转型了?还是说数据类型处理得多了就可以叫业务的转型?至少1/3的企业坚信大数据对企业是有价值的。还有超过半数企业说曾经做过大数据,但有50多家是失败的。在中国的失败率是差不多45%。但是在印度的失败几率只有12%。在别的地区失败率是58%。所以我们更关注的是为什么在中国有将近一半的企业会失败?是期望值不同还是目标设定不同还是说做的方式不同,我们要分析一下,因为这对企业的健康成长是非常关键的。

企业面临大数据的挑战是什么?大家说大数据很有用,其实它也给我们带来了更多的挑战。这里谈到每家公司存储的数据量,这些公司目前指的是金融、电信、互联网、政府行业的。如果传统的制造业到不了这个规模,可是这几大行业达到了14.6PB。这个爆炸性的数据,大家知道在2012年的年底中国整体数据量已经达到了1.91EB了,预测在2015年年底会到差不多8个EB。其实大家算一下1.9EB到2012年底,如果看2012年前所有的数据有多少,就知道数据的爆增量了。种类上来看,跟业务发生关联的事件每秒钟会发生1亿次,这跟数据相关的事件,有的时候是一个图片、有的时候是一个视频,有的时候是一个机器的日志。大家可以看到,因为数据和内容不受控给企业甚至给很多人民群众带来很多的损失,这都在时时刻刻地发生。传感器搜集来的数据我们是不是可以对它进行合适的分析?万一有传感器没有实时的很好的分析,桥就有可能塌了。这带来的损失是无法估量的。大家讲到后面,一个TB是每个小时机器产生的数据量,这更关乎企业的安全,因为可能涉及到后门是不是被人入侵。最后一点是比较保守的估计,400万信息量被盗用。数据量在变大,数据形成了各种类型,同时因为这样大的数据量没有办法良好地管理,数据流失了或者被偷窃的损失量是巨大的。大数据本身是机遇也是挑战,它可以带来价值也同时带来了很多损失,所以如何对待它要有一个合适的方式。

今天我们谈的是惠普的大数据解决方案。我们把它称之为大数据分析平台。它有几个特点。第一,我们结合了惠普原有的最能够被市场证明的解决方案,一个是Autonomy的解决方案。大家知道Autonomy是业界顶尖的处理非结构化数据的解决方案。这个平台还集成了Vertica的引擎,它的速度很快,搜索速度基本上是传统数据库的1000倍。第三,是企业安全的ArcSight  Logger日志管理,可以专门抽取到机器的信息,这称之为半结构化的数据,这些数据的处理关乎到企业安全的至关重要的方面。这是惠普杀手级的解决方案。同时,惠普还能集成到现在业界最开放的大数据的Hadoop,我们跟Hadoop可以做到数据的双向集成,这是最开放的架构。同时惠普大数据的平台集成了包括硬件、软件和服务在一起的,而不是单独的只是一个软件的平台。最后,这里面谈到了一点是,n也很关键。前面的内容我们谈到了一点很关键,大家一看就知道这是一个非常好的技术,但我们想谈的是这不仅仅是技术的平台,更多是业务的应用。在后面加n的概念是想说明大数据的平台有很多合作伙伴上来在这个平台上购置他行业的解决方案。大家说哪一种类型的行业解决方案呢?包括若干种,比如说企业安全、利润分析、合规性、客户的购买行为,各种类型的应用都是购置在大数据的解决平台上。给大家举一个例子,大家首先会问到这样一个平台最大的差异化在哪儿?能处理结构化、非结构化、半结构化的数据,速度是无与伦比的。那么这些内容在一起怎么在应用里面去做呢?举一个实际的案例,一个大型的国际银行专门购置了一个系统做客户的分析,也就是说当一个客户打电话进来,如果用HAVEn平台,电话第一时间就会被查清楚是不是一个合法的电话。他如果再咨询信息就有决定是要进行录音还是不进行录音。但因为客户跟数据库里面对比信息的时候,根据非结构化信息进行分析的时候,我们来确定当时这个客户打电话进来是高兴还是不高兴。高兴是准备投资点什么,不高兴是准备投诉点什么。这个信息要及时反馈到,我们第一时间就知道怎么处理。因为不高兴的时候如果再说你再买我点什么,就不太好,这才是针对客户的需求。如果你跟他讲很长时间,要知道这个客户在历史上是给我们带来利润的客户还是给我们带来损失的客户,这些信息要同步,我们讲的是一秒钟之内要分析出来。这些分析的结果是最终给客户一个怎样合理的方案。我是要给他更多的优惠还是其他的什么。整个的过程做下来,业界标准的大数据分析是做不下来的,必须有一个整体的大数据分析。为什么大数据平台可以理解人的情绪,怎么知道他高兴还是不高兴呢?这些一般是做不到的。这是大数据的沧海一粟的小例子。

所以,给大家谈到的是惠普这个大数据解决方案所要面临的主要的问题。它其实有三个最主要的特性强调一下。第一个特性是connecter,也就是采集平台,有700个。基本上全球所有的在结构化、非结构化以及机器信息所能搜集的绝大部分我们都可以搜集到。第二就是引擎,为什么谈到引擎呢?大家说Hadoop本身也有搜索的功能,你们为什么还有Vertica的搜索功能呢?这就看你的需求了。标准的Hadoop可以搜索20分钟,但你为什么要用两秒钟呢?如果是一个急救的病人或者是要搜索罪犯一定是要到秒级的,而不应该是多少分钟,因为那已经滞后了。所以Vertica起到的作用是在引擎方面速度是最快的,这个是别的比不了的。在引擎里面还有一个是对这种非结构化信息能感受到人的语言,我打一个电话比如说“喂”,我这一声到底是高兴还是不高兴你可以抓得出来,能体会人类的语言,这个引擎也是非常重要的。这一点构成理解所有大数据信息的关键点,因为你搜集来的信息大家理解它,这是第二块的关键点。第三块是应用,因为我们在这个大数据平台构建了运营分析,我们实时地解决。超出这些之外还包括了业务方面的应用,还有行业方面的应用。所以包括了connecter的这种引擎是这个大数据最关键的三个点,它是大数据解决方案最关键的部分。

我们谈到了一个信息回报的概念。现在都谈到ROI,但我们谈的是Return  on  Information。这就是证明为什么HAVEn可以做这个。假设成本是这样的,收益是这样的,回收期是在1.5个月,这是在三年风险调整后的收益部分,这个是成本部分。大家看到如果使用Vertica的平台成本是非常低的。这不是我们惠普自己说的,可以看到是第三方机构公正地认为可以产生这种效益。

我们刚才谈到了大数据的平台,大家已经理解了这是惠普第一次提出的大数据全面分析的平台。但它不仅仅是大数据的分析平台,同时还是一个生态系统。为什么这样说?因为我们认为惠普自身构筑这样的平台,但不可能知道全世界所有国家、所有行业、所有特定客户的需求。最好的方法是惠普在业界有大量的合作伙伴,我们和合作伙伴一起构筑生态系统。在构筑生态系统的时候在这个平台上要做很多的BI的合作伙伴,包括集成商、分销商、硬件合作伙伴、服务合作伙伴,在一起来共同将大数据的分析平台做得越来越大。这是我们在这个模式上走向市场的最重要的方式。还包括了最重要的数据的合作伙伴,因为构筑大数据的平台,客户说我们分析的时候不仅仅要分析企业的内部,还要有第三方的数据,我们也会提供数据的合作伙伴。只有和这些合作伙伴一起,我们相信这些大数据平台才能为我们的客户所用。在这里合作伙伴可以各自在上面开发应用,形成按国家、按行业、按区域的解决方案。这些加起来构筑了整个生态系统,大数据的分析平台很关键的一点是可以通过云的方式进行配置,也可以通过自己传统的购买服务器的方式,这几种方式我们都支持的。它的开放性最重要的是,惠普不仅仅支持自身的硬件,其他所有的主流的硬件都可以支持。这是我们一直秉持的开放的态度。加上这些我们相信能够给我们的客户提供一个最好的Return  on  Information。

这是惠普的一些特性,可以搜集处理半结构化数据的信息,还可以理解人类的语言,集成了Hadoop,可以做实时的超大规模的(到PB级)的数据分析。我把HAVEn的特性给大家做了一个简要的介绍,在回答问题的环节相信我们会有更多的沟通。接下来我会把时间交给我们的CTO,让他介绍一下在HAVEn平台上的应用。

魏喜勇:基于HAVEn可以看到它是一个非常综合性的大数据分析平台,而基于这样的平台今天同时也发布了4款相关的新的产品和解决方案,下面我给大家来介绍一下。首先在IT管理方面我们有两个新的解决方案发布,第一个是惠普运营分析的解决方案叫Operations  Analytics。第二是基于Hadoop的分析工具。

weixiyong

中国惠普软件集团首席技术官魏喜勇

第一是惠普的运营分析。为什么今天讲了很多行业上的发展趋势及应用,我们首先来看IT的数据分析呢?首先,在当前的一个大数据分析的应用场景里,支撑大数据应用的是技术越来越复杂,技术环境越来越灵活的IT设施,而且如果这些IT设施不进行有效的保护,上面大数据的分析平台也达不到使用的效果。第二,我们在IT管理方面IT的运营数据的复杂度一点不比相关的其他大数据的复杂度要低。因为在IT运营方面有众多的厂商、设备、应用都会产生大量的数据,所以我们需要对这些数据进行良好的分析和管理,才能达到我们提到的大数据分析平台的目的。在IT运行分析管理方面,首先会提供一个强大的搜集引擎,可以对IT所有发生的数据进行搜集,这里包括了结构化数据和非结构化数据。IT的数据也是有很多的种类,比如说故障的信息、性能的信息、拓扑的数据都是属于结构化数据。还有一些机器的日志或者是性能信息的话,这些是属于非结构化数据。这时候我们为了支撑这样一个平台运行,需要对这些数据进行综合的管理。以前,我们的环境并不是特别地复杂,我们就几十台服务器或者是几百个节点,我们把信息搜集来进行分析是比较容易的。现在的IT环境和结构越来越复杂,处理的节点是上千或者是更多,这时候是需要更快速、更有效的引擎分析我们的数据。在我们的运维分析管理平台里,可以对搜集到的数据进行综合的分析,可以快速地获取我们需要的信息。第二点,在大数据环境里业务环境越来越复杂,而我们的业务如果出现故障的时候,排查起来也是非常困难的。而在运营分析管理平台里,我们提供了一个历史回放的机制。比如说我的业务系统如果是在昨天晚上12点出现问题了,性能下降了,到底是什么下降了?什么原因呢?我们这边可以做一个表针拨到昨天晚上11点钟让它进行历史回放,这样业务发生了任何的变化,出现了什么故障都可以直观地了解到,这是以前达不到的。但基于HAVEn的分析技术可以把这些数据全部地汇总进行历史的分析和回放。

第三,在大数据分析平台中对我们的管理人员的要求也变得非常高了,因为大数据的环境里我们对管理人员需要有很多的了解,包括应用环境、包括一些底层的系统环境以及包括一些组件的连接的情况都需要进行紧密的了解。但我们的管理人员不可能说每一个人都有这么多的一些知识,所以说在运维分析管理平台里有这样一个向导式的排查问题的功能。也就是说我们看到一个问题的时候,可以看到某一个问题有可能是什么问题引起的,在什么地方可以一步一步地获得根源的问题。比如说看到某一个应用慢了的话,我们可以定位到底是网络的问题还是服务器的问题,还可以继续定位比如说是应用的具体的方法的问题,还是说是内存的调用问题,或者是说其他的问题都可以快速定位。通过惠普运营分析解决方案我们可以对IT环境的大数据进行管理,帮助IT大数据提供可靠的支持。

随意打赏

提交建议
微信扫一扫,分享给好友吧。