盘点|2016半年最酷的10家大数据初创公司
大数据具仍然是IT业界最活跃的领域之一,每周似乎都会涌现很多初创公司,提供新的技术用于收集、管理和分析大量结构化和非结构化数据。
根据市场研究公司Wikibon的研究,2015年大数据硬件、软件和专业服务的市场增长23.5%达到226亿美元,预计到2026年之前年复合增长率为14.4%达到922亿美元。
今年基于Hadoop平台的大数据项目似乎已经走过了概念验证的阶段,步入更加广泛的生产环境中,同时企业更加强调找到为经理们和员工们提供数据和分析能力的最佳方法。
Anodot创建于2014年,在11月走出隐身模式,推出了实时异常检测和操作智能技术,带有申请专利的机器学习算法的软件,会实现业务分析自动化,实时找出性能问题和商业机会。
Anodot的技术是针对电子商务网站、数字广告系统和物联网网络等用途,用于改善运行效率和收益最大化。
Aviso开发的预测分析应用已经被销售机构用于改善销售预测流程。结合机器学习算法和投资组合管理技术,该软件帮助销售经理和销售代表优化交易、降低风险和精确销售分析--这是Aviso所谓的"总收入智能"。
Cazena开发的大数据即服务产品可以让企业把基于云的数据湖和数据集市结合起来,用于配置和优化大数据系统,包括那些构建在Hadoop、Spark和MPP SQL技术上的系统。
这家位于马萨诸塞州沃尔瑟姆的公司创建于2014年,它已经吸引了大量的关注和资金,因为首席执行官Moghe和董事会成员Jit Saxena、Jim Baum帮助创建了Netezza--一家先锋的数据仓库一体机开发商,在2010年被IBM以17亿美元收购。
实时流数据是大数据管理和分析过程中的一大挑战。有一项技术能够解决这个问题,那就是开源Apache Kafka讯息代理项目,它提供了高吞吐量、低延迟的软件,用于处理实时数据反馈。
Confluent是由Apache Kafka最初的开发者创建的,位于加州帕洛阿尔托,它开发了一款完整的围绕Kafka的实时数据平台,作为容错的、高可扩展的信息系统。该软件可以用于收集来自用户行为日志、股票报价系统、设备及其他用例的数据。
Koverse提供了一个"盒中数据湖"平台,并称这个平台能够收集大数据,并将这些数据更快速地投入生产中,其成本要低于现有技术和实践。
Koverse位于西雅图,创建于2012年,在2年前首次公布了该技术的早期版本,将Koverse Accumulo"分布式键值库"技术与Universal Indexing Engine结合起来。
CEO: Todd Mostak
MapD Technologies开发了一款大数据分析平台,并称可以查询大数据以及实现大数据可视化,速度要比其他系统快100倍。该软件利用大规模并行的商用GPU跨数十亿行数据集执行SQL查询,只需要几毫秒时间。该系统可配合自己的MapD Immerse数据可视化工具或者其他虚拟化工具如Tableau。
Mostak在哈佛大学的时候,因为花了数小时甚至数天时间等待计算机系统处理数千万条推文的模式--他因为正在Arab Spring上撰写一篇论文,所以需要做这项研究--之后,他就开发了这个大数据技术的原型。他创建了他自己的计算机集群,使用计算机游戏GPU卡,然后在麻省理工学院计算机科学及人工智能实验室研究该技术。
Maana开发了一个数据搜索和发现平台Maana Knowledge Graph,其长处是收集来自多个系统或者"孤岛"的数据,并将其转换为运营洞察,可以被业务线应用所使用。该系统是构建在Apache Spark处理引擎上的。
Maana位于加州Palo Alto,创建于2012年,在2015年5月正式发布,被看作是可以很好地收集和分析由物联网网络生成的海量数据。
Stytch在4月首次推出了它的端到端数据分析平台,提供了用于自助式数据准备、数据建模、数据发现、报告和仪表板的系统工具。Stytch得到了邓白氏(Dun & Bradstreet)的支持,Stytch系统的一个关键卖点就是连接到了邓白氏庞大的业务数据库。
ThoughtSpot的口号是"面向所有人的搜索分析",它有一个大胆的目标,就是不再需要复杂的商业智能软件。该公司的ThoughtSpot Relational Search Appliance结合了来自现有环境、云以及桌面的数据,让用户可以通过一个简单的搜索界面就访问这些数据。
ThoughtSpot位于加州Palo Alto,创建于2012年,在2014年10月发布了它的一体机产品。12月它发布了ThoughtSpot 3,有大约200项覆盖搜索、分析和可视化的新功能。
CEO: Pete Cittadini
内容来源:ZDNet存储技术频道