对标Splunk,互利科技打造更适合国内企业的实时数据分析平台
————专访互利科技创始人CEO 林坦
作者:诺蓝 (36大数据专稿,拒绝任何不标明作者及来源、链接的转载)
说起HOOLI 互利科技,笔者第一的反应就是想到了美剧《硅谷》里面那家以Google为原型的互联网公司,这可能也是互利科技成立时的愿景,有着Amazon工程师背景的林坦是这家公司的创始人及掌舵人。从大数据的角度来看互利科技的业务模式的话,他又更像那家毛利润高达80%、全球第一家大数据上市公司Splunk。这样综合来看,互利科技是一家有理想的大数据新创企业,他既有着Google的野心,又有着Amazon的技术背景,更有着Splunk那样严谨的业务逻辑。
2015年年初,互利科技创始人林坦结束了在美国的工作及生活,带着梦想回到北京开始创业。
2015年8月,北京互利科技有限公司成立,同期发布了第一个内测版本,定位为实时数据分析平台。主要帮助企业用户实现数据集中管理,包括为服务器日志,业务日志,网络数据,传感器数据等提供实时索引统计、实时告警、准确探测潜在漏洞及洞察用户行为等服务。互利科技在2015年获华兴资本天使轮融资。
2016年7月,互利科技创始人CEO林坦参加了由36大数据在北京举办的“大数据商业应用与创新峰会”,在会上,林坦与我们分享了大数据在日志分析中的应用经验。在新上线的2.0版本中,HOOLI重磅推出了智能化的异常检测(Anomaly Detection)功能以及异常值预测(Outlier)功能。
互联网公司的发展速度是惊人的,尤其是以技术为驱动的公司。三个月过去了,为了进一步了解互利科技的业务模式以及未来的计划,36大数据近期特邀互利科技创始人CEO林坦做了一次专访。
以下是专访内容:
36大数据:我们了解到,互利科技有很大一部分业务是日志分析,分析机器产生的数据,而国际化大数据企业Splunk的主要业务也是日志分析,那么对比Splunk,互利与它的相同点是什么?不同点又是什么?
林坦: Splunk作为业界第一的日志分析软件,为我们提供了很多指导的意义。从产品的主要功能形态,能提供给用户的核心价值,以及针对的目标客户类型都是基本相同的。
而 互利科技与Splunk的不同点主要有几个方面:一是Hooli产品主要采用了更新的技术与架构 ,在一些性能特征上甚至是超过Splunk的。其次就是互利科技的主要目标客户群是国内企业,所以也基于他们的需求与反馈做了很多本地化的优化,Splunk因为主要客户群体还是英语系国家,很多细节更符合西方人的使用习惯,我们将一些在Splunk里不太被国内用户使用的功能抛弃了,而一些会被 国内用户使用但操作起来比较复杂的功能被简化了,使得Hooli更易于被接受和使用。
36大数据:互利科技目前的客户有哪些?目标客户的用户画像是什么?
林坦 :互利科技目前的客户有大型电商,也有通讯,政府,咨询等行业。我们针对的目标客户一是在一定规模之上,他至少每天产生足够多的数据,才会感受到数据难以被管理和实时分析的痛点,二就是要有一定的付费能力。至于在哪个行业对我们来说区别不太大,因为我们是分析的比较底层的数据,所以比较标准化和统一。
36大数据:之前在你的一篇文章中,你说过你们期望的客户通过使用互利的数据服务,最终可以达到机器可以自我修复,可以跟我们说说这个原理吗?
林坦: 这个是我们长远的一个目标,可以分阶段实现到不同程度。现在越来越多的技术运用在了如何让人与机器交互更加智能,比如自动驾驶和语义识别,而背后的代价是越来越多的工程师得去维护这些“智能”的程序。而其实在一些高频特定的场景下,机器是可以利用数据和AI的技术做归因分析,从而自我修复的。这是我们今后发展的主要目标,也是我们有别于仅仅在抄袭Splunk的一些产品和公司。
36大数据:机器学习在日志分析中的重要性是什么?
林坦 :更强的信息关联能力,预测潜在异常,更少的人工操作。
36大数据:对于非结构化数据的处理,目前互利是否已经做到了秒级查询?互利科技的产品服务主要针对的是结构化数据还是非结构化数据?
林坦 :是的,我们已经做到了 在TB级数据下的秒级查询。我们主要处理的是非结构化数据。
36大数据:日志分析的难点是什么?互利是如何解决这个问题的?
林坦: 主要难点是在海量数据下保证分析性能,如果分析十几G数据,很多有技术资源的公司自己搭个开源框架就能弄的七七八八,但当数据上了一定规模后,就会发现简直就是在解决一个完全不同的问题。就好比一个十万日活的App和微信这样处理上亿用户日活的App,对于使用者来说没什么区别,都是访问一个App,但背后的团队解 决的是完全不同规模的问题,两个问题虽然用的框架还是那些框架,数据库还是那些数据库,但处理的方式几乎没有共通性。
互利一个是基于过去的一些经验积累有了基本的思路和方向,二是做快速的迭代,克服一路遇到的各种困难,而这些被克服的困难也形成了我们的壁垒。
36大数据:从IT运维的角度来说,互利科技的日志分析产品可以帮助他们做什么?优势是什么?
林坦: 运维角度主要是帮助他们做troubleshooting,定位系统问题根源,对日志数据实时搜索和关联分析,比如一个大型电商网站的微服务架构的某个服务挂掉了,从用户的角度看可能是点checkout没反应了,或者返回500错误页面,甚至也可能是交易失败造成损失。那如何通过快速关联全局的信息找到问题根源止损,修复之前发生的问题就是Hooli可以帮他们做的。其他的一些使用场景也可以通过我们的官网hoolix.com做更多了解。
优势是我们平台的产品化更加完善,功能更丰富,开箱即用,有完整的技术支持。让用户更加集中精力在自己的主营业务上,减少用户为日志分析花费的时间精力,也避免了一个经常发生的情况就是一个公司花费了人员,设备和时间自建了一套日志分析平台最后相关人员离职了无人可继续开发和维护。我认为从社会劳动分工的角度来说,正确的做法一定是专人做专事,一个公司解决某个领域专业的问题。区别可以想象成用AWS和自建IDC的区别。
36大数据:我们了解到您曾经是Amazon亚马逊的工程师,亚马逊旗下的云计算平台AWS拥有超过100万的客户,那么我们想知道的是,在你看来,AWS的优势是什么?AWS有哪些地方值得我们学习?
林坦 :AWS太庞大了,也太伟大了,伟大一是因为作为商业公司,它很赚钱,商业模式也很成功,二是因为它也同时提供了巨大的价值,成就了很多创业公司。我也曾仔细分析过AWS的商业模式,但要说起来的地方就太多了。我认为 AWS能够崛起的主要原因是来自Amazon内部对于eat your own dog food的实践和对提供标准化platform的预见性 ,才能孵化出AWS,并使之打败了微软和Google。我之前写过一篇相关的文章也更详细的说了我们可以学习的地方: https://zhuanlan.zhihu.com/p/20762616
36大数据:互利科技目前公司的团队规模如何?大数据相关人才非常难招,对于新创大数据企业,有哪些经验来应对“用工荒”的问题?
林坦: 作为一个成立了一年的企业服务公司,我们更看重持续稳定的发展,团队现在约20人,有来自国内的各名校和大公司,也有来自美国Amazon和Google的人才。
招聘对于各个公司来说都是一件一直很难的事,我们在做的一是去找到底子比较好的人才,培养他们成为公司的骨干,这些人会陪公司走很久,所以底子一定要好,成长系数要高,因此我们公司比如工程师的面试更看重一个人的基础。对于一些高端人才,我们会不惜时间和精力的去建立良好的关系,最终希望其加入到互利科技。我一直相信人才是公司能走多远的基石,对此也一直非常重视。但同时有一点也很重要就是不要做盲目的人员扩张,一定要以合适的节奏招人,否则可能适得其反。
36大数据:从媒体人的角度来问,我们很想知道,互利科技未来12个月的计划是什么?
林坦: 互利科技会持续对产品进行迭代和创新,走出自己的独特的路。同时为更多中大型企业和机构提供服务,帮助他们节约成本,减少损失,提高人员效率,提升用户体验。当然我们也会持续招募更多人才,募集更多资金,保证公司平稳高速的发展。
__________________
观点总结:
1、互利科技目前的主要产品:企业级实时分析与管理机器数据平台HOOLI。
2、互利科技目前的客户有:大型电商,也有通讯,政府,咨询等行业。合作伙伴包括:亚马逊,阿里云、金山云等。
3、互利科技目前的团队规模约20人,未来将持续不断对产品进行迭代和创新,为更多的企业服务。
4、互利科技的商业模式:为企业提供日志数据分析平台,从而收取相应的授权使用费和服务费。
5、互利科技与Splunk的不同点:一是Hooli产品主要采用了更新的技术与架构,在一些性能特征上甚至是超过Splunk的;二是Splunk的客户群体主要为英语系国家,互利科技主要客户是国内企业,本地化服务更加好,更懂中国企业的需求。
6、人才方面:重视人才,但是不会盲目的扩张。
7、以互利科技目前的项目进展来看,互利科技预计在2017年上半年会进行A轮融资。
参考资料:
互利科技CEO林坦:大数据在日志分析的应用与实践
互利科技CEO林坦:机器学习在日志数据中的应用
End.