FirstMark合伙人Matt Turck:IBM是“反面教材”,垂直领域的AI创企更具爆发力
AI 星球(微信 ID : ai_xingqiu )】
我是纽约风投公司FirstMark的一名合伙人。FirstMark现已经成为纽约最大的风投公司。从投资角度来说,虽然我对很多事情都很感兴趣,但是我尤为关注的主要区域有两个。
第一个就是“数据领域”。这包括大数据、机器学习和人工智能企业,以及那些数据于他们而言就是核心竞争力的创企,例如ActionIQ、Dataiku、x.ai等。我很热衷于投资这样的企业;我还在博客上积极讨论这些话题。同时,我在运营着一个有着14000名大数据和人工智能爱好者的社区——Data Driven NYC。
第二个是前沿科技领域。前沿科技包括新型计算平台、增强现实、虚拟现实、物联网以及你所能想到的所有流行的新事物。我同样积极在博客上谈论此类话题,并经营着另一个超过5000个人的大社区——Hardwired NYC。
围绕着人工智能的炒作
Matt:我在科技行业的职业生涯几乎都是在数据和分析中进行的。我是一家搜索软件创企的联合创始人。我们用贝叶斯(一种机器学习分类)来进行问题的搜索和检索。
所以,机器学习出现在我的投资范围内已经好多年了。但是,我最近对此更有兴趣了。大数据出现,并且提供了合理的成本和速度来捕获及处理大量数据的基础设施。反过来,这又加快了机器学习的发展速度,特别是在需要大量数据工作的领域,比如神经网络。
现在正是投资该领域的好时候。在我看来,围绕着人工智能的炒作确实存在的。
Matt:据我在市场所听到的,大概是IBM。
主要是因为他们营销做得充分,而且有雄心壮志,但是这让他们自己陷入了一个尴尬境地:他们承诺得太多,但同时垂直于诸多领域也难得到能让市场满意的回馈。
我听说,只要你愿意花几个月时间和大量的金钱去训练IBM Watson,你就可以用它来做一些非常有趣的事情。但是很明显,他们言过其实了。
他们发现,他们在每个垂直领域方面的交易上都要跟别人竞争。据我了解,他们正在损失大量的交易,而且通常是败给那些更专注、更灵活的小公司。
Matt:我觉得不会。我听人说,当Salesforce创始人Marc Benioff去年宣扬人工智能平台Einstein时,Salesforce公司内部的人都有些害怕,不过我觉得这可能也是因为Marc本人就特爱夸大罢了。
创业生态系统循环和市场的收购动向有着直接的关系。在某种程度上,这是因为它们让你更有机会接触到机器学习的人才,而这正是目前这个阶段的主控因素。Salesforce和创业生态系统有较强的连接性,这一点很重要。
专有数据集所面临的挑战
Matt:创业公司在这一方面确实处于劣势,但是,最终他们还是会让资源变得丰富起来的。
从技术角度来说,我认为,今天,该行业中最敏锐的人(不仅仅是初创公司里的人)正在致力于让神经网络在数据量较少的情况下发挥作用。在可以看得到的未来里,这将是这个行业前进的方向。几家我很熟悉创业公司已经取得了一些真正的进展,并在转移学习方面做了一些有趣的事情。话虽如此,这似乎还是一个特别棘手的问题,所以还需要些时间。
当然,创业公司也正在寻找各种各样的方法来获得他们所需要的大型数据集。举一些医学成像领域的人工智能公司为例,他们中的一些人在与特定医院建立了合作后,能安全地访问一些特定的放射影像数据库。其他一些领域也是如此,如保险、工业机械、农业等。
另外,获取数据只是挑战的其中一部分,你还需要给它贴上标签,以便深入学习。而且创业公司在解决这个问题上已经很有方法了。
我看到一些创业公司在世界各地雇佣了一大批人,用Mechanical Turk(Amazon旗下的公司,网络交易平台)的套路来给他们的数据贴上标签。我还看到其他一些创企聘请了一些行业专家来给特定类型的数据贴上标签,比如一个外科医生精英组给最复杂的医疗图像数据集贴标签。
Matt:理论上,任何可以从多个用户那里收集足够的数据,在集合数据集上运行算法,并将学习反馈给每个客户的机器学习企业这些都可以从数据网络效应中受益。
以x.ai为例,他们的人工智能助手安排的会议越多,他们得到的数据越多,他们的算法也会变得越聪明。算法越智能,体验也就越好。体验越好,人们也就会更愿意使用x.ai来安排会议,从而x.ai就能获得更多的数据。如此良性循环下去。这便是数据网络效应。
这种效应的美妙之处在于它适用于很多情况,从像x.ai这样帮助人们安排会议的公司,再到像Phosphorous这样帮助医院经营基因检测实验室的计算基因组学公司都能适用。
在B2B模式背景下,通常更难受到数据网络效应影响,因为企业都很注重对数据的保护。并且,他们对于把自己的数据和所在行业其他公司的数据混在一起会感到很不舒服。
但是,这种问题也是有办法可以解决的。谷歌搜索在几个月前发表了一份关于联合学习的文章,文章的想法是:在不实际收集数据的情况下支持协作式机器学习。这就可以解决所有关于数据隐私的担心,充分利用各类数据网络效应了。
不管怎样,数据网络效应的影响要几年才能发挥出来。创企要建立客户基础来收集足够的数据,这才能让他们的模型进行学习。不过,一旦完成,企业就会形成较强的竞争力。
机器学习的复杂性延长了销售周期
Matt:我认为,大多数的人工智能创企最终都会变得与其他类型创企相像。例如,根据不同的行业、客户规模、价格点等,会有多种不同的市场策略供创企选择,他们后来将会变得和软件或SaaS公司看起来很像。
但是,我不认为我们已经达到那种程度了。现在,建立机器学习产品需要大量的研发,并且训练算法需要大量的时间、精力、技术资源以及大量的数据。
再用x.ai的例子来说明一下。x.ai用了几年的时间,数十名数据科学家和机器学习工程师,以及数百万的风险投资资金,才建立了一个人工智能后端,提供了高水平的自动化和可靠性。因此,这使得机器学习企业更难成为精益创企,至少现在来说是这样的。
对于这些机器学习公司来说,构建一个真正以人工智能驱动的最小可行产品是比较困难的。任何一款运作良好的人工智能产品都需要获取大量的使用数据,然后利用这些数据来训练算法并定制完善产品。
我更常见到的是:人工智能创企以大的预算来追求更大的客户,自上而下销售产品,基本上遵循合作策略,即在与少数客户紧密合作的基础上,开发出许多早期产品。
通常情况下这些公司最初是通过大量的服务来解决客户的问题。他们希望,能够在工作中构建软件,找到可重复使用的用例,并且随着时间的推移将他们的服务转化为产品。这是一个长期销售周期的过程,虽然很棘手,但运行得很好。
但这只是临时的。随着机器学习的大众化,你会得到更多的开源数据集和算法,以及更多的训练有素的工程师。你会看到,机器学习创企会向其他公司一样变得更加灵活。
Matt:考虑到风险投资的经济效益,后者的可能性更大。显然,我们看到了大公司收购各种小型人工智能公司的狂潮。这种现象之所以会发生,是因为人们多少相信人工智能将会有大发展,而且机器学习的人才也没有那么多。
所以,有时近距离接触研究实验室的公司会获得相当可观的投资。不过,我认为这种情况正在慢慢变少。
这就是为什么像我这样的投资者对垂直人工智能创企会如此感兴趣。在垂直领域方面,创企的专注度更高,而且他们的服务和产品能够区分于大公司。当大公司嗅到商业味道的时候,创企就已经能获得不小的成就了。
只要找准定位,人工智能可以成为真正的差异化因素。人工智能确实会对产品性能产生了巨大影响,提供比现有质量好10倍以上的产品。
不论你是创业者还是投资人,做的都是利用下一个市场拐点来发展公司的工作。几年前这个拐点是SaaS,现在是人工智能。当然,这最终也会结束。只是,现在很多的人工智能企业都有机会来成为这一行业的领军人。