亏了几个亿, AI 项目到底怎么投?看欧洲老牌风投 Index 如何押宝
1. 早期找到 AI 投资 的锚点
2. 投资向量数据库 Weaviate
3. 垂直整合投资
ChatGPT 的横空出世,让创投界燃起对 AI 领域的投资热情。
但不同于 互联网 时代的流量模式,作为前沿 科技 ,AI 领域投入大、周期长、竞争者众多。
AI 投资难免出现 " 雷声大雨点小 " 的现象。CB Insights 数据显示,今年第二季度,全球 AI 领域投资总额环比暴减 38%。
即便如此,在每个行业都将被 AI 革命的当下,不可否认,AI 一定是未来几年最大的产业趋势。 创业 投资数据库 Carta 报告显示,和其他类别的初创公司相比,AI 初创公司的估值和融资规模拥有更好的增长趋势。
投资人如何在发展早期找到 AI 投资的锚点,尤为关键。或许我们可以学习老牌风投公司的做法。
01 早期找到 AI 投资的锚点
Index Ventures(简称 Index)是一家欧洲老牌的风险投资公司,成立于 1996 年。一直以来,Index 都是 AI 的忠实信仰者和倡导者。
在 ChatGPT 发布的一年前,Index 领投了 Cohere 的 4000 万美元 A 轮融资,目前 Cohere 已经是估值 20 亿美金的 AI 独角兽。(关于 Cohere 是谁,可以参考我们的上一篇文章最年少 Transformer 论文作者如何与非典型华人创业者联合打造 20 亿美元的 AI 独角兽?|独角兽真探)
此外,在 ChatGPT 将 AI 主流化的前几年,Index 已经开始对旧金山的自动驾驶技术公司 Aurora;纽约的机器学习平台 Arthur AI 等人工智能公司进行投资。
前段时间,Index 的合伙人 Erin Price-Wright 领投了 Weaviate,这是一家开源向量数据库公司。该公司在今年 4 月份以 2 亿美元的估值筹集了 5000 万美元的 B 轮融资,除了 Index,NEA、Cortical Ventures、Zetta Venture Partners 和 ING Ventures 也加入了这一轮融资。
那么,Index 为何将眼光投向了向量数据库?适道(ID:survivalbiz)找到了 Index 合伙人 Erin Price-Wright 女士近期的访谈文章《Here ’ s How Index Ventures Is Investing In An Era Where ‘ Every Company Will Have AI ’》,下面是文章的翻译简写和补充。
02 投资向量数据库 Weaviate
首先,对于 ChatGPT,Price-Wright 没有给出高度评价,她认为 ChatGPT 只是在走捷径,毕竟这项技术已经存在了几年,不是什么新鲜事。ChatGPT 之所以走红,是因为 " 突然之间,它被每个人看到了,每个人能真切地感受到它作为一个消费品 "。
那么,真正具备价值的是什么?
从采访来看,Price-Wright 给出的答案包括支撑 ChatGPT 的向量数据库。
目前的大语言模型主要基于深度学习技术。深度学习需要输入文本,图片,视频等语料数据。但这些语料数据需要转化为向量数据,才能被神经网络使用。而向量数据库,是用来存储和查询向量数据的数据库。
为解释向量数据库的作用,我们假设一个场景。图书馆一般按类型和作者排列书籍,例如文学类、 经济 类等等。但如果你想找一本小时候看过的恐怖故事,只记得里面有稻草人变成活人的情节,不记得书名和作者时,你该怎么做?
如果你没时间翻找书架,最快的方法是问图书管理员,因为他们读过很多书,更可能知道哪本书是你要找的。
那么,图书管理员就是一个向量数据库,因为向量数据库旨在存储关于对象 ( 例如书籍 ) 的复杂信息 ( 例如书籍的情节 ) 。因此,向量数据库可以帮助你根据特定的查询 ( 例如,一本关于…的书 ) 而不是一些预定义的属性 ( 例如,作者 ) 来查找对象,就像图书管理员一样。
例如,让 ChatGPT 用莎士比亚的语气生成一段诗句,ChatGPT 先会通过向量数据库的相似搜索功能,才能增强内容输出的准确性。
因此,训练大模型时,向量数据库可以成为一个知识库,给大模型提供最新数据、每个客户企业独有的内部知识库。
Price-Wright 表示,在寻找这个投资机会(投资 Weaviate)前,Index 花了近两年的时间研究向量数据库。" 而真正让我们下定决心的事件是 ChatGPT,它让我们真正理解了向量数据库在更多生成式 AI 工作流中的价值,以及真正理解嵌入算法的重要性。"
公司在思考中得出了两个结果。
1、当你考虑了所有这些不同类型的生成式 AI 用例,会发现实际市场比单独的企业搜索市场要大得多。(the market was actually way bigger than the market for enterprise search alone, if you ’ re thinking about all of these different types of generative AI use cases.)
2、拥有一个专用数据库的价值,它可以非常接近嵌入算法。让你成为其产品的一等公民,而不是现有数据库的附加产品。(the value of having a dedicated database that could get really close to the embedding algorithms as a first-class citizen within its product, versus a bolt-on for an existing database.)
Price-Wright 认为:" 在接下来的十年中,已拥有大量数据集、大量客户群和复杂运营的企业会开始将 AI 融入到他们的产品中,让运营更高效、流程更精简、决策更快更灵活。我们将看到 AI 成为企业新型搜索的一个大的推动者,将数据编码成向量,并使用 AI 寻找相似的信息。对于很多用例来说,这比关键词搜索更加强大。"
那么,让 Index 青睐有加的 Weaviate 又有哪些优势?
Weaviate 首席执行官兼联合创始人 Bob van Luijt 表示:" 作为一个开源产品,Weaviate 向量数据库被用作 AI 原生生态系统的核心基础设施。它允许从初创公司到企业的用户创建新一波应用程序,范围从定制的搜索和推荐系统到 ChatGPT 插件。"
另外,Weaviate 向量数据库简化了 AI 开发人员的向量数据管理,解决了生成、存储和搜索嵌入向量及其相应对象的难题,具有如下功能:
1、可扩展的内置机器学习(ML)模块:只需加载和搜索;Weaviate 负责机器学习(ML)的繁重工作——任何数据类型、任何模型、任何用例。
2、更丰富的向量搜索:支持各种 ML 搜索,还可以搜索向量和生成向量的源对象。
3、高性能:亚秒搜索,可扩展到数十亿个对象,不间断运行。
Price-Wright 也曾在另一篇采访中表示:" 企业和人工智能原生初创公司使用 Weaviate 开发多模式搜索、推荐和生成应用程序的速度令人难以置信。这是开发人员使用人工智能构建的最佳产品,我们很高兴能与他们合作,帮助推动下一阶段的增长。"
03 垂直整合投资
除了投资向量数据库,Index 还在 AI 投资领域做了哪些动作?
如同 SaaS 随着云计算的兴起而出现一样,基于 AI 原生的产品也正在带来新的 商业 模式。
Index 认为:第一,在十年内,AI 将成为每一个应用软件的核心组件;第二,这一波浪潮将由广泛采用的基础模型(foundation models)来推动。
" 我们并不确切地知道这些新的商业模式将会是什么,但是我们对软件价值链如何变化有一些想法,并且开始看到了新模式出现的早期迹象。"
在应用层,Index 认为,随着时间的推移,商业模式将转变为通过 AI 来解锁更多针对客户的价值。用户不再简单地为使用 SaaS 付费,而是根据产品内的定制或个性化程度付费,例如针对行业、组织甚至个人进行微调的模型。
基于此,Index 投资了 Gong、DeepScribe 等公司。
2020 年,Index 投资了 Gong,他们的产品可以记录销售电话,并允许公司管理者来以此分析业绩,发现客户反馈的趋势,帮助培训和指导销售代表。当一个组织广泛采用该产品时,Gong 就会沉淀他们与客户对话产生的大量数据集。这反过来帮助 Gong 更好地定制产品,以高度个性化的方式服务于特定企业,从而改善用户体验。
2022 年,Index 领导了 DeepScribe 的 A 轮融资。DeepScribe 的产品可以记录医患对话,并使用 AI 为电子健康记录生成结构化的医生报告。通过持续使用可以增加产品对特定用户 ( 例如,具有特定风格的医生 ) 或一组用户 ( 例如,特定专业的医生或遵循一致标准的特定医院集团内的医生 ) 的价值。
在这两种情况下,随着产品被持续使用,用户将更多自己的数据放入产品中,AI 也能够以高度定制化的方式进行改进。
Index 认为,这是 AI 原生(AI-native)公司建立护城河并随着时间推移而持续获得增长价值的一条途径。
除此之外,Index 投资了 Hebbia,该产品可以用 AI 快速准确地为 金融 服务行业提供信息。Index 还投资了 Notion,这是一家拥有强大工作流和用户体验的公司,该公司目前致力将 AI 无缝融入到用户使用中。
Price-Wright 说:" 当我谈论 AI 是令人兴奋的,因为它是一种新的促成技术(Enabling technology)。AI 无处不在,并正成为每一款软件的心脏起搏器。"
来源:钛 媒体