两年追踪170个AI团队的原型设计：初创公司该选择做研究还是做外包？

亿欧网 • 7年前扫码分享

帮助研究驱动型原型设计团队成为初创企业带来的意外收益

两年之前，一位朋友鼓励我以导师身份参加柏林Techstars首届选择日活动。自那时开始，我就一直作为Techstars导师不断帮助“深度技术”初创企业由原型设计阶段顺利过渡至产品与市场相契合的层面。我所见到的大多数的初创企业仍处于原型设计阶段。从定义角度来讲，他们的原型设计尚未完成。

原型设计显然不足以令风险投资商满意。不过，打造新事物对于初创企业而言，在价值上要高于提供演示或者发布市场研究结论。全程追踪数十套原型设计方案在特定领域遭遇的难题以及茁壮成长的经历，正是我不断完善自己投资水平的主要学习资源。

颠覆性成果距离很远，但特定应用却距离很近

举例来说，从研发角度来讲，颠覆性成果似乎已经离我们不远——历史上对于AI的研发目标一直在于超越人类的智慧水平，并给整个人类社会带来难以想象的深远革命。但从另一方面看，第一代聊天机器人给我们带来的用户体验几乎可以证明，这样的深远革命确实够“远”。深入观察，我们只看到了数十款不再以规则为基础的机器人方案。相比之下，过去两年当中则出现了超过170多种更为出色的原型设计——其确实在一定程度上实现了AI超越人类的奇迹，只不过仅限于特定行业垂直领域内的专业应用，即在非常具体且狭义的任务上实现这样的效果。

平台并不足以消化这一切

另一项深受认同的论据，认为各大（美国与中国）互联网平台将在本质上“拥有”多个行业AI市场。这是因为“AI是一类强者愈强的行业：你拥有的数据越多，产品就越好；你的产品越好，能够收集到的数据越多。”这样的结论在一定程度上的确属实，具体包括图像识别、自动驾驶车辆、语音到文本以及基本上任何人皆倾向得出“正确”答案的应用场景。然而，很多问题并不具备惟一的正确答案。因此如果大家尝试利用机器学习构建新型内容，或者利用数据学习新的内容，那么这将建立起完全不同的市场体系，且其中完全能够容纳众多垂直赢家。

另外，数据本身的作用其实并不像以上论点当中表达的那么显著。根据我所看到的诸多原型设计，我发现利用以往数据进行神经网络训练其实实践价值相当有限。

虽然这也许有助于加速初始原型设计，但也就仅限于此了。大型企业可能确实掌握着多年以来的消费者数据与交互记录，但在对神经网络进行训练时，其仍然需要从头开始。初创企业的竞争环境则更令人惊讶。在我看来，财富五百强企业中的大部分都已经意识到，AI实现方案所需要的数据量要比他们想象的少得多。

除此之外，我还发现这些研究驱动型团队存在两大主要趋势：其一是这些研究型团队经常受到科学论文平台ArXiv社区的启发，且目前开始迈入初创阶段。在大多数情况下，他们都作为大型集团的小规模外包研究型团队存在。

ArXiv启发下的研究型团队逐步迈入初创舞台

也许正是由于存在这样一个公平的竞争环境，才促使众多研究驱动型团队参与到柏林的初创市场当中。

这一切对于柏林亦属于新鲜事物。柏林的初创环境长久以来一直以学生创业为主要表现形式，并培养起大量来自本地的所谓“运营型”初创企业。Rocket Internet公司的成功凭借的是他们自身的才能以及硅谷对于市场上现有技术的漠视。然而，如今此类机遇似乎已经不复存在。但包括我自己建立的Xyo公司在内的各类研究型初创企业则成为一种宝贵的例外。

很多人并不知道，柏林充斥着大量独立的开发人员。他们既可以在公司内工作，也可以参与一些业余爱好性质的项目，甚至成为柏林当地各企业的外包商。从2011年开始，我记得Android团队的Reto Meier就开始邀请我参加柏林的Android大会，这一活动吸引到了超过1500名开发者。除我之外，没有任何一家柏林当地初创企业参与其中，在这里出现的只是一群充满爱好与热情的开发人员。

这样的情况目前仍然存在。走出校园的博士们仍然将主要德国企业（包括工程、银行、金融以及各类中型企业）作为就业目标。然而，我们现在已经拥有了一波根基稳固的研究型创始者群体。另外，他们中有很多人来自柏林以外的地区。在我们遇到的170个团队当中，有超过六成来自柏林之外。事实上，来自美国与亚洲的众多研究团队同样相当活跃且令人瞩目。柏林能够仅以4000欧元的成本养活一支包含三位成员的技术团队，这样的物价水平在全球范围内都极具竞争力。

受ArXiv启发的初创企业的兴起

人们一再向我强调，研究型团队转化为初创企业的另一大动力在于，初创企业如今面对着应用研究领域的巨大发展空间——事实上，初创企业的研究方向相较主流企业要更为自由且灵活。

以开放性的心态进行方法共享、讨论与辩论，再加上开源成果的快速采用周期（几乎能够立即发布在GitHub之上）使得初创企业对研究人员而言极具吸引力。网络论坛与各类平台也一直在推动这一观念，即没有任何其它企业能够像ArXiv这样充满活力——在这一由康奈大学最初建立的在线科学论文库平台当中，各类团队能够随意参与各类讨论。

这里为研究人员提供的生活方式——即随时发布他们的想法/研究成果并进行公开参与——能够带来极强的鼓励性作用。人们对此通常抱有一种（误导性）假设，即初创企业能够给研究人员提供远胜过高校或者大型企业的自由发挥空间。一般来讲，AI团队只负责发布研究成果，而无需考虑构建具体产品或者商业模式——他们只需要等待收购即可。

要驳斥这样的固有观念，我们可以列举一个实例——Prisma应用如今已经拥有极高人气，其允许用户根据主题将一幅图片的风格转换为另一种完全不同的形式。

最初，一组来自图宾根大学Bethgelab的研究人员于2015年9月发表了一篇题为《艺术风格中的神经算法》的论文。

此项研究立即得到了关注，并在几天之后开始在GitHub上进行应用程序开发。相关的高人气论文及应用程序不久后开始陆续出现，且直到今天仍拥有相当的热度。到16年6月，Prisma应用由数位俄罗斯年轻人开发完成，并在被引入Facebook Feed后得到了公众的广泛认可。

目前人们普遍认为，Prisma的广泛普及使得公众开始对神经网络的应用方向抱有好奇心。但在另一方面，这也为初创企业指出一条新的发展途径——先面向公众，而后面向研究社区。

突然之间，很多人开始将初创企业视为一种理想的工作选择。最终，Bethelab团队也建立起一个Prisma风格的网站。据我所知，至少有15家初创企业的灵感源自ArXiv上发表的论文。更多初创企业则通ArXiv建立起尝试实业的信念。

正如Roobie Allen所言，这是一场ArXiv启发下初创企业的崛起浪潮：

“与大多数其它技术相比，AI的关键在于其强大的学术研究背景。（……）不同于在获得支持之前长期停滞的创新或者等待倾向，绝大多数AI研究成果皆基于为期仅数个月的工作以及有限的代码量。其中的关键在于尽快将思路提交至社区，以便其他人能够对其加以改善（并在他人做到之前确立思路的归属权与地位）。”

ArXiv启发型初创企业的局限

与此同时，AI研究与进展不仅体现在风格转换层面，同时亦在视觉与图像建模领域拥有出色表现（具体包括图像识别、视觉问题回答、图像语义标签、视频识别以及图像生成等）。书面与口头语言的研究工作在活跃度与开放性方面相对较低，机器学习系统在这两方面的水平则更为有限。

举例来说，没有人会在推文当中像Alex Champandard或者Nicholas Guttenberg那样讨论自己的思路/研究成果。语言本身也非常复杂，这是因为其与族群状态关系密切。有人认为深度学习将彻底解决自然语言处理（简称NLP）问题，意味着大家不再需要学习语言知识。然而，计算机语言学家们在面对计算机视觉/深度学习研究人员时却显得非常无力——他们对文本数据进行了一些实验，并发现自己根本无法在自然语言处理层面拿出同样份量的成果。

服务于大型企业的小规模外包研究团队仍面临挑战

对于大多数此类团队而言，通往初创企业的转型之中和仍然挑战重重。其中部分挑战属于创业工作当中的“常态”，换言之大部分此类团队都会提出类似的问题。

其中还存在一些具体的模式。就我所见到的情况，超过九成的AI原型设计方案以企业为中心，而非以消费者为中心。在这样的引导之下，相关团队大多数会将少数大型企业（买家）作为目标客户。

在这种意义上，此类团队更应被视为“企业外包研究机构”，而非真正具有爆炸式增长潜力的“风投级初创企业”。正视并深入探讨这个问题显然不是什么坏事。就2017年来看，大量成规模的企业开始与初创公司合作。在柏林，目前存在着超过160个企业加速器与创新团队。而本地也存在着不少受众，愿意为这些年轻团队的聪明才智买单。

给大家举个实例。最近，我发现一家初创企业正在与两家物联网冰箱制造商合作。就具体功能而言，这些冰箱产品在关门之后，其中的内部摄像机将能够帮助用户查看存放内容。其中一部分产品可以实现条码识别，但另一些则不能。接下来，这些日常数据将被发送至厂商处进行分析。

毫不意外，这家企业希望将“大数据”作出的模糊承诺转化为更具体的收益。

这家企业无法弄清如何追踪ETL问题并在内部将数据转化为实际价值。这就给我们的研究人员带来了创业机遇。在实际接触中，这家初创企业提出了很多关于解决各类挑战的好办法。其中之一在于建立一套出色的模型，而后设计训练神经网络以识别各类品牌标志图像，最终以此为基础构建部分分析功能。

对于研究驱动型团队而言，达到上述目标已经相当值得称道，更遑论其能够通过自己的工作获得报酬。然而，他们只是重复了以往他人已经实现过的成绩，因为这样的结果并不足以使其成为风投眼中的黄金“初创企业”。虽然他们仍有可能成为未来的初创明星，但就目前而言，其方案仍然只是一种早期原型，且其堆栈与初始代理客户端当中仍存在不少漏洞。与他人一样，Eyeem公司的Ramzi Rizk也认为：成为一家符合风险投资要求的AI初创企业其实非常艰难。

未来展望：时间到数据与快速迭代

那么这些小型外包研究机构要如何才能发展为真正的初创企业？以下两项目标值得大家加以借鉴。

时间到数据

正如AI风投方Merantix公司的Rasmus Rothe所言：

“在机器学习学术界，人们几乎不会关注数据集的获取方法。相反：为了将深度学习技术与其它方法相比较，同时确保其中一种方法优于另一种方法，标准流程要求以相同的评估程序来衡量标准数据集的处理成效。然而在现实世界当中，新型算法与其它方法相比在成效方面反而下降了1%。这里的重点在于构建起一套强大的系统，确保其能够以足够的准确性解决所需任务。对于一切机器学习系统，这都需要进行标记训练，并帮助算法以此为基础完成学习。”

实际上，人们可能往往会假设能够实现AI突破的关键性算法如宝藏般静静躺在某处，等待着研究人员通过大量高质量数据集将其从现有文献当中挖掘出来，而后立足当前可用的硬件加以针对性优化。

在演讲当中，我通常建议此类机构依靠以下方式运行测试。

让企业付费以确保研究工作的正常运行。

坚持投入同样的时间服务于其它客户。

在这些“其它”客户当中，需要优化的重点在于获取数据的时间。对于那些愿意测试自己粗糙的beta原型方案并提供反馈的朋友而言，这无疑是一种福利。通过这种方式，我们通常能够与其它初创企业（以免费方式）进行初步对接，而后与这些小型且通常由初创者主导的年轻公司组队，从而在无需正式数据获取流程的前提下作出明智决策。

更快迭代周期

另一条建议则与数据分析相关。在这方面，大家需要找到哪些模型能够确切实现效果，而哪些模式适用于特定数据集。

这意味着研究团队不可能以上百万个数据点为规模进行运营，因为这将带来3000甚至是10000套数据集。相反，着眼于数据并发现模式才是最好的选择。

其中最简单且成本低廉的处理方法就是在AWS S3存储桶上执行无服务器MySQL查询，或者立足Redshift构建起一些简单项目。如此一来，各研究团队即可将大量数据导入AWS并运行SQL查询，最终查看这些重要模式——而无需自行构建基础设施。

到这里，研究团队需要投入更多时间对数据进行整理（占总体工作时间的七成到九成），而后发现模式并在短时间内构建起算法。对于大多数研究型初创企业而言，这种作法与直觉存在冲突。然而，通过这样的方式，研究团队将能够在两到三周之内顺利前往下一次组队迭代——而非像以往那样耗费更长时间。

一旦找到志趣相投的组队伙伴，接下来就可以审视初创企业的数据收集策略并调查其可行性。事实上，通过计算得出这些数据策略很可能是研究型团队所面临的、最为艰巨的反直觉挑战。

事实上，其中一些策略甚至可能引起争议，并让整个团队重新思考是否还应继续朝着初创企业努力。以Babylon Health为例，这款聊天机器人应用允许用户在无需亲临诊所的前提下就自身症状提出问题，且最近筹集到6000万美元。该团队认为，“Babylon的科学家们预测称，我们将能够很快实现比医生更出色的个人健康问题诊断与预测能力。”在西方世界当中，从诊断到健康状况预测涉及大量数据、科学、法律以及商业化问题。

不过单纯从技术角度来讲，医疗团队确实能够打造出一套比人类更强大的特定健康问题检测或预测方案。如果能够在理论层面将诊断准确率由30%提升到60%，即可拯救许多鲜活的生命。然而，40%的准确率时可能出现的诉讼足以毁灭初创企业的发展道路。也正因为如此，众多医疗卫生团队选择在数据保护措施较弱或者被起诉可能性较低的国家进行早期实验。举例来说，Babylon Health在卢旺达拥有45万名用户。而西方各国的健康预防相关组织则通过各大型企业处理医疗系统及健康预测的监管工作。

到这一阶段，研究型团队亦开始需要转化为数据驱动型团队。

数据是否（仍）未实现民主化？

可以理解的是，Zeroth.ai公司（AI创新初创企业之一）的Tak Lo认为“数据鸿沟是AI创新所面临的最大威胁”，并极力呼吁数据民主化。

Tak呼吁建立一套类似于维基百科的AI数据库，这也从一个侧面证明如今AI研究团队的主要挑战也许正在于数据访问能力。各团队创始人在努力为合法技术或金融技术等平台当中的垂直领域构建特定用途的产品，并希望借此回避与谷歌或者微软等技术巨头的直接竞争。

然而总体而言，如今的数据还远没有实现民主化。尽管近来人们正在为建立数据民主化平台而纷纷发声，Helix等垂直应用商店也得到陆续启动，但AI当前仍没有达到“苹果AppStore”这一彻底实现移动开发与发布民主化的重量级成果的级别。

我们才刚刚踏上征途

目前对于研究驱动型团队而言堪称理想的历史时机，大家可以将自己的想法塑造出来，并在创业领域当中进行测试。而我们也将越来越多地看到ArXiv在其中发挥的重要促进作用。相当一部分研究团队未来将继续作为大型企业的外包机构进行工作，单就这一点而言已经是一项了不起的成就。而其中一部分团队还将进一步发展：找到自身产品的市场适应度，同时发现最佳数据收集策略，最终彻底改变世界。