四年落地七千+客户,五大银行争相投资,第四范式做对了什么
「我国有超 1.1 亿的糖尿病患者,是典型的糖尿病大国,但通常只有 30% 的患者知道自己得了糖尿病,临床上经常见到一个患者是在患病十年以后,发生了心脏病、肾衰竭等才知道自己患了糖尿病,这时医生也很难逆转病情。」
上海瑞金医院国家代谢性疾病临床研究中心 AI 研究负责人赵志云分享道,后来医院跟一家 AI 公司合作开发了一款糖尿病风险预测模型「瑞宁知糖」,可以预测人们未来三年患糖尿病的概率,比此前芬兰和美国通用模型准确率高 2~3 倍,可为特定的人群提供很好的判定和干预。
这家公司正是第四范式,之所以能够取得这样的成果,是因为通过 AI,机器可以在海量数据中寻找千万甚至数亿条规则,从而提升医院糖尿病预测的准确性。
第四范式所做的正是打造一个通用 AI 平台,为企业构建智能「大脑」,优化企业的效率与决策。过去四年,第四范式已经将 AI 落地 7617 个客户、12648 个场景,不仅在商用落地上取得一定规模,也验证了自身平台的通用性。
第四范式也是资本市场的宠儿,红杉资本从 A 轮开始就连续追投,去年 12 月更是完成超 10 亿元的 C 轮融资,短短四年估值已达 12 亿美元,可谓名副其实的独角兽企业。
尤为值得注意的是,它是中国五大国有银行(工商银行、农业银行、中国银行、建设银行、交通银行)共同 投资 的唯一 科技 公司,可谓 金融 行业的「宠儿」。据悉其在银行业的头部客户占有率已超过 70%。
立足于过去 4 年的 AI 落地实践,第四范式现在回答了一个重要问题,企业转型如何用 AI 构建竞争力,它总结出了一套方法论「1+N」,「1」代表企业的核心业务需要用 AI 做到极致,「N」代表企业的众多场景要用 AI 大规模落地。
由此,第四范式还在战术层面给出一套组合拳的打法,包括最新推出的 AI 软硬件一体集成系统 SageOne,助力企业低门槛、高效的落地 AI 应用。
1.「1+N」的构想在于价值最大化
机器之心发现,AI 落地产业缓慢的一个关键问题是信息不对称,传统行业往往不知道 AI 能够解决什么问题,而 AI 公司往往不知道行业的真实需求在哪里。而现在第四范式试图解决这一问题。
在帮助企业转型及应用 AI 的过程中,第四范式从中抽象出了一套方法论「1+N」。其中「1」代表企业的核心业务,需要利用 AI 达到极致效果;「N」代表企业的众多业务场景,可以通过 AI 的规模化落地,实现企业整体经营效率的提升。
这意味着企业不需要关心 AI 能够解决什么问题,而是转而聚焦自身的核心业务上,想办法将核心业务和 AI 结合起来,集中精力做到极致。
企业的核心业务往往是企业的「命脉」,也是构建企业竞争力的关键,哪怕 1% 的提升都至关重要。第四范式创始人&CEO 戴文渊举例道,对于制造企业能够将原材料的采购成本下降 1%,对于餐饮企业将个性化菜品推荐效果提升 1%,对于金融企业的贷款逾期预测效果提升 1%,甚至足以改变企业的竞争格局。因此,面对核心业务,AI 须做到极致效果。
N 则是指企业在 AI 改造过程中,往往存在众多场景应用。尽管它们不是核心业务,但 AI 的规模化落地,往往比单场景的极致效果对企业更为重要。假设一个企业有一千个场景,其中一个场景提升 10 倍,对整个企业来说,只有百分之一的提升。但如果一千个场景都 AI 化,每个场景只提升 1 倍,那对企业也是百分之百的提升。
因此,AI 的规模化落地对于企业的智能化转型同样尤为重要。
第四范式联合创始人&首席架构师胡时伟告诉机器之心,「1+N」的策略主要是为了企业价值最大化,这同时需要考虑收益最大化、机制最优化与获得价值的成本。
中国工商银行大数据与人工智能实验室陈建军称,资金安全和交易安全对于工行的个人客户和企业客户尤为重要,通过第四范式先知平台高维和实时能力的支持,工行构建了上亿维的模型,提升了该领域模型的业务效果。此外,陈建军认为,智能项目的实施过程中数据的闭环非常重要,2018 年以来,场景的落地效率有明显提升。
2.降低企业使用 AI 的门槛
对于企业 AI 转型而言,「1+N」是战略指向,而在战术层面,第四范式也给出一整套打法,让企业实现「1」与「N」的 AI 化。
针对「1」核心场景,要想实现极致的业务效果,第四范式给出的解法是「高维」+「实时」。
胡时伟谈道,越高维度的 AI,意味着效果越极致。第四范式开发的高维机器学习引擎,最高可支持万亿维度,高维模型可以利用海量业务数据中的海量特征,进而提升模型的精准度和业务的智能化水平。
另一个是实时,随着服务线上化以及对极致体验的追求,业务的实时响应越来越重要。结合第四范式本次发布的 AI 软硬一体集成系统 SageOne,可实现高维模型毫秒级响应的实时决策。胡时伟举例道,实时的金融风控可将客户损失降低 30%~50%。
对于企业而言,谁先做好高维与实时,就意味着率先提升生产力,率先为客户提供个性化的精准服务。
另一个维度是「N」的 AI 规模化落地,规模化落地的关键在于简单、高效、TCO。通过规模化落地,释放企业的创新活力,对企业的 AI 转型和竞争力提升尤为重要。而认知水平、数据成熟度和人才门槛则是目前规模化落地的三大主要挑战。
针对如何解决认知问题、数据问题、人才问题,第四范式从统一的方法论和构建闭环 AI 应用两个维度给出解法。
统一的方法论意味着用统一的认知和方法规模化生产 AI,第四范式借鉴了人类学习的过程(由行动——经验——反思——理论这四个阶段构成),基于此构建了「先知」AI 平台,将 AI 开发过程分为行为数据采集、反馈数据采集、模型训练、模型应用四个步骤。简单来说,当我们想要给顾客推荐美食,我们会先让机器采集顾客过往饮食喜好的行为数据,然后推荐给顾客相关食物,并采集反馈数据(顾客是否喜欢),基于这些数据进行模型训练,最终指导机器做出决策,而持续不断的数据采集支持下的模型进行自我迭代,可以带来决策效果的持久提升。
从实操层面来说,构建闭环 AI 应用往往涉及两个问题:模型与数据。企业往往缺乏 AI 专业人才来开发模型,降低模型开发的门槛,让 Web 工程师就能够构建 AI 应用势在必行。为此,第四范式每年投入超 50% 资源在科技研发上,其中 AutoML 就是一项关键技术,通过机器自动建模,降低模型的开发门槛。第四范式联合创始人、首席研究科学家陈雨强现场发布 AutoML 2.0 技术,它不仅是世界首个交互式 AutoML 技术,同时具备自动跨表特征增强能力,实现复杂数据下的自动建模过程。
另一方面,在 AI 应用开发周期中,数据准备占据 60% 以上人天成本,传统数据治理架构已成为 AI 规模化落地的瓶颈。第四范式先知平台从数据完整性、实时性、线上线下一致性三个角度构建数据引擎,解决传统大数据架构构建 AI 应用的效率瓶颈和性能问题。
基于先知平台统一的方法论、AutoML 和面向 AI 的数据治理,AI 应用平均上线周期可从 30 人月提升到数十人天,助力企业实现 AI 快速规模化落地。
此外,第四范式还展示了自动半监督机器学习技术,可以让标注数据下降 80%,进一步解决企业 AI 大规模落地中的数据问题。
最后,无论是核心业务的极致效果,还是 AI 的规模化落地,在底层都需要算力的支撑。而当下传统服务器架构不足以支撑 AI 对算力极高的要求, 导致企业无法负担高昂的算力成本。
第四范式本次发布了企业级 AI 软硬一体集成系统 SageOne,它采用软件定义计算的架构,实现 AI 算法和硬件的深度耦合,并内置自研 AI 训练引擎、AI 推理引擎和 AI 特征存储引擎三大核心引擎,能够充分释放算力,使企业低门槛、高效率、大规模构建 AI 应用。
胡时伟称,SageOne 在核心场景可以做到实时的业务决策,20 毫秒内可实现 20 亿维度模型的高并发访问。另外他还告诉机器之心,相比普通服务器,SageOne 软硬一体解决方案可实现高维模型构建过程的 6~12 倍加速,TCO 降低到 1/2 到 1/3。
3.从树立标杆到行业渗透
过去 4 年间,第四范式在金融、能源、医疗、零售等行业不断树立标杆项目,比如和工商银行开发的反欺诈金融项目,和瑞金医院开发的糖尿病筛查项目等。
这些标杆项目一方面为第四范式带来更多的合作伙伴,另一方面也扮演试金石,验证 AI 平台的通用性,以及从众多行业场景中抽象出共性,这对于 AI 平台的发展至关重要。
现在第四范式又向前迈出一步,宣布开启「启航」合作伙伴计划,打造生态平台。基于先知平台,第四范式建立起产品、咨询、交付、 营销 、技术五大赋能中心,接下来将会与解决方案商、咨询服务商、实施服务商、渠道分销商及开发者展开生态合作。
在机器之心看来,第四范式的核心能力在于 PaaS 层,早期打造一些行业应用更多是为了树立标杆,而随着平台的进一步发展,必须要有丰富的合作伙伴支撑落地,这一方面可以加速 AI 的规模化落地,另一方面也能够加深第四范式对于行业的渗透。
当谈及第四范式是否会从 PaaS 层纵向延伸产业链时,胡时伟称,「我们的根本目标是帮助企业转型,我们为企业转型提供的方法论就是『1+N』,我们所做的平台产品和软硬一体集成系统都是为广泛行业的企业实现 1+N 而服务,而这个过程需要加速发生,需要第四范式和产业链内合作伙伴的共同努力。」
对于如何定位第四范式公司,他称微软、Oracle、SAP 等都是某个时期的成功者,通过优秀的产品和服务给各行各业带来了巨大的变革和价值,第四范式也希望成为给各行各业带来技术落地、创造产业价值的企业。