ChatGPT热炒下的AI制药:不能承受之重
本文来自微信公众号: 深蓝观(ID:mic-sh366) ,作者:李昀,编辑:王晨,题图来自:视觉中国
3月15日,OpenAI发布GPT-4,成为公司在ChatGPT之后最先进的人工智能系统。
ChatGPT的出现,再次让和AI相关的一切领域站上风口。“ 2021年那一波AI制药的投资人又开始活跃起来了, 见面就聊ChatGPT能不能带来什么新的机会,这也是最近医药寒冬里为数不多的积极话题了。”一名投资机构人员说到。
而看到这条消息,国内最早从事AI行业的曹翎 (化名) 在朋友圈留下了一句很“不应景”的话:“真正的失落都是无声的。”
十几年来,曹翎一直在AI行业穿行不歇。他的最后一份工作,是在国内某知名大厂背景的AI制药公司从事AIDD (AI药物发现和设计) 。如今退圈的他有一些写书的计划,只想“为这个行业做一些基础建设工作”。
对于像曹翎一样的AI从业者而言,这个行业就像是幸运大转盘上的指针,曾经定格在电商、游戏、直播等行业。2021年,这枚指针落到了生物医药领域。一众国内AI制药初创便像雨后春笋一般崛起。但随之而来的,还有意料之中的内卷、路演,和资本的游戏。
一边,AI制药已经成为了一个大型投注箱,其中回荡着金钱的碰撞声:如果人类生命科技的未来注定属于多特异性药物,那善于分析复杂分子的AI必定大有可为;另一边, 则是AI制药的算力、数据库、准确性问题一直没有得到突破性解决,现阶段AI只能把药物研发效率从11%提高到14%。
“制药行业其实根本不在乎AI。”曹翎有点苦涩地说。“你AI做成的数据再漂亮, 药企可能只会花研发中的5%的权重去买它。 现在大药企就是看这些AI制药企业表演着,等表演得差不多了,再大家一起把这一块儿买走。”
而在大药企作壁上观的另一边,是这些AI初创人员为了数据准确性能再提升零点几加班加点、苦不堪谈。“AI制药是一个数据驱动的活儿,产品迭代特别快, 但其实背后的规律性没有搞透,真正的生物科学家又看不上。 ”——在曹翎看来,如今的AI制药从所谓的前沿科技渐渐滑落为一种四不像的尴尬产品,这是行业真正的失落所在。
相比于过去的AI投资人再次燃起的热情,在二级市场重新吃香的相关企业,诸如复星医药、成都先导、药石科技等,却在业内人士看来并不是纯粹的AI制药企业:要么是AI技术只占公司业务很小一部分,要么底子上是制造业化工的逻辑。而二级市场的重新繁荣,并没有带动起整个投融圈的热情。业内人士透露,对于大部分真正只做AI制药的初创而言, 现金流即将在半年之内出现巨大黑洞。
如今,大部分的人已经认清AI制药的工具属性, 应服从制药业本身的逻辑。 而只要它在行业中的应用程度和作用强度不发生改变,那么不管是股市的喧嚣一片、还是AI技术的飞驰而过,对于AI制药行业都只是一些遥远的消息而已。
2021~2023,AI制药资本的冷与热
去年12月,晶泰科技回应了港股18C咨询文件,这距离它最后一次融资已经过去了一年半的时间。
作为国内AI制药的头部,晶泰科技在2021年时也经历过50家国际机构融资竞标、额度达到8亿美元、投后估值达到19.68亿美元的盛况。然而,随着2022年生物医药市场环境的失速,公司不得不搁浅了美股IPO的计划。
2021年是AI制药最好的年头。 DeepMind的深度学习算法Alphafold刚刚被验证能够准确预测蛋白质的三维结构,就遇到了那一年的biotech上升期。 AI制药公司的数亿融资俯拾皆是,与药企合作捷报频传。“当时我们公司为了挖人,曾经开出过100万美元的天价高薪。”一名AI制药企业员工回忆。
然而,仅仅一年时间,AI制药卷起的泡沫就被打得粉碎。医药寒冬一来,钱去人空不可避免。去年一整年,部分美国上市的AI制药市值已经低于1亿美元,跌幅超过90%,其中不乏Absci、Schrdinger这样的独角兽。在国内,风口也巅峰不再,去年上半年融资总额同比缩水2/3。
除了突如其来的资本风暴以外,AI制药式微的主要原因还在于:它并没有像原先人们所料想的那样,帮药企解决卡点问题。本质上, 它只是把药企目前面临的问题,用不同的语言再重新书写一遍。
一名AI制药领域的专家介绍到,这个行业最早是卖软件的,但是只收服务费,上限比较低;如今是在做CRO还是做药之间产生分歧:晶泰偏CRO,英矽偏biotech——但不管是哪种路线,它都没有在根本上解决药物研发的失败率和成本问题。
资本市场曾经流行着一个诱人的故事:AI可以将公司的药物发现成本降低高达70%。但事实上,这只是理想数据, 因为目前市场还没有见证到AI制药的最终产品 ——2022年,第一款由AI设计、号称只用了12个月便进入临床的分子DSP-1181因I期未达标而折戟。
公司需要在前期打通数据、算力、算法,这绝非小数目;交叉学科中人才的稀缺问题,造成昂贵的人才成本;生物验证过程中的各种不确定性,造成来来回回的退回和返工——而这一切都让AI制药, 绝不像它听上去那么省钱。
最重要的是,大部分AI制药公司目前并没有清晰的发展主线,商业化通路处于观望状态,往往会在“既要又要”的“尝试”中损耗精力。曹翎提到,自己的老东家,就因为一些预算以外的投入,导致产出的虎头蛇尾。“在做药之前,公司必须把周边的东西搞齐或摸排清楚,其中包括不同的生物技术路线,包括产业链上下游的东西,要保证企业又能卖产品,又有自己做药的能力。这部分成本是非常大的。”
AI制药同样面临着生物医药领域同质化竞争的问题。 简单来说,AI的学习资料是人类已经创造的实验数据,对于那些冷门的靶点信息,AI无法无中生有。“AI制药公司用的数据库都差不多,算法技术也没有太大的技术壁垒,无非是针对场景慢慢进行优化。说到最后,还是拼靶点。”上述AI制药企业员工说。
一切似乎都回到了AI制药出现之前的原点,逻辑和难点都没有改变。
2023年,随着ChatGPT的大火,不少AI制药企业就像杀入18C的晶泰科技一样,意图再度抬头。成都先导,皓元医药、药石科技、泓博医药等医药上市公司先后披露布局AI制药赛道相关情况。“投资人们最关心的就是,ChatGPT这种生成式AI能不能给制药行业带来什么新的东西。”上述投资机构人员说。
“AI制药不能和ChatGPT比较,因为训练后者的,是强大的互联网工业和二十年左右的语言模型发展。相对而言, AI制药实在是太年轻了。 ”这名投资机构人员继续说道,“甚至可以说,对于AI制药公司而言,最难的时刻还没有到来。因为大批的产品还没有进入到临床阶段,真正的大考还没有到来。”
ChatGPT给的机会在哪里
在这一轮热度之前,AI制药还只是生物医药行业的一个影子,无法摆脱跟随式发展的限制。而ChatGPT这一剂强心针,不仅打在了二级市场的心坎上,还让不少投资机构给出观点: ChatGPT给了AI制药一个从辅助性向创造性迁移的机会。
“ChatGPT是一个数据与经验结合的大模型,而药物研发比较重要的是靶点的发现,本来也是对基因、蛋白组学的数据进行分析,建立关联,所以比较容易被大模型所替代。短期来看,GPT可以取代初级和中级的药物专家。”上述AI制药领域专家说。
一方面,GPT架构的排序训练方式,在理论上可以融合所有药物研发的模态数据,支持通用的药物研发模型;另一方面,它可以成为一个整合核心,通过API的方式调用各个子模块,而子模块返回的结果可以通过核心GPT进行整合报告,从而实现更加专业的预测。
简单来说,GPT有一个大底座,可以承载更多的生物信息 (小分子结构,蛋白质序列,化学反应,小分子与蛋白质对接,过滤规则等) ,也可以在不同步骤进行及时反馈,趋近准确。
这其实解决的是AI制药曾经出现过的两个问题:第一,是 模态不全 ,不同维度的生物信息之间无法协同导出综合判断;第二,是 运算压力造成的算力问题 ,经常会导致预测结果不够准确。
可以说,如果AI制药是一把枪的话,那么ChatGPT的确让它弹夹更大、弹道更直了;然而,如今AI制药最头疼的数据问题——即:子弹该如何被完美地上膛后射出,却始终没有得到清晰的答案。
水木未来CEO郭春龙曾表示过, 给数据做标签,这是ChatGPT能够突飞猛进发展的一个前提条件,而AI制药在这方面还没有准备好。 “你给一段话加上个标签,成本最多1分钟甚至几秒钟的事。但是你要希望给一个蛋白质的序列加上标签,往往需要大量的实验,包括电镜的收数据、解数据,它的成本要高很多。”
比起贴标签的成本,更严峻的是 数据来源 问题。ChatGPT依托在互联网这一共享平台上,而在可见的未来,制药行业的数据壁垒无法被打破。
除去有限的公共数据库外,AI制药公司只能通过与药企合作、自有实验平台、委托CRO等形式获取用以训练系统的信息;同时,因为不同实验室或公司数据标准化程度都不一样,前期输入的标准化转译也必须投入大量人力、财力。
“从数据来看,只有蛋白结构这个事情是可以解决的,其他环节的一些定量的、定性的实验数据因为标准化问题,80%实际上都是不可靠的。”曹翎说。
另一个GPT能做到、而目前AI制药无法做到的事情同样和数据相关。GPT的特点之一在于对信息的理解和筛选,其中涉及到强度和权重的赋值,可以理解为:人工智能可以决定在海量信息中重点看什么,不去看什么。而目前, 生物类数据还没有找到一种有效的方式,可以表现突出关系或信息的重要性层级。
“目前大家希望可以通过蛋白序列和基因序列的手段去解决这个问题。但这些序列在发生功能的时候,已经是一个结构化的东西了。相当于我们用一维的手段,去研究四维状态的现象背后的规律,然后再去映射它的功能,说实话挺难的。”曹翎说。
对AI制药有期待,错了么?
不管是科学界还是产业界,如今越来越多的人正在认定:多特异性药物,将引发现代制药工业的第四次革命性浪潮;那么,似乎没有什么理由可以指摘人们对AI制药的高度期待了。
面向未来的药物形态, 将拥有多重治疗机制和丰富的合成结构,其核心就是“以复杂对抗复杂”, 其中便给了AI分析和设计的广阔空间。
但同时, “复杂”也给了AI制药一种无的放矢、无处着力的困境。 一名AI制药企业管理人员总结道:“做药是个非常复杂的系统工程,AI在其中一个环节的加速,可能会被另一个环节所稀释。因此,AI制药必须要找准最关键的杠杆点。如果在一个点上能有千倍以上的提升,就会有一个从量变到质变的过程。”
简单点说,AI制药企业未来的定位,应该是像狙击枪一样。“大药企就像是霰弹枪,打击范围大,总有那么一两发是中的。”曹翎说。不管是AI制药初创,还是传统药企,研发都是一个几率问题。大药企能承担巨额的试错成本;相对而言, AI制药不能走量,只能在一些细分方向或步骤上做出四两拨千斤的效果。
换句话说,如果我们所期待的,是AI在复杂问题中提供全面而完美的解决方案,那么失望是在所难免的;但如果AI可以在复杂环境中,做撬开问题的一个杠杆,那我们将很可能获得一个全新的视角。
一名AI制药初创的研发人员发现,AI给人的感觉就像一个孩子一样——经常出错,但也能带来惊喜。“最近我们跟一个临床的合作方在做一个类似于自免罕见病的项目。对方问:如果给你患者的血液样本,你能不能分析它特定负极的bcr组库,然后去反向找自免抗原?理论上,因为人体内的蛋白是已知的,如果用高通量的结构和亲和力模型去做的话,是有机会的。我们就用AI试了试,最后给他推荐了4个。结果昨天他告诉我,其中一个挺有希望的。”
长期和AI打交道的经验告诉这名研发人员,任何时候都不能高兴得太早。但只要有耐心, AI就能不断在错误中爬起来、成长起来。
“之前我们用全人源的小鼠筛了一个相对复杂的靶点,是非特异性结合。我们就用AI去优化了一下,明显发现它在od450的层面的比值下降了很多,相当于我获得了一个推荐结合的靶点。但后来测试的时候,才发现它没有blocking function。”她回忆道,“后来我们大概又迭代了两轮,这样就把分子拿到了,就最终结果而言还是好的。”
在这名研发人员看来,目前AI制药最受诟病的一点, 就是没法一步到位地实现目标,这背后涉及的是对其商业效率的焦虑。 “在没有找到正确路径之前,一切都有可能发生,甚至有可能会出现迭代以后数据准确性下降的问题。而生物验证那边的反馈又很慢,效果好不好需要做上15天的实验才能知道结果。”
在AI制药方兴未艾、势单力薄的当下, 大部分企业在面对药企客户时并不具有议价权。 业内人士称,和AI制药初创合作的药企,大部分也都是抱着“玩票”的心态,“象征性地”给一些合作款项。
总体而言,AI制药的服务报价低、周期长,作为一款提供灵感的玩具而言,它显得实在太奢侈了;而它什么时候能升级为一款成熟的工具,还得依靠“玩”出来的思路和可能性——这也正是AI制药行业目前感到矛盾的地方。
本文来自微信公众号: 深蓝观(ID:mic-sh366) ,作者:李昀,编辑:王晨