算法抗癌,能否实现换药改命?
2016年,医生邀请Eileen Kapotes参与一款药物的临床试验,这种药物之前从未用于她所患的疾病。Kapotes是一名50多岁的一年级教师,她正在与体内扩散的侵袭性乳腺癌作斗争。在过去的四年中,她经历了包括全脑放疗在内的艰苦治疗,除此之外,她还一直在服用乳腺癌药物赫赛汀,但肿瘤仍在增长。现在一种截然不同的治疗方法摆在她面前:使用芦可替尼,这是一种最初用于治疗血液和骨髓癌症的药物。
「Kapotes对新药反应情况令人惊讶,」西奈山医院负责治疗Kapotes的肿瘤学家Amy Tiersten说,「芦可替尼阻止了她体内癌症的发展,而且几乎没有副作用。」
芦可替尼试验是哥伦比亚大学系统生物学家Andrea Califano历时十年探索的产物。他通过复杂的计算,对维持癌细胞的分子网络进行建模,并精确定位关键的转录因子蛋白,这些蛋白控制着细胞内许多基因的表达。Califano与当时也在哥伦比亚大学任职的细胞生物学家José Silva进行合作,对其他赫赛汀耐药患者组织库中的乳腺癌样本进行了分析。结果表明,转录因子STAT3在这些患者所患癌症中起着至关重要的作用。芦可替尼正是可以抑制STAT3的药物。
当时,其他的研究学者专注于确定个别患者的致病遗传突变。普遍认为这样做有助于为每个患者确定最佳药物。但是人群中致癌突变具有多样性,按照这种方法可能需要成千上万种药物来治疗每个人。
相比之下,Califano的方法则与众不同。他专注于识别一些充当「瓶颈」的转录因子(下图)。无论癌症最初由哪一突变引发,靶向Califano所说的主要调节因子,都可以阻止其进一步发展。肿瘤学家仍需分析每个患者的突变,以确定哪些调节因子在特定的癌症中发挥作用,但这次可能仅需数十种,而非成千上万种药物。这是个性化医疗的非个性化方法。
击中癌症的「瓶颈」。如果靶向的突变在基因网络太上游的位置,就很难关闭癌细胞出错的基因网络。但即使在仅使用一种药物的情况下,禁用充当细胞遗传电路中主要调节因子的转录因子也可能会导致癌细胞的死亡。
Califano在2015年与他人共同创立了 DarwinHealth ,通过利用Califano的算法来识别患者肿瘤中的关键转录因子,并为疾病推荐靶向药物。尽管有人指出这种方法仅在人体测试的早期阶段,其临床用途仍不确定,但Califano的工作还是赢得了其他研究学者的称赞。Califano的合作机构Jackson Laboratory的总裁兼CEO Ed Liu对此持乐观态度,他认为这种方法终将获得回报。「随着我们开发用来攻击这些节点的方法越来越精确,他的算法将变得更加有用。」
Califano的方法即将进行最大规模的测试。哥伦比亚大学已拨款1500万美元用于对其医院未来3年内的3000例癌症患者进行试验,试验会使用DarwinHealth的算法分析每个患者的癌症并推荐治疗方法。「这可能是我研究中最激动人心的时刻之一,」 Califano说,「因为最终我们能够在足够大规模的试验中应用这一方法论,能够真正地从患者的药物反应中获得一些信息。」
算法起源
时间转回1958年秋天,一名年轻的科学家François Jacob带着关于遗传机制如何控制细胞行为的假说前往了他的同事Jacques Monod所在的巴黎巴斯德研究所。这是两个骨子里带着叛逆的年轻人,在第二次世界大战中,Jacob代表流亡的法国政府与纳粹作战并负伤,而Monod这个经验丰富的攀岩者参加了法国抵抗运动的游击活动。在接下来的几年中,两人一起工作,他们首次对遗传电路进行了概念证明。这项工作最终使他们获得了1965年诺贝尔生理学或医学奖。
Jacob和Monod的大肠杆菌实验表明,这些细菌中的基因网络可以改变某些酶的产生,具体取决于它们可获得的食物类型。当环境中乳糖丰富时,细菌会开启基因来编码可代谢乳糖的酶。但是在只能获取葡萄糖的情况下,细菌就会关闭编码乳糖代谢酶的基因。这一发现开创性地证明了单个基因的活性可以被增强或抑制。
随后几十年的实验逐渐解释了细胞机制如何发挥这种控制作用。其中一个关键因素就是转录因子,一种可以增强或抑制其它基因活性的蛋白质。单个细胞的基因调控网络要比Jacob和Monod当时所揭示的要复杂得多。人类基因组包含20000个基因,其中预估有1500个基因能产生转录因子。这也形成了一个复杂的遗传开关网络。
Califano认为如果他能确定癌症的关键开关,也许能够关闭驱动癌症生长的基因变化。1986年他在完成物理领域的培训后,加入了IBM的计算机视觉与 人工智能 先导项目。但是IBM所在处无法建立实验室供Califano追求他对生物学的兴趣。他于2000年选择离开IBM,在2003年就职哥伦比亚大学。他一来到这里就踏上了编写代码解决癌症之谜的道路。
现在Califano算法的底层数据来自 RNA测序 (RNA-seq)。RNA-seq能对标示基因开关状态的RNA分子进行测序来衡量细胞内的基因活性。算法会处理大量的RNA-seq数据,来揭示与健康组织相比,哪些基因在癌症中过度活跃或活跃性不足。然后,使用复杂的方程推导基因相互作用的模式,并瞄准影响最大的转录因子。
癌症关键驱动因素的寻找并不容易。2018年对9000多个样本的分析就报告了近150万个突变。基因在错综复杂的网络和反馈回路中彼此相互影响,因此这些基因扰动在肿瘤中相互作用的方式是相当多的。「有1000个基因在所有可能引发癌症的肿瘤中反复地发生突变,因此与地球上的原子相比,人类具有更多可能的癌症突变组合。」Califano说。
制药行业无法为每一种独特的突变组合制造新药。因此,确认常见的致癌主要调节因子至关重要。
在哥伦比亚大学,Califano与他的前博士后研究员Mariano Alvarez合作开发了更高效的 基因网络分类算法 。目前的VIPER(virtual inference of protein activity by enriched regulon analysis)算法已被用于数十项膀胱癌、前列腺癌和肺癌中庞大关联的基因网络如何发生错误的相关研究。
最近Califano及其同事使用VIPER算法对Cancer Genome Atlas(美国政府赞助的数据库)中的10000多个个体肿瘤样本的RNA-seq数据进行分析后发现,不同类型癌症的共同之处比从前所认为的要更多。算法鉴定出了407个转录因子基因在所有癌症样品中均为疑似关键基因,其中只有20到25个与任一种特定癌症有关。Califano认为抗癌可能并不需要敲除所有的关键转录因子:推翻几个结点就足够了。
商业化
Carifano是最早推出利用复杂算法分析抗癌方法的科学家之一,随后又有其它研究者进行效仿。冷泉港实验室癌症中心主任David Tuveson认为Carifano算法的优势在于其可以查看包括RNA和蛋白质在内的整个基因产物网络。他也在自己的研究中使用VIPER来寻找胰腺癌的治疗方法。
Califano也希望将他的算法应用于患者。商业化的想法始于2013年,在英属维尔京群岛的海滩上他遇到了来度假的Gideon Bosker,他是一名急诊科医生,后来创立了一家成功的医学教育公司。两人一见如故,两年后他们决定组建DarwinHealth。哥伦比亚大学将VIPER技术授权给DarwinHealth,Bosker将自己的140万美元投入其中。自那时起,DarwinHealth的合作机构已使用公司的算法赞助了十多个研究项目。
Andrea Califano(右)和Gideon Bosker(左)创立了DarwinHealth
DarwinHealth将Califano的算法与数据库结合,数据库信息来源于药物如何影响多个基因的试验,编译自公司的文献综述和其它资料。现在只要遵循患者组织转交的相关规定,世界各地的医生就可以将组织样本发送至哥伦比亚大学的病理部门进行RNA的提取。DarwinHealth为患者癌症中可能作用最大的主要调节因子生成了「OncoTarget」,同时还对现有能抑制肿瘤中25种最活跃的转录因子的药物和能增强这25种被抑制的转录因子的药物生成了更为复杂的「OncoTreat」。该产品于2018年推出,售价1600美元。
沙利度胺的指引
俄勒冈健康与科学大学奈特癌症研究所的精密肿瘤学主任Gordon Mills在自己的研究数据中应用了Califano的算法,他认为Califano的抗癌算法仍需克服许多障碍。「有关我们是否能够预测人类疾病复杂性的怀疑一直存在,已有的数百种算法未能真正抓住癌症的复杂性和异质性,也未能将其成功地运用于临床。」
虽然这看似是个不太可能成功的方向,但是Califano觉得他对癌症关键因子的寻找将会取得成功,因为他看到了希望:沙利度胺。
在上世纪50年代中期,沙利度胺被用作镇静剂来帮助人们改善睡眠和焦虑症。医生也会为孕期呕吐的孕妇使用沙利度胺,然而用药结果令人难以承受,沙利度胺造成了胎儿包括四肢缺失和心脏问题在内的严重先天缺陷。但是后来沙利度胺又作为一种麻风病治疗药物而再度兴起。1997年,医生开始测试沙利度胺在抗多发性骨髓瘤中的作用。
后来,科学家们对沙利度胺的作用机理有了更多的了解。2018年的一项研究发现沙利度胺会促使细胞内的泛素连接酶cereblon为清除某些转录因子做标记。在多发性骨髓瘤中,被标记的转录因子IKZF1和IKZF3在基因网络中起关键作用,两者都会使癌症在体内肆意生长。对Califano而言,沙利度胺的成功表明寻找现有可以靶向癌症主要调节因子的药物是有价值的。
候选药物很是稀缺。许多药物都靶向一些具有酶活性和有易于靶向的活性位点的蛋白质,但是转录因子缺乏这种位点,许多研究人员认为它们是不可成药的。
但是Califano的实验室正在尝试增加潜在药物的清单。通过癌细胞样本的高通量筛选,来研究候选药物如何改变细胞的RNA-seq表达谱以及药物是否能逆转主要调节因子的活性。
生产FDA批准的治疗多发性骨髓瘤的沙利度胺的百时美施贵宝也加入了这一行列,现已与DarwinHealth签约来系统地对其化合物库进行搜索,来寻找其它可能靶向主要调节因子的化合物。
临床验证
西奈山伊坎医学院的Samir Parek等人最近进行的一项临床试验为DarwinHealth的抗癌方法提供了支持。这项试验的目的是测试地塞米松和selinexor这两种药物的组合对多发性骨髓瘤的治疗效果。仅有约四分之一的患者在使用该药物组合后血液中骨髓瘤蛋白的水平发生了下降。而在回顾性分析中,DarwinHealth的算法工具预测了哪些患者会有反应。在对12例患者的RNA-seq数据进行评估后,确定了受益于药物的5例患者中的4例以及未受益于药物的7例患者中的6例。这项分析结果于去年发表在《新英格兰医学杂志》上。
蒙特利尔大学的Morgan Craig也使用计算方法来确定新药,他认为对癌症分子网络的探索工作可能会改善个性化医学。像DarwinHealth所使用的算法或许不会立即取代临床方法,但绝对是向着尝试更加系统地进行靶点识别迈进的一步。
过去三年来,Carifano实验室已在哥伦比亚大学的试验中测试了DarwinHealth的算法。研究人员对100多个癌症患者活检样中的RNA-seq数据进行分析,确定了主要调节因子。算法所推荐的药物是通常并不会被考虑使用的药物。随后研究人员在移植有患者肿瘤的小鼠中测试了这一药物,确认药物是否如预期一样会影响主要调节因子。医生认为其中的5例患者可以大胆尝试使用算法建议的药物。这些患者皆为癌症晚期,已经不会对可用治疗产生响应。
这5例患者中有4例在给药后产生了一次以上的反应。算法推荐其中一位患有脑膜瘤的患者使用依托泊苷,这款药最初主要用于治疗肺癌和卵巢癌。用药后患者的肿瘤停止生长了一年多。后期出现轻微反弹,他接受了另一项临床试验。此后,他的肿瘤又开始迅速生长。
Califano希望以这些轶闻病理结果为基础进行正式的临床试验。据悉,哥伦比亚大学系统中的3000例患者将进行DarwinHealth的Oncotarget和Oncotreat测试。医生委员会最终将根据传统测序或基于VIPER的算法所检测到的突变信息选择患者所用的药物。
Califano和Bosker还向世界各地的其他研究人员授予DarwinHealth工具的使用权来进行癌症测试。今年1月,北京大学肿瘤医院确认将使用DarwinHealth的工具为临床试验中的患者提供指导治疗。领导这项新研究的肿瘤学家张小田说:「这些临床研究都将集中在胃肠道肿瘤,特别是胃癌和食道癌上。如果早期结果有希望的话,这项研究将扩展到其它医院。」
随着DarwinHealth的方法在多地进入临床测试,更多像Kapotes这样的患者将会接受从未用于他们所患疾病的药物进行治疗。这可能会为癌症治疗赢得宝贵的时间。在参与芦可替尼试验后两年多的时间内,Kapotes的病情保持稳定。在扫描显示她的肿瘤又开始生长时,Tiersten为她转用了另一种刚获FDA批准的药物。
这些天,Kapotes享受着她的退休生活和与家人共度的时光。她现在服用的新批药物通过不同的机制发挥抗癌作用,但是如果之前没有使用芦可替尼,Kapotes将永远没有机会服用这个药。
参考资料:
Computer algorithms find tumors’ molecular weakspots. (来源:Science)
本文经授权发布,版权归原作者所有;内容为作者独立观点,不代表亿欧立场。如需转载请联系原作者。