人工智能在药物研发领域的渗透
【编者按】 人工智能 的出现为降低药物研发成本带来了可能:更高效的发现新靶点,更准确的挖掘药物新特性,更快速的整合表型模式。本文从抗癌 靶向药 物研发市场的发展与现状、靶向药物研发中的人工智能技术、人工智能在抗癌靶向药物研发中的应用分布、人工智能技术在靶向药物研发中的落地案例、人工智能技术在靶向药物研发领域的局限性和发展趋势等六方面进行了分析。
本文来源于机器之能,作者于琳洋;经亿欧大健康编辑,供行业人士参考。
现代化医疗水平逐年提高,但癌症始终是人类亟待解决的重大医疗难题之一。靶向药物的出现为癌症患者带来了福音,也为众多药物开发产业打开了市场。但药物开发本身并非易事,肿瘤细胞受体及结合方式的多样性使靶向药物的开发难上加难。人工智能的出现为靶向药物的开发带来了新的可能,无论是新靶点的发现还是整合表型模式的筛选,人工智能依仗自身的特性和优势,在两个不同的方面都有不俗的表现。
一、抗癌靶向药物研发市场的发展与现状
伴随着世界老龄化的进程,癌症的发病率和死亡率逐年攀升,而抗癌药物在药物市场中的占比份额更是飞速提升。靶向抗癌药物自发现以来,以其自身无可替代的优越性(特异性高,毒副作用小),迅速占据抗癌药物产业链顶端,截至2018年统计,全球前10大抗肿瘤药物全部为靶向抗癌药物,市场占比接近50%,成为抗癌新药研发的主流。而靶向药物的开发成本也是不斐,具美国塔夫茨大学药物开发研究中心的一项报告显示,开发一个新药的平均成本高达25.6亿美元,而且这其中还没有计算药物的售后开支。在这天价的25.6亿美元中,饱含着11.6亿的同期投资损失,这部分损失就来自于药物研发本身的机会成本。 而人工智能的出现为降低药物研发成本带来了可能:更高效的发现新靶点,更准确的挖掘药物新特性,更快速的整合表型模式。
二、靶向药物研发中的人工智能技术
深度学习: 以人工神经网络为框架,通过不同的神经网络层,层层递进,从而有效挖掘数据中存在的直接或间接相关性。深度学习在靶向药物开发工程中应用广泛,无论是文献数据挖掘还是图片信息提取,都离不开深度学习神经网络的构建:利用递归神经网络和LSTM等模型技术,可以对文献文本信息进行处理;利用卷积神经网络可以进行更高维度的图片处理,高效提取图片中的特征信息。
自然语言处理: 利用计算机技术处理文本信息或语言类声音信息,使机器能够”懂得“自然语言的语言结构,从而能够挖掘其中的有效特征信息。自然语言处理技术能够实现靶向药物开发中海量文献挖掘的任务,实现知识的汇总与进化。
大数据技术: 大数据技术的体系庞大,基础技术包括数据采集,数据预处理,数据仓库等。利用大数据技术,可以整理总结不同蛋白序列、分子结构、小分子组成等靶向药物的临床药用效果、分子动力学特征,以及靶向分子和癌细胞受体之间的结合力及稳定性的数据,并利用这些数据对模型进行训练,从而实现模型的精准预测。
特征抽取: 利用基础的统计学方法、监督机器学习以及神经网络深度学习的方法,挖掘药物数据,生理数据以及病理数据之间的相关性,提取有效靶向药物之间的共同特征,并加以总结简化,从而生成新的、结合效率更高、治疗效果更好的靶向药物。
表征学习: 也称特征学习,是指将抽取总结出的特征作为机器学习模型的输入参数,通过监督机器学习或无监督聚类机器学习,获得特征与结果之间的,或特征与特征之间的相关性关系。
三、人工智能在抗癌靶向药物研发中的应用分布
四、人工智能技术在靶向药物研发中的落地案例
IBM Watson:药物开发服务利用深度学习和神经网络对海量文献,病理等文本数据进行自然语言处理与特征抽取,构建数据库并试图挖掘数据之间的相关性,从而提出新的假说,推动新药的研发。
Insilico Medicine:与药明康德合作,尝试利用Insilico Medicine独有的生成对抗网络(GAN)和强化学习(RL)等新型算法,针对全新的以及具有挑战性的靶点,为客户开发理想的临床前药物候选分子。
AccutarBio冰洲石生物科技:作为靶向治疗服务提供商,致力于通过AI技术提高筛选药物准确性和效率,打造算法平台,加速新一代药物开发,而其基于蛋白晶体学数据的人工智能解决办法已经在药物设计领域投入生产实践。而其提出的3D Molecular 算子和深度化学结构网络(Accutar ChemiNet)的计算预测比现有的方法的预测准确率还有提升,使得实验开发阶段的产率更加稳定。
BERG:提出基于人工智能的Interrogative Biology平台技术,通过通过对多种癌细胞和健康人类细胞样本进行高通量对比测试,来寻找治疗疾病的新靶点和诊断疾病的生物标志物。
Cyclica:开发Ligand Express的云端蛋白质组(proteome)筛选平台,利用人工智能辅助基于分子结构的蛋白质组筛选,作用于发现小分子化合物结合的新靶点。
五、人工智能技术在靶向药物研发领域的局限性
支撑人工智能的大数据相对缺乏: 部分发病率较低的癌症和较为冷门的研究方向,其生物学样本和文献资料相对匮乏,有限的数据无法支撑大数据数据库的需求。
验证人工智能挖掘的新靶点有成本风险: 利用人工智能挖掘的新靶点数量繁杂,由于深度学习神经网络“黑盒子”的特性,对挖掘出的新靶点缺少有效的机制上的解释,进而增加了验证靶点的风险;
人工智能挖掘文献数据的性噪比不可控: 利用人工智能和自然语言处理挖掘得到的文献数据,由于其在来源、影响因子、实验设计科学新、数据分析可信度上的差异,导致收集到的信息中有效信息和噪音信息比例不一而同。
六、人工智能技术在靶向药物研发领域的发展趋势
人工智能介入药物创新开发是必然趋势:基于人工智能预测本身的高效性和准确度,以及其强大的数据处理和计算能力,越来越多的依赖人工智能的药物开发项目出现将是必然趋势;
基于人工智能的虚拟测试和药物筛选节约企业成本:利用大数据库中的生理学药理学信息的人工智能模型,可以根据新开发药物本身的化学特征,对其实验表现和临床表现进行模拟和预测,从而极大的节约了开发成本;
人工智能图像处理能力或可催生新学科诞生:利用人工智能可以实现显微图片更为精确的信息读取,挖掘图片中肉眼难以发现的细节和趋势,并通过挖掘显微图片与临床效果之间的相关性,催生类似于细胞图像生物学的新学科。
本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。