谭蔚泓院士:多参数特征图谱、分子计算,实现精准诊疗的「两大利器」
近日,由百图生科与播禾创新主办,《医健AI掘金志》协办的 “首届中国生物计算大会” 在苏州闭幕。
作为主论坛的报告嘉宾,中国科学院院士、发展中国家科学院院士、中国科学院肿瘤与基础医学研究所所长谭蔚泓,以《基于AI的智能诊断以及多参数细胞、疾病分型》为题,进行了演讲。
谭蔚泓院士表示, 生命科学由点及面,有海量的数据,同时人类的疾病复杂性、多样性,要实现高效疾病诊疗,必须基于海量数据和多参数的表征。
他提出,要利用高通量测量技术,结合多个识别疾病标志物的分子探针,对病人样本进行多达300个疾病标志物分子特征的甄别和定量测定;利用人工智能和大数据科学进行解析,从而为疾病诊断提供精准图谱,判断各种亚型特征。
接下来,谭蔚泓院士围绕“分子计算”进行了讲解。
他提出“分子大脑”的概念——人脑强于思维,电脑强于计算。但电脑计算没有考虑分子层面信息,分子层面理解才是对事物最彻底的理解,尤其是疾病或生物领域。
分子计算,是将传统方法的“关键疾病分子信息提取”、“数据计算与分析”、“解读报告”等进行高效整合,像一个集成电路一样进行相关分子识别。
其优势就在于可以减少误差,无需人工辅助就可以直接出报告。
因此,分子大脑DNA逻辑回路就像是做一个多功能“分子医生”,将分子层面识别与信息联系起来,甚至模拟人类获得性免疫系统。
以下为谭蔚泓院士的演讲内容,雷锋网《医健AI掘金志》做了不改变原意的编辑和整理:
中国科学院早在2017年,就在仁济医院附近建立了分子医学研究院,目前也开始着手建设中科院医学所。
这些研究始终以临床为目标,尤其是以医院为中心,让医院掏钱,使病人和科研相结合,变成患者福音。
目前,人类对非生命体系认知已变得越来越清晰。
有人说方法学里只有物理和数学,方法学是创造一切物质学科的基础。
但同时化学方法也非常重要,从人类生命体系,到铁矿石、铁单晶、铁原子等等,还有很多未解之谜。
而且,人类最没有认知的就是人体自身,根据Science数据显示,全世界最前沿的125个科学问题中,生命科学就占据了46%。
例如人类是怎么思维和怎样进行记忆。
原来我曾做过一段时间“如何把记忆与某一基因联结在一起”的研究,发现这件事需要依靠很多参数。
生物的复杂性决定了生物学大数据的必然性,籍于此,各种组学应运而生,包括基因组学、蛋白组学、细胞组学、时空组学等等。
同样,疾病的复杂性、多样性等使得诊疗必须基于海量数据和多参数表征。
我觉得这样一个新时代已经到来,仅靠一个疾病标志物,实现疾病诊断已不太可能,必须要用到多个,所以海量数据的处理就成为了必须。
所以,疾病多参数的分子分型成为了精准医疗的核心。怎样获取多参数的生物计算海量数据,并从大量数据里,得到有用信息,也成为了我们要解决的问题。
关于疾病多参数、多分子分型,我给大家举个例子。
两年前,想要打开手机一定要输入密码,但今天面部识别,在全世界75亿人口,只有我一个人可以打开自己的手机。
其中所涉及的参数和检测就是实现眼睛、鼻子、耳朵相互关联,用这些信息来检测差异。
生物学也是同样,需要通过多参数进行同时检测,对数据进行有效分析,才能把疾病分成不同亚型,对症下药。
疾病的分子分型诊断,也需要依靠高通量测量技术,结合多个识别疾病标志物的分子探针,对病人样本进行多到300个疾病标志物分子分子特征,进行甄别和定量测定。
再利用人工智能和大数据科学解析,从而为疾病诊断提供精准图谱,判断各种亚型特征,为下一代疾病精准诊断提供变革性技术。
所以接下来,人工智能将推动疾病诊断+治疗的新范式。
可以训练AI理解130万个电子病历中的临床特征,自动分析患者病情,智能给出推荐诊断。
其中的第一个工作就是怎样获取300个参数所需的数据量。
对于技术的人而言,300个参数可能是一批小数据,但如果这些数据与人类疾病密切相关,怎样找到模式识别就非常艰难。
这样的数据和技术建立完成以后,就可以使各种疾病诊断变的容易。
以肿瘤诊断为例,过去的异质性问题给癌症诊断带来了极大的困难。而通过结合AI的精准诊疗,就可以对其进行甄别,发现其中不同的亚型。
特别是肺癌治疗,存在的多种亚型,每一种亚型的治疗方案都完全不同,而且分类靶向治疗具有更好的治疗效果。
那么我们应该怎样进行疾病的分子分型?
其中最重要的就是获取疾病多参数表征,和对获取的多参数数据进行有效解析。
既然已经了解疾病精准诊疗需要分子分型,具体操作就需要获取到这些多参数表征,开发专门的分子识别工具,发展新型数据算法,对蛋白、核酸等多组学信息进行有效分析。
目前的人工智能,虽然已经有很多开源数据分析方法,但这些算法依然还无法满足医疗的数据归纳。
除了数据工具,还有分子识别问题,这些分子包括抗体、多肽、核酸、小分子等等。
今天以核酸适体为例,核酸适体被称为“科学家的抗体”,由15-60个碱基组成,能识别靶标的单链DNA/RNA、具有高亲和力,高特异性、靶标范围广等特点,是精准药物治疗和临床诊断的新工具。
在实验中,我们主要使用以活细胞为筛选靶标的核酸适体细胞筛选新方法(Cell-SELEX),这种方法可在标志物未知条件下为靶细胞的分子识别提供全新的化学途径。
而且可实现活体细胞的多个靶分子探针的原位筛选,让每一次筛选都得到多个分子探针。
通过这种技术,我们已经创造了大量的核酸适体,基本相当于人工产生了300多个能识别特异细胞靶体的“抗体”
未来疾病的诊断一定需要从多个探针对生物体进行表征,这样一次产生100、200个探针,对细胞表面所有蛋白进行判断。
目前这些核酸适体也已经被广泛生物医学研究。
以应用于白血病病人样品的分子分型为例。
我们通过与八家医院合作,使用18个核酸适体对大约2000个病人进行了测试,并从中找出了核酸适体识别白血病的分子图谱识别新模式。
除了这些,我们还将核酸适体应用于外泌体的分子分型当中,由国家纳米科学中心孙佳姝研究员跟我们一同操作完成。
通过热泳技术辅助的外泌体分型,可以用于早期诊断和肿瘤分类,其中对六类癌症(1-4期)的分类准确率达到了71%
除了核酸探针,高通量方法还有很多。
例如流式质谱,通过流式细胞仪高速分析+质谱检测的高分辨能力,一次实验就可以得到100多个参数。在同一次实验中,完成多个参数获取。
除了流式质谱,核酸探针也可以做核酸影像,把核酸探针和核素连在一起,对人体进行全身影像进行扫描。
接下来讲一下分子计算。
今天,电脑彻底改变了生活模式,除此之外,还有分子大脑,人脑思维无法超越电脑计算,但电脑计算没有考虑分子层面信息。
而事实上,分子层面才是对事物最彻底的理解,尤其是疾病或生物领域。
过去分子计算,只是把病人样本拿过来,对一些关键疾病分子进行提取,之后由医生解读。
这种方法最大特点就是体量小,而且需要有经验的医生。
分子计算是将传统方法里的“关键疾病分子信息提取”、“数据计算与分析”、“解读报告”等进行高效整合。
像一个集成电路一样进行相关的分子识别,其优势就在于可以减少误差,无需人工辅助就可以直接出报告。
因此,分子大脑DNA逻辑回路就像一个多功能“分子医生”,将分子层面识别与信息联系起来,甚至可以模拟人类的获得性免疫系统。
以肿瘤的早期诊断为例,高特异性的标志物miRNA智能核酸系统,就可以实现外周血中肿瘤(肺癌)的早期诊断。
过去一个探针就是一个结果,多次检测才能产生多个数据,如今miRNA可以将探针联合起来,统一作为分子回路。
这些分子回路每一段都可以与mRNA进行识别,只要读到相关信息,就可以做疾病诊断。
这个工作最高由上交仁济医院韩达研究员完成。
将来的疾病诊断,一定是对多参数的同时获取,对大量信息进行解读,从而形成模型识别式诊疗,这必将是医疗的未来。
目前,我们已在中国科学院基础研究所建立了筛选中心,前年5月,浙江省人民政府也和中国科学院正式签署医学合作协议,共建中国科学院肿瘤与基础医学研究所。 雷锋网 (公众号:雷锋网) 雷锋网
。