为了让AI从放射科走入临床,华西医院与依图医疗做了两款用于肺癌的产品
“Waston在成都又建了一个公司,把临床指南、临床方案用英文变成中文。”6月15日,在采访正式开始前,华西医院院长李为民和依图医疗CEO倪浩讨论起前段时间IBM Watson Health裁员的事情,李为民告诉倪浩,“其实,我们也可以做人工智能辅助系统。”
在倪浩看来,Waston一直在用IBM的市场品牌优势炒作概念,不是医疗人工智能领域的一流公司,“这次出了问题其实对整个行业是好事情。”
采访当天,华西医院与依图医疗联合发布了针对肺癌的两款产品:“肺癌临床科研智能数据库”与“肺癌多学科智能诊断系统”。
“肺癌临床科研智能数据库”纳入了华西医院2009年至今收治的确诊为肺癌患者的全维度脱敏临床数据,利用AI技术,对影像数据、基因数据、病理数据、文本数据等非标化、非结构化的临床数据进行清洗、解析与重构。
在该数据库的基础上,华西—依图联合团队又开发了“肺癌多学科智能诊断系统”。
发布会召开的三天前,依图科技刚宣布获得工银国际、浦银国际、高成基金的2亿美元C+轮融资,估值超百亿。
依图创立于2012年,成立之初以安防和金融为核心;2016年,依图开始进军医疗,目前在肺癌筛查、儿童骨龄判读、乳腺疾病诊断、脑卒中诊断等领域研发了产品,并在放射科、超声科、儿科等科室提供临床诊疗辅助诊断。
依图CEO朱珑博士在今年的公开演讲中曾表示,“人脸识别技术在过去的一两年间,较历史已经实现了千倍、万倍增长,AI的未来将是医疗。”
从放射科走向临床
钛媒体曾在《医疗影像 AI 告别野蛮期:巨头做平台,创企走细分,抱团探寻商业化》一文中提到过,医生们认为真正需要AI的有两个地方,一个是工作多得人已经做不过来了;另一个是连人都很难诊断的。
前者对应的AI医疗影像,主要场景在放射科、检验科等,该领域已经有不少产品扎堆涌入医院;后者对应的则是临床、病理等,目前切入这一领域的产品较少。
为什么首先关注肺癌?李为民在接受钛媒体在内的媒体采访时坦言,肺癌无论是发病率还是死亡率都是排名第一的恶性肿瘤。肺癌的五年生存率均低于20%,这是所有癌症中它最大的一个难点。怎么提高肺癌的五年生存率,再进一步降低肺癌的死亡率?其中很关键的就是早期诊断、规范治疗。
目前已经证实低剂量的螺旋CT可以降低肺癌的死亡率,但是肺癌筛查之后,发现病变、结节,怎么正确区分出是不是癌症,又是面临的一大挑战。
通过人工智能使胸部CT检查的病变检出明显提高,达到很小的病变都能检测出来,这是人工智能达到的第一个目的;第二是通过综合产品的开发,帮助医生准确判断是癌症还是良性,是结核还是炎症,指导医生及时处理。
“肺癌多学科智能诊断系统”的应用,对于医生而言,诊疗流程会带来变化,但是性质和内容并不会改变,李为民认为,“关键是使我们工作效率得到大幅提高,不同层级医院的水平实现同质化。人工智能永远是代替不了医生的,一定是辅助系统。”
但跟随着医院对于AI的需求,依图的思路发生了转变,倪浩曾撰文表示,“最初选择在肺癌筛查环节,当筛查环节做得比较好之后,开始思考是否能够在其它环节进行复制。例如验血或拍片之后,医生需要给出一个具体的结论,这个环节里,医生们得出结论的差距更明显。”
因此依图的思路从原来服务于放射科、超声科、检验科等科室,转变为布局服务临床科室,给呼吸科、肝胆科、肿瘤内科的医生们提供人工智能产品。
但倪浩告诉钛媒体,放射科想要的东西和临床科室想要的东西,完全是不一样的。“总结起来是,放射科想要的是片子里面看见什么,临床科室的核心问题是这个东西到底是什么,良性还是恶性,是一个什么样子疾病的分型。”
依图医疗医学产品总监王炤向钛媒体透露,“以肺癌多学科综合诊断产品为例,今天在影像里面发现的已经不只是结节,包括斑片影、肿块等等,其实他们的发生概率可能确实比结节低,但我们要从影像科走向临床科室,要围绕着肺癌做综合的诊断,而肺癌在影像学上存在一定比例,是其他几类影像学的表征,我们需要去突破这样的技术。”
比如,放射科的医生并不用去看其他报告,但临床科室的医生需要看验血数据、病理数据、基因数据,还要询问病人的主诉病史、家族史、既往史等信息。这对于技术布局而言,做影像的时候,在影像这个方向有技术积累就行,但要做电子病历、病理数据的话,光是影像的技术能力就不够。
建立肺癌临床数据库,AI和医生如何分工?
肺癌病种数据库的建立是多学科智能诊断系统的前提,但现实情况是临床资源很多,数据却常常不完整。李为民有两点考虑,“一个是我们要进行临床研究,就需要有完整的、系统的、标准的数据。二是人工智能基础是数据,没有这样的数据就没有办法做人工智能。”
关于医疗大数据的重要性,原国家卫生计生委副主任、中国卫生信息与健康医疗大数据学会会长金小桃在发布会上提到,“医疗大数据、健康大数据是21世纪的石油金矿,怎么使它成为优质原料?是我们现在普遍要解决的问题。”
倪浩认为,在医疗数据领域里,被结构化的数据才能算得上“可用”,不管是影像数据,还是电子病历数据。“原来的医疗数据要变成医疗大数据,让应用层可以连续做深度挖掘和洞察,仅仅把数据集中起来是不够的。”
最重要的事情是用人工智能的方式把数据解构,做以AI智能、多模态的医疗数据构建全维度的临床科研平台。
华西医院和依图医疗花了6个月时间处理了2.8万例的肺癌患者全周期数据集采,在整个数据处理过程中,人工团队分为几个层次处理数据,AI全程参与,李为民坦言“我们用人工去做至少得五年时间吧”。
根据产品公开资料,钛媒体制图
李为民告诉钛媒体,“首先是100多位学生团队,我们先教会让他们去勾画一些基本的数据;第二层是专业的研究生,包括呼吸、胸外、放射等专业的研究生团队,有30多位;第三层是主治医师团队,多学科交叉,主治医生他已经博士毕业,已经工作了一定时间,有20多位;我们最后来把关,专家层面有10来位。”
这个过程中存在三个关键问题:文本数据、影像数据以及数据标准化,针对这三个问题,人工智能提供了对应的解决方案。
- 针对文本数据,结合医学术语本体构建技术与自然语义理解技术,研发医学语义解析算法,实现全量医学信息提取。
- 关于影像数据,基于深度神经网络的影像结构化提取模型,覆盖病灶类型、病灶大小、解剖学位置、影像学征象等,实现病灶倍增时间自动计算与提取、影像的高维信息提取。
- 对于数据标准化,基于本体构建方法,建设中文医学术语库;文本结构化提取模型融合术语库,实现表述归一化;并建立质量控制模型,基于逻辑推理实现错误纠正。
以电子病历为例,倪浩告诉钛媒体,每个医生都有自己的偏好,每个医院要求、规定、说法都不一样,所以要从电子病历里面做结构化、标准化、数据统一的事情,难度要远大于影像。倪浩坦言,“有一个误区是大家会觉得自然语言的处理比影像简单,实际上它比影像困难非常多,因为影像它是一个客观的数据,拍出来大家看到的东西都是一样的。”
为了完善肺癌临床数据库,李为民希望联盟医院加入进来,共同建立大数据、进行临床验证,“联盟医院也将作为我们产品的使用单位,共同开发、共同推广应用。”
除肺癌之外,华西医院还和依图签了10个病种,重点以癌症为主要扩展,肝癌、乳腺癌、胃癌、肠癌、肾癌、前列腺癌、甲状腺癌、骨癌等。
“我们刚刚取得批件,用于多中心的临床研究。我们希望在今年年底完成大部分的研究。”李为民向钛媒体透露,目前第一阶段成果已经在国内几十家医院投入临床试用,由华西医院牵头的多中心临床实验也即将启动。(本文首发钛媒体,作者/付梦雯)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App