科亚医疗曹坤琳:合规认证、数据集建设,医疗AI首证背后的经验全盘点
对于医疗人工智能企业来说,三类证是最重要的入场券。
没有三类证的医疗AI公司,犹如怀有一身教学绝技,但没有在校内教学资格的老师。纵使本事不小,也上不了台面,更赚不了钱。
数据显示:截至今年,陆续有15款AI产品通过了NMPA(国家药品监督管理局)的审批。
科亚医疗、Airdoc、联影智能、汇医慧影、致远慧图等主流医疗AI企业,纷纷拿到了属于自己的那张三类证“入场券”。
从产品最初立项研发,到收到NPMA的审批公告,各个医疗AI企业都经历了哪些难关和挫折;他们又是如何在一片空白的前提下,从零完成质量体系搭建、反复优化通过临床试验?
每一张不同类型、不同赛道的AI三类证,又将创造出多大的商业价值?
从9月13号开始,雷锋网《医健AI掘金志》邀请到科亚医疗、Airdoc、联影智能、汇医慧影、致远慧图等医疗人工智能三类证获批企业,分享获批产品背后的审批经验、得失及未来商业化探索。
作为此次云峰会的演讲嘉宾,科亚医疗研发VP曹坤琳,以《AI医疗三类证首证的获批经验分享及一年变化》为题,进行了演讲。
曹坤琳表示:因为医疗AI是数据驱动的工程技术,所以数据收集和数据库的建设,在资格认证和产品开发中都尤为重要。
其中深脉分数在2017年前瞻性试验过程中,就曾遇到被药监局要求收集更多的数据,进行更大规模临床试验来证实算法有效性的情况。
所以即使产品已经完成研发,科亚医疗在认证过程中,也一直都把数据集构建,列为了其中的一个重心,围绕数据采集,预处理,数据标注,数据集划分这四个药监局规定的步骤来改变软件开发的质量。
以下是演讲的全部内容,雷锋网《医健AI掘金志》做了不改变原意的整理和编辑:
大家好,我是科亚医疗曹坤林。非常感谢各位今天抽时间来参加今天的分享。
下面,由我来介绍一下科亚医疗在AI医疗产品研发、合规性建设上的一些工作成果及体会。
首先,我将简单介绍一下科亚医疗和首个AI三类证的产品———深脉分数;
然后结合这个产品,谈一下我们在合规性,尤其是对AI产品开发至关重要的数据集建设方面的工作;
最后,我将介绍一下科亚医疗目前的产品发展和未来规划。
科亚医疗致力于用AI技术赋能医疗数据,为患者、医疗机构、研究机构提供精准医疗服务。
我们的AI辅助医疗决策系统,主要提供临床所需定量指标,助力实现对疾病的早期筛查、精确诊断、以及为患者制定个性化的治疗方案。
心血管精准医疗的AI策略
很多心血管疾病,例如冠心病,主要是由动脉粥样硬化引起血管狭窄,进而导致供血不足所引发。目前,临床上也越来越重视结合解剖学狭窄和功能学缺血两方面的信息来进行综合评估。
解剖学狭窄评估的金标准是冠脉造影,功能学缺血评估的金标准则是血流储备分数———FFR。
具体介绍之前,我们先来分享一个什么是 FFR?
FFR即病变狭窄远端与主动脉的平均血流压力比,这个比值是一个介于0~1之间的值,缺血越严重,比值就越小。
《中国经皮冠状动脉介入治疗指南( 2016 )》提出,当病变直径狭窄小于90%时,就建议对FFR小于等于0.8的病变进行干预。
这就是一个结合结构学、功能学两方面信息的精准诊疗策略。但无论冠脉造影,还是FFR导丝测量都是在导管室完成、是有创过程,这样就不适合对患者进行早期筛查和多次复查。
目前,对冠心病的筛查和复查是临床上采取的主要手段之一,医生以冠脉CT检查狭窄大于50%作为梗阻性的狭窄标准,并以此确定该患者是否需要进一步导管室检查。
冠脉CT是无创的检查手段,费用相对较低,敏感性也高,但它存在一个主要问题:检查结果只有结构学的评价,没有功能学评价,特异性较低。
临床研究发现,很多病人CTA狭窄大于50%,进到导管室后却发现FFR大于0.8,没有显著功能性缺血,故而没有必要进行后续介入治疗。
所以,单纯以CTA显示狭窄程度作为参考标准,可能会造成很多不必要冠脉造影,带来不必要手术风险、医疗花销。
在这种背景下,无创CT-FFR技术应运而生,为冠脉CTA赋予新能力,让它能够提供功能学评估。CT-FFR的主要应用场景是在冠脉造影术前确定,是否从介入治疗当中获益、而只需要采用药物治疗的病人,从而帮助他们避免不必要的冠脉造影术,避免不必要的风险和花费。
目前, CT-FFR有几种不同实现路径,总体来说分为两大步:第一步,从冠脉CT当中提取血管树结构,进行3D建模;
第二步,从影像学到功能学,用不同技术手段实现CT-FFR,计算得到全数FFR值,CT-FFR在临床中主要应用于狭窄在30~90%之间的稳定冠心病患者上,来帮助医生在进行介入治疗或其他治疗方案上决策提供功能学指导。
临床研究表明,采用CT-FFR技术可以避免大于60%的不必要有创冠脉造影,降低大于30%的医疗费用。
另外,从长期的随访来看,CT-FFR还可以帮助改善治疗效果。所以这项技术在世界范围内的很多国家和地区都得到了推荐,写入指南,进入医保。
科亚医疗研发的“深脉分数”产品,就是一款基于人工智能的CTFFR评估软件。通过冠脉CTA进行无创快速的FFR分析,大幅提高基于CTA影像诊断冠心病路径的特异性。
深脉分数既可以适用于普通人群的体检、高风险人群的筛查,也可以在患者的复查等不同场景发挥作用。并且,由于深脉分数采用的是AI技术,所以它可以帮助我们提升CT-FFR计算的分析速度和计算精度。
深脉分数运用自主研发的深度神经网络,在不同分辨率的图像上对血管结构进行筛选优化提取,自动重建出冠脉结构模型。
临床实验结果显示,深脉分数的准确度与“金标准”导丝测量的FFR结果是高度一致的,并且优于采用CTA、ICA这类仅靠结构学狭窄进行病变严重程度评估的诊断手段的性能。
作为唯一一款基于深度神经网络的CT-FFR产品,我们的深脉分数,它的关键临床指标如准确性、敏感性、特异性等,都优于以“HeartFlow”为代表的世界一流水平。基于AI深脉分数,可以用于评估血管树上任何一点的FFR值。同时,它不需要额外药物成像或是有创手段,因此具有智能、全面、安全的特点;另外,深脉分数准确度高、处理速度快(计算时间小于10分钟),可以应用在早期筛查和多次复查中,帮助避免不必要造影术及FFR导丝开销,这样的AI无创技术可以带来显著的社会经济效益。
因此,深脉分数获得了国内外的认可,于2018年获得了CE认证,在2020年1月获得了国家药监局的审批,是国内首款获得NMPA和CE认证的人工智能三类医疗器械产品。在这里需要强调的一点是,深脉分数不仅仅能够提升现有医疗水平、医疗手段的效率,更是为临床提供了一个全新的诊疗方案:无需造影检查、无需压力导丝。
深脉分数的合规认证策略
深脉分数,在AI医疗领域这么多的AI医疗软件的注册过程中,能够一马当先地率先进入到创新通道,并且成功获得人工智能医疗器械三类证,除了证明技术创新优势之外,更是产品的合规性建设工作密切相关。
在产品研发的初期,科亚首先进行需求分析,深挖行业现状与痛点,结合临床指南,明确以提高CTA诊断冠心病特异性为切入点,运用AI技术开发一款无创、精准、高效的CT-FFR产品,提供创新型的血管功能检测手段。
根据明确的应用目标、适用范围制定了产品性能评价方法和指标,尤其关注准确性、稳定性等方面的表现,并对开发数据集多样性、充分性提出要求。
这些需求分析为我们接下来的数据收集、算法设计、产品验证工作提供了明确的指导方向。在产品的研发过程中,科亚医疗还持续建设质量管理体系,按照国家药监局颁布的《深度学习辅助决策医疗器械软件审评要点》的要求,严格规定每一个步骤使用什么样的工具和输入材料,在怎么样的流程规范和质量控制下,产出什么样内容。
深度学习因为是数据驱动的工程技术,因此数据收集工作在深度学习医疗产品的开发中尤为重要。下面我们就数据集建设工作,结合产品进行详细分享。
深脉分数数据集建设经验
第一,数据次采集和入组,目前临床操作规范,提出了关于冠脉CT和FFR数据的采集要求与入组协议。
同时,明确数据质量评估标准,以保证数据质量都能满足后续预处理步骤要求;之后,采集的所有数据都在医院内完成脱敏,这样就形成我们原始数据库。
第二,原始数据库清洗、逐个检查,把重复、不合格的数据剔除掉;而合格数据进行编号,形成基础数据集。
在这个过程中,逐个检查,剔除重复或不合格数据;对合格的数据进行编号,以形成基础数据集。同时我们对样本来源机构、采集设备、扫描参数、人口基线、病变分布等等信息进行统计,保证数据集多样性和充分性。
第三步,数据标注,这一步非常关键,直接影响模型训练的质量。
在这个过程中,我们首先要制定标注和医生选拔培训考核标准,明确标注使用软件和流程、医生审查标注结果需要注意的规范;
同时,保证记录每一个数据标注、过程和人员做到可追溯,在这样严格规范和质控下,我们就构建出了高质量标注数据库,保证后续算法开发有效性。
第四,提出数据集划分方法和划分比例,将数据标注数据库划分为训练集、调优集和独立测试集。 需要注意的是,划分后训练集要保证它的样本分布尽可能地均衡,而调优集和测试集则需要重点保证它的样本分布,尽可能地符合临床实际情况。
这样就完成从原始医疗数据,到构建AI算法开发所需的各个数据子集的建设工作,在这个数据收集过程中,我们对各项风险的分析贯穿始终。
逐项分析参与人员、使用工具、处理流程对我们输入的原始数据和输出的各个数据子集可能带来的影响,从而及时采取风控措施,来保证构建数据集的完全安全和可靠性。
数据集建设会直接影响到我们算法的性能和软件的使用风险,所以需要高度的重视。同时,我们需要把基于风险全生命周期管理体系合理应用在整个开发流程当中。
基于合理的数据集,我们研发了专有的CT-FFR技术,在保证产品有效性的同时,筑建自身技术壁垒,为产品在海内外的运用推广提供保障。
任何的 AI医疗产品,它最后的价值都会落实在临床使用上。那么深脉分数作为一款创新型AI医疗服务产品,一来可以帮助患者减少不必要的手术;二来对于医院来说,可以提高手术资源的使用效率,使进到导管室的患者基本都是阳性患者,所以深脉分数得到了国家药监局的认可,也首个获得了AI三类证。
由于深脉分数是一款创新型AI医疗服务产品,所以我们率先并积极地推进它的物价审批工作。目前,我们已经获得了北京、河北、安徽、山东、江苏、浙江、云南7个省市的物价收费编码,实现了AI医疗服务面向患者收费的通路。
此外,还有10余个省份的物价收费编码的工作即将完成审核。希望真正让AI技术落地,在临床上带来它增效提速的效用。 除了CT影像外,科亚医疗也凭借强大的研发能力,针对心血管诊疗的问题,布局了从筛查、诊断、治疗到随访的全流程产品服务体系。
这里面包括影像结构分析、影像功能分析,涵盖了软件、硬件以及耗材领域。我们把它们有机融合起来,为临床各个环节的需求提供解决方案,助力实现AI医疗产业链健全。
从冠脉产品管线开发出发,我们也在积极地布局其他管线,像在脑血管影像科等多个临床科室一级科室,也在拓展覆盖从筛查、诊断、治疗到随访的全过程的产品。
除了智慧心,还有智慧脑、智慧影像、智慧肺等等,对这些产品线我们都强调针对单病种、全流程进行服务。
问答环节
雷锋网:金标准数据集有多大规模?
曹坤琳: 刚刚也有提到,算法开发分为两个部分,一个是结构分析模块,另一个是功能分析模块,每个模块所使用数据是不同的。
例如,结构分析模块主要基于冠脉CT进行分割,这个数据集规模就比较大。第二部分是功能分析模块,这部分要求有金标准FFR数据,大家也知道FFR数据收集起来并不那么容易,但我们也收集了大量含FFR的数据。
雷锋网 (公众号:雷锋网) :深脉分数与其他产品的差异点在哪?其技术难点又有哪些?
曹坤琳: 与市场上很多基于影像结构的分析产品不同,深脉分数主要提供功能学的检测手段,也是我们跟很多其他产品可能不同的点,这是一种全新检测手段,所以技术门槛也比较高。
技术难点上主要是分为两个环节,一是如何精准地重建冠脉,二是如何实现从影像学到功能学的计算模块。
这两个部分我们都是基于深度神经网络来进行开发的,对冠脉精准重建,我们使用 End to end深度卷积神经网络进行多分辨率,从粗到细血管重建,我们重建的血管直径最小可以达到一毫米左右。
功能学上的计算我们所采用的是树形生成的双向长期递归神经网络,这也是获得了专利授权的。
通过结合影像学、结构学、生理的特征来对深度神经网络进行训练,从而得到结构学和有创冠脉功能学之间FFR关系模型。
这个模型既考虑了我们局部的影像学和结构学的特征,同时也通过树形的网络结构来捕捉了上下游之间的血流关系,从而能够保证精准的计算。
刚刚也提到,其实包括HeartFlow以及国内一些其他厂家他们研发的CT-FFR产品所采用的方法跟我们是不太一样的。我们是现在唯一完全采用Deep Learning进行开发的CT-FFR产品,而像HeartFlow之类的其他产品,则采取的是传统CFD技术,也就是计算流体力学。
这之中就有一些区别,像基于深度学习的深脉分数扩展性非常强,并且在训练的时候可以结合很多不同模态的多元数据来进行模型的优化。
比如说我们可以结合冠脉造影的金标准来进行模型的优化训练,同时可以学习很多不同的案例。而传统力学CFD方法,不需要很多案例就可以开始做,因为它主要是一种公式的计算,它是在扩展性以及对个体差异性衡量上做的不那么好。
深脉分数是基于AI开发的,所以它的强处在于通过足够的数据进行训练之后,能够捕捉到个体的差异性,同时适应不同病例自身的差异化。
随着数据量的不断增加,深脉分数的最终性能、效果以及准确度都能够得到进一步的提升,而基于传统方法所开发的产品就会受到一定的局限,数据增多对其产品性能的提升影响不大。
当然我们刚刚提到整个训练过程中还需要大量的数据,但这是在线下进行的,训练好之后,它在线上的应用就非常得快,新病例来了之后能够非常快地得到结果,像我们的FFR计算基本上是秒级的,所以是非常高效的。
总结来说,深脉分数区别于其他产品的关键点在于它是完全基于AI的智能技术来进行开发的,所以它具有扩展性强、高效、精准的优势。
那么,我们也围绕着核心技术申报了超过100项的国内外专利,以形成我们自身的专利技术壁垒,这也是对我们独特、创新的技术开发工作的一种体现和肯定。
雷锋网:除了深脉分数,还有哪些AI产品正在认证过程中,他们有什么技术上的差异?
曹坤琳: 除了深脉分数,我们实际上已经开发完成了一条完整的心脑血管疾病的产品线,覆盖了筛查、诊断、治疗到随访的全流程。
除了CT-FFR已经获得认证之外,正处于认证过程中的,还有深脉灵析的智能辅助诊断系统、基于DSA的 FRR分析的深脉造影分数、深脉智能的血管介入手术方案规划及导航,以及深脉血管介入机器人,这是应用在手术导管室里的,还有深脉震波球囊等10多款产品帮助我们形成一个临床的诊疗闭环,充分增加临床诊疗对AI技术产品的使用年限。
以上产品的应用领域不同,有的是用于检测,有的用于做分割,有的做tracking,有做手术planning,所以使用的技术肯定是有差异的,但我们产品都是基于AI技术研发。
雷锋网:作为首个获得认证的产品如何与药监局评审专家进行沟通?
曹坤琳: 除了是首证,也是首个进入创新通道的医疗器械软件产品,所以也是非常感谢药监局的工作人员和专家的指导与支持。
我们大概历时三年来研发了这么一个产品,因为起步较早,起初深度学习软件的审评要点还没有发布,也没有同类产品来作为参考,因此走了一些弯路,但通过创新渠道,我们得到了主管部门的悉心指导和支持。
在多次审评小组的沟通会上,审评小组指出了我们的产品所存在的问题,为我们召开了专家会,专家们对我们的产品临床应用方案提出了非常重要的建议。
这些意见和建议对我们产品的申报以及最终通过审批起到了非常大的指导和帮助作用。创新通道增加了很多我们跟药监局交流的机会,药监局帮助我们多次组织专家审评会,由各行各业的专家一起为这个产品提建议。
雷锋网:数据集的构建工作上有哪些可以分享的技术经验?
曹坤琳: 数据集构建四个步骤,其实也是药监局提出的四个步骤,每一步都会直接影响到软件最后的开发质量。
第一,数据采集。我们主要需要制定采集要求和入驻协议,决定最后产品适用范围。
第二步,预处理。需要注意对亚组分析来进行统计,像人口基线、病变分布、采集设备等信息要在这个步骤完成统计,从而保证我们开发数据的充分性和多样性。
第三步,数据标注。关键在于制定好技师和审查医生之间考核标准、培训标准,保证不同人标注之间的一致性,这样才能保证后续算法开发的准确性和稳定性。
第四步,数据集划分。测试集样本分布是否符合临床实际情况,训练集可能会有较多的unbalanced数据,我们需要通过测试集来把控训练出来的结果。
风险分析也十分重要,哪一个操作可能会带来什么风险,我们通过什么样方法来解决,技术手段上如何防止过拟合等,通过什么技术手段来控制这些风险,这些都要进行分析。
雷锋网:数据集是试验前采集的还是试验中采集的?
曹坤琳: 我们一共完成两个临床试验,2017年我们首先完成了一个前瞻性的试验。在与药监局沟通的过程中,对方希望我们能够做一个更大规模的临床试验,以收集更多的数据来证实我们算法的有效性。
2019年我们又完成了一个回溯性临床试验,有更大规模数据量,因此我们的临床试验既有前瞻的又有回溯的。
雷锋网:产品研发逻辑和布局是怎样?
曹坤琳: 在筛查诊断方面,我们刚刚提到结构学和功能学两方面进行综合评价,在两个方面上都提供产品。像深脉灵析作为结构学上的分析产品,能够分析狭窄、斑块,尤其是斑块,因为冠脉的病变其实主要是由斑块引起的,主要强调结构学上的分析。
而深脉分数强调在功能学上的分析,这两者结合起来就是一个非常完备的无创基于CTA诊断冠心病的分析。深脉造影分数是导管式的基于DSA进行FFR计算,就无需导丝测量,分钟级即可获得结果。
在治疗方面帮助医生介入手术方案的规划,包括虚拟支架以及术中的导航等,我们也进行了介入手术机器人的开发,帮助医生进行规范化操作,尽可能减少医生接触的辐射量。
深脉震波球囊主要应用在钙化斑块消除治疗,这是一种高质的耗材,可以帮助进行精准的处理。不单单是在冠脉的钙化病变,其他血管部位也可以使用。
最后在患者的多次随访上,基于CTA方面,我们采取结合结构学与功能学进行随访。所以整个服务过程涵盖了从疾病的防治,到筛查、诊断,从治疗到随访,这一整个流程。
雷锋网:回溯数据是否来源于真实世界?
曹坤琳: 所有数据都采集于医院。
雷锋网:应用在筛查、诊断、治疗、随访等不同方面的产品都需要过三类证吗?
曹坤琳: 不同产品有不同适用范围,因此要求也不一样。像耗材、介入机器人涉及到治疗的产品,要求会更高。
。