医学影像AI新晋IEEE Fellow「大论道」:后深度学习时代的记录、风向与产学思考
一个不争的事实是,在医学影像分析领域,华人学者的影响力越来越大。
近三年(2019、2020、2021),先后有六位该领域的华人学者当选IEEE Fellow(一年IEEE约有250名左右的Fellow产生,相当于会员总数的0.1%)。
IEEE全称是电气与电子工程师协会,医学影像作为其中相对“小众”的一个类别,获此殊荣殊为不易。
论文的接受数量,也进一步佐证了这一现象。
2019年,华人学者沈定刚教授成为MICCAI大会主席,他曾以MICCAI为例,向雷峰网 (公众号:雷峰网) 分享过一组数据:
在相当长的一段时间里,国内(包括香港)每年有十篇左右的文章会被(MICCAI)接收,比例只有3%-4%。
但这个现象在2019年完全不同——亚洲的录取文章比例已经达到37%(美洲为36%,欧洲为26%),超过了美洲。在亚洲的录取文章里,绝大多数(150篇左右)来自于中国。
在两年后的今天,这种学术趋势越来越明显。对学者而言,如何做出有水平的研究成果,实现高效的产研转化进而造福人类,是毕生的追求。
近日,由雷峰网与图像计算与数字医学国际研讨会(ISICDM)联合主办的"IEEE Fellow圆桌对话",邀请了近三年来当选IEEE Fellow的五位学者,围绕医学影像产学研融合的话题进行了深入探讨。
中国科学院自动化所研究员蒋田仔
中国科学技术大学讲席教授暨生物医学工程学院创始执行院长周少华
电子科技大学电子工程学院教授李纯明
东南大学脑科学与智能技术研究院创院院长彭汉川
腾讯天衍实验室主任郑冶枫
圆桌由南方医科大学生物医学工程学院的冯前进院长担任主持;MICCAI 2019大会主席、上海科技大学生物医学工程学院创始院长沈定刚教授进行致辞,对青年AI学术人的治学提出了诸多建议。(文后附致辞详细内容)
以下是圆桌论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理:
南方医科大学生物医学工程学院院长 冯前进
冯前进:近年来,越来越多华人在医学影像分析领域做出了杰出成就而当选IEEE Fellow,包括在座各位专家。请大家谈谈科研的经验与感想,如何做高水平、有影响力的学术研究?
蒋田仔:每个人对高水平定义肯定不一样,我觉得对这个领域或社会有意义的事,才是高水平。
我原来搞数学,从本科、博士都是学数学,后来做脑科学,从2000-2010年这十年基本上以写论文为主,发表了很多论文,却不能解决现实问题。
我们申请科技部“973项目”的时候,分析了以前的问题。
发现脑科学研究缺乏一个靠谱的脑图谱,所以,我们的项目设计了有三个主题:脑图谱、脑连接、疾病的脑网络表征。
该项目绘制的“脑网络组图谱”临床影响就很深远,因为有很多临床应用场景,包括精准诊疗的生物标志、治疗和调控靶区等等。
周少华:我非常同意蒋田仔教授观点。我博士做人脸识别,后来“误打误撞”加入西门子医疗开始医学影像的研究,研究了很多来自临床实践的问题。
我觉得临床实践才是医学影像研究比较好的途径,因为实际临床问题是重要的问题来源。
真的能解决某个临床问题、做出有影响力的工作才是高水平。
李纯明:我结合个人背景谈一下我的看法,我本硕都是数学,虽然博士读的是电子工程,后来一直在工科领域工作,但还是受数学影响比较深一点。所以我的研究偏数学一些,看法可能有些偏颇。
针对做算法的文章来讲,我认为一篇有长久影响力的论文应该具备以下四个特征:
第一,创新性。首先是文章的创新性,所提出的方法要新颖独特,这样才能成为作者的一张名片。
第二,有效性。文章里的实验结果首先要可复现,而且要有优势,至少在某些方面要优于其它方法。
第三,理论性。文章要有很好的理论支持,在理论层面或数学模型上就能够清晰地解释方法的工作机制,这样才能让人知其然,还知其所以然,让人心服口服,产生更深远的影响力。
第四,简洁性。文章的数学模型、公式和算法的表达都要尽可能简洁。
因为简洁可以让很多人在此基础做进一步研究,用起来更方便,容易让别人在你工作的基础上做进一步的研究,也更容易被记住。一篇经典的论文或一个fundamental的贡献往往具有简洁性。
现在很多深度学习论文的同质化比较严重,就是创新性不高,即不满足第一条特征,而且大部分论文也不具备第三条和第四条特征,往往只靠第二条。
即只依靠在某个数据集上的实验结果取胜,就是人们常说的“刷分数”,但因为缺乏理论性而不能让人心服口服,也许换一个数据集结果就分数很差。
而且,一个方法在某个数据集的挑战赛上得了第一名,也许第二天就被别的方法比下去了,很难维持长久的影响力。
彭汉川:蒋田仔教授他们一直都是体量比较大的项目,比较容易看到临床的巨大需求。但许多研究相对比较小众,项目曝光不大。
这种情况下怎么才能做出被大家关注的工作?
我曾经长期研究人工智能项目,博士后阶段后才开始做放射科学、医学影像技术、从事临床相关的数据挖掘。
后来,在2002年接触了新兴的基因组、基因表达研究,还有单细胞影像数据等等,逐步意识到,生命科学影像数据可以比传统医学影像数量级大很多,迫切需要新方法新系统。
2005年左右,这些研究的数据集进一步扩大,于是我尝试了很多方法学创新,其中也借鉴医学影像方法改进,但大量创新研究导致了全新的多维影像大数据平台并得到越来越广泛应用,现在也开始对医学影像数据处理产生了一些促进作用。
所以个人体会是,若想做出重要工作,需要经常跳出自己的视野,经常做一些跨界性研究,这个过程中会做很多不一样的工作,产生不一样的成果。
因此,我并不特别关注怎么做出高水平、有影响工作,而是如何在不同领域中使工作更有趣,同时把这些信息传递给合作伙伴,让大家慢慢把研究做起来,这样很多所谓的高水平工作就会自然产生。
郑冶枫:我在工业界工作了十几年,和周少华老师在西门子美国研究院共事十几年,工业界和学术界研究不太一样。
学术界比较自由,瞄准有意义的方向就容易出成果。但工业界没有太多自由,但好处是课题都是临床实际问题,都是医生迫切需要解决的好问题。
研究目标就是解决这些需求,所以我们被逼着死磕这些问题,确实有些问题很重要,但解决起来非常难,一旦解决就能推进技术发展。
例如,我曾用五六年研究如何从CT抽取冠状动脉,冠状动脉非常细,只有CT分辨率才能看清楚血管是否被堵住,想要解决非常难。
当时,我们参考了学术界方法,引入机器学习和深度学习,得到比较好的结果。
冯前进:深度学习兴起后,医学影像AI领域涌现一大波论文,这些论文与前深度学习时代论文相比有哪些不同?传统方法该何去何从?
郑冶枫:深度学习出来之后,最近5、6年所有方法都被深度学习覆盖,已经很难看到传统方法,我不希望某种方法一统江湖,压抑其他方法改进。
例如,现在模型越来越大,达到千亿、万亿级别参数的模型。搞得许多研究机构根本跟不上,像GPT那种需要几百、几千个GPU训练的模型,大部分实验室都没有这样的条件。
而且这种数据堆砌的方法不适用所有领域,例如医学影像没有那么多优质数据,几千个数据就是很大的数据集,这种情况下我会更聚焦算法创新。
除此之外,深度学习时代还有很多同质化现象,许多研究只是在神经网络结构上做微调,这不是一个好的现象,研究方式手段还要丰富多彩。
在深度学习如此火热的当下,之前旧的方法还是有很多可以探索的地方。之前我们更依赖于先验知识,而不是数据,用先验经验设计模型,现在靠数据、靠模型,这不太一样。
我最近就在研究把传统方法和深度学习结合,在数据量比较少的情况下提高准确率。
比如,传统的字典学习是生成模型,一般优化重建图像的损失,而在测试阶段是作为分类模型使用的,训练目标和测试目标不一致。
将字典学习和深度学习结合,我们可以做到端到端学习,训练和测试的设置一致,可以提高准确率。我们将这个方法用于CT图像去金属伪影,取得不错的效果。
最近几篇论文都是这个方向,因此我还是希望传统方法能和机器学习有机结合起来,发挥两者优点。
中国科学院自动化所研究员 蒋田仔
蒋田仔:深度学习只是一种方法,很多人把深度学习当作人工智能,认为人工智能就是深度学习。我觉得这值得思考,甚至要泼一些冷水。
2006年深度学习出来的时候,我就叫学生看了,但用处不明显。因为深度学习需要大量高质量、有标签的数据,对数据和人工要求都非常大,当时还不满足条件。
后来的深度学习越来越热是因为许多主要领域都有了数据积累。
即便如此,我还是要持不同的看法,很多问题是深度学习无法解决的,例如脑疾病问题需要最后追溯到哪个脑区和网络的损伤形成的,一般深度学习做不到,需要传统方法给临床提供一些帮助。
所以,未来也许有会出现深度学习更好的方法,但每个方法都有其优缺点。
彭汉川:我是1994年开始学习和使用人工智能包括很多人工神经元网络模型等,用了8年时间在早期先驱的原始代码上做各种实验也提出了一些新方法。
后来有幸又和做Bayesian Networks的首个学习算法提出者合作两年,做了医学图像数据挖掘的研究,之后大约进行了近20年的生物影像信息学大数据新领域的开拓和研究。
针对主持人的问题,我现在认为当今脑科学、生命科学研究和深度学习有很大关系。
现在,许多研究都已经可以用Deep learning解决方案,确实在很多工作中取得很好效果。对此,还是应该保持欢迎趋势而不是抗拒。
学术圈一种观点认为,这虽然叫深度学习,但不一定有“深度”。但深度学习好不好,还需要看应用场景。
例如,通过数据集成,在单个显卡训练或运算就能达到前所未有的效果,对学术研究是利好的,没必要拒绝。
另一方面,我们也注意到医学影像等现实需求中有大量问题,并不适用于深度学习方法。
例如,数据传输问题就不能被简单使用分类策略解决,数据可视化和标注也需要使用特定策略,不能简单套用所谓深度学习的框架。
实际上,一套医学影像AI系统不只是有深度学习模块,还有结果验证、校验、可视化、再编辑等等问题,需要一整套系统,而不是只是中间某个特定分类问题。
根据应用场景,我们可能不会只使用深度学习这一类方法;能解决问题同时又较少带来新问题的方法是最好的方法。
电子科技大学电子工程学院教授 李纯明
李纯明:我想说的有两点。
第一,现在的深度学习文章或方法同质化比较严重,大家可能觉得每个文章都能提出创新点,但方法上都大同小异,同质化比较严重,大批文章都比较类似。
同质化也造成一个很严重的审稿问题:要拒就全部拒,要接受就全部接受,许多文章貌似有道理,就被成批成批录用。
这样会出现一个恶性循环,文章一多,审稿的需求就增加,带来素质较差的审稿人。
第二,审稿人的不专业,许多本科生都来发顶刊文章,进入学术界,这些人进来之后就导致很多不好,水平比较差或没创新的文章被录用进来,产生恶性循环。
这和十几年前的学术界很不一样,当时的文章都比较注重理论创新,要有所突破。当然,其中也有人刻意加很多数学公式,把文章搞得很复杂,导致审稿非常困难,和现在正好相反。
周少华:我再补充一点,过去研究的很多都是临床问题,这些问题从更大层面角度都是刻划数据的分布问题。
我认为,深度学习是目前发现的一个最好的方法,过去的先验知识,或其它传统方法也都是数据分布的刻划,这一点上深度学习或许是一个最完美的手段。
当然,我也不喜欢模型变得越大越深,这让很多研究人员的工作越来越困难,所以深度学习还有很多问题,例如无法解决数据少的问题。
例如医学影像即使使用分布迁移的手段,也可能面临鲁棒性问题,让之前的努力都前功尽弃。
冯前进:在产学研融合方面,医学影像分析是一个交叉性质十分鲜明的学科,需要与医生进行广泛、深入的交流,要将一个好的模型转化为医生使用顺手的工具有很长的路要走,能否分享你们与医生合作印象较深的案例?
彭汉川:医生本身也需要很多科研需求,希望借助新方法在临床样本上看到不太一样的东西。
例如,医生需要利用自己的知识找到特定的数据样本或临床样本并记录下来,这就是一个标注,和样本分类的需求,具体可分为几个方面:
第一,对二维数据进行快速标注,这方面的工具有很多,需求和开发都比较简单;
第二,三维或多维影像的数据的标注,需要开发全新的算法。传统处理三位数据标注需要逐层处理,但一张一张来做的话速度很慢,效率低下。
效率更高的方法是通过工具把三维或多维数据在三维或多维环境中进行直接标注。
这在生命科学领域是一个很常见的问题,我的小组十几年前就做这方面工作,开发世界上第一套三维“虚拟手指”系统让使用者(包括医生)能够有效对三维影像数据进行快速标注,不需要单独逐层处理,得到越来越广泛的应用。
8年前我们又开始做虚拟现实工作,结合云计算把使用者和观察者放到海量数据中间,做出这个领域的世界第一套标注系统。
相信这样的系统未来会有很大应用,例如元宇宙,在虚拟世界里加入各种各样反馈,让场景变得更加生动有趣。
我们的系统也可以做类似开发,让影像科医生更加快速准确地产生诊断报告,将各种需求、研究和实际使用者联系起来,产出实际价值。
蒋田仔:这是我选择回国的主要原因之一,和医生合作是中国的一个优势。
我回国这20年时间里,一直都是和医生打交道,这让我能知道哪些工作是有价值的,哪些工作是没价值。
所以我最开始做973项目的时候,直接就选择了神经精神疾病作为应用场景,虽然这件事到现在还没有在临床应用,可能有几点原因:
第一,没有靠谱的图谱,所有人都拿着以前的图谱做牵强解释;
第二,缺乏大数据,精神疾病往往有不同亚型,精神分裂症也有不同亚型。
过去的一篇文章一共就二十个样本,如果分成不同亚型,一种亚型就只有几个样本。所以,从科研角度好像有一些进展。但对于临床医生来说,根本没意义,样本量太小。
所以,医学影像的科研,一定要通过和医生合作,了解他们的反馈和需求,调整自己的研究方向,尽量满足临床需要。
李纯明:我在这方面比较没有发言权,因为我过去的研究更偏向算法。
我觉得和医生合作,不能只是把他们看作提供数据的来源, 要求他们去做一些标注就到此为止,后面自己做,然后发文章;这样的研究既没有利用医生知识,也没有解决他们临床上的需求。
腾讯天衍实验室主任 郑冶枫
郑冶枫:我过去几十年都一直在工业界,参加了几个产品开发,这些产品最后也都在医院落地,有机会去看看医生的使用情况和收集反馈。
所以我也列举一个亲身的案例——当时在西门子开发的一个主动脉瓣膜微创置换手术导航系统。
这个手术非常复杂,过去死亡率达到10%。主动脉瓣膜是一个单向流动的阀门,如果钙化以后就会导致阀门关不严,血液回流,最终导致全身缺血,严重到一定程度就需要置换。
这个手术以前都需要开胸,把心脏打开,瓣膜缝进去,操作风险非常高。
在2009年以后,开始用微创的方法,在一根管子前方放置一个小瓣膜,从大腿根部动脉插进去,回溯到瓣膜位置,之后用气球将人工瓣膜撑开,替代掉原来瓣膜,整个手术创伤非常小,死亡率也很低。
但要实现这样的微创手术,就要能够在体外重建出体内情况,找到瓣膜放置的位置,临床上过去一直都是通过打造影剂,用X光照射观察,但是造影剂会对肾脏造成伤害,出现急性肾衰竭的风险。
我们了解到这个需求之后,了解到他们需要一个尽量不开X光、不打显影剂的导航系统,来找到瓣膜的位置,什么时候可以放置。
记得当时和医生沟通了很多次,去了很多家医院参观,甚至穿着铅衣还观看了几次真正的手术。
最后得出的方案是将X光机绕病人旋转一圈,生成一个CT,之后实时通过算法将瓣膜图像重建,抽取出来,满足在不打造影剂的情况下,就让医生知道人工瓣膜是不是在一个合适且匹配的位置,最后就可以撑开安装;
这是非常关键的,因为瓣膜置换只能做一次,如果放置不好,就需要转成开胸手术,这样死亡率又高达10%。
所以从产业的角度来说,和医生交流之后,能够知道他的需求,什么样的方案最合适,最后看到产品在临床应用后,会觉得熬了这么多夜做出来的东西确实真实有用,也很有成就感。
冯前进:2020年有多家公司的医疗AI产品获得了医疗器械的三类证,但是这些AI产品的落地能力仍受到质疑,这其中有哪些因素导致?产学研融合的关键是什么?
郑冶枫:腾讯也是获得三类证的企业其中之一,新冠肺炎辅助诊断算法在八月份获得药监局的NMPA三类证。落地中,我们确实碰到了很多问题,有商业模式的,也有技术的。
商业模式上,国内医疗系统收费模式和国外有差别,例如,影像诊断是和设备费用打包在一起,并不会独立算影像诊断费用,因此,我们的AI算法不能独立收费。
而美国诊断费用和设备费用是分开的,诊断费用和设备费用基本等价的,所以美国的人工成本非常高,有一些AI算法可以独立收费,甚至专门有一个类别可以报销,但国内的AI算法没法独立收费。
所以,对医院来说购买一个AI产品就增加了一项成本,真正采购的医院比较少。当然,整体环境正在改变,收费模式可能也会改变。但就现阶段而言,国内医疗AI企业的商业模式还有一些困难。
技术问题上,现在的AI算法只能在几个特定任务取得不错成果,拿证也都是独立病种一个个审批。
例如肺结节、肺炎,但法律要求影像科医生阅片将影像中体现的所有疾病都必须在报告中写出来,例如胸部不只看肺结节,还有心脏钙化、骨折、骨瘤等等一系列疾病。
所以这就有一个矛盾,现在的产品只有单一能力,例如我们拿到的是肺炎三类证,可以提高医生单点疾病诊断准确率,但不能节省工作量。医生还需要自己详细看一遍其它疾病,导致总体效率是降低的。
总体来说,现在的医疗AI算法还是单点能力,不能全面帮助医生,导致不能被临床普遍接受。
蒋田仔:非常赞同郑教授观点,拿证只是其中一环,拿证之后怎样被医生接受才最关键。脑机交互、神经调控也是同理。
很多人都是自己先做东西,然后去找市场,最终能不能落地,有没有人用这个产品都完全无法确定。
我们也有一个公司在做这方面研究,都选择医生看到这个需求和方向,我们在迅速跟进研究,这样的产品出来之后,可能更容易在临床落地。
中国科学技术大学讲席教授暨生物医学工程学院创始执行院长 周少华
周少华:AI落地最大痛点在于功能单一,除此之外医疗AI还有流程问题,医生工作流程都非常标准化。
如果AI产品不能嵌入工作流程,或者没有帮医生减少工作量是不受欢迎的。此外,还有分布迁移问题没有解决,一些AI模型即使有很多训练数据,做过很多测试,但还有鲁棒性问题。
李纯明:拿到证不见得能够得到医生认可,还要解决实际临床问题。自己在2018年前曾经预测深度学习最多还能再火一两年,现在看来其热度应该还能再持续一两年。
今年初我还觉得明年深度学习会降温,但AlphaFold又在生物计算领域掀起了一轮热潮,最近又有人工智能公司商汤的上市,它又会激励一些人继续加入深度学习的学术研究和创业。
所以,我现在都不太敢预测了。所以大家即使看到深度学习有很多问题,但未来还会继续发展,但应该会朝着更理性方向发展,比如进一步提高深度学习的可解释性,或与传统方法结合。
东南大学脑科学与智能技术研究院创院院长 彭汉川
彭汉川:落地难题本质不只是AI产品问题,更多的是公司运营的问题。
AI产品本身是一个新技术,拿到证只是标志它满足了一定技术质量要求、得到了政策允许、可以推向市场,至于落地难本身就是运营的问题。
医疗AI创业很大成分不只是怎么讲好故事,更多的是如何更有效推广,怎么在企业运营中分配各方面资源,更好地分配收益,产生持续现金流,这些才是关键。
AI技术只是其中的一部分,AI技术的落地更多的是市场问题,是公司运营的问题。
至于深度学习的热度会持续多久,我觉得会持续很久,因为现在深度学习参与者数量不断增加,越来越多的人在涌进这个领域。
此外,在实际应用中,我们看到医疗AI的成功案例也比较多,包括临床实验突破,技术成功,创业成功,上市成功,这会吸引更多人涌进这个领域,所以深度学习的热潮还会不断地持续下去。
至于医学影像发展,我的结论不太一样,在这一领域发挥作用的可能不只是深度学习等机器学习方法,更重要的生命力可能来源于它们能不能和具体应用场景或新技术结合。
例如元宇宙、自动手术机器人等不断拓宽应用场景和加强应用渗透度,和不同方法结合才能发挥更大前景。
郑冶枫:深度学习会继续持续一段时间,具体多久无法确定。
但事实上,现在的深度学习已经没有以前那么热了,顶会论文增长没有那么快,现在这个市场容不下这么多人。
至于深度学习会不会被取代,我记得80年代的时候神经网络技术也很火,但后来就直线下降,因为支持向量等替代技术,实际应用中比神经网络更好。
目前,我还没有看到可以替代深度学习的技术,顶会论文还都是深度学习文章,至少三五年内没有看到替代深度学习的理论。
我觉得深度学习的产业化情况总体趋势还比较好,在人脸识别、语音识别上都有很多成功应用。虽然医学影像的AI应用发展要慢一些,但至少大家都已经拿到证了,至于商业化是否成功,还需要几年观察。
沈定刚教授致辞:对青年AI学术人的建议
简介:沈定刚教授在美国工作20年(从Hopkins,UPenn,到UNC,都在医学院的放射科);在此期间,为国内培养近200位留学生/博士后/访问学者,有40位左右成为国内的院长/副院长、系主任/副系主任、放射科主任/副主任,还有不少人获得国家级和地方人才计划。回国前,沈定刚教授在UNC的 IDEA Lab 有70-80人,去年11月,他在上科大重建IDEA Lab,现在已有50多人,欢迎各位加入。
作为行业的权威学者,沈定刚教授在顶刊IEEE TMI、Medical Image Analysis杂志和顶会MICCAI上发表了全世界最多的论文,分别是72篇、64篇及411篇。
MICCAI 2019大会主席、上海科技大学生物医学工程学院创始院长 沈定刚
以下为详细内容:
今天的 “IEEE Fellow圆桌对话“ 里的每一个人,我都非常熟悉。
主持人冯前进,2021年刚成为长江学者。前进2008年到我UNC的IDEA Lab做博士后;博士后期间,不光在学术研究方面得到了全面的、深入的训练,更重要的是也学到了做研究、指导学生的新方法,这为他回国后有效领导他的研究小组起了很大的作用。
回国以后,他的研究组发表越来越多的 international journal papers,他们发表在 顶级影像杂志IEEE TMI上的文章在国内名列前茅。前进BME学院里的很多老师、学生都在我原来的UNC IDEA Lab训练过。
蒋田仔是我20多年的朋友,我们2000年在CVPR上认识,成为好朋友。田仔一直专注于医学图像的研究,他是脑网络研究的引领者,国内不少有名的脑网络研究者来自他的实验室;
我之前的不少博士后也来自于田仔的实验室。田仔在科研上坚持做原创工作,取得很多世界领先的水平成果(特别是脑图谱研究),相信田仔将来会获得更多的成果。
周少华,2006年在丹麦的MICCAI认识他。少华在医学图像领域一直做着创新的研发工作,他早期的image regression研究已在不同方面得到了广泛应用。同时,少华是我们领域的热心者,建立了很多专业微信群,促进同行的交流。
李纯明和彭汉川都来自我美国的同一个Lab,算是我的师弟了。
汉川当年从香港去Johns Hopkins做博士后时,我去机场接他的,他非常早到机场。汉川后来去了UC Berkeley,他那时做的mRMR特征选择方法,已被引用了一万多次。
后来汉川又开始做新领域,特别是转做脑大数据采集、可视化、分析、知识挖掘、脑图谱建立等工作,做得越来越好,在Nature、Cell等上发表了很多论文,包括最在Nature又发表的论文等。
李纯明,在我离开UPenn 的 Lab以后加入的;当然,我们很早就认识了。纯明的工作,之前的国内研究者应该比较熟悉,不少人跟着他做level set,他的好几篇level set方面的论文都被引用了几千次。
纯明近年了组织的 "图像计算与数字医学国际研讨会“,在领域中有较大的影响力。
郑冶枫,因为与我在同一领域——MICCAI领域,我们认识很长时间。冶枫的 “投影空间学习法” 在领域内比较有名,在医学影像的器官快速检测与分割中有较好的表现。
从我们指导学生、带领年轻从业者的实际经验来看,我们在学习AI的过程中,应该注意下面3个现象:
1) 跟风:大家可能都跟热点,包括应用场景和具体方法。基本上是跟着论文、比赛走。从论文中学到方法和应用,然后找论文中的问题,解决一个小问题,发表文章。
也就是从文章中来,回到文章中去,在文章里循环;没有从实际中找问题,为实际问题提供解决方案。也就是,没有做 "来自临床、高于临床、回归临床“ 的工作。
要解决这个问题,导师的作用非常重要,需要导师在初期引导学生/年轻人到正确的方向(包括临床场景、研究方法等)。
导师开始时要带着学生做研究,而不是给学生简单说一下方向,让没有经验的学生自己去做;那样的话,找好的临床问题、好的研究方法的可能性比较低。
2) 不深入:很多时候我们做完一个工作(可能只是其中的一个小问题),马上move到另外一个方向/课题,或者使用另外一个popular的方法,这样工作没有延续性。这个问题跟上面提到的 "跟风“ 问题非常相关。
正因为没有一个具体的临床问题去解决,看到新的文章、新的方法、新的比赛数据,拿过来就做;等到毕业的时候,做的问题很难成为一个体系,也解决不了具体问题。
应该以一个问题为中心,所有的方法都是为解决这个问题而服务;做完一个阶段性的工作,然后来深入review当前方法的limitation。
再来propose新的方法(这些方法也许是最近提出的新方法,或者经典的老方法),来解决当前的limitation,这样做的工作会越来越深入,最后的工作也会有体系、整体性。
3) 不实际:这个问题跟 "跟风“ 也有关系。如果我们在文章中找问题、公开数据中找方法,对于数据是怎么来的、怎么做预处理、怎么考虑从数据到结果的整体解决方案,都没有机会去学习、没有能力去解决。
这样没法跟医生做真正的合作,因为我们知道的只是其中一步,而医生需要解决的实际问题可能更复杂。其实,我们需要对问题的整体有全面的了解,虽然我们具体 focus的问题可能是其中一个问题。
另外,解决实际问题时,影像只是其中一部分的信息,我们需要考虑临床中用到的其他信息,来有效解决临床痛点。
归纳一下,我们应该做我通常强调的 "全栈全谱” 的工作。
上面讲了我们学习、工作初期的3种现象,大家可能也关心AI的前途,特别是当前AI的热度,以及可能的工资、待遇变化等。其实:
1) 过去AI被炒作得过分热。在医疗上面的应用,以前鼓吹AI要代替医生,这其实是门外汉的自我想象。
我们2017年就指出,这是不可能的;AI只能解决临床流程中的某些点上的某些问题,还没有能力去解决复杂的问题,还是需要医生作为AI工具的使用者,在临床流程中帮助医生,帮助病人,帮助医院管理,甚至医联体的管理。所有的AI都需要与实际临床问题紧密结合,才能很好解决临床问题。
2) 另外我们还需要深耕、练功。接地气的AI有广泛的应用,所以AI的前途非常光明;与垂直领域有机结合,我们可以一个问题一个问题去解决。
为了做到这些,我们还需要深耕临床场景、练好我们解决实际问题的功夫,这样我们的benefit(包括工资、待遇)都会越来越好。
雷峰网原创文章,未经授权禁止转载。详情见。