「肺炎 X 光病灶识别」挑战赛:几行代码,就能让医疗检测准确率 20% 的提高!
语音播放文章内容
由深声科技提供技术支持
雷锋网 (公众号:雷锋网) AI 开发者按:自 2017 年 7 月国务院印发《新一代人工智能发展规划》以来,中国人工智能技术得以迅猛发展,并在金融、医疗、教育、交通、社交等领域快速推广。
尤其在医疗这个拥有海量数据、严格判断规则且存在大量重复性劳动的现实场景中,人工智能的特性完全契合了这些工作需求,并发挥着重要的作用。
训练时长短、准确度高的 AI 医疗
正是由于 AI 具备对大量数据学习与判断的能力,通过对大量 X 光片数据集的训练,智能体能够在很短的世界内达到接近人类的识别准确度。
早在 17 年时,吴恩达等研究者借助国立卫生研究院公布的 10 万幅 X 光片对人工智能算法进行训练,就能使该智能体在短短两个月的时间,检测精度超越放射科医师水平。
而除了肺炎外,人工智能算法也能根据 X 光片,诊断出其它疾病,包括:纤维变性、疝气以及细胞团块等;它能够高效分析 CT 头扫描疑似中风,并标记那些更容易出现脑溢血的人,然后将它们集中起来供放射科医师重点检查。
甚至这种算法还可以帮助发现乳腺 X 光图像中那些放射科医生肉眼难以发现的乳腺肿瘤。并且值得一提的是,数据显示人工智能的诊断准确率也高于国立卫生研究院的基准线。
当然,AI 医疗远不止识别 X 光片、判断病情,它还可以帮助医生有效提高病例录入效率、辅助医生进行药物研发、提供诊疗方法参考等。
AI 医疗核心技术
从这些实例中我们会发现,AI 医疗的应用非常广泛,但 AI 病理开发环节主要涉及到了三个部分,包括了:数据积累、算法开发、场景应用环节;而这三大环节所包含的 AI 病理诊断及医学影像识别核心技术,其实也主要涉及到三部分:
-
首先是 数据挖掘 ,主要应用于数据采集环节。在这一部分,人工智能需要从大量的数据中自动搜索其中与病理特征有着相关性的图像信息;而高质量的数据资源正是进行有效算法开发的关键。
-
其次是 图像识别 ,主要应用于数据分析环节。通过对影像等多媒体医疗非结构化数据的识别与分析,从而实现对具有临床意义信息的提取。
-
最后是 深度学习 ,主要应用于学习和分析环节,也是整个 AI 诊断中最核心的环节。正因临床医学能够提供极为丰富的相关数据,利用深度学习对人工智能(AI)进行训练的难度就越低,它可以达到较高性能,应用也十分灵活。
可以看到,在临床应用中的 AI 医疗核心流程即:以传统医疗手段中采集到的医疗数据作为基础,通过这些数据对人工智能进行相应的训练,然后根据临床治疗经验建立人工智能医疗图谱。当然,由于应用场景、病种、病程等不同,病理数据的获取、分类也将有所区别。
肺炎 X 光病灶识别
AI 病理诊断技术可大幅缩短医生的工作量,提高放射学、病理学等依赖医学图像支持的专业的诊断效率和准确性。因此,AI 研习社这次以 AI 医疗为主题,开设了「肺炎 X 光病灶识别」挑战赛。
大赛主页提供了「肺炎 X 光片」相关的数据集,包括了训练集 20013 张以及测试集 6671 张。比赛任务也非常明确:只需编写相应代码,训练模型完成对测试集图片内容的正确识别即可~
开始时间:2019-12-09 09:00:00
结束时间:2020-01-08 00:00:00
大赛基础奖金池为 2000 元,比赛一共设置了三种奖项,包括了:参与奖(30%)、突破奖(20%)、排名奖(50%);三种奖项互不冲突,而优秀的选手(比如你),当然也是可以直接一次性全部拿走哦!
除此之外,在这一挑战赛中,我们也向大家免费开放了珍贵的 GPU 资源;只要报名之后,点击页面右侧的「获取免费云训练资源」,即可任意使用。
数据集下载链接:
https://1t.click/bxSW
评审标准
最终提交结果文件如下所示,其中,第一个字段位:测试集图片 ID(注意 ID 即文件名是从 0 开始的);第二个字段:病灶数量(0、1、2、3、4)。
Ps:建议使用 UTF-8 编码,共计 6671 个结果,因为数量不足可能导致无法评分哈~
整个比赛的评审完全透明化,我们将会对比选手提交的 csv 文件,确认正确分辨图片数据,并按照如下公式计算得分,其中:
-
True:模型分类正确数量
-
Total :测试集样本总数量
每日 24:00,我们也会将最新结果更新在官网排行榜上,你可以随时随地查看自己的排名情况。
更多信息,可进入参赛主页查看: https://god.yanxishe.com/18
雷锋网 AI 开发者 雷锋网
。