16岁女孩用AI诊断糖尿病视网膜病变,同龄的你在干吗?
当16岁的Kavya Kopparapu没有参加会议,没有发表演讲或组织学校生物信息学小组,没有练钢琴或者管理非盈利组织的时候,她总在思忖着如何打发她的空余时间。
2016年6月份,高二那年的暑假,Kopparapu正在寻找可以应用其计算机科学技能的新项目。很快,她将目光锁定她的祖父——生活在印度东部海岸小城市的一位老人。
她的祖父从2013年开始出现了糖尿病视网膜病变的症状,这是一种糖尿病的并发症,会损害视网膜血管并最终导致失明。虽然他的视力还是恶化了,但至少他获得了治疗,怎么说还是比较幸运的。虽然早期的药物和手术治疗可以阻止或者扭转视力损伤,但大多数患者并没有机会获得这些治疗方案。
Kopparapu非常清楚这些数据:全球4.41亿糖尿病患者中,三分之一伴有视网膜病变,其中一半得不到治疗。在病情严重的患者中,半数将在五年内完全失明。这些患者大多数都是穷苦之人。
Kopparapu说:“缺乏诊断是最大的问题。在印度,虽然有项目会派遣医生到农村和贫民窟为人们看病,但是患者那么多而眼科医生十分有限。”如果当地诊所可以有更廉价便捷的方式来发现这些新的病例并及时地将他们转至大医院呢?
于是,Kopparapu开发了Eyeagnosis。这是一款智能手机应用,外加一对3D打印镜头,Eyeagnosis旨在通过手机快速拍照来改变耗时2小时,且需要数千美元视网膜成像仪的诊断流程。
Kopparapu和她的团队——包括她15岁的弟弟Neeyanth和高中同学Justin Zhang,共同训练了一个人工智能系统来识别眼睛中的糖尿病性视网膜病变迹象,并提供初步诊断。上个月,她在纽约的O'Reilly人工智能大会上介绍了该系统。
美国国家卫生研究院(NIH)视觉疾病专家J. Fielding Hejtmancik说:“该设备非常适合用于高效筛选更广泛的人群。”其他研究机构,包括谷歌和Peek Vision最近都宣布了类似的系统,但Hejtmancik对这群学生的创造力印象尤为深刻。
Eyeagnosis的发展与大多数项目类似。Kopparapu说:“我搜索了很多资料,还发了很多邮件给眼科医生、计算病理学家、生物化学家、流行病学家、神经科学家、物理学家和机器学习专家等等。”最后,她组织了一个方案。
首先,她的团队利用已知的被称为卷积神经网络(CNN)的机器学习架构开发了一个诊断AI。神经网络在近来的人工智能大爆发中功不可没,包括在语音识别、机器翻译以及图像字幕等方面的大幅进步。他们通过解析大量数据来寻找相似性模式以训练AI。
CNN在识别图像方面特别有优势。信息经过被称为节点的“神经元”分层,每一层中,网络会识别出更多的抽象特征。“我们正在使用基于视网膜系统之工作原理的系统来诊断视网膜疾病,这在我看来非常有趣。”Kopparapu说。
与其从零开始构建网络,她选择了有微软研究人员开发的现成模型ResNet-50。但是为了训练系统识别眼部疾病,她仍需要大量的训练数据。
她发现在NIH的EyeGene数据库中有约34000个视网膜扫描数据。其中,许多图像由不同型号的相机拍摄,且拍摄条件也各不相同,有的很模糊,有的曝光很差。“但这其实是件好事,”Kopparapu说,“这些照片更符合现实,毕竟现实世界中用智能手机拍摄的图像大都千奇百怪。”
到2016年8月,她的团队已经让ResNet-50能以与人类病理学家相当的准确性来发现糖尿病视网膜病变。到10月份,她已经与孟买的Aditya Jyot眼科医院合作来测试Eyeagnosis应用,这个应用不仅能够检测疾病,还可以突出显示图像中的血管和微动脉瘤——以往通常需要向患者血液中注射荧光染料才能获得这些高亮显示的图像。“我们试图让眼科医生尽可能轻松地查看到所有信息。”
11月,她向医院寄出了首个3D打印系统镜头原型。当安装到智能手机上后,镜头会自动聚焦以照亮视网膜。完整的Eyeagnosis系统已经在五名患者身上进行测试,并且准确率100%。
NIH专家Hejtmancik指出,Eyeagnosis到临床应用还有很长路要走。“接下来她需要大量的临床数据来证明Eyeagnosis的诊断结果在各种情况下都是可靠的,比如在眼科医院,在乡村,在偏远地区的诊所等等。”
然而,Hejtmancik认为该系统具有真正的商业潜力。但他还表示,唯一的问题可能是这个系统太便宜,大公司可能会认为其利润过于微薄。“但是在我看来,这正是我们需要的医疗保健。”Hejtmancik说。