DeepSeek、Grok对医生能有多大帮助?
就在医疗界热火朝天地讨论如何应用DeepSeek时,北京时间2025年2月18日,埃隆·马斯克的人工智能公司xAI推出了Grok 3,马斯克将其描述为“地球上最聪明的人工智能”。
除了这大胆的说法,Grok 3在推理、编程和特定领域理解等方面的进步,确实有可能使其成为一些领域游戏规则的改变者。
ChatGPT4、DeepSeek- R1和Grok 3的相继推出,对于那些使用人工智能的医生、药物研发者、影像公司来说,这实际上意味着什么?这些变得越来越优秀的AI在医疗健康行业终究会扮演什么角色?
一、Grok 3带来什么冲击?
埃隆·马斯克的Grok 3,得益于神经网络升级、训练数据扩展,以及增强的计算基础设施,据称在数学推理、科学逻辑推理和代码写作等能力表现超过或媲美DeepSeek、ChatGPT等对手,尤其是Grok3的推理模式令人称道。
LabNews Media的一篇文章中指出,在医学领域Grok 3在一些方面的确表现出了显著的优势。
首先对医疗数据的处理,Grok 3可以独立生成和完善训练数据,这在敏感的医疗领域尤为重要,它可以提高患者数据分析的准确性,同时减少诊断中的潜在隐患。
其次,在分析大型生物医学数据集方面, Grok 3表现出特殊优势。它可以检测研究数据中的复杂模式,并支持新疗法的开发,尤其是它处理不同类型的数据的能力,将使其在药物研究和临床试验有望成为宝贵的工具。
第三,在诊断技能方面,Grok 3的高级图像分析功能允许解释各种医学成像程序,如X射线、PET扫描和核磁共振图像。
另外,Grok 3的实时数据处理允许直接分析和解释医疗信息,这对于在危急医疗情况下的快速决策特别有价值。
然而,尽管诸多优点加身,试用过的医生和研究人员还是表示, Grok 3诊断医疗能力有限。
美国一家非营利性科学研究机构研究人员Derya Unutmaz博士,是Grok的测试者之一,就对媒体指出, “必须对Grok的提示进行调整才能得到正确答案。”
对此,马斯克在X上的一篇文章中称,这仍处于早期阶段,但它已经相当准确,并将变得非常好。
乳腺放射科医生、深度学习研究员Laura Heacock在社交媒体帖子中说,她使用了她以前测试GPT4的相同乳房的X光检查、超声波和核磁共振作为基准,“比ChatGPT4稍微好一点,但没有一个诊断是正确的。”她预计,未来性能会变好。
这些测试暴露出人工智能的限制性,强调了 人工智能可以被视为支持性工具,而不是专业人员的替代品。
二、让DeepSeek参加一场医师考试
一个德国研究团队让DeepSeek-R1参加了一场美国医师执照考试 (USMLE) 。
在这场考试中,DeepSeek-R1不仅通过了USML三个阶段的考验,还顺带着和ChatGPT硬扛了一把。
不出意料,在这场比试中,DeepSeek进一步证明了人工智能系统在回答医学问题、模拟临床推理等方面实现了近乎专家的表现。这个由德国杜伊斯堡-埃森大学医学人工智能研究所 (IKIM) 、德国亚琛工业大学附属医院组成的研究团队,将该研究的预印本于2月6日发布在medRxiv上。
研究者发现, DeepSeek-R1在基于事实的回忆和临床知识检索方面表现出色。
USMLE有三个考试环节,第一阶段主要考基础医学,如微生物、病理、药理等;第二阶段考临床知识,含内科、外科、妇产科、小儿科等;第三阶段考的是临床实习后对于医学知识的进一步应用。
研究人员称,DeepSeek在第一、二阶段中,其精确匹配性能明显超过ChatGPT。这也表明DeepSeek作为医学教学工具有很大潜力。
不过在第三阶段临床决策方面,无论是DeepSeek,还是ChatGPT都出现力有不逮的状况。
该研究显示,在需要综合多种临床因素的复杂患者病例中,例如为慢性疾病重叠的患者选择最佳管理策略,DeepSeek可能无法考虑患者偏好、症状演变或非典型表现等细微差别;在高风险场景中,ChatGPT可能给出听起来合理,但医学上不合适的治疗计划。
无论是对DeepSeek,还是Grok的测试,都表明目前人类医生的专业经验还是至关重要,人工智能适合扮演最佳助手的角色。
也就是说,将人工智能作为工具,集成到医疗工作流程中可以让医疗健康体系更高效,并且人类专业知识和人工智能支持的结合,对提高诊断准确性和治疗效果将是一场幸事。
还需注意的是,众多人工智能的集中问世,也让一些问题更突出,也更紧迫。
Grok的数据来源就引发了隐私问题的讨论。2024年10月,马斯克在他的X社交媒体平台上公开要求Grok的用户,上传他们的医疗图像并生成诊断结果。
通过社交媒体平台上收集医疗数据的举动,让 Grok招来欧洲隐私监管机构的质疑,可能违反欧盟法规《通用数据保护条例》。
在步入一个满屏都是讨论AI的时代,最好的、最坏的可能都会发生。如北京朝阳医院一位信息工作人员对《财经》所说:“AI在病历质控、自动生成等已有探索性的应用。现在都还在探索阶段,还需看后面落地的实际应用。”
本文来自微信公众号: 财经大健康 ,作者:王莉萍、辛颖,编辑:王小