腾讯医疗大模型,不止大模型
在今年几乎所有企业都卷入AI大模型这场豪赌时,腾讯健康在做什么?
在西南边陲的贵州黔南州,与IT伙伴深耕远程医疗,打通五级行政区划的分级诊疗机制;在医药医械流通环节追求降本增效和透明规范的现况下,与物联网伙伴建立数字链路;在国产传统医疗器械巨头转型路上,将AI技术与大数据优势与体外诊断融合创新,让智慧大脑进入临床。
一些声音认为,腾讯健康的故事没有新意。当大家都在玩AI大模型时,它还拉着合作伙伴推敲医疗行业的“郁结”。
腾讯健康没有压力吗?
腾讯健康总裁吴文达在和雷峰网聊起时明确表示,他也在使用AI大模型这种新技术,并对其感到兴奋。但同时,他也想说明,腾讯整体都对大模型相对克制。“我们更关注如何在真实世界的医疗场景,用起大模型,用好大模型。”
拿医院来说,院方更在乎数据隐私,腾讯健康完全可以将千亿级参数的医疗大模型封装起来,从而实现医院本地部署,但会耗费大量的资金和人力资源,因此许多医院可能无法承担这些成本。即使能够承担,也存在其他现实的限制,例如难以招聘和保留高素质的数据科学员工、承担后续的维护费用等。
腾讯健康选择的是另一条路:将大模型这种生产工具封装在不同的业务和产品中,再输送给ISV(独立软件开发商)这类合作伙伴。
正如去年腾讯从集团层面明确从“集成商”到“被集成者”的战略转变:由合作伙伴担任直接服务客户的界面,腾讯的自研产品能力作为其中一环嵌入整体解决方案之中。
经过一年的实践,腾讯依然是让伙伴“唱主角”,相对应的是,自己在交互体验和场景挖掘方面有近乎极致的追求。
“这个场景非大模型不可?老年患者该怎么用大模型?大模型的延迟响应控制在多大尺度?具体到某一区域里的医疗机构能否支持接入......”
腾讯在医疗领域的野心,是愿意花费精力、下大注的。
千呼万唤始出来,腾讯医疗大模型就位
从过去以深度学习为代表的人工智能,到医疗大模型为代表的人工智能,如何为生命健康服务,一直是最性感的课题。
不久前雷峰网 (公众号:雷峰网) 对话北京一所三甲医院院长时,对方谈到,目前医疗大模型的应用面临着两个根本限制:人类对医疗大模型秉持着比人类更严格的错误容忍度、人类无法对医疗大模型追责。
这要求企业在打造基础大模型及行业大模型时,必须做好万分准备,以“技术底座”、“增程器”、“革自己的命”的标准要求自己。
9月8日,腾讯健康正式公布,基于腾讯自研的混元通用大模型,打造了面向医疗行业的专属大模型,并对腾讯健康中的智能问答、家庭医生助手、数智医疗影像平台、药物发现平台等多个AI产品做出了新一轮升级。
腾讯杰出科学家、腾讯天衍实验室主任郑冶枫介绍,团队在打造医疗大模型中分为四步。
腾讯杰出科学家、腾讯天衍实验室主任郑冶枫
首先,以自研“混元大模型”为基座模型,目前这一通用大模型达到超千亿参数规模和超2万亿tokens预训练语料,并加入大量医学专业数据,比如中英文的医学文献、百科全书、药品说明书,以及腾讯医典上的医学专家撰写且多轮校对过的文章等。
第二步,在基座模型基础上,持续加入天衍实验室过去这些年来积累的知识图谱,其中涵盖285万医学实体、1250万医学关系等结构化数据。
通俗点说,每个实体代表一个概念,如一种药或一个疾病;每条关系代表一个知识点,如某种药能治某种疾病。因此该知识图谱的覆盖率和准确率均非常好,基本覆盖98%的医学知识,使大模型进一步掌握专业的医学知识。
腾讯医疗大模型预训练阶段的数据来源
郑冶枫表示, “以上两步中提到的无结构和结构化数据,保证了混元大模型也能进行基础的医学逻辑推理,但到这只是完成了一半,最终模型是在对话中输出能力,所以后续着重用了‘问答对’的形式做训练。”
据悉,问答对这一类型的数据,有三路来源:
一是患者场景,包括线上问诊、医学问答、导诊、预问诊;
二是医生场景,包括医学考题、病历生成、出院小结、检查建议、诊断数据和用药建议;
三是与药企合作建设的药品知识库等,总计约3000万个问答对。
这是什么概念?打个比方,关于ChatGPT使用了多少对话数据,没有官方答案,据网传消息,2020年发表在ACL会议上的一篇论文中,研究者使用了650万条英文对话数据和300万条中文对话数据,相比之下腾讯的医疗大模型是其3倍多。这也从侧面体现出腾讯健康多年来建设医疗生态的价值。
最后一步,则是引入人类专家完成强化学习训练。为了增加答案的多样性,团队在设计之初规定,大模型可以输出5种不同的答案,并请专家对这些答案进行准确度、患者关怀等打分(0-9分),最终使用了这些专家打分的数据来训练一个奖励模型,并将强化学习机制融入到大模型中。
据悉,腾讯健康所使用的由专家医生的标注数据达到36万组,保证了腾讯的医疗大模型在处理医疗需求时更专业、精准,同时也兼顾了患者关怀,更接近人类医生。
郑冶枫举了几个例子,尝试说明对比通用大模型,腾讯医疗大模型更懂“医”:
对“小孩细菌性感染肺炎”的患者主诉,通用大模型会建议到“儿科”或“呼吸科”就诊,但是腾讯医疗大模型会更细致地给出“小儿呼吸内科”的推荐。
另一个更直观的例子是,模拟人类医生问诊。如ChatGTP等通用大模型只会按照患者提问给出对应的回答,并不会主动提出问题,在处理如“打完新冠疫苗第一针第二天得了急性咽喉炎怎么办?”这种问题时,往往只会一本正经地分析病情,然后建议尽快就医。
但其实,人类医生处理类似问题时并不会直接给出答案,而是追问症状,进一步排除可能性较低的疾病。腾讯医疗大模型就很好地实现了这一点,通过多轮提问推导出患者的症结所在。
正如今年世界人工智能大会上,不少人在谈及大语言模型时提到,医疗是一个极为严肃的领域,需要精准的判断并给出支撑判断的证据,不能像通用语言模型那样给出一个模棱两可的答案,或者堆砌答案。反而是,这需要医疗大模型在结论精度上进行提升,给出精准的决策及建议。
大模型能让医疗走得更远、更快吗?
这半年多以来,随着大厂博弈、中小企业的入局、以及投资和科研界的落地探讨,都一致认为:卷大模型没有意义,卷应用机会更大。
据不完全统计,目前在医疗领域,从医学科研、药物研发、智慧诊疗、医疗设备运维、医院管理等,国产大模型产品数量不少于40个。 如今,腾讯的医疗大模型也已就位,几乎可以肯定,医疗诊疗、健康管理的能力边界将进一步扩大。
腾讯杰出科学家、腾讯天衍实验室主任郑冶枫介绍,腾讯医疗大模型的能力包括,文案生成、智能问答、病历结构化和检索、影像报告、辅助诊断等,可嵌入医疗环节全流程。
放在医疗场景里看,则是就诊前的智能院务客服、科室导诊、医生推荐、预问诊;就诊过程中的医患对话、病历自动生成;就诊完成后的随访管理、患者档案流转到体检机构等服务。
腾讯医疗大模型的应用场景
这符合腾讯健康总裁吴文达对大模型的观点,即“用起来”才能体现医疗大模型的价值。
想象一下,日接诊量超5万人次的医院,当医生忙碌或者休息时间,一个“AI护士”就能7x24小时答疑解惑,引导患者正确就医;
基于大模型的能力,辅诊产品学习百万级医患对话及3000多疾病推演解析,实时给出有执行依据的辅助诊疗,自动生成更符合书写规范的病历等等。
这是一个双赢的局面:大模型最直观的帮助是缓和医生文书管理的压力。医护人员可得以将更多时间用于关爱患者,还能在亲自从事护理时获得更高的成就感。
而对于不太适应数字化操作的用户,一个实例,上海仁济医院已经率先运用腾讯医疗大模型,推出“适老化服务”,打造高度拟人化的虚拟数字形象“小威护士”。
再比如,对于医疗资源不够充足,全科诊疗能力受限的基层乡村医生,腾讯与中迈医疗从2015年开始,一起将贵州黔南州龙里县作为试点区域。最近,基于大模型的腾讯导辅诊AI,已经成为龙里县50多家村卫生室、近200位村医的日常工具,并且被纳入贵州省黔南州远程协作的标准作业规范。
借着微信的连接能力,医疗大模型还会进一步深入基层。
在这次峰会上,腾讯健康披露了全新的产品“家庭医生助手”,医疗大模型不光可以辅助家庭医生与居民展开对话,还可以变成医生随访的智能工具,生成不同的分类标签,帮助家庭医生分类管理患者。此外还可以将患者档案进一步扩展到综合医院体检和体检后的场景中。
不难发现, 对于医疗行业而言最大的感受是,如今的医疗大模型技术代表了一种技术的相变:以前,医疗服务被冻结在单个医疗体系里,而现在它已经融化成水,可以流向任何地方。
吴文达指出,医疗健康的数智化升级已从“先行先试”,转变为“全面拥抱”,人工智能及各类数智化工具的应用将加速普及。
他指出,当前最应该关注的是能带来医疗行业质变的技术突破,比如X光的发明催生了医学影像行业、抗生素的发明促进了外科手术普及、人类基因组计划开启了基因编辑技术等,“如今大模型技所具有的生成能力,很大程度上将是医疗行业变迁的前兆。”
腾讯健康总裁吴文达
在初见医疗大模型的红利上,智慧化技术+细分场景服务的组合,带来的是短时间极强的认知占据,随之而来是长期对生态发展的奠定。
因此,对于做医疗服务的企业而言,大模型是一个极好的复盘机会。从去年通过多维度调整,腾讯曾明确CSIG(云与智慧产业事业群)搭建的数字化平台,不会做定制部分,而是提供灵活的平台能力与标准件,让交付团队与客户内部研发团队去使用平台。
透过今年生态大会,我们能明显看到腾讯健康这一板块的覆盖面越来越广,场景越来越深,能力越来越强,很大程度上将成为医疗行业伙伴破局的“尖刀”。
云、数、智三位一体,辐射合作伙伴
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生认为,企服赛道周期比消费互联网赛道周期长很多,可以坚持十年二十年,但这个领域内的企业客户是一个一个赢回来的。
腾讯定位为平台软件厂商,选择的路径就是打造具备技术含量的产品,以产品为载体,凝练行业信任。
站在合作伙伴的视角上,为什么愿意和腾讯健康走在一起?
在此次腾讯全球数字生态大会举办之前,雷峰网走访了一家与腾讯同行八年,只做一件事的合作伙伴:中迈医疗。
腾讯和中迈的合作要追溯于2015年。
这一年,两家公司选择在贵州黔南州的龙里县试点,试试能不能把这个大山里的医疗信息化拉通。
中迈主要负责提供系统建设,包括全场景专科协作、远程诊疗、智能导诊、云HIS系统、电子病历等医疗IT系统,以及医疗设备连接集成等。同时,中迈还深度参与了龙里县的数字化分级诊疗机制的规划方,联合腾讯健康在龙里县打造“互联网+医疗健康”的智慧医疗生态。
腾讯则提供医疗AI软件产品、以及微信公众号、小程序,会议、直播、文档、云技术等非医疗业务。因此,腾讯可以把技术产品通过公有云或私有化部署以提供多样化服务,也可以让中迈将数据放到云端存储,并承担IT基础运维保障。
中迈在早期尝试引入美国HIE标准,最终失败告终。实际上,到目前为止,达到HIS七级(最高级别)的全国只有14家医院,而达到中国互联互通五级测评的也只有30家医院,证明这条路径在中国难以复制。
而后,在与腾讯的合作中,两家公司另寻了“区块链+专用医疗终端”的方式,将医疗数据的互联互通成本降低到10万以内,使得政策的制定和实施变得更加容易。
在沟通中,中迈创始人林子牛多次强调这一点,“技术模式要可行,成本要能够让各方接受,最后才能解决商业模式的问题,更多医院愿意来买单。”
从2015年以来,从头建成大范围的数据互联互通,两家企业用了四年,再到建立每级医疗机构执行的常态化的合作机制,又用了三年。直到今年5月,“龙里经验”升级为“黔南模式”,将进一步在黔南州、贵阳市、毕节市三地推广数字化分级诊疗。
最新的进展是,基于大模型的腾讯导辅诊AI,已经被纳入贵州省黔南州远程协作的标准作业规范,融入当地多年打造的数字化分级诊疗体系,嵌入基层医生诊疗系统,同时结合专家远程指导,让基层医生“能看病、敢看病”。
中国最基层,村医带AI问诊、导辅诊工具上门看病
从非医疗产品的支持,到如今医疗大模型的嵌入,腾讯健康用八年证明,医疗行业存在一系列重要的基建工作、伦理工作、以及该如何权衡企业利益与社会利益的关系。
回想2018年的生态大会,腾讯曾启动第三轮组织架构调整,成立云与智慧产业事业群(CSIG),意味着腾讯以此为起点,将自身云计算、大数据、人工智能等技术优势赋能智慧医疗。这被视为腾讯健康的一次重要转身。
如今五年过去,腾讯健康业务作为其中重要一环,深度参与了更多企业的数字化转型中:
爱创科技的溯源技术保障药械流通安全,并拓展增值服务空间;
迈瑞等医疗器械龙头的转型,打通软硬件一体化运营;
丁香园对医患群体的服务和连接能力,将为“治病为中心”转向“以健康为中心”的医健转型提供落地场景;
神舟医疗与腾讯为基层医院提供数字诊疗联合方案,促进医疗资源下沉,减少区域间不均衡。
在走向数智医疗星辰大海的路上,他们终将迎来自己的黄金时代。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。