为疫情预警:大数据在疾控中的应用面面观
图片来源@视觉中国
文 | 动脉网(ID:vcbeat),作者 | 陈鹏
不同于以往的情况,我国的科技水平如今已经有了大幅提升,甚至在某些领域领先全球,尤其是云服务、大数据和人工智能技术等创新科技。在本次疫情防控工作中,我们用高科技武装自己,将这些技术变为应对疫情的有力武器,在疫情追踪溯源、路径传播、发展模型预测、资源调配等领域加以广泛应用。
本文中大数据在疾控中的应用(动脉网制图,仅供参考)
大数据究竟对本次疫情防控做出了哪些贡献?在未来的疾控中可以发挥什么样的潜在作用?动脉网对此进行了梳理。
大数据在疾控预警及监测中不可或缺,前提是“真实”数据
根据媒体的报道,2019年12月26日,湖北省中西医结合医院呼吸内科主任张继先在电子病历系统中存储一个病例时惊讶地发现,当天上午已经有另外三条类似的数据都包含发热、咳嗽和华南海鲜市场三个相同的关键字。
经验丰富的张继先感觉出了异常,并于12月27日向副院长、院感及医务汇报。院方果断把数据上报武汉市江汉区疾控中心。到了12月29日,类似数据增长到7条,张继先再次向医院报告。医院立刻召开多部门会诊,随后,湖北省中西医结合医院直接向湖北省及武汉市卫健委疾控处报告。
张继先被认为是“疫情上报第一人”,湖北省中西医结合医院则是第一家正式上报疫情的医院。
公开报道中最早的病例可追溯到2019年12月8日。这半个月期间,武汉市的其他医院也陆续收到了类似的病例。根据报道,出于谨慎考虑,院方选择首先进行基因测序确定病原体再行上报。考虑到这是一种全新的病毒,基因序列也需要时间,这也无可厚非。
不过,我们假设一下,如果当时有大数据及人工智能能够第一时间抓取到这些早期的蛛丝马迹,情况是不是会向另外一个方向发展呢?
当然,也有人会提出质疑,为什么从2004年开始运行,当时耗资7.3亿元巨资建设的国家传染病与突发公共卫生事件网络直报系统(下文简称疾控直报专网)没有发挥预警作用?
根据动脉网的了解以及媒体的公开报道,疾控直报专网并非没有发生作用,但其数据来源完全取决于上报数据,由于种种因素,疾控直报专网无法与医院内部网络进行直接连通。采集不到数据,这一系统自然无从发挥。
2月3日,卫健委发布了《关于加强信息化支撑新型冠状病毒感染的肺炎疫情防控工作的通知》。各地卫健委根据通知不断改进采集方式,多数医院开始采用网络直报的方式,总算逐渐发挥了专网的作用。
对于大数据来说,真实的数据来源是极其重要的一步。本次疫情的发展过程中我们可以清楚地发现,依据错误数据得出的结论与事实相差千里。如何获取真实可靠的、来自医疗机构一线的数据?电子病历系统(EMR)、实验室信息管理系统(LIS)、医学影像存档和通讯系统(PACS)以及医院信息系统(HIS)这几个主要的系统为我们提供了可靠的数据来源。
EMR是数据来源的最初一环,也是国家推动的医院信息化升级中的一个核心系统。从2018年到2019年,国务院和国家卫健委总共有9条政策详细提到对于电子病历的硬性要求。2019年,全国总计有7000多家医院申报了国家的电子病历评级。
利用大数据及人工智能对EMR进行分析并运用于疾控并非无法实现,这是一个目前的热门话题。北京大数医达为南京市疾控中心建设的疾病与监测预警系统便直接打通连接了当地医院的EMR。
这一疾控监测预警系统应用了大数医达最先进的大数据和人工智能技术,对医学知识图谱建立模型,再直接提取EMR进行语义结构化,由人工智能匹配知识库判断EMR中是否包含新冠肺炎等传染病的关键词。一旦被人工智能判断为疑似或者是高度疑似则上报疾控部门,避免医院因故遗漏或者迟报。
系统直接打通并连接到医院的EMR,作为省市疾控中心的上报分析、数据汇总及预警分析系统。它具有很细的颗粒度,除了40种法定传染病,也支持各地区自己补充当地认定的多发性传染病。
大数医达区域疾病监测预警系统(所有显示仅为展示,不代表任何实际意义)
同时,系统结合历史疾控数据进行学习,并结合区域密度和人口流动率等大数据,可以对疑似数据对传染病的发展速度及分布区域等进行预测,从而为疾控决策给出参考数据。
总体来说,要把疫情防控工作做踏实做到位,需要借助AI+大数据技术,既要打通行业内“部-省-市-区县”自上而下的垂直领域数据,又要横向打通跨行业部门“信息孤岛”。从顶层设计就要实时结构化信息互联互通,业务联防联动。
大数医达为江苏省承建的这套系统原本是为春季流感高峰而准备,没想在这次更加严重的新冠疫情中发挥了作用。根据统计,如果以疫情爆发的中心城市武汉为原点,沿着高铁线路画一条半径约为2小时的圆圈,可以清晰地看到各个地区疾控水平并不一样。相对而言,江苏省的新冠疫情控制的就比周边要好很多。
专门从事传染病疾病智能监测的长沙双数科技则试图通过解决医生在当下传染病报卡中的痛点从而解决整个传染病监测的痛点。首诊医生负责制规定,凡发现传染病人,疑似病人病源携带者的均由首诊医生填写传染病报告卡,并作好记录备查。
传染病监控对传染病报告卡的数据质量要求较高,包括传染病报告的及时性、传染病报告数据的完整性和准确性都是重要指标。这本是一件好事,但客观上也使得医生在实际传染病报卡过程中会遇到很多问题。
首先是及时性。现行规定甲类传染病必须在2小时内,乙类传染病及丙类传染病须24小时内上报。然而,医生填写传染病报告卡信息需要花费较多时间,遇到就诊病人多时,就很容易出现疏漏造成没有及时上报,这样就会导致传染病的迟报和漏报情况的出现。
其次则是传染病报告数据的完整性和准确性。目前多数医院挂号系统中并没有完整的地址及电话等信息,在填报时无法满足传染病报卡对病人信息完整性的要求。医生只能现场询问并录入,过程耗费3-5分钟时间甚至更长,让人颇为头疼。
医生对传染病疫情是不是有足够意识也影响到传染病的监测。在疾控直报专网的传染病报卡中有“不明原因肺炎”的选项,实际上可以对应早期未明确的新冠肺炎。现实情况则是医生基本上都没有选择此项选择报告,因为上报就意味着后续需要完成一系列登记填表及调查工作,对于他们是额外的负担。或者,即使知晓有此选项,但缺乏明确的诊断也不敢轻易上报或无法通过现有系统的规则进行上报。
目前医院的传染病监测报卡系统不够智能、对医生的干预方案不够有效、医院传染病疫情管理部门对传染病迟报漏报筛查耗时耗力,这些都是传染病监测无法做到杜绝迟漏报的客观因素,也是传染病监测中的痛点所在。长沙双数科技经过熟练的实践,认为这些痛点可以利用大数据解决。
双数科技传染病疾病智能监测方案运行逻辑
在双数科技的传染病疾病智能监测解决方案中,首先汇集EMR、LIS、EMR及PACS四大系统诊疗数据,再运用双数传染病专家知识库、语义分析技术,对诊疗数据进行传染病疾病相关特征提取、标记。其后,使用传染病疾病分析模型对特征进行分析比对,从而认知传染病。
一旦认知到传染病病例,系统即时推送或延迟推送到具体医生电脑前端,并可强制锁死系统要求医生必须完成重要的传染病报告。
从实践来看,医生的确在初期不熟悉操作的情况会有一些微词;但是在医生填报卡过程中,双数利用大数据+人工智能技术实现了传染病的高精准认知、待报卡信息的自动提示、病人信息的自动填充、地址信息到街道的智能解析认知和重复报卡的自动去重等一系列优化方案来实现明显的效率提升。最后,医生对此都予以接受和认可。
这一传染病智能监测解决方案还实现了关口前移,把疾控直报专网上报的校验逻辑全面前移到医生填写传染病报告的阶段。校验不过就完成不了上报,这样就有效解决了报卡完整性和准确性问题。
医生完成报告传染病报卡后,数据完整准确的传染病报卡经医院传染病疫情报告人员审核后再上报至疾控直报专网,也解决了及时性的问题。
双数传染病监测平台(所有显示仅为展示,不代表任何实际意义)
在解决医生传染病报卡的基础上,双数科技进一步实现了从医院内网至疾控直报专网的一键直报功能。2017年5月,中南大学湘雅医院利用该系统实现了传染病报卡医院内网一键直报功能,耗时不到3秒。这在当时也是极个别可以实现内网直报的案例。
目前除了湖南省的中南大学湘雅医院外,重庆医科大学附属儿童医院和贵州遵义医科大学附属医院均已采用内网一键直报的方案。
根据统计,利用大数据和人工智能的双数传染病监测方案可以将杜绝迟报漏报的有效率做到95%以上;将医生的平均传染病报卡所耗时间从以往的5-8分钟大幅降低到40秒以内;疾控直报专网上报所耗时间也从2-3分钟缩短至几秒钟。
事实上,武汉大学中南医院也刚刚在去年采用双数传染病监测方案,并在后续的疫情报告效率上体现出了优势。不过,在突发性的未知传染病早期预警上,双数科技认为对单个医院的数据分析的结果、在说服力还是相对不足。
相对而言,双数科技认为区域一体化传染病疫情预警监测方案是应对区域重大传染病最好的建设方案。目前,双数科技已经完成了区域一体化传染病疫情预警监测方案的研发,已经在其他省市加快部署计划,希望能为中国整体的传染病信息化进程探索新模式。
不要忽视院内数据快速采集,大数据运营需要可视化
随着疾控上报流程的理顺,疾控信息的上报变得简单了不少,但多数医院对于他们身边正在处理的患者数量、确诊疑似病例分布、内部科室人员配比、排班情况和防护物资等状况反而难以获取全貌。通过Excel打印纸质表单手写统计这种落后方式不得不重出江湖。
低效的数据工作给一线医护人员的工作带来了不少负担和危险,也让管理者难以获得全貌。主任和院长无法进行快速调度,甚至影响了正常排班。上海华山医院张文宏主任“让党员先上”的做法赢得一片喝彩,但其背后的原因之一恐怕也是因为紧急时刻使得理想的调度流程出现了问题。
实际上,绝大多数医院依赖厂商的服务,本身缺少快速开发数据采集和处理数据的能力。一旦遇到突发情况没有办法处理,信息化系统就变成了摆设。在不得已的情况下,手写表格也就变得可以理解。
根据帆软从医院获取的反馈,医院内部在疫情期间的数据堵塞点非常多,主要分为填报微系统、报表自动化和管理型数据应用三个方向。
填报微系统是疫情期间医院的最大需求之一。医院的信息系统已经相当复杂,但现有信息系统的功能大多是围绕医院常规运行设计,对于很多可以运营的数据并未做额外采集。这导致许多临时性需求数据无法采集,一旦厂商工程师因故无法及时现场响应(比如疫情),医院基本只能抓瞎。
填报微系统主要就是为了将医院日常可能通过Excel进行收集的部分数据,或者将突发性、临时性的数据进行采集保留到数据库中以备紧急情况下使用,比如疫情中医院防护物资的临时管理。
第二个需求则是自动化报表业务,目的就是为了让医院从复杂繁琐的报表任务中解脱出来。同时,自动化报表还能够结合医院自身情况快速调整和修改。在疫情过程中,自动化报表在降低医院工作负担上也发挥了不小的作用。
第三则是管理型的数据应用。通过采集医院EMR、HIS和LIS系统的数据,并与填报微系统采集的数据结合,很方便就能给医院管理者提供目前医院的运营状况和指挥发力点。
在这方面,帆软经过对长期实践经验的总结,为医院提供了多种填报微系统及自动化报表的模板,包括物资处理、健康状况报告及远程办公数据统计等多种医院运营指标模板,可对医院工作量、防护物资总览及疫情动态等三个方向共计数十个指标进行填报,解了医院的燃眉之急。
说到大数据的应用,多数应用的推广都离不开数据的可视化。除了常规的柱状图、折线图、饼图之外,疫情地图始终都是最让人关注的部分。这并不是最近才兴起,早在1854年,英国麻醉学家、流行病学家约翰·斯诺(John Snow)对伦敦西部西敏市苏活区霍乱爆发的研究被认为是流行病学研究的先驱。
当时对于霍乱的认识并不多,甚至认为是由空气传播。斯诺统计了每户病亡人数,并在地图上予以标注。分析发现,大多数病例的住所都围绕在Broad Street水泵附近,结合其他证据,斯诺认为病例与该水泵的水被污染有关,于是关闭了水泵,霍乱得到控制。人们也从此认识到霍乱是由水源传播。
尽管当时的医疗水平还难以应付霍乱,但运用数据可视化则可对疫情有效地加以控制。斯诺正确地选择了地图,而非其他图表,从而使得统计分析变得一目了然。数据可视化的作用由此可见一斑。
帆软的门诊监控看板(图片由帆软提供,显示仅为展示,不代表任何实际意义)
帆软在数据可视化上的专长也在疫情防控中发挥出来。它的数据报表可视化工具可将医院信息系统获得的数据以及填报微系统抓取的数据结合,生成可视化大屏看板,方便医院管理者能够面对复杂的数据做出及时准确的决策判断。
望海康信于2月4日紧急上线的应急物资管理系统除了在不到20天时间内帮助140家医院完成紧缺物资对接外,也通过大数据和数据可视化对全国医院整体物资状况进行了统计分析。
望海康信应急物资管理系统注册情况(截至2020年2月23日,图片来自望海康信HIA大数据平台)
由望海康信HIA数据服务平台发布报告中的可视化图表,可以轻易发现由于各地均派遣了医疗队前往湖北省支援,医院物资紧缺状况并不局限在华中地区,而是遍及全国。
疫情期间各省市援助武汉医务人员情况(截至2020年2月15日,图片来自望海康信HIA数据平台)
通过人员调派图上,也可以看出全国各地医疗系统对湖北省的支援情况。以截止2月15日的数据为例,江苏省累计派出医务人员3182人,是当时最多的,但其占全省医务人员总数的比例大约在4%左右,显示了江苏省雄厚的医疗资源。
相对而言,宁夏自治区累计派出医务人员536人,但其占当地医务人员总数的比例已经达到8.62%,是当时所占比例最高的。这样的可视化数据对于管理者统筹资源进行决策有着决定性的作用。
大数据还原城市疫情全貌及舆情,改进疫情防控流程
将医疗小数据与各式各样的大数据结合,就能够创造出不少实用的抗疫数据应用:同行航班查询、同行车次查询、周边社区确诊查询、疫情全国分布等等。这也是本次疫情中最为直观且大家最为关注的数据,很多医疗大数据企业都在其中发挥了不小的作用。
在疫情期间,各地都建设了新冠肺炎疫情监控大数据平台、发热门诊监测大屏及新冠病毒医学观察者管理平台,为公众及政府提供疫情分析报告。
疫情监控平台利用大数据技术构建城市及区域的疫情动态热力图,有助于还原城市疫情发生全过程以及疫情防控流程的改进。利用智能分析及预测,为政府决策、应急管理、资源调度、重大事件研判及预测提供直观的支持,助力决策者基于关键的数据及动态变化了解区域内应急事件的发展情况及态势、以便迅速做出决策。
大部分的监控平台看板可动态显示着确诊病例变化情况、不同类型的累计病例、确诊数量的预测、疫情发展趋势对比分析、RT指数、RT变化趋势、治愈率情况等最新信息。区域医疗平台建设比较完善的地区还可对当地医疗机构进行多维度动态监管。
发热门诊监测大屏可与区域内发热门诊的对接,通过大屏方式实时监测区域内医院发热门诊的情况。还可实现风险预警,可以直接弹出提醒,确保医务人员安全。
当然,疫情防控指挥平台不单应该关注与疫情相关的直接信息,舆情也应该成为关注的重要对象。在本次疫情初期,各种信息混杂传播,一时让人难辨真伪。其中,有的是无意识的错误信息,有的则是别有用心的谣言。这些消息挤占了大量的通道,使得真正需要获得帮助的求助信息被掩埋到了垃圾信息中。
为了及时发现并澄清谣言,推动真相和正能量的传播。清博大数据平台在疫情期间上线了“疫情谣言粉碎机”,可以综合了解媒体、专业机构以及专业人士已辟谣的相关信息。助力为民众提供可靠的辟谣信息,减少民众的疑虑和恐慌。
清博协助“雷火研究”志愿者完成舆情材料共约50多份。自1月30日起每日编撰《疫情舆论汇编㊣雷火明书》,内容均选自当日与疫情相关的最新消息。其中,基础版截至3月2日共公开发布32期,旨在为政府和企业决策者、媒体和互联网报道者、海内外研究者提供参考。
除此以外,大数据技术更为重要的是可以从蛛丝马迹中发现和挖掘求助信息。清博大数据在疫情期间利用大数据对舆情进行了挖掘和汇总,对包括微博、微信、抖音、快手、论坛及帖吧等社交工具上发起的新型冠状病毒肺炎网络求助行为方式和传播方式进行研究。
通过将网络求助信息进行数据清洗、语意分析及特征提取,将非结构化的文本信息进行结构化的信息抽取;并利用指标模型设计和策略优化,将网络求助信息进行自动分类,将求助信息分为紧急求助(涉及生死类)、重要求助(比较重大的求助)及常规求助三大类进行汇总并转交相关部门。工作人员则会进行下一步的信息核实、救助实施和救助后的回访。
截止3月2日下午,清博协助“雷火救援”志愿者共计收录求助信息3157条,累计通过各种手段回访2572人,共协助救治1693人。
根据清博大数据的统计,疫情期间整体的舆情趋势陪随着疫情的防控呈现一波三折的情况,并在1月28号达到顶峰,随着之后疫情的有效防控,舆情热度逐步下降。
值得深思的是,在互联网和移动互联网如此发达的时代,部分区县的执行部门的互联网意识不足,对各种网络平台上的网络求助信息重视程度相对不够,有较大的提升空间。
清博大数据的舆情大数据(图片来自清博大数据,显示仅为展示,不代表任何实际意义)
因此,清博大数据计划在未来将本次针对疫情研发的网络求助发现及挖掘系统持续更新,使其更为通用并可以向公众开放。为政府和社会应对各种灾难事件提供力所能及的技术支持。除了方便决策者进行资源调度,也方便求助者能够找到附近可用的资源自救。
大数据+人工智能助力诊前初筛,患者医护皆安心
本次疫情发生时期正值冬季传染病流行期间,尤其是与流感的初期症状颇为相似。这让数量更加庞大的普通流感患者陷入了两难境地——以往只需前往医院做个简单的检查,现在却不敢去医院了,放任不管又担心是新冠肺炎。基于这种需求,很多互联网医疗企业都开通了远程门诊、预问诊或线上自诊分诊。
大数医达19年疫情爆发前就为江苏省卫健委承建了健康通APP,除了常规的在线远程问诊和分诊寻医问药,也在疫情期间紧急上线了基于人工智能的自测,在疫情期间针对新冠肺炎的病征进行了升级。这一功能在处于疫情中央的湖北省也起到了很大的作用。
作为全国支援湖北省计划的一部分,江苏省派出了732名医生支援湖北省黄石市。远程在线系统也被用于支持黄石市居民的线上问诊,其中便包括了基于大数据和人工智能的常见病自诊模块。
线上自诊分诊模块提供了一些用于症状初筛的问题,将其转化为每个患者的微病例,从而帮助远程问诊的在线医生预问诊。线上分诊到对应科室的医生在打开患者的图文咨询或者视频咨询之前,人工智能已经将对话结构化,包括之前个人输入的信息,比如说患者的年龄、身高、体重、高血压病史、是否怀孕等等,并将整个信息直接汇总。
医生在接待患者的时候就能够直接看到微病历,并根据判断直接提出一些更深入的追问,极大地提升了问诊效率。
同时,由于打通了各个数据平台,一旦居民被初筛人工智能定义为疑似或者高度疑似,疾控部门也将会抓取到这些数据,并对此进行分析和采样。通过观察高度疑似病例是散落各地或是地区聚集,从而做出分析预警和判断,实际上也起到了疫区强化防控的作用。
大数医达给江苏卫健委开发的互联网医院平台已顺利对接江苏省68家互联网医院和近20家健康医疗平台。截止2月12日,系统获数十万居民和疑似患者点击自测。每天约数百次到数千次调用次数,最多的一天曾被调用7000多次。
同时,大数医达也与合作伙伴一起开发了基于5G和人工智能的机器人,可以对发热病人提问初筛,并进行测量体温、测量血压及血氧等动作,随后根据具体情况进行追问,再将病人进行分诊。一旦有高度疑似新冠肺炎患者,则通知医院进行处理。
这一智能机器人在武汉及上海的两家医院分别试运行了接近一个月的时间,最高峰时一天曾完成了360多例初筛,极大地缓解了疫情爆发时的医院压力,同时减少医护人员的感染风险。
运用大数据思维,帮助基层安全高效实现人员管理
除了来自医疗系统的数据,来自医疗系统外的数据,尤其是基层社区一线的数据在本次疫情防控排查中也发挥了巨大的作用。
不过,基层排查在初期的运行效率并不高,很多地区采用纸质填报,再录入系统,消耗了大量时间和精力,且效果不佳。这种“表格抗疫”间接反映了疫情防控中的薄弱短板,效率低、也缺乏相应的技术手段,数据多头来源互相打架的现象一度颇为严重。
随着时间的进展,以及中央的指导,大数据思维及技术开始被运用到基层。
厦门市思明区早在1月下旬即开始着手开展疫情防控,考虑到当地行政区域狭小,外来人口居多,节后返工潮将造成较大的防控压力,出于公众返程中疫情联防联控的迫切需要,区政府需要短时间内能够开发完成,并快速部署上线的重点人群健康管理平台,进一步提高基层社区疫情防控工作效率。
智业互联(厦门)健康科技有限公司(下文简称智业健康)借助互联网及云计算技术,在短时间内开发完成火烧云健康管理平台,并迅速上线。这也是福建省首个重点人群健康管理平台。
利用该平台,辖区内居民及返程人员都可进行个人健康申报,自行在线信息登记和体温登记,提升重点管控人群的信息采集效率。辖区企业则可在线进行企业信息登记及员工健康数据登记及跟踪,方便企业及时了解员工状况,协助辖区政府做好疫情防控。
在填报过程中,平台支持单账号为家庭成员登记信息,并可选择所辖地区归属登记,方便后续社区人员上门随访。同时群众了解到周边疫情相关线索后,可针对身边可能存在的疫情隐患或违规行为(如可疑人员流动、群众聚集活动及制假售假等)联系线下社区卫生中心及社区街道进行上报,协助及时排查疫情隐患、遏制哄抬物价等违规行为,便于社区汇总管理。
为了防止瞒报漏报以及基层工作人员的疏漏,健康平台在填报时需要获取手机的地理信息,并由基层人员拍照留存。同时,平台在信息采集端采用了大数据思维,填报信息严格采用省级统一表格,提高数据的标准度,以便支撑区域大数据平台。
平台目前正在接入当地互联网医院发热门诊在线咨询服务,减少线下就诊时的交叉感染。
基层医生及社区工作人员在线下进行摸排随访时,则可以利用该平台一次完成跟踪对象信息采集和体温登记,同步提供在线体征数据跟踪,从而将基层人员从表格填报中解放出来,有效减轻基层工作人员工作压力,提升疫情防控效率。
同时,平台也提供了后台管理功能,方便各级政府管理人员和企业基于各自权限下在后台实现人员登记信息及数据查询统计。
智业健康火烧云健康管理平台(所有显示仅为展示,不代表任何实际意义)
目前,思明区的健康管理平台共计录入了22万人,其中包含4500家企业归属企业的6万员工,利用该平台将其中6000人纳入重点管理,有效降低基层人员的工作压力,提升了防控效率,从而降低了当地的防控风险。
接下来,该平台还可以为教育系统对学生进行单独的健康管理以应对复学高峰。同时,平台也正在更新功能以便实现诸如扫描身份证自动填报及人脸识别等后续功能迭代。
在疫情中心武汉市也有类似的密接管理平台。由于疫情中心的缘故,当地的疾控工作承受了巨大的压力,急需通过科技手段提升工作效率。和其他大多数地方一样,武汉市与确诊患者密切接触人群(下文简称密接人群)的排查最初都是通过原始的纸质问卷进行询问,然后录入到电脑。
这一模式不仅效率极低、容易出错,且数据周转周期长。在武汉市,每一秒钟的浪费都有可能意味着潜在的聚集性爆发。为了解决这一棘手的问题,在流调领域有所特长的易侕科研团队为武汉市疾控中心定制了EDC流调系统,并火速在一周内实现上线。
该系统可对武汉市当地密接人群进行管理,在获得大数据平台汇总提供的密接名单后,系统会将名单导入密接管理系统,按区入库并按照社区网格分配相关信息。基层密接组流调人员在上门排查时可以直接在手机上使用系统进行询问。
数据填写后即可及时上传至疾控中心,并生成图形化的界面和报表,疾控相关人员可以及时看到更新后的数据,并能更直观方便地分析数据。这一系统大大提高了当地疾控中心密接信息的流传效率,也极大地减轻了基层社区工作人员的汇报工作。
整个密接上报的实际流程为社区网格员-街道卫生服务中心-区疾控-市疾控-省疾控,各级别人员需要的报表和功能各有不同。为了满足这一需求,易侕团队在既往系统基础上快速开发了定制化报表和数据导出的功能,精确按照各级别数据权限进行报表,最大程度提高了各级单位的汇报效率。
基于大数据思维,密接系统包含了三层数据过滤功能。首先是前端录入标准化,从最开始过滤不合理数据。其次,易侕团队应用了既有的易侕数据管理人工智能,通过对现有数据范围进行动态学习,对可疑数据进行自动提醒勘误;最后则是配合人工审核,可对数据进行抽样,审批,以保证提取数据质量,从而为大数据平台应用数据起到了帮助。
截至目前,易侕EDC密接管理平台覆盖武汉市全部行政区域和集中隔离点,共计700多名疾控和社区服务人员使用,累计管理了8万多人次密接人员数据。同时,当地疾控部门也在申请连通居民身份系统,从录入源头上一次性完成全部数据的对接,将密接、流调、居住信息及社会关系等全部数据打通,更大程度地发挥数据价值。
大数据建设,不要将原本打通“信息孤岛”的初衷变成更多的“信息孤岛”
一个事实是,在近年来如火如荼的卫生信息化建设中,公共卫生信息化建设进度明显滞后。疾控直报专网主要还停留于各类传染病信息报告,使用权限基本都在国家层面,省市县各级都无法利用数据,无法形成及时、有效的分析结论。
同时,各级疾控中心所涉及的包括疾病监测、预防接种、卫生应急管理等工作目前均未能建立起上下联通的信息系统。
尽管各地都在投入建立大数据平台,但目前各地推动的国家全民健康基础信息系统与疾控机构信息系统南辕北辙,无论在基础信息收集、录入、标准使用及管理部门等均分离推进,更未建成统一高效的公共卫生信息平台。很多数据无法有效利用。
坦率地说,各部门各地区都在各自为战。如果没有顶层统筹设计及推动,原本为了消除“信息孤岛”的初衷,未来说不定会打造出更多的“信息孤岛”。
对于这一潜在的问题,业界专家们都认为有必要就大数据建设进行统一规划,标准统一,以便不同平台能够有效对接,不要打造出更多的“信息孤岛”。与此同时,还应该尤为关注数据的有效运营,应用要落实到具体的业务场景。否则,费尽心力采集的大数据大而无用,也就抵消了其应有的作用。
写在最后
我们要清醒地认识到,尽管这场抗疫战役中有不少可圈可点之处,互联网+和大数据应用如火如荼,但也暴露出我国疾控体系信息化水平亟待提高。
中华预防医学会新型冠状病毒肺炎防控专家组多位专家联名在《关于疾病预防控制体系现代化建设的思考与建议》一文中指出,公共卫生大数据及信息系统是疾控体系现代化建设的重要组成部分,也是提升公共卫生服务能力的重要手段和依托。
未来,我们应该基于国家全民健康基础信息化建设,依托公共卫生服务体系的改革和完善,深度融合医疗服务、公共卫生基础信息,运用区块链、大数据、人工智能、云计算、物联网等技术,紧密围绕“精准全维度大数据实时采集体系”、“疾病监测与流行规律人工智能深度学习体系”、“大数据云计算智能预警预测体系”和“应急保障统一资源管理和调配体系”,在常态化监测、疫情预警处置、趋势预测研判、传染源追本溯源、资源调配和防控救治方面发挥重要支撑作用。
依托国家全民健康信息平台,以电子病历、健康档案以及全员人口数据库为基础,在信息安全、标准规范、运行维护保障体系支撑下,健全和完善覆盖全国的疫情报告监测预警及其公共卫生突发事件信息网络体系。构建公共卫生云平台及疾病控制业务应用系统,实现疾病动态监测预警处置、儿童接种疫苗的全流程管理、健康危害因素监测与评价、职业健康、妇幼保健、综合监督服务等一系列基于平台开展的业务应用。
通过公共卫生云平台,建立面向公众的公共卫生信息服务,让老百姓真正体会到信息化带来的便利,从而提升公共卫生服务的及时性、便捷性和公平性,提高群众的满意度。
【注:感谢以下嘉宾接受采访并提供相关信息(排名不分先后):帆软数据应用研究院-郑伟、长沙双数科技有限公司创始人兼总经理-李诗勇、大数医达首席运营官-缪苗、易侕科研CEO-赵广、智业健康开发总监-庄城斌、望海康信品牌与市场部总监-喻瞳、清博大数据总裁助理-柳春阳。】
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App