医学数据科研——数据手动录入
编辑导语:如今随着科技的发展,医院里的很多种方式都使用互联网系统的方式进行,比如病人病历的记录,以前用本子,现在用数据库,查找起来比较方便;本文作者分享了关于医学数据科研中的数据手动录入,我们一起来了解一下。
一、背景
三甲医院由于其具备顶尖的医疗资源,会吸引疑难杂症的患者前去就诊,该部分患者所患疾病多为稀缺疾病,专病科研数据库由于疾病的稀缺性所以数据库内数据量较少。
在某疾病方向上,截止到2019年全国共有1516家三甲医院,现阶段约有600W份病例,每年仍将以30万的速度增长。
对于医院而言,这些数据为本院的医学科研提供了数据基础。
医学科研,一方面可以提升本院的治疗水平,进而提高本院患者治愈率;另一方面可以增加本院的医学论文数量。通过医学科研,可以提升医院在该疾病领域的业界地位,提升竞争力,吸引更多的患者前来治疗,最终为本院创造更多营收。
但是由于历史原因,目前600W份的病历数据依然是纸质数据。
在数据搜索方面,纸质形式存储的数据,需要人工翻阅纸质病历查找。当数据量小的时候,数据量查找成本较高,但是人力尚可企及。当数据量大的时候,数据查找几乎成为不可能。
电子化存储的数据,数据查找效率缩短至秒级。
在数据统计方面,纸质形式存储的数据,一次只能被一个人查阅,并且容易损坏;电子化存储的数据支持多人同时查看,并且不容易损坏。
电子数据为科研提供了便利。所以需要将纸质的病历数据转化成电子的病历数据。数据手动录入是将数据转换成电子化的一个方法。
二、数据手动录入
指,由人工将读取到的数据,填入可视化的页面中,并将数据保存至数据库,将数据转换成电子数据的方法。
包括自定义表单生成器和录入数据两个部分:
1. 自定义表单生成器
由于每个科研的研究方向不同,科研所需要的数据不同,采集数据的电子表单也将不同。
如果每个电子表单都由开发人员手动开发,随着研究课题的数量增加,随之增加的是人工成本、时间成本,降低项目交付的效率,自定义表单生成器是解决该问题的一款工具。
自定义表单生成器,是一款用户可以根据自己需要自定义电子表单的工具。将生成电子表单的工作由技术人员转移至现场项目人员,甚至有可能将工具的使用方法教给客户使用。大大减低了企业生产电子表单的成本。
以表单“手术情况”为例,演示表单配置的过程,包括三步——第一步:创建表单;第二步:配置表单变量;第三步:选择控件并配置控件属性。
第一步:创建表单
创建表单时,需要根据表单所代表的业务含义设置“表单名称”为“手术情况”。
“表单名称”是表单的中文名称,命名方式一般是表单的中文名称,代表该表单的业务方向;具有可读性,不具备唯一性,主要用于用户在填写或查看表单时快速了解该表单的内容。
第二步:配置表单变量及变量控件属性。
假设“手术情况”表单有4个字段,手术执行时间、手术方式、麻醉方式、手术经过。以手术执行时间举例说明,配置表单的过程。
配置字段的变量名称:手术执行时间;设置字段的变量ID:operate_data。
“变量名称”是变量的中文名称,具备可读性,不具备唯一性,主要用于用户在填写数据时快速了解该变量的含义。命名方式一般是变量的中文名称。
“变量ID”是变量的英文名称,具备唯一性,可读性较差。主要用于系统识别字段。命名方式一般是变量的英文名称。
第三步:选择控件并配置控件属性
为变量“手术执行时间”设置日期型控件。并配置控件的属性,不同的控件需要配置不同的控件属性。日期型控件关键属性包括日期类型。
“控件类型”指的是该变量适合使用的控件展示。该控件用于用户在前端页面准确且快速的录入数据库需要存储的数据。
“日期类型”指的是日期的精确度。有三种日期类型,年月日、年月日时分、年月日时分秒。
通过上述的配置过程,可以抽象出来表单配置的三个步骤:
- 创建表单
- 创建变量
- 选择控件
创建表单:
根据业务情况,设置表单名称和表单ID。
创建变量:
为该表单创建变量,设置变量名称和变量ID。
选择控件:
为变量设置合适的控件,并填写控件的相关属性,不同类型的控件,需要配置不同的属性。
通过上述步骤完成其余变量的配置,完成整张表单“手术情况”的配置,最终前端页面效果如下图:
2. 自定义表单发布上线
配置完毕表单以后,表单处于一种草稿状态。而科研数据由于其科研的严谨性,科研数据无法经常变化,需要建立在一种相对确定的数据结构上。所以需要把配置完成的表单发布上线。
在系统首次部署时,发布成功以后,所有数据直接使用该表单录入数据。
系统在运行过程中,随着系统的使用,用户对表单的需求存在发生变动的可能性。此时,需要对线上表单重新编辑,然后发布上线。
由于历史数据拥有很高的研究价值,需要根据新的表单将历史数据进行清洗,以保证旧数据在新的表单结构下可以被使用。
3. 创建患者并录入数据
录入数据指的是,用户在前端页面以电子表单的形式将纸质数据录入到系统中,形成电子化的过程。由两个步骤组成,创建患者、录入患者数据。
1)创建患者
指,在系统中增加一个新的患者。将新增患者的操作由用户直接在页面上完成,使得没有编程能力的人也可以将数据插入到系统中,降低了用户往数据库中新增数据的操作成本。
对于创建患者所使用的字段,不同病种数据库,因为数据质量不一致和对数据安全要求不同,所以在创建患者时填写的字段也不相同。所以需要配置创建患者所使用的变量。
对于患者唯一标示,创建患者时,系统会自动生成患者唯一标识。但是为了再次创建患者时,能够识别出来患者是否存在。所以需要根据创建患者时使用的字段生成患者ID。如果患者ID的生成规则发生变化,需要对历史数据进行清洗。
2)录入数据
指,在系统中完善患者信息。用户在前端页面以电子表单的形式,完善患者信息。使得没有编程能力的人也可以将数据插入到系统中,降低了用户往数据库中录入数据的操作成本。
科研所需的数据质量高,只有经过审核,确认数据达到使用要求,才可以被科研所使用。需要对表单数据设置状态来表示数据是否可用,包括暂存、提交待审核、审核通过、审核驳回等。
手动录入的数据量较大,需要提高数据录入的效率。例如在设计表单时将数据分组分类;通过键盘快捷键快速切换变量;快速切换到下一页等快捷操作。
三、总结
纸质数据通过手动录入的方式进入数据库,由于人脑在处理数据上更灵活性,数据填充率相比于系统填写会比较高。但是数据录入的效率会低效。
可以通过以下方式保持高效率和高填充率:将病历分成不同模块,由专业的医学人员对非专业的人员按病历模块进行培训,数据录入的问题将转换成如何管理数据录入员的问题。
本文由 @申bobo 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议