图片文字识别的黑科技,怎么走进移动医疗?
记得在一篇讲述黑科技的文章里,曾经比较过专业计算机和普通计算机。所谓普通就是大家正在使用的这种电脑,功能复合实用,并没有所谓一技之长。但专业型计算机就不同了,根据某种痛点,强调某种计算能力,不断迭代形成更高更垂直的技术壁垒。
这件事, 拍医拍 也想干。基于自身的图片文字识别技术(OCR),团队打算从数量多、标准化高、可操作性强的化验单入手,逐步扩大至B超、药品清单、病例、处方单等单据,做“就医信息电子化”,最终达到患者有效数据搜集的目的。
与其他院中+院后产品不同的是,团队并不想成为复杂的医患服务连接者/提供者,或者类似病历夹的工具/工作台,而是先做一个纯技术导向的公司,专心研究图文识别技术,把精准度提高。
团队申请的专利有:
1.基于机器学习的医学单据版式分析技术;
2.针对医学领域的多字符集图像文字识别核心;
3.基于递归神经网络的医学词向量后处理方案。
创始人诗展认为,现有的图片文字识别技术,还是处于机器+人工阶段,需要大量人力在背后筛查匹配,成为量化工程的一大“障碍”。当然,这里也需要强调,就算是再牛的技术,也无法做到100%准确。
于是越求精准,就意味着更大的样本和更长时间的学习。在C端,拍医拍通过云端自动“解读”服务来吸引C端用户,如上图显示的指标异常提醒,帮助患者前端先了解病情。产品六月上线,C端用户数量36氪会跟踪了解。
另外一方面,现在市场上大量的医患、病例分享/分析型产品也可能成为其潜在合作伙伴,也会包括一些有需求的医院或者网上医院,甚至辅助完善地区第三方医疗数据库。如果有可能的话,团队希望将医生判断、治疗方案与化验单结果结合起来。
但大家不禁要问,为什么拍化验单等等行为,会成为一种需求?
- 在特殊的医疗体系和环境下,国内公立医院病例信息不外传几乎成为一种常态。大到医院派系,小到合作医院抱团,都想把最有价值的信息掌握在自己手中,更何况还涉及到学术研究成果。
- 同时,医院信息化技术做的到底如何,信息录入是否完整也需要打个问号。相反,最容易被带出的数据就是用户手上的纸质档案了。
但,这种需求是持续的吗?
从大环境来看,电子化病例和多点执业是未来大趋势,前者会逐渐淘汰纸质数据,后者则会引导病人和病例外流,很有可能拍化验单这样的事情会不复存在,但从目前发展速度而言,确实不知道还有多远。
不过对于团队来说,未来利用自身的技术和数据样本,完全可以在环境开放之前就挖掘出潜在需求,结合医疗专业做出更高门槛的技术服务,乃至医疗服务。
创始团队中有原百度、好大夫数据和医学专家,已经完成天使融资,目前也在洽谈新一轮融资。
原创文章,作者:Leah