赛福基因:打开基因检测万亿级市场之前,有三大难题必须攻克
赛福解码(北京)基因科技有限公司(以下简称 赛福基因 )是一家围绕基因数据分析和解读的 精准医疗 服务商,提高临床的诊断准确率和治愈率。当前主要业务方向为包含癫痫在内的神经系统遗传性疾病。致力于搭建基因相关 大数据 智能解析平台,并通过连接前端 基因测序 和后端的临床诊疗,融入自动化和 人工智能 技术,让基因数据的解读更加标准、高效,以一体化的产品形式为临床医生提供准确的诊疗依据,提升患者的临床获益。近日,亿欧到访赛福基因北京办公室,同创始人 余伟师 就基因测序和基因数据挖掘技术的现状进行了沟通。
精准医疗≠基因测序
在聊基因检测之前,余伟师先解读了大众对于精准医疗以及基因检测的误会。
首先,精准医学不同于精准医疗,差异体现在“学”和“疗”,也就是科研和应用,这也反映出当下精准医疗发展的进程, 实际上大部分工作还停留在科研的层面上,深入临床诊断治疗的部分还很少 。
其次,精准医疗和基因测序不可以划等号,精准医疗简单来说可以划分为精准诊断和精准治疗两部分,而这个精准是一个逐步的过程,是一种方法学的精准,而不是一个口号。只有懂得用更精确的方法来面对医学上的各种问题,才有可能开展更多维度和精细的研究,找到疾病之中最精准的机制,从而有更多的证据帮助临床医生更快做出决策,然后找到最精准的药物。
而基因测序只是实现精准医疗的核心技术手段之一,通过对个体的唾液、血液或其它组织中的基因进行不同方式的测序获取相关的数据,而这些数据需要被有效挖掘并进行生物学意义的分析和解读,才能被用于医学研究或者临床诊断,赛福团队专注的正是解读这个环节。 余伟师解释到,片面的基因信息对于临床的诊断和治疗还存在很大的距离,这些信息只有和临床的数据充分结合,从多维度进行理解和判断才能高效指导临床,否则既无法支撑诊断,更无法支撑治疗效果。
在基因检测技术发展初期的前提下,创业公司的优势显现,赛福基因希望成为基因检测数据与患者临床表型之间高效结合的催化剂,辅助临床医生快速精准诊断,并为个性化治疗方案提供依据。
基因检测的三座大山
但是,要具体了解赛福基因所做的事情,必须要先了解基因检测技术的发展现状。
余伟师告诉亿欧,当前基因测序的主要应用产品集中在无创产前检测和肿瘤的靶向药筛查,以及新一代测序在临床科研中的推广,基因大数据还没有能够深入到临床诊断和治疗中,只是停留在精准医学研究当中。当然这里涉及到几方面的原因:
第一、核心数据库建设不完整。 首先,目前人们对基因的认识程度只有不到3%,可挖掘的数据量巨大。其次,对基因数据的精准、有效分析和解读也不仅仅是基因层面的分析和解读,所涉及的数据库也不仅是基因数据库,还需要整合大量的其他关联数据信息,比如已建立的基因与疾病的关联数据库,基因与药物的关联数据库,以及临床表型与治疗相关的数据库等等。而当下,中国这类关联数据库并不健全,甚至没有属于国内自己的数据库可用,国内的基因公司一般都需要使用国际数据库作参考、比对,有的也会使用到亚洲人的数据库,从人种差异上来说更接近。
第二、专业和深度的基因数据分析和解读人才稀缺,成本高,效率低。 基因数据的“精准”和“有效”解析仰赖的并不是某一单一学科的专家,而需要一个多学科、跨领域的专家团队,如分子/医学遗传学、生物信息学、分子生物学、统计学等,要组建一支数据解析团队需要耗费巨大成本,对于大部分医院和医疗机构是不经济的。同时,这种多学科的交叉配合,不仅在解读本身上,即使在算法、流程的调试、优化、整合上,也存在着效率较低的问题。
第三、临床脱节严重。 这里的临床脱节严重不仅是说很多临床医生没有深入了解过基因测序,不知道基因信息该如何使用、有什么价值。更重要的是,大部分基因检测公司在进行基因信息解读过程中并没有充分考虑到临床信息的有效结合,如临床表型结合、专家经验认知结合、其它已知临床信息结合等等。这是一个真正跨领域的难题,大部分临床医生很少接触基因测序,大部分基因测序公司又不懂临床,这直接导致了基因测序还只是停留在科研层面。
借助人工智能建立完整诊断流程
在余伟师看来,以上三个痛点,解决绝不能点对点完成,而是需要通过一个成熟、完善的体系去整体解决。而要达到数据的完整解读,需要在基因数据生物信息分析的基础上再经过层层过滤,与临床信息密切结合,辅助深度解读,生成医生可直接执行的报告,而不是直接做简单的数据评估工作。
因此前期凭借专家多年的经验和知识体系来做解读,是工作流程的第一步,而赛福团队借助自主研发、整合的数据库和算法逐步开发自动化分析流程,在报告解读过程中,通过机器学习进行疾病预测模型的参数训练,从而实现每一个疾病病种的人工智能化建模,以提高效率、降低成本。
具体来说,一方面基因数据解读需要建立关联数据库和中国人自己的数据库。 2016年,赛福完成了相互关联、对应的疾病、基因、药物三大数据库网络的自主构建,其中包括11000多种疾病相关的基因与基因突变位点信息、10000多个功能基因、数万个生物标记物和数千种基因相关药物以及上百种癌症相关基因。
另一方面,基因数据解读要运用现有科学技术,如自动化、AI等,与交叉学科科学家团队结合。 完成对基因相关各类测序数据算法、流程、关联性的调试、优化、梳理和整合,构建数据知识关联图谱,完善数据关联性自主推理体系,最终建设数据智能解析平台。目前,赛福自主建立的数据智能解析平台已经搭建完成,以关联数据库为底层支撑,集合临床有效信息,相较传统解析速度提升50倍,降低致病性变异预测误差率19%。
据赛福基因透露,公司合作医疗机构包括:美国克利夫兰医学中心、俄亥俄州立大学医学院、美国国立卫生研究院、北京协和医院、北京大学第一医院妇产儿童医院、北京大学国际医院、北京大学肿瘤医院、北京安贞医院等30余家国内外著名医疗机构和科研单位,在罕见病、癌症、单基因糖尿病以及由多基因引起的心血管疾病上展开了深入合作。其中, 作为赛福基因的主要研究方向,由赛福自主研发的应用于包括癫痫在内神经遗传病临床的产品,上线仅半年,获取病例数百例,其阳性检出率可达60%,较市场上基因包10%的阳性检出率高出6倍。
重磅福利!【 2017中国互联网+新商业峰会 】, 6月15-16日两天3000人次,携程创始人梁建章,嘉御基金创始人、前阿里巴巴CEO卫哲,分众传媒创始人江南春等嘉宾已确认出席,期待你的参与, 限量钜惠 票 等你拿!
本文作者宋少卿,亿欧专栏作者;微信:zzb0930(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。