【钛坦白】华大基因彭智宇:基因大数据,将带来巨大价值和市场格局变化

钛媒体  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

(本图由视觉中国授权钛媒体使用)

钛媒体注:本文根据钛媒体旗下的微信公开课“钛坦白”第18期分享整理。本期我们请到了来自动脉网蛋壳研究院、领医创造、阿里健康、艾科赛龙、华大基因、诺辉健康的钛客,跟大家一起“探究医疗健康产业的新技术、新方案、新方向”。以下是华大基因副总裁彭智宇的分享:

钛客:彭智宇,华大基因股份公司副总裁,全国首家遗传病专业咨询与交流服务平台“同并相联”网站创始人,Frontiers in Genomics Assay Technology学术期刊副编辑,广州市肿瘤贯穿组学研究重点实验室副主任。先后主持和参与了863计划、973计划、ICGC国际肿瘤基因组项目等重大科研项目。

分享主题:基因检测与大数据

下面是彭智宇在钛坦白分享的干货,由钛媒体整理:

什么叫基因呢?基因的英文是gene,翻译过来就是基因,生命的基本要素。这个词翻译的非常好,音和译是一样的。

基因有两个要素——遗传和变异。遗传就是我们常讲的“种瓜得瓜,种豆得豆”,而变异则指的是猪一窝生九个仔,个个都不一样。人和人的变异也不一样,高的可以像姚明一样很高,矮的很矮,但是在基因这个层面他们的差异不会超过0.5%。我们讲人不可貌像,基因可以决定拇指能不能弯,眼睛是单眼皮还是双眼皮,舌头能不能卷。

基因伴随着人的一生,有一个说法是生老病死大概50%和基因相关。从出生到衰老的很多疾病,比如说不孕不育、出生缺陷、肿瘤、代谢、心脑血管病等等,都和基因相关

那么就有人问了:“既然基因那么有用,为什么我们感觉不到呢?”其实这个问题很好回答。第一个人类基因组测定是在2000年,当时花了30亿美金,而且只测了一个人的基因组。当时计算机花费的成本很高,而且运算的性能还不如今天的手机,而今天测一个人的基因组只需要不到7000块钱。只有足够便宜,基因测序才能应用到生活中。

现阶段基因检测能为老百姓做什么?

第一个例子:无创产前基因检测,筛查唐氏综合征

生小孩的时候都会做产检。有一种病叫唐氏综合征,它伴有五官畸形、四肢畸形和智力障碍,目前没有很好的治疗办法,预防该疾病最好的方法就是产前筛查和诊断。以前,传统的唐氏综合征筛查是通过血清学指标进行判断,但是该方法假阳性率相对比较高,在高风险样本中的假阳性率达到98%以上。也就是说在高风险的人群中,有98%的疑似患者经过下一步诊断都不是唐氏综合征。确诊用什么办法呢?羊水穿刺。羊水穿刺是使用很长的一根针扎到肚子里面,收集胎儿样本,然后进行分析。这种检测方法虽然准确,但是流产的风险大概是1%。

有没有一个办法可以保证高准确率,又不会对孕妇和胎儿造成风险呢?这种方法就是无创产前基因检测。

1947年,科学家发现外周血中存在游离的DNA。1997年,香港科学家卢煜明发现在母血当中出现胎儿游离的DNA。以这项发现为基础,结合2005年出现的高通量测序技术,华大基因在2006年搭建了一个高通量测序平台,2008年开始做研发,建立了无创产前基因检测的方法。2010年我们启动了临床试验。

截止至今年3月,华大基因的这项检测产品的样本数已经超过了100万。目前,全球的无创产前基因检测样本数在400万左右,其中200万在中国,而这200万中的100万以上在华大基因。

第二个例子:明确致病基因,治疗先天性黑内障

对眼盲的患者来说,看得见可能是一个奢望,但是如果不是如果,而是真的可以再看见呢?美国的一个小男孩,在2000年出生的时候就患有先天性黑内障,8岁的时候全盲。在接受基因治疗一年之后,视力得到显著改善,可以读书和玩球。

基因治疗的前提就是明确致病基因。同样是先天性黑内障,另外一个叫凯文的小男孩,出生的时候就被发现有先天性黑内障的疑似症状,但是查了相关的17个基因都没有找到致病突变。他的医生在2011年的时候找到华大基因,通过跟我们合作,进行全外显子组测序,找到了2000多个没有被报道过的变异,这2000多个变异怎么样定位到最终的一个致病基因上,后面我会通过大数据分析的例子来说明。通过全基因组测序帮助医生迅速地找到了致病基因,相关的结果发表在Nature Genetics上。2014年7月,这个小男孩已经处于基因治疗的临床前阶段,这就是基因科技带来的新发现和新希望。

这样的疾病是怎么来的呢?父母都正常,为什么生下来的小孩会患病呢?下面这张图比较形象,他父母可能各携带了一半的致病基因,而人双份的基因,只要有一份正常,他就可以表现出正常。父母将各自一半的基因遗传给下一代,这样两个患病的基因就有1/4的可能会组合在一起。如果两个患病基因组合在一起,小孩就表现为患病。这就是遗传的机理,夫妇携带同一个致病基因,小孩就有1/4的可能性患病。

不要以为这些离我们很远。从科学的角度,每个人生来都携带致病基因。2011年,一项研究项目对448种单基因的遗传情况做了筛查。研究结果发现,每个人平均携带3-4个隐性杂和的突变基因。目前已知的单基因遗传病超过8000种。如果对每一种遗传病都做筛查的话,咱们钛坦白微信群里的每一个人必定都是致病基因携带者。只不过你跟你的另一半携带同一种致病基因的可能性会小一点,又加上1/4的概率,因此每个人都有患遗传病的可能性。所以在孕前或者是产前做好筛查是最好的预防和防控手段。类似的疾病有几千种,总的发病率大于1%,这个发病率已经远远超过了唐氏综合征1/600到1/800的发病率。

第三个例子:新生儿筛查,早发现早治疗

小孩在生下来之后,也有一些手段可以做到“早发现,早预防”。“千手观音”是我们比较熟悉的一个节目,其中有18个表演者是药物性致聋。药物性致聋可以通过新生儿的耳聋基因筛查提前发现。

目前国家强制做的两项新生儿筛查,一个是苯丙酮尿症,还有一个是先天性甲低。关于苯丙酮尿症,这里有一个例子。有一个小女孩在中国梦想秀里面表现特别好,歌唱得非常好。她有一个大他十岁的哥哥,由于没有做到“早发现,早预防”,智力还不如妹妹。所以,同样的疾病不同的治疗方案,得到的可能就是不同的人生。类似这种可以通过“早发现,早预防”的抗生素禁忌用药和疾病都有几十种。

第四个例子:切除乳腺,降低乳腺癌的患病率

跟肿瘤相关的故事,我们最熟悉的还是茱莉切乳腺。她切除双侧乳腺使其乳腺癌的患病率从87%下降到了5%。为什么要切呢?通过基因检测发现,她携带了BRCA1这个乳腺癌易感基因。当时很多人都说这是不是茱莉和基因公司联合起来的一个炒作。其实这个基因是在上个世纪末的时候,通过分析很多个乳腺癌患者的家庭发现的。那个时候还没有基因检测公司。是不是仅仅查BRCA1就够了呢?下面这张图大家看到,仅仅查BRCA1,甚至加上BRCA2都是不够的,它们仅仅解释了15%左右的原因。另外包括遗传性肿瘤在内的十几种病也跟基因相关。

女性两癌中的另外一个是宫颈癌。国际防癌组织公认:宫颈癌的发生和持续性高危的HPV病毒感染相关。这个科学发现在2008年的时候得了诺贝尔医学奖。宫颈癌预防的意义在于,从被HPV感染到发展成为癌症有五年到十年的时间,这个过程让我们有充分的时间去做好预防和干预。

那么已经得了肿瘤怎么办呢?有放疗、化疗,还有靶向药。截止至2015年5月,美国FDA公布的有基因标签的药物超过有166种。以前的肿瘤治疗是根据组织,比如肺癌、肝癌等;然后发展成根据细胞,比如鳞癌、腺癌;再到现在根据分子分型,其实就是根据基因的突变。比如同样是肺癌,不同基因突变有不同的药来治疗。同样的癌不同的治疗方式,叫同癌异治;还有异癌同治,同样是“赫赛汀”可以治疗乳腺癌也可以治疗胃癌,对应的都是HER2的突变,叫异癌同治。

检测手段非常多,可以通过组织去查癌相关的基因变异,也有最近特别火的液体活检,通过血液去查肿瘤的基因突变。

第五个例子:基因测序,快速找到感染源

除了肿瘤的例子,其实在病原感染上,基因测序也可以帮助医生快速地找到感染源。我们最近做的一个案例,是小男孩在干细胞移植之后反复发热。排除了各种的排斥反异,都没有找到病原体。于是用了抗生素治疗,但是也没有起到很好的效果。之后通过高通量基因测序快速地查出了是一个痤疮丙酸杆菌引起的发热。明确病因之后,针对性的用药使得小男孩的病情得到了控制。

还有一个是我们同事的小孩,当时因为川崎病进了医院,后来治疗得到了控制,出院前复查的时候都很开心。但是小孩出院后第二天开始全身发热,而且没有查出原因。之后通过高通量基因测序帮助迅速确定是“蒙氏假单胞菌”感染,这是医院内常见的一个病原微生物,针对性用药之后小男孩病情得到控制并恢复了正常。

上面举了五个例子,综合起来讲就是:贯穿整个生命周期,基因组医学都有相应的解决方案。从孕前、新生儿,到老年的过程,肿瘤、病原感染的治疗都有比较好的案例。这些就是老百姓们用得起的基因检测。

基因大数据扩展的价值在哪儿?

大产业产生大数据,基因大数据扩展的价值在哪儿?

先举一个23andMe的例子。这是一家提供个人基因检测的公司。公司寄给用户一个样品收集装备,用户将样品与收集管里面的保存液混合后再寄回公司。通过检测,公司会告诉用户疾病健康以及个体特征等信息。2007年成立的时候,初期的数据积累特别慢,后来爆发式增长,目前已经有超过100万的用户数据。可是一直以来该公司都没有找到合适的盈利点。2015年1月6号,Genentech宣布投资6000万美元购买3000万名帕金森病全基因组的数据,这些数据从原来的99美金一份变成了2000美金一份。这些数据可以用作新药研发,帮助找到靶基因。

另外一个例子是华大的无创产前基因检测,这100万的低深度全基因组测序的数据量是23andMe的很多倍,对应的我讲讲华大的无创产前基因检测能告诉用户什么。下面的结果是华大基因的金鑫博士的分析。第一个可以查的是孕期肿瘤,本来这个项目的设计是为了查胎儿的染色体异常,意外地发现通过检测也可以查孕妇有没有肿瘤。2015年的一篇科学研究报道:通过无创产前基因检测,可以发现母体的肿瘤发病率在3/4000。同样,我们通过华大自己的数据也能发现孕妇当中的肿瘤,下图中红红蓝蓝的柱子表示的是染色体异常。正常的孕妇其实不会有那么多异常,这提示的就是肿瘤异常,相应的数据也通过随访进行了相互验证。

除此之外,还可以分析耳聋和地中海贫血基因以省级行政区为单位的携带情况以及分子流行病学调查。结果表明: 耳聋致病基因在北方的携带率高于南方;而地中海贫血南方高发,北方低发,这也符合之前的预期。除了我们原来认为的两广(广东和广西)和海南之外,包括云南、贵州、湖南这几个地方携带率也很高。还有一个跟乳腺癌相关的,刚才提到的BRCA1、BRCA2这两个基因在东西方的频率差异到底是什么样子,以前谁也回答不了,而通过百万数据就可以回答这个问题。

人的血液里面只有人的基因吗?其实不是。通过下面这个数据可以看出,在人的血液里面还发现很多病原微生物的基因。

形象地来说,基因像一堆字母,随便找一个字母T是什么意思?这个是不知道的。如果足够幸运,另外一个人跟我的基因完全一样,只有一个字母T变成了A,而刚好我是正常的,另外一个人则是镰刀型细胞贫血的患者。我们可以讲这个T到A其实就是由正常变成了镰刀型细胞贫血的原因,但是实际情况远远比这个复杂。要通过大样本、大数据的分析才能揭示真相,任何两个人抓过来都有一堆不一样的位点。

大家应该还记得刚才讲的眼盲小男孩凯文,两千多个没有报道过的变异怎么一步一步缩小变成一个致病基因上的一个位点呢?其实就是通过比对大量的正常人数据库。正常人都有的变异其实跟疾病没有关系,剩下的才是跟致病相关的。以前的千人基因组数据,加上这个百万NIFTY数据库,组成了一个更大的正常人基因数据库。

精准医学和基因组计划

2015年1月20号奥巴马宣布启动“精准医学”计划,他对精确医学的定义是“精准医学是一种将个人基因、环境和生活习惯差异考虑在内的疾病预防和治疗的新兴方法”白宫的网站举了五个例子,第一个例子是一种罕见病,原以为是马凡综合征,通过基因测序发现是一种新的罕见病;第二个是一个明星2008年被诊断为白血病,他的家族有结肠直肠癌发病史,他的祖父和叔叔都死于结肠直肠癌,他做了家族病史分析,以此针对性的进行了下一步治疗;第三个例子和乳腺癌相关,其实就是跟茱莉的例子类似相关;第四个例子是白血病的T细胞免疫治疗,通过治疗,癌细胞消失;最后一个例子是囊性纤维化,2013年FDA以特别通道批准了新药,这个药是针对囊性纤维化的特定突变,患者在用药之后寿命得到了延长。

精准医学到底要做什么?最主要的基础是基因组计划,英国是10万基因组,美国是百万基因组。美国百万基因组计划的2.15亿美元分别分配在各个方向。相应的,我们中国到底做了什么?其实华大从1%人类基因组计划、10%国际人类单体型图计划,到第一个亚洲人基因组图谱,再到千人基因组计划,然后提出了百万人基因组计划。这些基因组研究的成果也是今天精准医学研究的一个基础。

我们还做了什么?为了方便理解,对应白宫网站举的五个例子:第一个囊性纤维化,在2014年的时候,我们为一个牛奶血的女婴查出了致病性的LPL突变,对应的有一个叫Glybera的新药可以治疗;第二个例子跟白血病相关,我们查到了基因突变,精准用药;第三个跟乳腺癌相关,我们查到了BRCA1的突变,及时发现囊肿,通过手术切除,病情得到了控制;第四个例子是疑似马凡综合征的新罕见病,对应的是刚才讲的凯文小男孩找到新的致病基因;第五个例子讲结直肠癌,我们帮助结直肠癌患者找到特定的基因突变,医生据此指导用药。

基因检测市场的容量和规模

最后讲讲目前的市场容量和将来的市场规模。以应用得最好的NIPT(Non-invasive Prenatal Testing,无创产前基因检测)为例。

2014年中国整个IVD(In vitro diagnostic products,体外诊断产品)市场是260亿人民币,产品品种接近2500种,一个产品的平均销售额是1000万。2014年,NIPT单一产品在中国的销售额是10亿人民币。到2015年,销售额已经达到了20亿,增长速度非常快。

整体二代测序分子诊断的市场规模,NIPT在80亿到100亿,孕前筛查240亿到320亿,新生儿的筛查百亿到千亿,肿瘤百亿到千亿的单位,微生物也是百亿到千亿,人人基因组,每个人都拥有自己的所有基因组这是千亿到万亿的市场。

当第一台计算机出现的时候,它很笨重,没有人觉得它会对人类的生活有多大的影响,但是现在每一个人都拥有自己的计算机和智能手机,世界发生了巨大的改变。同样,当第一个人类基因组需要30亿美金才能测定的时候,必然不是一个民生应用项目,但是当每一个人都拥有自己的基因组信息的时候,测序加分析全套在七千元左右就能解决,甚至接近免费的时候,这个格局就会发生巨大的改变。(本文首发钛媒体,根据华大基因副总裁彭智宇在钛坦白的分享整理)

……………………………………………………………………

第18期钛坦白医疗健康专场,“探究医疗健康产业的新技术、新方案、新方向”,三天的分享已经结束。干货会陆续发布在钛媒体网站,点击看干货:钛坦白

第19期钛坦白“金融科技”专场预告

地点:钛坦白|金融科技(微信群)

初定时间:5月30号、5月31号、6月1号晚上8点-10点

分享钛客邀请中,报名请与钛坦白项目负责人佳音联系,邮箱jiayinge@tmtpost.com

需要提供:个人介绍、分享主题、提纲

随意打赏

华大基因上市华大基因
提交建议
微信扫一扫,分享给好友吧。