碳云智能CEO王俊:打造收费的生命数据个性化服务

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

近日, 碳云智能 完成A轮股权 融资 ,募集资金超过1亿美元,投后估值近10亿美元。让资本市场如此看好碳云智能,究竟在做什么?4月13日,王俊现身正和岛广东岛邻机构两周年庆活动,在演讲中提到,他要用 基因 大数据做出每个人自己的“阿凡达”。王俊观点如下:

1)基因和计算机一样,可以进行程序编写;

2)人类可以通过技术对基因进行检测和研究;

3)碳云智能就是要收集相关的生命数据;

4)生命数据本身是免费的,但个性化服务是可以进行商业化的;

5)通过对生命数据的分析,可以了解人类乃至中国人的生命情况。

以下为王俊演讲实录

最近刚刚完成我的首轮融资,有的新闻已经出来了了, 腾讯 投了我们。碳云智能,碳是生命,云是云计算。计算机肯定是可以思考的,但那个时候我就问自己,计算机是如何思考的?我们也知道阿尔发狗已经赢了李大师,我们想知道计算机能不能像人一样思考?机器的智能和人的智能,最终是不是可以形成人的思考模式的基本形态?

我们当时学遗传学,发现生命科学和计算科学是一回事,只不过运行的载体不一样,计算科学是以“硅”为基础,生命是以碳为基础,我们每一个人身上都有一个生命的程序,像计算机写一个程序一样。

在那个时候为什么会成立华大?我们想了解人类本身,想了解这个程序本身,首先要把这个程序读出来,当时这个程序全世界没有一个机构把人的程序读出来,这就是人类基因组计划。中国当时参加了1%,这1%是华大基因做的。1999年,我们共同 创业 了华大基因,就做了一件事情,把测序人的基因代码由原来的10亿美金变成了现在的1000美金,未来甚至更少。

如果我们完全用计算机语言来看的话,对于生命本身来说,全世界所有图书馆的书,都可以存在巴掌大的DNA里面,每一个功能模块都代表一个基因,而这个基因是相关联的,我们现在看每一个不同的物体,每一个不同的物种,在体内像同一个程序员用不同的程序模块堆在一起的。

每一个人、每一个物种的基因,代表这个物种的基因组合,这个基因的组合代表生存策略,西藏人生下来的孩子就能够适应高山,动物生下来就可以跑,植物天生就可以进行光和作用,这一套基因的本身是预设的生命程序。

这个基因有什么用呢?基因可以了解我们的历史,可以了解种群的历史,可以了解自己的历史,你每一代都积累了一些基因突变。藏族人生下来就可以适应低氧环境,为什么所有长跑的冠军都是牙买加人?因为牙买加人的腿天生就适合长跑。

基因像程序代码一样完全可以拷贝,把一整套的基因管理代码可以克隆拷贝出来,现在基因也可以编辑,甚至开始合成,生物合成,我们后来可以直接合成出来酵母菌。

到今天为止,生命本身没有真正被理解过。我举一个简单的例子,我们以二型糖尿病为例,30年前中国二型糖尿病发病率是0.67%,2011年二型糖尿病发病率是9.7%,二型糖尿病是吃出来的病,所以我们作了一个科学的项目,把糖尿病人和非糖尿病人一起检测肠道微生物,发现这两者之间是有关系的。

我们曾经对英国8000个双胞胎做各种各样的分析,有的可能有这个疾病,另外一个就没事,所以基因在不同的条件、环境下形成的结果是不一样的。雾霾是一个大环境,PM2.5、温度、湿度如何,这都跟大环境有关。

我自己的基因测过很多次,我做完以后就开始做各种各样的解读,我的基因里面有痛风携带者基因。自己有了毛病以后就开始研究,中国人里面一半有我这种突变,这个研究本身是一个白人的研究。在过去四、五年里,这个研究在白人体系里面进行了很多次,同样的基因突变在不同的环境里面结果也不一样。所以我们需要很多数据,我们需要非常多的数据来理解基因本身,来理解是基因是如何运行的。

碳云就是要把所有的基因数据收集起来,把不同的生活环境、内部环境、外部环境一起收集起来,在这样的情况下才能收集疾病的状态,完全是数据导向的。基因只是其中一个环节,还包括蛋白质和代谢,包括很多中间产物。但是对生命科学本身的理解不是很简单的,是非常复杂的体系,需要很多年的磨炼,才能知道如何去设计这个东西,不是我有多少数据量就可以做的。

每个人的个体数据要收集都要很多钱,我认为每个人的数据都应该是免费的,但是在他享受个性化产品和服务的时候是需要付钱的。现在很多商业模式说,做一个基因检测你得到了什么呢?我已经把自己监测很多遍了,这样的数据采集和数据收集未来到对生命程序没有很深层次了解的话,是没有很大意义的。但是有很多环境数据,饮食、环境、对心脏的监控、对睡眠的监控、对血糖的监控,比如智能手机、智能手环、智能房子,把你所有生命过程中收集的数据都要收集起来。

你不能只做几百人、上千人的东西,几百人的东西不是规律的东西,你要了解血压、了解糖尿病、了解心脏病,需要一百万人的数据,而且你需要的是不同时间段的数据,需要不断的跟踪,吃多了是什么情况,酒喝多了是什么情况,所有东西做完了才有精准医疗。

数据本身对生命科学来说是最大的瓶颈,当你收集了这么多数据以后就可以放到一个模型里面,我们在做什么?碳云在做什么?碳云就是根据你以碳为基础的所有东西的数字化,在计算机里面做出一个你的“阿凡达”来,你不知道自己能不能跑马拉松,可以让“它”先跑一下,让它管理你的数字生命。

你想象一下把所有人的这些东西联在一起会形成一个什么网络效应?生命数字网络的话,儿童就不会被丢失了,现在骨髓移植、骨髓配型都变得容易了,不像现在很盲目。

全人类有70亿个生命程序,没有一个是完美的,每一个人都是特点的。如果把这样一个大的网络效应可以建成,我们可以通过在数据更大程度上的整合和挖掘,对生命的认知,我们要做的一件事情就是,做出每个人自己的“阿凡达”来。

随意打赏

提交建议
微信扫一扫,分享给好友吧。