碳云智能王俊:生命这套程序的设计就是120岁
网易科技讯 4月2日消息,2017中国(深圳)IT领袖峰会在深圳举行。在下午的高端对话中,深圳碳云智能科技有限公司创始人、首席执行官王俊认为,生命科学领域有点像十年、十五年前的IT行业,刚刚兴起,充满着机会,也充满着挑战。
他认为,在生命科学领域,很多东西在未来五到十年会有非常大的变化。目前生命科学的数据还没有到来,但我们要在这个领域做好充分的准备迎接它的到来,这是我们这个领域应该做的事,它的时间和步速可能很快,三五年时间可能就会有飞跃的发展,十年后你看到的医疗体系、保险体系可能完全不一样。
他提到,生命这套程序的设计就是120岁,问题是你能不能让你的程序运行到120岁。关键在于,你能否理解和认知这个程序是怎么运行的,而这些都要在数据基础上才能完成。这个领域才刚刚开始。(温泉)
以下为演讲实录:
王俊:IT领袖峰会特别牛,今天早上我看朋友圈刷屏,有三个人被吴鹰搞的一起拍了照片,据说是第一次。
这是我第三次参加IT领袖峰会,2015年我和吴恩达做了两个主题演讲,我讲完以后他讲,结果今年我们都离开了,我也离开了华大的CEO,他也离开了百度。今年有两个更牛的人讲,一个是马云讲的,一个是朱教授讲的,讲完以后许晴(音)走了,所以领袖峰会真的是充满了变数,未来充满了不可预测性。
挺有意思的,今天提到生命时主持人问“你要问我点什么?”我说你想问我啥就问啥。刚才他说生命是可以数字化的,提出了一个观点,我觉得这样挺好的,因为这样我可以纠正他:
从说生命可以数字化的假设来讲,本身就是错误,因为生命本身就是数字化的,它不是可以被数字化,生命本身就是数字化的,生命本身就是一个程序在运行,在运行的不同条件阶段里有不同的结果,只不过它编译的方式、运行原理不被我们所知,我们不理解,我们刚刚理解了一点,ATCG是人类的基因,把它读出来,就像人读一个软件程序,我们说能不能用测序,以前任职的华大基因就做了这事。
读出来越来越便宜了,你可以把程序读得很清楚很简单,问题是你并不理解这个程序,刚才主持人教授讲人类人工智能三个核心要素:数据、计算能力、算法,我把计算能力和算法放到一边,先说数据本身。
我不知道在座各位多少人手上有基因的数据,有你自己基因的数据,四个人?五个,六个。有多少人在网络上有你的社交图片数据,有多少人在你网络上有说话的数据,有多少人有各种各样走路走多少步的数据,那我们就知道了,生命科学的大数据时代远远没有到来。
我们现在看到的人工智能可以对图像识别、语音识别做很多比较深入的探讨,但我们自己刚才举着手,这已经是非常高端的人群了,结果只有两三个人举手说我有基因数据,我真的要跟他细聊一下,可能他手上只是片断的基因数据,不一定是全部的。
但基因已经是生命科学的数据里最简单的一种数据,因为它是线性的ATCG最简单的数据,我不知道各位此时此刻有没有这一辈子全部的蛋白质数据?有没有此时此刻我全部代谢物的数据?更不要讲身体的蛋白质和蛋白质相互作为的数据怎么样,要想理解生命本身是数字化的生命科学的数据,在座各位可能应该没有什么人有。
我们有什么数据呢?我们手上所有的最多数据是临床数据,绝大多数人都去过医院做体检,在体检中心和医院里有体检报告、医院诊疗报告,所以这是现在人工智能领域应用最多的,将数据拿过来,做人工智能诊断,做一个普通医生。
但如果真的从生命本身,算结果是算不出来的,比如糖尿病,中国糖尿病发生率非常高,得了糖尿病和要得糖尿病的差不多三分之一,我不想得糖尿病,但现在我关于糖尿病有关的数据有哪些呢?唯一数据是医院里的血糖数据,通过一些量的数据和糖尿病用药数据,你如何让自己不得糖尿病,这几乎不可能,所以在糖尿病管理体系里应该做的第一件事情,糖尿病的原因是因为什么来的呢?有人的起点不好,有人天生生下来得糖尿病的概率要高一点、有人低一点,这是起点,也就是你的出厂程序;二是生活方式、饮食习惯,我是糖尿病风险高,但我注意运动、注意饮食,可能没问题;我糖尿病风险低,但我不管,天天胡吃海喝,得糖尿病的风险又会高很多,这些数据有多少人被记录过?如果你真的想要管理自己的健康、生命,前提是有多少数据真正被记录了,而不是简简单单的计步数据,所以这是我现在做的第二个公司碳云智能的核心使命,帮助每一个生命数字化,而这个数字是你现在还没有过的数字。
第二,生命其实是可以被计算的东西,因为它本身就是一个程序,今天我喝了一碗粥,我的血糖怎么变,这可以用精准的数学公式描述出来,而不是随机变化,喝一碗粥后想高就高想低就低,不是,身体是非常精准控制的机器,而机器本身是可以被计算的。
有一个真正能够理解生命的最好办法是用计算机里一套人工智能的学习系统来学习你的生命特质。今天我喝一碗粥,我的血糖怎么变的,我计算下来了,放进模型有输入有输出,做多了回头来看,我的模型越来越准确,我做了一个计算机的王俊,这个计算机的王俊和现实的王俊一模一样,我跑马拉松,他也跑马拉松,他跑完马拉松后的身体跟我跑完马拉松后一样。
如果有这样一个可计算的模型实施出来,未来它就可以基于你的数据做一些精准的健康管理模型。
我认为如果我们的生命是以碳为基础,这个碳基世界和未来硅基世界的人会完全打通,因为在硅基世界里的人工智能,和碳基这个本身就是人工智能体系的世界会越来越相像、越来越理解对方。
就像刚才讲的,对于神经网络的东西,越来越像人,我们学习生物学可能不再是以人为研究对象,而是以计算机生物智能为研究对象,很多东西在未来五到十年会有非常大的变化,最简单基因数据在这个高端人群里都没有达到1%,更不要说在更广阔的范围里了,所以生命科学的数据还没有到来,但我们要在这个领域做好充分的准备迎接它的到来,这是我们这个领域应该做的事,它的时间和步速可能很快,三五年时间可能就会有飞跃的发展,十年后你看到的医疗体系、保险体系可能完全不一样,在座各位都能等得了,达到100岁、120岁可能不可能,完全有可能,因为你生命这套程序的设计就是120岁,问题是你能不能让你的程序运行到120岁,这在于你能否理解和认知这个程序是怎么运行的,而这些都要在数据基础上才能完成,这个年代刚刚开始,有点像十年、十五年前的IT行业,刚刚兴起,充满着机会,也充满着挑战。