【虎嗅夏季F&M节】华大基因李英睿:生命是什么?我们为什么要研究它?
注:本文来自 华大基因
李英睿 在2014虎嗅夏季F&M节上的演讲,虎嗅进行了整理、编辑。
什么是生命?
什么是生命?大部分的时间,我们看生命这个定义的时候,我们不是非常清楚这个定义,我们只是大概知道生命具有什么样的特征。我们回忆高中时候学的,一般来说生命是指什么样的信息,但从来没有真正意义上的定义什么叫生命。
所以,对于生命,我们先要来提三个问题。
第一个问题是对生命科学的认知。
我们来看三张图,中间这个是神经元,左边这张图也是非常复杂的河流网络,右边这张图是波士顿区域的交通热点,主要是反映手机的信号。哪一个是生命?我们仔细看一看,这三个图都有可能是某种意义上的生命形态。神经元在生长的时候,它的突触一直是受周围环境的引导;河流之所以会形成这样的结构是因为地质的原因;波士顿不同的区域,对于人群的吸引,商业或者住处是不一样的。这是我们对生命第一个形态上的认识。
第二个是我们对生命的想法。
大部分生命是由DNA转录成RNA,RNA有部分会翻译成蛋白质执行细胞的功能和生命活动,从根本上来讲,每个人实际上是有一个属性,DNA用4种元素,它实际上存储了生命中的绝大部分信息,并且它可以发育成一个人。这在生物上是四进制,在计算器里面都是0和1。我们真正看这个问题的时候,你认为生命是一个生命,还是某种意义上是信息流呢?
第三个看看生命的网络。
先来看一个图。左边是比较简单的生命,就是细菌;而右边是Linux操作系统。生命在使用信息和功能的时候,它以非常相似于操作系统的形式进行表达,形成对不同环境的适应和对后代的繁衍。但是实际上,如果我们仔细看看细菌的调控网络,它比人工设计出来的Linux系统还要复杂,因为不仅能调控到最上面这一层,还能调控到最底下这一层。从这样的层次来看,生命本身在信息上是非常多层次的。
生命是怎么来的?
为什么有的东西是有生命的,为什么有的东西是没有生命的?
一个是规则,一个是人择。
这里面最经典的案例是DNA以及RNA是怎么编码氨基酸的。在最开始的时候,DNA分子和RNA分子怎么知道这几个在物理化学信息上和氨基酸的物态完全不一样的时候,它是如何固定这样的编码规则?因为在这里面所有氨基酸的排列纯粹是序列的编码,它并不能用物理化学上面的相关性来分析,但它就是在这样的演化当中形成相对稳定的核酸和蛋白质的结构,这就是我们今天看到的结果,这也是典型的人择的情况。
我们在今天能够看见的生命体,我们今天能够定义出来的生命,在当时那个历史环境条件下并不一定是必然,很可能是偶然。随机的结果,我们今天认为它是生命。宇宙很大,在这么多的星球里面为什么只在地球上看到生命形态呢?我们忘记了,当有无限的时间和空间尺度的时候,这就有可能变成一个必然。
生命科学的边界在哪儿?为什么要研究它?
我们今天研究生命的形态,并不是研究生命背后内在真实的规则,而是我们到底能不能够理解自己。
生物目前产生的数据非常大,已经远远超过其他的学科。如果我们真的能够理解生命的话,我们是不是有可能写出生物学,相对物理学的三大定理,我们能不能写出相对于相对论和量子力学的理论。HIV病毒的复杂度,如果它达到这样的复杂度的话是不是也是一种生命的形态呢?是不是也是需要我们了解的生命活动的规律之一呢?是不是也可以称为某种意义上的生命呢?
科学是有边界的。
你发现一个新知识的成本远远要高于验证一个新知识的成本,以及学习这个知识的成本。如果我发现的结果和以往的不一致的时候,我是相信我的结果还是相信他的结果呢?这时候科学就不存在是与非了,只存在着你相信还是不相信,这个就是科学的边界。
当然我们可以想一些办法,我们可以用人工智能,可以用群集式和分布式的方法来解决这些问题。当你构造了一个复杂度更高的人工智能系统来解决一个复杂度相对低的,比如说人体的生物信息系统以后,请问人工智能系统本身可以理解吗?如果自身头脑的复杂度已经不能够理解我们自己,我们为什么会去理解未来更加复杂的人工智能系统呢?这也是科学边界的问题。
未来会是什么样?
未来是知其然不知其所以然的系统,我真的不知道为什么是这样,因为那个时候所有科学的边界被高复杂性的体系推过去了,人类本身的复杂度不足以理解群体的智慧或者分布式的智慧,或者未来的人工智能。科学不再是第一生产力,组织宏观效率将取代科技成为第一生产力。智慧本身从今天的认知将会发展触发式智慧,我们在触发的过程当中得到智慧。
从创业者的角度来讲,做入口、连接和平台的组织将比做技术和产品的组织对社会有更大的贡献,催化剂这时候比底物和反映物更重要。但是文明依然有梦想,我们仍然可以考虑统一生物圈的基本法则,我们仍然可以考虑统一时间尺度和复杂度,我们仍然可以考虑统一有机和无机,我们可以统一宇宙的传承。
|