90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

“我父母都是化学家,在学校教了一辈子书。父亲今年已经90岁了,照片上还挺健康的。这些年的研究,我从一个计算机科学老师,慢慢成了生物化学老师,终归是和父亲越来越像了。”


7月17日7点50分,上海还没出梅,温度徘徊在35度,闷热阴沉。

徐鹰透过舷窗看着机场入口处,因为24小时核酸报告折腾了自己两个小时的安保还站在原地,但自己却仿佛去了一趟魔幻现实主义世界。

他没想到的是,自己研究了一辈子的生物学,几乎每天都和蛋白质、核酸打交道,如今却要被一份有时效性的核酸报告急得团团转。

徐鹰坐在航班座位上,这是他在国内隔离14天后,第一次放松下来看看外面的世界,“谢天谢地,现在没人能再拦住我了。”

两个半小时后,他将和父亲一起在家乡长春见面。

从1993年起,过去的30年里,徐鹰每年这个时候都会回国住上一个多月,期间主持生物信息学领域的研讨会,开展青年学生的暑期课程。

但在2022年隔离期结束后,徐鹰的时间被压缩到只剩下22天。相比于去年夏天“14+7+7”的隔离政策,徐鹰反倒觉得时间还有很多,有足够时间开展今年的安排。

第二天,徐鹰发了一条朋友圈,把在上海隔离的半个月仔细整理出来,像是一篇纪实小记,最后一句话是“希望疫情能快点结束,大家都少遭点罪”。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

配图是他和父亲站在长春的家中,蓝天白云,天气清爽。

梳理过去的工作,是徐鹰多年来一直保留的习惯。这个习惯也让徐鹰做成很多开辟性的工作,比如在橡树岭国家实验室和田纳西大学,共同建立美国最早的生物信息学博士点、创建佐治亚大学生物信息学研究所、发起国内两项生物信息学领域的国际研讨会——IBW与ICSB。

去年,徐鹰当选IEEE Fellow。在学术科技界,它被认定为权威的荣誉和重要的职业成就,每年由同行专家在做出突出贡献的会员中评选出,当选人数不超过IEEE会员总人数的0.1%。

这是徐鹰继2007年当选AAAS Fellow(美国科学促进学会院士)后的又一个重要荣誉。

多年的研究和奔波,让徐鹰亲历了生物信息学发展的三十年。很多人来了又走、走了又来,但徐鹰却逐渐从一个计算学者,蜕变一个生物化学学者,始终透着一股不知疲倦的兴奋。

一个25岁青年转行的故事

1985年,25岁的徐鹰刚到美国,人类基因组计划在美国被正式提出。

“生物信息学”在这一计划的推动下,成为一门新学科,迅速吸引到从生物学、化学、物理,以及数学和计算机科学领域而来的年轻人。

徐鹰从未想过,有一天会与生物信息学结缘。

从本科到博士,徐鹰一直读的是计算机系。1978年进入吉林大学计算机科学系(7年本硕课程),随后进入了美国科罗拉多大学博尔德分校,继续攻读博士学位。

其中一个重要的小插曲是,因为一直对数学感兴趣,当时徐鹰想要报考的是吉林大学数学系。但身为计算机学者的叔叔徐如镜建议,“(学数学)不如学计算机软件”。

徐鹰连这个专业名称都没有听说过。但听到能用计算机研究数学问题,决定改报计算机科学系。他的父母是该校的化学系教授,在学什么这个问题上,他们秉持“放养”模式,从未干涉过儿子的个人选择。

当时,吉林大学计算机科学系刚刚建系第三年,是国内最早从事人工智能研究的单位之一。

1976年,在王湘浩院士的带动下,一批有着深厚数学背景的吉林大学教授,如管纪文、刘叙华、姜云飞等教授,纷纷从拓扑学、数学转向了代数和计算机。七八十年代,吉林大学的计算机学者群星璀璨,扛起了国内人工智能研究的大旗,也为徐鹰等后辈们从事计算机研究,打下了极好的数学底子。

尤其是本科阶段,徐鹰深受教过他一年半《离散数学》的刘叙华教授影响,第一次发现了“数学的美”。这也让他坚定了,自己更擅长数学理论研究。

让徐鹰没想到的是,数学和计算机背景的他会在来到美国的八年后,成为人类基因组计划的亲历者,并在接下来的三十年里,一直扎根在生物信息学领域,成为一名(计算)生物化学学者。

1993年,是徐鹰在科罗拉多矿业学院任教的第二年。在这所工科见长的学校,他正苦恼自己的理论研究与学校有分歧,思考自己究竟擅长什么。

那段时间,徐鹰看到了橡树岭国家实验室(下称“橡树岭”)计算与数学部招人的消息。

凭借着数学背景,徐鹰顺利进入该实验室。

橡树岭,几乎可以用“科研圣地”来形容。这家成立于二战期间的实验室,曾参与到美国陆军部研制原子弹计划中,与新墨西哥州的一所实验室共同制造出两颗原子弹,其中投放到日本长崎的这颗,就是橡树岭所研制。二战结束后,原来橡树岭的管理部门——美国原子能委员会改名美国能源部,橡树岭的使命也变为能源研究。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

位于田纳西州以西30公里处的克林顿小镇,坐落在山沟里

徐鹰参与的项目,正是当时大火的“人类基因组计划的测序工作”。

徐鹰回忆,实验室想找一个做统计的人,帮着他们在DNA测序序列中寻找蛋白编码基因,从而弄清楚每种基因制造的蛋白质及其作用。

那时候,徐鹰从并没有正经学过统计,但在研究员Ed Uberbacher的指导下,开始第一次尝试用统计方法写程序。

这也是徐鹰第一次将计算机、数学、生物这三门学科联系起来。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

Ed Uberbacher

由于这一次的尝试,徐鹰似乎找到了门路和感觉。

1993年到1995年期间,徐鹰所研发的计算机程序GRAIL,成为那个时代最好用的基因测序工具。直到2000年代中期,这一程序依旧是该领域的研究“标配”,文章引用次数超1000篇。

此后,徐鹰在橡树岭的工作更加顺利。

1995年,徐鹰有了独立实验室,开始独立培养学生及博士后学者,也将基因组测序的工作逐渐交到学生手中。

1997年,徐鹰看到了新的机会——蛋白结构折叠——一个编码基因蛋白折叠成的三维形状将决定这个蛋白的功能。他要研究的是使用生物统计及计算方法,预测出蛋白质的三维结构。

徐鹰觉得,这项工作会涉及到更多的数学,也会涉及到一些物理,“或许可以做得很长久”。

1997年,徐鹰换到蛋白质折叠的项目也从原来的数学与计算机科学部,转到了生命科学部担任这一课题的组长,一点点从生物信息学的边缘走向中心。

一年后,徐鹰和许东(现任密苏里大学校董事会教授)第一次见面。

徐鹰说到,自己想找一个有生物物理背景的人,正好许东申请了橡树岭。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

许东教授1998年,许东从美国国家癌症研究所读完博士,拒绝了一个工资翻了几倍的生物制药公司。

当时这个专业有多吃香?

据说,只要候选人会用特别简单的BLAST工具(生物大分子序列比对搜索工具),就是最抢手的人才。

许东称,1995年测序工作大火后,他看到一个制药公司一口气招了80多个生物信息学背景的人——全职。

“那真是一段泡沫期,很多人都挺动心,我当时也想去工业界,后来还是放弃了,我更喜欢做学术。”

此后的三十年里,许东与徐鹰轨迹几乎一致。如今他们都已卸任行政职务,成为各自学校的董事会教授。

时间回到1998年。许东的加入,让徐鹰的团队多了生物物理学(Biophysics)的背景。

他们一起做了一个蛋白结构预测程序Prospect,在蛋白三维结构预测上反响不错,二人也在生物信息学领域里小有名气。

2001年,人类基因组测序的工作草图完成,成为人类基因组计划中的重大里程碑,徐鹰和许东就是其中功不可没的两个人。两人共同获得了R&D100奖——《R&D杂志》颁发给世界上每年度最重要的100项发明创造奖项。

当时的李明(现任加拿大滑铁卢大学计算机科学系教授),已经是领域内人尽皆知的“大学者”。

他和堵丁柱教授在1995年在中国创办的COCOON会议(计算与组合学会议),如今已成为世界知名的理论计算机会议。

1997年,他曾运用信息距离理论以及自然语言理解,开发出新一代的搜索引擎,论文成果也在世界顶级会议KDD-07上发表。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

李明教授机缘巧合之下,李明与徐鹰、许东两位成了好朋友,还拉着两人到自己公司Bioinformatics Solutions Inc(BSI)担任技术顾问。

被业界誉为“AI预测蛋白质结构全球第一人”的许锦波,那时候还在滑铁卢大学,跟着李明念博士。

经由李明的介绍,许锦波也参与到蛋白三维结构预测项目中。后来,徐鹰和许东将所有的源代码交给了李明和许锦波。在此基础上,许锦波也将这一程序发展得更好,打造出端到端模型及计算程序 Raptor。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

许锦波教授时间来到21世纪。2002年年底,已经在橡树岭待了十年的徐鹰萌生出新的想法,动心再回学校。

一则橡树岭改为能源研究后,80%的经费都来自美国能源部。尽管不用愁钱的问题,但是研究方向成为了能源。

另外,从寻找蛋白编码基因到蛋白结构折叠,徐鹰也发现,自己对生物学具有极大的兴趣。

“或许,我不用再为别人做计算工具,完全可以用别人的工具,解决自己关心的生物学问题。”

2003年4月14日,人类基因组计划的测序工作全部完成,徐鹰的这一想法也更加坚定。

徐鹰和许东一同离开橡树岭,分别去了佐治亚大学和密苏里大学,一个成为学校首个生物信息所所长,一个成为最年轻的系主任。

2003年,李明也计划换个环境。因为不喜欢美国教学系统的条框束缚,他正准备离开加利福尼亚大学圣塔芭芭拉分校(UCSB,离洛杉矶1.5小时车程,号称全美最美大学)。

李明从朋友那里辗转听说了徐鹰的消息,主动联系后者。他表示,只要徐鹰想去UCSB,他就给系里写推荐信,接替自己的位置。

多年后徐鹰回忆,那时候,生物信息学领域中的华人学者会有一种“抱团”意识:不管是自己的“老大哥”李明、和自己“同窗”六年的许东,还是后辈许锦波,大家时不时聚在一块,互相扶持,一起钻研学科里的新问题。

不过,徐鹰并没有去UCSB。

当时,还有两所学校向徐鹰抛来了橄榄枝。

一所是纽约州立大学石溪分校(位于长岛),核物理学家、诺贝尔物理奖获得者杨振宁,曾在该校执教37年。

另一所就是徐鹰最终的决定——佐治亚大学。

徐鹰是东北人,东北人疼媳妇也是全国出名。当时,徐鹰的夫人在考察了三所学校后觉得,长岛和圣塔芭芭拉两地的生活费用太高,最后选择了位于雅典市的佐治亚大学。

就这样,徐鹰开始了在佐治亚大学的教学之路。

“来佐治亚吧,就是你了”

2000年初,生物信息学科红极一时。佐利亚大学的一批教授向学校联合提议,希望学校建立一个生物信息研究所。

囿于没有合适的所长人选,这件事一直拖了两年。

2002年年底,佐治亚大学的一位华人学者汪必成(现任生物化学与分子生物学系教授),听闻了徐鹰回归学校的想法,主动联系徐鹰到佐治亚大学做了一场报告。

报告结束后,两个人一起吃晚饭。推杯换盏中,汪必成提了一句,“这两年我们一直在物色一个生物信息研究所的所长,你有没有兴趣?”

见徐鹰还在犹豫,汪又称,“我们可以帮你拿到佐治亚州的科学协会(Georgia Research Alliance, GRA)著名学者讲习教授 (Eminent Scholar Chair)的位置,GRA是一个以招收世界级杰出学者的州政府项目。”

这份“就职礼”特别贵重。

具体来说,就是佐治亚州政府每年拿出3000万美元的启动资金,帮助州里的6所主要的公立大学面向全世界招生。美国《时代周刊》还为此做过报道。

徐鹰听闻,汪当初就是以这种形式,被从匹斯堡大学引入佐治亚大学。

2002年左右,佐治亚州里共有大概有三、四十个杰出学者,那些人起码都比徐鹰大20岁。徐鹰才40出头,自觉这份新工作“诚惶诚恐”。

汪多次对徐鹰表示,他是最合适的人选,并保证徐鹰来了可以挑一个自己最喜欢的系。

汪也建议,徐鹰选择治亚大学里最强的系--生物化学与分子生物学系(生化系)。随后,在徐鹰访问期间,当时生化系的系主任David Puett教授赶来,与徐鹰见了面,鼓励他申请生化系。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

David Puett教授

徐鹰回忆,“在佐治亚大学,对我影响最大的一个人,就是David教授。”

从1969年开始,David就开始了在新陈代谢和内分泌学等领域的研究,是一位具有物理和生物化学背景的学者,而他本人也极具绅士气质。

从他那里,徐鹰不仅学到了传统的肿瘤生物学研究方法,自己豪爽、健谈的心态也变得更谦和。

也许是徐鹰连获五年“橡树林国家实验室重要成就奖”,也许是见了一面后发现徐鹰特别敢想,这位老教授看到了徐鹰身上更多的可能。

Just You! ”(就你了)

转眼要到新年,徐鹰终于答应下来。

很快,徐鹰拿到了佐治亚大学的正式聘书:校董事会教授、佐治亚科学协会著名学者讲习教授,佐治亚大学生物信息研究所首任所长,以及一份他当时觉得高的邪乎的工资。

徐鹰讲起来这件事,有些感慨:“从零开始建设一个研究所,会有很多的工作要做,但这件事本身就是一件很荣耀的事。”

新官上任,情况真如徐鹰所料,只有一个光秃秃的生物信息研究所,紧接着就是招老师、建博士点、招学生,什么都是从零开始。

佐治亚大学的科研副校长只给了徐鹰4个教职名额。徐鹰想扩大师资,就想了一招——和其他系合招老师。

不管学校里有没有人知道这个新成立的研究所,徐鹰逛遍了学校,把所有与生物信息相关的系都拜访了下来。

他与其他系主任约定:研究所出一半工资,系里面出一半工资,合作招聘老师。

用这个办法,徐鹰的研究所一口气招了8位老师。

万里长征终于迈出了第一步,徐鹰还想建一个生物信息学的博士点。

不过,这件事有点麻烦。

学校要成立一个新的博士点,首先要争取已经设了博士点的相关系的同意,保证不会抢他们的生源。

其次是到州里,拿到Board of Regents(董事会)的批准,保证不会从州里其他学校的博士点抢生源。

这层审批相当于进入了国内的省级高等教育局那里盖章。

徐鹰一共拜访了本校的32位系主任。每到一个系就讲,为什么建生物信息博士点是双赢的事情、为什么我们不会抢你们的生源,为什么只会扩大我们共同的生源。

最后,32个系主任都同意了,学校层面就算是批了。徐鹰趁热打铁,又去了佐治亚州唯一有生物信息博士点的另一所学校佐治亚理工学院。

很巧,徐鹰和佐治亚理工学院生物信息中心主任是朋友。一顿饭后,那位主任表示,“没有问题,我完全支持你。”

从进入佐治亚大学到招到8位老师,成功设立博士点,徐鹰用了不到一年。在不断的奔走中,徐鹰也接触到很多志同道合的人。

徐鹰称,当时微生物系的系主任帮着他写申请材料,跑各种机构,“他们也愿意看着新机构变大。”

随着系里和其他学校里越来越多的人支持,2005年的春天,佐治亚大学生物信息研究所招到了第一批博士生,17个人。

这个成绩在佐治亚大学里还有点小轰动。

作为研究所的所长,科研副校长给徐鹰涨了工资。

徐鹰觉得,自己担任所长本可以拿到一份相当于一个月工资的补贴,于是他跟科研副校长说:我的工资已很高了,这份补贴我就不拿了。

同时,他还把入职佐治亚大学后的第一次涨工资的份额,全部捐给了系里的几个秘书。

徐鹰想起二十年前的那段时光,他说,“那时候不是特别自信,总觉得我怎么有这么好的位置,别弄错了。”

但他至今对自己曾产生的推动力感到欣慰。

徐鹰还做了一个工作,首创了实验室系列讲座的传统。

一般来说,学校里会以系的名义举办各种系列讲座,但徐鹰来了之后,每周都会从外面请一些学者到自己的实验室。开始请的是本校不同系的人,渐渐的是学校附近的人,一两年后又变成了车程4小时范围内的人。

徐鹰称,每次请来的人都是他和学生“精挑细选”过的。

如果某一段时间他们需要对肿瘤代谢系统有个了解,就一起查文献,看看哪些人最厉害,再从中筛选出4个小时车程圈的人。

用这样的方式,徐鹰带着学生一起,啃下一门又一门的新学科。徐鹰也年轻过,他知道年轻人需要参与感、存在感。

他还喜欢徒步,每逢周末能一口气走12公里,平时就去其他系的办公室“溜达”。

当时,时任佐治亚大学物理系主任的Bernd Schuttler教授,就是徐鹰主动搭讪来的好友。

徐鹰听闻他做了多年天体物理方面的计算,走进他的办公室,上来就问,“你能给什么东西建模?”

Bernd看着这个刚入职就要建设生信所的中国人,回了一句,“只要能动的东西,我就能建。”

在佐治亚大学的日子里,他们从此相识,成为了长期合作者,也在多年后一同来到中国讲学。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

Bernd Schuttler教授

徐鹰爱social的个性也曾闹出过笑话。

初到佐治亚的那年,徐鹰走进了化学系主任Bob的办公室,很随便地问:“Bob,你这小黑板上的分子式是什么?”

Bob以一种“见鬼了”的眼光看着徐鹰:你不是做蛋白结构计算的吗?这是20个氨基酸呀。

好在那时还年轻、反应快,徐鹰赶紧找补,“哦,对做数学的人来讲,每个氨基酸就是一个特定的几何结构,而不必关心其化学结构。”

徐鹰自认为自己的学问很少,对生物信息学的研究有一个漫长的“学徒”过程。

“我从来没有系统地学习过生物学方面的东西,所以都是需要什么,就去学什么。”

在橡树岭时,徐鹰也从同事那里“偷学”了不少东西。

徐鹰提到,当时橡树岭中有一位人称“行走的微生物百科全书”的同事,名叫Loren Hauser。

徐鹰对微生物特别感兴趣,总是中午拉着他一起在会议室吃饭,每天吃饭前都准备几个问题,一边吃饭一边闲聊。基本就靠那四、五年时间,徐鹰就把微生物基因组进化理论“偷”来了。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

Loren Hauser

徐鹰讲起这段故事来眉色飞舞,“他并不知道我有意识地在学习这个东西。所以你看,偷艺,也是一种学习方法。”

而凭借这股伶俐,徐鹰还顺利把一位同事“拐”进了佐治亚大学。

这位同事就是Victor Olman博士,两人从1995年就在一起工作,直到2013年Victor退休,共事了18年。

徐鹰称,Victor是标准的俄国数学家,师从苏联科学院院士,坚信要从统计学的角度看生物问题。

Victor有一个“交友标准”,每见到一个新同事就出一个数学问题,“如果没解答出来,那么以后他就对你的就兴趣不大了。”

意料之中,徐鹰通过了他的考试,并在2003年一起去了佐治亚大学。

在多年的交往中,Victor一直告诉徐鹰要“be accurate”(要准确),徐鹰也一直保持着这点科研要求,不断告诫自己和学生,要把生物学中很粗糙的东西,打磨成最底层的、最准确的东西。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

Victor Olman

徐鹰回忆,到了佐治亚大学,自己的学科背景,从求学时的数学和计算,橡树岭期间的进化理论、基因组学,进一步丰富到生物代谢、系统生物学以及计算化学等学科。

至2011年徐鹰卸任时,该研究所的博士点稳定在50多名博士生的水平,生物信息学学科当年进入全美前25名。

徐鹰卸任那年,生化系主任David对徐鹰说,“在你来之前,从未有物理系、数学系的人与生化系的人合作。现在这些系及统计系、计算机系的人,因为生物信息研究所的建立,已有了多项与生化系的老师的合作。”

现在来看,徐鹰连续八年担任生物信息研究所的首任所长,靠的不只是善于钻研的劲头。他真正稀缺性的,是他不需要顾虑什么。

他没有想过要建立自己的帝国,也从未建立自己的安全地带,而是不断思考通过研究所来促进生命科学与数理科学、化学及工程的互动,推动生物信息这一新型的交叉科学在校园中迅速成长。

徐鹰的轻松,也来源于此。

质疑、离职与院士父亲的认可

在担任所长的这段时间,由于长期建立起来的合作关系,徐鹰继续参与并推动在橡树岭的系统生物学工作,每年大概跑三四次,组织、指导项目推进。

其中微生物碳循环的项目,就是在2003年后正式着手。

简单来说,就是通过植物或海藻的光合作用,将空气中的CO2以纤维素或其它的碳链儿的形式高效地回收到地上,以减小空气中的温室效应。

此前从Loren Hauser那里“偷学”来的微生物系统生物学的知识,被全部派上了用场。

他使用读博士时学到的组合数学及算法,来给海藻的代谢网络建立数学模型,分析预测应如何通过基因工程来改变海藻的基因组,以提高其固碳的效率。

徐鹰在这个项目上一直做到2008年。

接下来的五年,他继续与橡树岭的同事们合作,研究碳循环的另一面:如何将通过光合作用存储在植物中的纤维素高效地转化为能量。

这一工作的目的是对能实现这一转化的微生物做基因生工程,大幅度地提高它们能量转化的效率。而指导这类基因工程的信息来自对这些微生物的代谢系统做数学建模、分析。

10年间,他与合作者在这一领域发表了100余篇学术文章、两部专著。

现在来看,微生物碳循环的研究意义十分重要,尤其是2020年9月中国明确提出双碳目标后,能源与环境问题,已经成为一大全球性问题。

这十年的社会议题研究,显然也让徐鹰习惯了用计算方法去解决实际的生物学问题。

2012年后,由于ImageNet的出现,生物信息学领域迎来了深度学习时代,开始迭代出更好用的计算工具,但那时候徐鹰的兴趣,早已转向了更底层的生物问题。

这一转变过程,也早在徐鹰加入佐治亚大学时埋下了注脚——肿瘤生物学。

此时的徐鹰到了知天命的年龄。在中国的“知天命”思想中,这一解释是人不再是听天由命,而是谋事在人。

攻克癌症肿瘤,这一传统认知上“无药可治”的疾病,就是徐鹰给自己提出的新命题。

他卸任所长,又全身心扑到了学术上。

但那一刻,徐鹰觉得自己被各种质疑声音“打败”了。

过去50年,学界对肿瘤的基本观点是:基因突变是肿瘤发病的根本原因,但这一框架并未给肿瘤的治疗带来突破性的进展,比如目前每10万人的肿瘤死亡率与50年前相比仅有略高于10% 的进步。

同时,这一框架还不能解释一些很基本的肿瘤学问题。比如,为什么有些器官很容易患癌,而相邻的器官则极少患癌,如大肠与小肠?为什么有些人的肿瘤有抗药性,而其他体质、年龄、性别同样的患者的肿瘤则没有抗药性?为什么有些患者的肿瘤很快就转移,而其他有同样肿瘤的患者健康地活了几十年?

徐鹰的目标,就是依据肿瘤大数据,研发一个新的肿瘤演化理论。

他本以为研发新的肿瘤理论,可能会有5年的低产或无产期,但逐渐发现,自己过于乐观了。

一方面,新理论的研发,需要全面扩充他的知识。除了他已很熟悉的分子及细胞生物学,遗传学、进化生物学、及生物化学,他还需要系统地了解免疫学、神经学、组织修复理论、及发育学等知识。

另一方面,但更难的问题是,他需要不断回答来自各个方面的质疑及打击,包括科学杂志的审稿人、编辑、基金会的评审人及官员,特别是一生从事肿瘤突变研究的学者。

终于,经过了此后十年的不懈努力,徐鹰及团队逐渐建立一个全新的癌症发生、发展及转移的演化理论。

其核心思想是长期慢性发炎及局部的铁积累,将导致细胞内持续的酸碱不平衡、这将进一步地导致细胞内的代谢方式发生根本的改变,称之为代谢重编程。这其中的有些改变,将推动细胞的持续增殖、分裂,另一些改变将推动细胞的转移等。

徐鹰说,“过去十年的路走得非常艰苦,说什么难听话都听到了。”

他至今都记得一个场景。

2018年,自己的4个博士生同时从实验室辞职。“他们觉得这个东西做起来很难,而且文献上的观点和徐老师的观点经常都是反过来的。”

当徐鹰试图从一个全新的角度来考虑肿瘤演化,不仅受到了很多学者的怀疑,也受到了整个社会的质疑。如果出现新的肿瘤演化理论,那么以往的教科书上关于肿瘤观点、逻辑分析、甚至一些经典的工作,可能都是错的。

这自然导致徐鹰的科研经费下降。他的研究团队也从2012年的三十多个人,逐渐流失到现在的七、八个人。

他的父亲徐如人,做了一辈子化学研究,也对徐鹰说,“你研究肿瘤,不把相应的化学反应式都写出来,我也不相信你。”

这是徐鹰,以及生物信息学领域都要面对的现实。

而他的选择是,走到生物学的中心,站在里面做研究。

从事肿瘤生物学研究前,他一直被视为计算机圈子的人,擅长研发更多更好用的计算工具。此后,徐鹰几乎所有的研究课题都围绕生物学中最底层的问题,要比传统的生物学者更能触及到化学及物理水平的研究。

在生物信息学的圈子,他是一个极其标志性的存在。也几乎只有他一个人,转型得如此彻底。

徐鹰自称,“在生物信息学里,自己现在的工作,90%归属于生物学,只有剩下的10%才是计算的范畴。”

好在最近几年,徐鹰团队真正有了突破性的进展。他的团队完成了一系列的肿瘤驱动力及机理的文章,并在主流杂志上发表出来。

此外,徐鹰的最新成果已发表论文,是他和吉林大学、以及中日联谊医院肿瘤系统生物学中心的共同研究,《Cancer is a survival process under persistent microenvironmental and cellular stresses》。

该模型系统地描述了原发性肿瘤发生、发展及转移的推动力及主要机理,建立了一个癌症发生、发展模型。并且,与传统观念的最主要差别是,肿瘤细胞所做的事儿,都是为了它们自身的生存,是不得不的行为,而基因突变是帮助他们生存的手段,而并非如传统学说所认为的,是肿瘤发生的原因。

目前,这一癌症发展模型已在小鼠肝癌上得到验证。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

癌症发展框架

在回国的路上,徐鹰和父亲聊天,他的癌症发展机理也终于获得了父亲的认可。

徐鹰说,“在情感上,我们是父子,在做研究上,我们则是两个独立的灵魂。”这位父亲是中国科学院院士,并将三名学生也培养为院士。

父亲的这次表态,很大程度上也代表了其他学科对他的认可。

只有一个人参加的报告

1993年,与橡树林工作同步进行的,是徐鹰与国内高校进行交流的愿望。

作为土生土长的东北人,徐鹰非常希望向国内高校、尤其是东北地区的高校介绍国外相关学科的进展。他回到吉林大学的计算机系,和当时的系主任自荐做场报告,讲讲生物信息学。沟通了多次,系主任才松口:“好,你做吧。”

“他也没认真,但我真做了。”

结果到了做报告的日子,只有徐鹰一个人去了,碰了一鼻子灰。

因为没有人重视这次报告,自然就没有人当报告的主持人。更棘手的问题是,到了做报告的教室,徐鹰才发现门都没开。

正好徐鹰的大学同学周春光毕业后留校,做了计算机系的副系主任,赶来做主持人救场。

徐鹰这样回忆那段时光:如果当时自己没有决定继续做下去,也就没有了此后在国内所做的各种交流会。

徐鹰从来没有埋怨过这一点,他的抗打击性比较强。

看到当时计算机系对自己的兴趣不是很大,他又参与到化学系里。就这样,徐鹰一边在化学系里合作一些项目,一边在计算机系里做些报告,同时帮他们带带研究生。

时间就这样一年一年过着,徐鹰依旧每年暑期回到国内。

再往后,当徐鹰在橡树岭与生物信息学结缘,并佐治亚建立起一个研究所,以及在肿瘤研究上开疆破土时,大洋彼岸的中国生物信息学,却发生了一场变故。

谈起那段历史,现如今很多吉大人最感同身受。

85年,管纪文因为一些不顺心的事情,负气出走,去了英国的大学。93年,吉大计算机系和数学系创始人,王湘浩病逝。95年刚刚评上院士的刘叙华教授,在讲坛突发脑溢血,巨星陨落……

从此,吉大计算机系慢慢地下滑,少了王湘浩这个主心骨,人才一个个流失。

老一辈学者,鞠九滨、金成值、周长林、刘大有、孙吉贵、周春光,也终归是要退休。

在2000年来临之际,吉大给自己留下了一个问题:再过十年,吉大计算机系会何去何从?

徐鹰的父亲此时已经在吉大生活了48年,这时候,他在吉大讲学和办公时,经常会在暑假带着儿子徐鹰同行。所见皆父亲辈的人,徐鹰没多说什么,只是照例每年夏天飞回来,继续在吉大做一些项目和讲学。

那时候,徐鹰40岁,正值壮年。

2001年,经院系调整,吉林大学的计算机科学系与另三个单位,合并为吉林大学计算机科学与技术学院。此前大学同学周春光也做了副院长,帮徐鹰申请到了长江学者,徐鹰多多少少有了一个名头。

来和徐鹰走动的人更多。徐鹰也能和更多的单位做合作,为吉大补充一些国内院校的交流。这时候就有北京大学生物信息中心,天津大学生物信息中心等。

而徐鹰真正对国内的生物信息学推波助澜,2002年无疑是最浓墨重彩的一年。

从1993年到2002年,这十年里,徐鹰在橡树岭的基因研究,以及在国内的学科建设,让徐鹰对研究有了一层新的思考:要将研究延续到学校中,以每代人最饱满的状态做学术。

这时候的徐鹰在思考两个问题,自己要去哪所学校任职,国内的生物信息学科如何发展。

就在这时,国内好友传来了一个消息。

2002年,中科院数学所的陆汝钤院士联系到徐鹰,说现在有十万块钱,能不能用这笔钱帮我们请一些国外的生物信息学者来国内讲学。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

陆汝钤院士

徐鹰索性就从国内和国外各请了十个人,有国内的陈润生院士、张春霆院士、郝柏林院士、清华大学的孙之荣教授、中国第一个长江学者,当时北京大学力学中心的佘振苏,以及当时加州大学河畔分校的姜涛、哈佛大学的刘小乐,伊利诺伊大学大学的梁杰,等等。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

陈润生、张春霆、郝柏林、孙之荣、佘振苏

第一届会议定在了2003年年底,因为非典推后了几个月。正好当时陆汝钤院士在复旦大学兼职,首届会议也就定在了上海。当时参会的主要都来自上海附近的学者,大概有90个人。

这次会议下来,大家都有点意犹未尽。孙之荣教授见状提议,“就把它办成一个系列会议吧,第二年由清华主办。”

系列会议的名字也当即确定下来,——“国际生物信息学研讨会,英文为IBW(International Bioinformatics Workshop)。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

佘振苏、徐鹰(中)、孙之荣讨论下一届会议

到了第三届IBW,徐鹰决定成立一个常务委员会,由他、北大的魏丽萍、哈佛的刘小乐,上海的李亦学四人组成,徐鹰任委员会主任。每年的8月初,该会议都会在各个高校轮流主办。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

首届IBW会议,徐鹰坐在前排中间,带着墨镜

当时徐鹰还提议,除了老师们互相交流还不行,还要培养学生。

他和首届会议的主持人赵伟(澳门大学第八任校长,现任中国科学院深圳理工大学副校长)提议,有没有可能在每年的会议开始之前,让这些回国的教授轮流给学生讲个5天。

这一提议也被大家广泛采纳,并确定为“永远免费”。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

赵伟校长

到了2010年,这个暑假课程开始由中国计算机学会的“龙星”计划支持,至今听课学员已有一万名人。今年的网络授课中,第一天有8800 多人参加,第二天有11000 多人。

“这在过去是不可想象的,这么专深的领域都有这么多人参加。”徐鹰称,学生对这个课程非常感兴趣。线下召开时,报名人数总是超过授课教室的容纳量。

几年前,会议在西安的第四军医大学举办,主会场坐满了400个人,一些报名晚了的学生就主动提议,“我们可以坐在楼道里”。那次会议临时开了第二个会场,在楼上的一个阶梯教室里,又坐了200多号人。

一直到2013年,徐鹰连续主持了前11届会议,年年给学生讲课。

IBW会议也吸引到了更多的生物信息学专家,以及类似Genome Biology 、Genomics、Proteomics and Bioinformatics等全球优秀的生物信息学期刊编辑。

徐鹰回忆,到了2011年,IBW会议已经发展得非常成熟,他就和吉林大学的梁艳春教授创办了另一个会议—— 肿瘤系统生物学国际研讨会(ICSB,The International Workshop on Cancer Systems Biology)。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

梁艳春教授

徐鹰刚刚卸任佐治亚大学的生物信息研究所所长,一心一意扑到了肿瘤生物学研究上,在国内的推动工作也有了更多精力。

会议依旧早年的IBW会议的形式。

每年的7月底,在ICSB会议召开前,徐鹰他们都会邀请10名国内及10名海外相关领域的华人学者和医生。

吉大也在多年的交流中,建立起与国内高校的长期学科合作,培养起一批新的人才团队。

目前,吉大生物信息学的学者中,大都是徐鹰过去在吉大带过的学生,其中不少人都曾经到过他在美国实验室,接受过一段时间的训练。

陆汝钤院士、郝柏林院士、北京301医院的顾瑛院士,都对徐鹰的组织领导能力和培养人才的热情大加赞赏。

天津大学生物信息中心的张春霆院士,早在90年代与徐鹰合作过。他这样评价徐鹰的工作,“中国三、四十岁的青年学者,基本上都从这个会里走出来过。作为IBW、ICSB,以及龙星计划的主要发起人,这些系列会议对于促进我国生物信息学的发展,特别是对培养年轻一代生物信息学工作者起到了重要的、不可替代的作用。”

所有的误解、遗憾与重新崛起,因为徐鹰的不放弃而有了最好的结局。

攻克人类最后一个疾病

现在,徐鹰还要每周工作70个小时,与一个年轻人的工作强度相当。

一年半前,他已经开始了在老年痴呆方面的研究。

他认为,在疾病的研究上,老年痴呆将是人类最后一个要攻克的疾病。“一旦攻克了这个疾病,那么人体内部的奥秘,我们就都掌握了。”

迈入六十岁,徐鹰已经历了一个甲子。

他说,“我这一辈子一开始做基因预测,后来做蛋白结构的计算、微生物、肿瘤,我相信一生里最后的科学研究,就会落在老年痴呆上。”

说完这句话,徐鹰爽快地吃了一个果脯,吐出一个果核儿。

他对我们说,“你们要做(回看生物信息学激荡三十年)的文章。我从1993年做起,生物信息学的30年,我才参与了29年。”

这么多年,徐鹰变换了多个研究项目,去年还开了一门生物化学课程,是为全校打算考医学院,兽医学院、药学院等专业的本科生提供的服务型课程。

作为一位从未修过“生物化学”,“有机化学”,甚至“大学基本化学”的人来说,有些难度,但也乐在其中。

“和这些最年轻的学生相处,乱哄哄的,气氛要比和一群同龄人坐在一起好得多。”

徐鹰的世界里,没有那么多条条框框,如果有,只有一个:不能停在过去,要始终站在舞台中央。

徐鹰喜欢徒步,记录餐食,发朋友圈,空闲的时间还爱吃点儿小零食。

他听别人讲话时,上身保持不动,只将视线抬高,穿过咖色镜片的上方看向你。这样能节省好多时间,既能礼貌听别人讲话,也能迅速收回视线继续工作。

只有他讲得兴奋时,整个人才会频繁用胳膊、手指、下巴示意,配合自己说的话。这是一项他多年总结出来的“案头体操运动”。

还有,在国外生活了37年,他的东北味儿,一点没变。


作者注:1993年,中国参与人类基因组计划,生物信息学科迎来大爆发。

在近三十年的时间里,一大批生物、化学、物理、计算等专业的学者,前仆后继加入到学科的产研建设,那是一个灵感迸发、情谊绵长的年代,也是一个走出质疑、迷茫的年代。

目前,雷峰网 (公众号:雷峰网) 启动《生物信息学的三十年往事》专题,将陆续推出徐鹰、潘毅、周耀旗、许东、唐建等新老学者的人物故事,记录光辉岁月,以照后人之路。

雷峰网雷峰网

雷峰网原创文章,未经授权禁止转载。详情见。

随意打赏

提交建议
微信扫一扫,分享给好友吧。