资讯 生物医药
此为临时链接,仅用于文章预览,将在时失效

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

作者:任平
2022/10/26 10:30

许锦波的人生分水岭是2016年秋天。

他提出的RaptorX-Contact方法,首次证明深度学习可以大幅提升蛋白质结构预测精度。

长期原地徘徊、进步有限的研究领域终于迈出实质性的一步,各界掀起了AI预测热潮,无数公司获得了进入生命科学的时代入场券。

外界给他加封了一个头衔:AI预测蛋白质结构全球第一人。

从2005年开始,许锦波就在芝加哥大学附属的丰田技术研究所开展科研和教学工作。

这是一所受慈善捐助而成立的独立计算机科学研究所。许锦波时间宽裕,每年的教学工作只有两个月,很少受科研经费困扰。能静下心来做研究,是他留在那儿的重要原因。

2021年9月,许锦波回国创业。2022年1月,他的公司成立,取名为“分子之心”(MoleculeMind)。此后,由许锦波牵头,分子之心在国内组建了一支25人左右的团队,其中不乏生物计算、计算机科学、生物化学物理等多学科背景的研究人员和工程师。

4月份,公司完成数千万美元天使轮融资。

关于许锦波和他二十多年来的研究故事,被凝练成一句话:从冷清走向热闹,从象牙塔走向聚光灯。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

金麟岂是池中物

1990年下半年,还在读高三的许锦波,在全国高中数学联赛中获江西赛区第一名,成为江西临川县获得该类奖项的第一人。竞赛结果出来后 ,许锦波收到了国内最好的五、六所大学发来的入学通知书。其中一封,就来自中国科学技术大学(下称“中科大”)。

彼时,中科大经过一系列的教学改革创新,在中外合作培养事业上取得了长足进步,在国内外声誉鹊起,被《Nature》杂志撰文称为“招风的大树”。

出生在安徽合肥的杨振宁更是多次访问中科大,并担任理学院名誉院长,倡导在中科大少年班中设立计算机软件专业,推动中国计算机科学发展与国际水平接轨。

在老师和亲朋的建议下,许锦波思索再三,对数学的热爱转移到理论研究上,便将志愿定为“中科大计算机科学技术系”,并选择了更偏向理论研究的“计算机算法”专业。

虽然专业偏向理论,但许锦波先于多数同学上手代码和实际项目。大三下学期(五年制),他在校外找了一份工作,在一家做金融服务软件的美国公司(合肥办公室),主要做美国股票分析系统的用户界面。

90年代初,许锦波用的还是元老级的编程语言——Borland C/C++来开发项目,写了多少行代码,他已经记不清,但写代码的能力却得到了锻炼。

他回忆道,“那时还没有实习的想法,更多是想打工挣钱。当然学校机房确实没几台电脑,学校更强调把基础打牢,四大力学是必修课。”

抱着深造的目的,许锦波决定硕士研究计算机的另一分支——计算机系统 。用他自己的话讲,“当时想学怎么造计算机。”

1996年,许锦波进入中国科学院计算技术研究所(下称“中科院计算所”)。在那里,许锦波结缘中科院一支高性能计算研究组——曙光组。

90年代初,时任国家智能计算机研究开发中心主任的李国杰,带着一支没有设计经验的队伍,承担了研发“超级计算机”的重任。就在许锦波到来的前一年,曙光组做出一个重要决定:863计划下一个目标产品曙光2000,不再沿着计划原定的“超级计算机”方向走,而是转向研制“超级服务器”。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

李国杰(身穿深色衬衣者)

两者区别在于,超级计算机主要用于科学工程计算,从计算速度上追赶国际先进水平。而超级服务器是更加通用的高端计算机,除科学计算外,更多地用于事务处理与网络服务。

这一决策也影响了许锦波后面的研究方向。

三年里,许锦波的重心放在了“分布式系统以及计算机安全”,陆续参与了曙光组的前沿项目,如虚拟主机系统、高可靠性系统等工程化项目。

他的朋友以及合作者对他的评价是:无需助手,能独立进行一项课题,独立用算法实现一系列想法。这种能力,很大程度上得益于这段工作经历。

许锦波说,“代码能力将成为不可忽视的底层能力,不仅是计算机专业要这么做,每一个理工人都要视其为基本功。”

一悟归身处,何山路不通

1999年,南斯拉夫大使馆事件让中美关系陷入僵局。转去加拿大,成了当时很多人求学和任教的共同选择。许锦波也是如此。

这一年,他去往加拿大南部腹地的大学——滑铁卢大学(临近多伦多),继续攻读计算机科学系。

在许锦波入校前,学校指派了一位做并行算法的印度裔教授Prabhakar Ragde为其导师。这位导师指导宽松,第一年,许锦波涉猎各个领域的论文,找感兴趣的科研方向。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

Prabhakar Ragde教授

2001年上半年,人类基因组计划(HGP)比原计划提前两年完成,历时11年的多国合作项目落下帷幕,随即进入了“功能基因组学”时代,研究的重心由基因组的“结构”向基因的“功能”,也就是向蛋白组学转移。

学术界一个明显趋势是,越来越多的学者愿意用计算机科学解决一些实际的生物学问题。两个学科的结合越来越紧密,直至融合形成一个新兴学科——计算生物学。

许锦波深受鼓舞,抱着试试看的心情,他毛遂自荐转入方向更为契合的滑铁卢大学李明教授组里。

为何转入李明门下?

实际上,许锦波本硕就读时,李明曾先后到中科大和计算所做过两次讲座,当时李明已凭借Kolmogorov复杂性、不可压缩方法、信息距离理论等研究,享誉计算机科学界。

1990年,李明做出了长度为O(n log n) 的超串来逼近长度为n的最短超串,成果发表至计算机科学领域的顶级会议期刊FOCS。

一年后,李明找到在加拿大麦克马斯特大学任教的姜涛,以及从荷兰来的访问学生John Tromp,合作钻研最短超串(shortest superstring)解决法。

正在此时,三人发现MIT的Avrim Blum、贝尔实验室的Mihalis Yannakakis,也在钻研这一问题,并且也独立得到了修改过的贪婪算法线性解。最后,五人合作发布了一篇STOC论文《 Linear approximation of shortest superstrings》。

后来,这一证明被收录至众多计算生物教科书中。

因此,在许锦波转入其门下时,李明已经成为生物信息学的一位大家。

按理说,李明在停薪留职期间不收学生,但他欣赏这位后生,两人都毕业于中科院计算所,说起来师出同门。于是,李明从Prabhakar Ragde那里要来了许锦波,算是合作培养。

2001年,许锦波正式做起了计算生物学。初次接触,李明对许锦波说,“有一个很难的问题,研究蛋白质折叠,想不想做?”

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

李明教授

那时候,学界已经研究了四十年的蛋白质结构问题,一直难有大突破。李明也从未将此课题向任何学生提及,甚至他自己也未涉足这一课题。

许锦波为什么愿意接手?

多年后,他回忆起这个决定:“我们选择研究课题的时候,通常要选择一些比较重要和困难的问题,如果问题不重要,就没必要花时间研究;如果问题不难,几年之内就被别人做出来,也没有多大意义。”

对27岁的许锦波来说,接下导师抛过来的这一选题,也意味着他要进行一次大范围的自我转变。不过,许锦波也不觉得这是明显的换方向,仍然是用计算的方法解决问题,只不过对象换成了生物学。

不过,紧接着他又补了一句,“就算博士几年一点结果都做不出来也没关系,大不了去硅谷写代码、当码农。”

许锦波说的不无道理。

加拿大最早成立计算机科学系,就在滑铁卢大学。而该系所属的二级学院,正是加拿大唯一且全球最大规模的独立数学院——滑铁卢数学院。作为数学院最具传奇色彩的计算机科学系,微软、谷歌、Facebook早早就来抢未毕业的学生。

决定从一个非常热门的领域跳出来,去做生物学研究,无论对谁来说都需要很大的勇气。

许锦波也没想到,这次转变将影响他一生的科研方向:在此后的二十余年时间里,他的任务就是开发和优化算法,去无限缩小蛋白质结构预测结果和真实构型之间的差距。

不过,开始研究生物学问题的半年时间,许锦波就很痛苦,“论文专业术语都看不懂,也没人可以问。”

许锦波坦言,当时他只有高中的一点点生物知识。滑铁卢大学是强理工科背景,仅有一个很小的生物系,他跟生物系教授没有很多交流。此外,导师李明还在加州学术休假,不像现在发个微信就可以交流,师生二人两个月才能见一次面。

那段时间,许锦波只能靠自己去啃论文,除了吃饭睡觉全是做科研。

“可能和大家印象中的科研形象不一样”,许锦波笑着说到,“一个生物学家的实验室是各种试管和试剂,但作为计算生物学家,全部的科研工作都在一台电脑上完成。”

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者


左图为生物学家实验室,右图为许锦波实验室

这也诠释了计算生物学领域的研究手段,既有传统的生物实验,即湿实验;也有包括计算手段在内的数学建模、数值仿真、数据分析,或是机器学习,即干实验。

和传统的湿实验相比,干实验最大优势即不需要特别大的经费投入,其次是比较灵活,可以随时开展一个新的研究项目。

那段时间,许锦波沿用一种干实验方法研究蛋白质折叠——能量优化。

他解释到,安芬森法则是蛋白质结构预测的基石。在安芬森这个假设和理论基础之下,科学家们去做蛋白质折叠预测,都是从能量优化的角度去做。如果将这种方法教给计算机,就可以一步步优化能量,从而达到预测蛋白质结构的目的。

2002年,李明学术休假结束,回到滑铁卢,许锦波马上告诉了他一个好消息,“马上要开始今年的CASP(全球蛋白质结构预测比赛)了,我们也去参加。”

结果是,许锦波在全自动高通量蛋白质结构预测的评比中一举夺冠。

不过,许锦波认为,“虽然排名最好,但不是大的突破,因为预测结果并不比以前的方法好很多。”

他重新梳理那一年来的工作,发现这一思路有着天然缺陷。

“第一,一个蛋白质是一个非常大的体系,由成千上万个原子组成,对应一个非常巨大的搜索空间,构型是千变万化的。第二,虽然说大家普遍接受蛋白质折叠到最小能量状态,但能量函数到底是什么样的?我们本身就对能量函数的理解还不是特别好。”

在当时一大批学者纷纷比拼更好的能量优化方法之际,许锦波站在了这一方法的对面:把生物学问题当成纯粹的算法问题,或许并不能从根本上解决问题。

“传统的能量优化方法可能不是一个很好的路径。”

十年磨一剑,霜刃未曾试

2003年,许锦波博士毕业后计划赴美,开启博士后工作。

然而,受2001年9月11日恐怖袭击影响,美国政府一度收紧了赴美学生签证,许锦波的签证一直处于被审查状态。

无奈之下,许锦波选择暂留本校任教,一边做助理教授,一边等待签证过审。

这也让许锦波错失了拜入徐鹰(时任佐治亚大学生物信息系主任)门下的重要机会。而导师李明曾推荐他去哈佛,最终也不了了之。

等待的时间里,许锦波做了一个新问题——蛋白质的侧链结构预测。

那时,学术界对蛋白质结构预测的研究重心是主链蛋白,许锦波博士期间的精力便集中于此。

为何从侧链下手?这是因为,蛋白质三维结构由主链和侧链共同搭建而成,算法预测蛋白质结构的步骤,是先以蛋白质主链建模,再根据主链的构象为侧链建模。

自然界中的蛋白质含有20种氨基酸,它们的主链几乎完全相同,而侧链差异很大。因此,精准的蛋白质侧链建模对蛋白质折叠和蛋白质设计至关重要。

签证背调用了近一年时间,许锦波也在这个方向上投入了近一年时间。

他并没有沿用当时学界的主流方法,通过SCWRL软件做近似优化,而是将图论算法引入侧链结构预测,成功地将侧链结构预测的时间,从十几个小时缩短至几分钟。除了速度提高了上百倍外,新方法还可用于构象复杂性更高的蛋白结构。

“这算得上是侧链结构预测中,第一个不需要完全暴力运算的算法。”

2004年,许锦波将成果投递于RECOMB(国际计算分子生物学大会)。这是与ISMB(国际计算生物学会)齐名的计算生物学两大顶级会议之一,会议从1997年开始举办,自2003年后投稿数量开始增加,接收率降低到20%左右。

此后很多年,许锦波陆续在RECOMB会议上分享过多次研究成果,并获得了诸多奖项,如2009年最佳海报奖、2014年最佳论文奖、2019年时间检验奖。

许锦波印象最深的,还是2004年第一次投递RECOMB。他记得,2004年上半年,自己的签证终于过审。于是马上动身前往MIT,开始了博士后生涯。2005年,该论文被RECOMB顺利接收,许锦波被邀请前往波士顿做会议报告。

在那时,这一成果并没有受到很多生物学家的关注,这和学术圈里的一个规律有关。

许锦波解释道,“一般而言,多数生物学家认为期刊论文更有价值,但在计算机领域,科研成果有很高的时效性,投稿一般都选择学术会议,便于和同行交流。”

拿当下最热的深度学习来说,2014年AlexNet算是第一个大获全胜的DL模型,距今仅8年时间,已经变成了公认的老古董。大约同年,生成对抗网络GAN出现。截至目前,起码有几百种能叫上来名字的GAN变种。

2015年,物体检测领域R-CNN被提出,深度学习正式攻陷此领域,之后fast-RCNN、faster-RCNN、YOLO、SSD、mask-RCNN,几乎每年都有重大突破。

因此,计算机领域日新月异的发展特性,决定了重要结果几乎先在会议上分享,其次才会在期刊里发表会议文章的扩充版本。

许锦波不知道的是,就在报告现场,他的成果吸引了一个人的特别关注。

几天后,许锦波收到了一封邮件,邀请他将成果整理为期刊论文发表,落款是时任Journal of the ACM(计算机科学领域顶级期刊)的德国编委,Thomas Lengauer。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

Thomas Lengauer教授

曾于2018年至2021年担任国际计算生物学学会主席的Lengauer,与许锦波的经历相似。

自20世纪90年代初以来,Lengauer的研究重点从理论计算机转向计算生物学,其中一个研究方向就是蛋白质结构和功能预测。2001年后,他一直担任马克斯普朗克信息学研究所(MPlI,位于德国)计算生物学和应用算法部主任。

而当时他所担任编委的JACM,正是ACM (Association for Computing Machinery,国际计算机学会) 的官方刊物,遴选标准极为苛刻,只刊登对计算机科学有长远影响的论文,理论偏向性很重。成立至今的68年里,仅发表了3000篇论文,平均一年不到50篇。

收到来信后,许锦波马上在论文中加入了一些理论结果,并于2005年投递于JACM。

而这一意外之举,直接将许锦波的命运向前推了一把。在此之后,许锦波的研究得到了计算机学者、生物学者、以及计算生物学家等更多人的支持,为他留美任教埋下了重要伏笔。

2005年,许锦波去往芝加哥大学附属的丰田技术研究所(另译:丰田工大芝加哥分校,TTIC,Toyota Technological Institute Chicago)任教。

TTIC是丰田工业大学与芝加哥大学共建的独立计算机科学研究所,于2003年9月正式运营,目前仅13名正式教授。

与众多高校不同的是,该研究所成立之初曾获2.6亿美元捐助,资金充足、支持力度大,可以支付大部分科研经费。

21世纪初,机器学习还没有迈入黄金时期,该研究所便意识到机器学习的价值,将其作为研究方向之首。此后,许锦波的研究方法逐渐从能量优化转换为机器学习,便是受研究所影响。

许锦波表示,传统的机器学习方法是直接把蛋白质的氨基酸序列映射到一个三维构型上去,比基于物理或是统计的方法做得好一点,但并没有得到本质上的改变,以至于大家认为蛋白质结构问题没办法预测出来。

这段时间,很多人做不出新成果,申请研究经费也非常困难,陆陆续续从蛋白质结构预测转向其他领域,比如RNA结构预测、系统生物学等。

那种冷清直接反应在人数上:CASP会场中不足两百人,仅有新世纪初的三分之一。

许锦波的朋友也多次劝说他换个方向:凭他的能力,完全有机会在其他领域再起炉灶。

许锦波没有动摇,他解释说,“这和我的性格也有关系,而且我的团队一直不大,不想分散精力去管理一个大团队,做太多不同的方向。”

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

许锦波在丰田技术研究所任教时留影

一直到2014年,局面出现一线转机。

2012年,深度学习开始在图像识别领域展示出威力。许锦波很自然地想到,能不能用深度学习去做蛋白质结构预测。

2014年,许锦波设计了一种新的深度学习算法,从更为简单的问题入手——预测蛋白质的二级结构,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。测试发现,深度学习对这个简单问题有效。

这个时候,生物信息学领域里,只有极少数人关注到深度学习这一新的工具。

2015年和2016年,许锦波再次开发了一种更好的深度学习算法,可以直接用来预测蛋白质的三维结构。许锦波解释道,“与能量最优化的传统方法不同,深度学习带来的新思路是预测原子之间的相互作用关系。”

很多人对此后的事情并不陌生。

2016年暑假,许锦波开发出第一代人工智能方法RaptorX,证明了深度残差卷积神经网络可以大幅度提高蛋白质结构预测的性能。

许锦波表示,“我们当时预测的一个有两百多个氨基酸的膜蛋白的结构,误差大概是2.29个埃,已经非常接近用实验技术解出来的结构的分辨率。”

2016年全球蛋白质结构预测比赛(CASP12),许锦波的这一方法震惊了在场人。这一年秋天,许锦波在自己的研究所召开了一个小型报告,邀请了芝加哥大学生物物理系合作者,共同探讨研究成果。

其中一位是芝加哥大学生物物理系的博士后,在听完许锦波报告后,全力转向深度学习方法,并在一两个月后加入Deepmind。他就是后来领导DeepMind团队,设计了AlphaFold人工智能系统的John Jumper博士。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

John Jumper,被《Nature》评为2021年度十大科学人物

随后,许锦波也将论文成果公布于网络,发布后的第一个月,即在领域内引起了一波关注。

2017年1月,这篇论文正式发表于国际计算生物学的官方期刊 PLoS Computational Biology,并在2018年上半年拿到了该刊创新突破奖。

在2018年的CASP 13中,许锦波进一步在比赛中验证他的深度学习方法,激励了蛋白质结构学界的许多研究小组,其中最具代表性的要属DeepMind、Baker两支团队,相继推出了 AlphaFold2、RoseTTAFold等AI模型,将AI预测蛋白质结构的研究推向高潮。

许锦波也逐渐有了“AI预测蛋白质结构全球第一人”的称号。

不过,这个成果本可以更早。因为2015年,许锦波就组织了学生去实现他的想法,但没有成功。2016年初,腾出一些时间的许锦波开始亲自写代码,直至七八月份完成初步成果。

还有一个小插曲是,这一成果最初投递的是《Nature》子刊,但是审稿的编辑不太相信结果。“因为这个问题研究很多年了,一直没有什么进展,他不认为我们能做得这么好。”事实上,无论是从方法还是成果上看,深度卷积残差网络都超前于时代。

所以,即便是跟随许锦波多年的学生,或是权威杂志的审稿人,都很难理解他和他的成果。许锦波说,“当时计算机科学背景的人都在扎堆做序列,研究结构的非常少,所以很多结构预测方面的成果不那么受重视。”不过,也有很多人成了许锦波“学术上的朋友”。

曾在1994年创办CASP比赛,现任马里兰大学细胞生物学和分子遗传学系教授的约翰·莫尔特,对许锦波的工作作出了肯定。

他评价道:“DeepMind在开发一种非常有效的方法方面做得很好。然而,这项工作背后的概念和方法并非凭空而来,关键技术是深度学习方法的应用。毫无疑问,DeepMind直接建立在许锦波的工作之上。”

此外,2012年就转向深度学习,并在许锦波博士阶段指导过他的许东(现密苏里大学校董事会教授),对许锦波的工作寄予厚望:“锦波是蛋白质结构预测的少数且最重要的贡献者之一。随着蛋白质结构预测在更广泛的领域中取得进展,这一领域很可能再获得诺贝尔奖的认可。”

而许锦波的导师李明,更是毫不吝啬对爱徒的赞赏,“他是我在职业生涯中遇到的最有才华、最杰出的学者之一。”

一木不成林,百花方为春

蛋白质结构预测的冷清已经是过去式。2020年,AI预测蛋白质结构,被国际顶级学术期刊《科学》杂志评为“十大科学突破之一”,2021年又被评为“十大科学突破之首”。

2021年8月,DeepMind公司在《Nature》上宣布,已将人类的98.5%的蛋白质预测了一遍,计划当年年底将预测数量增加到1.3亿个,达到人类已知蛋白质总数的一半,并且公开了AlphaFold2的源代码,免费开源有关数据集,供全世界科研人员使用。

现任佐治亚大学校董事会教授的徐鹰,过去二十年来逐渐跳出蛋白质研究,转向了更接近实际问题的肿瘤生物学。看到越来越多工业力量的加入,他感叹,“现在,AI技术已被应用于各种与蛋白质相关的问题,但这一切都有迹可循,离不开锦波多年来的坚持,他很善于用不同方法不断改进自己的研究工具。”

许锦波很乐于看到DeepMind继承了他的思想。

“这种颠覆带来的改变非常大,特别是改变了分子生物学家做研究的范式——以前分子生物学家研究一个蛋白质,都是基于氨基酸序列去研究蛋白质的功能,但现在我们有了精确的结构预测,分子学家可以直接基于预测出的结构去研究蛋白质的功能。”

被改变的,不仅仅是一种研究方式,更是一个产业的崛起。

互联网巨头如微软、甲骨文、英伟达、亚马逊,以及中国的腾讯、百度、字节跳动和华为等都在竞相押注“AI for Science”。

许锦波认为,“当下的确是一个好时代。”

2021年年初,清华大学智能产业研究院(AIR)的张亚勤找到许锦波,询问其回国意向。2021年6月开始,许锦波陆续收到多方投资意向书。

很快,昌平国家实验室的高毅勤教授(现任北京大学化学与分子工程学院教授)、谢晓亮教授(现北京大学生物医学前沿创新中心主任)也找到许锦波。

两位教授坦言,国内学者评职称与论文数量和影响因子强绑定,从事计算生物学的人比较吃亏,这个领域的学者太少;但如果以计算机学者的身份,更是吃亏。工业界薪酬高、待遇高,多数人想去大厂。即便是资格老的教授,门下无人的现象常有。

“你愿不愿意回来?”

这个问题更像是一种期盼。许锦波清楚,培养交叉型人才不是一个教授能推动的,但需要有人站出来。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

高毅勤教授、谢晓亮教授

2021年9月,许锦波回国,将视野转向应用空间更大的AI蛋白质优化设计方向。

谈及回国后的创业规划,许锦波表示,“我希望打造一个有中国特色的计算生物学,连接「 产学研用」,在创新药研发、生物材料、合成生物学等领域做出一些真正有用的东西。”

他兴致勃勃谈到,“比如能否把一个抗体优化得更好,使得它能够跟抗原结合更好;或者设计一个自然界不存在的蛋白,用它来做药或工业生产,比如我们可以设计一些新的酶来提高工业催化的效率。”

2022年1月,许锦波的公司成立,取名为“分子之心”(MoleculeMind)。

此后,由许锦波牵头,分子之心在国内组建了一支25人左右的团队,其中不乏生物计算、计算机科学、生物化学物理等多学科背景的研究人员和工程师。

4月份,公司完成数千万美元天使轮融资,由红杉中国领投,百度风投、生命园创投基金、芯航资本、未来启创等跟投。

7月份,公司自主研发的AI大分子优化与设计平台“MoleculeOS”正式亮相,填补了我国尚没有功能完整的AI蛋白质设计和优化平台的空白。

8月份,AI蛋白预测完成三级进化,全球首发孤儿蛋白预测新算法,进一步扩大了人类在蛋白质结构预测领域的探索效率和边界。

如今,分子之心计划与国外同行开展联动,在全球范围内同步打造专业的研发实验室,并持续寻找等各方面的优秀人才。

作为全球人工智能和生命科学的交叉领域首屈一指的顶尖华人科学家,许锦波的社会责任是什么?

他有一句话,很能回答这个问题:“AI颠覆了蛋白质结构预测,但这只是一个开始。我希望打造出中国生物经济时代的基础设施。”

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

分子之心MoleculeOS平台框架图诚然,如许锦波一样,生活在二十世纪中后期的一些学者是幸运的。他们有机会亲身见证历史的发生——70年代合成生物学诞生、80年代生物信息学诞生、90年代人类基因研究诞生、新世纪初基因测序成果诞生……如今,一个AI生命科学的时代到来。他们一生的探索都围绕生命科学的话题,他们的激情与困惑,真诚与彷徨,成为这场科学探索中不可分割的一部分。幸也,李明、徐鹰、姜涛、潘毅、周耀旗、许东、许锦波,为生命真理的探索并未结束。

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

作者注:

1993年,中国参与人类基因组计划,生物信息学科迎来大爆发。在近三十年的时间里,一大批生物、化学、物理、计算等专业的学者,前仆后继加入到学科的产研建设,那是一个灵感迸发、情谊绵长的年代,也是一个走出质疑、迷茫的年代。目前,雷峰网启动《生物信息学的三十年往事》专题,陆续推出了李明、徐鹰、潘毅、周耀旗、许东、许锦波等新老学者的人物故事,记录光辉岁月,以照后人之路。关于生物信息学的更多故事,欢迎与本文作者吴彤交流,微信号:icedaguniang

雷峰网(公众号:雷峰网)雷峰网


长按图片保存图片,分享给好友或朋友圈

「AI预测蛋白质结构第一人」许锦波:十年冷清终不渝,一个计算生物学的拓荒者

扫码查看文章

正在生成分享图...

取消
相关文章