现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

作者：任平

2022/10/19 16:04

回想2020年AlphaFold 2的横空出世，以及延续下来的AI制药创业热情，我们很难承认这是一个人或者一个团队的灵感成果。李明与他的前辈、后生，在所处的数个巨变时代中，成为了一个个照亮学科和行业的‘持炬者’。

说起李明，诸多生物信息学学者都不吝称之为“学术大师”：他的学界成果以及给后世带来的启发性思考与推动，持续了数十年。

他在机器学习、自然语言处理、算法平均复杂度、现代信息论以及生物信息学方面都做出了重大贡献，解决了计算机科学领域诸多难题。

他的成就记录在Nature、Nature Methods、Nature Machine Intelligence, Nature Communications, PNAS、Scientific American、JACM、CACM、FOCS、STOC等国际顶级杂志和会议上。在谷歌学术，文章引用数超过三万五千次。

他是现代信息论奠基人之一。他与荷兰计算机科学家Paul Vitanyi合著了经典著作《Kolmogorov复杂性及其应用》。这本书至今四次再版，广为引用，被学界公认为迄今为止最具前瞻性的指导性文献之一。

Amazon的读者评论：这本书是每个程序员必读之书。芝加哥大学教授Lance Fortnow 称这本书是本领域独一无二的必读书。这本书写作严谨、文笔流畅、理论漂亮、应用新颖、信息全面，赢得了Amazon上众多读者的青睐，他们少见地为一本深奥的数学著作给出一致的5星好评。

他是加拿大皇家科学院院士、ACM、IEEE和ISCB 的Fellow、以及Killam Prize的唯一一位获奖大陆华人。

他还是一位创业者。2000、2013年分别创办两家公司，二十多年里，他的生物信息公司不仅商业能力稳健，还为无数生物信息学者的技术落地架起了一段桥梁。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

李明院士数十年来，生物信息学科从无到有，经历了探索、勃兴、反思、革命等诸多重要节点，时代奔腾，学科起伏。

与李明同时代的好友姜涛、徐鹰、许东等人，仍在为学科奔走。

李明的晚生，如许锦波（博士师从李明）回国创立了分子之心、彭健（博士师从许锦波）创立了华深智药，师徒的情谊有了更多传承的意义。

他的足迹，是一幅跨越30年的生物信息学恢弘图景。

前半生的七所学校

北京海淀区科学院南路6号，是中国科学院计算技术研究所（下称“计算所”）。

1956年8月，中国科学院决定，成立计算技术所等三个研究所筹委会，并建立半导体物理研究小组，中国第一个专门从事“计算机科学技术”的学术机构由此诞生。

我国第一台通用数字电子计算机、我国高性能计算机的研发基地、我国首枚通用CPU芯片，都出自于此。

计算所有一条准则：瞄准国家重大需求，开展研究和技术转移工作。很长一段时间，计算所都是我国的计算机人才高地，一大批年轻人代表国家新兴力量留学海外。

其中一位，就是李明。

1980年，李明成为科学院公派出国的第一批研究生。这年4月，李明前往美国密歇根三大高校联盟之一的韦恩州立大学（WSU），攻读计算机科学硕士。只用了8个月时间，李明取得WSU硕士学位。

1981年，他赴康奈尔大学（Cornell）继续攻读计算机科学系。康奈尔大学是美国大学协会的十四个创始院校之一，著名的常春藤盟校八成员之一，李明在那里成为「计算复杂性」理论奠基人、图灵奖得主——Juris Hartmanis 的学生。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

Juris Hartmanis教授

康奈尔大学的计算机科学系与Hartmanis有着重要渊源。

五十年代，Hartmanis拿到博士学位后，曾在康奈尔大学数学系任教过一段时间，后加入通用电气公司的信息研究部，与Richard Stearns一起开辟了计算复杂性。直到1965年，Hartmanis才离开通用电气，重返康奈尔大学任教。但他没有回到数学系，而是负责筹建计算机科学系。

Hartmanis的到来，随即吸引了一批著名计算学者加盟，J.E.Hopcroft（1986年图灵奖得主)、David Gries（1995年ACM优秀计算机教育奖获得者)、E.Horowitz、P.Wegner、A.Shaw，都慕名而来。

李明加入时，Hartmanis带领的计算机科学系正值发展上升期。蔡进一、郭百宁、周礼栋后来也陆续来到了该校计算机系。

Hartmanis任教的25年中，有21个博士研究生，李明是第13位。他延承了导师的的计算复杂性研究。博士期间，李明曾用Kolmogorov复杂性完全解决了Hartmanis-Stearns 20年前留下来的未解难题。

此前，Michael O. Robin以及Zvi Galil等人曾做出部分进展，但一直没有人彻底解决该问题。

李明创造了一个分析算法平均复杂性的新方法。他解释道，图灵机有一个单向输入带，而他用一个工作带，成功模拟出两个工作带的紧致时间下界，开创了Kolmogorov复杂性在计算机领域的应用。

这个方法后来被李明和他的同事们用来解决诸多问题，如，Shellsort平均复杂性、Heapsort平均复杂性、Lovasz Local Lemma的新证明——多头有限状态自动机是否可以做字符串匹配，k个下推栈是否真的比k-1个好，等等。

1985年3月，李明拿到博士学位后，去了俄亥俄州立大学的计算机科学与信息系任教一半年。

同期，李明的中科院硕士同学李国杰也读完博士（1981年李国杰前往美国普渡大学攻读博士学位，师从美国计算机界的权威华云生教授），进入伊利诺伊大学CSL实验室工作。两年后，李国杰回到中科院计算所，开始了自己终身的科创事业。

1986年，李明去往哈佛师从图灵奖得主——Les Valiant，做了一年的博士后。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

Les Valiant教授

Les Valiant是一位英国人，同样是计算机科学背景，求学和任教经历相当丰富。他先后在英国剑桥大学、伦敦帝国理工学院、华威大学的计算机科学系学习，此后在卡内基梅隆大学、利兹大学和爱丁堡大学任教。直到1982年，Valiant来到哈佛，在异国他乡开始了长期的教学生活。

Valiant的一大贡献是1984年的论文《A Theory of the Learnable》，这让诞生于1950年代的机器学习第一次有了坚实的数学基础，对人工智能诸多领域包括加强学习、机器视觉、自然语言处理和手写识别等，都产生了巨大影响。

在与Valiant做博士后度过一年后，李明先后在哈佛大学Aiken计算实验室和加拿大约克大学短暂任教。两年后的1989年，他以副教授的身份去了滑铁卢大学的计算机科学系，与彼时刚刚博士毕业的杨强成为同事。

若干年后，杨强再赴他处就职，而李明留在了滑铁卢大学，1994年拿到终身教授职位，2009年成为校级教授（University Professor），并一直工作至今。

滑铁卢大学计算机系和多伦多大学计算机系一直并列为加拿大第一名，但滑铁卢大学计算机专业从来都是加拿大理科学生的首选。

在当地人心中，滑铁卢既是一座大学城，也是加拿大的高科技重镇。这所位于加拿大安大略省多伦多市西部、距离多伦多市区大约100公里的学校，创建于二战后的1957，其初衷就是为加拿大的经济建设培养人才。

正因如此，学校非常注重工程学科的建设和发展，尤其是计算机科系和工程系，学校更是倾其全力发展，并以全面的Co-op系统（Cooperative Education Program，指“带薪实习课程”）而世界闻名。时至今日，这两大系仍是滑铁卢大学的学术根基。

在这里，李明迎来了自己研究生涯的第一个“转型期”。

“误入”生信深处

在与雷峰网的对话中，李明坦言：“完全是误打误撞做起了生物学问题。”

在滑铁卢开始独立研究后，这位在计算机科学道路上近乎一路直线前进的学者，绝想不到自己会有一天与人类基因组计划产生联系。

1985年，人类基因组计划提出。这份史无前例的全人类的合作计划，不到五年时间就完成了全部的准备工作。

1990年，美国正式启动了该计划。投资30亿美元，用15年时间，破译组成人体约2.5万个基因的30亿个碱基对，绘制出关于人类基因的遗传图、物理图、排序图、转录图等所有图谱。

换言之，美国试图用“1美元1个碱基对”的预算，破译一本“生命天书”。

然而，这30亿碱基对相当于30亿阶楼梯，要按照正确的顺序排列完成，工程之浩大难以想象，被称为美国历史上的“第三大工程”（第一大工程为1944年的曼哈顿原子弹计划，第二大工程为1969年的阿波罗登月计划）。

人体基因组计划的意义及复杂程度史无前例。一旦揭开了基因的奥秘，人类将获悉生命的种族、血型、孕育、生长、凋亡等过程的全部信息。这也是为什么美、英、法、德、日和中国等六国的科学家，要共同参与这项国际性科研的原因。

一场对人类终极奥秘的探索，以1990年作为了分水岭。

在《生物信息学三十年》系列专题中曾提到，徐鹰、许东二人就是在这个时候参与到人类基因组计划中，他们建立了各种生物数据库，开发各种检索工具，并在DNA和蛋白质序列分析方面，合作做出了那个年代最好用的算法工具Prospect。

1989年，李明来到滑铁卢大学，接触的第一个问题就是困扰了计算机科学十年的——最短超串的近似算法分析。他发现，这一抽象的理论研究能够解决当时科学界的一个实际问题—— DNA序列的组装Shotgun算法的精确度问题。

用现在的眼光和影响来看，李明的这一发现恰逢其时。

基因组测序的困难在于，当时的技术无法准确读取长链，“读取”技术仅能够有效地读取较短的链。于是，科学家们决定将长链切成较短的碎片进行测序，最后在所有测序完成后，再拼装片段形成完整的DNA。当时应用最广的一种技术为“快速标签测序法”，被多国合作小组所承包。

但没想到的是，在人类基因组计划启动后，这项研究不仅迅速席卷多国，同时也扩散到诸多私营性质的基因研究机构中。

其中，最具代表性的就是的文特尔（J. C. Venter），他在1991年提出“霰弹枪法”的测序技术，目的是将一个细胞的所有基因复制多次，粉碎成无数个DNA小片段，再把大量基因测序工作交给计算机，从而大大加快DNA测序速度。一旦成功，他将把基因测序商业化，申请基因成果专利。

一场公私之间的竞争，在三十年前拉开帷幕。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

J. C. Venter

李明身在计算机科学领域，却发现了一个关键问题。

他注意到，霰弹枪法虽然大幅度提高了测序速度，但也造成了众多重合度过高的碎片，导致原序列重建时速度降低。因此，只需要在大量的碎片中找到有最大重合的碎片，就可以像玩拼图游戏一样，将基因组还原，组装速度大大加快。

这也就引出了“最短超串（shortest superstring)解决法”。

1990年，李明做出了长度为O(n log n) 的超串来逼近长度为n的最短超串，成果发表至计算机科学领域的顶级会议期刊FOCS。

一年后，李明找到在加拿大麦克马斯特大学任教的姜涛，以及从荷兰来的访问学生John Tromp，合作钻研这一问题。三人相距不远，同在加拿大安大略省，开车一小时的距离。频繁交流中，姜涛解决了修改过的贪婪算法的线性解。

正在此时，三人发现MIT的Avrim Blum、贝尔实验室的Mihalis Yannakakis，也在钻研这一问题，并且也独立得到了修改过的贪婪算法线性解。

“分头做不如合作”，李明表态。五人一拍即合，最后由李明解决了原始贪婪算法的线性解，并合作发布了一篇STOC论文《 Linear approximation of shortest superstrings》。

无意中，李明这一为期两年的研究，为人类基因组测序方法提供了理论依据，为这一全人类的科研项目添了一把火。

后续，这一证明被收录至众多计算生物教科书中，其中影响最为广泛的一本，就是1995年被Michael S. Waterman（生物信息学和计算生物学的奠基人之一）收录至个人所著的《Introduction to Computational Biology：Maps, sequences and genomes》。

不过，对于这项成果，李明表现得相当淡然。他向雷峰网(公众号：雷峰网)说到，“完全是误打误撞，我们把一个计算理论的问题解决了，属于先有了锤子再找钉子，结果可以用在生物学上，挺好玩，我们就开始做计算生物学了。”

也正是在这几篇论文之后，李明走向了生物信息学。

1995年，李明和时任明尼苏达大学计算机系教授的堵丁柱，决定回国创办一个计算机和算法相关的会议。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

堵丁柱教授

此时，国内与国外是两个不同的世界。

尽管中国从1993年已经开始参与人类基因组计划，但由于国内人才缺乏、信息网络建设落后，生物信息学一直发展缓慢。

李明和堵丁柱起意，办一个包含计算理论、算法、组合优化、生物信息学几个方向的会议，每年举办一次，名字就叫计算与组合学国际会议，英文简称COCOON，是李明和John Tromp 一起起的名字。

有意思的是，这个简称对应的是正是英文单词“茧”。这似乎暗含了李明的期待：中国生物信息学能如蝴蝶破茧。

在这次会议后，我国的生物信息学真正进入了“黄金时代”。90年代中期，李衍达、孙之荣、陈润生、郝柏林等国内学者，成为了这股学术潮流的“奔走者”。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

李衍达、孙之荣、陈润生、郝柏林四位教授

此后，清华大学迅速成为学术中心，先后举办了华北生信研讨会，成立了我国第一个生物信息学重点实验室——清华大学生物信息学研究所，并在新世纪后扩大规模，从区域会议变为全国会议，推出教育部直属的生信重点实验室。

后来也在国内创立生信会议的徐鹰，曾称赞李明是一个“大”学者：所谓学者之大，即耕耘在今日，收获在未来。

李明的黄金时代与合作者联盟

进入新千年，伴随着人类基因测序工作完成，生信研究再次迈入新时代——后基因组时代。

这次转变的一个重要标志是产生了「功能基因组学」，基因组学研究的重心由基因组的「结构」向基因的「功能」，也就是向蛋白组学转移。

后基因组时代，很多相关专业的人做起了生物信息学，如现任上海计算生物学研究所所长韩敬东、现北京大学前沿交叉学科研究院执行院长、中国科学院院士汤超、以及李明的博士生、被誉为“AI预测蛋白质结构全球第一人”的许锦波。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

韩敬东教授、汤超教授、许锦波教授

套用文化研究者戴锦华教授的一段话：他们非常幸运和不幸地有机会意识到他们置身大时代，而非小时代，就是因为现代文明登顶，这一代人不论他们是否自觉，他们都是作答者。

如果说李明在基因组学的时代还是在做理论、打酱油，蛋白组学时代注定成为他的舞台。

他带领团队开发的PEAKS 系列蛋白组学软件，不仅跨界发表在了Nature Methods、PNAS、Nature Machine Intelligence、以及Nature Communications等期刊上，而且已经成为国际上蛋白组学的主流软件系统，拥有包含几乎所有跨国药企、相关的生物技术企业、研究所、大学在内的4000家用户。

如今在国内，这一是蛋白组学软件系统也覆盖了80%的蛋白组学研究中心。

这些年来，因为工作上频繁接触和经常的思想交流，姜涛(现任加州大学河畔分校校长讲座教授）与李明结下深厚友谊。他一直把李明看作是亦师亦友的兄长，对李明的才能和品质深为敬佩。姜涛说到，“人工智能带动了蛋白组学技术的革命性进展，老大哥李明是这一场变革的主要推动者之一。”

2000年，李明趁着滑铁卢大学的两年学术休假期，去往了加州大学圣巴巴拉分校（UCSB）。

问及缘由，李明说道，“我太太当时想去加州，那儿天气好，就去了。”

UCSB是一个“面朝大海，春暖花开”的滨海院校。临湖沿海靠山，号称全美最美大学，李明描述，“在沙滩走着，还能看到海豚跳来跳去。”

刚到这所最美大学，李明回滑铁卢创建了自己的第一个公司——生物信息学公司Bioinformatics Solutions Inc（BSI），开发蛋白组学通用软件。

他的合作者包括姜涛、马斌、徐鹰、许东、Paul Kearney、Jonathan Badger、Brona Brejova、Tomas Vinar。这一众同事或学生日后全部成为世界上计算生物学中翘楚。

那段时间里，李明还被一位博士生找上门来，希望拜入门下。

这个博士生正是许锦波，他是全国高中数学联赛江西省第一名。许锦波原本在滑铁卢大学跟着计算机科学方向的导师Prabhakar Ragde读博，尝试用计算的方法做一些生物学的问题。

2001年上半年，许锦波决定转入方向更为契合的李明组里。

按理说，李明在停薪留职期间不收学生，但他欣赏这位后生，两人都毕业于中科院计算所，说起来师出同门。于是，李明从Prabhakar Ragde那里要来了许锦波，算是合作培养。

2001年，许锦波正式转行计算生物学。

李明提议，“有一个很难的问题——蛋白质折叠，想不想做？”

许锦波接下了这一课题。回忆二十年前的那股决心，许锦波向雷峰网坦言，“就算一点结果都做不出来也没关系，大不了去硅谷当码农。”

很长一段时间，这对师生都是远程交流，基本上两个月才能见一次。

许锦波说到，“那时候没有现在这么方便的网络会议，刚开始的时候非常困难。”2002年李明回到滑铁卢，许锦波马上告诉了他一个好消息，“马上要开始今年的CASP（全球蛋白质结构预测比赛）了，我们也去参加。”

结果许锦波在这届比赛中一鸣惊人，在用于全自动高通量蛋白质结构预测的评比中，一举夺冠。

对于徒弟的成就，李明没有半点邀功，“我完全没有什么监督，全是锦波自己做的。”

此后很多年，两人都保持着亦师亦友的关系，许锦波去往了芝加哥丰田计算技术所。很大程度上，李明影响了许锦波的学术价值观。李明说到，“做一个事情就要把它做到最好，就算是一个小问题，也力争把它做到世界级水平，不要用论文数量要求自己。”

此后，除了蛋白组学，李明还在Kolmogorov复杂性、信息距离、蛋白质结构预测系统、同源搜索算法等领域都开展了大量的研究，直接促进了信息检索和基因测序方面的进步。

2006年，李明当选加拿大皇家科学院院士，成为获此殊荣的第二位华人学者。在李明之后，凭借计算机科学获得该奖的华人学者还有两位：京东副总裁、加拿大西蒙弗雷泽大学计算科学学院教授裴健、微众银行首席人工智能官、香港科技大学讲席教授杨强。

2010年，李明再获另一重量级奖项——加拿大最高科学奖Killam Prize。自从这个奖设立至今40多年来，李明是唯一一位来自中国的华人学者获得此奖。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

2010年，李明获得加拿大最高科学奖Killam Prize

滑铁卢大学的第一位Killam Prize获奖者William Thomas Tutte教授，于1982年获奖。他曾在二战期间，破译了一系列被称为FISH的德国军事加密代码，使得诺曼底登陆得以大大提前。这被描述为第二次世界大战中最伟大的智力壮举之一。

换言之，近30年后，滑铁卢大学中才诞生了第二位Killam获奖者。时至今日，迄今为止仅有五人凭借计算机科学获此奖项。“深度学习三巨头”的其中两位——Geoffrey Hinton和Yoshua Bengio，分别在2012年和2019年获得Killam奖。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

Geoffrey Hinton和Yoshua Bengio

盛誉加身后，李明继续创业。他最常用一句话告诫自己，“做得更实际一点，更应用一点。”2013年，李明在滑铁卢创办了第二家公司——RSVP Technologies Inc，基于信息论、深度学习与自然语言处理技术，开发了深度语义理解平台，为企业提供场景对话服务。

面向B端客户，这也是李明作为学者创业的独特之处。

他曾在创立之初拿对话系统举例，“针对C端的对话机器人并不受市场买单，其中最根本的一个问题是，目前大家对于语言/文本，在机器能处理的空间中没有一个很好的表达方式，使得现有的对话机器人没有办法从语义和逻辑上去理解对话，并且缺乏自学习能力。”

李明认为，从另一个角度看，NLP的工程化不是一个个算法的累积，也不是一个个任务的独立优化，而应该是系统工程，综合考虑语言、计算、场景等多种因素，不断演进融合，寻求效果满意解的过程。这也是利用NLP技术可以达到赋能B端的原因所在。

至今，这番话仍能引起很多NLP从业者的共鸣。很大程度上，这也是“学者”李明与“创业者”李明的一种默契。

第三次创业，终点是攻克癌症

技术落地，仿佛贯穿了李明的人生，而创业的出发点，也可以从他下面这句话得到答案。

“当年做Kolmogorov复杂度理论，以及shortest superstring，那些都是纯理论问题，只让大家嗨了一下，离实际应用还差得很远。”

2018年前后，谷歌下属的DeepMind实验室，一下子调动了30个人，动用了几百块的GPU，涉足当时略显得冷清的生物信息领域——以深度学习工具预测蛋白质结构。

实际上，这是基于许锦波开始独立研究后的一个工作。

2014年，许锦波曾设计了一种新的深度学习算法，开始使用深度学习去研究蛋白质结构。他先在蛋白质二级结构预测上测试，发现深度学习对这个简单问题有效，由此激发了他进一步的研究。

2015年和2016年，许锦波开发了一种更好的深度学习算法——RaptorX，它可以直接用来预测蛋白质的三维结构。

很快，许锦波凭借这一工作在2016年的CASP比赛中崭露头角。当年秋天，他把结果写成一篇论文发布在了网上。发布后的第一个月，即在领域内引起了一小波关注。次年1月，许锦波将前期成果正式发表于PLOS Computational Biology，将蛋白质结构预测的声浪推向高潮。

自此以后，无论是学术界还是产业界，都对蛋白质结构预测给予了广泛的关注，特别是受到许锦波前期研究成果启发的AlphaFold 2，更是直接带热了AI制药行业。

由于家中亲人癌症去世，从2005年，李明就开始研究癌症。从2000年代以来，李明在质谱仪肽段测序方面做了大量的研究，2016年他发现，结合深度学习可以将此类技术应用在癌症个体化治疗中。

目前，对于癌症治疗的传统方法主要有以下三种模式：手术、化疗、放疗。但是由于手术风险较大，重要器官的肿瘤无法根除，化疗和放疗带来的巨大副作用，价格高昂以及个体差异等种种因素，人们开始在传统的治疗方法以外寻求其他更为高效，对个体更为精准以及副作用更小的疗法。免疫疗法成为不二之选。

李明进一步解释，当一个细胞发生癌变，我们的白细胞抗原(HLA)系统会把一些变异的肽段（新抗原）表达在细胞表面，以通知胞毒T细胞（CD8+ T）来清除这个癌细胞。个体化癌症免疫治疗的关键就是找到这些新抗原。

然而，如何在个体化层面鉴定这类新抗原和相关验证仍然是一巨大挑战。而这，也正是引入是深度学习的关键。李明将其称之为“新抗原的从头测序”。

具体来说，用深度学习寻找新抗原的过程，可以理解为三步：

一、在癌组织里面将癌细胞产生的新抗原提取出来，然后利用质谱仪DIA采集模式，将新抗原肽段产生大的谱图数据载入软件分析；

二、利用个人的HLA 肽段重新训练个体化模型，继续识别患者产生的新抗原；

三、最后也是最关键的一步是，用深度学习鉴定新抗原是否能激起免疫反应，也就是验证其有效性。

在传统方法中，最常见的一种验证方法就是“湿实验”，即通过在实验室里采用分子、细胞、生理学试验方法进行验证。然而，从大量的实验验证到药物研制，这个过程不仅漫长，造价也极其高昂。

针对这个问题，李明提出了模拟人体中心耐受系统的思想来解决在免疫原性预测中没有TCR 的问题，与Ngoc Hieu Tran博士和团队推出一个崭新的DeepImmu AI平台，使用深度学习技术替代传统湿实验室过程，新抗原的检测精度大大提高。

李明说，“生命科学领域存在大量的数据，单纯靠湿实验室远远不够。个性化治疗的普及需要干实验室化，AI将会帮助生物学家将制药流程从湿实验转到干实验。”

从应用价值上看，个体化癌症免疫疗法，也将随着时间发展而更加深刻。它意味着个性化免疫药物不再是花费数十年、耗资巨大的一种药物，而是可以通过产生针对每个人个体的特性新抗原，达到准确的治疗目的。甚至在未来，个体化治疗也将被用于其他疾病，如自身免疫系统疾病的治疗、降低器官移植的排异反应、以及预防癌症疫苗的生产上。

道阻且长，回头再看选攻克癌症这个选择，李明表示，“个体性免疫治疗在改变传统制药业的轨道，也是一个巨大的科学和工程问题。人工智能技术和时代的进步，一定要靠理论的进步，其次要用工程的思维找出一些有价值的应用方向。”

在他看来，与传统制药业相比，个体化制药是中国实现弯道超车的机会，将人工智能与个体化癌症免疫治疗相结合，是完成这个目标的关键。

2020年，BSI公司落地中国武汉和上海，李明取意诗经中的“桃之夭夭，叶之蓁蓁”，将其名为“百蓁生物”。百蓁利用BSI在软件和AI上的优势，在国内开始服务高端蛋白质学CRO市场。

基于BSI的软件，为制药公司、科研院所，提供高端蛋白质组学、糖基化分析、新抗原，蛋白质从头测序，抗体表征等一系列高端CRO服务。随着公司的落地，他们的新抗原测序和鉴定管线已经完成并开始服务。

李明表示，从BSI到百蓁生物，如果能够为生命科学做出一点推动，我的工作就算没有白费。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘

2021年4月，李明院士办公室落成郑州

去年四月，李明促成了一件大事，与郑州中原科技城、中科院计算技术研究所大数据研究院联手，将自己的实验室落成郑州。

落地这家“院士办公室”，它的意义不仅在于人才引领示范，还是郑州乃至中国的科技转型缩影。李明希望未来能够打造大数据抗体和抗原库，将人工智能与个体化癌症免疫治疗方法应用到临床治疗，实现癌症治疗的突破性进展。

在暂时的黑暗中，也最先看到黎明

历史的尖峰时刻，都需要太长的酝酿时间，每一桩影响深远的事件都需要一个发展的过程。就像避雷针的尖端汇聚了整个大气层的电流一样，那些不可胜数的事件也会挤在最短的时间内发作，但它们的决定性影响却超越时间之上。

所以，回想2020年AlphaFold 2的横空出世，以及如今AI制药等创业行业的火热，我们很难承认，这是一个人或者一个团队的灵感成果。李明与他的前辈、后辈，与他所在的数个时代——身在暂时的黑暗中，也最先看到黎明。

他们，是持炬者。

现代信息论先驱李明院士，与他的三十年「生命科学」奇缘