“学生不仅要站着开会,为了能跟上诸位特邀嘉宾的报告进度,更是直接坐在地上记笔记,就连会场放水的桌子上都坐满了‘杰青’。”
这就是前不久在广州召开的第11届全国生物信息学与系统生物学大会(下称“全国生信大会”)的现场。
本届大会由中国生物信息学会(筹)主办,广东省生物信息学会及中山大学承办,主题为《生物信息学与系统生物学及其应用的最新前沿研究》,共设3个特邀主会场和16个分会场,参会人数达1600多人,创造历史新高。
实际上,如今的全国生信大会已经走过二十五载岁月,已成功举办十届,但每届会议都无一例外地吸引到各地生信专家和学者。不少人交口称赞,“这一大会已发展为中国生信领域学术水平最高、影响最大的全国盛会,是当之无愧的品牌会议。”
孙之荣教授
谈起本届大会的盛况,大会主席孙之荣教授颇有感慨,“举办一场生信会议的念头由来已久,大概要追溯到1998年之前。早期小范围办会只取了一个“华北地区生物信息学研究会”的名字,清北、中科院、天津、内蒙古多地教授予以支持。新世纪后生信大会因为非典原因停办六年,后来有了各地高校教授的帮助,会议愈发成熟,成了一个大团队,感谢同道的帮助。”
事实上,本届会议原定于去年10月,因疫情爆发两次延后,直到今年年初管控放开,各地高校教授的的参会热情已经非常高涨。
作为组织者和参会者之一,本届大会执行秘书长为中山大学数学学院的张家军教授。他对雷峰网表示,“这会更加考验团队凝聚力和执行力问题。从决定举办并确定日期算起,留给我们的实际筹备时间仅有3个月,而往届会议会有一年的筹备时间。”
在人手有限、疫情干扰以及时间压缩的情况下,本届大会在会议嘉宾和内容以及节奏的把控上,都获得了极高的评价。
张家军教授(居中)与本届大会志愿学生
其一,分会场覆盖面更广,农林畜牧等学科人才面孔增多,一线医生参会热情高涨。
该届大会覆盖了基因组学信息学、转化信息学与数据安全、生物医学数据挖掘与计算、人工智能与生命科学、非编码RNA与RNA信息学、重大疾病组学信息学、生物信息学算法研究、农林信息学、生物分子结构预测与模拟、网络生物学、多组学与整合生物学、计算合成生物学等生物信息学与系统生物学的多个前沿方向,共3个特邀主会场和16个分会场。
张家军教授表示,“诸如各地农林畜牧方向高校、研究所学者积极应邀。此外,大会还专设了重大疾病组学信息学分会,来自各地附属医院、医学研究所、高校医学院的一线医生都赶到了现场。”
而这也意味着,随着科学研究深入发展,组学研究才是最大化研究价值的出路。
墙报展区
其二,老中青学者齐聚,“全员出动”成为一道风景线。
本届大会聚集了来自全国各地1600多名专家、学者和行业从业者,覆盖了生命科学、物理学、信息学、医学等学科,包括南方医科大学侯凡凡院士、北京大学汤超院士、北京大学张泽民教授、哈佛大学刘小乐教授(线上)、中科大刘海燕教授、中科院生化所陈洛南、清华大学张强锋等7位学者,从各自的研究方向出发进行了40分钟的特邀报告。
侯凡凡、汤超、张泽民、刘小乐、刘海燕、陈洛南、张强锋
孙之荣教授表示,本届大会也在主会场专设了国家杰出青年学者的25分钟报告环节。
如,山东大学数学与交叉科学研究中心杨建益、清华自动化系汪小我、北京北京国际数学研究中心张磊、上海交通大学数学科学学院周栋焯、中南大学计算机学院李敏、复旦大学类脑人工智能科学与技术研究院赵兴明、中山大学生命科学学院杨建华、北大公共卫生学院葛颢、中山大学数学学院张家军等9位学者。
值得一提的是,雷峰网(公众号:雷峰网)在会场观察到,不少教授携实验室学生全体出动。
浙江工业大学信息工程学院的张贵军教授表示,“尽管是第三次参会,但这次参会人数最多,师生十人同行。”
华中农业大学信息学院则直接是由院长张红雨、副院长李国亮带队,龚静、牛晓辉、全源、周强伟、王云龙、朱志贤、王振吉等多名师生参加会议。据该学院相关负责人介绍,“这次会议对促进与同行和行业从业者的交流和合作建立了可能。”
张贵军教授(中间戴胸牌)与实验室学生
其三,热闹的不止于大会参会人员,本次大会的展商区也云集了十多家相关公司。
如,位列“明星展位”的中科曙光、火山引擎、亚马逊科技,以及“标准展位”的毅硕科技、深圳国家基因库、曼迪匹艾(北京)、万乘科技、上海序祯达生物、安诺优达、北京并行科技、深圳华大智造。
据其中一家展商介绍,“线下参展的好处是,能直观感受到产学研各界的热情,不再是一头热一头冷。现在我们最大的挑战是时不我待,只争朝夕。”
这句话也诠释了如今的生信大会正在从“小而美”走向“大而强”。而在这场变革中,小到前沿学科建设、中端技术转化、后端产业承载,都在尝试作出最有力的回应。
本届大会如此火爆,很大程度上证明了生命科学产业风云变幻,机遇丛生。
正如全国人大常委会副委员长陈竺在贺信中所言,“当前新一轮科技革命和产业革命加速发展,生命科学创新突破方兴未艾,生物产业与信息产业深度融合,对全球生命健康事业发展和世界经济复苏具有十分重大的意义。”
其中,考虑到技术转化的难易程度,蛋白质预测与设计成为本届会议的两大看点,山东大学杨建益教授、中科大刘海燕教授的两场报告广受关注。
杨建益教授
山东大学数学与交叉科学研究中心的杨建益教授,以《AI在蛋白质结构预测中的应用》为题进行报告。
据悉,杨建益教授研究方向包括蛋白质结构与功能预测、RNA结构预测等,并与密歇根是大学张阳、华盛顿大学David Baker等学者合作,成功开发I-TASSER 和trRosetta等著名结构预测算法。在去年的CASP15比赛中,杨建益教授带队获蛋白质单体结构预测组第一名。
会上,杨建益教授首先详细介绍了蛋白质结构预测的基本原理与应用。
他表示,蛋白质结构预测的目标是从蛋白质的氨基酸序列出发,通过算法设计和开发,构建准确的三维结构模型。随着深度学习的发展,如今蛋白质结构预测方法主要分为三种:基于模版的同源建模、基于蛋白质分子电子结构的第一性原理的从头预测、基于深度学习的蛋白质结构预测。
而后者又可以分为两部分,其一是从二维图到三维结构的“两步走”法,代表性方法有AlphaFold1(DeepMind)、trRosetta(杨建益)、ProFold(卜东波)、RaptorX(许锦波);其二从神经网络到三维结构的端到端预测方法,涵盖AlphaFold2(DeepMind)、RoseTTAFold(David Baker)。
随后,杨建益教授结合CASP15的比赛表现,进一步介绍了两种方法的融合方式。
他表示,trRosetta的方法主要包括两部分,一是通过深度学习算法预测蛋白质残基间的几何信息、二是把这些信息转化为Rosetta的能量项,通过能量最小化方法快速从头预测蛋白质结构。而参赛的trRosettaX2,是在以前trRosettaX的基础上,改进了氨基酸距离和角度的预测,并用trRosetta的能量函数进行折叠。而对于trRosetta预测不好的结构,则直接使用了AlphaFold2的预测结果。
刘海燕教授
此外,在本次会议中,刘海燕教授以《基于AI的蛋白质从头设计》为题进行了特邀报告。
刘海燕教授于1990年毕业于中科大生物系,1996年1月获中科大博士学位。1998年11月-2000年11月先后在美国杜克大学化学系、北卡罗来纳大学生物化学与生物物理系作访问研究。2001年起在中国科学技术大学生命科学学院担任教授,博士生导师。主要研究方向为蛋白质设计、蛋白质分子动力学模拟方法及应用,在相关领域发表学术论文90余篇。
近年来,刘海燕教授主要开展数据驱动蛋白质设计方法研究,提出并实验验证了统计能量模型SCUBA和ABACUS,可分别用于主链结构和氨基酸序列的从头设计。
会上,他详细介绍了以上两种模型。他表示,近年来,国际上蛋白质从头设计的代表性工作主要采用RosettaDesign——使用天然结构片段作为构建模块来拼接产生人工结构。然而,这种方法存在设计结果单一、对主链结构细节过于敏感等不足,显著限制了设计主链结构的多样性和可变性。
因此,刘海燕教授,陈泉副教授及团队,基于数据驱动原理,开辟出一条全新的蛋白质从头设计路线,在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实的基础。
据悉,该团队首先建立了给定主链结构设计氨基酸序列的ABACUS模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA模型。理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,从而显著扩展从头设计蛋白的结构多样性,甚至设计出不同于已知天然蛋白的新颖结构。
刘海燕教授表示:“SCUBA模型+ABACUS模型,构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。”
值得注意的是,相关成果已于2022年2月10日发表于《Nature》,目前论文展示了9种从头设计的蛋白质分子的高分辨晶体结构,其中5种蛋白质具有不同于已知天然蛋白的新颖结构。
但从另一方面而言,尽管上述两项技术研发已经有了明显的进展,但生信学者还需要着眼于未来。
“预测和设计的技术实现是一回事,但设计出适合下游工业生产的特定功能蛋白,又是一回事。”张贵军教授分两方面指出,
“就预测而言,最大的问题是无法做到冷冻电镜一样的动态预测,AI模型拟合出来的是静态的蛋白质结构;就设计而言,脱离实验室条件,人工设计的蛋白质安全性、稳定性、耐药性如何都不得而知,而能否适合工业生产又有很多不确定性。”
龚新奇教授进一步补充道,“可以理解为,高校学者和业界学者,对于技术转化的周期估计并不相同,业界认为转化成果将很快出现。”
他举了两个例子,比如,西湖欧米创始人郭天南教授,与医院合作研究新冠病毒感染者多器官的蛋白组表达差异,将推动药物和治疗方法等产品转化;清华丘成桐教授也与北京政府合作,在雁栖湖建立应用数学研究院,希望招聘300个世界最好的数学家,专门做“AI+生物医学”的事情。此前丘成桐建立的清华三亚国际数学论坛,目前也在向生物育种领域靠拢。
周耀旗教授形容道,“数学家也想要做技术转化,看来生命科学是块‘大油田’。”
周耀旗教授、龚新奇教授
总体来看,作为一门交叉学科,生信整合数学、物理、计算机等理工学科,以及生命科学、医学、药学等医农学科。但直到今天,生信的学科价值愈发体现在转化应用。
换句话说,当数学家、生信学者以及各行各业都在考虑技术转化时,或许生命科学的帷幕才被徐徐拉开。
这些年来,全国生信大会在各地高校留下根基,先后在哈尔滨医科大学、东南大学、电子科技大学、澳门大学、同济与复旦、四川大学举办。时至今日,大会主席孙之荣仍能清晰记得每届承办单位的主要负责人:
华中科技大学肖翌、浙江大学钟伯雄,陈铭、哈尔滨医科大学李霞、东南大学孙啸、成都电子科技大学郭锋彪,黄健、澳门大学张晓华、上海同济大学张勇,复旦大学赵兴明,田卫东、四川大学沈百荣、以及本届会议负责人,中山大学周天寿,张家军。
最后,孙之荣教授对所有生信同道作出寄语,“在各位同行的努力下,生物信息学在中国蓬勃发展,已经产生了大量重要研究成果,其在生物医药等研究领域的引领作用日益凸显;生物信息学的发展前景非常好,希望领域内的研究人员能够不断创新,坚持初心,传承精神。我们也要更加紧密团结在中国生物信息学学会(筹)的旗帜下,为祖国的强盛和人民的幸福做贡献。”