去年12月,AlphaFold 2高调登上了圈内圈外的热搜榜。因其在蛋白质结构预测领域的突破性成果,使得媒体一度用“颠覆“、“革命性突破”、“诺奖级成果”等词汇来形容此事件。
短短半年多,今年7月23日,AlphaFold 2再次刷新人们的认知。
《Nature》杂志发表的一篇题为“Highly accurate protein structure prediction for the human proteome”的研究论文引爆各大社交网络。
当天其创始人 Demis Hassabis 在推特上兴奋的表示,“ 这是我梦寐以求的一天,DeepMind 的创办初衷就是用人工智能推动科学发展,造福于人类,我为我们的研发团队感到无比骄傲。”
据悉,这项研究成果将人类蛋白质组预测范围覆盖到了 98.5%,其中58%的氨基酸的结构位置做出可信预测(confident prediction),对36%的氨基酸的结构预测达到很高的置信度(very high confidence)。
DeepMind在官方博客中表示,作为蛋白结构预测的强大的工具,AlphaFold将被广泛应用于生命科学以及药物研发等领域。
这篇博客的标题为《把AlphaFold的力量交到全世界的手中》,可见DeepMind对AlphaFold改变生命科学研究的信心。为了支持生物学和医学研究,DeepMind 与欧洲生物信息学研究所 ( EMBL-EBI ) 合作创建了第一个AlphaFold DB,并免费向学术界开放。
这是迄今为止人类蛋白质组最完整、最准确的高质量数据集,它比人类通过生物实验确定的蛋白质结构的数量还多两倍。
当然,AlphaFold预测结构并非没有局限性,如尚且不能预测复杂复合体的3D结构;在动态过程中,通常只能预测一个蛋白构象;对于不产生特定结构的氨基酸序列,无法做出可信的结构预测。
去年12月,由图像计算与数字医学国际研讨会(ISICDM)主办,雷锋网、医健AI掘金志协办的《权威专家谈AlphaFold:DeepMind到底突破了什么?》线上圆桌论坛,引起了国内外众多学者的关注:
20多个专业社群、线上观众峰值达1万6千人,足见行业内对这一话题的热情。
为了更加深入、系统地讨论近期AlphaFold的系列成果,8月7日(本周六 9:30),我们将再次举办主题为《权威专家再谈AlphaFold2:AI是否会带来结构生物学的“大革命》的线上圆桌论坛。
本次主题论坛由图像计算与数字医学国际研讨会(ISICDM)主办,雷锋网、医健AI掘金志协办。
印第安纳大学医学院副院长、AIMBE Fellow黄昆教授担任主持,密苏里大学教授、AAAS/AIMBE Fellow许东教授、密歇根大学教授、DeLano奖得主和I-TASSER算法发明人张阳教授、芝加哥丰田计算技术研究所、斯隆奖得主许锦波教授、中科院计算所卜东波教授(新增)共同参与讨论。
想要提问的读者可关注《医健AI掘金志》,回复关键词“蛋白质”,进入专家社群,我们会将您的问题收集、汇总后,反馈给参会嘉宾,并在讨论环节一一进行解答。
主持人:黄昆,印第安纳大学医学院副院长,AIMBE Fellow
黄昆于1991年进入清华大学学习于1996年获生物学理学士与电子计算机工学士双学位。本科毕业后赴美国伊利诺伊大学香槟校区(UIUC)学习。
先后获得生理学硕士,电子工程硕士,数学硕士学位,并于2004年获得电子与计算机工程学博士学位,研究方向为计算机视觉与机器学习。
同年加入俄亥俄州立大学医学院生物医学信息学系任教,2010年获评终身教职,并先后担任综合癌症中心生物信息共享资源主任,计算生物学与生物信息学部主任,医学院副院长等职务。
2017年加入印第安纳大学医学院参与领导精准健康计划,担任数据科学与信息学主任,生物统计与健康数据科学系副主任,同时任基因组数据科学讲席教授,医学院主管数据科学副院长,印第安纳大学Simon综合癌症中心副主任。
其主要研究方向包括生物信息学,医学图像分析,医疗大数据,机器学习及其在癌症研究及神经科学等方面的应用。发表研究论文200余篇。2018年当选美国医学与生物工程学院(AIMBE)会士。
许东,密苏里大学教授,AAAS、AIMBE Fellow
美国密苏里大学电子工程和计算机科学系的Shumaker讲座教授,同时担任Christopher S. Bond生命科学中心研究员和信息技术专业主任。
许东教授在北京大学获得本科与硕士学位,于1995年在伊利诺伊大学获得博士学位。他在美国国家癌症研究所做了两年博后工作,此后在橡树岭国家实验室做了六年研究工作,一直到2003年加入密苏里大学,从2007-2016年,他担任该校计算机科学系的系主任。
许东教授的研究主要集中在生物信息学方面,包括机器学习在生物信息学的应用,蛋白质结构预测,蛋白质定位预测,蛋白质翻译后修饰的识别,单细胞数据的分析,还有植物、微生物和癌症的计算机模拟研究,以及生物信息系统。他的蛋白结构预测工作获得2001 年R&D 100大奖。
许东教授目前已发表400多篇论文,他是美国科学促进会(AAAS)会士和美国医学和生物工程研究院(AIMBE)会士。
张阳,密歇根大学教授,I-TASSER算法发明人
美国密西根大学计算医学与生物信息学系以及生物化学系终身教授。在蛋白质折叠和结构预测、蛋白质设计、以及功能注解等方向开展了一系列开拓性的研究,并产生了重要的国际影响。
I-TASSER算法发明人(该算法连续八届国际蛋白质结构预测CASP大赛自动组均名列第一,在生物信息及生物医学领域得到广泛应用)。主持与完成NIH百万美元以上级项目研究课题10余项。
曾获得DeLano奖,Sloan奖、NSF早期生涯奖、以及密西根大学基础科学奖等奖项;担任Journal of Structural Biology等8种国际期刊的编委。在Nature Methods,PNAS等著名期刊上发表论文200多篇,被国际同行引用三万余次,连续四年入选汤森路透(Thomson Reuters)全球高被引科学家。
许锦波,芝加哥丰田技术研究所教授,斯隆奖得主
美国芝加哥丰田计算技术研究所教授,《生物信息学》以及《计算生物学》编委;就读于中国科学技术大学计算机系,中国科学院计算技术研究所和加拿大滑铁卢大学,以及在美国麻省理工学院数学系和人工智能实验室接受博士后训练。
许博士的研究兴趣包括人工智能和机器学习,优化算法和计算生物学。他于2016年证明了深度残差卷积神经网络可以大大提高蛋白质结构预测的性能,引导了深度学习在蛋白质结构预测领域的第一次变革。
许博士获得了美国斯隆研究奖,美国自然科学基金早期职业奖,《PLoS Computational Biology》创新突破奖,国际计算生物学顶级会议RECOMB的最佳论文奖和时间考验 (Test-of-Time) 奖;曾多次接受英美杂志如《纽约时报》、《经济学人》、《财富》、《自然》和《科学》的采访。
卜东波,中科院计算所研究员
卜东波,中科院计算所研究员,承担863、973、NSFC、科技部重点研发计划等多项课题。研究兴趣包括生物信息学(蛋白质结构预测、糖结构鉴定)、计算机算法,在Nature Communications, NAR, AC, JPR, Bioinformatics, ISMB/RECOMB等发表论文100余篇,论文单篇引用超800次,著有《算法讲义》。
主要成果包括:研制了“用人工智能技术辅助算法设计”的AIA系统,在经典排课问题上实现了变“凭灵感设计算法”为“从数据学习出算法”。
设计了直接从多序列联配学习残基间距离的新型神经网络架构CopulaNet,进而设计了蛋白质结构预测算法ProFOLD,性能超过AlphaFold,正努力赶超AlphaFold2;设计了“组合优化技术与深度学习技术相结合”的蛋白质结构预测算法FALCON,获国际竞赛CASP-8 FM-Hard类第三名;主持设计了中科院志愿计算平台CAS@home,运行于全球4000+台志愿计算CPU上,为生物学家提供高性能蛋白质结构预测服务;提出了新型的“逆向蒙特卡罗”采样算法,解决了长期困扰的优化问题中的目标函数设计难题。
许东、许锦波、张阳(摄于2010年CASP比赛期间)
主题:权威专家再谈AlphaFold2:AI是否会带来结构生物学的“大革命”?
时间:8月7日,上午9:30-11:00
主办单位:图像计算与数字医学国际研讨会(ISICDM)
协办单位:雷锋网、医健AI掘金志
关注《医健AI掘金志》,回复关键词“蛋白质”,即可加入微信群,观看此次线上论坛,同时实时交流与提问。
(业内首批AI+蛋白质结构预测【资深研究者讨论群】)