作者 | 陈彩娴编辑 | 岑峰要说“AI for Science”的扛大旗者,大家也许都会首先想到 DeepMind:2018年,DeepMind 推出蛋白质折叠结构预测模型 AlphaFold,从氨基酸序列计算预测蛋白质结构,不仅为 Alpha 系列锦上添花,奠定了其在 AI 创新上的领头羊地位,还彰显了深度学习攻破其他领域难题的潜力,生物学首当其冲。AlphaFold 出世后,“AI for biology”(将人工智能用于生物学研究)成为人工智能领域的研究潮流,吸引了世界各地的优秀研究者投身其中。谷歌 AI 也是其中之一。这不,最近谷歌便发布了用于蛋白质解析的机器学习模型——ProtENN,登顶 Nature 子刊《Nature Biotechnology》。地址:https://www.nature.com/articles/s41587-021-01179-w
值得注意的是,早在2019年,谷歌 AI 就在 bioRXiv 发过 ProtENN 的预印本,不知是不是最近才被 Nature 接收?
蛋白质结构对生命有着至关重要的作用,了解蛋白质的氨基酸序列(如其结构域)与功能之间的关系是一项具有重大科学意义的长期挑战。自计算机兴起,科学家们就开始尝试用计算工具助攻该课题。例如,被广泛使用的蛋白质家族数据库Pfam便囊括了大量详细描述蛋白质结构功能的计算注释,例如珠蛋白与胰蛋白酶家族。但发展至今,目前至少仍有三分之一的微生物蛋白质的注释有待完善。而据谷歌 AI 的官博介绍,ProtENN的出现,能够为完善蛋白质结构的计算注释起到重要作用。