大分子结构预测与计算迎来新“利器”。
9月20日,上海智峪生物科技有限公司(简称“智峪生科”)宣布,公司正式推出高通量、高精度、全生态、全流程生物计算平台“峪云ZCloud”,以解决大分子结构计算、分子结构模拟、药物设计、酶工程、大分子设计(包括蛋白、核酸、以及其复合物)等领域内计算问题。
此前智峪生科已推出了包括FastAF2、PointSite、Docking、Virtual screening等在内的多个服务模块,累计服务了超过50多家生物科技企业及学术机构。此次峪云ZCloud的推出则是将公司积累的各类服务模块进行了一站式生态整合,实现计算精度和速度工业数量级跨越。
对于此次峪云ZCloud发布,智峪生科首席执行官王晟博士表示,“智峪生科在大分子结构计算和设计方面具备专业性及创新性。我们致力于打造智能化的合成生物设计系统,为客户在复杂、有挑战性的药物研发项目上提供低成本、高效率的一站式解决方案。最终,基于AI的高精度计算服务不止可以辅助新药分子发现,而且可以部分代替临床前试验,让人工智能真正从研究实验走向工业化应用与生产。”
“目前,中外在AI辅助制药与合成生物领域基本处于同一起跑线,智峪生科希望将ZCloud打造成为生物科技的‘EDA(集成电路设计软件)’,自主研发核心技术,让当前半导体领域面临的‘卡脖子’风险不在生物科技领域重现!”王晟表示。
根据Anfinsen法则,蛋白质的氨基酸序列决定其三维结构,同时三维结构又是蛋白质行使其生物学功能的基础,直接关系到人类对疾病成因及治疗手段的探索。但由于蛋白质的多级结构和复杂的相互作用,使得精确预测三维结构充满挑战。
2020年,由DeepMind研发的AlphaFold2横空出世,在多数蛋白质单体结构预测中首次达到与实验误差接近的准确性,深刻影响了蛋白结构预测以及相关领域。但由于AlphaFold2并未公布训练代码,且代码基于JAX框架与TPU硬件实现,高度依赖Google内部生态系统,因而对于绝大多数生物科技企业及研究者而言,AlphaFold2在使用上具有较大的限制。另一方面,AlphaFold2庞大复杂的模型,致使其数据处理与训练代价高昂,对大多数研究者来说较难承受。
智峪生科则选择在AlphaFold2的基础上进一步全新迭代升级,在保证预测精度的前提下,对各模块的计算效率做出了大幅度的工业级别的提升和改进,同时进行全新生态范式整合,实现蛋白质开发工作与合成生物学的全流程自动化。
始于结构建模,并不意味着止于结构建模。
目前,除了蛋白质结构计算外,峪云ZCloud平台上还提供了多套生物计算领域最前沿算法,涵盖了大分子设计、分子模拟、自由能计算、药物分子发现、序列与结构检索等诸多领域,以满足药物研发或合成生物学元件设计过程中的序列优化、高通量结构预测、结合位点预测、虚拟筛选、自由能微扰等多种应用场景。
这一切并非简单的堆砌,智峪生科在打造峪云ZCloud平台的过程中,更专注于打通不同算法之间的使用壁垒,将各个子模块串联为一个完整的、彼此支撑的生态,实现1+1大于2的效果。针对不同的问题,各个模块可以创造性地任意组合搭配,极大丰富可应用场景。
ZCloud全生态平台,来源:智峪生科
在聚合成为生物科技领域“瑞士军刀”的同时,峪云ZCloud平台计算的高精度也得到保证。
从高效率高精度的蛋白质结构建模fastAF2,到自研的独树一帜的高精度大分子(包括蛋白质与核酸)设计算法SWORD,再到高精度绝对自由能计算(autoFEP)、高精度结合口袋寻找(PointSite)、和高精度分子对接和筛选(autoLigand)等,ZCloud的多个自研算法在学术机构和制药企业的合作项目上已经展现出卓越性能。
高精度策略,来源:智峪生科
更贴近研发者需求的是,峪云ZCloud平台还着重在操作使用层面进行了优化,提供简易操作的界面与可视化的视图工具,方便用户使用。此外,借助“私有云+公有云”的模式,峪云ZCloud平台打造了从结构出发、高通量筛选再到先导物优化、分子评估推荐以及合成生物学相关模块的全产业链条,具备面提供安全隐私且大规模、高通量计算服务的能力。
峪云ZCloud应用效果及模块效果展示
“全生态、全流程、全好用,这是我们设计峪云ZCloud时着重想达到的效果,现今基于与药物研发相关的合作项目成果来看,基本都得到较好地实现。”王晟博士指出,作为更底层的通用平台,目前峪云ZCloud已涵盖了药物研发的各个环节,助力生物医药企业一键完成新药研发前的研究工作。“后续药企只用参照计算结果,即可顺畅完成药物发现的工作。”
值得一提的是,配合智峪生科自研的ZPod一体化”微型“数据中心使用,峪云ZCloud的性能还能如虎添翼更上一个台阶。
用户可以通过采购多个 ZPod 来实现线性扩展以获取更强大的计算能力,而多个 ZPod 存储和计算算力的弹性扩容可确保用户无感知提速。除了软硬件协同优化的生物化学计算以外,ZPod本身也是一个专业的HPC 异构集群,它通过使用当前最新的CPU、GPU、网络和存储硬件,确保集群的聚合IO、计算、通讯以及线性扩展能力得到最大优化。
在智峪生科首席执行官王晟博士看来,在峪云ZCloud问世后,通过“AI+大分子建模+高性能计算”的新一代分子设计技术,智峪生科可实现药物分子设计中精度、效率和成本的大幅度优化,为大分子(包括蛋白质与核酸)工作与合成生物从学术研究走向工业化落地奠定坚实的基础。
基于优异的性能,峪云ZCloud平台成为生物科技企业及研发者一站式实现化合物分子发现与设计的重要工具。
目前,峪云ZCloud平台各模块已被广泛使用。上线12个月,已经有50多家生物科技企业及学术机构通过峪云ZCloud模块完成了50多万个蛋白与核酸结构的预测,并挖掘出了之前未被发现的新酶,有力的推动了诸如人体健康、猴痘候选疫苗、动物免疫、生物合成制品等现实世界问题研究。
其中,据公开信息显示,基于蛋白质结构预测,上半年智峪生科就与某知名生物科技公司合作主要聚焦在高端困难蛋白原料和辅助试剂的开发和生产、与某知名CRO公司则在高通量辅助药物设计和新药分子发现方向展开合作。此前,王晟博士也曾表示,希望通过与产业方和学术机构的各类合作,基于智峪生科在大分子结构计算和设计方面具备专业性及创新性,让“AI+分子设计”落地到实际项目中。
“研究某微生物重要靶点,治疗该微生物感染的潜在药物分子;为ADC药物寻找最合适的短肽linker;为药物研发平台进行机理解释和分子优化设计......”实际上,峪云ZCloud所蕴藏的潜力还不仅于此。
今年6月,世界卫生组织将猴痘的全球公共卫生风险评估为中等。短短数日后,智峪生科即基于峪云ZCloud平台,发布了600多个猴痘蛋白质组的全蛋白质结构预测,并进行了详实而清晰的蛋白质功能注释,助力世界各地的科学家开展基于蛋白质结构的猴痘病毒疫苗和药物设计工作。该研究结果后续还被中国工程院院士、传染病学专家李兰娟引用。
值得一提的是,基于峪云ZCloud所提供的蛋白质结构预测结果,智峪生科已形成了集大分子结构预测、设计和生产的全产业价值链闭环服务,开始不断探索和拓宽合成生物学边界。
一般而言,合成生物学多采用工程学“自下而上”的理念,从系统表征自然界具有催化调控等功能的生物大分子,使其成为标准化“元件”,到创建“模块”、“线路”等全新生物部件与细胞“底盘”,构建有各类用途的人造生命系统。
而从基础来看,合成生物学需要设计和实现各类底层元件,比如催化元件、调控元件、感应元件和结构元件等。在此方面,智峪生科从未停止探索。除了在核心催化元件(例如酶)的设计与改造上取得了重大突破,ZCloud平台上的一系列算法已打通了单体核酸(如:RNA)以及蛋白-核酸复合物的结构计算,实现了调控元件的精准设计。并基于RNA的调控元件许多重要功能特性,在合成生物学领域进行广泛探索。此外,通过其标准化和自动化设计,ZCloud平台也在一定程度上实现合成生物学所许诺的工程设计理念。
按照智峪生科的设想,上游端,依靠强悍的大分子结构预测和设计能力,公司可以根据客户的需求解决成药过程中的痛点难题,也为公司自身合成生物学产品打造绘制了精准的“蓝图”;下游端,公司掌握了包括放大、工艺研发、菌种设计、代谢工程在内的种种生产工艺,依照上游产出的预测及设计结果开启合成生物学领域布局。
“这些设想都可以基于峪云ZCloud强悍的蛋白质结构预测能力得以实现,纵览峪云平台全生态循环加速模式,我们看到,它已经将AI带入了一个工业化级的落地时代。”据王晟透露,面对一个长度为655的蛋白,AlphaFold模型需要耗时11个小时才能完成预测。现在ZCloud平台下的fastAF2模型仅需6分钟就能将目标蛋白筛选出来,加速了110倍。
来源:智峪生科ZCloud平台 fastAF2在线预测(https://cloud.zelixir.com/fastaf2/#/fast-af2)
“这是AI作用于生物学工业时代的曙光,是一个令人振奋的大分子工业化突破。相信在未来,智峪生科可以利用ZCloud系统通过新药发现与合成生物来改善医学、能源、环境等相关领域,为生物科技,尤其是合成生物学带来一场看得见的革命!”王晟表示。雷峰网 雷峰网(公众号:雷峰网)