“我们不会去做CRO或自研管线,华为云的优势在云、大数据和AI这些软件领域,不可能像创业公司一样招聘很多生物医药背景的人做Biotech,我们也没有这样的基因。”
“IT领域面向医疗行业的产品和解决方案非常少,没有很好的产品或工具能够系统地解决医疗行业中存在的问题。医疗是一个非常细分且琐碎的行业,做起来又特别难,科技公司在这个领域的投入是不够的。”
近日,雷峰网《医健AI掘金志》推出《AI制药十人谈》系列,探究AI制药的前景与隐忧。
华为云医疗产品总监,医疗首席科学家乔楠博士在与《医健AI掘金志》的对话中,谈到了他对医疗行业产品与服务情况的观察。
乔楠是AI制药领域中少有的具有综合背景的研究者,2013年博士毕业于中国科学院后,乔楠进入诺华制药,从事生物信息学分析工作,参与抗癌药物的研发。在诺华制药工作期间,还曾获得诺华团队合作奖和诺华优选奖。
2015年乔楠加入埃森哲并领导成立了埃森哲中国AILab,为不同行业提供的客户提供产品和解决方案。在埃森哲工作期间,乔楠发现,IT领域面向医疗行业的产品和解决方案还不够丰富,这一领域仍有待大力发掘。
2018年,华为公开发布全栈全场景AI框架,搭建起了建设AI To B业务的重要基础,乔楠决定加入华为,重新回到制药行业。
在埃森哲的工作经验,让乔楠更加了解不同行业之间的壁垒,熟练掌握如何使用数据库、AI等前沿技术解决行业难题。
加入华为云后,乔楠面临的首要任务就是打造一个面向医疗行业的AI研发平台,乔楠和团队选定基因组、药物研发和临床研究三个方向作为重点,构建起面向医疗行业的AI和大数据能力。
依托于华为云自主研发的盘古药物分子大模型,联合中科院上海药物研究所的蒋华良院士、北京大学的高毅勤教授等业内专家,医疗团队打造了制药行业的EDA软件:盘古辅助制药平台,为药物研发机构提供SaaS化软件服务。
乔楠指出,药物设计平台的基础建设不是一两家企业独自能够完成的,只有国内的科技企业与科研机构一起发力,持续打造出自己的软件生态,才能避免被国外“卡脖子”。
以下为《医健AI掘金志》与乔楠的对话内容,《医健AI掘金志》做了不改变原意的编辑与整理。
《医健AI掘金志》:您博士毕业于中国科学院生物信息学专业,当时的研究方向是什么?什么时候开始接触药物研发?
乔楠:我本科学的是自动化,后来转到生物技术专业,博士期间选择了生物信息学,师从分子系统生物学专家韩敬东教授。
生物信息学本身是一个交叉学科,我们需要把生物学、数学、计算机、物理、化学等等很多领域的知识整合起来,运用在生物医学领域的数据分析中,构建机器学习的模型或深度学习模型,用来验证科学家提出的生物学假设。
研究的内容上,我做的比较杂,比如通过文本挖掘,分析文献中基因的信息;通过分析蛋白质相互作用网络的数据,寻找潜在药物的靶点;还有针对基因组数据的各种分析和建模,博士期间的一个工作就是分析 家蚕被病毒侵染之后基因表达量的变化。
另一个比较有意思的工作叫做“WormFarm”。 Worm就是是线虫,是一种常用的模式生物 ,Farm是农场,代表我们实验室研发的一种微流控芯片。
我们在指甲盖大小的微流控芯片上刻 8 个小槽,将很小的线虫养在其中,每天喂食营养液,让它们在芯片里生长,通过设计各种实验观察线虫的表型,比如对线虫的基因进行敲除之后观察线虫的生存时间,通过这些观察建立起长寿与基因相关的模型,寻找长寿基因与药物靶点。
《医健AI掘金志》:博士毕业后,您曾在诺华制药工作过一段时间,您在这一阶段专注于哪些研究工作?那一时期AI制药技术的发展情况如何?
乔楠:读博期间,我做了很多科研数据分析,毕业之后希望能够进入具体的行业中,看看大家如何用机器学习、数据分析这些技术解决业务问题,于是加入了诺华制药在张江药谷建立的研究所。
进入诺华制药后,我主要从事生物信息学分析工作,分析病人样本、动物模型、细胞系等不同维度的多组学数据。通过对多组学数据的分析,找到可能的生物标记物或潜在的药物靶点。同时也对实验团队的数据进行分析和建模,指导他们做早期的药物发现。
我在诺华制药工作期间,深度学习才兴起不久,ImageNet等相关工作才刚刚发表,药物设计还处于CADD阶段(计算机辅助药物设计),药企开始使用计算机软件和算法对药物进行辅助设计和计算模拟优化,如今兴起的AIDD,也是起源于CADD,对于CADD的一些问题,AI的算法可以做到更好。
《医健AI掘金志》:您为什么选择加入华为云,担任医疗产品总监及医疗首席科学家?加入华为云后您带领医疗团队进行了哪些工作?
乔楠:在诺华制药工作习惯后,我发现日常进行的大多是重复性的工作,我想要看一看在更多的行业中大家如何借助机器学习处理相关业务,于是在2015年,我加入埃森哲,担任埃森哲中国首席数据科学家,并领导成立了埃森哲中国AILab,面向不同行业的客户提供AI产品和解决方案。
在这个过程中,我发现IT领域面向医疗行业的产品和解决方案非常少,没有很好的产品或工具能够系统地解决医疗行业中存在的问题。医疗是一个非常细分且琐碎的行业,做起来又特别难,科技公司在这个领域的投入是不够的。
另一方面,2018年,华为的轮值董事长徐直军发布了全栈全场景的AI框架,这是建设AI ToB业务的重要基础,一个企业如果想要从头构建AI 平台,就必须要有一套全栈全场景的AI平台和解决方案。
在2018年,全球只有谷歌一家公司有这样的全栈全场景能力,先后发布过Tensorflow、TPU、Google Cloud等产品和平台。
当我看到华为发布了完全国产的全栈全场景AI框架时,觉得这是一个非常有前瞻性、非常重要工作,于是决定加入华为云,重新回到医疗行业。
在埃森哲的工作经历对我回到医疗行业后的工作帮助很大,让我了解了不同行业之间的壁垒,如何使用数据库、AI等前沿技术解决行业难题,将不同的技能串联起来,这是很多生物医药背景出身的从业者缺乏的能力。
我加入华为之后,首要的任务是打造一个面向医疗行业的AI研发平台。
对于任何企业来说这都是一个难题,大部分传统行业的公司缺乏云、大数据、AI背景的人才,很难快速地构建起一个AI研发平台,没有AI研发平台公司就很难快速进行研发创新。
所以,我们希望实现的效果是,用户只要在云平台上创建一个账号,订阅相关的服务,就能够借助平台的支持进行AI 研发工作。
医疗行业的细分领域非常多,华为云究竟要构建什么样的平台?这也是一个很紧要的问题。
我们对医疗行业进行了系统的分析和洞察,最终决定选择三个方向作为工作的重点,基因组、药物研发和临床研究。
围绕着这三个方向,我们构建起基础的AI和大数据能力,同时,联合华为云的技术合作伙伴,高校和中科院研究所共同研发,开发了这些领域中核心的技术和算法,将其产品化后放到平台上,供医疗行业的研发人员使用。
在一次研讨中,中科院上海药物研究所的蒋华良院士,北京大学的来鲁华教授、高毅勤教授、李洪林教授等业内专家,提到大家在药物研发领域涉及到的物理化学、量子力学、量子化学、结构生物学等诸多基础学科中分别有各自擅长的方向,但教授们开发的算法或工具,往往几年后就不再进行维护了,缺少连续性。
我们希望和这些教授合作起来,打造出一套完全自主可控的AI 辅助药物设计平台。
《医健AI掘金志》:SaaS、AI CRO与AI Biotech,是AI制药领域的三种主要商业模式,华为云在打造AI辅助药物设计服务平台时,是如何在这三者中进行选择的?
乔楠:华为云提供的是SaaS化的软件服务,企业注册账号后,开通相关服务即可使用。我们的盘古辅助药物设计平台是依托华为云平台打造的,华为云主要为企业提供IT数字化和智能化的服务,旗下的研发人员多为算法工程师、软件工程师,软件和算法是我们的优势,平台本身的定位就是药物设计软件,通过SaaS化的方式向药物研发机构提供服务。
我们不会去做CRO或自研管线,华为云的优势在云、大数据和AI这些软件领域,不可能像创业公司一样招聘很多生物医药背景的人做Biotech,我们也没有这样的基因。
《医健AI掘金志》:盘古药物分子大模型能够赋能新药研发流程中的哪些工作?
乔楠:我们的AI辅助药物研发平台能够覆盖药物设计的全流程,为靶点发现、药物筛选、分子优化三个环节提供强力支撑。
在靶点发现环节,2019年以来,我们针对基因数据、基因多组学数据、基因调控网络数据陆续发布了三个算法:AutoGenome、AutoOmics、AutoGGN,通过从细胞系、动物模型、病人身体组织中测到的多组学数据进行AI建模,为生物标记物发现和靶点发现等相关问题提供依据。
我们联合北京大学高毅勤教授团队开发的蛋白质结构预测算法MEGA-Protein,可以根据已有的蛋白质序列出蛋白质的三维结构;
获取蛋白质三维结构以后,下一个任务就是基于元动力学进行靶点发现与构象搜索,找到靶点与配体的可能的结合位置;
我们从软件和硬件层次对分子动力学模拟工具进行了大幅提升,使计算时间得以缩短。
在药物筛选环节,我们打造了一个独有的小分子库生成功能,基于盘古药物分子大模型,从模型学习到的类药化学空间中均衡采样,生成新颖且类药性质更优的化合物分子库,帮助加速药物筛选过程。
获得新颖的小分子库后,可以进行小分子药物虚拟筛选,这也是CADD中最典型的一个功能,除小分子外,平台同样支持多肽分子的虚拟筛选。
在分子优化环节,分子搜索功能基于华为云盘古药物分子大模型的小分子化合物表征,以使用者输入的参考化合物结构为起点,从海量的小分子库中搜索到相似结构和排序,可以实现百亿级小分子的秒级搜索。
分子属性预测也是药物研发中的重要一环,药物分子设计完成后,不经过实验验证就无法了解化合物的性质。盘古药物分子大模型能够预测化合物的ADMET/PKPD相关的80多种成药性质,给出预测值与置信度。
分子优化功能是AI辅助药物设计中最核心的功能,不论是创新药还是Me-too、Me-better,都要基于前期的分子进行改造。使用者在平台中输入一个分子,指定其结合口袋、分子属性、分子结构等,即可对分子进行定向优化,我们支持针对70余种分子属性的多目标优化。
《医健AI掘金志》:数据问题一直是AI制药领域的痛点,已经成为目前制约AI药物研发的重要因素之一。华为云为获取和积累药物数据做了哪些工作?AI制药应如何打破数据孤岛?
乔楠:华为云盘古药物分子大模型共学习了17亿个小分子的化学结构。
在药物设计领域,尤其是小分子领域,学术界有很多开源的数据库可以使用,我们收集的17亿个小分子化合物全部源于开源信息,我们联合中科院上海药物研究所蒋华良院士团队共同完成了盘古药物分子大模型的训练。
在训练盘古药物分子大模型时,我们采用了无监督学习的方法,只需要化合物的信息,不需要实验数据。在学习了这17亿个小分子化合物后,已经能够让大模型比较好地学习到小分子化合物隐含的表征空间。
另一方面,药物设计是一个非常微观的过程,小分子化合物、蛋白等都是微观层次下的结构和状态。我们可以借助分子动力学模拟等软件和工具,通过计算和模拟的方法去产生大量的数据,这些数据也可以应用到大模型的训练之中。
实验数据是药企的重要资产,一般无法轻易获取,数据共享是一个很难的问题,近年来业内在药物数据共享上做了很多工作,但收效甚微,短期内这一问题都难以解决。
我们能做的就是将盘古药物分子大模型开放给药企,让药企可以基于自己的数据再加上盘古药物分子大模型调优自己的模型,用于药物管线的分子设计与优化。
当药企的研发工作结束,不再使用这个平台,就可以将自己的数据和模型完全删除,避免泄露。
《医健AI掘金志》:随着AI制药技术的不断成熟,近年来业内涌现了一批AI制药初创企业,互联网、科技巨头在该领域也多有布局。在众多竞争者之中,盘古药物分子大模型有哪些差异化优势?
乔楠:我们希望国内的科技公司、初创企业不断在AI制药这一领域加大投入,虽然中国的AI制药行业发展得很好,但目前行业内处于最尖端的仍是欧美国家。这个领域本身就具有很高的难度,只有大家都投入进来,才能让中国吃到这一波红利。
华为在云、大数据和AI领域有很深的基础,我们具备建设基础平台的能力,同时也具备一些核心的技术优势,比如华为云自主提出了一套全新的深度学习架构,这是我们专门针对小分子化合物的性质设计的一套架构,能够更好地学习小分子化合物的深度表征,是盘古药物分子大模型的核心,决定了大模型的性能和效果。
此外,在AI辅助药物设计平台的产品设计上,我们每年会进行数十次的迭代升级,不断引入新的技术和方法,并且会吸收用户提出的建议对产品进行改进和迭代。
《医健AI掘金志》:针对国内创新药研发现状,目前还是Fast Follow居多,或者是Me-too、Me-better,这种情况下最需要AI去解决什么问题?
以华为为代表的大型科技公司的入局,将如何推动国内创新药的发展,优化行业生态?下一步,华为云将在药物研发领域进行哪些新的布局?
乔楠:当前国内情况肯定是Me-too、Me-better更多,但是这不是个大问题,比如我们的分子优化工具可以基于Fast Follow分子直接进行改造优化,如果优化的结果更好,就是Me better药物了。所以目前的重点是如何让药企的研发人员更快、更好地掌握AI工具的使用。
在药物设计这个领域,国内外的药企如今应用最多的还是国外的CADD软件,如薛定谔、MOE等,我们希望中国的科技公司在领域内不断投入,构建起国产的药物设计平台与生态。
这个过程中,必然会涉及到很多基础能力建设,绝非是一两家公司独自就能够解决的,只有国内的科技公司、科研机构等一起发力,打造出自己的软件生态,才能够不断地升级迭代,优化药物设计各类工具,提升能力,避免被国外“卡脖子”。
创新药研发的核心在于生物技术实验的验证,而AI和BT的融合将会起到1+1大于2的效果,下一阶段,我们将会进一步推进对AI+BT的融合的制药平台研究。同时,围绕药物设计软件的更多领域进行布局,希望能够支持更多类型的药物研发。
作为一个开放的平台,我们也支持第三方工具通过华为云向药企提供服务,做好产业链的协同发展,与下游伙伴更好地合作,共同推动制药产业的创新与变革。
《医健AI掘金志》:盘古药物分子大模型目前已经支撑了多家药企和科研院的商业服务或药物管线开发合作,其中有哪些典型案例?
乔楠:我们联合西安交通大学第一附属医院的刘冰教授团队发现了一款超级抗菌药Drug X。
抗生素类药物如今正面临的一个很大的危机——抗生素耐药性(AMR)。根据世界卫生组织(WHO)的预测,到2050年,抗生素耐药性将可能导致超过1000万人死亡,超过癌症导致的死亡人数。
有些药物甚至在刚刚进入临床阶段时,细菌就已对其产生了耐受。因此,找到能够对抗耐药菌的抗生素是非常紧要的任务。
刘冰教授借助华为云盘古药物分子大模型的分子优化能力,有效地提升了小分子化合物与目标抗菌靶点蛋白的结合、降低与人体蛋白的结合,从而减弱了Drug X对人体正常细胞可能产生的毒副作用。
同时,Drug X的靶点特质决定了细菌将难以对其产生耐药性,这一发现对抗疟(即疟原虫)药物研发等多个领域有着重要的影响。Drug X可能会成为全球近40年来首个新靶点、新类别的抗生素。
目前,这款药物正处于临床前阶段,已经进行动物实验验证,在推进IND申报中,并且已在国际范围申请专利。
在人体器官芯片领域,我们与江苏运动健康研究院院长、东南大学生物科学与医学工程学院院长顾忠泽教授达成了合作。
顾忠泽教授团队是国内最早一批开展人体器官芯片研究的团队,成功构建了肿瘤、皮肤、心脏、血管等多种器官芯片,在部分研究领域中领先于国际水平。
2022年12月底,FDA不再要求人体临床试验前必须进行动物实验,人体器官芯片将成为变革性的动物和临床替代实验技术。
顾忠泽教授将盘古药物分子大模型与器官芯片进行了融合,利用盘古药物分子大模型打通干湿实验循环,通过器官芯片获取更加精准的实验数据,从而提升临床试验的成功率。
在中枢神经系统创新药物的研发上,苏州旺山旺水生物医药股份有限公司利用盘古辅助制药平台取得了很好的进展。
中枢神经系统的不可再生性是药物研发中面临的一大难题,此外,中枢神经系统相关疾病的病例机制复杂、病程过长等特点,导致药物实验的周期过长。
为提升研发效率,旺山旺水公司借助我们的盘古辅助制药平台,覆盖药物研发干实验的三大核心环节,“靶点发现和药效验证、化合物属性预测、化合物分子优化设计”,使药物设计效率提升了3倍,为分子设计实验节省了60%以上的时间、资金成本。
在这些的合作过程中,我们对BT与AI深度融合的理解逐渐加深,同时客户也为我们提出了产品改进的建议,我们进行评估后,及时更新到产品的迭代中,进一步完善AI辅助药物设计平台。
《医健AI掘金志》:AI制药技术可将先导药物研发周期大幅缩短,虽然已经有少数药物进入临床阶段,但到目前为止,AI驱动研发的药物仍然没有一款成功获批上市,AI技术研发的药物距离上市还有多远?
乔楠:AIDD为药物设计的效率和准确性带来了极大的提升,更重要的是使用起来非常方便,降低了药物设计的门槛,即便是没有化学背景的研发人员,经过简单的培训后,都可以借助AI辅助药物设计平台来做药物设计。
很多创业公司也已经开发了AI辅助药物设计的工具和算法,这些工具的效果和价值已经经过了验证。
药物研发本身就有一定的周期,并且成功率一直都不算高,正常来说研发一款药物的成功率只有10%,Al工具一定程度上能够加速研发流程,提高成功率,但是距离AI辅助设计的药物真正上市,还要再等一段时间。
如今这个行业需要解决的问题,一是对药企的研发人员进行培训,让他们都能掌握借助AI工具进行药物设计的方法,提升药物研发的效率。
关于GAIR全球人工智能与机器人大会
“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,由鹏城实验室主任高文院士、香港中文大学(深圳)校长徐扬生院士、GAIR研究院创始人朱晓蕊、雷峰网(公众号:雷峰网)创始人林军等人联合发起,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。历届大会邀请了多位图灵奖、诺贝尔奖得主、40位院士、30位人工智能国际顶会主席、 100多位 Fellow,同时也有500多位知名企业领袖,是亚洲最具国际影响力的AI论坛之一。