作为药物发现阶段的研究核心,先导结构的发现和优化往往需要花费数年时间,投入数亿美元,长期被视为药物研发的关键技术瓶颈。
从20世纪70年代以来,计算机辅助药物设计(CADD)作为一个日趋完善的药物发现手段,主要包括虚拟筛选和药物从头设计两种策略,曾极大提升新药设计和开发的效率。
“我们即将迎来生物医学大爆发的时刻,但这一成果的取得,不仅取决于生物学家与医学家的努力,甚至更大程度上取决于数学、物理学、化学、计算机技术等的发展以及与生物医学的结合。”
“随着AI技术的成熟,蛋白质、基因组学数据的积累,AI制药平台化势必成为医药行业的一股革命性力量,从根本上改变传统药物设计试错流程,未来AI大模型技术又将引发新的期待。”
近日,由雷峰网GAIR Live&《医健AI掘金志》举办的《「人机协同」模式下的新药研发》线上圆桌论坛落幕,五位具有投资、企业、药物实验、AI制药背景的专家表达出这样的愿景。
本次论坛,由浙江大学药学院教授谢昌谕主持,北京大学药学院研究员刘振明、腾讯医疗健康AIDD技术负责人刘伟、浙江工业大学智能制药研究院院长段宏亮、清华大学智能产业研究院战略发展与合作部主任张煜参与讨论。
在上篇中,他们共同辨析了人机协同模式下的药物研发历程、近几年AI制药领域的算法和模型突破、以及与传统药物研发手段相比AIDD的优劣性。
在下篇中,则探讨了我国创新药研发的痛点、AI制药的数据之困,以及新一轮AI浪潮下药物研发的可能性。近期AI大模型爆火,欢迎添加作者微信(微信号:qiaoyw186),互通有无。
“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。
经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。
GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。
以下是主题论坛的现场内容,雷峰网(公众号:雷峰网)《医健AI掘金志》做了不改变原意的编辑和整理。
张煜:从历史来看,我们国家的西药研发确实跟随着欧美的步伐在前进,欧美国家很早就有了相关的行业标准和规定,使新药研发有规律可循,并且在发展的过程中培养了大量的行业人才。在行业标准性、规范性以及人才培养上,我们都还有很长的路要走。
过去那套新药研发的机制,包括前期的研发、IND(Investigational New Drug,新药临床研究审批)、临床实验等环节在内,都需要很长的时间和资金的积累。在国外,已经有了很成熟的新药研发体系,不论资本、人才还是机制都非常成熟。
而国内还处于起步阶段,虽然国家正在大力推动国产药物创新,但是在新药研发机制上,我们还有很多的课要补。
在技术积累、人才培养、实验机制等方面,我们前段时间去了几家国际知名的大药厂进行学习,发现他们的流程化做得非常好,国内的企业目前也在学习中,但整体上看还是跟随着欧美的脚步,其中存在很多痛点。
与国外的AI制药技术相比,我国的相关技术仍旧存在着代际差异,并且是系统性的差异,而非某一两个因素。在追赶的过程中,国家要发挥更大的作用。
新药研发的投入是巨大的,虽然如今行业内已经划分出CDMO( Contract Development Manufacture Organization,合同研发生产组织)、CRO(Clinical Research Organization,临床试验业务)等不同的研发阶段,但仍旧是一件费时、费力、费钱的事情。
对国外已经发展成熟的大药厂来说,他们有成型的平台和多年的资源积累,探索AI辅助新药研发的成本会更低一些,而国内目前还处于摸索阶段,试错的时间和金钱成本要更高,标准成本也更高,还需要国家的支持。
AI制药是否能成为国产药的创新弯道超车的机会,我认为这是一定的。新的技术要素造就新的格局,每一次产业革命都是由新技术的变革所带来的,AI制药正是我们国家赶超欧美的一个新机会。
几位老师在前面的讨论中也讲到,AI制药不能仅仅停留在计算的阶段,最终还是要落实到实际的药物疗效上,所以必须要和干湿实验结合起来,从过往的经验来看,湿实验更多的是正向实验。
如今很多企业,特别是新的AI制药企业都引入了干湿实验实验,从正反两方面进行验证,使算法收敛的速度和优化的效率都得以大幅提高。
所以,我们的AI制药技术和国际上差距在不断缩短,但是从创新程度上来看,欧美如今还是创新的源头,我们仍处于跟随和学习的阶段。
段宏亮:创新药的研究国内起步比较晚,距今还不过十余年时间,在此之前一直以仿制药为主。当然,这也和我们国家所处的发展阶段相关,很多研究都要从零开始发展,创新药也是如此。
在人才培养、新药研发流程方面的欠缺,导致我们和美国、欧洲、日本等国家之间,存在着非常大的差距。
但是从最近十年国内从零开始做创新药开始,能够看到国内以恒瑞、百济神州等为代表的公司,已经有一些产品在国际上具备了一定的竞争力和影响力,比如百济神州开发的BTK抑制剂,这表明我们国家的药物行业有很强的学习能力,尤其是在一些相对较新的药物研发细分领域。
比如ADC抗体偶联药物,最近一两年间,国内的制药公司向国外制药巨头转让了数个金额达几十亿美金的ADC药物。
在类似的新兴细分领域中,欧美国家也没有太多的积累。AI制药也是类似于ADC领域的新兴赛道,相比我们国家,欧美国家的技术积累也不太多。
虽然国内的制药行业相比国际上还落后一些,但我们的AI技术在全世界是非常一流的,我们国内凭借先进的AI技术水平,和相对落后的创新药研发进行结合,形成AI制药这样的新行业形态虽然只发展了短短几年的时间,但整个资本市场这个行业的反响都非常热烈,甚至比欧美国家的投入还要大得多。在大量资源的扶持之下,我们或许能在短时间内取得一定的成果。
在新药研发领域,我们和欧美依然存在着代际差异,尤其是小分子这一板块,我们几乎没有做First In Class的新药开发能力,国内的First In Class屈指可数,更多的是Fast Follow或者Me-too、Me-better的项目。
但是在AI 制药领域差距却没有那么大,国外这方面发展得也并不顺利,以薛定谔、Recursion等为代表的各大AI制药公司,在资本市场的表现并不算好,一些研发项目进展缓慢。
这就为我们赢得了很多时间和机会,如果国内能够继续保持研发的劲头,在这样一个全新的赛道中,完全可以弯道超车。
刘振明:这个问题很值得讨论,在许多公开的报告、讨论中,我曾经反复提过一件事情:中国的创新药被迫起航。从这句话当中,我们可以感受到切肤之痛。
就在去年和前年,国内的一家知名药企裁员一千人,因为这些员工做的是仿制药业务,而非创新药;另一家药企自断臂膀,将自己所谓的创新药项目砍掉了八十多个。
这就是他们的切肤之痛,他们做的药物,放在五年前可能都是宝贝,但是在创新药时代就变成了累赘。
为什么会出现这种局面?我从一个从事药学研究的工作人员的角度来分析,首先,2021年国家药监局药审中心发布了第46号文《以临床价值为导向的抗肿瘤药物临床研发指导原则》,做肿瘤药物的热潮一下子就熄火了。
标准是人家制定的,要和他们竞争你的能耐在哪里?监管部门要考虑这些问题,这些都是长痛,而非短痛。
其次,大家都在讲AI,我们在研究中关注适应症更多一些,比如PD和AD对市场来说是很好的适应症,为什么大家不做?
以往基于Aβ蛋白,基于乙酰胆碱酯酶抑制剂研究积累的数据,对我们建模、做PD和AD的药物研究,究竟是助力还是阻碍?这些问题都需要思考。
2021年,国家正式启动科技创新2030“脑科学与类脑研究”项目,在目前的研究水平之下,我们对一些脑部疾病的认知还太肤浅,甚至于前期研发的相关药物使用的都是“假”数据。
虽然现在大模型的概念玩的很嗨,但是到了真正练兵的时候估计作用有限。我个人感受,AI目前炒的太热了,我们科技组的很多学生,水平都还未达到培养要求的标准,就已经被企业争抢得一塌糊涂,人才更是这个行业的痛点。我担心繁华过后留下的是一地鸡毛。
当然,我们希望大模型的发展不会像当年的互联网泡沫破裂一样经历漫长的寒冬,但前提是从业者能够脚踏实地地为人才储备做一些扎实的工作,才能让这个行业经历过现在的短痛以后,不再经历未来的长痛。
关于国内的AI 技术与国外相比是否存在代际,我的观点与其他几位老师相同,是不存在的。但中国目前的创新药研发能力和国外存在代际差异。
为什么我们一直在强调基础原创研究?很多研究药学领域的老师都明确讲过,我们的很多药效模型和国外相差至少二十年,比如几年前的IDO抑制剂药物,国外的研究项目下线后,国内的相关项目也全部下马,因为核心的原创研究不在我们手里。此外,在药剂和递送技术、药物研发环境等方面,我们和国外都存在代际差距。
至于AI制药能否成为国产药创新、弯道超车的机会,AI一定能让创新药的研发起步姿态非常美,但是能不能跑到终点,目前还不知道。弯道超车要有一个前提条件,它得有道。
我们做药的人常常讲,当一款药物成功以后,我们讲出来的故事往往都是完美的。但如果回过头重新走一遍这条路,也许最终得到的结果却很不一样。
简而言之,做药这件事情除了实力以外,还需要一点点的运气。因此,我只认可AI技术能够让药物研发的起跑姿态更美,能否超车仍是未知数。
谢昌谕:整体而言,这一阶段新药研发存在的痛点比较多,不论是整体的大生态还是人才、数据或其他方面,各位老师刚刚已经讲过很多,我就不再重复了。但如果就聚焦在AI制药的领域,尤其是聚焦在算法模型的层面,我认为不存在代际差异。
当前的AI技术以及整个社区,相对来说比较开源、透明,世界各国的研究者们不入欧有新的研究成果或进展,大家都可以快速地通过发表的论文,开源的代码以及各种线上讲座等方式来相互了解和学习。
但由于基础设施的差距,在新药研发过程中药企之间反而很难像AI技术一样迅速实现技术的学习和共享。弯道超车少不了AI技术的支持,但仅仅依靠AI技术可能还是无法实现。
谢昌谕:ChatGPT做的RLHF依赖专家标注的数据量还是比较大的。RLHF应用在药学领域的挑战在于,人类专家很多时候没法“一拍脑袋”就轻易地对大模型输出的不同答案进行评价和排序,判断好坏。
在药学领域,研究者还要对大模型输出的结果进行更多的计算或实验,才能确认哪个选择是更好的。
如果说大模型输出的结果非常容易分辨,比如设计出的新分子与口袋靶点是否能形成关键的相互作用,或者较为简单的物理化性质的评估等等,专家一看就能分辨,那么这个大模型学习到的相关知识可能还还是十分有限。
这也是ChatGPT与新药研发在使用上的底层逻辑不同的需求。ChatGPT 更多的时候只要做到人类专家的水平即可,然而AI制药往往期望 AI 可以做的比专家和之前的CADD 都更为准确的判断。
当然,正如刚刚刘伟老师讲到的,目前已有不少优秀的分子生成模型是通过强化学习来进行调试的,所以这项技术肯定还是有用的。
但是具体在什么样的场景下才能将这项技术用得更好,真正在一定程度上可以降低对庞大数据量的依赖,还有待我们去挖掘。
刘振明:我们特别看好大模型未来对AI制药行业的赋能。目前,大模型更多的应用场景是在社交领域,而在AI制药领域,大模型的商业价值的实现会更加缓慢,未来五到十年内大模型应用场景会发生切换,对AI制药产生一定的影响。
以我们关注的化学制药为例,化学制药的合成实际上就是速控步,需要基于经验来完成,否则就要依靠外包。SCIFinder这类知识库也许很快就会被大模型取代。
在未来,即便一个经验怎么不丰富的合成学家,借助大模型这个“军师”也能完成合成工作,只要向大模型提问合成反应的结构式、不同反应条件的选择等等,大模型都能够给出指导。
在优化环节,使用者哪怕只是给出“这个结果不太对”的回应,大模型都能够据此对结果进行优化。
最近几年,我和国内做创新药的投资人接触比较多,感觉他们特别不容易,一方面带着兴奋,坚信生物医药绝对是一个创新的朝阳行业;另一方面带着迷茫,没有深厚医药背景的他们很难看懂这个行业。
未来大模型的发展,也许能够让这批投资人更好地理解创新药的研发,对行业的影响反而更大。
投资人虽然不做药,但是他们在大模型的支持下,他们能够与做创新药的人更好地对话,省去了进行底层教育的时间。
我遇到的很多投资人都不敢投创新药行业,大模型更像一个军师,我们也特别希望它未来能成为投资界的一个强有力的助手,使创新药的投资门槛更低一些。
刘伟:预训练AI大模型出来之后,我们这些做AI的人归纳起来,认为它带给了我们两个比较震撼的改变过去认知的东西,一是改变了AI的范式,二是改变我们对效果的认知。
过去我们做AI通常是基于监督学习,或是规模不大的预训练的模型加微调,比如BERT+finetune。现在的大模型在应用场景中不依赖微调,只需要用海量的无标签数据进行预训练,再用提示学习等方法小规模数据进行优化,这跟以前的预训练的大模型加微调是非常不一样的。
这是一种新的范式,反映到AI制药行业也是存在的。比如基因,蛋白质序列,各种大规模化合物分子的数据库等等,数据量可能达到几十亿到几百万亿的量级,并且其中绝大多数都没有标签,这与自然语言的情况是比较类似的。
这种情况下,如果我们能够将这些数据拿过来对模型进行训练,这些数据库中所涵盖专家知识的量是人类专家很难企及的。 这些数据全都拿来,并且能够进行有效的表示和学习,能够带来的想象空间是非常大的。
当大模型学习了大量的基因数据、蛋白质数据或者分子数据后,也许就能够发现新的分子生物学的机理,甚至是发现一种新的治疗方法,这在不久的将来都是能够想象得到的。
另一点对效果认知的改变也十分显著,过去我们认为多轮对话并且具有一定的逻辑推理能力的AI非常难以实现,也许需要三五十年才能打造这样一个通用的人工智能,当下的大模型所展现的智能涌现的现象,是以前从未出现过的。
智能涌现叫做emergence,来源于凝聚态物理和复杂系统的研究中,即复杂系统中的较低层次的子系统通过相互聚集、相互作用构筑较高层次的系统,会在较高层次的系统层面诞生一些子系统所不具备的新属性或新规律。
比如凝聚态物理中的超导、超流等相变现象,就是物理学中的典型涌现现象。
在以前的AI模型训练中,从未出现过涌现的现象,即模型参数量以及训练的数据量跨过一个坎后,出现大幅度的性能提升,也就是出现相变。在以往的普遍认知中,增加数据量后,模型的效果会出现一定的提升,但只是线性或亚线性的增长,而非涌现的那种突变。
以前的很多研究工作由于性能提升缓慢没能再继续下去,在大模型的背景下,这些工作可能又值得继续研究下去。
大模型也为AI制药的研究提供了源头活水,如果我们有一个以分子化合物为基座的大模型,利用数十亿量级的数据库对大模型进行预训练,其中少量带有标签的数据可以来自湿实验,或是来自专业领域的知识、人类专家的反馈,然后对基座的大模型进行微调与强化。
行业内已经有很多公司在进行相关的研究工作,训练蛋白质、基因或分子的大模型,将这套范式搬到药物AI的场景下,这是一个非常值得投入的研发方向。
至于大模型在药物AI领域能否像自然语言处理领域一样,出现智能涌现的现象,达到一定的训练量和参数量后,效果实现显著提升,目前还是一个开放性的问题,有待我们进行进一步的研究。
段宏亮:专业领域的大模型与ChatGPT等常识性大模型相比不同的地方在于,对于ChatGPT来说,来自全球的几十亿人都可以作为数据的生成人员与ChatGPT进行人机互动,但如果我们研发一个药学大模型,能够生成数据的人相对而言比较有限,可能只有几十万或是几百万的量级。
从大模型要处理的工作来看,药物研发的难度比ChatGPT中自然语言处理的问题难得多,所以,药学的大模型的研发和训练显得更加困难。
药学领域的很多数据都依赖于实验,或许几周、几个月的时间才能产生几个数据反馈给计算机模型,无法像ChatGPT一样从互动聊天中即时获得大量的信息,迅速迭代。
当数据量或是产生数据的人较少时,药学大模型是否还能像ChatGPT一样,迅速地根据人类反馈优化,使模型的智商在训练中增长,还是一个未知数。
但是从数据的角度来说,药学大模型,或许可以成为收集药学数据的方式。正如刘老师刚才所讲,用联邦学习平台收集数据是不可行的,药企的戒备心很重,无法放心地将数据放到联邦学习平台之中,担心数据会泄露。
但药物研发人员在与大模型的交流互动过程中,会以一种隐蔽的方式将数据传输给大模型。大模型可以将这些零散的数据收集起来,将时间线拉长,在几年、几十年后,数据积累到一定程度,也许某一天药学大模型就会豁然开朗。
张煜:蛋白质结构预测技术的突破,让大家看到了更多的可能性,也让人们开始畅想这个行业未来的模样。
不仅仅是AI制药领域,整个社会,包括专业的学术领域、技术领域、企业界和资本界,都对制药产生了更多的关注和期望,所以即使没有技术的突破,相关应用的发展也会进入快车道。
至于相关应用突破和爆发的可能性,从技术角度来看可能的发展方向有以下几个。
首先是药物设计,肯定会更快、更精准、成本更低,这本来也是AIDD要实现的目标,在技术驱动下会向着这样的方向发展。
在具体应用的层面,病症的治疗会更加个性化和精准化。过去在治疗普通病症时,需要服用的药物剂量都是一片、两片,儿童减半,但治疗一些特殊病症时药物的剂量需要非常精准,没办法用传统的方法来定量,但AI可以解决这一问题,通过计算给出精准的药物配比和剂量。
其次是在一些特殊方向上的应用,比如抗衰老药物的研发。干细胞的研究与个体相关,要进行很多的实验,成本非常高,如果用AI技术来辅助进行研究,或许能够大幅降低成本。
罕见病的相关研究。药物研发以数据为基础,通常需要大量数据。但罕见病的稀有性则注定无法取得大规模的病例数据。如果使用AI技术,或许能够使这些小样本或小数据量的药物设计成为可能,这也是未来可能的突破方向。
迅速反应和预测。当年SARS病毒出现时,研究机构花了很长时间才确认毒株,而四年前的新型冠状病毒出现后,仅仅花了一周时间就确认了毒株的整体结构,从而快速找到应对措施。在AI的辅助下,我们对大规模传染性疾病的防治或许会取得更好的效果,甚至在AI的支持下,可以预测病毒的变异和进化,从而提前研发面向未来的疫苗和抗体。不借助AI手段这些是无法实现的。
复合疗法。目前的单抗、双抗或是其他疗法,通常相关性很强。在未来,某些疾病可能需要相关性不太强的疗法,比数字疗法加药物疗法,或是其他不同的疗法综合进行疾病治疗,其理论基础和实验都非常难,以我们目前的手段几乎无法实现,AI技术或许能够使综合性的疗法成为可能。
药物递送。药物递送与药物设计、靶点发现同为药物研发中的三大难题,就目前的技术手段来看,药物递送还存在很多问题,也许只有AI技术能够解决。
中药。中药研发过程中涉及到的机理和各种要素比较复杂,规律性比较差,用传统的研究方法很难实现,用AI技术进行研究或许能取得比较好的效果。
段宏亮:随着蛋白质结构预测技术和大模型这两个跨时代的新技术的应用,对新药研发工作的改变会非常大。
在小分子药物的研发上,如果要做小分子药物和蛋白药物的相互作用,本身就需要蛋白质结构,蛋白质结构预测技术刚好可以解决这个问题,
当然,更大的影响或许在蛋白药物的开发以及多肽药物的开发这些领域。
AlphaFold2做的主要是单体的蛋白结构预测,而蛋白质复合物、以及蛋白和多肽复合物的预测,和蛋白质药物、多肽药物等的研发相关性会更高,DeepMind后来开发的AlphaFold Multimer就做了很多这方面的工作,本质上与AlphaFold2一样,都是氨基酸的相互作用。
如果能够沿着这条路走下去,在蛋白质复合物的研究上投入更多精力,把精度做得更加准确,那么在抗体药物、蛋白质药物、合成生物学等方向,或许会出现一些颠覆性的应用,这会是未来几年中我们可能看到的重大突破。
刘伟:从AlphaFold2出现以后,蛋白质结构预测做得越来越多了,但是目前仍然没有将这项技术非常好地应用落地在药物临床前的各个研究阶段,并且取得比较大的提升,我觉得这一块在未来是一个很重要的突破口。
刚才段老师提到,可以用蛋白质结构预测用在抗体的研究上,可以实现很多以前没有做过的工作。
我们曾参加过CASP14竞赛,自研了tFold,近年也在tFold的基础之上扩展出tFold-Ab,用于抗体结构的研究,同时我们也测试了蛋白质结构预测在不同场景下的性能表现,比如单体、二聚体、三聚体、抗体抗原等体系下的性能,在有些情况下还存在比较大的误差。
业界也有不少论文中提到了类似的测试结果,因此有人质疑AlphaFold2是否真的能够应用于实际的药物研发。
针对这一情况,我们团队专注于tFold在抗体抗原体系中的研究,在tFold模型的基础上,设计了基于大规模预训练的单序列结构预测方法,能够快速预测出抗体重轻链复合体的三维结构,这项研究成果已经发表在 NeurIPS2022的机器学习与结构生物学研讨会(《Fast and Accurate Antibody Structure Prediction without Sequence Homologs》),目前该成果也已经和多家药企进行了相关合作。
刘振明:AlphaFold2在生物医药领域中的应用会带来很多影响,解决了靶标的问题,激活了以抗体设计为代表的大分子药物设计领域。
有很多投资人问过我们为什么不做大分子,只做小分子。他们认为大分子更复杂,但实际上抗体抗原设计中80%以上的东西是一致的,而小分子相对来说要复杂得多。
AlphaFold2的应用也不会让结构生物学家们失业,我有一个学生在做卤化酶的研究,他明确地讲过AlphaFold2对他所研究的卤化酶的预测是错的。卤化酶并不是很复杂的一类蛋白,但AlphaFold2预测出的结果与实际情况的确存在出入。
这意味着AlphaFold2或许在统计学上做得很好,整体来看在蛋白质预测领域表现很出色,但它并不是万能的,在某些细分领域的预测不一定准确,依然需要结合试验结果,由人类专家帮助优化。
其次,AlphaFold2用来做训练的数据是静态数据,而蛋白质在人体内发挥作用时是动态的,通过结构的变化来产生功效,这是AlphaFold2目前的数据集中所缺少的数据,但是在药物研发的过程中,必须要考虑这种动态变化。
AlphaFold2走出了一个很好的开端,但是未来要走的路还有很长。
如果未来的药物领域出现了AlphaDrug,它要回答的一个最重要的问题,某个疾病用什么“新”药来治疗?(不是简单的用药推荐)。
只有大数据能够回答这个问题的时候,才真正实现了AlphaDrug。大夫可以和大模型进行对话,将疾病的症状用定量的方式进行描述,然后大模型在无穷大的仓库中找出疾病的诊断结果与治疗方案。
就像AIDD这个行业,不论算得再准,最终要交付的还是品种。在我前几天参加的一场答辩中,一位药物化学领域的前辈提出,所有能被药化学家看出来的东西都不是AIDD。品种交付能力一定是未来技术突破中要关注的问题。
我是传统的药物化学家,目前还在负责一本欧洲药物化学杂志《EJMC》。我们在和主编讨论时,经常说起两靶点、三靶点、四靶点,我们知道每一个疾病的发生和治疗绝对不是单靶点,这就反向给我们提出了一个问题:在一个疾病的治疗中,究竟什么样的靶点群是有效的?
如果未来AI技术能够解决这个问题,AI制药也将取得很大的突破。现在最大的问题在于,第一临床数据太少,第二噪音背景太大,或许大模型技术已经出现了很多好的文章,但是距离真正解决问题还需要一定的时间。
谢昌谕:各位老师刚刚也提到,在如今的AI+Science浪潮之下,很多不同的领域都有可能成为下个产生重大突破的焦点。
从我个人感兴趣和能够参与的领域来讲,我很期看到AI能够和基于理论的计算科学的传统算法产生新的融合,从而加速在量子化学、蛋白质结构预测、分子动力学等等领域内的计算范式的突破。
AI的深远影响,甚至超过了制药的范畴。我们对大语言模型的挖掘也远远没有结束,它在生物医药领域还有其他的可能性。
比如刚刚曾提到过的,在高纬度空间中的数据分析,多模态的多组学等等,我们如何更好地从中了解复杂的生物网络,从而挖掘新靶点的新生物标志物,这应该是未来几年中将会看到越来越多成果的方向。
除ChatGPT以外,目前已经有AutoGPT能够更好地规划如何使用各种工具去完成更复杂的任务。由AutoGPT主导的干湿实验结合,加上可解释性AI等技术,能够实现更好的人机互动,使干湿实验结合达到一个新的高度。