进入到 2022 年,生物科技领域动态不断。
仅过半个月,有 4 家生物科技相关公司被同一家企业投资;不仅如此,它所投的项目在《麻省理工科技评论》(MIT Tech Review )的十大突破性发明“AI 新药发现”板块占比过半……
这些动态的背后,都离不开一家互联网巨头:百度。
对于鲜少关注医学领域的人来说,很难将百度和生命科学进行联系,但从其近年来的种种举措来看,在生命科学领域,百度正“闷声干大事”。
对外界而言,百度 AI 落地最广为人知的场景在于自动驾驶领域,即百度 Apollo,但对于百度而言,其 AI 的野心并不止于此——对于生命科学领域,百度同样想吃下;不仅因为这是一个极具前沿性的方向,而且关系到李彦宏“最初的梦想”。
大约在 20-25 年前,李彦宏就对生物信息学挖掘人体秘密充满兴趣。
早在 90 年代,李彦宏在华尔街时便申请过生物信息研究相关的工作,据说当时已经拿到世界顶尖生命科学研究机构的 Merck(默克集团)的 offer。
不过,在他看来,当时的基因测序技术还非常初级,生物数据量和数据质量也不足以发挥计算的优势。
“如果那么多从事生命科学的人都不相信计算机能够对生命科学产生重要影响,那么靠我一个人力量恐怕也很难推动”,李彦宏事后回忆。
后来的事情也不难得知,李彦宏回国创立了百度,而后百度又在 AI 上迅猛发力,并在包括智能驾驶等领域进行落地实践。
但对李彦宏来说,他始终没有放下对生命科学的向往。李彦宏曾多次在公开场合提到计算机技术与生命科学相结合的可能性。
在他看来,基因测序是 IT 领域之外另一个高度契合摩尔定律的领域。“每隔 18 个月,计算机的计算能力提升一倍、成本下降了一半,经过几十年这样的速度发展,很多原来觉得不可能的事情变可能了”,李彦宏表示。
从基因测序的发展来看,的确如此。十几年前,基因测序需要花费 10 亿、20 亿才做出来。如今,每个人的基因测序只需花费 1000 美元左右。
即使当初想投身声明科学的“梦”被暂时搁置,但在很长一段时间里,李彦宏一直在尝试推动互联网技术和生命科学的结合,曾个人捐资 3000 万元与协和合作抗癌项目;跨界参与完成医学研究论文等。
2020 年 5月,李彦宏与其它学者共同研究的关于食管鳞状细胞癌的论文在权威医学期刊 Cell Research 杂志发表,题为《Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma》。
除了李彦宏亲自上阵的种种举措,百度还在内部设立了一家 VC 基金——百度风投(Baidu Ventures),其中一大重要投资版块便是生物智能。
据不完全统计,百度风投过往投资的生物计算相关企业超过 50 家,涵盖 AI 药物发现、多组学数据、分子影像等诸多领域。
在多年的积累沉淀下,百度在 2020 年 1 月疫情爆发时就能够在第一时间开放线性时间算法 LinearFold——借助这一算法,疾控部门用 10 小时便完成了四个样本的全基因组测序。
随后,百度研究院又推出全球首个专门优化新冠病毒 mRNA 疫苗基因序列的高效算法 LinearDesign,可在 11 分钟内完成序列设计。
或许是新冠疫情的爆发让百度更加认识到互联网技术和生命科学结合的重要性,在 2020 年 8 月,百度研究院宣布成立生物计算实验室。
百度期望通过 AI 和计算技术,深化学术界和生物制药企业的合作,探索基因、DNA、RNA、蛋白质分子结构等人类生命密码,缩短新药研发周期,降低新药研发成本,提升药物和疾病匹配的精准度,发现基因和疾病的关联关系,从而实现精准医疗。
仅仅过了 1 个月,百度就成立了一家名为 "百图生科"(英文简称为 BioMap)的生命科学平台公司——李彦宏作为牵头发起人,担任该公司的董事长,原百度风投 CEO 刘维担任 CEO。
雷峰网(公众号:雷峰网)注:图为刘维
值得注意的是,百图生科成立初期,李彦宏并未以个人股东的身份出现。直到 2021 年3月,李彦宏才通过直接和间接方式持有百图生科 40% 股份,成为名副其实的幕后掌舵人。
这意味着,在扎根互联网 20 年后,百度正式向生物科学进军,寻求 AI 落地的另一站,而李彦宏也重新踏上了逐梦之旅。
“这些年,我对挖掘人体数据、探寻疾病规律、找到新药设计的热情一如既往”,在 2021 年的生物计算大会上,李彦宏坦言一直在密切关注生物计算行业的变化。
尽管 20 多年前未能圆梦,但随着生物计算发展十分迅速,产生的大量数据(包括基因组学研究带来的人体数据、新药研发过程当中所累积的知识、以及新生的各类机器学习算法等)为认知复杂的生命系统打开了新的大门,也给计算技术带来了新的用武之地。
知名咨询公司埃森哲(Accenture)曾在预测报告中指出——到 2026 年,大数据与医学和制药领域的机器学习相结合将产生每年 1500 亿美元的惊人价值。
可见,生物计算是一个前景辽阔的领地。李彦宏也坚定认为,生物和计算的融合会带来巨大的突破和进步。因此,百图生科的业务发展规划也始终围绕这个核心展开。
雷峰网了解到,百图生科的业务发展分为两个阶段——
第一个阶段:利用前沿 AI 技术构建完整的生物计算平台,并与提供新的数据轴和新的数据分析、药物设计工具的初创企业与研究机构携手,构建生物计算生态,为生命科学企业和科研用户提供丰富的工具能力和完整的解决方案,做好服务。
第二个阶段:深度参与或主导发起新型精准药物和精准诊断产品的研发,携手合作伙伴,为社会贡献极具创新性的精准生命科学产品。
不仅如此,百图生科还计划大力投入关键底层数据设备和计算技术的研发,加速高通量类器官芯片、高分辨物质观测设备、新的组学采集分析设备、蛋白质模拟和生物计算专用芯片的研发。
这并非易事。
仅是 AI 制药,就需要突破三大技术门槛,包括高性能的生物计算引擎、干湿一体的生物数据生产能力、靶点挖掘 — 药物设计全流程的闭环能力。
“这是一个新兴的行业,没有一个成熟的解决方案可以直接套用”,百图生科首席 AI 科学家宋乐说道。
宋乐进一步向雷峰网解释道,要用 AI 发掘新药有三个问题需要提前考虑:
一是了解复杂疾病的困难。
二是对多维度、多尺度的数据进行复杂且多样化的融合处理,包括基因层面的基因测序、表观组,蛋白质表达、蛋白质代谢,组织层面、机理层面等。
三是行业配合问题。数据分析与实验往往是两波人,他们之间的沟通缺乏一个非常高效的系统,将预测、模型输出和试验系统进行整合。
不难想见,即使背靠百度这座大山,百图生科依然步履维艰;毕竟,其要驶入的,是一片无人区。
而百图生科,仅刚刚开始。
公开资料显示,百图生科将与百度底层深度学习算法平台飞桨建立深度战略合作,飞桨将为百图生科提供 AI 底层技术和开发工具。同时,百度作为善于处理海量数据、知识图谱,具有巨型数据中心布局的 AI 平台公司,预计也将在底层架构上与百图生科产生协同。
从全球市场来看,企业耗费巨资建立研发中心的大研发模式已成过去。近年流行的趋势是 VIC 模式,即 “VC (风险投资)+IP (知识产权)+CRO (研发外包服务)” 相结合的新药研发模式。
在此模式之上,百图生科提出了“VIP”模式,即利用资本(Venture)+自行参与打造 IP + 生物计算及智能实验平台(Platform)加速药物和诊断管线的 IP 生成和转化——这或将成为百图生科生物计算平台的核心价值和盈利来源。
雷峰网了解到,百图生科有独立的投资部门 BioMap Ventures,其前身是百度风投的生物投资团队,目前在全球已投资了超过 50 家早期企业。
除了联合生态合作伙伴,百图生科还在不断招兵买马。成立初期,百图生科就宣布两项领军人才招募计划,将分别用 100 万美元年薪及 100 万人民币年薪招兵买马。
值得一提的是,去年加入百图生科担任首席 AI 科学家宋乐就是世界知名的机器学习专家,他曾在 CMU 从事生物计算相关的研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果,获得 NeurIPS、ICML、AISTATS 等主要机器学习会议的最佳论文奖。
2021 年 5 月,百图生科还推出了“免疫图谱卓越计划”。百图生科提供自身研发的核心生物计算引擎、海量自有数据、10 亿元的资金补贴,与生态联盟合作伙伴共同推动免疫图谱的绘制,系统探寻癌症、自免等疾病的复杂免疫规律,进一步提高对应的靶点挖掘和药物设计效率。
截至 2020 年 7 月底,首批“卓越计划”就已收到来自中科院、协和、北大、清华、复旦等系统的近百个临床和研究团队的申报。
不仅如此,百图生科目前也在自建实验室,从而全流程系统化地解决和提高行业的运行效率。
据悉,通过利用自己构建的生物计算平台和大规模预训练模型,百图生科成功将典型蛋白质结构预测时间,从 30 分钟缩短到 5 分钟以内。
在不断地发展布局下,百图生科在去年 7 月拿到了上亿美元 A 轮融资,GGV 纪源资本领投,百度、君联资本、蓝驰创投、真知资本、襄禾资本跟投。据了解,这轮融资还将用于技术研发和人才引进。
如果仅从百图生科的成立到发展的周期来看,其时间长度仅一年有余,但实际上,百图生科其实是李彦宏和百度在生命科学领域多年积累的汇聚,是百度 AI 落地的另一站,也是百度开启生物计算的新通道。
这是一条道阻且长的道路,李彦宏同样深知,他表示——
“生命科学没有尽头,只有尽力”。