晶泰科技CEO马健:AI正成为生命科学爆发与裂变的技术支点

12 月 10 日 - 11 日,由浙江省委人才办、绍兴市委市政府、《麻省理工科技评论》主办的全球青年科技领袖峰会暨《麻省理工科技评论》中国 “35 岁以下科技创新 35 人” 颁奖典礼在绍兴上虞举行,“35 岁以下科技创新 35 人” 2020 年中国榜单正式发布。

会上, 晶泰科技联合创始人兼 CEO 马健发表了《AI 赋能新药研发》的主题演讲。

他认为,过去很多年,AI 药物研发公司普遍分布在从机理研究、药物设计乃至到临床研究,现在正从局部优化逐渐走向全局优化,AI 将为新药研发带来一个全新的加速过程。在药物研发领域,AI 技术的下一块拼图在于数据,挖掘已有的数据很重要,但是更重要的是提高数据产生能力。

他表示:“生命科学研究医药是与时间的赛跑,而人工智能就是下一个时代,生命科学爆发的一个外源动力。”

根据《中国发展报告 2020》,2050 年时中国将拥有 3.8 亿 65 岁以上的人口,占国家总人口比例达到 27.9%,这样老龄化的发展会给生物医药带来非常大的需求。2018 年有一部电影叫《我不是药神》,其描述了用药难的问题。事实上,目前很多创新药物未能满足临床需求。很多人说 2020 年是生物医药的元年,这是因为疫情给我们提出非常多的新命题。

如何在最短的时间内跨过重重障碍开发出新的药物来?对生命科学技术来说,生物医药研发不仅是商业行为和经济问题,也是很大的社会问题。

马健介绍,过去这些年药物研发的整体回报率在不断下降,新药物越来越难被发现,越来越难被认可,同时还要面临重重安全、有效等等关键指标的挑战,有很多疾病到现在都没有合适的药物,还有很多疑难杂症迄今尚无有效治疗方法。

为什么这么难?药物研发一般是从早期机理靶点发现,然后到临床前研究,再进入人体的临床研究。其中面临着 “三高一长” 的特性:高风险、高投入、高回报、周期长。基于统计数据来讲,一款创新药物从最早研究的发现阶段开始走到临床,需要十年和二十六亿美金,不仅耗资巨大,而且时间非常漫长。

药物分子设计就像千军万马过独木桥,从最开始大量的候选化合物,经过层层遴选后,很多化合物最后失败在药物安全性和药效上。真正能够走到最后上市的药物,其实 FDA 每年最多批准三十几个药,但是全球药物研发却有大量的活动。

“药物研发过程非常复杂,比如发现了一个疾病的致病基因,这个基因表达一个蛋白,蛋白就像一把锁,这个锁有一个锁眼。药物发现就相当于找一把钥匙,这把钥匙正好能打开这把锁,可以调控机理治疗疾病。当然,这是一种非常美好和形象的比方。在我们实际做研究和药物发现的过程当中,真实的感觉却更像另一部电影《谍中谍》。有时候就像是一个看上去不可能完成的任务。” 马健打了个比方。

即便科学家设计出了一把 “钥匙”,它完成了最后一步在细胞内蛋白层面的操作,但是新药进入人体内,经过器官、血液、吸收、穿透细胞膜,却需要一个 “特工” 带着这把钥匙潜入敌人的大楼通过重重关卡,最终才能抵达病灶的终点。

所以,药物的发现远不是只设计一把” 钥匙” 那么简单,我们需要开发一个具备完善能力的分子才能够有效去解决这样的疾病。这个过程通常用物理和数学的方式层层进行筛选,从而多阶段、多目标地优化问题,在面临这样问题的时候,我们自然会想到,是否有更多的源头创新的技术,能帮科学家们找到更多好的候选化合物,以及更好地优化指标并把药物快速设计出来。

这便是 AI 技术过去几年在医药研发领域越来越关键的原因,就像当年 AlphaGo 在围棋领域战胜人类冠军一样,最近谷歌新推出的 AlphaFold 程序利用 AI 技术做蛋白结构预测,其实很多新思想和新方法也会对行业上下游有更多启示。

AI 在药物研发中,很多时候扮演的角色是帮助科学家去广泛探索化学空间,精确找到可以成药的分子。

比如类药的化合物空间是一个非常庞大的数字 ——10 的 60 次方,这么大的化学空间中这么多可能的分子当中,要找到最后可能会治疗疾病的药物,人的智力可触达的空间非常有限。科学家需要从分子的产生和分子搜索,再到计算化学和物理手段把分子的活性和选择性相关药效的属性描述出来,之后再通过自动化高通量的方法合成和测试完成这样的过程,来加速药物发现。

“晶泰科技过去几年一直致力于做药物创新和 AI 赋能,在我们的实际工作中,跟药企的合作和孵化创新药物的过程都经过了这样的过程,我们的工作更像是药物研发专家手里的升级武器,一个思想的放大器,专家给我们一个 idea,我们通过 AI 技术可以给你一千个、一万个或是在新范围内找到更好的 idea,这样就能完成思想的跨越,打开想象的空间。” 马健说道。

目前,通过 AI 和量子物理算法,晶泰科技可以实现对类药化学空间的全局探索,在更广阔的化学空间中寻找全新的药物分子。同时,在 AI 的协同下,对于可成药分子的毒性、选择性等关键性质进行综合打分,快速收敛。可以将发现先导化合物的速度从 12 个月提升到 3 个月,药物发现的合成分子数量从上千降到 200 以内。其晶型预测的效率更是惊人,仅用 14 天便能得到常规研究方法需要 1 年时间才能获得的结果。

马健表示,人工智能相当于给药物化学家插上了想象力的翅膀,比如要设计一个分子,构造新的化合物,AI 其实起到了放大器的作用,给科学家提供新的工具,工具非常重要,工具决定生产力,也决定生产关系。药物研发当中的生产关系即是研发策略,AI 技术把一些瓶颈解决之后重组很多新的研发策略,能让结果变得更加优化。

而 AI 制药未来下一个拼图会是什么?他认为最重要的还是数据问题。AI 有数据和训练集,挖掘已有的数据很重要,但更重要的是提高产生数据的能力。

药物的发现从最微观的分子蛋白、到细胞、再到动物,整个过程就是一步一步建立生物和生命体相互认知的过程,AI 发挥的主要作用目前来讲是在比较早期的阶段,这个阶段可以视作物理建模区,这个尺度下很多的相互作用和要素比较简单,可以通过大量精确的物理学模拟获得虚拟数据。通过虚拟数据的训练,有针对性地提升 AI 的表现。

但是到了后面,更多要依赖于直接去探索自然界的实验和人的经验,靠底层物理学的建模,不可能做好或较好完成这件事。因为,从分子到人是一条线,每一两个点之间都有尺度的鸿沟,所以要思考在这个地方该用什么样的方式来提升 AI 要表现的能力。

AI 药物发现不是单纯的算法问题,传统上实验工作更多基于过去人的脑力活动研究一种条件来进行,受限于实验条件和物理规律,但是接下来科学家们需要更加丰富的实验技术,打造更加强大的 AI 大脑,为它提供丰富更多标准化和高通量的数据。

马健最后总结,AI 赋能药物研发自动化、智能化是一个非常重要的建设工作,也是一个新的基建过程。过去这些年 AI 药物研发公司,分布在从机理研究药物设计乃至到临床研究,现在正从局部优化逐渐走向全局优化,希望AI助力新药研发带来一个全新的加速过程。

晶泰科技在项目实践中,已经实现 1 年左右将新药研发项目推进至 PCC 阶段,基本集成了以人工智能为核心的一站式药物发现能力。晶型预测的效率更是突破性地提升,将项目研发周期缩短至 14 天。在研究准确度更高,结果更具理论依据的基础上,晶泰科技的研发模式大幅提升药物研发关键环节的效率。这些真实的项目数据,展示出人工智能技术有望成为生命科学爆发与裂变的技术支点,创造出更好的“新药神”。