从算法到临床:生成式AI在药物研发中的应用——任峰演讲实录

时间:2025-07-15

近日,2025昌平医药健康金融投资创新论坛在昌平成功举办。英矽智能联合首席执行官兼首席科学官任峰博士发表了题为《从算法到临床:生成式AI在药物研发中的应用》的主题演讲。以下为演讲实录:

首先,我介绍一下我自己,我以前是做传统创新药物研发,一开始在葛兰素史克,后来加入了美迪西,带领化学团队和生物团队做小分子创新药的研发,这十几年的过程深刻体会到了我们用传统的方式做创新药研发面临很大瓶颈。这一页是我最喜欢的PPT,从2010年的一篇Nature文章,传统创新药研发面临很大瓶颈就是研发周期长,研发成功率低,研发费用投入高,所以每款新药上市需要12到15年以上的研发周期,需要花费26亿美金研发投入,而且整个研发成功率从靶点发现一直到药物获批只有不到5%。为什么传统药物研发面临这样的瓶颈,是因为传统做创新药靠人的知识、经验,没有办法很高效,很系统解决三个最主要的核心瓶颈,第一就是跟生物学相关的靶点发现,第二就是跟化学相关的分子的设计,第三就是跟临床相关的临床方案的设计和优化,这三个方面没有办法通过人的知识经验系统高效的解决,有时候我们的科学家灵光一现解决一方面的问题,但是不可能永远都是灵光一现。利用数据,利用算法,通过人工智能的方式,基于过往大数据可以帮我们系统性解决这三个的方面问题。第一就是靶点发现,第二就是分子生成及第三是临床试验,针对这三个方面,英矽智能我们又发明了自己的三个AI平台,一是利用多组学数据帮我们发现靶点,第二是利用生成式对抗神经网络,Tansformer等生成式AI帮助我们设计和生成分子,第三是帮我们预测临床二期到三期的转化率,这是我们临床试验的最低谷。

PandaOmics利用病人多组学疾病找靶点,经过四五年的时间,到2020年底,把这样一个算法通过不断优化,优化算法,丰富数据,做成一个商业化的软件,叫PandaOmics。PandaOmics今天由于时间关系我不介绍了,就是你只要把你想做的疾病领域输入到这个界面,按照这个方式就可以通过病人多组学数据,帮你找到PandaOmics它认为比较好的,或者新颖性的,又靠谱的靶点。

找到靶点之后,下一步就是如何设计分子。这里有一个Chemistry42平台,靶点的三维结构可以是晶体结构,冷冻电竞结构,输出端就是AI帮你设计的小分子,能够和蛋白结合成像性好的小分子,这里有40多中生成式AI算法,来帮助我们产生分子。

所有的AI平台后台都是庞大的数据,英矽智能经过十余年的积累,积累了一千多万组多组学数数据,包括转录组、代谢组、蛋白组等等,数据库里有两百多分子结构和活性,安全性、毒性信息等等,所有这些数据都是AI算法的底层,所有算法都是基于高质量的数据上面。有了数据,有了算法,大家想问一个问题,是否可以通过AI把生物学、化学结合起来,找到一些治疗疾病的新的作用机制,一些新的药物,下面我以一个例子,主要是以一个例子,特发行肺纤维化为例,展示一下我们如何做药物。

首先,特发行肺纤维化是一个罕见病,全球影响了70多万病人,这是致死性很强的疾病,得病以后病人平均寿命只有三到五年,病人用力肺活量每年以6.8%的速度在丧失,三到五年病人就去世了。目前市场上只有两款药,这两款都是十年前的,而且有明显的毒副作用,疗效不好。即便如此,其中一款的销售额有38亿美元。里面有40%的病人没有耐受药物毒副作用被迫停药,对这些病人来讲没有药物可以医治。英矽智能希望通过我们的AI平台找到治疗特发行肺纤维化这种新的靶点,新的药物。我们对比纤维化病人和健康人的多组学,找到他们基因之间差异,到底哪些基因发生的变异变化,能让病人容易得特发行肺纤维化,或者通过这种方式,同时对比文献专利里的信息,用这种方式找靶点。通过这种方式PandaOmics帮我们推荐治疗特发行肺纤维化的靶点排名第一叫TNIK,大家可能没听说过这个靶点,这是目前全球除了英矽智能之外没有任何一个公司有针对这个靶点的分子在临床上。这是2019年找到这个靶点,当时非常新,我们得做一些生物学机制的验证,发掘TNIK可以形成很多信号通路,都是跟纤维化相关,我们认为这可能是一个靠谱的靶点,影响多个信号通路,都能治疗纤维化。于是,我们当时立项决定做这个分子。因为没有化学起点,只能用生成式AI,把靶点的三维结构放到Chemistry42里,针对这个口袋设计分子,从无到有把这个靶点口袋里去,我们发现了这个055分子,这是针对这个项目合成并测试的分子,属性就是7.8nM,从什么都没有,到我们找到活性nM级别的055,只测试了55个分子,可以看到AI的高效,同时我想说055这个分子就是现在在临床二期的分子。

找到之后我们比较055和已知的小分子,做别的基酶筛选会带上它,我们的分子跟所有的分子相似度都是小于0.3,相似度非常低,生成的分子是非常非常新颖的。有了这个之后我们又做了大量临床前试验,包括药效、药带、安平,评估这个药物的有效性、安全性,所有数据支持把这个分子推动到临床。于是我们在中国和新西兰同步做了临床一期,在人身上的半衰期是7到12小时,意味着可以支持1天1次或2次的给药,病人安全性良好。这是我们做的在中国完成的临床试验,最右边这个,去年销售38亿美金的药物尼拉美谷,灰色是安慰剂组,一年用力肺活量下降206毫升,吃了药以后下降95毫升,意味着它只能延缓肺活量下降,不吃药的病人下降400毫升,也是只能延缓。最近BI另外一个PDE4抑制剂刚在全球做了三期,下降了183,吃了药以后,最高剂量组下降114毫升,这些药物只能延缓病人肺活量下降,而不能改善或者逆转。我们的抑制剂在去年9月份完成的临床二期的试验,这是三个月,不吃药的病人用力肺活量下降62毫升,如果一年乘四就行,下降两百多毫升。吃了药以后,用力肺活量上升了98.4毫升,意味着这个药物有可能为特发行肺纤维化病人提供一个颠覆性的解决方案,可以积善肺功能,而不是简单抑制肺功能下降,我们希望尽快能在国内完成临床2B或者三期试验,在更大病人人群和更长时间里证明它确实可以改善病人的用力肺活量,的确可以为病人提供一个颠覆性的治疗手段,这就是我们新靶点新分子特料特发行肺纤维化的情况。

这个项目是从2019年立项,当时立项过程中,初衷并不是想治疗特发行肺纤维化,是想找到一个能延缓人的衰老的靶点,纤维化是衰老最重要的一个表型,人老了以后都会发生纤维化,人小的时候基本没什么纤维化,当时是要找衰老的靶点。在2020年开始化学试验,2021年,2022年临床一期,2023年临床二期,五年时间完成了从一无所有到临床二期结束的过程,通过AI加持确实可以做的很快。做项目过程中不断发表研究成果,从靶点一直到临床一期发表在2024年3月份Nature上面,临床2A期结果发表在今年6月份的Nature药物方面,化学这部分,跟衰老相关发表在Nature aging上面。这是男老鼠,这是女老鼠,瘦的是敲除了TNIK的小鼠,胖的是没有敲除,意味着TNIK这个靶点有可能不光可以治疗特发行肺纤维化,还可以在减肥和代谢领域有它的应用,我们也在探索这个可能性。这是找到新分子以后不断扩大分子和靶点的适应症,从纤维化,包括特发行肺纤维化,还有肾纤维化,肝纤维化,癌症,神经系统疾病,代谢系统疾病,希望在未来不久可以发表我们在这个领域的研究成果跟大家分享。

时间关系,我不讲第二个案例,这也是很有意思,我们今年会进入临床二期,这是治疗IBD的。

英矽智能成立于2014年,全球有350多位员工,我们是国际化很强的公司,立足中国,放眼全球,算法团队在中东,阿联酋阿布扎比和加拿大蒙特利尔,药物研发团队主要在亚洲,以上海为主,生物团队和临床团队都在纽约。公司成立至今募集了5亿多研发经费,支持算法开发和试验项目的推进,也做了很多合作,比如AI软件平台可以对外授权付费使用。另外,可以跟大公司建立战略合作,这里列举了从2022年开始到2024年几个有代表性的公司,比如2023年开始对外授权,小分子都是几千万美金,总的里程碑5亿到10亿美金,销售分成。管线,通过AI方式做了大量的快速管线,公司鼓励创新,从成立到现在一共发表了两百多篇学术论文,很多都是Nature子刊,Science子刊,去年就发表了54篇。未来AI竞争慢慢从算法竞争过渡到数据竞争,我们建立了自己的智能机器人实验室,帮助产生大量的独有的数据。

扫一扫,加关注