首页>新闻>易凯资本健康产业团队“AI+”系列报告之1: AI+新药研发

易凯资本健康产业团队“AI+”系列报告之1: AI+新药研发

2021-09-16

2020年以来

国内AI计算驱动的创新药物研发领域

(下称“AI+药物研发”)

热度明显攀升

出现多起大额融资:


晶泰科技

2020年9月 C轮 3.188亿美元

(当时全球领域内最高纪录)

2021年8月 D轮  4亿美元

英矽智能

2021年6月 C轮  2.55亿美元

百图生科

2021年8月 A轮  数亿美元

望石智慧

2021年4月 B及B+轮 1亿美元

齐鲁锐格

2021年2月 B轮  9000万美元

星药科技

2020年12月 A轮 数千万美元

2021年8月 战略融资

......


根据公开信息整理

2021年截至目前

国内已完成31起融资交易

总融资额超过110亿元人民币

已超过2020年全年融资交易数量与融资额


而市场对AI+药物研发领域有诸多好奇

比如:

1. 为什么这一两年AI+药物研发这么火热?

2. AI能从根本上颠覆创新药市场格局吗?

3. AI在创新药研发领域有哪些应用?

4. AI辅助药物研发(AIDD)目前主要应用的算 法有哪些?有何局限性?

5. 将AI技术引入药物研发后能否引发学科革命,使得计算科学能够切实指导药物研发?

6. 对于AI+药物研发公司来说,算法重要还是数据重要?如何理解算法的优势以及判断数据质量?

7. AI+药物研发公司的主要数据来源有哪些?

8. AIDD主流算法模型需要大量数据驱动,而创新药行业内真实数据依然相对匮乏,如何解决这一问题?

9. 目前绝大多数AI+药物研发企业集中在小分子药物研发领域,AI是否也能应用到大分子药物研发领域?

10. 什么样的AI+药物研发公司团队称得上是一个优秀的团队?

11. AI+药物研发公司如何进行商业变现?

12. 2022年AI+药物研发融资趋势如何?



针对大众普遍关注的上述这12个问题

易凯资本给出了我们的答案。


01

为什么这一两年AI+药物研发这么热?

近年来深度学习算法的突破,算力大幅提升,以及生物学技术发展和成本下降带来的生物医药大数据加速积累为AI在生物医药领域的应用提供了客观条件。


海外AI驱动研发的候选药物进入临床,以Schrodinger和Relay为代表的AI/计算驱动制药公司上市,以及多个跨国药企和互联网巨头的涉足成为该领域热度攀升的催化剂。


新冠疫情对行业与资金面的影响不可忽略。疫情驱动市场对生物医药行业有了前所未有的关注,流动性宽松的背景下资金向风险资产倾斜,而AI+药物研发作为市场想象空间巨大的交叉领域,同时受到TMT和医疗这两个大行业资本的追捧。


对国内企业来说,国家对于创新药的扶持是AI+药物研发热的重要驱动因素以2015年药品审评审批制度改革为起点,国家从注册审批、医保支付、资本市场上市规则、人才政策、专利保护等各个角度全面鼓励创新药的发展,me-too、me-worse等“伪创新药”和仿制药的价值空间被极大压缩,对创新的追逐以及降本增效的需求驱使医药企业加速拥抱AI。


根据易凯资本的扫描截至2021年8月底,国内共计有57家AI+药物研发公司。其中最早一批公司成立于2012年-2014年,多数公司成立于2018年后,就AI的应用场景及AI驱动的研发成果而言,目前行业整体还处于起步阶段


02

AI能从根本上颠覆创新药市场格局吗?

就目前的应用效果而言,AI在药物研发领域只是扮演赋能工具的角色,谈AI对市场格局的颠覆还为时尚早。我们预期AI带来的研发质量与效率的提升会成就一批采用创新研发模式的“新生代”biotech,但big pharma多年积累构筑的临床开发与商业化壁垒非一朝一夕可以建成,行业主流格局在短期内难以被撼动。但我们不排除随着数据积累、模型创新与迭代、新的监管与商业模式的出现,AI将来有可能重塑创新药行业格局。


03

AI在创新药研发领域有哪些应用?

AI在靶点发现与验证、分子发现与优化、临床前研究、临床试验设计与患者筛选入组、药物上市后研究等新药研发的各个环节均有大量应用。新药研发的链条很长,不同环节所需要的技术能力与经验背景差异很大,因此多数AI+药物研发公司选择从其中一两个环节切入,且主要集中在靶点发现与验证和分子发现与优化阶段,这是因为生物学机制理解和候选分子性质是决定临床试验成败的最关键因素。


04

AI辅助药物研发(AIDD)目前主要应用的算法有哪些?有何局限性?

目前应用在创新药研发行业的AI技术主要指的基于数据驱动的机器学习(ML)算法,实际上ML乃是AI大范畴下的一个主要任务。而以深度神经网络DNN代表的深度学习技术则是目前最前沿的ML方向,在这次AIDD热潮中发挥了至关重要的作用。AIDD当前主要应用的深度学习算法模型包括卷积神经网络CNN、循环神经网络RNN(LSTM)、生成对抗网络GAN、Transformer、图神经网络GNN及其变种和组合等。除此之外,模型中还经常有许多机器学习中的经典算法来配合使用,如决策树、支持向量机、蒙特卡洛树搜索、MCMC等。


对于深度神经网络相关算法来说,其形成的端到端的系统结构对于输入输出而言类似一个黑盒,因此模型参数的可解释性相对较差也就成为其主要的局限性,如何用现有的生物医药知识有效地指导模型搭建和效果优化也是当前的一个主要研究方向。