新闻

德睿智药团队接受四大会计所「安永」访谈 | 中外专家畅谈AI药物发现(上)

2021-09-15

编者荐语:

德睿智药受邀安永采访

 

以下文章来源于安永EY:

2021年7月,AlphaFold 让 AI 算法预测蛋白质结构迎来了里程碑式的进展。2021年8月27日,斯坦福大学团队在 Science 发表了《Geometric deep learning of RNA structure》,让AI 算法预测 RNA三维结构的进展走入我们的视野。安永研究院第一时间对业界这一令人振奋人心的标志性事件进行了解析。自《安永看生物医药|从AlphaFold谈AI药物发现》发布以来,我们收到了来自各方的评论、意见及建议。应广大读者的要求,我们联系了国内外多位专家,深度讨论AI药物发现。

 

专家介绍

David Rubinsztein教授

英国皇家科学学会及英国医学科学院两院院士

剑桥大学医学院副院长

剑桥老年类药物研究所所长

曾发现16个疾病靶点/通路

陈奕婷女士

生命健康领域资深投资人

图片

高奇琦教授

华东政法大学人工智能与大数据指数研究院院长、教授

上海市大数据社会应用研究会副会长

上海市自然辩证法研究会副会长

图片

刘大鹏博士

瑞典国家人工智能研究中心研究员

查尔姆斯大学博士-人工智能方向

加州大学伯克利分校访问学者

牛张明先生

德睿智药创始人/CEO

曾任德国某AI医疗上市公司CTO

曾共同领导2020年欧盟“创新药物计划”项目

 

对话专家

Q1:解决所有问题V.S.尚未解决的问题

很多媒体报道称AlphaFold2一举解决了蛋白质结构预测领域的所有重要问题。Mohammed AlQuraishi也有类似评价:“I think it’s fair to say this will be very disruptive to the protein-structure-prediction field. I suspect many will leave the field as the core problem has arguably been solved.”但我们看到仍有一些问题尚未有明确的答案,如全自动蛋白质结构预测、蛋白质在不同环境下的构象变化、蛋白修饰、多链蛋白质的结构预测等,这些遗留问题的解决只是时间问题,还是需要完全不同的思路去解决?

图片

David Rubinsztein教授

英国皇家科学学会及英国医学科学院两院院士

剑桥大学医学院副院长

剑桥老年类药物研究所所长

曾发现16个疾病靶点/通路

首先要说明的是,我的主要研究领域并非结构生物学。但是通过阅读文献,我了解到像AlphaFold2这种基于人工智能的技术进步将很有可能带来巨大福祉。当然,人工智能技术在一些重要问题上还没有真正找到解决办法,比如对蛋白质折叠过程的理解。我对结构生物学或人工智能的了解不足以让我确切地判断这些重要问题能否通过AI目前所提供的方案得到解决。有些问题看上去似乎更难以解决,因为和可以测量的蛋白质结构相比,解决这些问题所需要的训练数据更难获得。

 

图片

刘大鹏博士

瑞典国家人工智能研究中心研究员

查尔姆斯大学博士-人工智能方向

加州大学伯克利分校访问学者

AlphaFold2 在蛋白质结构预测领域取得了巨大的成功与突破性的进展,是2020年来人工智能及应用最值得注意的成果之一。其成功在于引入了新颖的神经网络结构,以及基于进化、物理、几何等限制条件的训练方法。另一方面,新的神经网络结构和训练方法之所以如此成功,也因为其建立在对蛋白质结构这一问题恰当的表达形式。给定数据和问题,通常可以有很多种方式来描述问题。问题的表达方式,决定了是否可以用合适的人工智能方法来解决。

具体来讲,对于目前尚未解决的问题,如多链蛋白质结构预测,能否沿用此前的问题描述与数据表征方式,决定了是否可以直接参考AlphaFold2的解决思路来决定下一步的研究方向。结构生物学并非我的研究领域,因此很难给出专业判断。不过,“新问题是否要求新的数据?”本身就是一个看待这些尚待解决的问题非常好的角度,也很有可能成为解决这些问题的基础之一。或者换一种说法,尽管相似的问题可以用AlphaFold2作为基础,但如果缺乏相应的数据或信息作为支持,同样难以短时间内解决目前仍面临的问题。 

长远来看,AlphaFold2的巨大成功会让专业团队认识到人工智能算法的潜在可能,促使他们将AI纳入到解决问题的工具库中。这一点无疑意义重大。参照人工智能在其他应用领域的成功,我相信具备专业领域知识的专家与人工智能专家的结合,将会促进该领域的蓬勃发展。人工智能作为新的研究工具和方法,打破原有的研究范式,带来理论与技术的创新,指日可待。

 

图片

牛张明先生

德睿智药创始人/CEO

曾任德国某AI医疗上市公司CTO

曾共同领导2020年欧盟“创新药物计划”项目

不可否认AlphaFold2是AI在结构生物学上的一项重大突破,但是说它解决蛋白质结构预测领域所有重要问题并不准确。比如AlphaFold2没有解决蛋白质四级结构预测的难题。

我会比较乐观地认为这些遗留问题的解决只是时间问题,需要结合计算化学、药物化学、量子力学、AI、结构生物学等多学科一起解决。

 

 Q2:蛋白质结构 V.S. RNA三维结构

当下mRNA技术炙手可热,在疫苗领域尤为受宠。AI算法预测RNA三维结构的出现,以及新的RNA递送平台的发现(如张峰教授团队发现的SEND),是否预示着RNA技术的研发和应用进入了加速道?RNA由4种核苷酸排列组成,而蛋白质由20种氨基酸排列组合而成。都有AI算法加持的情况下,RNA靶点发现是否会比蛋白质的准确性更高?如此一来,未来的制药格局会发生怎样的变化?

图片

David Rubinsztein教授

英国皇家科学学会及英国医学科学院两院院士

剑桥大学医学院副院长

英国剑桥老年类药物研究所所长

曾发现16个疾病靶点/通路

我不能断言相较于蛋白质的20种氨基酸,RNA由4类碱基排列构成这一事实是否会让RNA三维结构的预测更加简单。还有其他一些结构形成中的决定因素需要考虑,比如在RNA多个碱基间如何相互作用。

我相信AI的能力在某种意义上取决于训练数据的数量和质量。尽管如此,我认为AI在RNA结构预测上也会取得像蛋白质结构预测上所取得的成绩。这对药物发现过程很重要,因为它可以为设计直接作用于mRNA水平的小分子提供靶点信息。虽然目前在靶向RNA的药物开发方面已经有了一些成果,但与靶向蛋白质药物相比,RNA领域仍然有很多需要探索的空间。综上,我认为问题中的这一说法是对的——AI对RNA三维结构的预测能力将为mRNA 水平上的新药研发铺平道路

 

图片

牛张明先生

德睿智药创始人/CEO

曾任德国某AI医疗上市公司CTO

曾共同领导2020年欧盟“创新药物计划”项目

靶向RNA技术的研发和应用进入了加速道并且被广泛看好,会在未来许多年内保持高速发展。人工智能等技术的不断进步以及数据量的积累也会助力于RNA药物的研发。未来小核酸药物有望成为继小分子化药和抗体药物后的第三大类型药物。

 

Q3:小分子门槛降低?

有种声音说AlphaFold降低了小分子医药研发的门槛,您怎么看?产业链上是否会出现一些新的节点值得关注和投资?哪些潜在进入者对投资者来说是有吸引力的?

图片

陈奕婷女士

生命健康领域资深投资人

我不认为AlphaFold降低了小分子研发的门槛。AlphaFold仅仅完成了最初始的蛋白质结构解析。实际上,从蛋白质结构到做药,中间还涉及到好几个关键节点,比如蛋白质和疾病之间关系的探索和验证、化合物结构的设计等。这些环节AlphaFold并没有涉及

现在,正有其他的AI公司在这些关键节点上进行潜心的研究和开发。AI和科学家之间不是竞争关系,更多的是AI为科学家赋能。新药研发是个非常复杂的过程,其中有很多经验和判断没有办法用AI替代。我会建议新药研发企业对AI持开放的态度,并考虑在某些研发环节加入AI赋能。我们看到全球的大药企已经在3年前就大举拥抱AI了。过去3年一共有100多次大药企和AI公司的合作,由此可见一斑。

 

未完待续......

 

Appendix:David Rubinsztein教授英文问答原文

Question1:

It had been widely reported by the media that the AlphaFold2 has resolved all of the major issues in the protein-structure-prediction field, which echoes Mohammed AlQuraishi that “I think it’s fair to say this will be very disruptive to the protein-structure-prediction field. I suspect many will leave the field as the core problem has arguably been solved.” But as we understand there are still a fair number of questions remain unanswered, such as the fully automatic protein structure prediction, the conformational changes of proteins in different environments, protein modifications and the structure prediction of polychain protein. Is the resolution of these remaining questions a matter of time for AI, or these questions require fundamentally different approach to be fully untangled?

Answer:

At the outset, please understand that I am not a structural biologist. However, my reading of the literature suggests that the new AI-based strategies like AlphaFold2 represent major advances with huge potential benefits. However, there are important problems that have not really been addressed by such programmes, including understanding the protein folding process. I am not expert enough in either the structural biology or the AI to know whether such problems will yield to AI in the same way. But some are arguably more difficult as the “training data sets” are not accessible in the same way as they have been for structures.

 

Question 2:

mRNA is hot at present and is particularly popular for vaccines development. The emergence of AI prediction of RNA three-dimensional structures, and the discovery of new RNA delivery platforms, such as SEND discovered by Professor Zhang Feng's team, predict the acceleration of RNA technology development and application? RNA consists of four nucleotide arrangements, and proteins are made up of 20 amino acid arrangements. With AI algorithms, will targets

be found more accurately using RNA than proteins? In such case, how will the pharmaceutical landscape changes in the future?

Answer:

I am not sure that the 4 bases in RNA versus 20 amino acids makes RNA 3D structure prediction easier. There are other constraints like how the structures are formed – in the case of RNA by multiple base-base interactions. I also think that the power of the AI is in some senses determined by the “training data sets” available. Nevertheless, I suspect that there will be similar progress driven by AI in the RNA structure area. This will be important for drug discovery as it may inform the design of small molecules that act directly at the level of mRNAs. While there has been some work in this area, it is still rare compared to drugs targeting proteins. So I think you are correct – this may pave the way forward to opening new exciting drug discovery possibilities at the mRNA level.