编者荐语:
以下文章来源于安永EY:
引言
在2021年9月14日发布的《英国两院院士领衔,中外专家畅谈AI药物发现(上)》一文中,我们就RNA三维结构应用AI的前景、AI最新技术对蛋白质结构研究和小分子药物研发的意义向国内外多位专家提出问题,深度讨论AI药物发现。
本文,我们继续与各位专家对话,从更多维度、更深层次畅谈AI药物发现的深远影响。
对话专家
Q4:短期影响 V.S. 长期影响
“人类总是对新技术的短期影响过分夸大,却对其长期影响估计不足”,这一说法是否会同样适用于AI药物发现?
David Rubinsztein教授
英国皇家科学学会及英国医学科学院两院院士
剑桥大学医学院副院长
剑桥老年类药物研究所所长
曾发现16个疾病靶点/通路
我认为这发生在许多新技术和新发现中,当然也发生在AI辅助药物研发领域中。但AI辅助药物研发领域的确存在巨大机会,有潜力在短期内做出重大成果。事实上,AI驱动的蛋白质结构预测已经为生物学、医学和药物发现领域带来了前所未有的机会。
高奇琦教授
华东政法大学人工智能与大数据指数研究院院长
上海市大数据社会应用研究会副会长
上海市自然辩证法研究会副会长
这一说法同样适用于AI的药物发现,因为在新技术运用的初期,在资本等多方力量的影响下,人们往往会对新技术有过高期待,然而这样一种期待在短暂地达到高峰之后,又会进入一个新的低谷期,正如Gartner曲线所表现出的一样。当经历过一个较长的低谷期,新技术的应用才会缓慢地爬升,这时人们对新技术的认识预期会降低,但同时新技术的影响会变得更加深远。
牛张明先生
德睿智药创始人/CEO
曾任德国某AI医疗上市公司CTO
曾共同领导2020年欧盟“创新药物计划”项目
长期来看AI辅助药物研发有可能会成为制药业的一项工业革命,而现阶段正是这场革命的开始。我个人对AI辅助药物研发持有长期乐观的态度,就像相信自动驾驶(飞机,汽车)终将会实现一样,这是一个循序渐进的技术进化和迭代过程。
Q5:商业化团队 V.S. 学术界团队
在CASP14中,位列第二的Baker实验室的预测准确性取得了显著提升,但与AlphaFold2相比,距离是在被进一步拉大的。Baker实验室与AlphaFold团队之间的对比被外界视为学术界团队与商业化团队之间的对比。从CASP14的结果来看,商业化团队比学术界走地更快。您如何看待这个对比?
牛张明先生
德睿智药创始人/CEO
曾任德国某AI医疗上市公司CTO
曾共同领导2020年欧盟“创新药物计划”项目
在CASP14竞赛上DeepMind团队开发的AlphaFold2确实表现更好,也和其他团队拉开了更大的差距。但不可否认开发AlphaFold2的DeepMind团队也是站在前人的肩膀(过去这些年的学术科研成果,算法,数据积累的基础)上才取得这样的成绩。
许多从0到1的基础探索和科研都是从学术界出来的。而进入横向应用、工程开发、深度拓展、这种从1到10或者100的阶段,研究型企业(比如DeepMind,Boston Dynamics等公司)有时候更加擅长。这个例子也说明了加深工业界与学术界的合作的重要性,产学研一体化是实现技术突破的关键一环。
刘大鹏博士
瑞典国家人工智能研究中心研究员
查尔姆斯大学博士-人工智能方向
加州大学伯克利分校访问学者
商业团队与学术团队并非二元对立。好的成果,通常既需要专业的人才、领域专家和人工智能专家;也需要巨大的资源投入,人力、物力、时间、组织方式等等。在人工智能应用领域,既需要领域内专家的专业知识,也需要了解人工智能现状的人能够用恰当的方式解决问题。
通常,学术界与工业界的资源、组织方式、解决问题的目的和手段,存在不同。但对于成果的作出,所需要的配方,可以说非常相似。因此,工业界与学术界更多的合作、取长补短是更好的方式。伯克利人工智能研究院、伯克利深度驾驶研究中心,通过学者提出研究问题、工业界评选的方式连结了学术界与工业界,让两者相得益彰。
瑞典人工智能创新中心也是以加速学术界与产业界的联合、成果转化为目的而成立的机构。相信未来会有更多的成果来自于学术与商业团队的联合。
Q6: 学术界贡献几何?
AlphaFold2的成功无疑为蛋白结构预测起到了非常好的科普宣传作用,但似乎也让AlphaFold2抢尽了风头。相信它的成功离不开此前学术界几十年来科研成果的不断积累,比如对“端到端模型”的实践。能否为我们介绍一下AlphaFold2取得这一成绩所依赖的学术界的理论基础?我国科学家在这方面理论和技术积累上都做出了哪些贡献?
刘大鹏博士
瑞典国家人工智能研究中心研究员
查尔姆斯大学博士-人工智能方向
加州大学伯克利分校访问学者
AlphaFold2的成功建立在其新颖的神经网络结构与训练方法之上。在神经网络方面,AlphaFold2创新性地推出了进化自注意网络(Evoformer)这一结构,作为搭建主干网络的结构基础。Evoformer, 从名字上来自于进化(evolution)与自注意网络(transformer/self-attention network)。
自注意网络最初被提出时是用来解决自然语言处理问题的。后因其强大的能力被迅速而广泛地应用到了人工智能的各个领域,成为新的主流神经网络之一。相比较于卷积神经网络受限于局部的处理能力,自注意网络提供了全局学习的可能,因此拥有更大的自由度来处理问题。与此同时,进化自注意网络将问题描述为图推断问题。图神经网络也是近年来兴起的人工智能方法,在很多领域取得了目前为止最优秀的成绩。自注意网络作为图神经网络的一种,被广泛研究和应用。
在训练方法上,AlphaFold2 的创新之一是迭代进化(iteratively refinement)。将神经网络的输出结果,以递归的方式重新输入给网络自身。结合最终的损失函数,做到在不大量增加训练时间的情况下提高神经网络的表现。
在人工智能领域,中国的科学家和研究机构正在作出巨大的贡献。以今年的ICLR会议为例,华人作者参与的论文数占到论文总数的一半,华人一作的论文数量接近三分之一。不仅是数量,从论文的影响力角度来看,华人学者也不断发表有份量的论文。如在AlphaFold2网络结构中大量使用的残差结构,便来自于何恺明的论文《图像识别中的深度残差网络》。大批的青年科学家如何恺明、陶大程、沈春华、田渊栋等,正在各自的领域作出杰出贡献。相信未来会有更多数量和份量的成果来自于中国的科学家和科研机构。
Q7:AI如何赋能生物医药?
据您所知,生物学家、医药学专家在多大程度上重视AI对其研究方面的帮助?生物医药学应该如何指导和赋能AI下一步在该领域的发展?或者换句话说,医药领域何种类型的反馈对AI科学家来说是极为富有价值的?
David Rubinsztein教授
英国皇家科学学会及英国医学科学院两院院士
剑桥大学医学院副院长
剑桥老年类药物研究所所长
曾发现16个疾病靶点/通路
我个人认为AI有对生物和医学研究产生变革性影响的潜力。我认为AI现在还能与生物医药领域有更加深入的结合,我们都需要学习如何发现这样的机会。目前存在的问题是,一些AI研发中心,在计算机科学家与实验或临床科学家之间的合作并不是那么的紧密。同样,科学问题的提出最好由实验科学家和临床医生来完成,而不是计算机专家。因此,我们需要在实验和临床的大框架内,更好地整合计算工作,并更多地使用实验来验证模型预测结果。
牛张明先生
德睿智药创始人/CEO
曾任德国某AI医疗上市公司CTO
曾共同领导2020年欧盟“创新药物计划”项目
从我们接触到的生物和医学相关的合作方反馈上来看,大部分医药领域的专家对AI的重视程度是与日俱增的。生物医药的先验知识对AI算法设计和算法验证有着很强大的指导作用,AI可以成为生物学家和医学家手中的一项强有力的辅助工具。医药领域专家对需求定义和结果反馈对AI科学家是最有价值的。
Q8:行业游戏新规则
在AlphaFold公开源代码后,行业原有的游戏规则被颠覆。您觉得不同的行业参与者怎样应对和布局才能在新的游戏规则下有所作为,不同参与者该如何赢得先机?
牛张明先生
德睿智药创始人/CEO
曾任德国某AI医疗上市公司CTO
曾共同领导2020年欧盟“创新药物计划”项目
AlphaFold2在结构生物学的成功证明了AI在药物研发的巨大潜力,它可以大幅提升人类对蛋白质结构和人类蛋白质组的理解和预测的准确性。对整个药物研发产业和医学界来说都巨大的利好。让许多之前未知结构的蛋白质有了可以被开发成具有成药性的靶点蛋白的潜力。让生物制药行业有了更多可以攻克疾病的靶点选择和开发。
有准备,具有快速学习和进化能力,愿意积极拥抱变化的公司将会拥有更多商业化的先机。
陈奕婷女士
生命健康领域资深投资人
AlphaFold做的工作对生物技术公司来说是重大的利好。人体有2万个已知的编码蛋白质的基因,理论上可以有2万个靶点。目前有药物靶向的只有600个,新药探索的空间很大。其中很重要的一环就是蛋白质结构解析。传统的X射线或冷冻电镜耗时耗力,AlphaFold公开了人体98%的蛋白质结构后为制药企业铺设了高速公路,可以使他们尽情地在上面奔驰。生物技术公司应该在这么好的基础科研成果上加大对于新靶点药物的研发,把握这个历史机遇。
Q9:资本的新宠儿?
在AlphaFold2之前,AI驱动的药物研发赛道在中国已经开始受到资本青睐,多家药企和科技巨头入场布局。在AlphaFold2源代码公布后,您预计资本的关注点是否会发生变更,或更加聚焦于某一细分领域或开发环节?不同背景的资本在关注点上会有哪些不同?
陈奕婷女士
生命健康领域资深投资人
资本对于AI新药研发的兴趣主要看中的是AI对于药物研发成功率、效率和创新性这三个维度上的提升。AI药物发现是个笼统的概念,里面有很多细分的领域,比如利用AI做新靶点发现,用AI去做化合物的虚拟合成和筛选,还有用AI做临床试验结果的预测。这些细分赛道资本都有兴趣,只要它能给药物发现带来价值。
Q10: AI药物带给人类社会的挑战?
在AI药物研发领域,您会怎样去定义人与AI的关系?它跟其他领域人与AI的关系有什么不同之处?从社会角度看,随着AI与大数据参与药物研发的程度越来越深,从社会学角度你预见我们将面临什么样的挑战?
高奇琦教授
华东政法大学人工智能与大数据指数研究院院长
上海市大数据社会应用研究会副会长
上海市自然辩证法研究会副会长
在AI药物研发领域,人和AI的关系主要有两种,一种是研发者与AI的关系,另一种则是患者与AI的关系。从AlphaFold 让AI算法预测蛋白质结构这样的大突破来看,未来人工智能在研究中的作用会进一步凸显,这有可能会改变AI原来作为一种辅助者的角色。这样一种变化的长期发展,可能会使得人类在药物研发中的主体性进一步丧失。这实则隐藏着新的危险,因为药物会最终作用到人身上。药物使用的目的是为了解决个体的生理或者心理上的某种非常态状况。完全由人工智能来主导这样的药物研发是否会导致药物使用的失控或者隐含着新的未发现的风险?
从整个社会角度来看,人工智能用于药物研发,从中长期来看有可能会加剧社会的不公平。将来是否可能会出现一些超级药物,或者是某些富裕的群体可以利用特殊药物或基因编辑之后产生超级人类?这样是否会在富裕阶层和贫困阶层之间、从基因或者自然状态上就会导致一种根本性的不平等。
因此,人工智能用于药物,一方面可能会进一步提高医疗水平,但从另一个角度讲,新技术的运用也有可能会加剧社会的不平等。富裕阶层有可能会运用这类超级技术进一步强化基因。
Appendix:David Rubinsztein教授英文问答原文
Question 4:
“We overestimate the impact of technology in the short-term and underestimate the effect in the long run.” Do you think this statement would apply to AI driven drug discovery?
Answer:
I think this happens with many new technologies and discoveries and I think this is happening with AI-based drug discovery. However, the potential is huge and has the potential to make important contributions in the short-term. Indeed, as you alluded to earlier, the dramatic recent advances in AI-driven protein structure prediction provide unprecedented opportunities and will make this is an exciting time for biology, medicine and drug discovery.
Question 7:
As far as you know, in what extent biologists and medical experts appreciate the assistance of AI in their research? How could biomedical science direct and enable the next phases of AI development? In other words, what types of feedback from the medical science community would be valuable to AI scientists in the coming years?
Answer:
I personally think that AI/machine learning can have transformative impacts on biological and medical research. I suspect it is underutilized at the moment and we all need to learn how to spot the opportunities. A risk is that AI-based centres are established where the links between the computational people and laboratory or clinical scientists are not as strong as they could be. Similarly, the initiatives and questions that need to be solved are often best identified by the experimental scientists and clinicians and not the computational experts. Thus, we need to seek to integrate the computational work much better within the experimental and clinical frameworks and in many cases designs