AI提升药物及疫苗研发效率,王军/陈义华团队通过AI加速新型抗生素发现

Nature子刊:王军/陈义华团队通过AI加速新型抗生素发现
 
抗生素是全球健康的重要组成部分,它通过杀死或抑制细菌生长,帮助人类治疗肺炎、葡萄球菌和肺结核等感染性疾病,使人类的预期寿命从上个世纪开始延长了至少20年。然而,这个曾经的功臣目前已成为人类面临的十大公共卫生威胁之一。
 
全世界每年有127万人死于耐药性细菌感染。如果没有新的抗菌素疗法,严重感染造成的发病率和死亡率将增加,预计到2050年,因无法治疗的感染造成的死亡人数将达到每年1000万人。我们该如何应对这种威胁?
 
早在2017年,世界卫生组织(WHO)就指出,目前正在研发的抗生素远不足以应对多重耐药性造成的感染与并发症,且耐药性增强的速度远超抗生素的研发速度。
 
抗菌肽(AMP)是一种长度通常为8-50个氨基酸的小蛋白质,可以提供对病原体的保护作用。由于抗菌肽不太可能引起耐药性,因此是传统抗生素的替代品。然而,这些分子中只有少数进入了临床试验,其中几十个正在进行临床前试验。
 
目前,使用微生物组数据的高通量方法扩大了对有前景抗菌肽的搜索,可能为对抗抗生素耐药性的病原体提供了新的候选药物来源。
 
近日,中国科学院微生物研究所王军研究员团队和陈义华研究员团队合作,在 Nature Biotechology 期刊发表了题为:Identification of antimicrobial peptides from the human gut microbiome using deep learning 的研究论文。
 
该研究利用深度学习(Deep Learning)方法,从一万多个人类肠道微生物中“海淘”出三个具有显著活性和安全性的抗菌肽“潜力股”。这种新方法有助于将依靠艰苦的试错实验研究迈向新的通过机器学习快速发现分子的时代。
 
Nature子刊:王军/陈义华团队通过AI加速新型抗生素发现
Nature子刊:王军/陈义华团队通过AI加速新型抗生素发现
 
有研究正在使用深度学习来发现新的抗生素,包括使用预测模型和生成模型。生成模型已被用于设计在动物中具有疗效并显示出低毒性的新型抗菌肽。深度学习和其他算法已经成功地重利用以前未被识别的具有抗生素活性的分子,并在人体中发现具有抗菌特性的隐性肽。令人兴奋的是,比较基因组学管道已经被开发出来,可以探索人类微生物组以发现生物活性肽和微生物蛋白。
 
王军陈义华团队通过对大规模宏基因组数据进行搜索,识别出与已知抗菌肽相似的序列,作为设计用于抗菌肽识别的管道。他们结合了几个基于深度学习的自然语言处理模型(如循环和注意力神经网络),并对其性能进行优化。为了训练数据,该团队还使用了大量来自蛋白质序列数据库 UniProt 的非抗菌肽数据集,以增加用于模型训练的数据集,同时最小化假阴性的可能性。
 
研究人员总共检索出4409个代表性基因组,并从长度为6至50个氨基酸的表达蛋白中筛选出了2349个候选抗菌肽。接下来,该团队研究了基因表达数据、相对丰度和与选定细菌的关联,以从列表中删除不太可能的抗菌肽。这一步鉴定出241条抗菌肽序列。一旦确定了这些候选肽,研究人员就用化学方法合成这些肽,并在体外评估了它们的抗菌活性。
 
在241个多肽中,研究人员合成了216个,其中181个具有抗菌活性,命中率为83.8%,优于先前的工作。
 
这些算法的一个潜在限制是它们倾向于偏差。例如,UniProt 中存在的大量肽序列以甲硫氨酸开始,由起始密码子 AUG 指定,但与生物活性无关。这可能会使训练产生偏差,因为深度学习方法将在考虑甲硫氨酸的情况下构建具有明显(和高估)高精度的预测器。额外的偏差可能会进一步限制旨在药物发现的机器学习工作。然而,王军和陈义华团队合成并实验验证了肽的抗菌活性,表明尽管存在潜在的偏差,但他们的深度学习模型仍然能够有效地发现抗菌肽。未来的工作应着重于生成强大的训练集和最佳模型,并对所有(或大多数)在计算机预测和生成的序列进行实验验证。
 
研究团队选择了对耐药性细菌(包括ESKAPE病原体)具有最强抗菌活性的11个抗菌肽进行了深入的特征分析。在这11个序列中,有7个来自人类肠道微生物组中的一个优势属,这表明该菌群可能是抗菌肽的一个来源。肽c_AMP1043显示出最强的抗菌活性,对所有测试的临床分离物的最小抑制浓度<10μM,并被证明是后续研究中最有前景的主要候选药物。
 
对这11种肽的作用机制研究表明,该研究开发的管道可能可以捕获具有不同作用机制的抗菌肽。这些结果表明,该研究所使用的计算方法可能会揭示出数据集中有趣的隐藏特性。
 
开发新药时的一个关键要求是目标细菌菌种不对药物产生耐药性。为了评估细菌对c_AMP1043耐药性的潜在发展,研究人员将大肠杆菌菌株DH5α连续暴露于该抗菌肽肽30天后,没有检测到明显的抗性。
 
更重要的是,该团队提供了体内数据以确定其策略的治疗潜力。简而言之,该研究展示了三个具有显著活性和安全性的肽,并验证了它们在小鼠模型中对肺炎克雷伯氏菌肺部感染的抗感染效力,以及治疗后可以在体内减少细菌载量10倍以上。
总的来说,研究团队提出了一种基于自然语言处理和深度学习的人工智能方法,以探索复杂的宏基因组信息作为新型抗菌肽的来源。该平台可能会改变抗菌肽的研究,从而有可能在创纪录的短时间内发现更多种类的潜在抗生素。
 
这项研究有望大大加快发现新型抗生素的进度。正如这项研究所表明的,人工智能方法为发现急需的抗生素带来了希望,这将有助于补充我们已经枯竭的“弹药库”。

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注