机器学习 | 抗2019-nCoV药物的机器智能设计

美国密歇根州立大学的研究人员发现2019-nCoV和SARS-CoV的蛋白酶抑制剂结合位点几乎相同,这意味着所有潜在的抗SARS-CoV化学疗法也是潜在的2019-nCoV药物。研究人员报告了一类由机器智能生成网络复合体(GNC)产生的潜在2019-nCoV药物家族。还分析了一些现有的HIV药物治疗2019-nCoV的潜在有效性。

本文将对“Machine intelligence design of 2019-nCoV drugs"文中使用的机器学习方法和结论进行介绍。

新型冠状病毒肺炎(Corona Virus Disease
2019,COVID-19),简称“新冠肺炎”,是指2019新型冠状病毒感染导致的肺炎。2019年12月以来,湖北省武汉市部分医院陆续发现了多例有华南海鲜市场暴露史的不明原因肺炎病例,现已证实为2019新型冠状病毒感染引起的急性呼吸道传染病。


目前,尚无针对这种流行病的特效药。然而,众所周知,冠状病毒的病毒蛋白酶对其复制必不可少,因此是有效的药物靶标。幸运的是,2019-nCoV蛋白酶和严重急性呼吸系统综合症病毒(SARS-CoV)的序列同一性高达96.1%。

生成网络

新的抗2019-nCoV候选药物是通过使用最近开发的生成网络复合体(GNC)设计的。该平台如图1所示,组件包括编码器、潜在空间,分子发生器和解码器。生成网络将采用给定的SMILES字符串作为输入以SMILES串的形式产生新的分子,这些分子将被输入到GNC,一个基于二维(2D)指纹的深层神经网络(2FP-DNN),重新评估他们的可用性。下一个组件是用于预测三维(3D)的数学模型由2DFP-DNN选择的化合物的结构信息。这些化合物的生物活性进一步由基于结构的深度学习模型MathDL估计,GNC的最后一个组成部分用来选择有希望的候选药物的指标。

机器学习 | 抗2019-nCoV药物的机器智能设计
图1 生成网络复合体的示意图。SMILES字符串通过一个基于门控递归神经网络(GRU)的编码器。这些载体在分子发生器中被修饰,以获得所需的药物属性,如结合亲和力、分配系数(LogP)、相似性等。通过预先训练的深度神经网络(DNNs)进行预测。这产生的药物样分子被GRU解码器翻译成SSs。这些物理特性由2D验证基于指纹的多任务DNNs。有希望的候选药物被输入到数学物理单元以生成3D结构,3D结构进一步通过数学深度学习(MathDL)中心的验证来选择新药候选。

数据集

ChEMBL,是一个开放的数据库,将化学、生物活性和基因组数据结合在一起翻译基因组将信息转化为有效的新药。考虑到2019-nCoV病毒蛋白酶与SARS-CoV病毒蛋白酶的序列高同一性,研究者以SARS-CoV病毒蛋白酶为目标可以找到ChEMBL中的输入目标和该目标的总共115个ChEMBL标识。因此,2019-nCoV训练集由115种非典型肺炎冠状病毒蛋白酶抑制剂组成。

机器学习 | 抗2019-nCoV药物的机器智能设计
图2 从chembl下载分子结构及活性信息

PDBbind数据库是每年更新的实验测量的结合亲和力数据(Kd,Ki和IC50),用于存放在蛋白质数据库(PDB)中的蛋白质-配体复合物。PDBbind包含高质量的蛋白质-配体复合物的X射线晶体结构和相关的结合亲和力。通过结合数据、晶体结构以及复合物的性质进行过滤来选择集合。研究者使用PDBbind 2018中4463种复合物的集合作为主要的结合亲和力训练集。

结论

研究者的GNC模型预测了超过8000种潜在的抗2019-nCoV药物,通过潜在空间结合预测器和2D指纹预测器进行评估。有希望的药物进一步通过两个3D深度学习模型进行评估,包括冠状病毒蛋白酶(3DALL)数据集,以及使用冠状病毒蛋白酶数据集作为独立任务(3DMT)。

此外,研究者还选择了15个潜在的抗2019-nCov药物去分析分配系数(logP)、溶解度(logS)和合成可及性评分(SAscore)根据由3DALL模型计算的绑定相似性排序来确定。最终结果表明生成的15种抗2019-nCoV候选药物对抑制2019-nCoV有潜在的效果。

最后,研究者分析了部分抗艾滋病药物治疗2019-nCoV的效果。艾滋病毒药物卡莱特拉(或阿路维亚)和诺维在治疗2019-nCoV时可能确实有一定的效果

目前论文可以在biorxiv预览下载。
Machine intelligence design of 2019-nCoV drugs
Kaifu Gao, Duc Duy Nguyen, Rui Wang, Guo-Wei Wei doi:
https://doi.org/10.1101/2020.01.30.927889

文章链接,欢迎关注 机器学习 | 抗2019-nCoV药物的机器智能设计