【深度学习】DEVELOP-基于3D药效团的全新分子设计
深度生成模型(Deep generative models)在全新药物设计领域展现了良好的表现,但是大多是模型不能直接利用三维信息指导分子的设计。药效团(Phamacophore)是一种三维分子结构的抽象化表示,可以用来描述配体分子中对结合有重要贡献的特征,在药物设计中有着广泛的应用。为了充分利用这一类信息,来自牛津大学的Imrie等人提出了分子生成模型DEVELOP,能够利用药效团信息实现苗头化合物或先导化合物的优化。该工作被发表在Chemical Science上,题为“Deep generative design with 3D pharmacophoric constraints”。
——方法——
DEVELOP模型构架(图1)由两个部分组成:(1)基于3D-CNN的药效团编码器;(日语怎么说2)基于图的分子生成模型。DEVELOP使用3D格点对输入的药效团信息进行表征,每个药效团被视为三维空间中的一个高斯函数,其使用的药效团类型包括(1繁文缛节的拼音)氢键受体/给体(2)芳香基团。在构建训练集时,作者利用RDKit从每个分子中提取药效团信息(训练集分子来源于ZINC数据库)。在训练时,作者将上述药效团信息作为输入,以分子结构作为输出,要求DEVELOP能够根据药效团信息推断出与之吻合的分子结构。
图1:DEVELOP的网络构架。
DEVELOP模型中的图生成模块来源于Imrie等人在以往工作中提出的模型DeLinker[1],其使用的网络构架来源于Liu等人提出的CGVAE[2]。该网络首先生成所有相关原子,再通过逐步添加化学键的方法生成完整的分子图(图2)。
图2:CGVAE生成分子的过程。该模型首先初始化所有节点(原子),再通过一次添加一条边(化学键)的方法构建分子图。
在给定药效团的情况下,DEVELOP可以实现两类分子设计任务:(1)片段间的连接链设计(Linker design,图1a);(2肉段怎么做)基于骨架的侧链设计(Scaffolde laboration,图1b)。在训练时,作者通过拆分训练集分子的非环单键的方式来构建输入和输出。例如,对于连接链设计任务,作者会对分子进行两次拆分,两端的片段作为模型输入,中间的连接片段作为输出。作者还将片段(anchor原子)之间的距离以及夹角作为额外的模型输入。
——模拟评价——
作者首先考察了DEVELOP是否能够利用药效团信息有效指导分子设计。作者使用PDBBind general t作为测试集,比较了DEVELOP(提供药效团信息)以及DeLinker(不提供药效团信息)两种方法生成分子的结构。发现DEVELOP生成的分子能够更好的覆盖输入药效团的信息,并且能够更好地复现测试集中的分子,说明其能够充分利用输入的药效团信息指导分子设计(表1)。
表1:DEVELOP能够利用输入的药效团信息指导分子的设计。相比DeLinker,DEVELOP生成的结果中有更多的分子能够符合输入的药效团模型。注:DeLinker-Count指将每种药效团的数目(不包括3D信息)作为额外输入提供给DeLinker。
为了定量化评价生成分子的药效团匹配度,作者计算了模型生成的分子与用于提供药效团
的测试集分子之间的形状以及药效团相似性(SC_RDKit,见表2、表3),发现DEVELOP在这些指标上的表现显著优于DeLinker,再次说明其能够充分利用输出的药效团信息指导分子生成。
金角银边草肚皮表2:DEVELOP,DeLinker以及SyntaLinker在Linker设计任务上的表现。
微笑近义词
表3:DEVELOP,DeLinker以及SyntaLinker在基于骨架的取代基设计(Scaffold elaboration)任务上的表现。
作者还在将DEVELOP与SyntaLinker[3]进行了比较,发现DEVELOP在许多指标的表现上都优于SyntaLinker,如表姓马的名字2、表3所示。
——案例分析——
图3:将DEVELOP用于PPI(蛋白-蛋白相互作用)抑制剂的优化。(a)抑制剂的初始结构(PDB ID 4x5z);(b)人为设计的高活性抑制剂(PDB ID:左侧5DB2,右侧5DB3);(c)DEVELOP优化的结果。
最后,作者以menin-MLL融合蛋白相互作用抑制剂的设计为例,分析了DEVELOP在具体问题上的表现。MLL(mixed lineage leukemia)融合蛋白与menin的相互作用在许多急性白血病中有着重要的作用,我们可以通过设计与mernin蛋白结合的小分子来阻断两者之间的相互作用。作者分析了已知高活性分子的药效团信息(图3b卖火柴的小女孩的作者),并将其作为输入尝试对较低活性的分子进行R基团优化。作者发现DEVELOP生成的分子能够很好地吻合输入的药效团信息。在对接打分上,DEVELOP也显著优于DeLinker。图4展示了DeLinker生成的分子(橙色和绿色)与DEVELOP生成的分子smina企业职工奖惩条例对接打分(越低越好)的分布,可以看出DEVELOP生成的分子更倾向于分布在smina打分数值较低的位置。