实验八 甾体化合物的三维定量构效关系—比较分子场分析
Experiment 8. 3D-QSAR: Comparative Molecular Field Analysis (CoMFA) of Steroids
8.1目的要求 Purpo
(1)了解定量构效关系的种类及方法。
(2)掌握比较分子场分析(CoMFA)方法的基本原理及计算步骤。
(3)深入理解所得构效关系结果并能根据计算结果设计新化合物。
(4)本实验5学时。
8.2背景介绍 Background Information
8.2.1定量构效关系方法及种类
定量构效关系(quantitative structure-activity relationships, QSAR)分析是指利用理论计算和统计分析工具来研究系列化合物结构(包括二维分子结构、三维分子结构和电子结构)与
其生物效应(如药物的活性、毒性、药效学性质、药物代谢动力学参数等)之间的定量关系,它是药物研究中的一种重要理论计算方法和常用手段。
定量构效关系可分成两类:二维定量构效关系(2D-QSAR)和三维定量构效关系(3D-QSAR)。传统的二维定量构效关系方法很多,有Hansch法[1]、模式识别Free-Wilson法[2]、电子拓扑法[3]等,其中最为著名、应用最为广泛的是Hansch法,它假设同系列化合物某些生物活性的变化是和它们的某些可测量的物理化学性质的变化相联系的。这些可测量的特性,包括疏水性、电性、空间立体性质等,用相应的分子参数来表示,通过定量方式来回归其与活性的相关性。三维定量构效关系则考虑了生物活性分子三维构象性质,在QSAR分析中引入了与生物活性分子三维结构相关的量作为变元(descriptor),与2D-QSAR方法相比,能够更为精确地反映生物活性分子与受体之间的非键相互作用特征,从而更深刻地揭示药物-受体相互作用机理。最典型的三维定量构效关系方法包括分子形状分析(molecular shape analysis, MSA)[4],距离几何法(distance geometry, DG)[5]和比较分子场分析(comparative molecular field analysis, CoMFA)[6],其中CoMFA是目前最成熟且应用最广泛的方法。
本实验主要应用CoMFA方法对21个甾体化合物进行三维定量构效关系研究。
8.2.2甾体激素
甾体激素[7]以极低的浓度(0.1~1.0 nmol / L)存在于体内,与靶细胞内特定受体结合后,引发相应的激素效应。甾体(steroids)母核是由A、B、C、D四个环两两相邻并合而形成的环戊烷并多氢菲结构,含17个骨架碳原子。其中A/B、B/C和C/D分别在C5/C10、C8/C9和C13/C14处并环。天然甾体化合物的C10和C13上可带有甲基,C17上可连接侧链。
8.3实验原理 Experimental Principles
配体分子与受体之间的可逆相互作用主要是通过非共价结合,如范德华相互作用、静电相互作用、氢键相互作用和疏水相互作用而实现的。作用于同一受体相同作用位点的一系列配体分子,它们与受体之间的各种作用力场应该具有一定的相似性。这样,在不了解受体
三维结构的情况下,研究这些配体分子周围的力场分布,并把它们与配体的活性数据定量地联系起来,既可以推测受体活性位点的某些性质,又可以依此建立一个定量模型设计新化合物,并定量地预测化合物的活性,这便是CoMFA的物理基础。
CoMFA计算可以大致分为以下四个步骤(见图8-1):
(1)确定研究体系各个化合物的药效构象,根据合理的重叠规则,把它们重叠在一个包含全部化合物分子的空间网格上。
(2)计算化合物周围各种作用力场的空间分布。根据研究对象及生物活性特征,选择合适的探针原子或基团,计算探针原子或基团在每个空间网格点上与各个药物分子的相互作用能(一般为静电场和立体场,有时也包括疏水场和氢键场)。它们和各化合物的生物活性构成CoMFA的QSAR表。
(3)把步骤(2)计算得到的分子场能数值作为自变量,把分子的活性作为因变量,通过偏最小二乘(PLS)方法结合交叉验证来确定最佳主成分;基于最佳主成分,采用PLS建立化合物活性和分子场特征之间的关系,确定CoMFA方程。
(4)做CoMFA系数图,从系数图上可以清楚地看到哪些地方的力场分布强弱对生物活性产生影响,据此可以设计新化合物。
Figure 8-1. Procedures of comparative molecular field analysis
8.4实验操作 Experimental Procedures
8.4.1 CoMFA计算软件
本实验中CoMFA计算主要采用Tripos公司的SYBYL7.3软件中的QSAR相关模块。
8.4.2分子信息表(Molecular Spreadsheet,MSS)的生成
本实验从文献中搜集了21个具有甾体骨架的化合物组成训练集,它们的活性数据均来源于同一药理模型,其结构及log(1/IC50)值见图8-2:
17ohpregnenlone 6.36 aldosterone 5.32 androstanediol 9.11 androstanedione 7.46
androstenediol 9.18 androsterone 7.15 corticosterone 6.34 cortisol 6.20
cortisone 6.43 dehydepiandrstrone 7.82 deoxycorticosterone 7.38 deoxycortisol 7.20
dihydrotestosterone 9.74 estradiol 8.83 estriol 6.63 estrone 8.18
etiocholanolone 6.15 hydroxyprog 7.00 pregnenolone 7.15 progesterone 6.94 testosterone9.20
Figure 8-2. The structures and log(1/IC50) values of 21 steroids lected in the training t
在进行CoMFA计算之前,需要事先建立保存有训练集化合物三维结构及活性信息的分子信息表(Molecular Spreadsheet,MSS)。建立过程大致可以分为两个步骤,首先建立包含这21个化合物三维结构的数据库文件,将其导入MSS,然后再将活性数据输入或者导入。
建立数据库文件时,打开菜单 File > Databa > New…新建数据库,在弹出的New Databa 窗口中将新数据库命名为jac.mdb。打开菜单Build/Edit > Sketch Molecule,按照图8-2所示结构式,在sybyl 窗口中搭建出分子17ohpregnenlone的三维结构。搭建完毕之后,注意给分子加上氢原子。然后打开Compute菜单,选择Charges > Gasteiger-Huchel,为分子加上电荷。选择Compute菜单中的 Minimize…采用分子力场的方法对小分子进行能量优化。优化时采用默认参数。优化完毕之后,可以看到窗口中的分子键长、键角都发生了变化,构象更加合理。再次打开Build/Edit菜单,选择 Name Molecule…,在弹出的对话框中输入“17ohpregnenlone”作为化合物的名称,点击OK关闭对话框。然后打开菜单File > Databa > Put Molecule…将化合物存入之前新建的jac.mdb数据库。
按照相同方法,将图8-2中的21个化合物分别搭建、命名完毕,并保存入数据库jac.mdb中。(提示:因为这21个化合物的结构相似,在搭建分子结构时,可以在前一个化合物的结构基础上进行修改,以便减少工作量。)
在进行CoMFA计算之前,要将数据库中各个化合物进行叠合。叠合通常可以采取根据训练集化合物结构骨架、分子对接构象或者药效团模型叠合等方式进行。需要注意的是,分子叠合对CoMFA计算结果影响很大,要根据具体情况采取适当的方式进行。本实验中,由于分子的结构骨架均为甾体母核,因此可以采用骨架叠合的方式。Sybyl提供了对数据库中的多个分子进行骨架叠合的工具。打开菜单File > Align Databa… ,在弹出的对话框中将Databa to Align设定为jac.mdb,将Template Molecule设定为该数据库中第三个分子androstanediol(图8-2中第一行第三个分子),将Common Substructure设定为训练集化合物结构骨架中的公共部分:(该子结构需要事先在3D窗口中绘出,其构象与androstanediol相同),其他参数不变,点击Go,开始进行叠合,最后将叠合好的分子保存在新生成的数据库文件jacs.mdb中。
下一步,建立MSS,并将结构式导入。单击进入菜单Tools >> QSAR >> New Spreadshee
t,在弹出的Option对话框中选择Databa作为数据来源,在适当路径中指定jacs.mdb,点击窗口左下角的Open按钮,将其导入新生成的分子信息表。表中的每一行对应一个化合物。
最后一步,是输入各个化合物的活性数据。输入活性数据时可以在MSS表格中添加活性数据列,然后在每个化合物对应的行末尾逐个输入数值。本实验中的活性数据已保存在单独的文件中,可直接将其导入MSS即可。单击进入新生成MSS的菜单File >> Import,在适当路径下找到tbg.tsv文件,点击OK,进入MSS Import窗口,将Import Format设置为Delimited by Tab,将File contains column names和File contains row names in field 1两个选项选中。MSS Import参数设置情况见图8-3。输入的活性数据为各个化合物的log(1 / IC50)值,因此数值越大,表明该化合物的活性越强。
| |
Figure 8-3. The parameters specified in MSS Import dialog | Figure 8-4. The parameters specified in Add New CoMFA Column dialog |
| |
8.4.3添加CoMFA力场
添加CoMFA力场的计算过程大致可以分成两个部分:首先需要扫描全部分子所在空间,从而确定空间网格所在区域;然后用探针分子在网格上移动,计算超过33000次探针与化合物的相互作用能。
单击分子信息表的第二列表头,将整个第二列单元格选中,点击分子信息表左上角Auto Fill按钮,在弹出的Option窗口中选择数据类型为CoMFA,点击OK键,进入Add New CoMFA Column参数设置对话框,采用如图8-4所示默认设置,为分子所在空间添加静电场和立体场,分子所在空间由程序自动识别。点击Add Column按钮,在MSS的第二列添加上CoMFA场能相关数据。该数据数值大小显示了探针与化合物所占空间内部网格相互作用数目。