分析Amber轨迹(一)


1. 用途

分析Amber分子动力学轨迹,内容包括:RMSD、RMSF、B因子、氢键、回转半径、RDF以及距离、角度、二面角等几何指标的测量。

2. 预备知识

2.1 均方根偏差(Root Mean Square Deviation,RMSD)

分子模拟中采用RMSD来衡量构象差异程度或轨迹稳定程度。RMSD的定义如下:

RMSD=i=0N[mi(XiYi)2]MRMSD = \sqrt{\frac{\sum_{i=0}^N{[m_i\cdot(X_i - Y_i)^2]}}{M}}

其中,N是原子数,mim_i是原子ii的质量,XiX_i是目标原子i{i}的坐标矢量,YiY_i是参照原子ii的坐标矢量,MM是总质量。当RMSD不采用质量加权时,全部mi=1m_i=1M=NM=N。在Amber,RMSD的单位是埃米(Angstrom,Å)

RMSD = 0.0意味着完美重叠,RMSD越大意味着目标分子偏离参照分子的程度越大。

计算RMSD需要指定参照分子,参照分子与目标分子在原子数和原子顺序上必须匹配。

在分子动力学模拟中,常用采用RMSD来快速判断某段轨迹是否达到平衡,以便进行后续模拟或分析。

RMSD的高度反映了轨迹相对于参照分子(通常选取轨迹第一帧,即初始状态)的整体偏离程度;但这不是至关重要的因素,因为采用不同的参照帧,高度和形状都会有所改变。RMSD曲线的形态和振幅则是值得重视的。当曲线有向上倾斜的趋势时,这表明体系构象可能发生某种显著运动(比如,蛋白Loop区“开合”折叠,RNA二级结构发生重大改变);当曲线在某个高度附近平稳振动时,这表明体系达到平衡,振幅大小反映了其振动的剧烈程度。

下图是典型的平稳的RMSD图(0.1 nm = 1 Å),曲线在1.3 Å附近波动,振幅保持在1.5 Å内。

图1

下图是蛋白骨架的RMSD曲线,从30 ns开始有缓慢抬升的趋势。模拟时间足够长(100 ns),它可能提示存在某种本质的蛋白骨架运动。

图2

2.2 均方根涨落(Root Mean Square Fluctuation,RMSF)

RMSF计算每个原子相对于其平均位置的涨落(变化幅度),是衡量原子运动自由程度的指标,表征分子结构的柔性。其定义为:

RMSFi=tj=1T[xi(tj)xˉi]2TRMSF_i = \sqrt{\frac{\sum_{t_j=1}^{T}{[x_i(t_j)-\bar{x}_i]^2}}{T}}

其中,TT为时间,xi(tj)x_i(t_j)tt时刻原子ii的位置,xˉi\bar{x}_i为该原子的平均位置,xi(tj)xˉix_i(t_j)-\bar{x}_i就是tt时刻原子ii相对于其平均位置的偏移量。在Amber中,RMSF的单位是Å

当计算的是残基或一组原子的RMSF时,计算公式为:

RMSF=RMSFimimiRMSF = \frac{\sum{RMSF_i\cdot m_i}}{\sum{m_i}}

其中,RMSFiRMSF_i为原子ii的RMSF值,mim_i为其质量,即将各原子RMSF按质量进行加权平均。

RMSD与RMSF的区别:

  • RMSD反映分子结构随时间的位置变化程度(偏移),横坐标是时间,纵坐标是整体偏移值;
  • RMSF反映分子中各原子运动的自由程度(涨落),横坐标是残基(或原子),纵坐标是各自的涨落值。

下方是典型的RMSF图(右图),将其显示在蛋白原子上(左图),可观察到特定区域有较高柔性,这些区域对蛋白发挥功能有重要作用:

图3

2.3 B因子(B-factor)

温度因子(也称温度值,B因子,B值或Debye-Waller因子)是衡量原子位置不确定性的一种方法,体现了晶体中原子电子密度的“模糊度”(diffusion)。温度因子越高,相应部位的构象就越不稳定。B因子与RMSF的关系是:

B=RMSF283π2B = RMSF^2 \cdot \frac{8}{3}\pi^2

在Amber中,B因子的单位为 Å2

通过比较计算的B因子和晶体结构数据,可以考察模拟结果是否与晶体结构符合。

2.4 回转半径(Radius of Gyration)

回转半径(Radius of Gyration)描述体系原子沿着特定轴向的分布特征,可用于表征分子的紧密程度(compactness)。例如,可用于区分折叠的α\alpha-螺旋结构和舒展的结构,或者考察体系的特征运动。其计算公式如下:

Rg=i=1N[mi(rirc)2]MR_g=\sqrt{\frac{\sum_{i=1}^{N}{[m_i(r_i-r_{\text{c}})^2]}}{M}}

其中,MM是总质量,mim_i是原子ii的质量,rircr_i-r_c是原子ii到全部原子的中心(通常为质心)的距离。

下图展示了原本体和突变体的回旋半径曲线,两者在高度和振幅方面都有显著差别,这表明突变后体系变得更“松散”且不稳定了。

图4

2.5 径向分布函数(Radial Distribution Function,RDF)

径向分布函数(Radial Distribution Function,RDF,也称对关联函数)是用来考察特定粒子周围其他粒子分布特征的一种统计方法。其定义是:在一个中心分子周围距离为rr处,分子的局部密度相对于本体密度的比值。公式为:

g(r)=ρ(r)ρg(r) = \frac{\rho(r)}{\rho}

图5


下面是典型的RDF曲线图:当距离较小时,RDF一直为0,随着距离增大,在某个临界点开始出现其他粒子,随后出现一个高峰,峰值远大于1,然后出现小于1的低谷,之后可能还会出现若干峰谷,在大距离区间,RDF趋近于1.0。

图6

3. 入口

平台地址:(https://cloud.yinfotek.com/)

平台左侧菜单栏【计算方案】->【大方案】->【分子动力学】->【分析Amber轨迹】

4. 平台操作步骤

4.1 选择结构文件和设定采样范围

从平台云盘中选择拓扑文件轨迹文件,点击【计算帧数】,获得各轨迹文件的帧数。建议选取经过【处理Amber轨迹】方案处理过的文件。

不同分析内容可能需要采用不同方式处理过的文件;下面会在具体的分析内容中详细介绍,若非特别注明,本教程采用来自【处理Amber轨迹】默认参数处理后的文件。

4.2 设置分析内容

按需要设置分析内容。

  • RMSD

    为需要计算RMSD的结构填写Amber mask(详见《【分子动力学模拟(Amber 20)】》的预备知识),可填写多项,每项对应一条曲线。参照分子可选择轨迹的第N帧或上传文件。

    例如,计算某蛋白1-266号残基的蛋白骨架(CA、C和N原子)RMSD,可在mask填写:1-266@CA,C,N

  • RMSF

    为需要计算RMSF的结构填写Amber mask(详见《【分子动力学模拟(Amber 20)】》的预备知识)。 计算方式有三种:

    • 按残基

      得到每个残基的RMSF值,常用于评价生物大分子残基柔性。

    • 按原子

      得到每个原子的RMSF值。

    • 按原子群

      得到mask结构整体的RMSF值。

例如,计算蛋白1-266号残基的RMSF,可在mask填写:1-266,选择按残基方式。

  • B因子

B-factor的设置方式与RMSF类似,勾选计算各向异性位移参数可得到类似于PDB文件中ANISOU的文件。计算方式只提供两种:按残基按原子,含义与RMSF类同。

例如,计算蛋白1-266号残基的B因子,可在mask填写:1-266,选择按残基方式。

  • 氢键

溶质-溶质间氢键用于分析溶质与溶质之间的氢键,需要填写氢键供体和受体的mask。分两种情况:

  • 分子间氢键

分析独立分子之间的氢键,例如,受体蛋白与配体间的氢键、蛋白两链间的氢键。此时,应勾选排除分子内氢键以免分析蛋白链内残基间的氢键,产生过多不必要的信息。

例一、计算蛋白(1-266号残基)与配体(267号残基)之间的氢键,可填写:1-267,并勾选排除分子内氢键

例二、计算配体(残基名为BAX)与周围7 Å以内的残基之间的氢键,可填写:BAX<:7,并勾选排除分子内氢键

  • 分子内氢键

分析分子内的氢键,例如,蛋白链内某些残基之间的氢键。此时,应不要勾选排除分子内氢键

注意,每条不相连的链(包括由序列间隙分隔成多段的链)均视为独立的分子。

例如,计算蛋白链(1-134号残基)内氢键,可填写:1-134,不要勾选排除分子内氢键

溶质-溶剂间氢键与水桥用于分析溶质和溶剂(水)之间的氢键和水桥,溶质-离子相互作用用于分析溶质和离子之间的相互作用。两项均只需填写溶质的mask

注意,【处理Amber轨迹】方案的默认操作是删除水和离子。因此,进行该分析时,请确保轨迹文件中包含溶剂和离子。必要时,请提交新的任务进行单独分析。

例一、分析配体分子(267号残基)与溶剂水之间的氢键和水桥,可填写:267

例二、分析所有赖氨酸残基(LYS)与溶剂离子(K+、Na+、Mg2+、Ca2+和Cl-1)之间的相互作用,可填写:LYS

  • 回转半径

填写需要计算回转半径的mask。默认对原子进行质量加权,勾选计算最大值将使用最大回转半径(而非均方根值),计算张量将计算回转半径张量。

例如,计算蛋白(1-266号残基)的回转半径,可在mask填写:1-266

  • RDF

溶剂mask填写需要计算RDF的原子的mask,此为必填项。若同时填写溶质mask,则以溶质每个原子为中心,计算将计算溶剂原子的RDF。

  • 溶剂mask不一定是溶剂,也可以是任意原子,该命名只是方便区分。
  • 【处理Amber轨迹】方案的默认操作是删除水和离子。因此,若该分析涉及水或离子,请确保轨迹文件中包含这些分子。必要时,请单独提交任务进行本项分析。
  • 顾名思义,RDF计算的是每对粒子的距离,计算量会随着粒子数量剧增,请注意设定适当的mask和轨迹采样范围。必要时,请单独提交任务进行本项分析。

这里提供了4种计算方式:

  • 按原子:以溶剂溶质mask中的原子作为计算单元。

  • 按原子群几何中心:以溶剂溶质mask中的原子群的几何中心作为计算单元。

  • 按残基质心:以溶剂溶质mask中的每个残基的质心作为计算单元。

  • 按分子质心:以溶剂溶质mask所指的每个分子的质心作为计算单元。

此外,需要确定距离区间宽度(图5的dRdR)和区间范围(图6的横坐标最大值)。

另外还有两个高级选项:

  • 勾选根据体积确定密度将根据轨迹中的体积自动计算密度,否则将采用固定的密度值(0.033456个分子/ Å3,对应于1.0 g/mL水的密度);
  • 勾选排除分子内距离将忽略分子内距离,只计算分子间距离。

例如,计算配体(残基名为BAX)周围水分子的RDF,可在溶剂mask溶质mask分别填写:WAT@O:BAX,对于溶剂,选择按原子方式计算,对于溶质,选择按残基质心,不勾选根据体积确定密度

  • 距离

原子1原子2填写要计算距离的mask,每组mask定义一个距离。若mask包含多个原子,将以原子群的几何中心质心进行计算。

例如,计算配体(残基名为BAX)的O15原子和147号残基N原子之间的距离,可在原子1原子2分别填写:BAX@o15:147@N,选择几何中心

  • 角度

与测量距离同理,在原子1原子2原子3中填写要计算角度的mask,每组mask定义一个角度。几何中心质心的含义与上同。

  • 二面角

与测量距离同理,在原子1原子2原子3原子4中填写要计算二面角的mask,每组mask定义一个二面角。几何中心质心的含义与上同。

4.3 点击【提交】,提交任务。

4.4 任务完成后,进入分析页面,可查看分析内容。内容按字面意思很好理解,因此不再赘述。

  • RMSD、RMSF、氢键、回转半径、距离、角度、二面角等随时间变化的统计指标,平台给出的横坐标为Frame,但发表文章时通常写作Time (ps)Time (ns)。换算关系取决于所选轨迹的采样间隔和每一帧代表的时间间隔。例如,原始轨迹1帧对应1 ps,如果采样间隔为10帧,则数据结果的1帧对应10 ps。

  • 氢键数据的详细解释见《【分子动力学模拟(Amber 20)】》文章的结果分析。


文章作者: 殷赋量子氢
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 殷赋量子氢 !
  目录