Gromacs命令锦集

更新时间:2023-10-04 20:21:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

目录

1、MAKE_NDX .........................................................................................................................................................2 2、G_TRAJ ...............................................................................................................................................................3 3、G_ENERGY另外一种用法...............................................................................................................................3 4、PDB2GMX ...........................................................................................................................................................3 5、GENION ..............................................................................................................................................................5 6、EDITCONF............................................................................................................................................................6 7、G_RAMA.............................................................................................................................................................6 8、G_CLUSTER .........................................................................................................................................................7 9、GENBOX ..............................................................................................................................................................7

1

1、make_ndx

Gromacs的索引文件,即index文件,由make_ndx程序生成,文件后缀为.ndx。 索引文件是gromacs最重要的概念文件,使用它可以在模拟过程中为所欲为。举一个简单的例子,比如想详细了解HIV整合酶切割DNA的反应机理,使用量子力学模拟反应位点的反应过程,而分子其他部位使用一般分子动力学模拟。于是我们就面临一个对模拟系统进行分割定义的问题,在gromacs中,就要用到索引文件。

基本的思路是这样的,在索引文件中,定义一个独立的组,这个组包括反应位点处所有原子。在模拟的.mdp文件中,对这个组定义量子力学模拟,事情就是这么简单。对蛋白进行量子力学模拟时,一般使用洋葱模型。所谓洋葱模型,就是对反应位点使用量子机制,在反应位点一定的半径内,使用半量子力学机制,然后分子部分使用分子机制。那么索引文件就定义一个使用量子力学的组,把需要引进量子机制的原子都放到这个组中;再定义一个半量子机制的组,同时放进需要半量子力学机制模拟的原子,再在.mdp文件中独自定义即可。

再举一个例子,比如说在进行SMD(Steered MolecularDynamics,这个我一直没有想到或者找到切恰的中文翻译方法,或许可以叫做牵引分子动力学??别扭!!)中,要对蛋白莫一个原子或者残基作用力,那么可以建立一个索引文件,在该文件中定义一个组,把要施力的残基或者原子放到该组中。然后在.ppa文件中使用该组就行了。

如果我还没有说明白,那么看看gromacs的参考文件吧。如果还是不明白,可以来找我,我免费培训。^_^

索引文件使用make_ndx命令产生,\可以看到全部的参数。运行make_ndx后,可以使用\命令选择残基,\命令选择原子,\命令多组进行改名。可以使用\表示或运算,\表示与运算。下面是几个简单的例子:

----------------------------- 1.选择56号残基 r 56

2.选择3至45号残基 r 3-45

3.选择3至15,23至67号残基 r 3-15 | r 23-67

4.选择3至15号残基的主干链原子

r 3-15 & 4 #在索引文件中,4号组为默认的主干链。 -----------------------------

组合是灵活的,使用的时候好好发挥聪明的大脑啦。

个人觉得gromacs把索引文件概念做得非常好,并独立成一类文件是一个不小的创举啊。在这个概念很值钱的年代,基本上使gromacs多一个大大的卖点。

2

2、g_traj

几乎gromacs的所有分析数据都可以输出为xmgrace的数据文件,g_traj可以产生gromacs轨迹的各个组的坐标,速度,受力和边界等等。使用” -com “参数可以求出轨迹中各个组的质心的坐标,速度,受力等;使用” -mol “则可以求取系统中各个分子的信息;” -ot “则可以求出系统中各个组的温度。还有几个其他参数,比如” -cv “可以求平均速度,” -cf “可以求平均受力等。其他参数同其他命令无异,参加说明文件。

3、g_energy另外一种用法

Gromacs的各个工具都很有个性,如果互相结合,可以做很多事情。

g_energy求系统轨迹各个能量的,一般跑完MD之后,使用g_energy处理ener.edr只能得到系统的各个能量项。但是如果想求系统中两个不同部分在模拟过程中的相互作用能量,那就要使用一些小窍门。

以下是实现的一个方法:

第一,根据原来的tpr文件建立一个新的tpr,在这个新的tpr中,明确定义感兴趣的组。这要用索引文件,见上文。

第二,用mdrun的\-rerun \参数指定原来的轨迹文件再跑一次模拟,这个过程很快。如果还想更快,可以使用trjconv把水分子去掉。这一个重复的模拟也产生轨迹文件,重要的是,还产生一个新的ener.edr文件,这个文件中包含了tpr文件中定义的各个组能量及相互作用能量(库伦相互作用能,范德华相互作用能等)。

第三,再使用g_energy把各个能量项提出来,想要什么提什么。 嗯,结果非常好。不信你试试。

4、pdb2gmx

使用gromacs做分子动力学模拟时,第一个要用到的命令一般都是pdb2gmx。这个命令吧pdb分子文件转化成gromacs独特的gro分子结构文件类型,同时产生分子拓扑文件。

Gromacs是典型的GPL软件,每一个命令都有很多命令参数。这对熟悉windows环境的人来说有一点烦,但是如果熟悉了Linux环境,也就慢慢喜欢啦。(建议多使用命令,就像VMD, Pymol, rasmol和Chimera等等分子可视化软件,如果接合命令使用,功能都非常强大。另外一个比较bt的软件叫做WHATIF的,完全建立在bt的命令菜单上,心理承受能力不强者多半吐血而终。

3

使用“pdb2gmx -h”可以得到pdb2gmx的所有参数及简单说明(gromacs的任何命令都可以使用-h参数得到类似帮助)。pdb2gmx的参数很多,但是常用的只有以下几个:

-----------------------------------------------------------------------

-f 指定你的坐标文件,可以是pdb、gro、tpr等等包含有分子坐标的文件;

-o 输出文件,也就是处理过的分子坐标文件,同样可以是pdb、gro、g96等文件类型;

-p 输出拓扑文件。pdb2gmx读入力场文件,根据坐标文件建立分子系统的拓扑;

-water 指定使用的水模型,使用pdb2gmx的时候最好加这个参数,不然后面会吃苦头。它会提前在拓扑文件中添加水分子模型文件;

-ff 指定力场文件(下文讨论),也可以不用这个参数,再自行选择; -ignh 舍弃分子文件中的H原子,因为H原子命名规则多,有的力场不认;

-his 独个指定HIS残基的质子化位置。

------------------------------------------------------------------------

其他的参数还不少,可以好好看一个pdb2gmx的帮助文件,一般的pdb2gmx的执行格式如下(假设你的分子坐标文件为sen.pdb):

pdb2gmx -f sen.pdb -o sen.gro -p sen.top -water tip4p -ignh -his

该命令读入分子文件,使用tipp水模型,等等,然后pdb2gmx会让你选择力场文件。然后它就很聪明的帮你建立初始模拟系统啦。

gromacs自带的力场有很多:

------------------------------------------------------------------------

0: GROMOS96 43a1 force field

1: GROMOS96 43b1 vacuum force field

2: GROMOS96 43a2 force field (improved alkane dihedrals) 3: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205) 4: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656) 5: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656)

6: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals) 7: [DEPRECATED] Gromacs force field (see manual)

8: [DEPRECATED] Gromacs force field with hydrogens for NMR

9: Encad all-atom force field, using scaled-down vacuum charges 10: Encad all-atom force field, using full solvent charges

------------------------------------------------------------------------

本人建议使用OPLS力场和tip4p水模型。tip4p水有四个粒子,分别是两

4

个氢原子,一个氧原子和一个没有质量的电粒子。这个电粒子在其他三个原子中间靠近氧原子。tip4p水模型多了一个粒子,模拟代价高一点,但是结果要好一点。但是最近有报道说使用spce水模型和GROMOS力场的计算结果最好,嘿嘿,好一个百家争鸣的学术氛围啊,我真的号感动哦。Gromacs也可以使用其他力场,如AMBER力场等,使用方法请参考google。

pdb2gmx的输出基本可以做真空中模拟了,现在对MD模拟的要求高,一般都要有点水。为分子系统添加水环境和离子环境需要其他命令,要慢慢来。

5、genion

在给蛋白质添加水环境之后,一般要在水环境中添加金属离子,使模拟系统更加接近真实系统。如果系统中蛋白质本身已经带了静电量,那么就更要给系统加几个带相反电量的金属离子,使系统处于电中性。

gromacs中添加金属离子的命令是genion,使用\可以得到其使用的参数,其中有几个比较常用:

--------------------------- \指定系统tpr文件。

\指定系统拓扑文件,在往系统中添加金属离子时,genion会往拓扑文件最后的分子类型中写入添加的离子数,并修改拓扑文件中系统原子数。

\指定输出文件,genion的输出是pdb文件或者gro等结构文件。也就是说你产生这个文件之后,还要再用这个文件产生tpr文件。

\带正/负电金属粒子的数目。这个数目有一点讲究,一般需要看个人的应用。假如想要得到\的离子浓度到底要加多少,可以自己算一下(很简单,方法很多,比如看课本)。也可以直接使用\-conc \参数直接指定离子浓度,在使用\-conc \参数时,建议使用\\参数配合,即使系统的最后处于电中性。嗯,gromacs开发组想得不要太周到哦(南京话)。

\指定正负金属离子的名字,比如\或者\。可以看看gromacs安装途径\下面你用的力场文件中离子到底用什么名字,也可以使用新的离子,但是要在力场中定义,或者把新离子的itp文件使用\添加到系统拓扑文件中。

\随机位置添加离子。这个比较有说法,如果不用该参数,那么离子就会添加在势能最低处,即靠近蛋白质相反电量的部位。有的人说这样可以节省时间,但是这样一跑MD,离子就会抱跟着蛋白,死死不放,不是很好。

\-seed \有随机,就是随机种子,如果发现使用\-random \添加离子自由,离子离蛋白太近(比如说小于0.1nm),那么可以指定新的seed。

--------------------------- 嗯,给一个例子: ------

\genion -s topol.tpr -o system_ion.pdb -p system.top -np 100 -pname Na -nn 100 -nname Cl -random \

------

说明一下:加了100个Na和100个Cl,随机加,输出文system_ion.pdb文件。

5

再使用grompp生成一个新的tpr,就可以计算了。

6、editconf

在使用pdb2gmx创建模拟分子系统之后,可以使用editconf为你的分子画一个盒子。也可以认为使用editconf把分子放进一个盒子中,这样,你就可以往盒子里面添加水分子,离子,或者其他溶剂等等了。

使用“ eidtconf -h ”可以看到editconf的参数,其中比较常用的有以下几个: ---------------------------------------------------------- -f 指定你的坐标文件。

-n 分子系统的索引文件。索引文件是gromacs一个十分突出的功能,刚接触有点复杂,但是功能相当强大。

-o 输出文件,即放进盒子里面的分子系统。

-bt 盒子类型,有正方型,长方形,八面型等等,看个人需要跟癖好啦。 -box 自定义盒子大小,需要三个长度,即X、Y、Z三个方向的长度。 -d 分子离盒子表面的最短距离。这个跟-bt一起使用,基本就足够了;如果蛋白在模拟过程尺寸变化很大,那就用-box吧。

-center 确定哪一部分分子放在盒子中心,如果和索引文件一起使用,可以非常详细的定义分子的位置。

-translate 平移分子,跟X、Y、Z三个方向,随便移动。可以参考我前面一篇关于加大盒子的e文文章,练习e文,不好意思。

-rotate 转动分子,还是三个方向。我觉得editconf开发者太有才,什么都想到了,我想要什么,他就有什么,以后遇到他,我会让他给我签名。 -princ 这个参数可以用来对齐分子,比如使分子沿X轴对齐。举一个例子吧,比如你想将分子中两个残基沿Y轴对齐,那么就在索引文件中将这俩个残基标记以下,然后使用-princ,根据提示走就能对齐分子啦。

----------------------------------------------------------

由于gromacs的很多命令都可以接受不同的文件类型,editconf也有其他功能,如和trjconv一样进行gro和pdb的转化: editconf -f sen.pdb -o sen.gro 或者

editconf -f sen.gro -o sen.pdb 7、g_rama

rama图的标准分布,是统计很多天然蛋白质结构残基的psi和phi二面角

6

而绘制的,集中分布在几个角度范围的区域,物质都具有自发朝向能量最低的方向变化的特点,自然界的蛋白也是,所以在rama标准分布图中,统计分布密集的区域,是蛋白能量低、稳定的构象,在这些区域中,残基间的侧链彼此间斥力小。模拟得到的结果如果绝大多数落在这些范围中,也可以说明具有这样的特征。但分布另一方面也和残基类型有关,侧链越小所受的斥力制约越小,在rama图中分布范围越广。

A Ramachandran plot (also known as a Ramachandran map or a Ramachandran diagram), developed by Gopalasamudram Narayana Ramachandran, is a way to visualize dihedral angles φ against ψ of amino acid residues in protein structure. It shows the possible conformations of φ and ψ angles for a polypeptide.

我想這張圖應該是用\畫出來的~

VMD Main -> Extensions -> Analysis -> Ramachandran Plot

8、g_cluster

用了g_cluster这个命令,可是生成了一个rmsd-clust.xpm文件。 xpm2ps是gromacs中的一条命令可分析rmsd-clust.xpm,并用xmanager观看图形

9、genbox

使用genbox命令为Gromacs模拟分子添加水环境

使用editconf把分子放进一个盒子之后,接下来要做的就是往盒子里面添加水分子。Gromacs中添加水环境的命令是genbox,这是一个较其他命令简单一点的命令,因为参数不多。

通常用到的genbox参数有一下几个:

7

-cp :带盒子参数的分子坐标文件,也就是editconf的输出文件;

-cs :添加的水分子模型,如spc216、spce、tip3p、tip4p等,关于各个模型的区别,请参考scholar google;

-o :输出坐标文件,就是添加水分子之后的分子坐标文件,默认是.gro文件,但是也可以输出其他文件格式,如pdb;

-p :系统拓扑文件,genbox会往里面写入添加水分子的个数,这个不要忘记,不然在进行下一步计算时,会出现坐标文件和拓扑文件原子数不一致的错误;

-ci :索引文件,genbox可以为分子特定部位添加水环境,这样可以减少原子数,只有研究的分子部位添加水环境,节省计算时间。

-seed :随机种子数,添加水分子时,各个水分子的位置是随机的,可以改变这个随机数子使水分子重新分布。

添加水分子后可以用VMD等软件看看结果,一般完成这个之后事情开始变得复杂。比如某一个水分子出现在蛋白结构中,而这个位置本来就是不希望水分子一开始就存在,那么可以找出这个水分的残基标号,进行删除,同时删除拓扑文件中水分子的数目等。

8

本文来源:https://www.bwwdw.com/article/wz8d.html

Top