人Latexin基因及蛋白质的生物信息学分析 - 王兆松

更新时间:2024-02-29 02:16:01 阅读量: 综合文库 文档下载


第 20 卷 第 2 期 生命科学研究

2016 年 4 月 Life Science Research Vol.20 No.2 Apr. 2016

DOI:10.16605/j.cnki.1007-7847.2016.02.006 人 Latexin 基因及蛋白质的生物信息学分析


蒙,魏 梅,董秋萍,许世磊


(天津医科大学肿瘤医院 国家肿瘤临床医学研究中心 天津市肿瘤防治重点实验室,中国天津 300060)

摘 要: Latexin(Lxn)是人的羧肽酶抑制剂, 并有肿瘤抑制因子的作用。 利用生物信息学分析 Lxn 基因的启动子和

CpG 岛以及 Lxn 蛋白质的理化性质、结构特点、功能特征后发现, Lxn 基因存在两个启动子和 CpG 岛, 且 一个 CpG 岛与启动子重合; Lxn 是全长 222 个氨基酸, 等电点 5.52, 无信号肽、 无跨膜结构的亲水不稳定蛋白 质; 蛋白质二级结构有 4

个 α 螺旋和 9 个 β 折叠, 三级预测结构可信度为 99.55%, 拉曼图表明结构稳定; 与

Lxn 相互作用的蛋白质主要是羧肽酶, 另外 Lxn还参与炎症反应和温度引起的痛觉反应等生物过程; 启动子和

氨基酸在灵长类间的同源性极高。 对 Lxn 的表达、结构及功能的预测分析可以为研究 Lxn 在生命过程中的作 用提供重要的信息。 中图分类号:Q811.4


关键词: Latexin; 羧肽酶抑制剂; 肿瘤抑制因子; 生物信息学


Bioinformatic Analysis of Human Latexin Gene and Protein

WANG Zhao-song, ZHAO Wen-cheng, ZHOU Meng, WEI Mei,


DONG Qiu-ping, XU Shi-lei

(Tianjin Key Laboratory of Cancer Prevention and Therapy, National Clinical Research Center for Cancer, Tianjin Medical

University Cancer Institute and Hospital, Tianjin 300060, China)

Abstract: Latexin (Lxn) is a carboxypeptidase inhibitor in human and acts as a tumor -inhibiting factor. Through bioinformatic analysis, predictions on the promoter and CpG island of Lxn gene, as well as physico- chemical properties, structural and functional characteristics of Lxn protein were performed. It was found that there are two promoters and two CpG islands in the gene and one CpG island is located in one promoter region. Lxn protein is composed of 222 amino acids, with isoelectric point of 5.52. It is a hydrophilic and unstable protein without a signal peptide and transmembrane domain. As for the advanced structure, four α-helices and 9 β-sheets were predicted in the secondary structure. The reliability of predicted tertiary struc- ture reached up to 99.55% and the structure was proven to be stable by Ramachandran plot. The advanced structure influenced the function of protein. Lxn not only interacted with carboxypeptidase but also took part in inflammatory response and pain sense stimulated by temperature and so on. What′s more, the homologies of promoters and amino acids in primates were very high. The analysis results provide important messages for further studies on function of Lxn in human life activities.

Key words: Latexin; carboxypeptidase inhibitor; tumor-inhibiting factor; bioinformatics

(Life Science Research,2016,20(2):125~130)



Latexin(Lxn)是目前已知的哺乳类动物中唯 且调控了干细胞中蛋白质表达的丰度[3]。Liang 等[4] [1]一的羧肽酶抑制剂, 具有 222 个氨基酸残基, 相 发现小鼠 Lxn 的表达影响其体内造血干细胞的数 [5]对分子质量为 29 kD。Lxn 在人的心脏、前列腺、卵 量, Muthusamy 等发现 Lxn 的表达与干细胞因子 [6][2]巢、肾脏、胰腺、结肠等多个器官中均有表达, 并 的表达呈现负相关的关系, 而 Liu 等证明Lxn 具 作者简介:王兆松(1989-),男,山东泰安人,硕士研究生,主要从事分子生物学研究;通讯作者:许世磊(1981-),男,天津人,助理研究 员,博士,主要从事肿瘤细胞生物学研究,Tel: 022-23340123-6009,E-mail:slxu@sibs.ac.cn。


126 生 命 科 学 研 究

2016 年

网站; Lxn 蛋白质的氨基酸序列(NP_064554.3)来自

有抑制血液系统的恶性肿瘤的作用, 并且这种抗肿瘤的作用不依赖于其羧肽酶抑制剂的功能。随

着对 Lxn 研究的深入, 它对肿瘤抑制作用的研究也在不断增加, 如通过促进细胞凋亡以抑制淋巴瘤的生长, 使细胞停滞于 G0 期, 从而抑制肝癌细胞的增殖。另外, 有临床研究证明 Lxn 能够有效抑制胃癌、乳腺癌、甲状腺癌等恶性疾病



NCBI 网站。

1.2 方法

利用在线数据库及分析软件对 Lxn 基因相

关序列及 Lxn 蛋白质氨基酸序列进行分析, 并得出相应的结果。

。因此, 对 Lxn


2 结果与分析

2.1 人 Lxn 基因启动子及转录因子预测与分析

物的开发及愈后的检测提供大量可行的指导意见。本研究借助生物信息学的方法对人 Lxn 基因启动子及甲基化进行分析预测, 并对 Lxn 蛋白质的理化性质、亲疏水性、二级结构、三级结构以及蛋白质之间的相互作用等进行预测分析, 为 Lxn

使用 Promoter Scan(http://www-bimas.cit.nih.

gov/molbio/proscan/)对 Lxn 基因起始密码子上游


行启动子的预测。通过预测发现 Lxn 基因存在两个启动子, 并且预测得到与相应启动子结合的所有

3 000 bp 和下游 1 000 bp 共 4 000 bp 的片段进

1 材料与方法

1.1 材料

Lxn 基因(Gene ID: 56925)相关序列来自 NCBI

转录因子, 启动子位置及序列如表 1 所示, 其

中Promoter 1 横跨起始密码子。预测所得的与两个启动子相结合的转录因子分别如表 2 和表 3 所示。

表 1 人 Lxn 基因启动子预测

Table 1 Promoter prediction of human Lxn gene

Promoter Promoter 1 Start 3 241 Stop 2 991

Score 59.40

Promoter 2







表 3 Promoter 2 结合的转录因子

Table 3 Transcription factors combined with Promoter 2

表 2 Promoter 1 结合的转录因子

Table 2 Transcription factors combined with Promoter 1

Name Sp1 NF-κB NF-κB

Sp1 AP-2 GCF Sp1 GCF Sp1 AP-1 AP-2

Strand - - - + + - - + + - + - - - - - - +

Location 3 229 3 226 3 226 3 224 3 186 3 155 3 152 3 149 3 147 3 095 3 013 2 997 2 996 2 996 2 996 2 995 2 994 2 991

Weight 3.191 000 2.869 000 1.080 000 3.119 000 1.091 000 2.361 000 3.292 000 2.284 000


Location 330 321 298 179 179 179 Weight 2.618 000 1.971 000 2.920 000 2.920 000 2.618 000 1.971 000

3.361 000 8.606 000 1.091 000

2.2 人 Lxn 基因启动子区域 CpG 岛及甲基化区 域的预测与分析 使用在线 MethPrimer 软件(http://www.uro- gene.org/cgi-bin/methprimer/methprimer.cgi)对 Lxn 基因起始密码子上游 3 000 bp 和下游 1 000 bp 共 4 000 bp 片段进行甲基化预测, 得到如图 1 所示结 果。在 4 000 bp 中存在两个 CpG 岛, 长度分别为 106 bp(491-596 bp)和 151 bp(3 060-3 210 bp), APRT-mouse_US EARLY-SEQ1


(Sp1) Sp1



6.003 000

6.322 000 1.108 000 8.117 000 2.755 000

3.292 000 2.284 000

第 2 期 王兆松等:人 Latexin 基因及蛋白质的生物信息学分析


其中一个 CpG 岛完全落在 Promoter 1 中, CpG 岛

2.4 人 Lxn 蛋白质的理化性质分析

的存在会抑制基因的转录, 因此 Promoter 1 及其甲基化对于 Lxn 的转录调控具有更重要的作用。

图 1 人 Lxn 启动子序列甲基化预测图谱

Fig.1 MethPrimer predication of human Lxn promoter

将 Lxn 蛋白质序列(NP_064554.3)提交到

ProtParam 在线分析软件(http://web.expasy.org/ protparam)分析发现: Lxn 总共有 222 个氨基酸

残基 ; 相对分子质量为 25 750.1; 理论等电点为 5.52; 在 222 个氨基酸残基中负电荷氨基酸残基

(Asp+Glu)总数为 28, 正电荷氨基酸残基(Arg+ Lys) 总数为 21; 蛋白质总分子式为 C1157H1779 - N307O344S8, 其原子总数为 3 595; 不稳定系数为 43.70, 属于不稳定蛋白质 ; 蛋白质的疏水值为

78.11, 平均总亲水性值为-0.593。

2.3 人 Lxn 基因启动子及 CpG 岛同源性分析

ncbi.nlm.nih.gov/Blast.cgi)在线系统, 对人 Lxn 基

2.5 人 Lxn 蛋白质的同源性预测和分析

使 用 NCBI 的 protein blast(http://blast.ncbi. nlm.nih.gov/Blast.cgi)在线系统, 对人 Lxn 蛋白质进行同源性分析, 输出结果中覆盖度达 100%的为哺乳动物, 其中与黑猩猩、恒河猴、牛、鼠的序列的相似性分别为 99%、97%、86%、85%, 这说明在哺乳动物中, Lxn 具有高度的同源性, 因此它在其他物种中的

使 用 NCBI 的 nucleotide blast(http://blast.

因得分较高的启动子(启动子 1)和落在其中的 CpG 岛共同进行同源性分析, 输出结果中覆盖度

(query cover)达 100%的多为灵长目物种, 其中与黑猩猩、绿猴、狒狒、恒河猴的序列的相似性(i-dentity)分别为 98%、92%、90%、92%, 这说明在灵长类动物中, 启动子序列具有高度的保守性, 因


ClustalX2.1 序列比对软件, 对人 Lxn 氨基酸序列与黑猩猩、恒河猴、牛、鼠的序列进行多重比对, 并构建系统进化树, 使用 NJplot 对进化树进行可视化分析(图 3), 结果显示人与黑猩猩、恒河猴之间的进化距离小

此 Lxn 基因可以被相同的转录因子所结合。通过 ClustalX2.1 序列比对软件, 对人 Lxn 启动子与黑


并构建系统进化树, 使用 NJplot 对进化树进行可视化分析(图 2), 结果显示人与黑猩猩之间的进化距离小于 0.016, 与绿猴、狒狒、恒河猴之间的进化距离大于 0.035。

Papio anubis

Chlorocebus sabaeus

Homo sapiens Macaca mulatta


于 0.014, 但与牛、鼠之间的进化距离大于

0.06。蛋白质同源性分析的结果与启动子、CpG 岛

分析的结果基本一致, 遗传进化越接近的物种之 间, Lxn 的表达调控及作用机制越相似。

2.6 人 Lxn 蛋白质的亲水性/疏水性预测与分析

使 用 ProtScale 程 序(http://expasy.org/tools/ protscale.html), 按其默认算法, 得到 Lxn 蛋白质


( )


0.032 Pongo Homo sapiens Pongo Macaca mulatta Bos Taurus Mouse

0.016 Homo sapiens




1 000 0.035


Chlorocebus sabaeus Pongo

Macaca mulatta 0.061 Homo sapiens 658 0.012 (B)

1 000 0.071 0.064 0.014

图 2 不同物种间 Lxn 基因启动子及 CpG 岛同源性分析 (A) 人、黑猩猩、绿猴、狒狒、恒河猴 Lxn 基因启动子及 CpG 岛序列比对结果;(B)Lxn 基因启动子及 CpG 岛系统进化树。

Fig.2 Homologous analysis of Lxn promoters and CpG islands in different species

(A) Sequence alignment of promoters and CpG islands in hu-man, pongo, chlorocebus sabaeus, papio anubis, macaca mu-latta; (B) Phylogenetic tree of promoters and CpG islands.

Papio anubis Macaca mulatta

0.009 mouse

Bos Taurus

(B) 图 3 不同物种间 Lxn 蛋白质的同源性分析

Fig.3 Homologous analysis of Lxn in different species

(A)人 、黑猩猩 、恒河猴 、牛 、鼠 Lxn 序列比对结果 ;(B)Lxn蛋白质的系统进化树。

(A) Sequence alignment of Lxn in human, pongo, macaca mulatta, bos taurus, mouse; (B) Phylogenetic tree of Lxn.

128 生 命 科 学 研 究

2016 年

亲疏水性序列分析图谱(图 4)。该蛋白质存在两个高分值(score>1.5)峰, 即 137-141 区和 143-145

区, 其中最大值是第 139 位的 Leu 的 2.144。而 6


1.2 TMHMM posterior probabilities for LXN

1.0 0.8 0.6 0.2 0.4 个低分值(score<0) 峰分别位于第 26、50、101、155、171、214 氨基酸位点附近 , 其中最小值是

Probability 101 位 Glu 的-3.022。通过分析得知, ProtScale 统

100 Inside

150 200 Outside

计的人 Lxn 蛋白质的 214 个氨基酸(5-218)中, 74.30%(159 个)分布在低分值区, 25.70%(55 个)分布在 score>0 区, 这说明 Lxn 存在大量的亲水域, 属于亲水性蛋白质。


50 Transmembrane

图 6 人 Lxn 跨膜区预测 Fig.6 Transmembrane structure prediction of human Lxn

3 ProtScale output for user sequence 2.9 人 Lxn 蛋白质二级机构的预测与分析

Jpred 采用了 Jnnet 神经网络算法, 它对蛋白质


2 1 0 -1 二级结构的预测平均准确率大于 81%。将人 Lxn

的氨基酸序列提交到 Jpred4.0(http://www.compbio. dundee.ac.uk/jpred/)进行二级结构的预测, 得到如图 7 所示的结果。人 Lxn 蛋白质含有 4 个 α 螺旋区和 9


-2 -3 -4

50 100 Position

150 个 β 折叠区, α 螺旋占 26.58%(59/222),β折叠片层占 32.88%(73/222)。这说明 Lxn 蛋白质中大部分氨基酸可以形成一定的结构域。

图 4 人 Lxn 亲水性/疏水性分析

Fig.4 Hydrophilcity/hydrophobicity analysis of human Lxn

2.7 人 Lxn 蛋白质的信号肽预测与分析

将 Lxn 蛋白质的氨基酸序列提交到信号肽在线预测程序 SignalP 4.1 Server(http://www.cbs.dtu. dk/services/SignalP/), 得到如图 5 的预测结果, 其中 C、Y、S 的最大值分别为 0.126、0.111、0.128, S-mean、D 值分别为 0.102、0.106, 通过该数据得知人 Lxn 蛋白质无信号肽。

图 7 人 Lxn 二级结构预测 H :α 螺旋;E:β 折叠。

Fig.7 Secondary structure prediction of human Lxn

H: α-helix; E: β-sheet.

2.10 人 Lxn 蛋白质三级结构预测与分析


SignalP-4.1 prediction(euk networks):LXN


C-score S-score

因此分析蛋白质的三级结构对于研究其功能必不可少。Swiss-Model 采用同源建模方法预测蛋白质的三级结构。将 Lxn 蛋白质序列提交到在线程序 Swiss-Model(http://swissmodel.expasy.org/)中,

得到 3 个预测结果。如图 8 所示,与模板相比, A

的相似度为 99.55%, B 的相似度为 85.14%, C 的

0.8 Y-score Score 0.6 0.4 0.2 0



20 50

60 70

30 40 Position

图 5 人 Lxn 信号肽分析 Fig.5 Signal peptide analysis of human Lxn

使用 TMHMM 在线分析程序(http://www.cbs.

2.8 人 Lxn 蛋白质的跨膜区预测与分析

相似度为 16.09%。分析人 Lxn 蛋白质与同源

蛋白质的相似性波形图显示, 结果 A 的预测值高且稳定, 因此预测得到的模型 A 更趋于其体内的真实高级结构。

为了进一步验证预测模型 A 的可靠性, 将预测所

dtu.dk/services/TMHMM/)对人 Lxn 蛋白质氨基酸序列进行分析后得到如图 6 的预测结果, 发现

得到的模型使用在线分析网站 The Structure Analysis and Verification Server(http://services.mbi.

Lxn 无跨膜区域, 说明 Lxn 蛋白质不是跨膜蛋白质。Lxn 可能分布于细胞质中, 当需要行使功能时, 在相应部位与靶蛋白质特异性结合, 因此它

ucla.edu/SAVES/)进行拉曼图分析, 得到如图 9 所

示的结果。预测所得蛋白质模型 A 中的所有氨基酸残基, 除甘氨酸(▲标示)外, 均位于黄色及红

第 2 期 王兆松等:人 Latexin 基因及蛋白质的生物信息学分析


0.8 1.0

Local quality estimate

Ramachadran plot model-1

oage similarity 0.4 0.6 180 135 90 45 0 -45 -90 -135

Psi(degress) local 0.2 Predcted 0

50 100 150 200 250


similarity totarget

Residue number

Local quality estimate 1.0 0.8

0.6 local 0.4 Predcted 0.2 0

-180 -135 -90 -45 0 45 90 135 180 Phi(degress)


50 100 150 200 Residue number

1.0 0.8 250

图 9 人 Lxn 预测三级结构模型 A 的拉曼图分析

图中区域由白到红,颜色越深该区域二面角越合理。 ▲:甘氨


similarity totarget Local quality estimate


0.4 0.2 0 Fig.9 Ramachandran plot analysis of predicted 3D

model A of human Lxn

The deeper the color, the more reasonable the dihedral angle. ▲: Glycine; ■: Other amino acids except glycine.

local Predcted


50 100 150 200 250 Residue number

Lxn 蛋白质进行分析, 得到 10 个与 Lxn 相互作用紧密的蛋白质(图 10)。相互作用蛋白质的信息及预测得分见表 4, 得分较高的是羧肽酶, 这与 Lxn

(A) 蛋白质 A 模型三级结构及其与同源蛋白质相似性波形图;

(B) 蛋白质 B 模型三级结构及其与同源蛋白质相似性波形图;

(C) 蛋白质 C 模型三级结构及其与同源蛋白质相似性波形图。

图 8 人 Lxn 三级结构预测

Fig.8 Tertiary structure prediction of human Lxn


2.12 人 Lxn 的 GO 注释分析


(A) Tertiary structure of model A and its similarity

waveform to the homologous protein; (B) Tertiary structure of model B and its similarity waveform to the homologous protein; (C) Tertiary structure of model C and its similarity waveform to the homologous protein.

geneontology.org/cgi-bin/amigo/go.cgi)对人 Lxn 进

行基因本体论的分析, 结果见表 5。对结果进行总结分析可以发现, 从细胞定位来说, Lxn 既可游离于细胞质中也可以分泌到细胞外; 从分子功能上来说, Lxn 具有蛋白质和生物因子的结合功能及金属内肽酶抑制剂的活性; 另外, Lxn 还参与温度引起的痛觉反应、炎症反应、抑制肽链内切酶的活性等生物过程, 这与蛋白质相互作用中预测羧肽酶与 Lxn 具有相互作用的结果相一致。

使用 Gene Ontology Consortium(http://amigo1.

色区域内, 表明所有的氨基酸均形成了一种合理的二面角, 构成的蛋白质结构稳定, Swiss-Model

预测得到的人 Lxn 蛋白质的模型稳定可靠。

2.11 人 Lxn 相互作用蛋白质的预测及分析

使用 String 蛋白质相互作用预测网站对人

表 4 与人 Lxn 相互作用可能性较大的 10 种蛋白质

Table 4 Ten proteins most likely to interact with human Lxn

Protein shot name CPA4 CPA1 CPA2


Protein full name

carboxypeptidase A4 carboxypeptidase A1 carboxypeptidase A2

zinc finger with KRAB and SCAN domains 4

SH3 domain binding glutamic acid-rich protein like DAB2 interacting protein

dihydropyrimidine dehydrogenase GSG1-like

transmembrane protein 14A

core-binding factor, runt domain, alpha subunit 2

Score 0.998 0.947 0.749 0.742 0.644 0.610 0.590 0.557 0.557 0.502

第 2 期 王兆松等:人 Latexin 基因及蛋白质的生物信息学分析


0.8 1.0

Local quality estimate

Ramachadran plot model-1

oage similarity 0.4 0.6 180 135 90 45 0 -45 -90 -135

Psi(degress) local 0.2 Predcted 0

50 100 150 200 250


similarity totarget

Residue number

Local quality estimate 1.0 0.8

0.6 local 0.4 Predcted 0.2 0

-180 -135 -90 -45 0 45 90 135 180 Phi(degress)


50 100 150 200 Residue number

1.0 0.8 250

图 9 人 Lxn 预测三级结构模型 A 的拉曼图分析

图中区域由白到红,颜色越深该区域二面角越合理。 ▲:甘氨


similarity totarget Local quality estimate


0.4 0.2 0 Fig.9 Ramachandran plot analysis of predicted 3D

model A of human Lxn

The deeper the color, the more reasonable the dihedral angle. ▲: Glycine; ■: Other amino acids except glycine.

local Predcted


50 100 150 200 250 Residue number

Lxn 蛋白质进行分析, 得到 10 个与 Lxn 相互作用紧密的蛋白质(图 10)。相互作用蛋白质的信息及预测得分见表 4, 得分较高的是羧肽酶, 这与 Lxn

(A) 蛋白质 A 模型三级结构及其与同源蛋白质相似性波形图;

(B) 蛋白质 B 模型三级结构及其与同源蛋白质相似性波形图;

(C) 蛋白质 C 模型三级结构及其与同源蛋白质相似性波形图。

图 8 人 Lxn 三级结构预测

Fig.8 Tertiary structure prediction of human Lxn


2.12 人 Lxn 的 GO 注释分析


(A) Tertiary structure of model A and its similarity

waveform to the homologous protein; (B) Tertiary structure of model B and its similarity waveform to the homologous protein; (C) Tertiary structure of model C and its similarity waveform to the homologous protein.

geneontology.org/cgi-bin/amigo/go.cgi)对人 Lxn 进

行基因本体论的分析, 结果见表 5。对结果进行总结分析可以发现, 从细胞定位来说, Lxn 既可游离于细胞质中也可以分泌到细胞外; 从分子功能上来说, Lxn 具有蛋白质和生物因子的结合功能及金属内肽酶抑制剂的活性; 另外, Lxn 还参与温度引起的痛觉反应、炎症反应、抑制肽链内切酶的活性等生物过程, 这与蛋白质相互作用中预测羧肽酶与 Lxn 具有相互作用的结果相一致。

使用 Gene Ontology Consortium(http://amigo1.

色区域内, 表明所有的氨基酸均形成了一种合理的二面角, 构成的蛋白质结构稳定, Swiss-Model

预测得到的人 Lxn 蛋白质的模型稳定可靠。

2.11 人 Lxn 相互作用蛋白质的预测及分析

使用 String 蛋白质相互作用预测网站对人

表 4 与人 Lxn 相互作用可能性较大的 10 种蛋白质

Table 4 Ten proteins most likely to interact with human Lxn

Protein shot name CPA4 CPA1 CPA2


Protein full name

carboxypeptidase A4 carboxypeptidase A1 carboxypeptidase A2

zinc finger with KRAB and SCAN domains 4

SH3 domain binding glutamic acid-rich protein like DAB2 interacting protein

dihydropyrimidine dehydrogenase GSG1-like

transmembrane protein 14A

core-binding factor, runt domain, alpha subunit 2

Score 0.998 0.947 0.749 0.742 0.644 0.610 0.590 0.557 0.557 0.502

