DNA甲基化的生物信息学研究进展

更新时间:2023-06-12 08:23:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

。。,?。j

j。二j一.j。一|。ReviewsandMonographs

PIll,:豢蕊嚣乞…记s

WWW.pibb.ac.cn

DNA甲基化的生物信息学研究进展

凡时财1,2)张学工1)”

(1)生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084;

≈电子科技大学自动化工程学院,成都610054)

摘要作为重要的表观遗传学现象之一,DNA甲基化对基因的表达发挥重要的调控功能.随着高通量检测技术的不断发展,对DNA甲基化的生物信息学研究也成为DNA甲基化研究中的一个非常活跃的热点.对生物信息学在DNA甲基化状态的预测、CpG岛不易被甲基化的机制研究、探索DNA甲基化同其他表观遗传学现象之间的关系以及DNA异常甲基化同癌症的发生和发展之间的关系等方面的研究进展进行综述.

关键词DNA甲基化,生物信息学研究,CpG岛,预测,机制,表观遗传学学科分类号Q3,Q6,Q7

IN)I:10.3724/SP.J.1206.2008.00426

在多细胞生物的发育过程中,细胞如何分化很大程度上取决于其内部的基因表达模式,而基因的表达模式不仅仅依赖于细胞内转录因子的作用,还同表观遗传学因素密切相关.表观遗传学是指在不改变DNA序列的条件下所发生的可遗传基因表达的变化【l】.表观遗传学主要包括DNA甲基化、组蛋白修饰和染色质结构.脊椎动物中,DNA甲基化表现为在DNA甲基化转移酶(DNAmethyltransferase,DNMT)作用下,甲基基团合成到5,.CpG一3’中胞嘧啶的第五位碳原子上【21.DNA甲基化参与了细胞的多种生理活动,比如基因的时空特异性表达、X染色体失活、衰老以及癌症的发生【3一.甲基化的CpG双核苷酸通过募集转录抑制因子嘲或者阻碍转录激活因子的结合抑制基因的表达[61.由于DNA甲基化在基因调控中的重要功能,以Sanger研究所为代表的人类表观基因组联盟,于2000年10月发起了人类表观基因组计划(human

epigenome

根据Gardiner—Garden等【lo】的定义,CpG岛是一段长度不小于200bp、GC含量不小于50%、CpG含量与期望含量之比不小于0.6的区域.由于该定义将一些重复片段也包含其中,Takai和Jonestlq将CpG岛重新定义为长度不小于500bp、GC含量不小于55%、CpG含量与期望含量之比不小于0.65的区域.据统计,多于50%的基因的启动子区含有CpG岛【1213】.在早期的认识中,CpG岛都是非甲基化的[41,但是随着研究的不断深入,人们发现在印迹基因[31、失活的X染色体【t41甚至是正常的体细胞中都存在甲基化的CpG岛【151.部分CpG岛的异常甲基化常常伴随着癌症等疾病的发生【阍.

近年来,随着高通量的DNA甲基化检测技术的出现,DNA甲基化的生物信息学研究得到了很大的发展.一系列具有较好精度的DNA甲基化预测工具不仅成为实验检测技术的补充,也反映了DNA甲基化本身是有规律可寻的,这启发了研究者们对于DNA甲基化内在机制的探索.DNA甲基化具有序列偏好性的观点得到进一步证实,CpG

国家自然科学基金资助项目(30625012,60721003),国家重点基础研究发展计划项日(973)(2004CB518605)和国家高技术研究发展计划项目(863X2006AA022325).¨通讯联系人.

Tel:010—62794919.E mail:zhangxg@tsingh峪.edu.Gn收稿日期:2008-06.13,接受日期:2008-08.18

project,imP),试图获得人类多个组织

中的DNA甲基化模式[71.目前该计划已经完成了来自12个组织的第6号、20号和22号染色体的检测工作嘲.

人类基因组中,70%"-'80%的CpG双核苷酸处于DNA甲基化状态嗍.非甲基化的CpG不是均匀分布,f面是呈现局部聚集倾向,形成一些GC含量较高、CpG双核苷酸相对聚集的区域,即CpG岛[41.

144 生物化学与生物物理进展Prog.Biochem.Biophys.2009;36(2)

岛边界序列通过绐合特定转录因子使CpG岛不易被甲基化的机制假说也有了更多的证据.同时,研究疾病特别是癌症中DNA甲基化静特点和撬律、发现与特定癌症楣关的甲摹纯生物标记(biomarker),成为DNA甲基化研究中新的热点问题.

本文综述了目前关于人的DNA甲基化研究中生物信息学研究酶竣新进展。首先介绍了DNA甲基化的高通量检测方法和相关数据库,然后重点综述了DNA甲基化的预测研究和CpG岛不易被甲基化的桃制探索,紧接着麓篓阐述了DNA瞪基化同癌瘫以及其他表观遗传学现象之闻的关系,最后一部分是作者基于DNA甲基化的T作体会对于今后研究方向的展望。

括三大类:a.亚硫酸氧钠(sodiumbisulfite)法,亚硫酸氢钠把非甲基化的胞嘧啶转化为尿嘧啶,而保持甲基化的胞噻睫不变,以此实现两类的分离,此方法因其准确率商碡i被誉为裣测DNA甲基亿的“金方法”;b.限制性内切酶(restrictionenzyme)法,限制性内切酶町以切割J#甲基化的位点,而甲基化以磊静识溺位点将被攥留;e.剩用特定抗体砖甲基化的胞嘧啶进行免疫沉淀反应(immunoprecipitation).这三种方法的丰要特点见表1.前期处理实现了甲基化和棼甲基化的胞豫啶分离以后,可以对分离出的甲基化DNA片+段进行基冈芯片杂交或者大规模深度测序,实现高通精的检测(图1).以上两个步骤的不同组合产牛了多种赢运量的蜜验检溺技术,磐耍硫酸氯镪+溺穿黔is]、亚硫睃氰钠+芯片技术(19,201、酶切+芯片技术【2lJ、甲基化抗体十芯片技术俐等.目前很多实验室利用以上技术对不月组织t|t的DNA甲恭化状态进行了检测,具体情况觅表2.

DNA甲基化的高通量实验检测方法

DNA甲基化的检测大体分为两个步骤:a.待

检测榉品的前期处理;b。目标序列的定位釉甲基化状态的量化。待检测样t谲酶前期处理方法上要包

Table1

Thecharacteristicsofdifferent

pretreatmentmethodsindetectiontechniquesforDNAmeth),lation

袭1DNA甲基纯实验检测鼓零各静羲期懿遴方法兹特纛

Fig.1

Sketchofthehigh—throughputdetectiontechniquesforDNAmethylation

图1高通量检测DNA甲基化技术的示意图

2009;36(2)

凡时财等:DNA甲基化的生物信息学研究进展 145

Table2

ThepublishedresultsofhumanDNAmethylationwithhigh-throughputdetectiontechniques

表2已发表的大规模检测人的DNA甲基化状态的研究结果

相关的一些DNA甲基化模式.MethDB和

DNA甲基化的相关数据库

数据库的构建是生物信息学研究的重要内容.

MethyCancer还提供了DNA甲基化的可视化工具.通过对现有的分散的DNA甲基化数据的整理分析,这些数据库提供了内容独立、记录相对完整、格式比较统一的数据资源,为后期的深入挖掘提供了极大便利.随着大规模深度测序技术在DNA甲基化检测中的应用,建立相应数据库用以存储和分析相关数据,开发类似于CpGViewert25】的可视化分析工具将具有重要价值.

目前发表的较大规模的DNA甲基化相关数据库有4个:MethDB、MethyCancer、PubMeth和MethCancerDB,数据情况见表3.其中,MethDB是最早整合文献中DNA甲基化数据的数据库,也是涵盖物种和组织最多的数据库,其余3个数据库都采用了文献挖掘的方法,收集了文献中已报道的与特定癌症

Table3

Databasesrelated

toDNA

methylation

表3DNA甲基化相关的数据库

测、对CpG岛片段以及CpG岛的甲基化状态预测.

DNA甲基化的预测研究

实验手段检测DNA甲基化状态的方法虽然比

Methylator(http://bio.dfci.harvard.edu/Methylator/index.html)是目前唯一的预测单个CpG双核苷酸甲基化状态的工具pq.该工具基于MethDB数据库∞3l】中人的2839个DNA甲基化模式数据,以CpG位点周围39bp的序列模式为特征,采用支持向量机的方法得到了87%的正确率.该研究还表明,基因的非翻译区的甲基化程度要高于外显子和内含子.由于单个CpG双核苷酸的甲基化状态在细胞生长过程中是动态变化的【4l,因此Methylator的应用相对有限.

2006年,Rollins等【2l】发表了人脑组织全基因

较可靠,但是其对于人力财力的需求以及检测技术方面的缺陷,使得目前大规模的DNA甲基化的实验数据还比较有限.研究计算预测DNA序列甲基化状态的方法显得极为重要.另一方面,作为实验检测技术的补充,预测算法能够挖掘出数据中隐藏的重要特征,为人们进一步认识DNA甲基化机理提供重要依据和研究思路.目前发表的对DNA甲基化模式进行预测的方法中,按照预测目标的类型可以分为,对单个CpG双核苷酸的甲基化状态预

146

生物化学与生物物理进展Prog.Biochem.Biophys.

组范围的甲基化数据.基丁其得到的1948个甲基化区域和2386个非甲基化区域,产生了两个预测

CpG岛片段甲基化状态的工具—_HDMFinder【32】和

MethCGI‘刭.HDMFinder(http://rulai.cshl.edu/HDMFinder/

methylation.htm)禾0用包括A缸在内的17个序列特征能够对长度为800bp的CpG岛片段以及800

bp

的普通DNA序列的甲基化状况进行准确预测,并且还对22个常染色体中的甲基化模式进行了预测.我们开发的MethCGI则专门针对CpG岛片段(包括200

bp、300

bp以及400bp)进行了预测,正

确率达到了84%,提供了在线预测服务(http://bioinfo.a11.tsinghua.edu.cn/MethCGI/MethCGI.html).通过分析特定转录凶子结合位点在甲基化和非甲基化的CpG岛片段中的分布情况,我们得到了4个在两类中差异最大的转录因子结合位点,这些结合位点可能为下一步研究DNA甲基化的内在机理提供重要依据.另外,MethCGI对MethDB数据库中包含的来自多个组织的甲基化数据也得到了较好的预测精度,表明CpG岛片段的甲基化模式并没有很强的组织特异性.

CpG岛的甲基化状态同基因表达的模式密切相关,因此对于CpG岛甲基化状态的预测一直是人们关注的重点.2003年,Feltus等[341通过在细胞系中加入过量DNA甲摹化转移酶(DNMTl),发现大部分的CpG岛仍然保持非甲基化状态,同时有部分CpG岛警现超甲基化,采用序列特征对两类的分类正确率可以达到82%.在特征选择的过程中,他们发现两类CpG岛在长度、GC含量、CpG比例以及和启动子的关系上没有显著性差异.但是其后对来自体内的DNA甲基化数据的研究表明,甲基化和非甲基化的CpG岛在长度、GC含量以及CpG比例上存在显著差异【33一.Bock等基于人外周血白细胞中第22号染色体得到的132个CpG岛的甲基化状态数据【26】,先后得到了两个预测CpG岛甲基化状态的分类器.第一个采用了序列模式,特定的重复序列以及特殊的DNA结构三大类特征[351,第二个增加了预测的组蛋白修饰状态和染色质结构特征[361,并提供了在线预测工具Epigraph(http://epigraph.mpi-inf.mpg.de/WebGRAPH/).由于组蛋白修饰以及染色质结构分布是否存在DNA序列的偏好性仍是一个有争议的问题,我们通过增加Barski等鲫实验获得的基因组尺度的组蛋白甲基化数据,对CpG岛的甲基化状态进行了预测冈.该预测模型得到了更高分类正确率的同时,还发现了

4种显著影响CpG岛甲基化的组蛋白修饰特征(H3K4mel、H3K4me2、H3K4me3以及

H3K9mel),一定程度上量化了部分组蛋白甲基化

同CpG岛甲基化之间的关系.

CpG岛不易被甲基化的机制探索

虽然人类基因组上有的CpG岛处于甲基化状

态,但是大部分CpG岛是不易被甲基化的,这同基因组上约80%的CpG双核苷酸处于甲基化状态的现象形成鲜明对比.该现象促使人们思考为什么CpG岛不易被甲基化.早在1994年Brandeis等【39】就发现,Spl的结合位点在人胚胎干细胞的APRT基因中能够保护CpG岛在重新甲基化的过程中不被甲基化,后来对人乳腺组织中BRCA.f基冈的研究结果同样表明,启动子区Spl和CTCF结合位点突变与否将决定该区域CpG岛的甲基化状态[401.Turker等[41,421以Spl在小鼠4pn基冈中的功能对小鼠体细胞中DNA甲基化模式的形成提出了一个动态平衡假说,认为在DNA的重新甲基化过程中,首先是B1之类的重复序列被甲基化,这些序列被称为甲基化中心,然后甲基化会从中心往外延伸,spl结合位点通过|一Spl的结合能够阻碍甲基化向CpG岛区的蔓延,从而保护CpG岛不被甲基化.后来的研究又发现,在Spl缺失的情况下Aprt基因仍然有表达,即CpG岛并没有冈Spl的缺失而超甲基化[431,另一方面,Spl(以及CTCF)的结合位点并非存在于所有不易甲基化的CpG岛附近,这也意味着还应该有其他凶子参与保护机制的形成.

利用人脑组织基因组尺度的CpG岛甲基化数据【2”,我们系统分析了不易甲基化的CpG岛内部以及岛边界序列的序列特征,发现一些具有锌指结构的转录因子(包括spl和CTCF)可能的结合位点在CpG岛的400bp边界序列中显著富集,而且其中80%的结合位点在人、大鼠和小鼠中是显著保守的144].基于以上结果,我们认为,从小鼠AD厅基因得到的关于CpG岛不易被甲基化的保护机制同样存在于人的基因组中M:AlM序列是重新甲基化过程中的甲基化中心【¨】,在甲基化转移酶的作用下,DNA甲基化从Alu序列出发往外延伸,当CpG岛周围富集的转录因子结合位点同具有锌指结构的转录因子结合以后则可以阻止甲基化向CpG岛的蔓延,因此在这种阻止与蔓延的作用达到动态平衡以后,就形成了比较稳定的甲基化模式.当细胞所在的环境发生变化时,这种平衡可能

2009;36(2)

凡时财等:DNA甲基化的生物信息学研究进展 147

会被打破,阻止功能的增强或者侵入能力的提高则可能使DNA甲基化往CpG岛外或者往内移动,从而建立新的平衡.比如,如果某些顺式元件发生突变,则本可以结合并阻碍DNA甲基化蔓延的特定转录因子可能因为结合能力的减弱使其阻碍功能变

弱甚至消失,这种情况下,其附近的CpG岛可能会被甲基化f觋431.因此,发生癌变的组织中抑癌基

因的异常甲基化以及与老化过程相关的甲基化可能是由于这种保护机制的减弱造成的[451.上述推测的

保护机制示意图见图2.

甲基化中心

甲基化中心

^缸重复序列嚣翥襞鬻CpG岛焉裹茎鬻Alu重复序列

录因了结合莅点

A重复序列

0不甲基化CpG双核苷酸

Sketchofthehypothetical

甲基化CpG双核苷酸

resistanttoDNAmethylation

Fig.2

mechanismwhyCpGislands

are

图2

CpG岛不易被甲基化的机制假说示意图

Bibikova等【191对结肠癌、乳腺癌、肺癌和前列腺癌

DNA甲基化与癌症的关系

DNA甲基化同众多疾病的发生与发展密切相

细胞系以及正常细胞中371个基因中的l536个位点的甲基化状态进行聚类分析,发现了55个可以较好地区分癌细胞和正常细胞以及区分各种癌细胞类型的位点.该方法表明,各种癌症都存在其特异的DNA甲基化生物标记.

关,比如Ⅱ型糖尿病、自身免疫疾病以及各种癌症.特别是癌症,其发生过程中癌细胞基因组整体的欠甲基化和局部区域的超甲基化是其典型特征[461.超甲基化体现在抑癌基因的启动子区被异常甲基化,整体的欠甲基化同重复序列(如转座子)以及癌基因的启动子区的甲基化程度减小、基因组遗传不稳定性的增加密切相关.研究特定癌症中超甲基化基因的工作较多,包括乳腺癌【47.蟠1、结肠癌[22,491、髓细胞性白血病刚、肝癌【511、涎腺腺样囊性癌【521和卵巢癌1531等.其中,Keshet等【49】基于结肠癌的数据发现,结肠癌中超甲基化的基因不仅属于一个特定的功能类型并在染色体上聚集,而且这些基因中还存在着共同的motif,他们推测这类基因可能受到相同转录因子的调节.目前,对于癌细胞和正常细胞中DNA甲基化模式差异性的认识还存在不同观点.Weber等[221对原代纤维细胞、正常结肠黏膜和结肠癌细胞系中6000个CpG岛甲基化模式进行了比较,认为肿瘤细胞中仅有小部分CpG岛的启动子区存在异常甲基化.但是Gebhard等【卯】在髓细胞性白血病中却发现了大量异常超甲基化的基因,并认为癌细胞中的甲基化模式显著不同于正常细胞.以上两种结论的差异是来源于细胞系之问或是所采用的技术平台之间的差异,还有待于对更多癌细胞中的DNA甲基化模式进行分析研究.此外,

DNA甲基化与其他表观遗传学现象之间

的关系

细胞发育过程中,各种表观遗传学现象之间不是孤立存在而是密切联系的.DNA甲基化同组蛋白甲基化共同调控基因表达的现象最早在链孢霉(Neurosporacrassn)中得到证实嗍,进一步的生化研究结果认为,DNA甲基化是受组蛋白甲基化调节的【551.而在哺乳动物中,有研究认为,DNA甲基化是建立和维持其他表观遗传学现象的基础[561,比如DNA甲基化位点可以募集诸如组蛋白去乙酰化酶等具有抑制功能的复合物,同时去除掉该位点附近的组蛋白乙酰化标记[41.也有研究认为,DNA甲基化是受组蛋白修饰调控的,比如有报道称组蛋白修饰耳3K9me能够促进DNA甲基化的进程[571.目前,虽然哺乳动物中存在基因组尺度的DNA甲基化和组蛋白修饰数据,但是还没有研究者针对同一个组织进行两种修饰的系统研究.2008年初,北京生命科学研究所采用覆瓦芯片(TilingArray)技术对水稻第4和lO号染色体中的DNA甲基化和组蛋白甲基化进行了系统研究,发现了DNA甲基化

148

生物化学与嫩物物理进展Prog.Biochem.Biophys.2009;36(2)

纛缰蛋自修馋在基因组不隧位置上存在鼹餐种摆互关系,还进一步分析了它们同染色体结构以及基因表达之间的相关性【58】.如果将类似的高通量技术同时用以检测哺乳动物中DNA甲基化和其他表观遗传因素,燹|J必将鸯疆快我们对于DNA甲基化和其他表观遗健隧素如何共霜调节基陵表达豹理解帮认识.

7结论和展望

作为黉接箨蠲予DNA序麓酶表观遗传修饰,DNA甲基化在基因表达调控中扮演着壤要角色.虽然DNA甲基化是各种表观遗传学现象中最早被人们认识也是研究相对较成熟的现象之一,但是目

前对丁DNA甲基化的枫遴机制静探索还仍然处于比较初级的阶段.随着各种高逶量检测技术的发展和应用,备种正常组织以及癌症组织的DNA甲基化数据将不断涌现,这就给从事牛物信息研究的科学工作者提供了大量研究数据、提出了大量新的研究谋遮。分搴厅剩震这些海楚舱数据无疑需要开发更多更有效的计算方法和工具.利用来自不同样本不同组织的DNA甲基化数据,可以深层次探讨DNA甲基化在人群中的差异性以发组织特异的DNA甲基化模式.虽然保护枫簇觞假说缝够一是程度上解释CpG岛不易被甲摹他的机制,但是该假说是否全面揭示了其真实机理,是否还有其他更多甚争更重要的凼豢参与其中,这螳问题都有待进一步验证。另外,结合其他表观遗传现象对人类基因组进行系统研究也是认识基因表达的必然之路。在医学应用上,寻找和特定疾病相关的DNA甲基化标识,利用这些标识对疾病进行检测,并研制使异常甲基化还缘的药物也是极媳发展前景的方向.

参考文献

oldberg

D,AllisC

D'BernsteinE.Epigeneties:alandscape

takesshape.Cell,2007,128(4):635~638

BirdA

P.CpGislands

as

ganemarkers

inthevertebratenucleus.

Trends

Genet,1987。3:342~3473

Reik

W,

Santos

F,Dean

W.

Mammalianepiganomies:reprogrammingthe

genome

for

development

and

therapy.

Theriogenology,2003,59(1):21~32

Bird

A.DNAmethylationpatternsandepigeneticmemory.Gfnes

Dev,2∞2,16(1):6~2l

Bi砖A≯Wol曩eAP.Methylation-indueedrepression----belts,braces,andchromatin.Cell,1999,鲫(5):45l~454

KimJ,K0llhoffA,Bergnmrm

A,etⅡf.Methylation-sensitivebinding

oftranscription

factorYYl

to

aninsulator

seqhence

withinthe

paternallyexpressedimprinted

gene,Pe93.HumMol

Genet,2003,

12《3):233~2霹5

Bradbury

J.Humanepigenomeprojec卜—1lpandrunning.PLoS

Biot,2003,l(3):E82

EckhardtF,Lcwin

J,Cortese1Lef“.DNAmethylationprofilingof

humanchromosomes6,20

and

22.Nat

Genet,2006,38(12):1378~

13859Ehrlich

M,Gama-SosaMA,Huang

H,et

a1.Amountand

distributionof5一methylcytosineinhumanDNAfromdifferent

types

oftissuesofcells.Nucleic

AcidsRes,t982,10(8):2709.一2721

10

Gardiner-GardenM,FrommerM.CpG

islands

in

vertebrate

genomes。J

MolBiol。1987。196(2):26l~282

ll

fakai

D。JonesP

A.Comprehensive

analysis

of

Ct)G

islands

in

humanchromosomes

21

and

22.ProcNailAcadSci

USA,2002,99

(6):3740~3745

12WangY,Leung

FC。Anevaluation

ofnewcriteriafor

CpOislands

inthe

humangenomeas

gene

markers.Bioinformatics,2004,掬(7l

1170~1177

13

LarsenF,GundersenG,LopezR

et

al。CpG

islands

as

genemarkers

inthe

humangenome,Genomics,1992,13(4):1095

1107

14HansenRS,Stoger&WijmengaC,et矗。Escapefromgene

silencingin

ICFsyndrome:evidencefor

advancedreplicationtime

as

majordeterminant.HumMolGenet,2000,9(18):2575~2587

l5

YamadaY,WatanabeH,MiuraF,et02.A

comprehensive

analysis

ofallelic

methylation

statusof

CpG

islands

on

human

chromosome

2lq.GenomeRes,2004,14(2):247-一266

16

HanahanD,WeinbergR

A.豫hallmarks

of

e踊e既Cell,2000。

too(D:57~70

17

RakyanV

KHiIdmannT,Novik

eta1.DNA

methylation

profilingofthehuman

majorhistoeompatibilitycomplex:a

pilot

studyf斫the

humanepigenomeproject.PLoSBiol,2004,2(12):

0405

18CokusSj,FengS,ZhangX,et蠢。Shotgunbisulphite

sequencingof

the

Arabidopsisgenome

revealsDNAmethylationpatterning.

Natm'e,2008,452(7184):215~219

19

Bibikova

M,Lin

Z,ZhouL,et以.High-throughput

DNAmethylationprofilingusing

universalbeadarrays.Genome

Res,

2006,l联3):383~39320

ZhangD,WangY,BaiY’et积Anovelmethod

to

quantifylocal

CpG

methylationdensitybyregionalmethylationelongation

assay

on

mieroarray.BMC

Genomics,2008,9:5921RollinsR

A,Haghighi

F,Edwards

R,et越.Large-scalestructureof

genomicmethylationpattems。GenomeRes,2006,l联2):15了~163

22

WeberM,Davies

J,Wittig玟et

a1.Chromosome-wideand

promoter-specific

analyses

identify

sites

of

differential

DNA

methylationinnormal

andtransformedhumancells.NatGenet,

2005,37(8):853~862

23

Schumaeher丸Kapranov

P,Karainslcy五et

a1.Mieroarray-basedDNA

methylationprofiling:technologyandapplications。Nucleic

AcidsRes,2006,34(2):528~54224

WeberM,HellmaunI,StadlerM

B,et

a1.Distribution,silencing

potentialandevolutionaryimpactofpromoterDNA

methylation

in

thehmmn

genome.NatGenet,2007,39(4):457~466

2009;36(动

凡时财等:DNA甲基化的生物信息学研究进展 149

25

CarrI

M,Valleley

M,CordarySF,etⅡf.Sequ∞ceanalysisand

editingfor

bisulphitegenomicsequencingprojects.NucleicAcids

Res,2007,.aS(10):e79

26

Grunau

C,Renault

E,Rosenthal

A,et

d.MemDB—a

public

databasefor

DNA

methylationdata.Nucleic

Acids

Res,2001,29(1):

270~274

27

He)(,ChangS,ZhangJ,et

a1.MethyCancer:thedatabaseofhuman

DNA

methylationandcancer.NucleicAcidsRes,2008,36

(Databaseissue):D836~841

28

Ongenaert

M,VanNesteL'DeMeyer

T,et

a1.PubMeth:acancer

methylationdatabasecombining

text-miningandexpertannotation.

NucleicAcidsRes,2008,36(Databaseissue):D842~846

29

Lauss

M,VisneI,WeinhaenselA'eta1.MethCallcerDB——

aberrantDNAmethylationinhumancancer.Br

Cancer,2008,98

(4):816~817

30

Bhasin

M,ZhangH,Reinhorz

EL'et

a1.Prediction

of

methylated

CpC-sin

DNA

sequences

using

supportvectormachine.FEBS

Lett。2005,579(20):4302~4308

3l

AmoreiraC。Hindermann

W,GrunauC.An

impmvedversion

oftheDNA

methylation

database(MethDB).NucleicAcids

Res,2003,31

(1):75~77

32

Das

1LDimitrovaN,Xuan

Z,et

df.Computationalprediction

ofmethylationstatusinhumangenomicsequences.Proc

Natl

AcadSciUSA,2006,103(28):10713~10716

33

Fang

F,FanS,ZhangX

et

a1.Predictingmethylationstatus

ofCpG

islands

in

the

humanbrain.Bioinformatics,2006,22(18):2204~220934

FeltusF

A,LeeE

CostelloJ

F,et以.PredictingaberrantCpGisland

methylation.Proc

Natl

Acad

Sci

USA,2003,100(21):

12253~12258

35

BockC,Paulsen

M,Tierling

S,et

cd.CpG

islandmethylationin

human

lymphocytes

is

highly

correlated、】lrith

DNA

sequence.repeats,andpredictedDNA

structure.PLoS

Genct,2006,2(3):e26

36

Bock

C,Walter

J,PaulsenM,etdf.CpGislandmapping

by

epigenome

prediction.PLoSComputBiol,2007,3(6):el

10

37

BarskiA,CuddapahS,Cuil(,eta1.High-resolutionprofilingof

histone

methylationsinthe

human

genome.Cell,2007,129(4):823~837

38

FanS,ZhangMQ,Zhang

X.Histone

methylationmarks

play

important

rolesin

predictingthemethylationstatus

ofCpGislands.BiochemBiophys

Res

Commtm,2008,374(3):559~564

39

Brandeis

M,Frank

D,KeshetI,et

a1.Spl

elements

protect

CpG

islandfrom

de

novo

methylation.Nature,1994,371(6496):435~

43840

ButcherDT,Mancini—DiNardoDN,Archer

TIC.et以.DNA

binding

sites

for

putative

methylationboundaries

inthe

unmethylatedregi叫

oftheBRCAlpromoter.hatJ

Cancer,2004,111(5):669~678

4t

Turker

S.

皿eestablishmentandmaintenance

of

DNA

methylationpatternsinmousesomatic

cells.Semin

CancerBiol,

1999,9(5):329~337

42

TurkerM

S.Gene

silencing

in

mammalian

cells

andthe

spreadofDNA

methylation.Oncogene,2002,21(35):5388~5393

43

MummaneniP,YatesP,SimpsonJ,et

01.Theprimaryfunction

ofa

redundant

Spl

binding

siteinthemouse

aprtgene

promoteris

to

block

epigenetic

geneinactivation.NucleicAcids

Res,1

998,26(22):

5163~5169

44

Fan

S,FangF,Zhang

X,eta1.Putativezincfinger

proteinbinding

sites

are

over-represented

inthe

boundaries

of

methylation-resistant

CpG

islandsinthehumangenome.PLoSONE,2007,2(11):el184

45

Issa

P.Aging,DNA

methylationaadcancer.Crit

Rev

Oncol

Hematol,1999,32(1):31~43

46JonesP

ABaylin

SB.Thefundamental

roleofepigenetic

eventsin

cancer.Nat

Rev

Genet,2002,3(6):415~428

47

Ordway

M,BudimanMA,Korshunova

Y,et

a1.Identification

of

novelhigh—frequencyDNAmethylation

changes

inbreast

cancel'.

PLoS

ONE,2007,2(12):e1314

48

Piotrowski

A,BenetldewiczM,Menzel

U,et

a1.Micmarray-based

survey

of

CpG

islandsidentifies

concurrent

hyper-and

hypomethylationpatternsintissuesderivedfrompatients

with

breast

cancer.GenesChromosomesCancer,2006,45(7):656~667

49

KeshctI,SchlesingerY,FarkashS,et01.Evidence

forallinstructive

mechanismofde/“gffomcthylation

in

cancer

cells.Nat

Genct,2006,

38(2):149~153

50

GebhardC,SchwarzfischerL,PhamT

H,eta1.Ganome-wide

profilingofCpGmethylationidentifiesnovel

targetsof

aberrant

hypermethylationinmyeloid

leukemia.CancerRes,2006,66(I∞:

6118~6128

5l

Yu

J,ZhangHY,MaZZ,et以Methylation

profilingoftwenty

four

genesandtheconcordantmethylationbehavioursofnineteen

genes

that

maycontributetohepatocellularcarcinogenesis.CellRes,

2003,13(5):319~333

52

ZhangC

Y,ManL,Li

L,et以.Promotermethylationas

common

mechanismforinactivating

E-cadherinin

human

salivary

gland

adenoid

cystic

carcinoma.Cancer,2007,110(1):87~95

53

Yang

J,“u

W,Wang

Y,et

a1.DifferentialDNA

methylation

profiles

in

gynecologicalcancer¥andcorrelationwithclinico—

pathologicaldata.BMCCancer,2006.6:212

54

TamaruH,Selker

EU.A

histone

H3

mcthyltransferaso

controls

DNAmethylationin

Neurospora

crclssa.Nature,2001,414(6861):

277~283

55JacksonJ

P,LindrothA

M,CaoX,et以.Control

of

CpNpG

DNA

methylationbythe

KRYPTONITE

histone

H3

methyltransferase.

Nature,2002,416(6880):556~560

56

Jaenisch

R,BirdA.Epigenetic

regulationofgeneexpression:how

the

genome

integrates

intrinsic

andenvironmentalsignals.Nat

Genet,2003,33(Suppl):245~254

57

LelmertzB,UedaY,Denjck

AA,et

a1.Suv39h-mediatedhistone

H3

lysine

methylationdirectsDNAmethylationto

major

satellite

repeats

at

pericentrichcterochromatin.CurtBiol,2003,13(14):

1192~120058“)('WangX

He

et

a1.High-resolutionmappingofepigenetic

modifications

oftherice

genomeancovcrsinterplay

betweerlDNA

methylation,histonemethylation,andgeneexpression.Plant

Cell,

2008,20(2):259~276

150 生物化学与生物物理进展Prog.Biochem.Biophys.

2009;36(2)

ProgressofBioinformaticsStudyinDNA

FANShi—Cail一。ZHANGXue—Gon91∥

CMOEKeylaboratoryofBioinformaticsandBioinformatics

4School

Division,TNLIS?YDepartment

Methylation。

ofAutomation,TsinghuaE阮西emimBeijin9100084,China;

ofChina,Chengdu610054,China)

ofAutomation

Engineering,University

ofElectronicScienceandTechnology

Abstract

DNAmethylationis

all

importantepigeneticsystem。Itplaysmanycrucialrolesinthegeneregulation,

detectiontechniques,thebioinformaticsstudyhasbeen

an

Withthedevelopmentofthehigh-throughput

topicinthe

activehot

researchofDNAmethylation.Themajorachievementsandprogress

are

on

thepredictionofDNADNAmethylation,the

methylationstatus,themechanismthatthemajorityofCpGislands

resistantto

relationshipbetweenDNAmethylationandotherepigenetics,aswellastheassociationbetween

aberrant

DNA

methylationandthetumorigenesiswerereviewedinthisarticle。

Keywords

DNAmethylation,bioinformaticsstudy,CpGisland,prediction,mechanism,epigeneties

DoI:10.3724/SP.J.1206。2008.00426

*Thisworkwassupportedbygrants

from

TheNationalNaturalScienceFoundationof

China(30625012,60721003),TheNational

BasicResearch

ProgramofChina(2004CB518605)andTheHi-techResearchandDevelopmentProgramofChina(2006AA022325).

+‘Corresponding

author.

Tel:86。10-62794919.E-mail:zhangxg@tsinghua。edu。辨

Received:June

13,2008

Accepted:August18,2008

DNA甲基化的生物信息学研究进展

作者:作者单位:

凡时财, 张学工, FAN Shi-Cai, ZHANG Xue-Gong

凡时财,FAN Shi-Cai(生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084;电子科技大学自动化工程学院,成都,610054), 张学工,ZHANG Xue-Gong(生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084)

生物化学与生物物理进展

PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS2009,36(2)0次

刊名:英文刊名:年,卷(期):引用次数:

参考文献(58条)

1.Goldberg A D.Allis C D.Bernstein E Epigenetics:a landscape takes shape 2007(4)2.Bird A P CpG islands as gene markers in the vertebrate nucleus 1987

3.Reik W.Santos F.Dean W Mammalian epigenomics:reprogramming the genome for development and therapy2003(1)

4.Bird A DNA methylation patterns and epigenetic memory 2002(1)

5.Bird A P.Wolffe A P Methylation-indueed repression--belts,braces,and ehromatin 1999(5)6.Kim J.Kollhoff A.Bergmann A Methylation-sensitive binding of transcription factor YY1 to aninsulator sequence within the paternally expressed imprinted gene,Peg3 2003(3)7.Bradbury J Human epigenome project--up and running 2003(3)

8.Eckhardt F.Lewin J.Cortese R DNA methylation profiling of human chromosomes 6,20 and 22 2006(12)9.Ehrlich M.Gama-Sosa M A.Huang L H Amount and distribution of 5-methylcytosine in human DNA fromdifferent types of tissues of cells 1982(8)

10.Gardiner-Garden M.Frommer M CpG islands in vertebrate genomes 1987(2)

11.Takai D.Jones P A Comprehensive analysis of CpG islands in human chromosomes 21 and 22 2002(6)12.Wang Y.Leung F C An evaluation of new criteria for CpG islands in the human genome as genemarkers 2004(7)

rsen F.Gundersen G.Lopez R CpG islands as gene markers in the human genome 1992(4)

14.Hansen R S.Stoger R.Wijmenga C Escape from gene silencing in ICF syndrome:evidence for advancedreplication time as a major determinant 2000(18)

15.Yamada Y.Watanabe H.Miura F A comprehensive analysis of allelic methylation status of CpG islandson human chromosome 21q 2004(2)

16.Hanahan D.Weinberg R A The hallmarks of cancer 2000(1)

17.Rakyan V K.Hildmann T.Novik K L DNA methylation profiling of the human major histocompatibilitycomplex:a pilot study for the human epigenome project 2004(12)

18.Cokus S J.Feng S.Zhang X Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNAmethylation patterning 2008(7184)

19.Bibikova M.Lin Z.Zhou L High-throughput DNA methylation profiling using universal bead arrays2006(3)

20.Zhang D.Wang Y.Bai Y A novel method to quantify local CpG mcthylation density by regional

methylation elongation assay on mieroarray 2008

21.Rollins R A.Haghighi F.Edwards J R Large-scale structure of genomic methylation patterns 2006(2)22.Weber M.Davies J J.Wittig D Chromosome-wide and promoter-specific analyses identify sites ofdifferential DNA methylation in normal and transformed human ceils 2005(8)

23.Schumacher A.Kapranov P.Kaminsky Z Mieroarray-based DNA methylation profiling:technology andapplications 2006(2)

24.Weber M.Hellmann I.Stadler M B Distribution,silencing potential and evolutionary impact ofpromoter DNA methylation in the human genome 2007(4)

25.Cart I M.Valleley E M.Cordery S F Sequence analysis and editing for bisulphite genomic sequencingprojects 2007(10)

26.Gnmau C.Renault E.Rosenthal A MethDB--a public database for DNA methylation data 2001(1)27.He X.Chang S.Zhang J MethyCancer:the database of human DNA methylation and cancer 2008(Databaseissue)

28.Ongenaert M.Van Neste L.De Meyer T PubMeth:a cancer methylation database combining text-miningand expert annotation 2008(Database issue)

uss M.Visne I.Weinhaeusel A McthCancerDB--aberrant DNA methylation in human cancer 2008(4)30.Bhasin M.Zhang H.Reinherz E L Prediction of methylated CpGs in DNA sequences using a supportvector machine 2005(20)

31.Amoreira C.Hindermann W.Gnman C An improved version of the DNA methylation database (MethDB)2003(1)

32.Das R.Dimitrova N.Xuan Z Computational prediction of methylation status in human genomicsequences 2006(28)

33.Fang F.Fan S.Zhang X Predicting methylation status of CpG islands in the human brain 2006(18)34.Feltns F A.Lee E K.Costello J F Predicting aberrant CpG island methylation 2003(21)

35.Bock C.Paulsen M.Tierling S CpG island methylation in human lymphocytes is highly correlated withDNA sequence,repeats,and predicted DNA structure 2006(3)

36.Buck C.Walter J.Paulsen M CpG island mapping by epigenome prediction 2007(6)

37.Barski A.Cuddapah S.Cui K High-resolution profiling of histone methylations in the human genome2007(4)

38.Fan S.Zhang M Q.Zhang X Histone methylation marks play important roles in predicting themethylation status of CpG islands 2008(3)

39.Brandeis M.Frank D.Keshet I Spl elements protect a CpG island from de novo methylation 1994(6496)40.Butcher DT.Mancini-DiNardo DN.Archer TK DNA binding sites for putative methylation boundaries inthe unmethylated region of the BRCA1 promoter 2004(5)

41.Turker M S The establishment and maintenance of DNA methylation patterns in mouse somatic cells1999(5)

42.Turker M S Gene silencing in mammalian cells and the spread of DNA methylation 2002(35)

aprt gene promoter is to block epigenetic gene inactivation 1998(22)

44.Fan S.Fang F.Zhang X Putative zinc finger protein binding sites are over-represented in theboundaries of methylation-resistant CpG islands in the human genome 2007(11)45.Issa J P Aging,DNA methylation and cancer 1999(1)

46.Jones P A.Baylin S B The fundamental role ofepigenefic events in cancer 2002(6)

47.Ordway J M.Budiman M A.Korshunova Y Identification of novel high-frequency DNA methylationchanges in breast cancer 2007(12)

48.Piotrowski A.Benetkiewicz M.Menzel U Microarray-hased survey of CpG islands identifies concurrenthyper-andhypomethylation patterns in tissues derived from patients with breast cancer 2006(7)49.Keshet I.Schlesinger Y.Farkash S Evidence for an instructive mechanism of de novo methylation incancer cells 2006(2)

50.Gebhard C.Schwarzfischer L.Pham T H Genome-wide profiling of CpG methylation identifies noveltargets of aberrant hypermethylation in myeloid leukemia 2006(12)

51.JIAN YU.HONG YU ZHANG.ZHEN ZHONG MA.WEI Lu.YI FEI WANG.JINGDE ZHU Methylation profiling of twentyfour genes and the concordant methylation behaviours of nineteen genes that may contribute tohepatocellular carcinogenesis[期刊论文]-细胞研究(英文版) 2003(5)

52.Zhang C Y.Man L.Li L Promoter methylation as a common mechanism for inactivating E-cadherin inhuman salivary gland adenoid cystic carcinoma 2007(1)

53.Yang H J.Liu V W.Wang Y Differential DNA methylation profiles in gynecological cancers andcorrelation with clinicopathological data 2006

54.Tamaru H.Selker E U A histone H3 methyltransferase controls DNA methylation in Neurospora crassa2001(6861)

55.Jackson J P.Lindroth A M.Cao X Control of CpNpG DNA methylation by the KRYPTONITE histone H3methyltransferase 2002(6880)

56.Jaenisch R.Bird A Epigenetic regulation of gene expression:how the genome integrates intrinsicand environmental signals 2003(Suppl)

57.Lehnertz B.Ueda Y.Derijck A A Suv39h-mediated histone H3 lysine 9 methylation directs DNAmethylation to major satellite repeats at pericentric heterochromatin 2003(14)

58.Li X.Wang X.He K High-resolution mapping of epigenetic modifications of the rice genome uncoversinterplay between DNA methylation,histone methylation,and gene expression 2008(2)

相似文献(1条)

1.学位论文 何坤 高等植物光形态建成过程中基因调控的生物信息学分析——转录调控及表观遗传调控分析 2006

转录调控(tanscriptionalregulation)和表观遗传调控(epigeneticregulation)是真核生物基因调控的两种主要途径。本论文的工作内容为:利用生物信息学手段分析生物实验室提供的数据分别对上述两种调控机制进行研究。 利用结构域搜索并结合文献检索,预测了拟南芥基因组共1826个转录因子,为拟南芥转录因子的重大国际合作项目提供了基因克隆的基本信息;同时结合核酸和蛋白质序列、结构以及拟南芥基因组等公共数据库信息,构建了拟南芥转录因子数据库,提供友好方便的使用界面和全面丰富的注释信息。通过对拟南芥和水稻MYB家族361个转录因子进行深入的系统发育分析,为MYB家族成员的克隆以及进化和功能分化提供了重要线索。 由于覆瓦式芯片(tilingarray)结果目前还没有可以直接使用的分析软件,本文基于统计学软件R和Perl语言,开发了适用于覆瓦式芯片数据的软件包,并用该软件成功对以下两类芯片数据进行了分析:第一类是基于拟南芥全基因组覆瓦式芯片进行免疫共沉淀芯片(ChIP-chip)实验来确定拟南芥幼苗bZIP(basicleucinezipper,碱性亮氨酸拉链)转录因子家族成员HY5光调控下结合位点的数据;第二类是利用覆瓦式芯片技术,分别对拟南芥光照和黑暗状态下6天期幼苗组蛋白H3亚基第9位赖氨酸双甲基化(H3K9Me2)、乙酰化(H3K9Ac)修饰,水稻悬浮培养细胞以及光照和黑暗状态下幼苗组蛋白H3亚基第4位赖氨酸上双甲基化(H3K4Me2)、三甲基化(H3K4Me3)和DNA甲基化修饰进行研究的数据。该软件包具有良好的平台移植性,且提供可调参数,可用于其它各种物种全基因组覆瓦式芯片结果。 对第一类数据分析发现,HY5的结合位点

全基因组水平(6.7﹪)。靶基因多定位于细胞核和细胞壁,与能量储存、糖代谢、脂肪酸氧化、小分子转运、光合作用以及细胞壁合成相关。与已有基因表达数据相比,发现HY5主要结合在早期光诱导基因上,且其结合在光照早期主要诱导转录因子表达,光照晚期则主要抑制转录因子表达。已知HY5与AtMYB12均能促进查尔酮合酶表达,分析表明HY5在AtMYB12启动子区也具有很强的结合信号,推测HY5可能存在一种尚未发现的调控模式,即在光形态建成早期激活某些转录因子,然后与它们一起参与下游基因的表达调控。该发现为下一步生物学实验研究提供了方向。 对第二类数据分析发现,拟南芥中H3K9Me2修饰主要集中在异染色质区和转座子上,与基因表达水平无相关性;H3K9Ac修饰则主要发生在常染色质区基因5'端附近区域,与基因表达水平成正相关。黑暗条件下转座子中H3K9Me2修饰水平降低、H3K9Ac修饰水平升高,表明其活性可能较光照条件下高,该结果已经得到生物学实验初步验证。水稻异染色质区DNA甲基化修饰水平高于常染色质区,且修饰水平与基因表达水平成负相关;常染色质中基因5'端附近区域H3K4Me2和H3K4Me3修饰程度较高,并均与基因表达水平成正相关,但与H3K4Me2相比,H3K4Me3更加集中在基因5'端区域,与基因表达水平相关性也更大。组蛋白修饰与DNA甲基化不仅具有组织特异性、在光暗不同条件下也存在差异。 对上述两类数据的分析为进一步探索光形态建成中重要转录因子HY5对下游基因的调控机制、揭示光形态建成中表观遗传调节所起的作用提供了重要信息。同时通过对这两种数据的综合分析,发现一些仅有转录因子结合或5'端发生H3K9Ac修饰并不能激活基因表达的实例。表明同时利用转录调控和表观遗传调控两种结果进行生物信息学研究,可进一步探索高等植物基因表达调控机制。

本文链接:/Periodical_swhx200902002.aspx

下载时间:2009年10月7日

本文来源:https://www.bwwdw.com/article/ttb1.html

Top