DNA甲基化的生物信息学研究进展
更新时间:2023-06-12 08:23:01 阅读量: 实用文档 文档下载
。。,?。j
i
j。二j一.j。一|。ReviewsandMonographs
PIll,:豢蕊嚣乞…记s
WWW.pibb.ac.cn
DNA甲基化的生物信息学研究进展
凡时财1,2)张学工1)”
(1)生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084;
≈电子科技大学自动化工程学院,成都610054)
摘要作为重要的表观遗传学现象之一,DNA甲基化对基因的表达发挥重要的调控功能.随着高通量检测技术的不断发展,对DNA甲基化的生物信息学研究也成为DNA甲基化研究中的一个非常活跃的热点.对生物信息学在DNA甲基化状态的预测、CpG岛不易被甲基化的机制研究、探索DNA甲基化同其他表观遗传学现象之间的关系以及DNA异常甲基化同癌症的发生和发展之间的关系等方面的研究进展进行综述.
关键词DNA甲基化,生物信息学研究,CpG岛,预测,机制,表观遗传学学科分类号Q3,Q6,Q7
IN)I:10.3724/SP.J.1206.2008.00426
在多细胞生物的发育过程中,细胞如何分化很大程度上取决于其内部的基因表达模式,而基因的表达模式不仅仅依赖于细胞内转录因子的作用,还同表观遗传学因素密切相关.表观遗传学是指在不改变DNA序列的条件下所发生的可遗传基因表达的变化【l】.表观遗传学主要包括DNA甲基化、组蛋白修饰和染色质结构.脊椎动物中,DNA甲基化表现为在DNA甲基化转移酶(DNAmethyltransferase,DNMT)作用下,甲基基团合成到5,.CpG一3’中胞嘧啶的第五位碳原子上【21.DNA甲基化参与了细胞的多种生理活动,比如基因的时空特异性表达、X染色体失活、衰老以及癌症的发生【3一.甲基化的CpG双核苷酸通过募集转录抑制因子嘲或者阻碍转录激活因子的结合抑制基因的表达[61.由于DNA甲基化在基因调控中的重要功能,以Sanger研究所为代表的人类表观基因组联盟,于2000年10月发起了人类表观基因组计划(human
epigenome
根据Gardiner—Garden等【lo】的定义,CpG岛是一段长度不小于200bp、GC含量不小于50%、CpG含量与期望含量之比不小于0.6的区域.由于该定义将一些重复片段也包含其中,Takai和Jonestlq将CpG岛重新定义为长度不小于500bp、GC含量不小于55%、CpG含量与期望含量之比不小于0.65的区域.据统计,多于50%的基因的启动子区含有CpG岛【1213】.在早期的认识中,CpG岛都是非甲基化的[41,但是随着研究的不断深入,人们发现在印迹基因[31、失活的X染色体【t41甚至是正常的体细胞中都存在甲基化的CpG岛【151.部分CpG岛的异常甲基化常常伴随着癌症等疾病的发生【阍.
近年来,随着高通量的DNA甲基化检测技术的出现,DNA甲基化的生物信息学研究得到了很大的发展.一系列具有较好精度的DNA甲基化预测工具不仅成为实验检测技术的补充,也反映了DNA甲基化本身是有规律可寻的,这启发了研究者们对于DNA甲基化内在机制的探索.DNA甲基化具有序列偏好性的观点得到进一步证实,CpG
国家自然科学基金资助项目(30625012,60721003),国家重点基础研究发展计划项日(973)(2004CB518605)和国家高技术研究发展计划项目(863X2006AA022325).¨通讯联系人.
Tel:010—62794919.E mail:zhangxg@tsingh峪.edu.Gn收稿日期:2008-06.13,接受日期:2008-08.18
project,imP),试图获得人类多个组织
中的DNA甲基化模式[71.目前该计划已经完成了来自12个组织的第6号、20号和22号染色体的检测工作嘲.
人类基因组中,70%"-'80%的CpG双核苷酸处于DNA甲基化状态嗍.非甲基化的CpG不是均匀分布,f面是呈现局部聚集倾向,形成一些GC含量较高、CpG双核苷酸相对聚集的区域,即CpG岛[41.
144 生物化学与生物物理进展Prog.Biochem.Biophys.2009;36(2)
岛边界序列通过绐合特定转录因子使CpG岛不易被甲基化的机制假说也有了更多的证据.同时,研究疾病特别是癌症中DNA甲基化静特点和撬律、发现与特定癌症楣关的甲摹纯生物标记(biomarker),成为DNA甲基化研究中新的热点问题.
本文综述了目前关于人的DNA甲基化研究中生物信息学研究酶竣新进展。首先介绍了DNA甲基化的高通量检测方法和相关数据库,然后重点综述了DNA甲基化的预测研究和CpG岛不易被甲基化的桃制探索,紧接着麓篓阐述了DNA瞪基化同癌瘫以及其他表观遗传学现象之闻的关系,最后一部分是作者基于DNA甲基化的T作体会对于今后研究方向的展望。
1
括三大类:a.亚硫酸氧钠(sodiumbisulfite)法,亚硫酸氢钠把非甲基化的胞嘧啶转化为尿嘧啶,而保持甲基化的胞噻睫不变,以此实现两类的分离,此方法因其准确率商碡i被誉为裣测DNA甲基亿的“金方法”;b.限制性内切酶(restrictionenzyme)法,限制性内切酶町以切割J#甲基化的位点,而甲基化以磊静识溺位点将被攥留;e.剩用特定抗体砖甲基化的胞嘧啶进行免疫沉淀反应(immunoprecipitation).这三种方法的丰要特点见表1.前期处理实现了甲基化和棼甲基化的胞豫啶分离以后,可以对分离出的甲基化DNA片+段进行基冈芯片杂交或者大规模深度测序,实现高通精的检测(图1).以上两个步骤的不同组合产牛了多种赢运量的蜜验检溺技术,磐耍硫酸氯镪+溺穿黔is]、亚硫睃氰钠+芯片技术(19,201、酶切+芯片技术【2lJ、甲基化抗体十芯片技术俐等.目前很多实验室利用以上技术对不月组织t|t的DNA甲恭化状态进行了检测,具体情况觅表2.
DNA甲基化的高通量实验检测方法
DNA甲基化的检测大体分为两个步骤:a.待
检测榉品的前期处理;b。目标序列的定位釉甲基化状态的量化。待检测样t谲酶前期处理方法上要包
Table1
Thecharacteristicsofdifferent
pretreatmentmethodsindetectiontechniquesforDNAmeth),lation
袭1DNA甲基纯实验检测鼓零各静羲期懿遴方法兹特纛
Fig.1
Sketchofthehigh—throughputdetectiontechniquesforDNAmethylation
图1高通量检测DNA甲基化技术的示意图
2009;36(2)
凡时财等:DNA甲基化的生物信息学研究进展 145
Table2
ThepublishedresultsofhumanDNAmethylationwithhigh-throughputdetectiontechniques
表2已发表的大规模检测人的DNA甲基化状态的研究结果
相关的一些DNA甲基化模式.MethDB和
2
DNA甲基化的相关数据库
数据库的构建是生物信息学研究的重要内容.
MethyCancer还提供了DNA甲基化的可视化工具.通过对现有的分散的DNA甲基化数据的整理分析,这些数据库提供了内容独立、记录相对完整、格式比较统一的数据资源,为后期的深入挖掘提供了极大便利.随着大规模深度测序技术在DNA甲基化检测中的应用,建立相应数据库用以存储和分析相关数据,开发类似于CpGViewert25】的可视化分析工具将具有重要价值.
目前发表的较大规模的DNA甲基化相关数据库有4个:MethDB、MethyCancer、PubMeth和MethCancerDB,数据情况见表3.其中,MethDB是最早整合文献中DNA甲基化数据的数据库,也是涵盖物种和组织最多的数据库,其余3个数据库都采用了文献挖掘的方法,收集了文献中已报道的与特定癌症
Table3
Databasesrelated
toDNA
methylation
表3DNA甲基化相关的数据库
测、对CpG岛片段以及CpG岛的甲基化状态预测.
3
DNA甲基化的预测研究
实验手段检测DNA甲基化状态的方法虽然比
Methylator(http://bio.dfci.harvard.edu/Methylator/index.html)是目前唯一的预测单个CpG双核苷酸甲基化状态的工具pq.该工具基于MethDB数据库∞3l】中人的2839个DNA甲基化模式数据,以CpG位点周围39bp的序列模式为特征,采用支持向量机的方法得到了87%的正确率.该研究还表明,基因的非翻译区的甲基化程度要高于外显子和内含子.由于单个CpG双核苷酸的甲基化状态在细胞生长过程中是动态变化的【4l,因此Methylator的应用相对有限.
2006年,Rollins等【2l】发表了人脑组织全基因
较可靠,但是其对于人力财力的需求以及检测技术方面的缺陷,使得目前大规模的DNA甲基化的实验数据还比较有限.研究计算预测DNA序列甲基化状态的方法显得极为重要.另一方面,作为实验检测技术的补充,预测算法能够挖掘出数据中隐藏的重要特征,为人们进一步认识DNA甲基化机理提供重要依据和研究思路.目前发表的对DNA甲基化模式进行预测的方法中,按照预测目标的类型可以分为,对单个CpG双核苷酸的甲基化状态预
146
生物化学与生物物理进展Prog.Biochem.Biophys.
组范围的甲基化数据.基丁其得到的1948个甲基化区域和2386个非甲基化区域,产生了两个预测
CpG岛片段甲基化状态的工具—_HDMFinder【32】和
MethCGI‘刭.HDMFinder(http://rulai.cshl.edu/HDMFinder/
methylation.htm)禾0用包括A缸在内的17个序列特征能够对长度为800bp的CpG岛片段以及800
bp
的普通DNA序列的甲基化状况进行准确预测,并且还对22个常染色体中的甲基化模式进行了预测.我们开发的MethCGI则专门针对CpG岛片段(包括200
bp、300
bp以及400bp)进行了预测,正
确率达到了84%,提供了在线预测服务(http://bioinfo.a11.tsinghua.edu.cn/MethCGI/MethCGI.html).通过分析特定转录凶子结合位点在甲基化和非甲基化的CpG岛片段中的分布情况,我们得到了4个在两类中差异最大的转录因子结合位点,这些结合位点可能为下一步研究DNA甲基化的内在机理提供重要依据.另外,MethCGI对MethDB数据库中包含的来自多个组织的甲基化数据也得到了较好的预测精度,表明CpG岛片段的甲基化模式并没有很强的组织特异性.
CpG岛的甲基化状态同基因表达的模式密切相关,因此对于CpG岛甲基化状态的预测一直是人们关注的重点.2003年,Feltus等[341通过在细胞系中加入过量DNA甲摹化转移酶(DNMTl),发现大部分的CpG岛仍然保持非甲基化状态,同时有部分CpG岛警现超甲基化,采用序列特征对两类的分类正确率可以达到82%.在特征选择的过程中,他们发现两类CpG岛在长度、GC含量、CpG比例以及和启动子的关系上没有显著性差异.但是其后对来自体内的DNA甲基化数据的研究表明,甲基化和非甲基化的CpG岛在长度、GC含量以及CpG比例上存在显著差异【33一.Bock等基于人外周血白细胞中第22号染色体得到的132个CpG岛的甲基化状态数据【26】,先后得到了两个预测CpG岛甲基化状态的分类器.第一个采用了序列模式,特定的重复序列以及特殊的DNA结构三大类特征[351,第二个增加了预测的组蛋白修饰状态和染色质结构特征[361,并提供了在线预测工具Epigraph(http://epigraph.mpi-inf.mpg.de/WebGRAPH/).由于组蛋白修饰以及染色质结构分布是否存在DNA序列的偏好性仍是一个有争议的问题,我们通过增加Barski等鲫实验获得的基因组尺度的组蛋白甲基化数据,对CpG岛的甲基化状态进行了预测冈.该预测模型得到了更高分类正确率的同时,还发现了
4种显著影响CpG岛甲基化的组蛋白修饰特征(H3K4mel、H3K4me2、H3K4me3以及
H3K9mel),一定程度上量化了部分组蛋白甲基化
同CpG岛甲基化之间的关系.
4
CpG岛不易被甲基化的机制探索
虽然人类基因组上有的CpG岛处于甲基化状
态,但是大部分CpG岛是不易被甲基化的,这同基因组上约80%的CpG双核苷酸处于甲基化状态的现象形成鲜明对比.该现象促使人们思考为什么CpG岛不易被甲基化.早在1994年Brandeis等【39】就发现,Spl的结合位点在人胚胎干细胞的APRT基因中能够保护CpG岛在重新甲基化的过程中不被甲基化,后来对人乳腺组织中BRCA.f基冈的研究结果同样表明,启动子区Spl和CTCF结合位点突变与否将决定该区域CpG岛的甲基化状态[401.Turker等[41,421以Spl在小鼠4pn基冈中的功能对小鼠体细胞中DNA甲基化模式的形成提出了一个动态平衡假说,认为在DNA的重新甲基化过程中,首先是B1之类的重复序列被甲基化,这些序列被称为甲基化中心,然后甲基化会从中心往外延伸,spl结合位点通过|一Spl的结合能够阻碍甲基化向CpG岛区的蔓延,从而保护CpG岛不被甲基化.后来的研究又发现,在Spl缺失的情况下Aprt基因仍然有表达,即CpG岛并没有冈Spl的缺失而超甲基化[431,另一方面,Spl(以及CTCF)的结合位点并非存在于所有不易甲基化的CpG岛附近,这也意味着还应该有其他凶子参与保护机制的形成.
利用人脑组织基因组尺度的CpG岛甲基化数据【2”,我们系统分析了不易甲基化的CpG岛内部以及岛边界序列的序列特征,发现一些具有锌指结构的转录因子(包括spl和CTCF)可能的结合位点在CpG岛的400bp边界序列中显著富集,而且其中80%的结合位点在人、大鼠和小鼠中是显著保守的144].基于以上结果,我们认为,从小鼠AD厅基因得到的关于CpG岛不易被甲基化的保护机制同样存在于人的基因组中M:AlM序列是重新甲基化过程中的甲基化中心【¨】,在甲基化转移酶的作用下,DNA甲基化从Alu序列出发往外延伸,当CpG岛周围富集的转录因子结合位点同具有锌指结构的转录因子结合以后则可以阻止甲基化向CpG岛的蔓延,因此在这种阻止与蔓延的作用达到动态平衡以后,就形成了比较稳定的甲基化模式.当细胞所在的环境发生变化时,这种平衡可能
2009;36(2)
凡时财等:DNA甲基化的生物信息学研究进展 147
会被打破,阻止功能的增强或者侵入能力的提高则可能使DNA甲基化往CpG岛外或者往内移动,从而建立新的平衡.比如,如果某些顺式元件发生突变,则本可以结合并阻碍DNA甲基化蔓延的特定转录因子可能因为结合能力的减弱使其阻碍功能变
弱甚至消失,这种情况下,其附近的CpG岛可能会被甲基化f觋431.因此,发生癌变的组织中抑癌基
因的异常甲基化以及与老化过程相关的甲基化可能是由于这种保护机制的减弱造成的[451.上述推测的
保护机制示意图见图2.
甲基化中心
甲基化中心
^缸重复序列嚣翥襞鬻CpG岛焉裹茎鬻Alu重复序列
岛
录因了结合莅点
A重复序列
0不甲基化CpG双核苷酸
Sketchofthehypothetical
甲基化CpG双核苷酸
resistanttoDNAmethylation
Fig.2
mechanismwhyCpGislands
are
图2
CpG岛不易被甲基化的机制假说示意图
Bibikova等【191对结肠癌、乳腺癌、肺癌和前列腺癌
5
DNA甲基化与癌症的关系
DNA甲基化同众多疾病的发生与发展密切相
细胞系以及正常细胞中371个基因中的l536个位点的甲基化状态进行聚类分析,发现了55个可以较好地区分癌细胞和正常细胞以及区分各种癌细胞类型的位点.该方法表明,各种癌症都存在其特异的DNA甲基化生物标记.
6
关,比如Ⅱ型糖尿病、自身免疫疾病以及各种癌症.特别是癌症,其发生过程中癌细胞基因组整体的欠甲基化和局部区域的超甲基化是其典型特征[461.超甲基化体现在抑癌基因的启动子区被异常甲基化,整体的欠甲基化同重复序列(如转座子)以及癌基因的启动子区的甲基化程度减小、基因组遗传不稳定性的增加密切相关.研究特定癌症中超甲基化基因的工作较多,包括乳腺癌【47.蟠1、结肠癌[22,491、髓细胞性白血病刚、肝癌【511、涎腺腺样囊性癌【521和卵巢癌1531等.其中,Keshet等【49】基于结肠癌的数据发现,结肠癌中超甲基化的基因不仅属于一个特定的功能类型并在染色体上聚集,而且这些基因中还存在着共同的motif,他们推测这类基因可能受到相同转录因子的调节.目前,对于癌细胞和正常细胞中DNA甲基化模式差异性的认识还存在不同观点.Weber等[221对原代纤维细胞、正常结肠黏膜和结肠癌细胞系中6000个CpG岛甲基化模式进行了比较,认为肿瘤细胞中仅有小部分CpG岛的启动子区存在异常甲基化.但是Gebhard等【卯】在髓细胞性白血病中却发现了大量异常超甲基化的基因,并认为癌细胞中的甲基化模式显著不同于正常细胞.以上两种结论的差异是来源于细胞系之问或是所采用的技术平台之间的差异,还有待于对更多癌细胞中的DNA甲基化模式进行分析研究.此外,
DNA甲基化与其他表观遗传学现象之间
的关系
细胞发育过程中,各种表观遗传学现象之间不是孤立存在而是密切联系的.DNA甲基化同组蛋白甲基化共同调控基因表达的现象最早在链孢霉(Neurosporacrassn)中得到证实嗍,进一步的生化研究结果认为,DNA甲基化是受组蛋白甲基化调节的【551.而在哺乳动物中,有研究认为,DNA甲基化是建立和维持其他表观遗传学现象的基础[561,比如DNA甲基化位点可以募集诸如组蛋白去乙酰化酶等具有抑制功能的复合物,同时去除掉该位点附近的组蛋白乙酰化标记[41.也有研究认为,DNA甲基化是受组蛋白修饰调控的,比如有报道称组蛋白修饰耳3K9me能够促进DNA甲基化的进程[571.目前,虽然哺乳动物中存在基因组尺度的DNA甲基化和组蛋白修饰数据,但是还没有研究者针对同一个组织进行两种修饰的系统研究.2008年初,北京生命科学研究所采用覆瓦芯片(TilingArray)技术对水稻第4和lO号染色体中的DNA甲基化和组蛋白甲基化进行了系统研究,发现了DNA甲基化
148
生物化学与嫩物物理进展Prog.Biochem.Biophys.2009;36(2)
纛缰蛋自修馋在基因组不隧位置上存在鼹餐种摆互关系,还进一步分析了它们同染色体结构以及基因表达之间的相关性【58】.如果将类似的高通量技术同时用以检测哺乳动物中DNA甲基化和其他表观遗传因素,燹|J必将鸯疆快我们对于DNA甲基化和其他表观遗健隧素如何共霜调节基陵表达豹理解帮认识.
7结论和展望
作为黉接箨蠲予DNA序麓酶表观遗传修饰,DNA甲基化在基因表达调控中扮演着壤要角色.虽然DNA甲基化是各种表观遗传学现象中最早被人们认识也是研究相对较成熟的现象之一,但是目
前对丁DNA甲基化的枫遴机制静探索还仍然处于比较初级的阶段.随着各种高逶量检测技术的发展和应用,备种正常组织以及癌症组织的DNA甲基化数据将不断涌现,这就给从事牛物信息研究的科学工作者提供了大量研究数据、提出了大量新的研究谋遮。分搴厅剩震这些海楚舱数据无疑需要开发更多更有效的计算方法和工具.利用来自不同样本不同组织的DNA甲基化数据,可以深层次探讨DNA甲基化在人群中的差异性以发组织特异的DNA甲基化模式.虽然保护枫簇觞假说缝够一是程度上解释CpG岛不易被甲摹他的机制,但是该假说是否全面揭示了其真实机理,是否还有其他更多甚争更重要的凼豢参与其中,这螳问题都有待进一步验证。另外,结合其他表观遗传现象对人类基因组进行系统研究也是认识基因表达的必然之路。在医学应用上,寻找和特定疾病相关的DNA甲基化标识,利用这些标识对疾病进行检测,并研制使异常甲基化还缘的药物也是极媳发展前景的方向.
参考文献
l
G
oldberg
A
D,AllisC
D'BernsteinE.Epigeneties:alandscape
takesshape.Cell,2007,128(4):635~638
2
BirdA
P.CpGislands
as
ganemarkers
inthevertebratenucleus.
Trends
Genet,1987。3:342~3473
Reik
W,
Santos
F,Dean
W.
Mammalianepiganomies:reprogrammingthe
genome
for
development
and
therapy.
Theriogenology,2003,59(1):21~32
4
Bird
A.DNAmethylationpatternsandepigeneticmemory.Gfnes
Dev,2∞2,16(1):6~2l
5
Bi砖A≯Wol曩eAP.Methylation-indueedrepression----belts,braces,andchromatin.Cell,1999,鲫(5):45l~454
6
KimJ,K0llhoffA,Bergnmrm
A,etⅡf.Methylation-sensitivebinding
oftranscription
factorYYl
to
aninsulator
seqhence
withinthe
paternallyexpressedimprinted
gene,Pe93.HumMol
Genet,2003,
12《3):233~2霹5
7
Bradbury
J.Humanepigenomeprojec卜—1lpandrunning.PLoS
Biot,2003,l(3):E82
8
EckhardtF,Lcwin
J,Cortese1Lef“.DNAmethylationprofilingof
humanchromosomes6,20
and
22.Nat
Genet,2006,38(12):1378~
13859Ehrlich
M,Gama-SosaMA,Huang
L
H,et
a1.Amountand
distributionof5一methylcytosineinhumanDNAfromdifferent
types
oftissuesofcells.Nucleic
AcidsRes,t982,10(8):2709.一2721
10
Gardiner-GardenM,FrommerM.CpG
islands
in
vertebrate
genomes。J
MolBiol。1987。196(2):26l~282
ll
fakai
D。JonesP
A.Comprehensive
analysis
of
Ct)G
islands
in
humanchromosomes
21
and
22.ProcNailAcadSci
USA,2002,99
(6):3740~3745
12WangY,Leung
FC。Anevaluation
ofnewcriteriafor
CpOislands
inthe
humangenomeas
gene
markers.Bioinformatics,2004,掬(7l
1170~1177
13
LarsenF,GundersenG,LopezR
et
al。CpG
islands
as
genemarkers
inthe
humangenome,Genomics,1992,13(4):1095
1107
14HansenRS,Stoger&WijmengaC,et矗。Escapefromgene
silencingin
ICFsyndrome:evidencefor
advancedreplicationtime
as
a
majordeterminant.HumMolGenet,2000,9(18):2575~2587
l5
YamadaY,WatanabeH,MiuraF,et02.A
comprehensive
analysis
ofallelic
methylation
statusof
CpG
islands
on
human
chromosome
2lq.GenomeRes,2004,14(2):247-一266
16
HanahanD,WeinbergR
A.豫hallmarks
of
e踊e既Cell,2000。
too(D:57~70
17
RakyanV
KHiIdmannT,Novik
K
k
eta1.DNA
methylation
profilingofthehuman
majorhistoeompatibilitycomplex:a
pilot
studyf斫the
humanepigenomeproject.PLoSBiol,2004,2(12):
0405
18CokusSj,FengS,ZhangX,et蠢。Shotgunbisulphite
sequencingof
the
Arabidopsisgenome
revealsDNAmethylationpatterning.
Natm'e,2008,452(7184):215~219
19
Bibikova
M,Lin
Z,ZhouL,et以.High-throughput
DNAmethylationprofilingusing
universalbeadarrays.Genome
Res,
2006,l联3):383~39320
ZhangD,WangY,BaiY’et积Anovelmethod
to
quantifylocal
CpG
methylationdensitybyregionalmethylationelongation
assay
on
mieroarray.BMC
Genomics,2008,9:5921RollinsR
A,Haghighi
F,Edwards
J
R,et越.Large-scalestructureof
genomicmethylationpattems。GenomeRes,2006,l联2):15了~163
22
WeberM,Davies
J
J,Wittig玟et
a1.Chromosome-wideand
promoter-specific
analyses
identify
sites
of
differential
DNA
methylationinnormal
andtransformedhumancells.NatGenet,
2005,37(8):853~862
23
Schumaeher丸Kapranov
P,Karainslcy五et
a1.Mieroarray-basedDNA
methylationprofiling:technologyandapplications。Nucleic
AcidsRes,2006,34(2):528~54224
WeberM,HellmaunI,StadlerM
B,et
a1.Distribution,silencing
potentialandevolutionaryimpactofpromoterDNA
methylation
in
thehmmn
genome.NatGenet,2007,39(4):457~466
2009;36(动
凡时财等:DNA甲基化的生物信息学研究进展 149
25
CarrI
M,Valleley
E
M,CordarySF,etⅡf.Sequ∞ceanalysisand
editingfor
bisulphitegenomicsequencingprojects.NucleicAcids
Res,2007,.aS(10):e79
26
Grunau
C,Renault
E,Rosenthal
A,et
d.MemDB—a
public
databasefor
DNA
methylationdata.Nucleic
Acids
Res,2001,29(1):
270~274
27
He)(,ChangS,ZhangJ,et
a1.MethyCancer:thedatabaseofhuman
DNA
methylationandcancer.NucleicAcidsRes,2008,36
(Databaseissue):D836~841
28
Ongenaert
M,VanNesteL'DeMeyer
T,et
a1.PubMeth:acancer
methylationdatabasecombining
text-miningandexpertannotation.
NucleicAcidsRes,2008,36(Databaseissue):D842~846
29
Lauss
M,VisneI,WeinhaenselA'eta1.MethCallcerDB——
aberrantDNAmethylationinhumancancer.Br
J
Cancer,2008,98
(4):816~817
30
Bhasin
M,ZhangH,Reinhorz
EL'et
a1.Prediction
of
methylated
CpC-sin
DNA
sequences
using
a
supportvectormachine.FEBS
Lett。2005,579(20):4302~4308
3l
AmoreiraC。Hindermann
W,GrunauC.An
impmvedversion
oftheDNA
methylation
database(MethDB).NucleicAcids
Res,2003,31
(1):75~77
32
Das
1LDimitrovaN,Xuan
Z,et
df.Computationalprediction
ofmethylationstatusinhumangenomicsequences.Proc
Natl
AcadSciUSA,2006,103(28):10713~10716
33
Fang
F,FanS,ZhangX
et
a1.Predictingmethylationstatus
ofCpG
islands
in
the
humanbrain.Bioinformatics,2006,22(18):2204~220934
FeltusF
A,LeeE
K
CostelloJ
F,et以.PredictingaberrantCpGisland
methylation.Proc
Natl
Acad
Sci
USA,2003,100(21):
12253~12258
35
BockC,Paulsen
M,Tierling
S,et
cd.CpG
islandmethylationin
human
lymphocytes
is
highly
correlated、】lrith
DNA
sequence.repeats,andpredictedDNA
structure.PLoS
Genct,2006,2(3):e26
36
Bock
C,Walter
J,PaulsenM,etdf.CpGislandmapping
by
epigenome
prediction.PLoSComputBiol,2007,3(6):el
10
37
BarskiA,CuddapahS,Cuil(,eta1.High-resolutionprofilingof
histone
methylationsinthe
human
genome.Cell,2007,129(4):823~837
38
FanS,ZhangMQ,Zhang
X.Histone
methylationmarks
play
important
rolesin
predictingthemethylationstatus
ofCpGislands.BiochemBiophys
Res
Commtm,2008,374(3):559~564
39
Brandeis
M,Frank
D,KeshetI,et
a1.Spl
elements
protect
a
CpG
islandfrom
de
novo
methylation.Nature,1994,371(6496):435~
43840
ButcherDT,Mancini—DiNardoDN,Archer
TIC.et以.DNA
binding
sites
for
putative
methylationboundaries
inthe
unmethylatedregi叫
oftheBRCAlpromoter.hatJ
Cancer,2004,111(5):669~678
4t
Turker
M
S.
皿eestablishmentandmaintenance
of
DNA
methylationpatternsinmousesomatic
cells.Semin
CancerBiol,
1999,9(5):329~337
42
TurkerM
S.Gene
silencing
in
mammalian
cells
andthe
spreadofDNA
methylation.Oncogene,2002,21(35):5388~5393
43
MummaneniP,YatesP,SimpsonJ,et
01.Theprimaryfunction
ofa
redundant
Spl
binding
siteinthemouse
aprtgene
promoteris
to
block
epigenetic
geneinactivation.NucleicAcids
Res,1
998,26(22):
5163~5169
44
Fan
S,FangF,Zhang
X,eta1.Putativezincfinger
proteinbinding
sites
are
over-represented
inthe
boundaries
of
methylation-resistant
CpG
islandsinthehumangenome.PLoSONE,2007,2(11):el184
45
Issa
J
P.Aging,DNA
methylationaadcancer.Crit
Rev
Oncol
Hematol,1999,32(1):31~43
46JonesP
ABaylin
SB.Thefundamental
roleofepigenetic
eventsin
cancer.Nat
Rev
Genet,2002,3(6):415~428
47
Ordway
J
M,BudimanMA,Korshunova
Y,et
a1.Identification
of
novelhigh—frequencyDNAmethylation
changes
inbreast
cancel'.
PLoS
ONE,2007,2(12):e1314
48
Piotrowski
A,BenetldewiczM,Menzel
U,et
a1.Micmarray-based
survey
of
CpG
islandsidentifies
concurrent
hyper-and
hypomethylationpatternsintissuesderivedfrompatients
with
breast
cancer.GenesChromosomesCancer,2006,45(7):656~667
49
KeshctI,SchlesingerY,FarkashS,et01.Evidence
forallinstructive
mechanismofde/“gffomcthylation
in
cancer
cells.Nat
Genct,2006,
38(2):149~153
50
GebhardC,SchwarzfischerL,PhamT
H,eta1.Ganome-wide
profilingofCpGmethylationidentifiesnovel
targetsof
aberrant
hypermethylationinmyeloid
leukemia.CancerRes,2006,66(I∞:
6118~6128
5l
Yu
J,ZhangHY,MaZZ,et以Methylation
profilingoftwenty
four
genesandtheconcordantmethylationbehavioursofnineteen
genes
that
maycontributetohepatocellularcarcinogenesis.CellRes,
2003,13(5):319~333
52
ZhangC
Y,ManL,Li
L,et以.Promotermethylationas
a
common
mechanismforinactivating
E-cadherinin
human
salivary
gland
adenoid
cystic
carcinoma.Cancer,2007,110(1):87~95
53
Yang
H
J,“u
V
W,Wang
Y,et
a1.DifferentialDNA
methylation
profiles
in
gynecologicalcancer¥andcorrelationwithclinico—
pathologicaldata.BMCCancer,2006.6:212
54
TamaruH,Selker
EU.A
histone
H3
mcthyltransferaso
controls
DNAmethylationin
Neurospora
crclssa.Nature,2001,414(6861):
277~283
55JacksonJ
P,LindrothA
M,CaoX,et以.Control
of
CpNpG
DNA
methylationbythe
KRYPTONITE
histone
H3
methyltransferase.
Nature,2002,416(6880):556~560
56
Jaenisch
R,BirdA.Epigenetic
regulationofgeneexpression:how
the
genome
integrates
intrinsic
andenvironmentalsignals.Nat
Genet,2003,33(Suppl):245~254
57
LelmertzB,UedaY,Denjck
AA,et
a1.Suv39h-mediatedhistone
H3
lysine
9
methylationdirectsDNAmethylationto
major
satellite
repeats
at
pericentrichcterochromatin.CurtBiol,2003,13(14):
1192~120058“)('WangX
He
K
et
a1.High-resolutionmappingofepigenetic
modifications
oftherice
genomeancovcrsinterplay
betweerlDNA
methylation,histonemethylation,andgeneexpression.Plant
Cell,
2008,20(2):259~276
150 生物化学与生物物理进展Prog.Biochem.Biophys.
2009;36(2)
ProgressofBioinformaticsStudyinDNA
FANShi—Cail一。ZHANGXue—Gon91∥
CMOEKeylaboratoryofBioinformaticsandBioinformatics
4School
Division,TNLIS?YDepartment
Methylation。
ofAutomation,TsinghuaE阮西emimBeijin9100084,China;
ofChina,Chengdu610054,China)
ofAutomation
Engineering,University
ofElectronicScienceandTechnology
Abstract
DNAmethylationis
all
importantepigeneticsystem。Itplaysmanycrucialrolesinthegeneregulation,
detectiontechniques,thebioinformaticsstudyhasbeen
an
Withthedevelopmentofthehigh-throughput
topicinthe
activehot
researchofDNAmethylation.Themajorachievementsandprogress
are
on
thepredictionofDNADNAmethylation,the
methylationstatus,themechanismthatthemajorityofCpGislands
resistantto
relationshipbetweenDNAmethylationandotherepigenetics,aswellastheassociationbetween
aberrant
DNA
methylationandthetumorigenesiswerereviewedinthisarticle。
Keywords
DNAmethylation,bioinformaticsstudy,CpGisland,prediction,mechanism,epigeneties
DoI:10.3724/SP.J.1206。2008.00426
*Thisworkwassupportedbygrants
from
TheNationalNaturalScienceFoundationof
China(30625012,60721003),TheNational
BasicResearch
ProgramofChina(2004CB518605)andTheHi-techResearchandDevelopmentProgramofChina(2006AA022325).
+‘Corresponding
author.
Tel:86。10-62794919.E-mail:zhangxg@tsinghua。edu。辨
Received:June
13,2008
Accepted:August18,2008
DNA甲基化的生物信息学研究进展
作者:作者单位:
凡时财, 张学工, FAN Shi-Cai, ZHANG Xue-Gong
凡时财,FAN Shi-Cai(生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084;电子科技大学自动化工程学院,成都,610054), 张学工,ZHANG Xue-Gong(生物信息学教育部重点实验室,清华信息国家实验室牛物信息学研究部,清华大学自动化系,北京100084)
生物化学与生物物理进展
PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS2009,36(2)0次
刊名:英文刊名:年,卷(期):引用次数:
参考文献(58条)
1.Goldberg A D.Allis C D.Bernstein E Epigenetics:a landscape takes shape 2007(4)2.Bird A P CpG islands as gene markers in the vertebrate nucleus 1987
3.Reik W.Santos F.Dean W Mammalian epigenomics:reprogramming the genome for development and therapy2003(1)
4.Bird A DNA methylation patterns and epigenetic memory 2002(1)
5.Bird A P.Wolffe A P Methylation-indueed repression--belts,braces,and ehromatin 1999(5)6.Kim J.Kollhoff A.Bergmann A Methylation-sensitive binding of transcription factor YY1 to aninsulator sequence within the paternally expressed imprinted gene,Peg3 2003(3)7.Bradbury J Human epigenome project--up and running 2003(3)
8.Eckhardt F.Lewin J.Cortese R DNA methylation profiling of human chromosomes 6,20 and 22 2006(12)9.Ehrlich M.Gama-Sosa M A.Huang L H Amount and distribution of 5-methylcytosine in human DNA fromdifferent types of tissues of cells 1982(8)
10.Gardiner-Garden M.Frommer M CpG islands in vertebrate genomes 1987(2)
11.Takai D.Jones P A Comprehensive analysis of CpG islands in human chromosomes 21 and 22 2002(6)12.Wang Y.Leung F C An evaluation of new criteria for CpG islands in the human genome as genemarkers 2004(7)
rsen F.Gundersen G.Lopez R CpG islands as gene markers in the human genome 1992(4)
14.Hansen R S.Stoger R.Wijmenga C Escape from gene silencing in ICF syndrome:evidence for advancedreplication time as a major determinant 2000(18)
15.Yamada Y.Watanabe H.Miura F A comprehensive analysis of allelic methylation status of CpG islandson human chromosome 21q 2004(2)
16.Hanahan D.Weinberg R A The hallmarks of cancer 2000(1)
17.Rakyan V K.Hildmann T.Novik K L DNA methylation profiling of the human major histocompatibilitycomplex:a pilot study for the human epigenome project 2004(12)
18.Cokus S J.Feng S.Zhang X Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNAmethylation patterning 2008(7184)
19.Bibikova M.Lin Z.Zhou L High-throughput DNA methylation profiling using universal bead arrays2006(3)
20.Zhang D.Wang Y.Bai Y A novel method to quantify local CpG mcthylation density by regional
methylation elongation assay on mieroarray 2008
21.Rollins R A.Haghighi F.Edwards J R Large-scale structure of genomic methylation patterns 2006(2)22.Weber M.Davies J J.Wittig D Chromosome-wide and promoter-specific analyses identify sites ofdifferential DNA methylation in normal and transformed human ceils 2005(8)
23.Schumacher A.Kapranov P.Kaminsky Z Mieroarray-based DNA methylation profiling:technology andapplications 2006(2)
24.Weber M.Hellmann I.Stadler M B Distribution,silencing potential and evolutionary impact ofpromoter DNA methylation in the human genome 2007(4)
25.Cart I M.Valleley E M.Cordery S F Sequence analysis and editing for bisulphite genomic sequencingprojects 2007(10)
26.Gnmau C.Renault E.Rosenthal A MethDB--a public database for DNA methylation data 2001(1)27.He X.Chang S.Zhang J MethyCancer:the database of human DNA methylation and cancer 2008(Databaseissue)
28.Ongenaert M.Van Neste L.De Meyer T PubMeth:a cancer methylation database combining text-miningand expert annotation 2008(Database issue)
uss M.Visne I.Weinhaeusel A McthCancerDB--aberrant DNA methylation in human cancer 2008(4)30.Bhasin M.Zhang H.Reinherz E L Prediction of methylated CpGs in DNA sequences using a supportvector machine 2005(20)
31.Amoreira C.Hindermann W.Gnman C An improved version of the DNA methylation database (MethDB)2003(1)
32.Das R.Dimitrova N.Xuan Z Computational prediction of methylation status in human genomicsequences 2006(28)
33.Fang F.Fan S.Zhang X Predicting methylation status of CpG islands in the human brain 2006(18)34.Feltns F A.Lee E K.Costello J F Predicting aberrant CpG island methylation 2003(21)
35.Bock C.Paulsen M.Tierling S CpG island methylation in human lymphocytes is highly correlated withDNA sequence,repeats,and predicted DNA structure 2006(3)
36.Buck C.Walter J.Paulsen M CpG island mapping by epigenome prediction 2007(6)
37.Barski A.Cuddapah S.Cui K High-resolution profiling of histone methylations in the human genome2007(4)
38.Fan S.Zhang M Q.Zhang X Histone methylation marks play important roles in predicting themethylation status of CpG islands 2008(3)
39.Brandeis M.Frank D.Keshet I Spl elements protect a CpG island from de novo methylation 1994(6496)40.Butcher DT.Mancini-DiNardo DN.Archer TK DNA binding sites for putative methylation boundaries inthe unmethylated region of the BRCA1 promoter 2004(5)
41.Turker M S The establishment and maintenance of DNA methylation patterns in mouse somatic cells1999(5)
42.Turker M S Gene silencing in mammalian cells and the spread of DNA methylation 2002(35)
aprt gene promoter is to block epigenetic gene inactivation 1998(22)
44.Fan S.Fang F.Zhang X Putative zinc finger protein binding sites are over-represented in theboundaries of methylation-resistant CpG islands in the human genome 2007(11)45.Issa J P Aging,DNA methylation and cancer 1999(1)
46.Jones P A.Baylin S B The fundamental role ofepigenefic events in cancer 2002(6)
47.Ordway J M.Budiman M A.Korshunova Y Identification of novel high-frequency DNA methylationchanges in breast cancer 2007(12)
48.Piotrowski A.Benetkiewicz M.Menzel U Microarray-hased survey of CpG islands identifies concurrenthyper-andhypomethylation patterns in tissues derived from patients with breast cancer 2006(7)49.Keshet I.Schlesinger Y.Farkash S Evidence for an instructive mechanism of de novo methylation incancer cells 2006(2)
50.Gebhard C.Schwarzfischer L.Pham T H Genome-wide profiling of CpG methylation identifies noveltargets of aberrant hypermethylation in myeloid leukemia 2006(12)
51.JIAN YU.HONG YU ZHANG.ZHEN ZHONG MA.WEI Lu.YI FEI WANG.JINGDE ZHU Methylation profiling of twentyfour genes and the concordant methylation behaviours of nineteen genes that may contribute tohepatocellular carcinogenesis[期刊论文]-细胞研究(英文版) 2003(5)
52.Zhang C Y.Man L.Li L Promoter methylation as a common mechanism for inactivating E-cadherin inhuman salivary gland adenoid cystic carcinoma 2007(1)
53.Yang H J.Liu V W.Wang Y Differential DNA methylation profiles in gynecological cancers andcorrelation with clinicopathological data 2006
54.Tamaru H.Selker E U A histone H3 methyltransferase controls DNA methylation in Neurospora crassa2001(6861)
55.Jackson J P.Lindroth A M.Cao X Control of CpNpG DNA methylation by the KRYPTONITE histone H3methyltransferase 2002(6880)
56.Jaenisch R.Bird A Epigenetic regulation of gene expression:how the genome integrates intrinsicand environmental signals 2003(Suppl)
57.Lehnertz B.Ueda Y.Derijck A A Suv39h-mediated histone H3 lysine 9 methylation directs DNAmethylation to major satellite repeats at pericentric heterochromatin 2003(14)
58.Li X.Wang X.He K High-resolution mapping of epigenetic modifications of the rice genome uncoversinterplay between DNA methylation,histone methylation,and gene expression 2008(2)
相似文献(1条)
1.学位论文 何坤 高等植物光形态建成过程中基因调控的生物信息学分析——转录调控及表观遗传调控分析 2006
转录调控(tanscriptionalregulation)和表观遗传调控(epigeneticregulation)是真核生物基因调控的两种主要途径。本论文的工作内容为:利用生物信息学手段分析生物实验室提供的数据分别对上述两种调控机制进行研究。 利用结构域搜索并结合文献检索,预测了拟南芥基因组共1826个转录因子,为拟南芥转录因子的重大国际合作项目提供了基因克隆的基本信息;同时结合核酸和蛋白质序列、结构以及拟南芥基因组等公共数据库信息,构建了拟南芥转录因子数据库,提供友好方便的使用界面和全面丰富的注释信息。通过对拟南芥和水稻MYB家族361个转录因子进行深入的系统发育分析,为MYB家族成员的克隆以及进化和功能分化提供了重要线索。 由于覆瓦式芯片(tilingarray)结果目前还没有可以直接使用的分析软件,本文基于统计学软件R和Perl语言,开发了适用于覆瓦式芯片数据的软件包,并用该软件成功对以下两类芯片数据进行了分析:第一类是基于拟南芥全基因组覆瓦式芯片进行免疫共沉淀芯片(ChIP-chip)实验来确定拟南芥幼苗bZIP(basicleucinezipper,碱性亮氨酸拉链)转录因子家族成员HY5光调控下结合位点的数据;第二类是利用覆瓦式芯片技术,分别对拟南芥光照和黑暗状态下6天期幼苗组蛋白H3亚基第9位赖氨酸双甲基化(H3K9Me2)、乙酰化(H3K9Ac)修饰,水稻悬浮培养细胞以及光照和黑暗状态下幼苗组蛋白H3亚基第4位赖氨酸上双甲基化(H3K4Me2)、三甲基化(H3K4Me3)和DNA甲基化修饰进行研究的数据。该软件包具有良好的平台移植性,且提供可调参数,可用于其它各种物种全基因组覆瓦式芯片结果。 对第一类数据分析发现,HY5的结合位点
全基因组水平(6.7﹪)。靶基因多定位于细胞核和细胞壁,与能量储存、糖代谢、脂肪酸氧化、小分子转运、光合作用以及细胞壁合成相关。与已有基因表达数据相比,发现HY5主要结合在早期光诱导基因上,且其结合在光照早期主要诱导转录因子表达,光照晚期则主要抑制转录因子表达。已知HY5与AtMYB12均能促进查尔酮合酶表达,分析表明HY5在AtMYB12启动子区也具有很强的结合信号,推测HY5可能存在一种尚未发现的调控模式,即在光形态建成早期激活某些转录因子,然后与它们一起参与下游基因的表达调控。该发现为下一步生物学实验研究提供了方向。 对第二类数据分析发现,拟南芥中H3K9Me2修饰主要集中在异染色质区和转座子上,与基因表达水平无相关性;H3K9Ac修饰则主要发生在常染色质区基因5'端附近区域,与基因表达水平成正相关。黑暗条件下转座子中H3K9Me2修饰水平降低、H3K9Ac修饰水平升高,表明其活性可能较光照条件下高,该结果已经得到生物学实验初步验证。水稻异染色质区DNA甲基化修饰水平高于常染色质区,且修饰水平与基因表达水平成负相关;常染色质中基因5'端附近区域H3K4Me2和H3K4Me3修饰程度较高,并均与基因表达水平成正相关,但与H3K4Me2相比,H3K4Me3更加集中在基因5'端区域,与基因表达水平相关性也更大。组蛋白修饰与DNA甲基化不仅具有组织特异性、在光暗不同条件下也存在差异。 对上述两类数据的分析为进一步探索光形态建成中重要转录因子HY5对下游基因的调控机制、揭示光形态建成中表观遗传调节所起的作用提供了重要信息。同时通过对这两种数据的综合分析,发现一些仅有转录因子结合或5'端发生H3K9Ac修饰并不能激活基因表达的实例。表明同时利用转录调控和表观遗传调控两种结果进行生物信息学研究,可进一步探索高等植物基因表达调控机制。
本文链接:/Periodical_swhx200902002.aspx
下载时间:2009年10月7日
正在阅读:
DNA甲基化的生物信息学研究进展06-12
部编版一年级语文下册19-9夜色教学设计01-04
北京经济开发区探索工业用地弹性供给05-09
船长业务(海商法部分)03-11
处方点评汇总及整改措施03-12
Unit 6 词汇和短语复习课07-29
中印投资环境对比研究02-27
判断题,船舶优先权可以由当事人约定02-16
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 基化
- 研究进展
- 生物
- 信息
- DNA
- 2014年春人教版七年级下册历史第一单元测试题
- 第八章 人口与环境
- 构建中小企业产品虚拟展示和自主创新开发环境的信息化服务平台
- 志愿者服务工作制度(新)
- 浅谈新疆勘探开发中心通信电源系统的应用与维护
- 中国啤酒行业投资分析报告
- 基于单片机的数字抢答器设计
- 有效表达:如何把话说到点儿上 时代光华课后答案
- 深圳超裕激光陈晓峰祝贺新老客户的光顾
- 部编版八年级上册历史复习训练题
- 矿山救护队岗位责任制
- 江苏省镇江市2016年中考一模化学试卷
- 农村籍中职学生转户宣传资料
- 一种竖曲线上高程的计算方法
- 第8课 写秋抒情——制作模仿写字效果的动画教学设计(小学信息技术精品)
- 第二章 建设工程造价的构成
- 洁净厂房空调净化系统验证方案
- Master Kong production(康师傅的产品分析) 英文版
- 桥梁施工技术讲座
- 怎么批量修改电脑文件名?