基于混合蚁群遗传算法的RNA二级结构预测

更新时间:2023-08-07 07:22:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

RNA二级结构预测是生物信息学的重要研究领域。本文提出一种新的基于混合蚁群遗传算法的RNA二级结构预测方法。充分利用茎区和茎区之间的关系信息和累积的信息,通过蚁群算法产生初始种群和新的个体,进而替换遗传算法中的变异算子。构造蚁群算法中的启发式信息、初始信息素矩阵、下一茎区的选取规则和信息素的更新机制,给出遗传算法中交叉算子的交叉策略。最后通过测试已知二级结构

2 1年第 8期 01文章编号:0 62 7 ( 0 )80 0 -4 10 -4 5 2 1 0 -0 10 1

计算机与现代化 J U NIY I N A H A I A J U XA D IU S

总第 12期 9

基于混合蚁群遗传算法的 R A二级结构预测 N高冬(吉林大学计算机科学与技术学院,吉林长春 10 1 ) 3 0 2摘要:N R A二级结构预测是生物信息学的重要研究领域。本文提出一种新的基于混合蚁群遗传算法的 R A二级结构预 N

测方法。充分利用茎区和茎区之间的关系信息和累积的信息,通过蚁群算法产生初始种群和新的个体,而替换遗传算进

法中的变异算子。构造蚁群算法中的启发式信息、初始信息素矩阵、一茎区的选取规则和信息素的更新机制,出遗下给传算法中交叉算子的交叉策略最后通过测试已知二级结构的 R A序列, N实验结果表明,方法相对于遗传算法不仅该节省程序运行的时间,而且可提高预测的准确性。 关键词:生物信息学; N二级结构;蚁群算法; R A;遗传算法中图分类号:P 8 T 1文献标识码: A

+

d i 1 .99 ji n 10 -4 5 2 1. 80 1 o: 03 6/. s .0 62 7 .0 10 .0 s

Pr di tng RNA c n r t u t e Ba e n e ci Se o da y S r c ur s d o Hy r d AntCo o y t m nd Ge e i g rt b i l ny S s e a n tc Al o ihmGA0 n Do g

( o eeo o p t c n eadT cnlg, inU i rt, hnc u 3 02 hn ) C lg f m u r i c n eh o y Ji nv s y C agh n10 1,C ia l C eS e o l eiAb t a t RN s c n ay s u tr rd c in i a mp ra t e e r h f l n b on o ma is e meh d i p e e td t r - s r c: A e o d r t cu e p e it s n i ot s a c ed i i if r t .A n w t o s r s ne o p e r o n r i e d c A e o d r t cu e b s d o y r n oo ys s m n e e i ag r h itRN s c n ay s u t r ae n h b d a t

ln y t a d g n t lo t m.T e r lt n hp if r t n b t e i r i c e c i h eai s i no mai ewe n df o o - f rn tmsi s d t e e aet e ii a o u a o n ea c mu ae h r mo ei fr ain i s d t o s u t e e o d e e t e Su e g n rt h t p p lt n a d t c u l td p e o n no s o ni l i h m t Su e oc n t c w s c n - o r n a t c u e h n t ef l ig p t w y i smu ae y u r sr t r .T e h od n ah a s i l td,ic u i g s c r c s e sc n t c o ft e h u si n o mai n,t e n l d n u h p o e s s a o sr t n o h e r t i r t ui i c f o h

u e o t l n h h r mo e, h c a im fc o s t l d n x e a h t tg f d t h r mo e r l fi i aiig t ep e o n t e me h ns o h o i gt e i i a n e t t m d t e s ae y o p ai gt e p e o n ni z n h ni a s n r u n h b t e n t o df r n tms A d a n w c o s v rsrt g sp o o e .B si g t eRNA s q e c swi n w t cu e,e— ew e w i e e ts e . n e r s o e tae i r p s d y yt t e n h e u n e t k o n s h u r t rs x p rme tr s t h w h tti g r h i rv s t e p e it n a c r c o a e i e e c ag r h e i n e u o s t a s a o t m mp o e h r dc i c u a y c mp rd w t g n t l o t m. l s h l i o h i i Ke r s: ii o ais y wo d b on r t;RNA;s c n a y sr c u e n oo y s s m;g n t g rt m f m c e o d r t t r;a tc l n y t u e e ei a o h cl i

0引言 核糖核酸 ( N是核酸的一种, R A)因含核糖而得名

。在 2 0世纪的 10年间,诺贝尔奖与 R A领 0 7个 N

传统的二级结构预测方法大致可以分为两类:多序列比对方法和最小自由能方法。多序列比对方法

认为同源序列应具有相似的结构,其预i结果的准确贝 4性较高,不适合预测单条 R A序列的二级结但 N

域有关。随着核酶的发现,究者对 R A的生物功研 N能多样性有了全新的理解。2 1世纪初,随着一系列

构。最小自由能方法的核心思想是最稳定的结构引应具有最低的能量,因此该类方法总以最小自由能为适应值函数,找能量最低的二级结构。根据不寻同方法对最小自由能的紧密程度,可分为部分依赖又

调控 R A的发现、 N人类基因组计划的完成、后基因组研究的兴起,得 R A的研究再次接近一个新的高使 N

峰。具有相同功能的 R A序列具有类似的结构, N因此通过预测未知功能的 R A序列的二级结构,而 N进

推断其功能成为亟待解决的问题。通过实验手段 (核磁共振等 )确定 R A序列的空间结构花费高, N且难度大。通过计算机模拟和预测 R A的二级结构是 N生物信息学的重要研究课题。收稿日期:0 1 71 2 1- .1 0

和完全依两种:其中部分依赖方法以李伍举先生的螺旋区随机堆积方法为典型代表 J该方法先得到,茎区的分布情况,之后按照茎区被调用的概率选择茎区形成最终的二级结构,该方法一定程度上削弱了最小自由能对最终预测结果的影响;全依赖方法包括完动态规划方法和组合优化算法,以动态规划方法为思

作者简介:高冬 (9 0 )女, 19一,吉林松原人,吉林大学计算机科学与技术学院本科生,研究方向:群集智能算法。

本文来源:https://www.bwwdw.com/article/s09j.html

Top