癌症基因表达谱挖掘中的特征基因选择算法GA/WV
更新时间:2023-07-23 01:37:01 阅读量: 实用文档 文档下载
- 基因表达谱怎么看推荐度:
- 相关推荐
鉴定癌症表达谱的特征基因集合可以促进癌症类型分类的研究,这也可能使病人获得更好的临床诊断?虽然一些方法在基因表达谱分析上取得了成功,但是用基因表达谱数据进行癌症分类研究依然是一个巨大的挑战,其主要原因在于缺少通用而可靠的基因重要性评估方法.GA/WV是一种新的用复杂的生物表达数据评估基因分类重要性的方法,通过联合遗传算法(GA)和加权投票分类算法(WV)得到的特
第 8卷第 2期 20 1 0年 6月
生物信息学C iaJ un lo iifr t s hn o r a fB onomai c
V0. No 2 18 .
J n,0 0 u .2 1
癌症基因表达谱挖掘中的特征基因选择算法 G/ A WV申伟科钟理,昆张波王建飞张小刚秦向东。,葛,,,,( .河北大学生命科学学院生物芯片研究室,河北保定 0 10 1 7 02;2 B c ma s a c n t u e o t f Ho e Nai n lMe i a e tr . e k n Re e rh I s i t fCi o p t a d c C n e,Du re a i r i t y o l a t,C fn a,CA9 01 l o 1 0,US; A
3河北大学科学技术处,河北保定 0 10 ) . 7 02
摘要:鉴定癌症表达谱的特征基因集合可以促进癌症类型分类的研究,这也可能使病人获得更好的临床诊断?虽然一些方法在基因表达谱分析上取得了成功,但是用基因表达谱数据进行癌症分类研究依然是一个巨大的挑战,其主要原因在于缺少通用而可靠的基因重要性评估方法。G/ A WV是一种新的用复杂的生物表达数据评估基因分类重要性的方法,通过联合遗传算
法( A和加权投票分类算法( )到的特征基因集合不但适用于 wV分类器, G) wV得也适用于其它分类器?将 G/ A WV方法用癌症基因表达谱数据集的验证,结果表明本方法是一种成功可靠的特征基因选择方法。 关键词:遗传算法;加权投票;模式识别;特征基因选择;高维性中图分类号: 7 9 Q8文献标识码: B文章编号: 7 1 2—56 (0 0 O 0 8— 6 6 5 5 2 1 )一 2— 9 0
GA/W V p ia in i u o e e e pr si n pr fl i i g a a pl to n t m r g n x e so o i m n n s c i nga f a ur e e to l o ih e t e s l c i n a g rt mS E i e,HO G L, E K n,H N o, N infi,H N i .a g, I in .o g H N We. Z N i G u Z A G B WA G J— Z A G X a gn Q N X a gdn k, a e o( .Deat etfMo clr il y H bi n esyC lg i c ne
, adn 70 2 C i J p r n m o l ua oo, ee U iri ol efL e i cs B oig0 1 0, hn e B g v t e o fSe a; 2 Bcm nRe ac stt o i . e a s r I tuefCt o p ainl dcl et, at,C lon C 9 0 0 S k e hni y fHoeN t a i ne Dur o Me a C r e airi A 1 1,U A; f a,3 Dp r n c neadTcnl y Hee U i rt,a ig0 10, ia . eat tfSi c n eh o g, bi nv syB n n 70 2 n ) e m o e o ei dAb t a t I e t c t n o e e s b esfo g n x r s in a ay i su eu n t mo p sc a s yn, n tw u d as ep a sr c:d n i ai fg n u s t r m e e e p e s n lssi s f l u rt e ls i i g a d i o l o h l sp— i f o o i y f l t n s t c e tb t rc i i d a n sn .T o g o t o s fr a ay ig mir ar y e p e so aa h v h w d a tg s ti i t o a c p et l c i g o i g h u h s me meh d o n lzn c o r x r si n d t a e s o n a v n a e,i s e e n a s l a b g c al n et o n c a c rca s c t n t e e e p e so rf ig d t .I h ssu y,w e c i e o e lo i m r t l i h l g o c n e t n e ls i ai g n x r s in p o l a a n t i t d i e c i f o o i n ed sr dan v l gr h f b a t o a s s i g te i o tn eo e e rs mp e ca sf ain b s d o o lx e p e so aa:/ V.T e g n e sw e y c mb— se s h mp ra c f n sf a l ls i c t a e n c mp e x r si n d t GA W n g o i o h e est egt o i b
n ggn t lo tm ( A)adw ih vt g( )m tosaent n ut r ls f ao
u te lsf ti .We i ee ca rh G n i gi n egt oi WV e d r o ol si df cas ct nb t hr asi a n n h y e o WV i i i o c ic oa p id t i GA W V a ay i o a s t fg n x r si n d t o d f r n u rt s e,te r s l fcu tr g a d tsi g d mo— p l h s e / n lsst e e e e p e so a af m i ee t mo su s h e u t o l se n n e t e n o r f t i s i n s a e h tt i n v l lo t m i a d a c d fau eg n ee t n a g r h i e e e p e so aa mi i g t td t a hs o e g r h s n a v n e e t r e e s lc i lo t m n g n x r s in d t nn . r a i o i Ke o d: n t lo i m; eg t d v t g s h me P t r e o nt n; e t r e e s l cin; g y W r s Ge ei ag r h W ih e o i c e; at n r c g i o F au e g n ee t c t n e i o Hih—d me s n l i ni a o
癌症的发生发展是一个复杂的基因表达调控过程,由于基因芯片技术能平行检测大量基因的表达谱,因此常用于分子水平上癌症的研究。。癌症
—
t—ni,2选择了 5与两种白血病相关的 o o e S N) s 0个
基因,过加权投票方法 ( egtd vt gsh m,通 w i e oi ce e h nwv)证了这些基因?另外,他研究者也提出了验其
表达谱的大规模分析势必会促使发现更多在基因水平上具有诊断和预后功能的肿瘤标志物,于这些基
各自的统计计算方法
。但这些方法只适合于
解决一些特定的基因表达谱问题。 癌症基因表达谱中往往包含大量的基因,大但
标志物的诊断可以减少对癌症亚型或相似癌症类型的误判 L J 6。很多研究者已经提出一些计算方法和 统计模型用于癌症的分子分型研究, K a _提出如 hn3
用神经网络对小圆蓝细胞癌症 (ma on lecl s lru dbu e l l
部分
基因与分类问题无关,这些冗余信息的存在人为的增加了分类计算的成本也阻碍了分类精确性的提高,因此特征基因的选择对癌症基因表达谱分析而言是必需的。通常用于特征基因选择的方法是标准的双样本 t一检验,然而要处理的数据中通常包含
t o,R C S进行分类判断, u r SB T) m s最终鉴定出了 9 6个最具区分力的基因。G lb使用信噪比 ( i a o u Sg l n
收稿日期:0 9— 1—2; 20 0 1修回日期:09— 7—1. 20 0 3基金项目:北省科技攻关类项目(5 4 54。河 0 2 5 1 D)
作者简介:申伟科,,男在读硕士,河北省邢台沙河市人, E—ma: e eb n9 1 a o.o .n i w i se 18@yhocr c . l k n通讯作者:钟理,,男教授,博士,主要从事分子生物学及蛋白质组学研究。E—ma:zog o .r i l n@chog l h
正在阅读:
养路机械及专用车辆讲义0211-08
中国人民解放军各集团军编制战斗序列大全05-02
沪教版六年级数学教案第六章12-08
体育教学改革方案课件资料03-08
计算机考试范题-基础知识12-29
高考理数试题解析(海南卷)WORD版-数学 - 图文12-19
二年级抒情作文450字:快乐的旅行08-11
新苏教版二年级数学下册第3、4单元教案05-04
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 基因
- 癌症
- 算法
- 挖掘
- 特征
- 表达
- 选择
- 羽毛球理论课初级班复习资料
- 江苏省泰州二中高二物理上学期期中考试试题(无答案)选修
- ERP财务总监助理心得总结
- 2017年春季新版华东师大版八年级数学下学期19.2.1、菱形的性质导学案2
- 混凝土搅拌站管理实施细则
- 专业硕士实践总结报告(刘新)
- 青年岗位能手先进事迹材料
- 英语语言学练习题
- 现代教育技术试题及答案
- 2011黑龙江省银行从业资格考试个人贷款真题精选2(必备资料)
- 2016年南开大学材料物理与化学考研考试科目-考研参考书
- 新形势下促进农民致富增收的思考
- 2018年全国Ⅲ卷物理试题及答案(纯word版)(可编辑修改word版)
- 磷酸铁锂正极材料稳定性探讨
- 广西壮族自治区高三上学期第二次模拟考试文综地理试题(II)卷
- 基于PLC的模糊控制变频调速系统
- 磁控溅射法镀制红外低辐射膜的研究进展
- 全自动饺子皮机 混沌皮机
- 【新课标-精品卷】2018-2019学年仁爱版七年级英语上册Unit3单元检测卷及答案
- 描写人物神态的成语