癌症基因表达谱挖掘中的特征基因选择算法GA/WV

更新时间:2023-07-23 01:37:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

鉴定癌症表达谱的特征基因集合可以促进癌症类型分类的研究,这也可能使病人获得更好的临床诊断?虽然一些方法在基因表达谱分析上取得了成功,但是用基因表达谱数据进行癌症分类研究依然是一个巨大的挑战,其主要原因在于缺少通用而可靠的基因重要性评估方法.GA/WV是一种新的用复杂的生物表达数据评估基因分类重要性的方法,通过联合遗传算法(GA)和加权投票分类算法(WV)得到的特

第 8卷第 2期 20 1 0年 6月

生物信息学C iaJ un lo iifr t s hn o r a fB onomai c

V0. No 2 18 .

J n,0 0 u .2 1

癌症基因表达谱挖掘中的特征基因选择算法 G/ A WV申伟科钟理,昆张波王建飞张小刚秦向东。,葛,,,,( .河北大学生命科学学院生物芯片研究室,河北保定 0 10 1 7 02;2 B c ma s a c n t u e o t f Ho e Nai n lMe i a e tr . e k n Re e rh I s i t fCi o p t a d c C n e,Du re a i r i t y o l a t,C fn a,CA9 01 l o 1 0,US; A

3河北大学科学技术处,河北保定 0 10 ) . 7 02

摘要:鉴定癌症表达谱的特征基因集合可以促进癌症类型分类的研究,这也可能使病人获得更好的临床诊断?虽然一些方法在基因表达谱分析上取得了成功,但是用基因表达谱数据进行癌症分类研究依然是一个巨大的挑战,其主要原因在于缺少通用而可靠的基因重要性评估方法。G/ A WV是一种新的用复杂的生物表达数据评估基因分类重要性的方法,通过联合遗传算

法( A和加权投票分类算法( )到的特征基因集合不但适用于 wV分类器, G) wV得也适用于其它分类器?将 G/ A WV方法用癌症基因表达谱数据集的验证,结果表明本方法是一种成功可靠的特征基因选择方法。 关键词:遗传算法;加权投票;模式识别;特征基因选择;高维性中图分类号: 7 9 Q8文献标识码: B文章编号: 7 1 2—56 (0 0 O 0 8— 6 6 5 5 2 1 )一 2— 9 0

GA/W V p ia in i u o e e e pr si n pr fl i i g a a pl to n t m r g n x e so o i m n n s c i nga f a ur e e to l o ih e t e s l c i n a g rt mS E i e,HO G L, E K n,H N o, N infi,H N i .a g, I in .o g H N We. Z N i G u Z A G B WA G J— Z A G X a gn Q N X a gdn k, a e o( .Deat etfMo clr il y H bi n esyC lg i c ne

, adn 70 2 C i J p r n m o l ua oo, ee U iri ol efL e i cs B oig0 1 0, hn e B g v t e o fSe a; 2 Bcm nRe ac stt o i . e a s r I tuefCt o p ainl dcl et, at,C lon C 9 0 0 S k e hni y fHoeN t a i ne Dur o Me a C r e airi A 1 1,U A; f a,3 Dp r n c neadTcnl y Hee U i rt,a ig0 10, ia . eat tfSi c n eh o g, bi nv syB n n 70 2 n ) e m o e o ei dAb t a t I e t c t n o e e s b esfo g n x r s in a ay i su eu n t mo p sc a s yn, n tw u d as ep a sr c:d n i ai fg n u s t r m e e e p e s n lssi s f l u rt e ls i i g a d i o l o h l sp— i f o o i y f l t n s t c e tb t rc i i d a n sn .T o g o t o s fr a ay ig mir ar y e p e so aa h v h w d a tg s ti i t o a c p et l c i g o i g h u h s me meh d o n lzn c o r x r si n d t a e s o n a v n a e,i s e e n a s l a b g c al n et o n c a c rca s c t n t e e e p e so rf ig d t .I h ssu y,w e c i e o e lo i m r t l i h l g o c n e t n e ls i ai g n x r s in p o l a a n t i t d i e c i f o o i n ed sr dan v l gr h f b a t o a s s i g te i o tn eo e e rs mp e ca sf ain b s d o o lx e p e so aa:/ V.T e g n e sw e y c mb— se s h mp ra c f n sf a l ls i c t a e n c mp e x r si n d t GA W n g o i o h e est egt o i b

n ggn t lo tm ( A)adw ih vt g( )m tosaent n ut r ls f ao

u te lsf ti .We i ee ca rh G n i gi n egt oi WV e d r o ol si df cas ct nb t hr asi a n n h y e o WV i i i o c ic oa p id t i GA W V a ay i o a s t fg n x r si n d t o d f r n u rt s e,te r s l fcu tr g a d tsi g d mo— p l h s e / n lsst e e e e p e so a af m i ee t mo su s h e u t o l se n n e t e n o r f t i s i n s a e h tt i n v l lo t m i a d a c d fau eg n ee t n a g r h i e e e p e so aa mi i g t td t a hs o e g r h s n a v n e e t r e e s lc i lo t m n g n x r s in d t nn . r a i o i Ke o d: n t lo i m; eg t d v t g s h me P t r e o nt n; e t r e e s l cin; g y W r s Ge ei ag r h W ih e o i c e; at n r c g i o F au e g n ee t c t n e i o Hih—d me s n l i ni a o

癌症的发生发展是一个复杂的基因表达调控过程,由于基因芯片技术能平行检测大量基因的表达谱,因此常用于分子水平上癌症的研究。。癌症

t—ni,2选择了 5与两种白血病相关的 o o e S N) s 0个

基因,过加权投票方法 ( egtd vt gsh m,通 w i e oi ce e h nwv)证了这些基因?另外,他研究者也提出了验其

表达谱的大规模分析势必会促使发现更多在基因水平上具有诊断和预后功能的肿瘤标志物,于这些基

各自的统计计算方法

。但这些方法只适合于

解决一些特定的基因表达谱问题。 癌症基因表达谱中往往包含大量的基因,大但

标志物的诊断可以减少对癌症亚型或相似癌症类型的误判 L J 6。很多研究者已经提出一些计算方法和 统计模型用于癌症的分子分型研究, K a _提出如 hn3

用神经网络对小圆蓝细胞癌症 (ma on lecl s lru dbu e l l

部分

基因与分类问题无关,这些冗余信息的存在人为的增加了分类计算的成本也阻碍了分类精确性的提高,因此特征基因的选择对癌症基因表达谱分析而言是必需的。通常用于特征基因选择的方法是标准的双样本 t一检验,然而要处理的数据中通常包含

t o,R C S进行分类判断, u r SB T) m s最终鉴定出了 9 6个最具区分力的基因。G lb使用信噪比 ( i a o u Sg l n

收稿日期:0 9— 1—2; 20 0 1修回日期:09— 7—1. 20 0 3基金项目:北省科技攻关类项目(5 4 54。河 0 2 5 1 D)

作者简介:申伟科,,男在读硕士,河北省邢台沙河市人, E—ma: e eb n9 1 a o.o .n i w i se 18@yhocr c . l k n通讯作者:钟理,,男教授,博士,主要从事分子生物学及蛋白质组学研究。E—ma:zog o .r i l n@chog l h

本文来源:https://www.bwwdw.com/article/dy0m.html

Top