SNP芯片数据分析

更新时间:2023-12-25 13:57:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

上海敏芯信息科技有限公司

Affymetrix SNP芯片数据分析方案

项目一、基本分析

包括:

芯片原始数据的处理和基因分型,我们给出有统计意义的SNP列表。 描述性统计,如minor allele frequency,Hardy-Weinberg equilibrium等。 显著性检验,实验组与对照组的差异,假阳性率(FDR)的计算等。 SNP的关联分析,建立线性模型或logistic回归模型等。(所有的统计可以选择由SAS,SPSS,或S-Plus/R给出)

项目二、Copy Number Variation(CNV)的计算。

CNV是目前的一个热点研究内容。SNP芯片数据可以用于精确地计算CNV。我们提供针对SNP芯片的基于CNAG(Copy Number Analyser for GeneChip), dChip(DNA-Chip Analyzer)和CNAT(Chromosome Copy Number Analysis Tool)等算法的CNV计算结果。

项目三、SNP注释

通过SNP在染色体上的位置,利用寻找SNP可能影响的基因( or EST)。我们也可以对相应基因进行功能的注释(gene ontology , pathway和转录因子分析等),进而解释SNP可能的作用机理。该部分可以参考常规表达谱芯片的分析。

项目四:基于模式识别的SNP挖掘

传统的SNP挖掘使用统计学的方法来进行,往往在敏感性与特异性上有一定的限制。利用一些模式识别/机器学习的方法可以更好解决SNP筛选问题。我们提供基于决策树等SNP挖掘算法。

Hsiang-Yu Yuan et al. FASTSNP: an always up-to-date and extendable service for SNP function analysis and prioritization. Nucleic Acids Research 2006 34(Web Server issue):W635-W641

项目五:诊断模型建立

利用筛选到的SNP建立人工神经网络(ANN)、SVM、PAML等诊断模型,在临床上具有重要意义。下图是我们使用ANN方法来构建诊断模型设计的策略:

样本 (train+test) PCA降维(取前10个主成分) 随机将样本等分为n组 4/5 1/5 训练 交叉证实 重复1000次 神经网络模型 Blind Test结果 Gene Ranking 确定最佳分类所需最少SNP

项目六、 不同SNP平台整合分析

目前SNP public的数据越来越多,主要使用的是Illumina和affymetrix两个平台。我们提供公共数据的整合分析的解决方案,包括不同平台数据之间的整合。

项目七、SNP芯片与表达谱芯片,aCGH等其他高通量数据整合

SNP与表达谱芯片,aCGH在技术上各有所长。我们提供数据整合方案实现综合所有可能的高通量方法,解决相应的生物学问题:如癌症药靶的筛选,复杂遗传疾病marker的挖掘等。

Stein Aerts et al. Gene prioritization through genomic data fusion. NATURE BIOTECHNOLOGY VOLUME 24 NUMBER 5 MAY 2006

项目八、实验验证部分

包括数据验证实验设计,以及实验服务。

我们提供采用PCR方法,或taq-man的real-time PCR基因分型方法等对SNP芯片内容进行验证的服务。另外,我们也提供对SNP功能的后续实验服务,这包括:

1. 对于位于基因启动子区域的SNP, 我们推荐对基因蛋白表达量进行检测(western blot)。

同时利用转录因子分析点突变对转录因子结合自由能的影响。

2. 对于intron中的SNP,我们推荐进行可变剪切的验证(northern blot)。

3. 对于CDS区域的SNP我们建议是否为同义突变,非同义突变可以利用3D你比较建模

分析蛋白结构的变化。

4. 对于3’-UTR我们推荐进行microRNA结合位点预测和常见3’-UTR元件预测(如ARE

等)。突变会造成结合位点的丢失。

本文来源:https://www.bwwdw.com/article/90cx.html

Top