GWAS笔记SNP过滤
更新时间:2023-12-25 16:29:01 阅读量: 教育文库 文档下载
- gwas snp推荐度:
- 相关推荐
GWAS学习笔记SNP过滤
1:缺失比例(Missing rates):( GENO> 0.05 )
Shortly we will apply more stringent criteria, such that GENO > 0.05. In this case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in 4.45 more more samples, that SNP will be removed from the dataset.
不久将来,我们将采用更严格的标准,比如GENO> 0.05。在这种情况下,0.05 * 89 = 4.45样本,这意味着如果SNP在4.45多个样本中丢失,则SNP将从数据集中删除。
2:最小等位基因频率(Minor Allele frequencies)( MAF< 0.03 如果SNP较多可以设置为MAF<0.05)
MAF is the Minor Allele Frequency. It can be used to exclude SNPs which are not informative because they show little variation in the sample set being analyzed. For instance, if a SNP shows variation in only 1 of the 89 individuals, it is not useful statistically and should be removed.
MAF是次要等级线频率。它可以用于排除不信息的SNP,因为它们在被分析的样本集中几乎没有变化。例如,如果SNP仅显示89个个体中的1个,则在统计学上不是有用的,应该被去除。
3:Removing SNPs out of Hardy-Weinberg equilibrium(p-value > 10?6 - 10?4 )
Population genetic theory suggests that under ‘normal’ conditions, there is a predictable relationship between allele frequencies and genotype frequencies. In cases where the genotype distribution is different from what one would expect based on the allele frequencies, one potential explanation for this is genotyping error. Natural selection is another explanation. For this reason, we typically check for deviation from Hardy-Weinberg equilibrium in the controls for a case- control study. For a quantitative trait, PLINK just uses everyone. The following command generates p-values for deviation from HWE for each SNP. Low p-values indicate that a SNP is out of HWE.
人口遗传理论认为,在“正常”条件下,等位基因频率与基因型频率之间存在可预测的关系。在基因型分布与基于等位基因频率的预期不同的情况下,一个潜在的解释是基因分型错误。自然选择是另一个解释。因此,我们通常检查病例对照研究对照组中Hardy-Weinberg平衡的偏差。对于数量特质,PLINK只是使用每个人。以下命令生成每个SNP偏离HWE的p值。低p值表示SNP超出了HWE。
4:如果你有vcf文件,可以先用vcftools转换为plink的输入形势,输出结果为:.bed与.map文件,然后以此作为输入进行过滤: vcftools --vcf my.vcf --plink --out plink
plink --noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed --out QC 参考文献:
Roshyara N R, Kirsten H, Horn K, et al. Impact of pre-imputation SNP-filtering on genotype imputation results[J]. BMC genetics, 2014, 15(1): 1.
Pongpanich M, Sullivan P F, Tzeng J Y. A quality control algorithm for filtering SNPs in genome-wide association studies[J]. Bioinformatics, 2010, 26(14): 1731-1737.
正在阅读:
GWAS笔记SNP过滤12-25
给词语中斜体的字选择正确的解释05-10
沟通技巧之十大常见又很棘手的问题09-04
物业管理补充协议10-05
我爱迎春花作文500字06-16
游八达岭作文500字07-13
冬天巧用化妆水06-29
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 过滤
- 笔记
- GWAS
- SNP
- 邯郸市建设局关于印发关于进一步加强廉政风险防控深化权力运行
- 最新-2019年教师工作总结 2019高中化学教师年终工作总结 精品
- 实验四搜索引擎营销
- 具备履行合同所必需的设备和专业技术能力的承诺书2019.6.18
- 四年级数学上册3.2分数的加减计算教案沪教版(全汇总版)
- 计算机管理办法
- 2015年春中国石油大学(北京)大学语文第二阶段在线作业
- 南京邮电大学网络技术实验报告 - 图文
- 《数据的收集与整理》单元测试卷
- 在教学中如何帮助学生积累基本数学活动经验
- 民事能动司法的功能分析
- 大学英语2C卷
- 山东玻璃钢水箱价格影响因素分析
- 老字号企业经营困境的文化因素及对策探析
- 数学f1初中数学中考模拟试题
- 浙江省人民政府关于加快建设质量强省的若干意见
- 关于无穷级数求和问题的探讨毕业论文
- 天鹿幼儿园安全教育活动设计 - 不吃零食好习惯
- 办公室主任个人年终工作总结3篇范文
- 最新(总结范文)之生产中心年终总结及工作计划