GWAS笔记SNP过滤
更新时间:2024-03-09 21:48:01 阅读量: 综合文库 文档下载
- gwas snp推荐度:
- 相关推荐
GWAS学习笔记SNP过滤
1:缺失比例(Missing rates):( GENO> 0.05 )
Shortly we will apply more stringent criteria, such that GENO > 0.05. In this case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in 4.45 more more samples, that SNP will be removed from the dataset.
不久将来,我们将采用更严格的标准,比如GENO> 0.05。在这种情况下,0.05 * 89 = 4.45样本,这意味着如果SNP在4.45多个样本中丢失,则SNP将从数据集中删除。
2:最小等位基因频率(Minor Allele frequencies)( MAF< 0.03 如果SNP较多可以设置为MAF<0.05)
MAF is the Minor Allele Frequency. It can be used to exclude SNPs which are not informative because they show little variation in the sample set being analyzed. For instance, if a SNP shows variation in only 1 of the 89 individuals, it is not useful statistically and should be removed.
MAF是次要等级线频率。它可以用于排除不信息的SNP,因为它们在被分析的样本集中几乎没有变化。例如,如果SNP仅显示89个个体中的1个,则在统计学上不是有用的,应该被去除。
3:Removing SNPs out of Hardy-Weinberg equilibrium(p-value > 10?6 - 10?4 )
Population genetic theory suggests that under ‘normal’ conditions, there is a predictable relationship between allele frequencies and genotype frequencies. In cases where the genotype distribution is different from what one would expect based on the allele frequencies, one potential explanation for this is genotyping error. Natural selection is another explanation. For this reason, we typically check for deviation from Hardy-Weinberg equilibrium in the controls for a case- control study. For a quantitative trait, PLINK just uses everyone. The following command generates p-values for deviation from HWE for each SNP. Low p-values indicate that a SNP is out of HWE.
人口遗传理论认为,在“正常”条件下,等位基因频率与基因型频率之间存在可预测的关系。在基因型分布与基于等位基因频率的预期不同的情况下,一个潜在的解释是基因分型错误。自然选择是另一个解释。因此,我们通常检查病例对照研究对照组中Hardy-Weinberg平衡的偏差。对于数量特质,PLINK只是使用每个人。以下命令生成每个SNP偏离HWE的p值。低p值表示SNP超出了HWE。
4:如果你有vcf文件,可以先用vcftools转换为plink的输入形势,输出结果为:.bed与.map文件,然后以此作为输入进行过滤: vcftools --vcf my.vcf --plink --out plink
plink --noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed --out QC 参考文献:
Roshyara N R, Kirsten H, Horn K, et al. Impact of pre-imputation SNP-filtering on genotype imputation results[J]. BMC genetics, 2014, 15(1): 1.
Pongpanich M, Sullivan P F, Tzeng J Y. A quality control algorithm for filtering SNPs in genome-wide association studies[J]. Bioinformatics, 2010, 26(14): 1731-1737.
正在阅读:
GWAS笔记SNP过滤03-09
一件让我开心的事作文600字07-03
北宋时期冷兵器发展05-31
奥数 - 六年级竞赛 - 几何直线形面积 - 燕尾定理 教师版word04-25
议论文论据的分析 公开课06-08
实验三 乙醇脱水09-21
难忘的那一幕作文600字06-20
海南航空股份有限公司企业文化试题_05-18
五一趣事作文精彩7篇03-27
与好习惯同行作文06-29
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 过滤
- 笔记
- GWAS
- SNP
- 二级 第一篇 人力资源规划 知识要点
- 邯郸市建设局关于印发关于进一步加强廉政风险防控深化权力运行
- 关于无穷级数求和问题的探讨毕业论文
- 世界汽车大事年表
- 半年度工作总结2118年销售部门上半年总结及下半年计划
- final翻译--CMAA70-1 - 图文
- “走下网络、走出宿舍、走向操场”主题活动通知
- 难点81 如何选用合适的句式-备战高考语文之难点突破100讲 Word版
- 人教版必修一经济生活8.2征税和纳税作业
- 2016年盐城一调电子电工试卷
- 第17课 内战烽火人教版八年级上册历史 第17课 内战烽火 教案02 -
- 小学语文生成性课堂教学的驾驭艺术探讨
- 大象版四年级科学上册 期末复习题
- 高中物理电磁感应知识点汇总
- SQL复习题及答案
- 四年级品德与社会上册第二单元我爱我家4怎样面对失败教学设计2未
- 2013年高考化学总复习 选择题百题精炼(第2期)专题01 化学用语
- 18年高考化学二轮复习三道题经典专练6化学反应原理综合考查题二
- 2018-2019年初中数学浙教版《七年级上》《第5章 一元一次方程》
- 2017秋八年级数学上册14.2.3三边分别相等的两个三角形学案无答案