GWAS笔记SNP过滤
更新时间:2024-03-09 21:48:01 阅读量: 综合文库 文档下载
- gwas snp推荐度:
- 相关推荐
GWAS学习笔记SNP过滤
1:缺失比例(Missing rates):( GENO> 0.05 )
Shortly we will apply more stringent criteria, such that GENO > 0.05. In this case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in 4.45 more more samples, that SNP will be removed from the dataset.
不久将来,我们将采用更严格的标准,比如GENO> 0.05。在这种情况下,0.05 * 89 = 4.45样本,这意味着如果SNP在4.45多个样本中丢失,则SNP将从数据集中删除。
2:最小等位基因频率(Minor Allele frequencies)( MAF< 0.03 如果SNP较多可以设置为MAF<0.05)
MAF is the Minor Allele Frequency. It can be used to exclude SNPs which are not informative because they show little variation in the sample set being analyzed. For instance, if a SNP shows variation in only 1 of the 89 individuals, it is not useful statistically and should be removed.
MAF是次要等级线频率。它可以用于排除不信息的SNP,因为它们在被分析的样本集中几乎没有变化。例如,如果SNP仅显示89个个体中的1个,则在统计学上不是有用的,应该被去除。
3:Removing SNPs out of Hardy-Weinberg equilibrium(p-value > 10?6 - 10?4 )
Population genetic theory suggests that under ‘normal’ conditions, there is a predictable relationship between allele frequencies and genotype frequencies. In cases where the genotype distribution is different from what one would expect based on the allele frequencies, one potential explanation for this is genotyping error. Natural selection is another explanation. For this reason, we typically check for deviation from Hardy-Weinberg equilibrium in the controls for a case- control study. For a quantitative trait, PLINK just uses everyone. The following command generates p-values for deviation from HWE for each SNP. Low p-values indicate that a SNP is out of HWE.
人口遗传理论认为,在“正常”条件下,等位基因频率与基因型频率之间存在可预测的关系。在基因型分布与基于等位基因频率的预期不同的情况下,一个潜在的解释是基因分型错误。自然选择是另一个解释。因此,我们通常检查病例对照研究对照组中Hardy-Weinberg平衡的偏差。对于数量特质,PLINK只是使用每个人。以下命令生成每个SNP偏离HWE的p值。低p值表示SNP超出了HWE。
4:如果你有vcf文件,可以先用vcftools转换为plink的输入形势,输出结果为:.bed与.map文件,然后以此作为输入进行过滤: vcftools --vcf my.vcf --plink --out plink
plink --noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed --out QC 参考文献:
Roshyara N R, Kirsten H, Horn K, et al. Impact of pre-imputation SNP-filtering on genotype imputation results[J]. BMC genetics, 2014, 15(1): 1.
Pongpanich M, Sullivan P F, Tzeng J Y. A quality control algorithm for filtering SNPs in genome-wide association studies[J]. Bioinformatics, 2010, 26(14): 1731-1737.






正在阅读:
GWAS笔记SNP过滤03-09
美丽奇妙的大自然作文350字06-19
厦门会计从业资格无纸化考试新大纲主要经济业务事项账务处理考前冲刺试题-厦门会计之家10-28
GWAS笔记SNP过滤12-25
国家电网公司招聘高校毕业生应聘登记表07-23
《环境生态学》课程教案03-28
空军副政治委员——赵以良空军中将05-28
准公共物品03-16
常用字五行细分字库大全05-18
书法创作常用诗词对联01-19
- 天大砼方案 - 图文
- 农业科技网络书屋能力提升_玉米错题选
- DNS习题
- 浅议检察官对罪犯谈话的技巧与效果
- 高考语文文言文翻译专题训练
- AB类学科竞赛目录(2015)
- 建筑面积计算新规定(2015最新)
- Revit2012初级工程师题集一
- 十三五项目米线可行性报告
- 2013体育学院党组织建设工作总结
- 2014Revit工程师题库
- 高中数学如何实施研究性学习
- 茶艺表演 中英互译
- 小学音乐湘文艺版 四年级下册 第十一课《(歌表演)脚印》优质课公
- 山西省农村合作经济承包合同管理条例
- 2015年镇江市中考化学一模试题参考答案及评分标准(定稿)
- 统计 题集
- 批评意见清单
- 8潞安集团蒲县黑龙关煤矿矿业公司2
- 鄂教版四年级语文上册复习精要(光谷四小)
- 过滤
- 笔记
- GWAS
- SNP
- 二级 第一篇 人力资源规划 知识要点
- 邯郸市建设局关于印发关于进一步加强廉政风险防控深化权力运行
- 关于无穷级数求和问题的探讨毕业论文
- 世界汽车大事年表
- 半年度工作总结2118年销售部门上半年总结及下半年计划
- final翻译--CMAA70-1 - 图文
- “走下网络、走出宿舍、走向操场”主题活动通知
- 难点81 如何选用合适的句式-备战高考语文之难点突破100讲 Word版
- 人教版必修一经济生活8.2征税和纳税作业
- 2016年盐城一调电子电工试卷
- 第17课 内战烽火人教版八年级上册历史 第17课 内战烽火 教案02 -
- 小学语文生成性课堂教学的驾驭艺术探讨
- 大象版四年级科学上册 期末复习题
- 高中物理电磁感应知识点汇总
- SQL复习题及答案
- 四年级品德与社会上册第二单元我爱我家4怎样面对失败教学设计2未
- 2013年高考化学总复习 选择题百题精炼(第2期)专题01 化学用语
- 18年高考化学二轮复习三道题经典专练6化学反应原理综合考查题二
- 2018-2019年初中数学浙教版《七年级上》《第5章 一元一次方程》
- 2017秋八年级数学上册14.2.3三边分别相等的两个三角形学案无答案