基于全基因组snp数据如何进行主成分分析

更新时间:2023-11-14 21:38:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1)全基因组snp数据格式为 .vcf

2)利用vcftools软件进行格式转换:vcftools --vcf tmp.vcf --plink --out tmp 此时会生成两个文件:tmp.ped 和 tmp.map

3)利用plink软件进行数据格式转换:./plink --noweb --file tmp --make-bed --out tmp 注意,输入文件和输出文件都不需要文件名的后缀,此时生成3个文件:tmp.bed,tmp.bim 和 tmp.fam

4)利用gcta软件进行pca构建

4.1 ./gcta --bfile tmp --make-grm --autosome --out tmp 此时生成一个文件:tmp.grm.gz

4.2 ./gcta --grm tmp --pca 3 --out pcatmp

此时生成两个文件:pcatmp.eigenval 和 pcatmp.eigenvec

5)将生成的pcatmp.eigenvec用文本编辑器打开,在最上面加入一行:1 2 pc1 pc2 pc3(之间以空格隔开),保存 6)打开R软件

6.1 输入文件:a <- read.table(\6.2

plot(a$pc1,a$pc2,

pch=c(1,2,3,4,5,6,7,8,9,10),

col=c(1,2,3,4,5,6,7,8,9,10) , main=\6.3

legend(\pch=c(1,2,3,4,5,6,7,8,9,10),

c(\col=c(1,2,3,4,5,6,7,8,9,10)) 文件 > 另存为 > Jpeg or Tiff

That's all, Game over. 再次向基因组-health (213256700)予以致谢!

本文来源:https://www.bwwdw.com/article/ghmv.html

Top