当前位置:首页 >> 生物学 >>

基于全基因组snp数据如何进行主成分分析


1)全基因组 snp 数据格式为 .vcf 2)利用 vcftools 软件进行格式转换:vcftools --vcf tmp.vcf --plink --out tmp 此时会生成两个文件:tmp.ped 和 tmp.map 3) 利用 plink 软件进行数据格式转换: ./plink --noweb --file tmp --make-bed --out tmp 注意, 输入文件和输出文件都不需要文件名的后缀, 此时生成 3 个文件: tmp.bed, tmp.bim 和 tmp.fam 4)利用 gcta 软件进行 pca 构建 4.1 ./gcta --bfile tmp --make-grm --autosome --out tmp 此时生成一个文件:tmp.grm.gz 4.2 ./gcta --grm tmp --pca 3 --out pcatmp 此时生成两个文件:pcatmp.eigenval 和 pcatmp.eigenvec 5)将生成的 pcatmp.eigenvec 用文本编辑器打开,在最上面加入一行:1 2 pc1 pc2 pc3 (之间以空格隔开) ,保存 6)打开 R 软件 6.1 输入文件:a <- read.table("D:/pcatmp.eigenvec", header=TRUE) 6.2 绘 散 点 图 : plot(a$pc1,a$pc2, pch=c(1,2,3,4,5,6,7,8,9,10),

col=c(1,2,3,4,5,6,7,8,9,10) , main="pca",xlab="pc1",ylab="pc2") 6.3 添 加 图 例 : legend("bottomleft", pch=c(1,2,3,4,5,6,7,8,9,10),

c("CL","IN","GZ","DA","PP","YN","DX","JY","NP","SL"), col=c(1,2,3,4,5,6,7,8,9,10)) 文件 > 另存为 > Jpeg or Tiff

That's all, Game over. 再次向基因组-health (213256700)予以致谢!


赞助商链接
相关文章:
主成分分析SPSS操作步骤
主成分分析SPSS操作步骤_计算机软件及应用_IT/计算机_专业资料。临沂大学建筑学院房地产系 主成分分析 SPSS 操作步骤以教材第五章习题 8 的数据为例,演示并说明主...
全基因组重测序数据分析_图文
全基因组重测序数据分析_生物学_自然科学_专业资料。全基因组重测序数据分析 1...在分析中使用到的 SNP 识别算法包括 基于贝叶斯和基因型似然值计算的方法, 以及...
硕士毕业论文-全基因组SNP分子标记开发
基于 Windows XP 和 Linux 操作系统构建数据分析系统...聚类与拼接发掘出遍布全基因组的 80363 个 SNP 位...QTL)定位于更小的染色体区域内,为 新主效基因的...
基于R软件的主成分分析
R 软件第二次作业——基于 R 软件的主成分分析 学院:应用科学学院 班级:统计...(psjt,type="line",main='碎石图',lwd=2)#对数据做碎石图 从碎石图上...
Affymetrix 全基因组 SNP 芯片检测
Affymetrix 全基因组 SNP 芯片检测_生物学_自然科学_专业资料。Affymetrix 全基因...检测原理| 技术优势| 产品列表| 定制芯片| 数据分析|基于 GeneChip 平台的人 ...
全基因组关联分析
SNP) 进行总体关联分析的 方法, 即在全基因组范围内选择遗传变异进行基因分型,...在后 GWAS 时代,利用已有的 GWAS 数据在多个人群间进行 meta 分析已经成为一...
SNP分析命令
在 5.pca.evec 文件中可以看到主成分占的比例。 7 原始 SNP 数据转化成 map 和 ped 文件 >data=...全基因组关联分析 plink --file data --remove my...
如何利用SPSS进行主成分分析
,因此对此栏不作变动, 就是认可了主成分分析方法。 在 Analyze 栏中,选中 Correlation matirx 复选项,则因子分析基于数据的相关系数 矩阵进行分析;如果选中 ...
主成分分析(SPSS)操作详细步骤
主成分分析在 SPSS 中的操作应用 SPSS 在调用 Factor Analyze 过程进行分析时,SPSS 会自动对原始数据进行 标准化处理,所以在得到计算结果后指的变量都是指经过标准...
主成分分析实例
主成分分析实例_数学_自然科学_专业资料。在统计学中,主成分分析(principal components analysis, PCA)是一种 简化数据集的技术。 它是一个线性变换。这个变换把...
更多相关标签: