当前位置:首页 >> 生物学 >>

基于全基因组snp数据如何进行主成分分析


1)全基因组 snp 数据格式为 .vcf 2)利用 vcftools 软件进行格式转换:vcftools --vcf tmp.vcf --plink --out tmp 此时会生成两个文件:tmp.ped 和 tmp.map 3) 利用 plink 软件进行数据格式转换: ./plink --noweb --file tmp --make-bed --out tmp 注意, 输入文件和输出文件都不需要文件名的后缀, 此时生成 3 个文件: tmp.bed, tmp.bim 和 tmp.fam 4)利用 gcta 软件进行 pca 构建 4.1 ./gcta --bfile tmp --make-grm --autosome --out tmp 此时生成一个文件:tmp.grm.gz 4.2 ./gcta --grm tmp --pca 3 --out pcatmp 此时生成两个文件:pcatmp.eigenval 和 pcatmp.eigenvec 5)将生成的 pcatmp.eigenvec 用文本编辑器打开,在最上面加入一行:1 2 pc1 pc2 pc3 (之间以空格隔开) ,保存 6)打开 R 软件 6.1 输入文件:a <- read.table("D:/pcatmp.eigenvec", header=TRUE) 6.2 绘 散 点 图 : plot(a$pc1,a$pc2, pch=c(1,2,3,4,5,6,7,8,9,10),

col=c(1,2,3,4,5,6,7,8,9,10) , main="pca",xlab="pc1",ylab="pc2") 6.3 添 加 图 例 : legend("bottomleft", pch=c(1,2,3,4,5,6,7,8,9,10),

c("CL","IN","GZ","DA","PP","YN","DX","JY","NP","SL"), col=c(1,2,3,4,5,6,7,8,9,10)) 文件 > 另存为 > Jpeg or Tiff

That's all, Game over. 再次向基因组-health (213256700)予以致谢!


赞助商链接
相关文章:
SNP分析命令
在 5.pca.evec 文件中可以看到主成分占的比例。 7 原始 SNP 数据转化成 map 和 ped 文件 >data=...全基因组关联分析 plink --file data --remove my...
Affymetrix 全基因组 SNP 芯片检测
Affymetrix 全基因组 SNP 芯片检测单核苷酸多态性(single nucleotide polymorphism,...检测原理| 技术优势| 产品列表| 定制芯片| 数据分析|基于 GeneChip 平台的人 ...
全基因组关联分析
SNP) 进行总体关联分析的 方法, 即在全基因组范围内选择遗传变异进行基因分型,...在后 GWAS 时代,利用已有的 GWAS 数据在多个人群间进行 meta 分析已经成为一...
全基因组关联分析(GWAS)解决方案
※ 实验技术流程 ※ 基于芯片的 GWAS Affymetrix 公司针对人类全基因组 SNP ...※ 计算中心 GWAS 案例 华中农业大学玉米农艺性状 GWAS 数据分析。 基因型为...
SNP检测方法汇总
实现绝大多数 SNP 位点的分型都能用 RFLP 分析来...尤其适合针对全基因组 SNP 关联研究 获得的初步阳性...该技术的数据准确性超过 98%,仅次于测序和 SNaPshot...
SNP检测方法汇总
全基因组测序 这是最贵的方法,但也是看 SNP 最全...数据分析得到 SNP 位点结果 SNPlex 中等偏高通量的...特异的引物做多重 PCR,把模板进行扩增 基于毛细管...
全基因组重测序数据分析_图文
全基因组重测序数据分析_生物学_自然科学_专业资料。全基因组重测序数据分析 1...在分析中使用到的 SNP 识别算法包括 基于贝叶斯和基因型似然值计算的方法, 以及...
翻译
全基因组 SNP 基因分型结果进行使用 Affymetrix 人类全基因组 SNP 6.0 数组和 ...基因表达分析 微阵列数据可以在两个批次,一个基于版本 2 数组(48701 调查,307...
Natural Variation in the Promoter of GSE5 Contribut...
在这项研究中,我们通过将全基因组关联研 究与功能...基于这些核苷酸 多态性,我们进行主成分分析(PCA)...然后,我们使用这些 SNP 分析了这 102 个籼稻品种的...
全基因组关联分析在畜禽上的应用
基因组计划的完成和 SNP 数据库的建立为 GWAS 的...研究人员一直致力于影响复杂性状的标记 及主效基因的...TDT) 和基于回归分析的混合模型方法 (Mixed model ...
更多相关标签: