背景
数据来源是精神病学基因组学联盟
可在这里申请下载数据。
参考文献PMID25056061
使用qqman包进行曼哈顿图等可视化分析。
安装R包
install.packages("qqman")
载入与初始化
library("qqman")
# 读入
SCZ <- read.table('rall.txt', header=TRUE, sep="\t")
# 由于曼哈顿图需要的CHR变量是数字(int),所以需要先把原始文件里的hg19chrc这一列改造一下
# 如把chr1改成1,把chrX改成23
# 去掉chr
SCZ$hg19chrc <- gsub("chr", "", SCZ$hg19chrc)
# 将X改成23
SCZ$hg19chrc <- gsub("X", "23", SCZ$hg19chrc)
# 把hg19chrc这一列的类型改成int
SCZ$hg19chrc <- as.integer(SCZ$hg19chrc)
# 大概是需要一条准线
genomeWideLine = 0.05 / nrow(SCZ)
画图
# 画曼哈顿图
manhattan(SCZ, chrlabs=c(1:22, "X"), genomewideline=-log10(genomeWideLine),
chr = "hg19chrc", bp = "bp", p = "p", snp = "snpid",
suggestiveline=FALSE, main="PGC SCZ GWAS")
输出最明显的那个染色体
# 说要输出最明显的那个染色体,明显是6号咯
manhattan(subset(SCZ, CHR==6), genomewideline=-log10(genomeWideLine),
chr = "hg19chrc", bp = "bp", p = "p", snp = "snpid",
suggestiveline=FALSE, main="PGC SCZ GWAS chr6")
最明显的点标出来
# 根据图把最明显的那个点也可视化出来
# rs115329265
manhattan(subset(SCZ, CHR==6), genomewideline=-log10(genomeWideLine),
chr = "hg19chrc", bp = "bp", p = "p", snp = "snpid",
suggestiveline=FALSE, main="Most Significant Locus",
annotatePval=1e-30, annotateTop=TRUE)
讨论
rs115329265这个位点是最显著(p值最小)的位点。原文章一开始忽略了,为什么?
在原文章的资料里看这个位点是”Locus too broad”,不在已知的基因范围内。
也有文章提了在千人基因组的数据库里,在日本人群中这个位点并没有发现多态性。
当然我觉得解释的最明确的大概是Meta-straw men in the season to be merry这篇文章,上面提到了这个位点无论是病人还是健康人的携带率都高达85%以上,很难看出有什么作用。
参考文献
Biological Insights From 108 Schizophrenia-Associated Genetic Loci
Variability of 128 schizophrenia-associated gene variants across distinct ethnic populations