GATK PoN相关

检测正常样本

要求是不能有mnp

gatk Mutect2 -R reference.fasta \
	-I normal.bam \
	-max-mnp-distance 0 \
	-L target.bed \
	-O normal.vcf.gz

导入pon需要有索引,以往没有索引的vcf可以这样重建索引

gatk IndexFeatureFile -F normal.vcf

如果需要压缩再建立索引可以

bgzip normal.vcf
tabix -p vcf normal.vcf.gz

建立新pon数据库

可以通过写多次-V导入vcf或者利用–sample-name-map传入vcf的路径。

gatk GenomicsDBImport -R reference.fasta \
	-L target.bed \
	--genomicsdb-workspace-path pon_path \
	-V normal1.vcf.gz \
	-V normal2.vcf.gz \
	-V normal3.vcf.gz

传入路径文件sample.list格式如下

sample1	sample1.vcf.gz
sample2	sample2.vcf.gz
sample3	sample3.vcf.gz

使用

gatk GenomicsDBImport -R reference.fasta \
	-L target.bed \
	--genomicsdb-workspace-path pon_path \
	--sample-name-map sample.list

新样本加入已存在的pon

可以往pon数据库中加入新样本,传入方式同上,主要修改–genomicsdb-update-workspace-path参数。

gatk GenomicsDBImport \
	-L target.bed \
	--genomicsdb-update-workspace-path pon_path \
	--sample-name-map sample.list

生成pon vcf

生成用于mutect2的pon.vcf。注意,”gendb://”是必须加到自己的pon数据库路径前的。

gatk CreateSomaticPanelOfNormals -R reference.fasta \
	-V gendb://pon_path -O pon.vcf.gz

GATK 官方 pon

在GATK的google bundle里可以找到提供的pon。