检测正常样本
要求是不能有mnp
gatk Mutect2 -R reference.fasta \
-I normal.bam \
-max-mnp-distance 0 \
-L target.bed \
-O normal.vcf.gz
导入pon需要有索引,以往没有索引的vcf可以这样重建索引
gatk IndexFeatureFile -F normal.vcf
如果需要压缩再建立索引可以
bgzip normal.vcf
tabix -p vcf normal.vcf.gz
建立新pon数据库
可以通过写多次-V导入vcf或者利用–sample-name-map传入vcf的路径。
gatk GenomicsDBImport -R reference.fasta \
-L target.bed \
--genomicsdb-workspace-path pon_path \
-V normal1.vcf.gz \
-V normal2.vcf.gz \
-V normal3.vcf.gz
传入路径文件sample.list格式如下
sample1 sample1.vcf.gz
sample2 sample2.vcf.gz
sample3 sample3.vcf.gz
使用
gatk GenomicsDBImport -R reference.fasta \
-L target.bed \
--genomicsdb-workspace-path pon_path \
--sample-name-map sample.list
新样本加入已存在的pon
可以往pon数据库中加入新样本,传入方式同上,主要修改–genomicsdb-update-workspace-path参数。
gatk GenomicsDBImport \
-L target.bed \
--genomicsdb-update-workspace-path pon_path \
--sample-name-map sample.list
生成pon vcf
生成用于mutect2的pon.vcf。注意,”gendb://”是必须加到自己的pon数据库路径前的。
gatk CreateSomaticPanelOfNormals -R reference.fasta \
-V gendb://pon_path -O pon.vcf.gz
GATK 官方 pon
在GATK的google bundle里可以找到提供的pon。