sambamba与varscan2的使用

现在的肿瘤方向分析流程我用的是

比对:BWA

排序:samtools

去重:gatk Markduplicates

校正:gatk BaseRecalibrator + gatk ApplyBQSR

变异检测:gatk Mutect2

尝试一下另外一条路线

比对:BWA

排序:sambamba

去重:sambamba

校正:不做

变异检测:varscan2

sambamba

用sambamba的原因主要是因为比samtools快。

直接下载编译好的版本,解压就能用

wget https://github.com/biod/sambamba/releases/download/v0.8.0/sambamba-0.8.0-linux-amd64-static.gz
gunzip sambamba-0.8.0-linux-amd64-static.gz

常用的view与sort功能

sambamba view input.sam -S -h -f bam -o output.bam
sambamba sort output.bam -t 8 -o output.sort.bam

与bwa的pipe

bwa mem -t 8 -M -R "@RGxxxxx" ref.fa read1.fq.gz read2.fq.gz \
	| sambamba view /dev/stdin -S -h -f bam -o output.bam

sambamba去重和samtools去重,有空测试一下差异

sambamba markdup -t 8 -p input.bam output.bam
samtools markdup -@ 8 -O BAM input.bam output.bam

VarScan2

VarScan2也是直接下载jar包就能用了。

VarScan2 somatic 貌似只支持配对样本。

samtools mpileup -B -f ref.fa -q 15 -d 10000 tumor.bam > tumor.pileup
samtools mpileup -B -f ref.fa -q 15 -d 10000 normal.bam > normal.pileup
java -jar VarScan2.jar somatic \
	normal.pileup tumor.pileup output.prefix \
	--min-coverage-normal 10 --min-coverage-tumor 20 \
	--min-var-freq 0.02 --strand-filter 1

pipe

samtools mpileup -B -f ref.fa \
	-q 15 -d 10000 normal.bam tumor.bam \
	| java -jar VarScan2.jar somatic \
	-mpileup output.prefix \
	--min-coverage-normal 10 --min-coverage-tumor 20 \
	--min-var-freq 0.02 --strand-filter 1