SV分析

分析SV的软件,被多次提到的有crestbreakdancerlumpy。 这里使用lumpy进行分析。

lumpy安装

lumpy的安装比较简单

git clone --recursive https://github.com/arq5x/lumpy-sv.git
cd lumpy-sv
make

使用

lumpy的原始输入是bam文件,但是需要注意的是bam文件必须有RG信息。一般的,在bwa比对时使用-R参数,或者比对后使用gatk AddOrReplaceReadGroups来加入RG信息。

先得到比对到不同地方的reads

samtools view -bh -F 1294 sample.bam \
	| samtools sort -@ 8 - -o sample.discordants.bam

再得到存在soft clipped的reads

samtools view -h sample.bam \
	| lumpy-sv/scripts/extractSplitReads_BwaMem \
	-i stdin | samtools view -bSh - \
	| samtools sort -@ 8 - -o sample.splitters.bam

最后运行lumpy得到sv

lumpyexpress -B sample.bam \
	-D sample.discordants.bam \
	-S sample.splitters.bam \
	-o sample.lumpy.vcf

基因型确定

可以使用svtyper,使用的bam文件需要有索引文件,可使用samtools index建立

安装,必须注意的是svtyper基于python2.7。

pip2 install git+https://github.com/hall-lab/svtyper.git --user

使用

svtyper-sso \
	-i sample.lumpy.vcf \
	-B sample.bam \
	--cores 8 \
	-o sample.gt.vcf

.