分析SV的软件,被多次提到的有crest、breakdancer、lumpy。 这里使用lumpy进行分析。
lumpy安装
lumpy的安装比较简单
git clone --recursive https://github.com/arq5x/lumpy-sv.git
cd lumpy-sv
make
使用
lumpy的原始输入是bam文件,但是需要注意的是bam文件必须有RG信息。一般的,在bwa比对时使用-R参数,或者比对后使用gatk AddOrReplaceReadGroups来加入RG信息。
先得到比对到不同地方的reads
samtools view -bh -F 1294 sample.bam \
| samtools sort -@ 8 - -o sample.discordants.bam
再得到存在soft clipped的reads
samtools view -h sample.bam \
| lumpy-sv/scripts/extractSplitReads_BwaMem \
-i stdin | samtools view -bSh - \
| samtools sort -@ 8 - -o sample.splitters.bam
最后运行lumpy得到sv
lumpyexpress -B sample.bam \
-D sample.discordants.bam \
-S sample.splitters.bam \
-o sample.lumpy.vcf
基因型确定
可以使用svtyper,使用的bam文件需要有索引文件,可使用samtools index建立
安装,必须注意的是svtyper基于python2.7。
pip2 install git+https://github.com/hall-lab/svtyper.git --user
使用
svtyper-sso \
-i sample.lumpy.vcf \
-B sample.bam \
--cores 8 \
-o sample.gt.vcf