介绍
delly 是一款结构变异 (SV) 预测软件,可以单个碱基的分辨率检测基因分型和可视化缺失、串联重复、倒位和易位等结构变异。它使用双端reads、split reads和reads深度来检测结构变异。下游可使用sansa进行注释。
软件当前最新版本是1.0.3,开源许可是BSD3。
安装delly
软件已经预编译,下载下来就能用,同时还提供了一个singluarity的镜像。
wget https://github.com/dellytools/delly/releases/download/v1.0.3/delly_v1.0.3_linux_x86_64bit
chmod +x delly_v1.0.3_linux_x86_64bit
ln -s delly_v1.0.3_linux_x86_64bit delly
./delly
使用delly
软件输入是bam文件
delly call -g reference.fa -o sample.bcf sample.bam
可以加入-x参数定义排除的区域,delly提供了hg19、hg38等基因组的排除区域文件。
delly call -x hg19.excl -g reference.fa -o sample.bcf sample.bam
如果是配对样本,则是
delly call -x hg19.excl -g reference.fa -o sample.bcf tumor.bam normal.bam
输出结果是bcf,可使用bcftools转换为vcf。
bcftools view sample.bcf > sample.vcf
结果注释
使用sansa进行注释。注释需要使用gtf文件,实测使用UCSC的gtf未能成功,使用ensembl的成功了。UCSC的gtf下载地址点这里,ensembl的点这里。输入文件可以是vcf也可以是bcf。
sansa annotate -g Homo_sapiens.GRCh37.87.gtf.gz sample.vcf -o sample.tsv.gz -i gene_name
但是整体输出结果仍然是缺失很多信息的,比如实际断点的所在的内含子编号/外显子编号,支持的reads数以及双侧断点的深度等。因此关于注释此步建议是自行编写脚本进行。