用seq2HLA做HLA分型

最近在研究二代测序数据的HLA分型,找了一大堆分型软件。 很多安装过程和配置过程都很麻烦。

对比起来,这个是过程最简单的。

这是项目的页面seq2HLA seq2hla

项目已经从bitbucket搬迁到了github了。

下载软件并解压

wget https://bitbucket.org/sebastian_boegel/seq2hla/get/seq2HLA_v2.2.tar.gz
tar -zxvf seq2HLA_v2.2.tar.gz

软件的运行需要bowtie,要先安装好并加载到环境变量中。 可以使用conda安装

conda install bowtie

也可以从官网安装。

可以参照软件自带的说明

python seq2HLA.py -h

如果数据是多条lane的数据,可以先合并起来。举个例子。

zcat read_L1_1.fq.gz read_L2_1.fq.gz > read_1.fq.gz
zcat read_L1_2.fq.gz read_L2_2.fq.gz > read_2.fq.gz

我们只需要使用一个简单命令就好了。数据需要的是双端的fq数据,支持gz压缩格式。

python seq2HLA -1 read_1.fq.gz -2 read_2.fq.gz -r output > output_summary.txt

最后的结果是这样的: results