简单实用的转座子插入分析软件TIEA-WES

#software

TIEA-WES(Transposon Insertion Event Analyzer for Whole Exome Sequencing)是一个专门用于从全外显子测序(WES)数据中检测转座子插入事件的工具。

🔬 支持检测的转座子类型

  • Alu - SINE家族中最丰富的转座子
  • LINE-1 (L1) - 人类基因组中最活跃的逆转录转座子
  • SVA - 复合型逆转录转座子
  • HERV - 人类内源性逆转录病毒

✨ v2.0 新特性

v2.0是一次完全重构,性能大幅提升:

  1. 单次遍历处理 - 合并了原来Step 1-3,BAM处理速度提升3倍
  2. 双向检测 - 支持5'和3'方向的softclip检测,灵敏度更高
  3. MAPQ过滤 - 默认过滤MAPQ<20的reads,降低假阳性
  4. 断点聚类 - 自动合并相近位置的断点,输出更干净
  5. 管道解析 - 直接解析BWA输出,无需中间SAM文件
  6. 自动识别参考基因组 - 从BAM header自动检测hg19/hg38等

📦 安装方式

Docker安装(推荐):

docker build -t tiea-wes:2.0 .
docker run --rm -v /path/to/data:/data tiea-wes:2.0 \
    python /app/TIEA-WES.py -p sample -i /data/sample.bam -o /data/output

原生安装:

git clone https://github.com/pzweuj/TIEA-WES.git
# 需要安装 pandas, pysam, BWA

🚀 快速使用

python TIEA-WES.py -p sample -i sample.bam -o output_dir

可选参数:

  • -s 10 最小支持reads数
  • -l 36 最小softclip长度
  • -q 20 最小MAPQ值
  • -w 10 断点聚类窗口(bp)
  • --threads 4 BWA线程数

📄 输出格式

输出标准VCF文件 <prefix>.te.result.vcf,包含:

  • <INS:ME:ALU> - Alu插入
  • <INS:ME:LINE1> - LINE-1插入
  • <INS:ME:SVA> - SVA插入
  • <INS:ME:HERV> - HERV插入

INFO字段包含支持reads数、置信度、插入方向、TE家族匹配信息等完整信息。

🔄 与主流软件对比

特性 TIEA-WES MELT xTEA
适用数据 WES + Targeted WGS + WES WGS + WES + Targeted
支持TE类型 Alu/L1/SVA/HERV Alu/L1/SVA Alu/L1/SVA/HERV
检测策略 Softclip Discordant+Split+Assembly Discordant+Split+Assembly
运行速度 ⚡ 快 较慢 中等
使用难度 简单 较复杂 中等
群体分析

选择建议:

  • WES快速筛查 → TIEA-WES(轻量、快速、易用)
  • WGS群体研究 → MELT(高灵敏度、群体分析)
  • 多平台/长读长 → xTEA(支持最广泛)

🔗 项目地址

GitHub: https://github.com/pzweuj/TIEA-WES


#生信工具 #转座子 #WES分析 #结构变异