介绍
同源重组修复缺陷(Homologous Recombination Deficiency, HRD),这个marker可以用于指导铂类和PARP抑制剂获益状态。
目前已获得FDA批准的产品有FoundationOne CDx和Myriad Genetics myChoice Test。按照FoundationOne CDx的方案,判断HRD状态需合并gLOH来判断:
HRD状态 | BRCA状态 | LOH≥16% |
---|---|---|
HRD+ | BRCA+ | Yes |
HRD+ | BRCA+ | No |
HRD+ | BRCA- | Yes |
HRD- | BRCA- | No |
即当满足BRCA发现致病突变或LOH≥16%其中一个条件即可判断为HRD阳性。
而Myriad Genetics myChoice则是除了BRCA致病突变外,需要对杂合性缺失(LOH)、端粒等位基因不平衡(TAI)、大片段迁移(LST)三个指标进行打分,当BRCA发现致病突变或三个指标得分总和≥42,判断为HRD阳性。当然,也有HRR基因致病突变及三个指标的组合。
FDA批准关于前列腺癌的14个HRR基因,查看pdf。
数据分析流程
BRCA等基因的致病位点发现使用常规的SNV、indel、重排等分析流程即可,这里将使用scarHRD对杂合性缺失(LOH)、端粒等位基因不平衡(TAI)、大片段迁移(LST)三个指标进行打分。
scarHRD适用于全基因组和panel检测数据(panel设计比较关键),用于配对样本。
这个R包需要先使用sequenza、ASCAT、facets、TitanCNA等软件获得肿瘤的纯度和倍性。
scarHRD推荐使用sequenza,但是需要注意要安装2.1.2或者2.1.1版本的sequenza,使用3.0版本会报错,scarHRD已经比较久没有更新,与sequenza 3.0版本不兼容。看了一些文章,WGS数据使用TitanCNA+scarHRD,panel数据(包括WES)使用sequenza+scarHRD效果较好。
scarHRD中提供了两个example,test1应该是来源于sequenza,而test2应该是来源于ASCAT。
使用scarHRD分析
Rscript -e 'scarHRD::scar_score("test1.small.seqz.gz", reference="grch38", seqz=TRUE)'
Rscript -e 'scarHRD::scar_score("test2.txt", reference="grch38", seqz=FALSE)'
Pipeline
使用sequenza与scarHRD分析。
先建立GC校对文件
sequenza-utils gc_wiggle -f hg19.fa -w 50 -o - \
| gzip > hg19.gc50Base.txt.gz
然后分析
sequenza-utils bam2seqz -gc hg19.gc50Base.txt.gz \
--fasta hg19.fa \
-n normal.bam \
-t tumor.bam \
| sequenza-utils seqz_binning -w 50 -s - \
| gzip > tumor.seqz.gz
最后使用scarHRD分析
Rscript -e 'scarHRD::scar_score("tumor.seqz.gz", reference="grch37", seqz=TRUE, chr=TRUE)'
测试中ploidy的输出运行报错,原因未知。
docker
做了一个docker镜像,已经封装了scarHRD、sequenza以及TitanCNA。网络不好,build了好几次才成功的,后来还发现docker在build的时候遇到R包安装失败不会退出,应该是因为R包安装只是print出错误。不知道怎么处理,只能每次安装完后检查一下有没有装成功,比较难装上的包都这样写,以下是dockerfile写法例子。
RUN Rscript -e 'install.packages("devtools")' -e 'if (!library(devtools, logical.return=T)) quit(status=10)'
docker拉取scarHRD
docker pull pzweuj/scarhrd:2020aug
scarHRD、sequenza-utils、titanCNA.R均已在环境中。docker中加入了一个调用scarHRD运行脚本,使用方式:
docker run --rm pzweuj/scarhrd:2020aug scarHRD
参考资料
Homologous recombination repair deficiency (HRD): From biology toclinical exploitation