HLA区域reads提取

一般的HLA分析软件需求输入fastq文件或bam文件,更建议是从fastq出发。使用全外的数据或大panel数据比对后,再从比对完成后的bam文件中提取出HLA区域的reads,形成较小的fastq,方便后续分析。

尝试接近illumina TSO500 分析流程

从illumina公布的[文档](https://support.illumina.com/content/dam/illumina-support/documents/documentation/software_documentation/trusight/trusight-oncology-500/trusight-oncology-500-local-app-v2.2-user-guide...

爬取CHPO数据库

CHPO即[china HPO](http://www.chinahpo.org/),是在中文人类表型标准用语联盟倡导下建立的一个公共网站,希望提供一个共享的平台有助于研究人员和医学专家共同翻译编辑Human Phenotype Ontology,以形成一个中文版的HPO。

爬取CKB数据库

Jax Ckb是比较常用的肿瘤相关位点注释的数据库。[曾几何时](https://pzweuj.github.io/2018/06/10/ckb-jax.html)数据库还是免费查询的,现在部分基因如EGFR已经转到了高级版本中,不过免费版还是能查若干基因的。

根据转录本号找内含子

总所周知,融合基因的断点大都在内含子上,这时我们有一个基因的转录本号,比如NM_004304(ALK),需要找到18号内含子。