爬取DECIPHER Genomics数据库2021-04-13[DECIPHER](https://www.deciphergenomics.org)数据库收集了关于拷贝数变异的已知综合征及病例信息。本次爬取主要是收集里面每个基因的pLI、LOEUF、sHet、%HI等值,其他内容并不在目标中。#coding
HLA区域reads提取2021-04-08一般的HLA分析软件需求输入fastq文件或bam文件,更建议是从fastq出发。使用全外的数据或大panel数据比对后,再从比对完成后的bam文件中提取出HLA区域的reads,形成较小的fastq,方便后续分析。#database
尝试接近illumina TSO500 分析流程2021-03-26从illumina公布的[文档](https://support.illumina.com/content/dam/illumina-support/documents/documentation/software_documentation/trusight/trusight-oncology-500/trusight-oncology-500-local-app-v2.2-user-guide...#default
爬取CHPO数据库2021-03-18CHPO即[china HPO](http://www.chinahpo.org/),是在中文人类表型标准用语联盟倡导下建立的一个公共网站,希望提供一个共享的平台有助于研究人员和医学专家共同翻译编辑Human Phenotype Ontology,以形成一个中文版的HPO。#coding
爬取CKB数据库2021-03-09Jax Ckb是比较常用的肿瘤相关位点注释的数据库。[曾几何时](https://pzweuj.github.io/2018/06/10/ckb-jax.html)数据库还是免费查询的,现在部分基因如EGFR已经转到了高级版本中,不过免费版还是能查若干基因的。#coding