XHMM检测CNV

[XHMM](https://bitbucket.org/statgen/xhmm/src/master/)是一个用PCA降噪+HMM方法来检测全外显子CNV的软件。软件[文档](https://statgen.bitbucket.io/xhmm/tutorial.html)可在这里查看。

MitoMap 数据库

[MitoMap](https://mitomap.org/foswiki/bin/view/MITOMAP/WebHome)是人类线粒体基因组数据库,除可以直接在线查询线粒体坐标的注释与相关文献研究外,还可以在线分析fasta序列(我没用过)。当然,最值得使用的方式是下载MitoMap提供的注释文件,形成自己的注释数据库。

参考转录本

大部分时候,报告结果上呈现的cDNA及氨基酸突变等,都是以某个转录本为参考的。不同转录本的位置会有差异。

再整理一次测序数据去重流程

二代测序PCR过程中会产生duplications,为了下游分析的正确,一般需要进行去重操作。最常用的去重工具是picard MarkDuplicates。picard MarkDuplicates默认计算比对后的Reads,当存在Start与End以及序列一致的情况时,再计算这些reads的比对质量值之和,取其中最大的作为模板,其他作为duplications并在flag值中加上1024进行标记...