挑选一批SNP位点用于分析污染
在实验流程中,由于气溶胶、或者实验操作不当等,可能会造成样本间存在污染,在设计的Panel中,加入一批人群频率为0.5左右的SNP位点,这种位点的检出丰度在理想状态下是0,50%,100%。如果检出的值偏差较大,则提示可能存在污染。
WDL流程中导入文件夹
在集群中使用WDL流程语言,会通过singularity镜像导入环境。但是,一些巨大的数据库不可能封装进镜像中。之前在使用annovar等注释软件时,我都是不打包为镜像而是在各个节点中都安装上软件的,然后通过在WDL中写入数据库的路径来达到对应效果。