生信懂得简单的linux就可以啦(2)
好烦啊
我必须快速思考,快速行动。
cp
# 复制文件,只有源文件较目的文件的修改时间新时,才复制文件
cp -u -v file1 file2
# 将文件file1复制成文件file2
cp file1 file2
# 将文件file1复制成file2,因为目的文件已经存在,所以指定使用强制复制的模式
cp -f file1 file2
# 将目录dir1复制成目录dir2
cp -R file1 file2
# 同时将文件file1、file2、file3与目录dir1复制到dir2
cp -R file1 file2 file3 dir1 dir2
# 复制时保留文件属性
cp -p a.txt tmp/
mkdir
# 在目录/usr/xx下建立子目录tes...
生信懂得简单的linux就可以啦(1)
祝自己生日快乐。
因为服务器基本都是用linux系统的,而且都是命令行操作,敲着敲着看着就酷炫。所以,第一期的linux操作先介绍几个简单的命令。
pwd
# 查看当前路径
pwd
# 查看链接的路径
pwd -P
ls
# 列出当前目录下的文件和文件夹
ls
# 列表模式,显示大小和权限
ls -l
# 显示隐藏文件(以.开头的文件)
ls -a
# 以修改时间列出
ls -ltr
cd
# 打开文件夹
cd [dir]
# 打开上层目录
cd ..
# 打开上上层目录
cd ../..
# 打开主目录
cd ~
# 打开前一目录
cd -
mv
# 将当前目录下的a文件移动到b文件夹
mv a b/
# 一次移动多个文件
mv a1 a2 a3 ...
yaml
久违的更新。台湾生活节奏太慢了让我整个人变懒了。
yaml是一种配置语言。可以被很多其他的语言读取。来起到一个传入参数的作用。
首先我们要有一个配置文件,例如config.yaml
languages:
- R
- Java
- Python
Alpha:
a
b
c:
'c1'
'c2'
'c3'
例如上面的,languages和Alpha算同一等级,然后当前面有“-”,就是一个数组。我们通过引用yaml库,可以轻易的导入这堆参数。
在python中的用法
import yaml
con = open('config.yaml')
conf = yaml.load(con)
# 这时候,conf其实就是一个dictionary。
print co...
HLA分型与资料数据库
HLA是一个非常难的项目,查了无数资料和网站,发现了这个,资料很丰富。
HLA-alleles。
HLA
系统是目前所知人体最复杂的多态系统。
自1958年发现(Jean Dausset)第一个HLA抗原,到20世纪70年代,
HLA便成为免疫遗传学、免疫生物学和生物化学等学科的一个重要新兴研究领域。
现在,已基本弄清其系统的组成、结构和功能,阐明了其理化性质和生物学作用。
这些研究成果不仅具有重要的理论意义,而且具有巨大的生物医学价值。
在生信的领域,主要就是通过确定HLA基因的分型,来通过分型设定对应的治疗方案。
比如说HLA-B*58:01,HLA-B*27。这是比较常见的相关区域。
HLA-alleles这个网页提供了每个HLA区域的分型表。
比如说HLA-B区
可...
annovar
测序下来的数据,经过variant call/SNP calling之后,想要得到更多的信息,就要拿去注释。annovar就是一款注释软件。 主要包含三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Region-based Annotation(基于区域的注释)、Filter-based Annotation(基于筛选的注释)。
第一步
安装perl。由于annovar是用perl写的,所以先要安装perl。然后,再下载annovar。下载下来的,其实是一堆perl脚本,然后windows要把这些东西弄成环境变量。
annotate_variation.pl #主程序,功能包括下载数据库,三种不同的注释
coding...
B-L-A-S-T!blast
BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。
就是说!如果你有一段序列,不管是DNA,RNA还是蛋白质序列,把它扔进blast里跑一下,就能比对出最相近的结果!也就是说,如果你不知道这段东西的是啥,blast一下你就知道啦!
原理:将你的input序列和库中的序列进行匹配度打分,分数高列出来!
首先来看看NCBI提供的在线的blast工具
可以看到,一共有五种blast!分别有什么用呢!
所查序列作一对一的序列比对。
BLASTX是核酸序列到蛋白库中的一种查询。先...
共计 232 篇文章,29 页。