主页 - 生物信息文件夹

好烦啊我必须快速思考，快速行动。 cp # 复制文件，只有源文件较目的文件的修改时间新时，才复制文件 cp -u -v file1 file2 # 将文件file1复制成文件file2 cp file1 file2 # 将文件file1复制成file2，因为目的文件已经存在，所以指定使用强制复制的模式 cp -f file1 file2 # 将目录dir1复制成目录dir2 cp -R file1 file2 # 同时将文件file1、file2、file3与目录dir1复制到dir2 cp -R file1 file2 file3 dir1 dir2 # 复制时保留文件属性 cp -p a.txt tmp/ mkdir # 在目录/usr/xx下建立子目录tes...

祝自己生日快乐。因为服务器基本都是用linux系统的，而且都是命令行操作，敲着敲着看着就酷炫。所以，第一期的linux操作先介绍几个简单的命令。 pwd # 查看当前路径 pwd # 查看链接的路径 pwd -P ls # 列出当前目录下的文件和文件夹 ls # 列表模式，显示大小和权限 ls -l # 显示隐藏文件（以.开头的文件） ls -a # 以修改时间列出 ls -ltr cd # 打开文件夹 cd [dir] # 打开上层目录 cd .. # 打开上上层目录 cd ../.. # 打开主目录 cd ~ # 打开前一目录 cd - mv # 将当前目录下的a文件移动到b文件夹 mv a b/ # 一次移动多个文件 mv a1 a2 a3 ...

久违的更新。台湾生活节奏太慢了让我整个人变懒了。 yaml是一种配置语言。可以被很多其他的语言读取。来起到一个传入参数的作用。首先我们要有一个配置文件，例如config.yaml languages: - R - Java - Python Alpha: a b c: 'c1' 'c2' 'c3' 例如上面的，languages和Alpha算同一等级，然后当前面有“-”，就是一个数组。我们通过引用yaml库，可以轻易的导入这堆参数。在python中的用法 import yaml con = open('config.yaml') conf = yaml.load(con) # 这时候，conf其实就是一个dictionary。 print co...

这段时间没有偷懒，只是在做我的自动化工程! 然后，准备去学郑成功。一段时间不会更新。

不多说，直接上代码！ #加载sangerseqR包 library(sangerseqR) #读入数据 seq = readsangerseq('input.ab1') #读取碱基数据，0.33指的是将达到主峰0.33的次峰定义为杂合子峰 bc = makeBaseCalls(seq, ratio = 0.33) #读主峰 primarySeq(seq) #读次峰 secondarySeq(seq) #输出可视化图像 chromatogram(bc, showcalls = 'both') 结果如下：

HLA是一个非常难的项目，查了无数资料和网站，发现了这个，资料很丰富。 HLA-alleles。 HLA 系统是目前所知人体最复杂的多态系统。自1958年发现(Jean Dausset)第一个HLA抗原，到20世纪70年代， HLA便成为免疫遗传学、免疫生物学和生物化学等学科的一个重要新兴研究领域。现在，已基本弄清其系统的组成、结构和功能，阐明了其理化性质和生物学作用。这些研究成果不仅具有重要的理论意义，而且具有巨大的生物医学价值。在生信的领域，主要就是通过确定HLA基因的分型，来通过分型设定对应的治疗方案。比如说HLA-B*58:01，HLA-B*27。这是比较常见的相关区域。 HLA-alleles这个网页提供了每个HLA区域的分型表。比如说HLA-B区可...

测序下来的数据，经过variant call/SNP calling之后，想要得到更多的信息，就要拿去注释。annovar就是一款注释软件。主要包含三种不同的注释方法，Gene-based Annotation（基于基因的注释）、Region-based Annotation（基于区域的注释）、Filter-based Annotation（基于筛选的注释）。第一步安装perl。由于annovar是用perl写的，所以先要安装perl。然后，再下载annovar。下载下来的，其实是一堆perl脚本，然后windows要把这些东西弄成环境变量。 annotate_variation.pl #主程序，功能包括下载数据库，三种不同的注释 coding...

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。就是说！如果你有一段序列，不管是DNA，RNA还是蛋白质序列，把它扔进blast里跑一下，就能比对出最相近的结果！也就是说，如果你不知道这段东西的是啥，blast一下你就知道啦！原理：将你的input序列和库中的序列进行匹配度打分，分数高列出来！首先来看看NCBI提供的在线的blast工具可以看到，一共有五种blast!分别有什么用呢！所查序列作一对一的序列比对。 BLASTX是核酸序列到蛋白库中的一种查询。先...

主页

生信懂得简单的linux就可以啦（2）

生信懂得简单的linux就可以啦（1）

yaml

放个假！

用R处理ab1数据

HLA分型与资料数据库

annovar

B-L-A-S-T!blast