主页

生信懂得简单的linux就可以啦(1)

祝自己生日快乐。 因为服务器基本都是用linux系统的,而且都是命令行操作,敲着敲着看着就酷炫。所以,第一期的linux操作先介绍几个简单的命令。 pwd # 查看当前路径 pwd # 查看链接的路径 pwd -P ls # 列出当前目录下的文件和文件夹 ls # 列表模式,显示大小和权限 ls -l # 显示隐藏文件(以.开头的文件) ls -a # 以修改时间列出 ls -ltr cd # 打开文件夹 cd [dir] # 打开上层目录 cd .. # 打开上上层目录 cd ../.. # 打开主目录 cd ~ # 打开前一目录 cd - mv # 将当前目录下的a文件移动到b文件夹 mv a b/ # 一次移动多个文件 mv a1 a2 a3 ...

阅读更多

yaml

久违的更新。台湾生活节奏太慢了让我整个人变懒了。 yaml是一种配置语言。可以被很多其他的语言读取。来起到一个传入参数的作用。 首先我们要有一个配置文件,例如config.yaml languages: - R - Java - Python Alpha: a b c: 'c1' 'c2' 'c3' 例如上面的,languages和Alpha算同一等级,然后当前面有“-”,就是一个数组。我们通过引用yaml库,可以轻易的导入这堆参数。 在python中的用法 import yaml con = open('config.yaml') conf = yaml.load(con) # 这时候,conf其实就是一个dictionary。 print co...

阅读更多

放个假!

这段时间没有偷懒,只是在做我的自动化工程! 然后,准备去学郑成功。 一段时间不会更新。

阅读更多

用R处理ab1数据

不多说,直接上代码! #加载sangerseqR包 library(sangerseqR) #读入数据 seq = readsangerseq('input.ab1') #读取碱基数据,0.33指的是将达到主峰0.33的次峰定义为杂合子峰 bc = makeBaseCalls(seq, ratio = 0.33) #读主峰 primarySeq(seq) #读次峰 secondarySeq(seq) #输出可视化图像 chromatogram(bc, showcalls = 'both') 结果如下:

阅读更多

HLA分型与资料数据库

HLA是一个非常难的项目,查了无数资料和网站,发现了这个,资料很丰富。 HLA-alleles。 HLA 系统是目前所知人体最复杂的多态系统。 自1958年发现(Jean Dausset)第一个HLA抗原,到20世纪70年代, HLA便成为免疫遗传学、免疫生物学和生物化学等学科的一个重要新兴研究领域。 现在,已基本弄清其系统的组成、结构和功能,阐明了其理化性质和生物学作用。 这些研究成果不仅具有重要的理论意义,而且具有巨大的生物医学价值。 在生信的领域,主要就是通过确定HLA基因的分型,来通过分型设定对应的治疗方案。 比如说HLA-B*58:01,HLA-B*27。这是比较常见的相关区域。 HLA-alleles这个网页提供了每个HLA区域的分型表。 比如说HLA-B区 可...

阅读更多

annovar

测序下来的数据,经过variant call/SNP calling之后,想要得到更多的信息,就要拿去注释。annovar就是一款注释软件。 主要包含三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Region-based Annotation(基于区域的注释)、Filter-based Annotation(基于筛选的注释)。 第一步 安装perl。由于annovar是用perl写的,所以先要安装perl。然后,再下载annovar。下载下来的,其实是一堆perl脚本,然后windows要把这些东西弄成环境变量。 annotate_variation.pl #主程序,功能包括下载数据库,三种不同的注释 coding...

阅读更多

B-L-A-S-T!blast

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 就是说!如果你有一段序列,不管是DNA,RNA还是蛋白质序列,把它扔进blast里跑一下,就能比对出最相近的结果!也就是说,如果你不知道这段东西的是啥,blast一下你就知道啦! 原理:将你的input序列和库中的序列进行匹配度打分,分数高列出来! 首先来看看NCBI提供的在线的blast工具 可以看到,一共有五种blast!分别有什么用呢! 所查序列作一对一的序列比对。 BLASTX是核酸序列到蛋白库中的一种查询。先...

阅读更多

连金鱼都能看懂的git简明教程!

Git是一个用来做版本控制的系统。好比说,你修改了文件之后,要记录下你改了啥。同时,git允许多人协作,你在这边改了,别人那里也能看到! github则是一个码农交友网站托管代码的网站,还可以偷偷当网盘用。看名字就知道这俩东西很有关系! 这是个简明教程!不会介绍很复杂的技巧(因为我也不会)! 话不多说! windows,先去把git下载装好了! 然后,也建议装上github desktop,还有自己去申请个github账户。 初次使用git,先设置一下本地的git账户! git config --global user.name 'yourname' git config --global user.email 'yourname@yourmail.com' 然后要让gi...

阅读更多