找启动子

有时候,我们需要找一个基因的启动子序列。一个基因如果要表达,前面就必须有启动子。 可以通过EPD数据库来查询。

EPD数据库全称Eukaryotic Promoter Database,就是真核启动子数据库(硬核翻译)。目前收集的数据如下:

pro_0

这里测试一个SEPT9基因。选择人类数据。找到七个,随便点进去一个看看。给出了某转录本上的位置以及序列。 pro_1


其实有一个经典方法,就是在NCBI选择Gene然后搜索。然后看这里,基因方向和参考基因方向是同向还是反向的。比如说这里就是同向。一般的,启动子序列会在基因上游2000bp以内。所以这个时候就把上游2000bp的序列弄出来就好了。

pro_2

在下面选择需要的参考基因后,点击GeneBank进入,然后手动修改这里,往上游走个2000bp,点击update。注意反向的话上游也是在反向的位置。 pro_3

一般的,可以继续对这2000bp碱基进行分析。下面这里提供了很多关于启动子的工具,可以进行进一步的分析。

PROMOTERS & TERMINATORS