通过SnapGene软件进行基因标注
01基因结构

①非编码区
定义
非编码区(Non-coding region)是不能够转录为相应信使RNA,也不能指导蛋白质合成的区段,通常位于编码区前后,同属于一个基因,控制基因的表达和强弱。
功能
在非编码区上含有RNA聚合酶结合位点、启动子、回文序列等,可以调控遗传信息的表达。
②编码区
定义
编码区是细胞DNA的一部分,是能够转录信使RNA的部分,可以合成相应的蛋白质。
功能
转录出mRNA,指导蛋白质合成。
③增强子
增强子是DNA上一小段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游,且不一定接近所要作用的基因(由于染色质的缠绕结构,可以使序列上相隔很远的位置也有机会相互接触)。
④启动子
启动子是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,含有RNA 聚合酶特异性结合和转录起始所需的保守序列,多数位于结构基因转录起始点的上游,启动子本身不被转录。
⑤外显子
外显子(expressed region)是真核生物基因的一部分。它在剪接(Splicing)后会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟RNA中的基因序列,又称表达序列。
⑥内含子
内含子(Intron)又称间隔顺序,指一个基因或mRNA分子中无编码作用的片段,是真核生物细胞DNA中的间插序列。这些序列被转录在前体RNA中,经过剪接被去除,最终不存在于成熟RNA分子中。
注:
1)只有真核生物才有内含子和外显子。原核细胞只有编码区和非编码区,没有内含子和外显子之分。
2)外显子属于编码区。含有外显子的基因能转录出前体RNA,再由内含子转录出来的部分进行自我切割,才得到成熟的mRNA,没有内含子也就没有自我切割。
⑦CpG岛
CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率。CpG岛主要位于基因的启动子(promotor)和第一外显子区域,是富含C、G核苷酸的一些区域,长度为300—3000bp。
Gene structure
02查询需要标注的基因序列
(以CCNB1基因为例)

①CCNB1基因序列
打开UCSC网站,输入CCNB1基因进行查询,并进入CCNB1界面。

进入以后,点击Sequence and Links to Tools and Databases下的Genomic Sequence选项。

设置好适宜的参数后,即可获取CCNB1基因序列。
注:在NCBI网站中,是查询不到基因上下游序列的。


②启动子序列
我们取转录起始位点上游2000nt区域为所选的启动子区。
③外显子与内含子序列
在得到CCNB1基因序列后,可以看到序列中所有大写的基因序列即为外显子序列。
④CpG岛
在CCNB1基因界面中选择CpG: 38。

进入CpG岛界面后,点击View DNA for this feature。

设置好参数后,即可得到CpG岛的序列


03在snapgene软件上进行基因的标注
①导入基因序列
首先将查询到的CCNB1基因序列粘贴到snapgene软件中,并输入基因名称。

②对于基因进行标注(以CpG岛为例)
按住“Ctrl+F”,在搜索框中输入预先查询到的CpG岛序列,点击工具栏中“Features”——“Add feature”,设置颜色及名称,即可添加标注。

③完成标注
按以上方法分别添加外显子与启动子,再将左侧工具栏中的开放阅读框打开,即可完成CCNB1基因的简单标注。

上一条:SnapGene软件, SnapGene是干嘛用的
下一条:zemax光学设计,zemax软件官网