-
干货贴:NCBI 上的这些字母都是什么意思?
发布时间: 2021-08-23 点击次数: 23291次NCBI 上基因前面有个 accession(编号)分别有 NC、NM、NP、GI、XP、XM、BC、AB、NG、 AJ、AC、AY 和 AF 等等,然后后面是一串数字,都是什么意思??特别是看 Blast 结果时,这些编号到处都是的,根本不知道哪个才是想要的好么!!
莫慌,今天就给大家理理顺!
ACCESSION是NCBI序列数据中我们常用到编号(另一个是GI)。ACCESSION形式为CC_#####, 其中 CC 为两个字母,其不同组合又可以区分为蛋白序列、核酸序列或基因组序列,而#为位数不等的数字;ACCESSION 后面又会加版本号,以 CC_####.#形式表示,最后的尾数递增表 示序列信息较之前的版本有所修改。这样 ACCESSION+版本号就是一个*的表示,代表一个*的序列,而且这个编号不会改变。
以下是帮大家找到的整理表格!具体的各项说明及序列来源说明可以查看 NCBI。
一般来说,mRNA 和基因组序列是我们主要的寻找对象。如果想找标准序列的话,mRNA 就采用 NM_开头的,基因组用 NC_或者 AC_开头的。so easy!
不同的编码代号代表不同的意思,如 NM_开头的表示标准序列,XM_表示预测的蛋白编码序列,NR_表示非编码蛋白的 mRNA 序列,AF 开头的表示克隆序列,BC 开头的表示模板序列......
上面的表格中是一些常见序列的 accession 号,不过大家知道 NCBI 中还有很多其他的 accession 号么?!其中,仅与 RNA 相关的就有 116 种!不过,科研人员生存不易,不必在细节上作死自己,建议大家按需选择或者需要时查询即可!