dbSNP 数据库
发布时间:2025-05-19 20:29:13 发布人:远客网络
一、dbSNP 数据库
1、dbSNP数据库由NCBI建立,整合来自GenBank、PubMed、LocusLink和人类基因组计划的数据。它收录了NCBI的注释信息,包括文献验证、转录信息、功能信息如突变位置、外显子、内含子,以及突变类型如错义突变,还有疾病和临床信息等。dbSNP数据库包含1,463,178份提交,覆盖了人类、小鼠、大鼠、黑猩猩和疟原虫等五个物种的变异。
2、例如,以KRAS为例,dbSNP数据库提供了对变异的全面描述。个人学习笔记中,内容应由读者自行甄别准确性。
二、三大核酸数据库的特点
1、Genome收录的物种涉及所有的生物领域:细菌、古细菌、真核生物,以及许多病毒、噬菌体、类病毒、质粒以及含有遗传物质的细胞器。
2、Gene数据库收录全部已测序物种的基因注释信息,包括基因的名称、染色体定位、基因序列和编码产物(mRNA、蛋白质)情况、基因功能和相关文献信息等,并与GenBank、OMIM、遗传多态数据库(如dbSNP、dbVar)等NCBI子库,及KEGG、GeneOntology等外源性数据库进行交叉引用。
3、GenBank是NIH遗传序列数据库,集成了所有公开可获得的已注释DNA序列,其收录的核酸序列数据根据不同的研究属性,分属于Nucleotide、GSS和EST三个子库。
三、NGS基因测序常见数据库汇总
1、人群数据库中,RefSeqGene数据库,由NCBI维护,提供基因组、转录本和蛋白质的参考序列,注释详尽,涵盖多种生物体,确保准确性。其数据定期更新,便于与其他NCBI资源如GenBank和PubMed交叉引用。
2、UCSC基因组浏览器数据库包含丰富信息,如基因注释、基因组比对、重复序列等,支持多种物种,是生物信息分析的重要数据源,如Hg19为常见的人类全基因组参考。
3、ExAC数据库,作为gnomAD的一部分,汇总外显子组测序数据,是研究遗传变异的有力工具,尤其在等位频率分析上独具特色。
4、dbSNP数据库存储SNP信息,是研究遗传多态性的关键资源,分为用户提交和参考SNP两种类型。
5、gnomAD整合大规模测序项目数据,提供广泛变异频率信息,特别关注GRCh38和GRCh37版本的变异数据。
6、1000 Genomes项目专注于发现人群中常见变异,为遗传变异研究提供基础数据。
7、HGMD数据库汇集遗传疾病突变信息,是遗传性疾病研究的权威资源,提供详细变异描述和相关临床信息。
8、OMIM数据库是孟德尔遗传疾病研究的综合平台,收录大量基因和疾病信息,每日更新。
9、ClinVar作为遗传变异与疾病关联的重要数据库,收录多种变异类型,强调数据质量与权威性。
10、InterVar评估遗传变异致病性,部分实现自动化评分,而ClinGen则结合临床证据对变异进行分类,支持精准医学研究。
11、OncoKB专为肿瘤患者基因突变提供信息,包括靶向药物、临床预后等,分为多个证据等级。
12、COSMIC是癌症体细胞突变数据库,收录全球癌症研究的详细数据,为癌症研究者提供关键信息。
13、TCGA癌症基因组图谱包含临床和基因组数据,为癌症研究提供详尽的多维度数据。
14、PharmGKB则关注药物基因组学,整合药物反应与遗传变异信息,支持精准药物治疗。