NGS基因测序(panel)报告解读数据库汇总
发布时间:2025-05-20 11:04:50 发布人:远客网络
一、NGS基因测序(panel)报告解读数据库汇总
NGS基因测序(panel)报告解读是一项复杂的任务,涉及到众多数据库的查询和分析。以下是主要数据库的概述,帮助你理解和解读肿瘤基因报告:
1. dbSNP数据库():NCBI提供的变异数据库,包括SNPs和各类变异,用户提交和参考SNP区分,提供变异详细信息和相关研究链接。
2. gnomAD数据库():大规模测序数据聚合平台,汇集外显子组和基因组数据,对人群频率进行研究。
3. ExAC数据库():外显子组测序数据的早期版本,现已被整合进gnomAD,提供覆盖度信息。
4. 1000 Genomes():关注频率大于1%的变异位点,为人类遗传变异研究提供资源。
5. HGMD数据库():突变位点的专业数据库,包含详细的功能和致病性信息。
6. OMIM数据库():综合的孟德尔遗传疾病数据库,包含大量基因和疾病信息。
7. ClinVar数据库():权威的遗传变异与疾病关联信息库,严谨的证据支持其数据。
8. InterVar数据库():评估遗传变异致病性的数据库,部分自动化评分。
9. ClinGen数据库():临床基因组学研究支持的数据库,用于致病性分类和证据评估。
10. OncoKB():专为肿瘤药物选择提供信息的数据库。
11. COSMIC():全球癌症体细胞突变数据库,详尽记录癌症相关突变。
以上数据库共同构成了基因测序报告解读的重要资源,通过查阅和理解这些信息,可以更深入地解析基因变异对健康的影响。
二、CPTAC蛋白数据库
1、CPTAC是由National Cancer Institute在2011年发起的项目,目标是通过大规模蛋白组和基因组分析,系统性地识别由癌症基因组改变和相关生物过程导致的蛋白质,从而加速癌症分子机制的研究,提高诊断、治疗和预防癌症的水平。
2、CPTAC包含基因组和蛋白组数据。基因组数据包含1300+种不同类型的肿瘤病人数据,包括WGS、WES和RNAseq,可通过GDC Data Portal访问。蛋白组数据则通过PDC提供。CPTAC提供了不同肿瘤类型和基因在不同肿瘤类型中的表达情况的查看与分析,有助于发现潜在的标志物或靶点。
3、Proteomic Data Commons(PDC)是NCI最大的基于质谱的肿瘤蛋白质组学数据库,提供高质量质控、整合标准、高效查询、可视化、分析和下载的平台。CPTAC的原数据访问入口在2022年2月关闭,现已转移到PDC。PDC不仅提供原始质谱数据,还通过计算分析,将质谱映射到多肽序列并鉴定蛋白质,便于多组学分析。
4、PDC提供的文件类型主要有原始文件和主要结果文件summary.tsv,该文件包含了蛋白的定量结果。数据按原发位点分类有12种,按疾病类型分类有19种。以结直肠癌为例,用户可通过PDC页面查看样本介绍和数据文件描述,数据文件包括Studies、Biospecimens、Clinical、Files、Genes五个部分组织。
5、PDC提供多个分析工具,包括Explore Quantitation Data、Peptide Genome mapping、Pepquery和cProSite。Explore Quantitation Data可用于分析和展示每个study的蛋白定量结果,通过热图展示蛋白质和翻译后修饰(PTMs)的丰度模式。Peptide Genome mapping则提供各种类型数据在基因组上的可视化展示。Pepquery是一个以肽段序列为中心的搜索工具,适用于查询MS数据库中的新肽段或DNA序列,可用于发现基因组改变导致的新蛋白序列,作为潜在的疾病标志物或治疗靶标。cProSite则用于分析单个基因在肿瘤和癌旁组织中的丰度差异、磷酸化位点差异等。
6、用户可以输入目标基因在首页搜索框中查询,或在EXPLORE左侧的Genes筛选框中输入一组基因或选择某个信号通路的基因进行查询,查看检测到的PTM和不同study中的表达丰度。
7、蛋白质组定量结果与RNA定量类似,可进行差异表达、GO/KEGG注释、蛋白互作网络分析等。结合Clinical标签数据,可进行生存分析,挖掘与临床病理或结果真正相关的标志物或靶点,通过机器学习方法进行疾病分型、诊断预测等。
8、CPTAC提供有限的肿瘤类型和样本数目,基于质谱的蛋白质组学数据可用于挖掘和验证肿瘤中的差异表达基因及基因表达情况。通过不同的生物学分析方法和多组学分析方法,综合印证不同维度的结果数据,挖掘真正有意义的潜在标志物或靶点。除了CPTAC,还有其他类似的蛋白质组学数据库如HPA等。随着高通量蛋白组学检测方法如Olink的兴起,预计会有更多基于此方法检测的数据数据库出现,为各类研究者提供更多样本和数据支持。