国际著名的三大蛋白质数据库
发布时间:2025-05-20 09:42:52 发布人:远客网络
一、国际著名的三大蛋白质数据库
国际著名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。
蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。
2、The Human Protein Atlas数据库
The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。
瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些CST公司发现但未发表的蛋白修饰位点。
该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
蛋白质数据库(HPDB),建于2005年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。
分子结构特征描述采用汉语,同时提供英文原文以供考证。对于善于使用英文的读者,我们提倡直接访问RCSB PDB,一来可以减少网络拥挤,二来可以减少由于HPDB的翻译不妥带来的不便。
蛋白质数据库(HPDB)对每个蛋白质分子结构说明部分做了中文翻译(最新加入数据库的分子除外),内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库,因此HPDB支持中文查询。
蛋白质数据库(HPDB)虽然翻译了“分子结构说明”部分,但为了保证数据的可靠性和准确性,HPDB对一级结构序列及大分子结构坐标数据等未做任何改动,数据库保持RCSB PDB核实后的原始实验数据文件,并保持PDB文件格式和蛋白质分子编号。
二、肿瘤相关数据库介绍
肿瘤是医学领域的一大难题,深入理解肿瘤的基因特征和预后情况对于疾病的预防、诊断和治疗至关重要。本文将介绍几个关键的肿瘤相关数据库,帮助研究人员和临床医生获取宝贵信息。
首先,Cancer Today数据库(gco.iarc.fr/today/home)提供了全球肿瘤的发病率和死亡率排名。通过点击“Multi bars”功能,用户可以直观地查看各类肿瘤的情况。以乳腺癌为例,它在全球范围内发病率位居首位;而肺癌的死亡率则在全球排名第一。
接下来,Genomics of Drug Sensitivity in Cancer数据库(cancerrxgene.org/)为药物敏感性研究提供了强大的支持。以Doxorubicin为例,用户可以获取其IC50值及其分布情况,从而了解不同药物对肿瘤的潜在影响。
Lnc2Cancer v2.0(biobigdata.net/lnc2canc...)专为研究长链非编码RNA(lncRNA)而设。数据库显示lncRNA在特定肿瘤中的研究情况、验证情况、测序数据等。点击任意lncRNA,用户可以看到详细信息,包括名称、肿瘤类型、表达模式、是否与药物耐药性相关、是否在循环中出现以及是否能够预测预后。
MEXPRESS数据库(mexpress.be/)探索了基因甲基化、表达与临床表型之间的关联。用户只需在左侧输入基因并选择特定癌症类型,即可进行分析。
OncoKB(oncokb.org/)是由MSK癌症中心维护的精准医疗肿瘤数据库,提供基于证据的somatic突变和结构突变信息,助力治疗决策。以STAT3为例,用户可以查看其在多种癌症中的突变情况和位点分布。
GEPIA数据库(gepia.cancer-pku.cn/)允许用户分析特定基因在肿瘤中的表达,提供生存曲线和基因相关性分析。以HMGA1在胃癌中的表达为例,用户可以直观地看到该基因的表达差异,并评估其与患者生存的关系。
Ualcan数据库(ualcan.path.uab.edu/ind...)从TCGA分析和CPTAC分析两方面提供基因信息。例如,ACE2在子宫内膜癌的表达情况,用户可以查看其在不同样本中的变化,并根据患者特征进行分析。
GCBI数据库(gcbi.com.cn/gclib/html/...)不仅查找文献,还允许用户对基因进行分析,如基因雷达。通过单基因或多基因搜索,用户可以获得涉及多种疾病的基因信息、调控网络等。
CanSAR数据库(cansarblack.icr.ac.uk/)提供了基因与已批准药物、基因蛋白结构、细胞系等之间的关联信息。以EGFR为例,用户可以查看针对该基因的抑制剂、生物活性、相关通路和涉及的癌症类型。
The human protein atlas(proteinatlas.org/)从组织、细胞、病理、脑、血液等方面分析基因表达。以ABCD3为例,用户可以查看其在多种组织和细胞中的分布情况,以及在不同病理条件下的作用。
使用这些数据库,研究者可以高效获取肿瘤相关基因和药物敏感性等信息,为肿瘤的精准医疗提供科学依据。通过实验验证,这些数据将为临床决策和新药研发带来显著价值。请注意,本文提供的链接为示例,实际使用时可能需要访问特定平台以获取最新数据。
三、HPA蛋白数据库数据库简介
HPA蛋白数据库:一幅详细的人类蛋白质全景
自2000年启动以来,人类蛋白质图谱(Human Protein Atlas, HPA)项目致力于绘制人体细胞、组织和器官中蛋白质的详尽地图。该项目于2003年转为学术研究,采用多种技术,如抗体成像、蛋白质组学、转录组学和系统生物学,所有数据均对外开放。自2005年首个版本发布后,HPA持续更新至最新版本23,于2023年更新,涵盖了全球多个合作机构的成果。
HPA数据库分为12个部分,其中一个示例是Tissue Section,它展示了丰富的功能。通过多重组织分析,研究人员可以深入研究特定细胞类型和状态的蛋白质分布,如在睾丸生殖细胞发育中的蛋白质表达。在23.0版本中,已有742种蛋白质通过这种方法得到分析,揭示了精原细胞等不同细胞类型的蛋白质特征。此外,数据库还提供了全面的组织和器官蛋白组信息,包括那些组织特异性表达的蛋白质,以及癌症中基因表达的详细数据,如肺癌相关基因的表达水平和生存曲线。
自项目成立以来,HPA已经揭示了众多关键发现,包括39个里程碑事件。LEARN板块包含丰富的资源,如字典、蛋白类别和方法指南,而DATA板块则提供了数据下载的详细信息。
总的来说,HPA是一个极其宝贵的资源,它整合了基因表达的丰富信息,对学习和研究具有极高价值。无论是探索特定基因的表达模式还是理解组织结构的蛋白质分布,这个数据库都值得深入探索和利用。