您当前的位置:首页 > 互联网教程

GEO数据库为什么是RNA

发布时间:2025-05-19 22:15:00    发布人:远客网络

GEO数据库为什么是RNA

一、GEO数据库为什么是RNA

1、因为GEO是基因表达综合数据库,RNA是实现遗传信息在蛋白质中的表达。

2、从GEO数据库获取GSE79973数据集,该数据集包含胃癌疾病与正常样本的表达谱数据,筛选出其中差异表达的lncRNA。

3、下载GSE62254和GSE15459数据集以及对应的临床数据,通过GSE62254数据集来构建一个临床预测模型,识别出与预后显著相关的lncRNA,通过GSE15459数据集对模型进行验证。

4、进一步的通过多因素分析来研究ACJJ分期、性别、年龄和样本的风险分数与临床预后的关系。最后通过ssGSEA来发现样本的高低风险组之间通路富集的差异情况。

二、GEO数据库基本信息

1、GEO数据库,作为全球基因表达数据的权威存储库,由NCBI创建并维护,网址为ncbi.nlm.nih.gov/geo。它收录了来自全球科研人员的多种高通量基因表达数据,包括微阵列芯片、二代测序等,所有数据均可以免费获取。

2、GEO的数据组织结构清晰,分为两个子数据库:GEO DataSets以实验数据集为单位,记录一个实验的所有信息;而GEO Profiles则按基因表达谱进行存储,每个基因在数据集中的表现都可查找。数据以五级分类:Platforms(以GPL开头,如GPL570,代表实验平台)、Series(GSE开头,如GSE5764,代表完整的实验方案)、Datasets和Profiles(GDS和流水号,如33759453,代表整理后的数据)、以及Samples(GSM开头,如GSM134584,代表实验样本)。并非所有上传数据都会被整理,只有经过官方评估的才会成为GDS或Profiles。

3、GEO提供丰富的数据类型,包括基因表达、非编码RNA表达、基因组甲基化、变异和单核苷酸多态性数据,以及蛋白微阵列芯片和高通量测序数据(高通量测序原始数据存于SRA,处理后的数据在GSE)。在GEO首页,用户可以根据数据类型和组织结构进行查找,数据可通过网站或FTP下载。使用GEO数据进行研究时,别忘了引用其相关文献。

三、Geodatabse空间数据库模型的特点是什么

1、空间参考。Geodatabse在要素类和数据集中对空间参考信息进行了完整的定义。

2、表定义。Geodatabse空间几何数据与属性数据保存在同一个表(要素类)中。

3、拓扑规则。Geodatabse的拓扑关系管理机制在以下几个方面有明显的优势:

1)用户可以自行定义哪些要素类将手拓扑关系规则约束。

2)多个点、线、面要素类(层)可以同时受同一组拓扑关系规则约束。

3)提供了大量的拓扑关系规则。

4)用户为自己的数据可以自行指定必要的拓扑关系约束规则。

5)拓扑关系及规则是在符合工业标准的DMBS(数据管理系统)中进行的,可以多用户并发处理。

6)用户可以局部建立或检查拓扑关系,以提高生产率。

4、可以表达复杂的地理要素(如,河流网络、电线杆等)。