GEO数据库芯片、测序数据挖掘

为什么要挖掘GEO数据库?

GEO数据库(或者ENA数据库)中包含大量芯片、测序原始数据。这些数据一般都是可以免费下载使用的,充分利用GEO数据库,可以增加文章的分量,提高接受率。
当然,GEO数据库中的数据集很庞杂,数据质量也参差不齐,甚至有上传文件混淆,错误的情况,都需要我们以专业的眼光进行判断和分析。

我们总结利用GEO数据库的场景主要包括:
1,预实验。别人做过的实验,我们不用再做一遍
2,独立验证。自己的实验结果,与GEO数据集相同实验结果进行相互印证
3,联合分析。自己只做了mRNA,但GEO数据集中有甲基化的数据,可以联合分析
4,算法/数据库开发。没有自己的数据,直接使用GEO数据进行算法或者数据库二次开发

GEO芯片数据挖掘

1,常规表达谱芯片挖掘,包括表达分析,差异分析(一般GEO2R),常见作图等
2,多套数据联合分析
3,多组学联合分析

GEO测序数据挖掘

1,分析所用基因组版本不一样,需要下载原始数据重新分析
2,分析所用方法不一样,需要下载原始数据重新分析
3,单套数据的深入挖掘分析
4,多套数据集联合分析
5,多组学联合分析

微信扫码联系我们