GEO数据上传的详细步骤演⽰
GEO数据上传的详细步骤演⽰
想必很多⽼师、同学们对转录组相关数据如何上传⾄GEO数据库存在困惑,本篇整理了GEO数据上传的相关步骤,教⼤家如何上传数据。
1登录GEO
1.1GEO地址
进⼊GEO数据库,两种⽅法:
GEO数据库
1.2注册登录GEO
为了上传数据,⾸先需要登录账号,点击界⾯右上⽅“login”。
新⽤户需要先注册,填写相关信息后,账号通过邮箱激活。
注册账号
登录后,如果账号是⾸次登录,需要完善个⼈信息,包括国家、地区、所属单位等。
登陆账号
2GEO数据上传
进⼊GEO数据库后,在⾸页界⾯选择将要上传的数据类型。⼤体上,上传数据类型可分为3类:
芯⽚数据;
⾼通量数据,如RNA-q、ChIP-q等;
其它表达谱数据,例如RT-PCR等。
接下来以某RNA-q数据上传为例展⽰,点击上传⾼通量数据类型。
以上传⾼通量数据为例
2.1上传数据要求
根据⽹站要求,需要上传3种数据,包括:
信息表(Metadataspreadsheet),这个由GEO⽹站提供,需下载填写;
⼀些重要的处理后数据(Procesddatafiles),如基因表达值矩阵等;
原始测序数据(Rawdatafiles),如fastq⽂件,推荐使⽤cleandata。
并且,GEO⽹站中列出了⼀些注意事项,仔细阅读⽹站界⾯下⽅的内容即可,⼤致上有以下⼏点:
GEO接受数据是有关基因表达定量、基因调控,表观遗传学或其它功能基因组的研究,包括RNA-q、ChIP-q、HiC-q、甲基化测序
等,不接收全基因组、宏基因组等类型。
原始测序数据是必须要提交的,由于后续将⾃动提交SRA,因此需要提供SRA⽀持的格式。推荐上传gz压缩的fastq⽂件(不要使⽤zip压
缩),且各个样本已做拆分。
处理后的数据也是GEO提交的必需部分,但只限于⾮常重要的,例如原始基因表达count值、FPKM标准化后的矩阵、ChIP-q定量峰bed⽂
件等。⼀些中间⽂件,或者⼤⽂件,如基因组⽐对后的BAM不推荐上传,除⾮有特殊必要需发邮件提前咨询⼯作⼈员。
对于上传的数据,需要校验MD5码并填写在信息表中,便于审核⽂件是否完整。
2.2填写信息表
⾸先下载信息表填写相关的信息。
在下载的Excel表中,“METADATATEMPLATE”中填写上传数据信息,包括试验描述、样本信息、数据类型等。“EXAMPLE”中提供了
相关的参考⽰例,根据实际数据模仿填写即可。
下载信息表
以展⽰RNA-q的EXAMPLE2为例简单说明下该表。
“SERIES”是对整个试验的描述。
title可以是发表⽂章的标题,summary可以是发表⽂章的摘要(请描述详细,不能太少),contributor可以为贡献作者。
填写⽂章的标题摘要⽐较省事,当然也可以重新构思描述信息,⽐如该数据在多个⽂章中使⽤时,可以综合为⼀个统⼀的试验描述。
“SAMPLES”是对样本的描述,“PROTOCOLS”、“DATAPROCESSINGPIPELINE”是关于样本处理以及测序细节。
对于样本描述,就是样本名称、来源的物种、组织、细胞类型等,以及各样本对应的数据⽂件,尽可能补充完整吧,除了不涉及的选项可以不
填(⽐如是组织测序,不涉及细胞系,因此细胞类型等就⽆需填写了)。
对于样本处理、测序,就是有关的RNA提取、⽂库构建等试验,这些若存在疑问,建议咨询测序公司⽐较好。
最后的三项内容,就是上传⽂件的细节信息。
包括⽂件名称、类型、MD5码等,以及若是双端测序还需指定R1和R2端测序数据⽂件的对应关系。
2.3上传数据
信息表填写⽆误后,开始上传数据。
⾸先返回GEO⽹站界⾯,查看有关数据上传的相关说明。
点击查看上传数据相关说明
初次使⽤GEO,⾸先需创建⼯作空间,以⽤于后续在服务器站点中作为个⼈存放数据的⽬录。记录Step1中的个⼈路径,后续上传⽂件时需要
指定。
创建个⼈站点
然后,点击Step2查看上传说明,下载安装指定的传输⼯具,上传数据。包括主机、⽤户名、密码以及个⼈账号路径等。
若有疑问,可在GEO⽹站界⾯下⽅查看答疑解惑。
登录站点
仔细阅读GEO⽹站中传输数据的要求,按要求将所有数据,包括原始测序数据、基因表达矩阵、信息表等摆放⾄⼀个⽂件夹中,然后将该⽂件
夹直接拖动⾄服务器的个⼈路径下就可以了。
传输时间由总⽂件数量、⼤⼩及⽹速决定。传输完成后⼀定要仔细对⽐下前后的⽂件⼤⼩是否⼀致,⽤于判断是否出现传输断点,是否有⽂件
需要重新上传等。
上传数据⾄站点
2.4提交审核
确认上传的数据⼀切⽆误后,返回GEO⽹站,点击Step3的“NotifyGEO”。
提交审核
根据所填写信息编辑页⾯,如果确认上传,最后点击Submit。
如果点击Submit提交了审核(真实上传数据时),接下来的⼏天内,注册NCBI账号时使⽤的邮箱中,会收到来⾃GEO官⽅的邮件。若有问
题,会在邮件中告知,之后按照提⽰修改即可。若⽆问题,等待后续数据释放就可以了。
如果未点击Submit(例如仅为测试GEO数据上传步骤),已上传的数据将默认在2周内⾃动清除。
确认提交
本文发布于:2023-01-03 09:07:54,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/83459.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |