TCGA数据挖掘入门---什么是TCGA?TCGA中有哪些数据?

更新时间:2023-07-28 08:23:37 阅读: 评论:0

TCGA数据挖掘⼊门---什么是TCGA?TCGA中有哪些数据?
1. 什么是TCGA?TCGA中有哪些数据?车水马龙
党员自我鉴定
TCGA的全称是The Cancer Genome Atlas, 这个项⽬始于2005年,它旨在使⽤基因测序和⽣物信息学编⽬与癌症有关的基因突变。TCGA通过利⽤⾼通量基因组分析技术,来帮助我们更好地理解癌症的遗传学基础,从⽽提升我们对于癌症的诊断能⼒和对癌症的治疗、预防。
礼钱
TCGA受美国癌症研究所(National Cancer Institute)下的癌症基因组中⼼和美国⼈类基因组研究所监管。
TCGA包括主要进⾏测序的基因组表征中⼼(genome characterization centers, GCCs)和负责测序数据分析的基因组数据分析中⼼(genome data analysis centers, GDACs),到⽬前为⽌TCGA共有39种癌症的相关测序数据,涉及29种癌症器官,1万多个肿瘤样本,27万多份⽂件。
2. 那么可以从TCGA中下载到哪些类型的数据呢?
TCGA的数据类型主要有以下⼏种:
(1) Clinical: 包括病⼈的⼀般情况、诊治情况、TNM分期、肿瘤病理、⽣存情况等。
(2) mRNA表达数据: 通过mRNA芯⽚或者RNAq测得的mRNA表达量
(3)microRNA: microRNA芯⽚或者microRNA-Seq测得的microRNA表达量
(4) Copy number variation: SNP芯⽚得到的肿瘤组织⽐对正常组织的染⾊体上各⽚段的⽐值
甲士>科学的反义词
(5) Mutation: 肿瘤组织测序结果相对参考基因组的核苷酸突变,包括插⼊和缺失等变化
(6) Protein: 蛋⽩芯⽚测序得到的约200种常见癌症相关蛋⽩的表达量
(7) Mythelation: 甲基化芯⽚测得的DNA甲基化数据,主要为27和450两种芯⽚的数据
其中mRNA-Seq,miRNA-Seq以及Methylation Array被⼴泛使⽤。
3.mRNA-Seq数据分为3种:
而知之作文HTSeq-Counts;HTSeq-FPKM;HTSeq-FPKM-UQ。
4.TCGA数据等级:
level1:原始数据
睡不着发朋友圈配图level2:处理过的数据
level3:经过分割、解释的数据
level4:感兴趣的区域或概要
总⽽⾔之,前⾯2个层级的数据⼀般是拿不到的,需要权限,⼀般也只有国外的PI才能申请到(听说的),我们⼀般拿到的open数据就属于那种已经标准化后的数据。
5.TCGA样本分类:
除了要知道数据等级外,我们还需要了解TCGA的样本分类,⽐如哪个是正常样本,哪个是肿瘤样本
⼀般我们可以看到样品名称如:TCGA-19-2619-10A,我们需要关注的是最后⼀位10A,⼀般来说01代表癌症样本,11代表癌旁样本。其实从01-09是tumor,癌症样本;10-29是normal,癌旁样本。只是其中分的⽐较细。具体可参考官⽹
参考⽂章
如何下载TCGA数据/TCGA数据下载⼩教程铁离子符号

本文发布于:2023-07-28 08:23:37,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1099733.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   癌症   测序
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图