GO,KEGG,DO富集分析

更新时间:2023-07-07 05:28:03 阅读: 评论:0

怎么关闭qq空间GO,KEGG,DO富集分析
what is Gene Ontology(GO)
基因“本体论” 对事物的分类描述,对基因的分类描述
对基因的描述
1、cellular component,CC(基因存在于细胞质还是细胞核,是线粒体还是其他细胞器)细胞组成
2、Biological process,BP(能够参与哪⼀个⽣物学过程,参与rna加⼯,复制等)⽣物学过程
3、Molecular function,MF(分⼦功能上,催化什么反应,什么样的酶)分⼦功能
基于以上三类,对基因进⾏分类
so,we will have a gene annotation information
⼀、RNA-Seq ctrl, treatment
ctrl gene expression distribution, 在1种条件下的基因表达谱
treatment gene expression distribution,在其他条件下的基因表达谱
饭后运动ctrl v.s. treatment ->DEG 差异表达基因
DEG:differential expression genes (cuffdiff,⽐较两者差异基因)
cufflink 计算基因表达量
⼆、DEFG ->GO annotation(找到GO注释)
施工计划方案
1、cellular component,CC(基因存在于细胞质还是细胞核)
2、Biological process,BP(能够参与哪⼀个⽣物学过程)
3、Molecular function,MF(分⼦功能上)
how to test if the GO is enriched? 如何去检测GO的富集
GO enrichment analysis(GO富集分析)
什么是GO注释?(为了给基因分配 go term)
如何拿到GO注释
model orgnism -> annotated databass(模式⽣物已经分配好了GO term)
学生在校表现评语non-model orgnism ->arch databa(⾮模式⽣物,需要⾃⼰去找,如果没有需要⽤blast办法?)
⽆参的⽣物(A)没有 reference ,找相近的有 reference 的⽣物(B)
⽤ A blast B ,A ⾥⾯的 gene1 ⽐对到 B 的 gene2 ,然后找 gene2 的 term 或者 annotation 当作 A 的。(使⽤的软件blast2GO 还有其他的 )
KEGG enrichment analysis?(代谢通路富集分析)
DO (dia)enrichment analysis? (疾病富集分析)[⼀般是临床使⽤]
>>>>>>>>>>>####
# 2020/3/8
# test GO analysis and KEGG pathway analysis
>>>>>>>>>>>>
rm(list = ls())
# 1、 RNAq  fastq -> BAM (tophat2, hiast ,star)
# 2、 cufflink BAM
# 2、 cufflink BAM
# 3、 cuffdiff BAM GTF电脑花样机
# 1. load cuffdiff result
cuffdiff_result = read.table(file="../Desktop/test_data/rnaq_test_date/diff_out1/gene_exp.diff",header = T,p = "\t")
cuffdiff_result$sample_1 = "ctrl"
cuffdiff_result$sample_2 = "treat"
#test_id 或者 gene_id 称为 gene samble = samble
# 2. lect DEG
# Ⅰ. FPKM1 or FPKM2 >1
# Ⅱ. log2(fold change) >1 or < -1
# Ⅲ.  p_value <0.05
lect_vector = (cuffdiff_result$value_1 > 1 | cuffdiff_result$value_2 > 1 ) & abs(cuffdiff_result$log2.fold_change.) >= 1 &  (cuffdiff_result$p_value < 0.05) cuffdiff_result.sign = cuffdiff_result[lect_vector,]
<_id = data.frame(gene_id = cuffdiff_result.sign$gene_id)
write._id , file = "../Desktop/test_data/GO,kegg(live7)/sign_gene_id_text",col.names = F ,row.names = F,p = "\t",quote = F)
>>>>>>####
师德小结# 在R上做
# tup R package
>>>>>>>
library(clusterProfiler)
# ⽤来做富集分析
library(topGO)
# GO看图⽤
library(Rgraphviz)
# 调⽤上⾯两个包
library(pathview)
# 看 KEGG pathway
library(db)
# ⼈的注释⽂件,去 bioconductor 可以搜其他的注释⽂件(模式⽣物都有)
>>>>>>>
# GO 分析
>>>>>>>
<_symbol = as._id$gene_id)
columns(db) #查看常⽤类型,⽤于下⾯ keyType 填写
<_id = mapIds(x = db,
keys = _symbol,
keytype = "SYMBOL",
column = "ENTREZID") # 转化ID,⼀般⽤ ENTREZID ,其中会有转换不成功的NA
<_id = na._id)  #剔除NA
>### GO.BP
OrgDb = db,
keyType = "ENTREZID",
ont = "BP",
pvalueCutoff = 0.01,
qvalueCutoff = 0.05,
readable = T) #pvaluecutoff 是 pvalue 的阈值,富集的统计显著性要⼩于0.01, q 是 p 的修正值
>#### GO.CC
< = enrichGO(gene = _id,
OrgDb = db,
keyType = "ENTREZID",
ont = "CC",
pvalueCutoff = 0.01,
qvalueCutoff = 0.05,
readable = T)
readable = T)
>> GO.MF
OrgDb = db,
keyType = "ENTREZID",
ont = "mf",
pvalueCutoff = 0.01,
qvalueCutoff = 0.05,
readable = T)
>> barblot, dotplot
bp)
)
f)
bp)
>> plotGOgraph (树形图)
pdf(file = "../Desktop/test_data/GO,kegg(live7)/bp.tree.pdf",width = 10,height = 15)  #直接保存成pdf⽂件
bp)
电脑蓝屏出现一堆英文怎么解决dev.off() # 关闭画图,与pdf⼀套
>>>>>
# KEGG pathway analysis
>>>>>
kegg.out = enrichKEGG(gene = _id,
organism = "hsa",
keyType = "kegg",
pvalueCutoff = 0.05,
pAdjustMethod = "BH",
qvalueCutoff = 0.1)
barplot(kegg.out)
>>>>>####
# 如果是⾮模式⽣物,但是有参考基因组
# 以番茄为例⼦
source("bioconductor/biocLite.R")
BiocManager::install("AnnotationHub")
BiocManager::install("biomaRt")
# 载⼊包
library(AnnotationHub)
library(biomaRt)
# 制作 OrgDb
hub <- AnnotationHub::AnnotationHub()
#使⽤query在我们制作的OrgDB --> hub⾥⾯找到番茄相关的databa即org.Solanum_lycopersicum.
eg.sqlite 注:Solanum_lycopersicum是番茄的拉丁名和它对应的query(hub, "Solanum")  # Solanum番茄的拉丁名
王长远# 下载下来
Solanum.OrgDb <- hub[["AH59087"]]
#此时,番茄的databa就会赋值到变量Solanum.OrgDb

本文发布于:2023-07-07 05:28:03,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/1083080.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   富集   分析   物学
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图