基于⼩⿏的基因集数据库资源(⼈⿏基因集⽐较)
问题
找出
⼈基因集的基因数量
⼩⿏基因集的基因数量
关于冬至的手抄报两个基因集overlap数量
⼈特有的基因数量你的名字解析
⼩⿏特有的基因数量
思路
重大事故隐患将⼈⿏的基因转化为同源ID,使⽤同源id 来找overlap 和特异基因。没有对应的同源id,转化为gene symbol ,根据⼤⼩写来⽐较(虽然我觉得,找不到同源id,很⼤可能不是同源基因了,它们的gene symbol估计也不⼀样,不过以防万⼀,还是⽐较⼀下。。。)
library(homologene)
library(db)
library(db)
geneid2symbol <-function(gene.id, OrgDb){
id.df <- AnnotationDbi::lect(OrgDb, keys = gene.id,
keytype ="ENTREZID",
columns = c("SYMBOL"))
return(id.df$SYMBOL)
采摘草莓}
Hs.Hid <- lapply(Hs.H,function(genes){
h.data <- homologeneData[homologeneData$Gene.ID %in% genes,] other.id <- tdiff(genes, as.character(h.data$Gene.ID))## ⾮同源id gene.id <- as.character(h.data$HID)## 同源基因id
if(length(other.id)>0){
other.sys <- geneid2symbol(other.id, db)
gene.id <- c(gene.id, other.sys)
}产后瘦身
return(gene.id)性别教育
})
福州琅岐
Mm.Hid <- lapply(Mm.H,function(genes){
h.data <- homologeneData[homologeneData$Gene.ID %in% genes,] other.id <- tdiff(genes, as.character(h.data$Gene.ID))
gene.id <- as.character(h.data$HID)
if(length(other.id)>0){
other.sys <- geneid2symbol(other.id, db)
gene.id <- c(gene.id, toupper(other.sys))
}
return(gene.id)
})
hs_mm_overlap <- lapply(names(Hs.Hid),function(n){
length(interct(Hs.Hid[[n]], Mm.Hid[[n]]))
})
hs_only <- lapply(names(Hs.Hid),function(n){
length(tdiff(Hs.Hid[[n]], Mm.Hid[[n]]))
})
mm_only <- lapply(names(Hs.Hid),function(n){
length(tdiff(Mm.Hid[[n]], Hs.Hid[[n]]))
})
df <- unt, Mm.count, hs_mm_overlap, hs_only, mm_only) df
清炒豌豆苗