ABSTRACT美国大学专业排名
在这篇文章中,我们描述了一个长非编码RNA(lncRNA)与疾病的关联数据库(LncRNADia)它可以在cmbi.bjmu.edu/lncrnadia进行公开访问。近年来,大量lncRNAs已经鉴定和越来越多的证据表明, lncRNAs在各种生物过程中发挥关键作用。因此,lncRNAs的功能障碍是与多种疾病相关联。也因此,了解lncRNAs在疾病中所起的作用,并为疾病的诊断,治疗和预后确定候选lncRNAs是十分重要的。为了这个目的,一个高品质的lncRNA-疾病关联数据库将是极为有利的。在这里,我们描述LncRNADia数据库,它收集和策划了480项实验支持LncRNA-diea的关系,其中包括166种疾病。 LncRNADia还策划了478项在不同分子水平上的lncRNA互作搭档,包括蛋白质,RNA,miRNA和脱氧核糖核酸。此外,我们用基因组信息,序列,参考文献和物种注明LncRNA-diea关系。我们将疾病名称和lncRNA功能障碍的类型进行归一化并提供给每个条目详细的描述。最后,我们开发了生物信息学的方法来预测新的LncRNA-diea关系,并将这个方法和预测出的与1564个人类lncRNAs相关的疾病整合到数据库中。
INTRODUCTION
我们惊讶地发现在人类转录组分析中蛋白质编码序列只占基因组转录产物的一小部分。多数人类基因组的转录物是非编码RNA ,尤其是,长非编码RNA( lncRNAs)。通常,lncRNAs往往是跨物种保守性较低并常常表现出低表达水平和高组织特异性。因此,在他们第一次被发现的时候, lncRNAs往往被认为是转录噪音。在最近几年,积累的研究表明,许多lncRNAs不是转录的噪声,而具有重要的功能,例如,影响基因转录,靶向RNA聚合酶II ,调节剪接和参与表观遗传学。此外,根据竞争内源RNA的理论,在功能上,lncRNAs可能与广泛的RNA分子通过竞争性结合微小RNA(miRNA)相互作用,这表明lncRNAs可能在一个广泛的生物学过程中发挥关键作用。以前的研究产生了大量的lncRNA相关的数据,包括序列,表达谱和功能。因此,以便更好地理解lncRNAs,整理和注释这些数据是很重要的。几个lncRNAs数据库确实提供了一些帮助有助于学习lncRNAs。例如,NRED为lncRNA表达数据的数据库。lncRNAdb数据库提供了详细的lncRNA信息,包括序列,功能,表达,相关蛋白和细胞位置。虽然NONCODE数据库不是为lncRNA 特定的,但是在它的第三个版本中收集了lncRNAs的序列,功能,表达和细胞定位。
最近,研究人员试图了解lncRNAs和疾病之间的关系。有研究报道, lncRNA功能障碍与多种疾病相关,包括癌症,心血管疾病和和神经退行性疾病。例如, lncRNA PCA3是一个高
度前列腺癌特异性分子和PCA3有成为前列腺癌侵略性的一个生物标志物的潜力。上调的lncRNA HOTAIR是进行肝移植后的肝癌患者肿瘤复发的独立预后因素。一项研究从膀胱癌诊断的泌尿沉积物,证实了lncRNA UCA1的高特异性和敏感度这,表明UCA1是膀胱癌诊断( 16 )一个潜在的生物标志物。 Godinho等揭示,lncRNA BCAR4可用于抗雌激素抗性乳腺癌治疗的潜在靶标,因为在乳腺癌细胞中它的强制表达导致细胞在各种抗雌激素剂的存在和雌激素不存在的条件下增殖。上述研究表明,lncRNAs可能有助于了解疾病,并有助于发现在疾病的诊断,治疗和预后中的潜在分子。因此,lncRNA–dia关系的研究成为lncRNAs和疾病研究中的最重要的课题之一。出于这个原因,一个高质量的lncRNA–dia关系数据库将有助于研究lncRNAs在疾病的角色,但它仍然无法使用。为了建立这样一个数据库,我们手工辅助实验文献报道lncRNA疾病的关系,最终建立了一个数据库,LncRNADia。我们录入了包括每个条目的详细注释信息。此外,我们策划并注明实验支持的lncRNA互动搭档。此外,我们开发了生物信息学的方法来预测新的LncRNA-diea的关系,并将这个方法和预测出结果整合到数据库中。
DATA SOURCES AND IMPLEMENTATION
数据来源与实现
首先,我们下载了PubMed数据,非蛋白编码RNA基因信息,并从国际生物技术信息中心下载gene–PubMed 关系的数据。第二,我们手工辅助数据和检索lncRNA疾病对。所有lncRNA -疾病对由不同的研究人员进行双重检查。提供了PubMed数据库中的原创文章的超链接。我们还注明了序列和物种的信息。我们进一步规范化lncRNAs和疾病的名称。总体而言,我们策划166疾病,其中癌症( 39.8 % ) ,心血管疾病( 10.8 % )和神经退行性病变的疾病( 8.4 %)为前三大类。 此外,我们提供了lncRNAs与疾病的关联的详细说明和策划了每个条目的功能异常类型。例如,如果一个条目的功能障碍证据是从表达数据中得出,此项目的功能障碍类型将被视为“表达”。功能障碍类型的分布示于图1B。除了lncRNA-疾病相关性的数据,我们还策划了实验支持的lncRNA相互作用并根据该相互作用分子和相互作用的特征对它们进行分类。例如,在RNA水平,lncRNAs可与蛋白质、RNAs, lncRNAs and miRNAs相互作用。它们之间的虎作可能是绑定,调控和共表达。在DNA水平上,lncRNA基因的启动子
可以与转录因子(TF)结合,并被转录因子调控。“LncRNADia”数据库中的所有数据均使用SQLite—— 一个轻量级的数据库管理系进行组织。该网站是基于Django的,一个Python Web框架开发的。该数据库可在cmbi.bjmu.edu/lncrnadia获得。
regulation
英语译汉语PREDICTING NOVEL LNCRNA–DISEASE ASSOCIATIONS
预测新型LNCRNA疾病社团
LncRNADia的设计不仅作为实验支持的英语四六级报名官网lncRNA–dia关系数据的一种资源,也可作为用于预测新的lncRNA–dia关系的平台。在这项研究中,我们提出了一个基于给定的lncRNA的基因组背景的方法来预测新lncRNA–dia关系。我们之前发现,在基因组中miRNAs的位置很密切(特别的先考托福还是gremiRNAs可位于2kb之内),而且往往与类似疾病相关联。这里,与我们调查lncRNAs是否趋向于与类似疾病相关联,并把相似疾病作为lncRNAs的基因组邻居。因此,我们在与报道出的疾病相关联的任何lncRNAs的2 kb 核苷酸 中确认了蛋白编码基因和miRNAs。然后,我们确定了具有相同的关联疾病作为其邻居基因/miRNAs的lncRNAs,我们发现了33个这样的lncRNAs。为了评价显著性,我们对与lncRNAs相关联的疾病进行10万次随机重新排序并记录这样的lncRNAs的数目。其结果是,没有一个计数大于33和预期的数目为9,这表明lncRNAs和其邻居基因/ miRNA的趋向于与同一种疾病关联(P <1104,随机化测试相关联;图2)。这个结果表明,我们可以通过与lncRNAs的邻居基因/ miRNA相关联的疾病预测lncRNAs的潜在关联疾病。基于上述观察,
我们开发了一个工具来预测lncRNA–dia关系,并确定在人类基因组中的所有lncRNAs的潜在相关疾病。最后,我们将这个工具和预测结果整合到LncRNADia数据库。
QUERYING THE DATABASE
查询数据库
我们为用户提供多种方式查询LncRNADia数据库。首先,用户可以通过lncRNA名称或疾病名称浏览LncRNADia。当点击“浏览”网页中的一个lncRNA或疾病时,LncRNADia将返回匹配的条目的列表。其次,我们通过在“搜索”页键入lncRNAs或疾病的全部或部分名称为每个条目提供一个“模糊搜索”功能。“搜索”不区分大小写。我们还为工具提供了一个页面来预测新的lncRNA–dia关系。此外,数据库中的所有数据,包括oa是什么意思lncRNA大学英语六级听力–dia关系,预测的lncRNA–dia关系和lncRNA互作,可以下载。用户也可以提交新的数据到数据库中。此外,对于数据库的使用的详细教程在“帮助”页面中可用。
FUTURE EXTENSIONS
未来的扩展
该LncRNADia数据库代表在这个项目的第一步。进一步扩展将得到发展。该LncRNADia数据库每2个月将更新一次实验支持lncRNA–dia关系数据。同时,正在开发用于分析lncRNA–dia关系数据的一些新的工具将被整合到LncRNADia数据库。例如,我们正在开发表达谱和相互作用的合作伙伴为基础的方法来预测新的lncRNA–dia关系,并期望在不久的将来这些方法集成到数据库中。
DISCUSSION AND CONCLUSION
增加的研究表明,lncRNAs具有重要的功能,并具与多种疾病相关联。LncRNAs正在成为用于疾病的诊断,治疗和预后的新的潜在的分子。在这篇文章中,我们描述了一个lncRNA与疾病关联数据库——LncRNADia数据库。该LncRNADia数据库整合了多种类型的数据,如实验支持的lncRNA–dia关系数据,实验支持的lncRNA的互作数据和预测lncRNA–新东方戚颖dia关系数据。此外,我们开发了一种根据lncRNA的基因组背景的生物信息学方法来预测新型lncRNA的潜在相关疾病并把这种方法 整合到了LncRNADia数据库中。
lncRNAs在疾病中的重要作用正吸引更多的生物医学研究人员。因此,更多的实验支持的l
ncRNA–dia关系预计将在未来发表,这些数据将被整合到LncRNADia数据库。更重要的是,虽然数千lncRNA已经确定,但是仅有限数量的lncRNAs已报道与疾病相关联。 人们越来越需要通过生物信息学方法来预测lncRNAs潜在的相关疾病。因此,LncRNADia的另一个主要目的是开发和集成更多的分析和预测lncRNA英文翻译收费标准–dia关系的生物信息学方法。最后,我们相信,LncRNADia在lncRNAs和疾病的研究中是有用,并且当它集成了更多的数据和工具使时,它将会为本主题提供更多的帮助。
图1。LncRNADia数据库中疾病的统计和分布(A)和lncRNAs的功能障碍类型(B)。
97xxx图2。lncRNAs与他们的邻居基因/ miRNA共享一个疾病的显著性,蓝色三角形表示在随机情况下,与相同疾病相关联并将这个疾病作为其邻居基因/ miRNA的lncRNAs数目的分布。 红色箭头表示真实情况下的这种lncRNAs数目。
长非编码RNA:是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。