生物信息学名词解释(xiexiebang推荐)
第一篇:生物信息学名词解释 (xiexiebang推荐)
1.生物信息学(bioinformatics):是一门综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法,以互联网为媒介、数据库为载体、利用数学和计算机科学对生物学数据进行储存、检索和处理分析,并进一步挖掘和解读生物学数据。
2.Genom基因组:某一物种的一套完整染色体组中的所有遗传物质。其大小一般以其碱基对总数表示的表格。
3.数据库查询(databa query):是指对序列、结构以及各种二次数据中的注释信息进行关键词匹配查找检索。
4.数据库搜索(databa arch):在分子生物信息学中有特定含义,它是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。
5.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
6.Alignment:比对,从核酸以及氨基酸的层次去分析序列的相同点和不同点,以期能够推测它们的结构、功能以及进化上的联系。
各种各样的船7.表达序列标签(EST):某个基因cDNA克隆测序所得的部分序列片段,长度约为200-600bp。EST可以定位出基因在genome上的位置。
8.开放阅读框(ORF):开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列。In Silico Cloning电子克隆:利用种子序列从EST及UniGene数据库中搜索相似性序列,进行拼装、检索、分析等,以此获得目标基因的全称cDNA,在此基础上也能够实现基因作图定位。9.Contig:即重叠群,把含有STS序列标签位点的基因片段分别测序后,重叠分析就可以得到完整的染色体基因组序列。
10.Homologymodeling同源建模:是目前最为成功且实用的蛋白质结构预测方法,它的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列同源性高于35%,一般情况下认为他们的三维结构基本相同
11.序列表谱(profile):是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸的权值和空位罚分
12.PAM矩阵:PAM指可接受突变百分率。一个氨基酸在进化中变成另一种氨基酸的可能性,通过这种可能性可以鉴定蛋白质之间的相似性,并产生蛋白质之间的比对。一个PAM单位是蛋白质序列平均发生1%的替代量需要的进化时间。、13.BLOSUM矩阵:模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部块中的替代频率的观察。每个矩阵适合特定的进化距离。例如,在BLOSUM62矩阵中,比对的分值来自不超过62%一致率的一组序列。
14.Phylogenetic tree:系统发生树,又称为演化树,是表明被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。
15.Homology:同源性,是指两个对象间的肯定或者否定的关系。如两个基因在进化上是否曾具有共同祖先。
16.Data mining:数据挖掘,指从生物信息数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
17.二次数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单归类、整理或注释。
太原旅游一卡通
第二篇:生物信息学
生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研
究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。实验一 熟悉生物信息学网站及其数据的生物学意义
实验目的:
培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。
实验原理:
利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Enmble、中科院北京基因组研究所、北大生物信息
急躁的反义词学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway
等数据,理解其重要的生物学意义。
实验内容:
1.浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描女的名字
述网站特征;
2.下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;弄的组词
3.讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。实验报告:
1.各网站网址及特征描述;
2.代表性数据的下载和生物学意义的描述;
防火墙设置在哪3.讨论:这些生物信息学相关网站的信息资源,可以被那些生物信息学
研究所利用。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;《生物信息学手册》 郝柏林 等著,上海科技出版社,2004;
《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。实验二 利用BLAST进行序列比对
实验目的:
了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。
什么条件符合大病救助实验原理:
利用实验一下载的核算和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。
板栗南瓜的做法实验内容:
1.向网上BLAST服务器提交序列,得到匹配结果;
2.本地使用BLAST,格式化库文件,输入命令行得到匹配结果;
3.对结果文件进行简要描述,阐述生物学意义。
实验报告:
1.阐述BLAST原理和比对步骤;
2.不同类型BLAST的结果及其说明;
3.讨论:不同平台运行BLAST的需求比较。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;
《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。
实验三 利用ClustalX(W)进行
多序列联配
实验目的:
掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并且对这些序列在分子进化过程中的保守性做出估计。
实验原理:
首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树图能用于指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用Myers和Miller算法实现。
实验内容:
1.明确软件所支持的输入文件格式,搜集整理出合适的数据;
2.在Windows环境运行Clustal X,在Linux环境运行Clustal W;
3.实验结果及分析,用TREEV32或Njplotwin95生成NJ聚类图。
实验报告:
1.整理好的符合Clustal的序列数据;
2.提交数据网页记录和各步骤记录;
3.提供聚类图和多序列联配图,并说明意义。