转座子(TE,散在重复)特征及其对基因组影响

更新时间:2023-05-19 19:54:20 阅读: 评论:0

转座⼦(TE,散在重复)特征及其对基因组影响基因组中重复序列⼤体分为两类:
串联重复(Tandem repeats,Tandem Duplication) (TRF可预测)
散在重复(Disperd repeats),也被称为转座⼦(TE,transposable element)
在植物中,着丝粒和端粒区域存在丰富的 逆转座⼦ (散在重复I型转座⼦) 和 串联重复序列(Satellite)。植物着丝粒是基因组中进化最    在植物中,着丝粒和端粒区域存在丰富的 逆转座⼦ (散在重复I型转座⼦) 和 串联重复序列(Satellite)。
⼤多数植物着丝粒结构复杂,主要是由⾼度重复的卫星
剧烈、结构最复杂的区域,在物种形成和分化过程中发挥重要作⽤。⼤多数植物着丝粒结构复杂,主要是由⾼度重复的卫星
DNA (satellite)以及中间穿插的逆转座⼦序列组成,其中着丝粒satellite序列单元长度主要集中在150 – 180 bp之间,例如⽔稻CentO和⽟⽶CentC序列。
串联重复
TD:  Tandem Duplication    TR:  Tandem Repeat 都叫串联重复。串联重复序列是指以相对恒定的短序列为重复单位,⾸尾相
TD:  Tandem Duplication    TR:  Tandem Repeat 都叫串联重复。
接, 串联连接形成的重复序列,⼜称卫星DNA (satellite DNA)。在⼈类基因组中,串联重复序列约占10%,主要分布在⾮编码区,少数位于编码区。编码区中的串联重复序列与功能有关,⾮编码区串联重复序列多分布在间隔DNA或内含⼦,重复单位短的仅2bp长的可达数⼗碱基对,重
按重复序列的长度和序列特征分成⼤卫星DNA、复次数少则数次,多则⼏百次。重复序列的重复次数
不同,是形成DNA长度多态性的基础。按重复序列的长度和序列特征分成⼤卫星DNA、⼩卫星DNA和微卫星DNA等主要类型。
⼀般在植物⾥⾯称为(Simple Sequence
微卫星在动物⾥⾯⼀般称为短串联重复序列(short tandem repeats, STRs),⼀般在植物⾥⾯称为(Simple Sequence
Repeats,SSRs)。SSR在植物中经常被⽤作遗传标记使⽤。
散在重复    TE    转座⼦
转座⼦ transposable elements (TEs) 是⼀类能够在基因组上移动其位置的DNA序列。
可细分为两类:I型转座⼦: retrotransposons(逆转座⼦);RNA transposons;RNA转座⼦    以DNA为模板,转录为
可细分为两类:I型转座⼦: retrotransposons(逆转座⼦);RNA transposons;RNA转座⼦    以DNA为模板,转录为
(逆转录是指以RNA为模板合成与
“复制-粘贴”    (逆转录是指以RNA为模板合成与mRNA,mRNA再反转录为cDNA,在整合酶的作⽤下插⼊基因组的新位置。
mRNA,mRNA再反转录为cDNA,在整合酶的作⽤下插⼊基因组的新位置。    “复制-粘贴”
其互补的cDNA的过程)
II型转座⼦:DNA transposons;DNA转座⼦        由DNA介导        “剪切-粘贴”
II型转座⼦:DNA transposons;DNA转座⼦        由DNA介导        “剪切-粘贴”
转座⼦按照能否⾃主移动,都分为⾃主性和⾮⾃主型。⾃主型是,TEs只要⾃⾝就能在基因组上跳跃,⾮⾃主型TE需要另外⼀个TE 转座⼦按照能否⾃主移动,都分为⾃主性和⾮⾃主型。⾃主型是,TEs只要⾃⾝就能在基因组上跳跃,⾮⾃主型TE需要另外⼀个TE 带着它才能跳跃。⾮⾃主型不能独⽴跳跃,是因为缺少转座酶(对于II类)或逆转录酶(对于I类)。Ac/Ds系统中,Ac是⾃主型,Ds是带着它才能跳跃。⾮⾃主型不能独⽴跳跃,是因为缺少转座酶(对于II类)或逆转录酶(对于I类)。
⾮⾃主型。没有Ac,Ds⾃⼰不能发挥作⽤。
⾃主型元件通常含有 gag 和pol 两个基因,前者负责编码⾐壳蛋⽩,后者负责编码多功能蛋⽩ ,其具
有蛋⽩酶、反转录酶、RNa H以及整合酶的活性功能域;⾮⾃主型元件缺少完整或⼤部分转座所需蛋⽩的编码基因,其对应于⾃主元件的区域由不相关的序列或宿主序列组成。
转座⼦的层级分类
两⼤类转座⼦在不同物种中的占⽐。Sc: Saccharomyces cerevisiae 酿酒酵母; Sp: Schizosaccharomyces pombe
桂林旅游必去景点裂殖酵母; Hs: Homo sapiens ⼈类; Mm: Mus musculus 家⿏; Os: Oryza sativa ⽔稻; Ce: Caenorhabditis elegans
线⾍; Dm: Drosophila melanogaster 果蝇; Ag: Anopheles gambiae, malaria mosquito 疟蚊; Aa: Aedes aegypti,
yellow fever mosquito 埃及伊蚊; Eh: Entamoeba histolytica 变形⾍; Ei: Entamoeba invadens; Tv: Trichomonas
vaginalis ⽑滴⾍.
TE具有扰乱被介⼊基因组成结构的潜在可能性,并被认为是导致⽣物基因发⽣渐变(有时候是突变),并最终促使⽣物进化的根本原    TE具有扰乱被介⼊基因组成结构的潜在可能性,并被认为是导致⽣物基因发⽣渐变(有时候是突变),并最终促使⽣物进化的根本原因。如染⾊体的 插⼊inrtion ,删除deletion,以及 易位transposition 是通过TEs 来改变的。
宿主尽可能降低转座发⽣对其基因组稳定性造成的威胁,转座元件也可以在转录⽔平 (transcriptional level) 或转录后⽔平上
宿主尽可能降低转座发⽣对其基因组稳定性造成的威胁,转座元件也可以在转录⽔平 (transcriptional level) 或转录后⽔平上(post-transcriptional level) 参与邻近基因的表达调控,并能以 “顺式” (in cis) 或 “反式” (in trans) ⽅式调控内源基因表
达。
TE对基因组的影响(部分):
TE对基因组的影响(部分):
插⼊功能基因,使该基因失活,这便是假基因的来源
* 插⼊功能基因,使该基因失活,这便是假基因的来源
拼音声调
* 插⼊编码区时,它们通常会引起移码突变或改变剪切模式,从⽽改变(⼤多数情况下是破坏)蛋⽩质功能    * 插⼊编码区时,它们通常会引起移码突变或改变剪切模式,从⽽改变(⼤多数情况下是破坏)蛋⽩质功能* 插⼊或靠近调控区时,可以改变基因表达(如转录时序或转录量),或充当增强⼦或其它调控因⼦的⾓⾊。
* 插⼊或靠近调控区时,可以改变基因表达(如转录时序或转录量),或充当增强⼦或其它调控因⼦的⾓⾊。
* 许多TE含有启动⼦来驱动⾃⼰的转座酶转录。这些启动⼦可引起连锁基因的异常表达,从⽽导致疾病或突变表型。
编码反转录酶的 TE 有时不仅能将它们⾃⼰ RNA 的 DNA 拷贝(cDNA)插⼊到宿主基因组内,还能将其它基因的 RNA 转录物也插⼊到宿主基因组内,这些 RNA 的 cDNA 拷贝(反转录序列,retroquence)类似于基因组内其它位置的祖先基因的外显⼦,只是它们没有调控区和内含⼦。⼤部分反转录序列是已加⼯假基因,并不产⽣有功能的基因产物。
83年属什么的
* 通过转录和不等交换,TE 数量可增加或减少,从⽽改变基因组⼤⼩。
* 通过转录和不等交换,TE 数量可增加或减少,从⽽改变基因组⼤⼩。
* 会增加宿主基因的突变率。
* 会增加宿主基因的突变率。
result转座⼦对基因组的影响
转座元件对插⼊位点基因的影响主要表现为:基因⾃⾝功能突变以及新功能化、基因结构变异、核酸序列和表观遗传修饰的重新编排转座元件对插⼊位点基因的影响主要表现为:基因⾃⾝功能突变以及新功能化、基因结构变异、核酸序列和表观遗传修饰的重新编排等,这些影响最终可能造成表型变异。
假基因(Pudo gene)
假基因是⼀类本来正常,但后来因为突变或转座,⽽可能失去了原来功能的基因,常⽤ ψ 表⽰。它在序列结构上与功能基因⾮常相    假基因是⼀类本来正常,但后来因为突变或转座,⽽可能失去了原来功能的基因,常⽤ ψ 表⽰。它在序列结构上与功能基因⾮常相似,但已丧失了正常的蛋⽩质编码功能。⼀般情况都不被转录。
在环境压⼒下,某些假基因可以重新被激活,⽽某些假基因则有着调控基因表达的作⽤。可总结为“假作真时真亦假”。它们与原来在环境压⼒下,某些假基因可以重新被激活,⽽某些假基因则有着调控基因表达的作⽤。可总结为“假作真时真亦假”。它们与原来的基因可能很相似,但⼜可以有很⼤差异。
假基因主要分为(重复假基因)duplicated pudogene 和 (转座假基因或加⼯假基因)procesd pudogene or retropudogene。
安静的音乐
重复假基因:DNA复制 或 染⾊体不均等交换 过程中基因编码区或调控区发⽣突变(如碱基替换、插⼊、缺失),导致复制后的基因丧失正    重复假基因:
常功能⽽成为假基因。
转座⼦假基因:mRNA反转录成cDNA插⼊整合到基因组上,由于插⼊位点不合适或序列发⽣突变⽽失去正常功能,这样形成的假基  转座⼦假基因:mRNA反转录成cDNA插⼊整合到基因组上,由于插⼊位点不合适或序列发⽣突变⽽失去正常功能,这样形成的假基因称为加⼯假基因或转座假基因。
假基因的数量与选择压⼒和转座⼦的活性有关,选择压⼒越⼤,转座⼦活性⾼,反转录成的转座假基因越多。所以⼀般情况下,假基    假基因的数量与选择压⼒和转座⼦的活性有关,选择压⼒越⼤,转座⼦活性⾼,反转录成的转座假基因越多。所以⼀般情况下,假基因的Ka/Ks⽐较⾼。假基因的功能主要是在RNA⽔平上,类似于ncRNA。
逆转座⼦
⽬前主要存在两种类型RNA转座⼦(逆转座⼦):
LTR (Long Terminal Repeat retrotransposons)    长末端重复反转录转座⼦    双末端都是长重复序列                                              non-LTR TEs    双末端缺乏重复序列    LINE和SINE
LINE 元件的编码区由 ORF1 和ORF2 共同构成,ORF1 与 gag基因编码的产物类似,ORF2 则含有内切酶(EN)和反转录酶(RT)的编码基因。LINE 和 SINE 均以简单的序列重复结尾,通常有poly(A)。对所有已知 SINE 分析发现,它们的近 5 ‘端都含有⼀个潜在的 RNA pol III 启动⼦,⽽除了 3' 端的序列与 LINE 同源外,其余部分的特征还不清楚,暗⽰SINE 在基因组中作为⾮⾃主元件,可能借助LINE 的⾃主转座机制进⾏⾃我复制。LINE 在植物中的⽐例较低,⽽ SINE 则以⾼拷贝形式存在。
LINE 在植物中的⽐例较低,⽽ SINE 则以⾼拷贝形式存在。
以⼈类转座⼦为例:⼈体⼤约有40%的DNA和逆转录病毒有关。其中7.7%的DNA和逆转录病毒的DNA⾮常的相似,我们称之为内源逆转录病毒(endogenous retrovirus,ERV)。逆转录病毒的DNA结构可以⽤下⾯这张图表⽰:
LTR(long terminal repeat)。LTR没有编码任何蛋⽩,主要起到调控的作⽤。中间是三段基因:
病毒两端有两条相同的序列,称为LTR(long terminal repeat)
gag,pol和env。gag编码了⾐壳蛋⽩等结构蛋⽩,pol编码了逆转录酶,整合酶,蛋⽩酶这些病毒复制需要的酶,env编码了病毒包膜的糖蛋
⽩。所有的逆转录病毒都有这三个基因。⼈类的内源逆转录病毒(HERV)
内源逆转录病毒(HERV)也有这三段基因和两个LTR,也可以像逆转录病毒那样,把⾃⼰逆转
⼈们认为HERV是很久以前逆转录病毒偶然感染了⼈类的胚胎,结果永久性的成为⼈的基因组录再整合到别的地⽅,就像复制-粘贴⼀样。⼈们认为HERV是很久以前逆转录病毒偶然感染了⼈类的胚胎,结果永久性的成为⼈的基因组的⼀部分。经过这么多年的扩增达到了7.7%的规模。但⼈类的ERV不知道什么原因已经变异失去了制造新的病毒颗粒的能⼒。
还有0.6%的⽚段含有LTR和gag,pol,但不含有env。由于不含有env,⽆法获得包膜,也就⽆法形成病毒颗粒。这些⽚段被称为逆转录转座⼈们猜测这类转座⼦是逆转录病毒的来源,逆转录转座⼦通过偶然的机会获得了env的基因,从⽽产⽣了最早⼦(retrotransposon)。⼈们猜测这类转座⼦是逆转录病毒的来源,逆转录转座⼦通过偶然的机会获得了env的基因,从⽽产⽣了最早的逆转录病毒。
剩下的是不含LTR的和逆转录有关的DNA⽚段。其中16.9%的被称为LINE的DNA也有编码和逆转录酶,整合酶相似活性的酶。⼈们认为LINE 也可以像ERV,逆转录转座⼦那样逆转录,整合到别的地⽅,它们也占据了最⼤的⽐例。还有10.6%的没有编码逆转录酶,称为SINE。⼈们猜测SINE是在LINE的辅助下进⾏逆转录和整合的。但不管怎么说,SINE也占据了相当⼤的⼀部分。这些不含有LTR的⽚段总共占据了33.9%的⼈类基因组。
⼈们猜测ERV是远古逆转录病毒感染⼈类胚胎留下来的,⽽逆转录转座⼦可能是逆转录病毒的起源。
总之,⼈们猜测ERV是远古逆转录病毒感染⼈类胚胎留下来的,⽽逆转录转座⼦可能是逆转录病毒的起源。
LTR-RTs 的结构特征
LTR-RTs 的结构特征
希望你能幸福典型的 LTR-RTs 的结构有 5 个特征,各特征意义如下:
TSR=TSD,⽬标重复位点,是 4~6bp 的短重复序列,在 5’LTR and 3’LTR 两侧,是转座⼦插⼊的信号
(1) TSR(TSD):⽬标重复位点,是 4~6bp 的短的重复序列,在 5’LTR and 3’LTR 两侧,是LTR转座⼦插⼊的信号。
(1) TSR(TSD):⽬标重复位点,是 4~6bp 的短的重复序列,在 5’LTR and 3’LTR 两侧,是LTR转座⼦插⼊的信号。
含有笑的四字词语⼤多数TEs(全部LTR,TIR;某些LINE, SINE)的转座过程在整合位点的宿主DNA中产⽣⽬标位点复制    ⼤多数TEs(全部LTR,TIR;某些LINE, SINE)的转座过程在整合位点的宿主DNA中产⽣⽬标位点复制
(TSD),因此识别与TE相邻的TSD可以确定转座。
(2) 5’LTR and 3’LTR :  LTR 两端序列完全⼀致的末端重复, TG..CA box,完整的 LTR 均含有此结构。LTR 长度⼀般在
(2) 5’LTR and 3’LTR :  LTR 两端序列完全⼀致的末端重复, TG..CA box,完整的 LTR 均含有此结构。LTR 长度⼀般在85~5000bp。
(3) PBS(primer binding site) 引物结合位点: 在 5’LTR 的末端,可与⼀些 tRNA 3’ 末端互补结合的⼀段 18bp 左右的序    (3) PBS(primer binding site) 引物结合位点: 在 5’LTR 的末端,可与⼀些 tRNA 3’ 末端互补结合的⼀段 18bp 左右的序列,是反转录的第⼀步。
(4) 蛋⽩区域: 长度通常在 1000~15000bp。 GAG:⾐壳蛋⽩。 POL:包含 4 种酶,有AP(天冬氨酸酶)、IN(INT,整合
(4) 蛋⽩区域: 长度通常在 1000~15000bp。 GAG:⾐壳蛋⽩。 POL:包含 4 种酶,有AP(天冬氨酸酶)、IN(INT,整合酶)、RT(逆转录酶)、RH(核糖核酸酶),LTR 能否⾃主转座的关键原因。 ENV:包膜蛋⽩,后⽣动物中存在。
(5) PPT:3’LTR 的起始位置短的富含嘌呤的序列,11~15bp。
(5) PPT:3’LTR 的起始位置短的富含嘌呤的序列,11~15bp。
在植物基因组中,I类转座因⼦,LTR-RT (LTR retrotransposons) 是基因组扩张的主要原因。LTR 在⽣物    在植物基因组中,I类转座因⼦,LTR-RT (LTR retrotransposons) 是基因组扩张的主要原因。寂寞如歌
通常将包含两个相对完整的 LTRs 和已识别的 PPT 和 PBS 位体内历经成千上万年的进化,发展出许多存在形式。通常将包含两个相对完整的 LTRs 和已识别的 PPT 和 PBS 位点的元素,且两侧有 TSD
(target site duplications) 的 LTR 定义为 Intact LTR(A)。由于 LTR-RTs 两
的数量表端序列⾮常相似,LTR-RTs 内可发⽣重组,导致内部元件消失,形成 solo LTR(C),⽽ solo LTR 的数量表端序列⾮常相似,LTR-RTs 内可发⽣重组,导致内部元件消失,形成 solo LTR(C),⽽ solo LTR

本文发布于:2023-05-19 19:54:20,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/698376.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   序列   转座   逆转录   基因组   编码   假基因   病毒
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图