1、要分析一个重组事件,首先需要一些基础软件的支持,其中最重要的是mega。
2、打开一个.meg格式的文件:左击鼠标open按钮。
3、点击页面顶端options按钮,进入General页面选择一系列参数:选择你的序列是环状还
是线性,检测所需要的方法,建议选择默认的选项(RDP,GENECONVandMAXCHI)你选
择的方式越多,消耗时间越长。如果你分析的是小型数据(小于50个序列),你还可以
选择CHIMAERA,BOOTSCAN和SISCAN。一般不使用LARD方法,除非在验证重组时间
或检测小于20个序列的数据时。再看右边的选项,在你第一次分析数据时,应该选上
dintangleoverlappingevents选项,如果分析时卡住了再取消分析,把这个选项删掉就
可以了。其他选项选择默认就可以了
4、一旦所有选项都调试好之后,左击主界面上的X-over按钮开始进行重组分析。如果你认
为耗费的时间超出了你的预期,你可以点击stop按钮,如果你不想分析其中的某个序列,
可以点击Sequencedisplay界面中右侧序列的名字,左击一下名字变灰,为mask这个序
列,即对这个序列不进行重组分析,但依然作为参考序列在做树中显示出来;左击两下
名字变白,disable这个序列,即完全除去这个序列。这样的处理可以提高分析重组的能
力,集中精力分析你需要的序列。
5、分析完毕后出现四个界面,顺时针方向依次为Sequencedisplay,Therecombination
informationdisplay.,Schematicquencedisplay以及Plotdisplay。下面分四个部分具
体讲解。
uenceDisplay:
左击序列中的部位可以显示不同颜色代表的含义
鼠标悬空在某个核苷酸上会显示出该核苷酸处于何序列的具体位置。右击鼠
标可以保存不同形式你想要的序列。
Saveentirealignment.:保存整个比对结果,可以保存成多种形式。
Savealignmentwithrecombinantquencesremoved:保存没有重组序列的比对
结果。即在plotdisplay板块中为一个完整的长条的序列。
Savealignmentwithrecombinantcolumnsremoved.:将去除所有与重组相关的
序列,如果一个比对结果中与重组相关的序列太多,很可能结果是一个空白
或接近于空白。
Savealignmentwithrecombinantregionsremoved.:所有与重组相关的核苷酸
将被取代为—或.
Savealignmnetwithrecombinantregionsperated.:重组序列将被分割成两部
分,一部分与重组无关,一部分是重组部分。可以分别与其他序列进行比对。
Splitalignmentintocommonmosaics.:具有同一重组镶嵌体的序列和其余的非
重组序列被分裂为两个单独的比对结果。
Saveonlyenabledquences.:只有被enable的序列才会保存。这个选项有助
于手动将同一组的序列保存成新的比对结果。
Saveonlydisabledquences.:只有mask和disable的序列被保存下来
如果你想单独分析某一组序列,右击鼠标选择lectgroups,点击你想选择的
序列,变为蓝色即为选中,未选中的为黑色。
如果你想专门看某个序列,右键点击goto,然后在schematicquencedisplay
中会显示这个序列。
5、TheRecombinationInformationDisplay
这些信息包括用于检测的方法,重组事件的编号,可能的断点,序列的名字,可能的突变
位点,与该重组毒株密切相关的,可能父母代的序列名字(主要和次要的父母)和次要父
母代毒株比主要父母代毒株与重组序列的关系更密切的概率,以及P值的大小。如果出
现以下情况,该界面还会出现warning标示(红色):
(1)在比对序列中只有一个可能为父母代毒株的序列
(2)有可能(约30%或更大的可能)误认为重组序列(即实际上父母代的序列中的某个才是真正的重组毒株)
如果是这样会在后面显示出实际上可能为重组毒株的父母代毒株的名字。
(3)无法识别出一个或全部两个突变位点。
(4)一个或两个突变位点是错位的。
(5)重组信号微弱
(6)如果复合信号可能是一个分析错误的人工制品。
“confirmationtable”部分表明了用不同方法检测出发生该重组事件的毒株数和关于目前
检测到的重组事件的符合程度
Confirmationtable下面是一个总结性的柱状图,对于99%的用户来说前三条柱状图代表的是有
用的信息。柱状图下面的分数大于60分代表这该毒株几乎确定为重组毒株。大于40小于60的
分数代表软件可能犯了错误,但也可能没有。小于40表示该毒株很可能不是重组毒株。
6、Schematicquencedisplay
每一个长条都代表一个重组序列。不同的颜色可以代表不同的意思:
1.每一个最可能为重组事件供体的序列被赋予独一无二的颜色。
2.用于检测重组序列的方法。
3.他们相关的P值
4.它们与推测的父母代序列之间的关联性大小。
可以通过cyclethroughdisplayoptions”button选项改变颜色。而这些颜色代表的意思可以通过左
击击灰色部分看到。
ematicquencedisplay
Currentview
Cyclethrough
displayoptions
Savesub-
alignment
Recombinant
region
Background
quence
右击鼠标灰色部分可以将该图拷贝到剪贴板或保存成.emf文件。
该图表可以转换三种模式(1)“ShowalleventsforquenceX”(quenceX是你的鼠标
距离最近的序列)(2)“Showonlybesteventsforallquences,”and(3)“Showalleventsfor
allquences.”就是有的重组事件可能用所有方法都可以检测到,而有的重组事件只有一
到两种方法可以检测到。如果你选择(2)的话只有最优的重组事件会显示出来(即P
值最低)。你可以通过键盘上的pgDn和PgUp浏览重组事件。
在序列彩色条上右击鼠标会出现一系列的选项,你可以通过“接受或不接受该重组事件”
选项来人为修改你认为RDP出现的错误,也可以将父母代供体和重组毒株相互调换,但
必须慎重,因为这个调换是不可恢复的,如果你要取消调换只能重新分析。而且,尽管
RDP可能出现错误,但它至少是一个客观的判断方法,没有人的主观性。所以,除非你
有充足的理由,否则不要随便调换。
在你浏览这些重组序列的时候,应该时刻accept你认为正确的重组序列,这样有利于你
记录自己的进度,也有利于修改RDP的错误,因为一旦RDP在这里出现错误,那么它
在后面出现错误的几率也会增大。所以,在accept之后就选择选项栏的Re-Identify
recombinantquencesforallunacceptedevents,或者点击下面的“Re-scan”按钮重新进行
分析。
检测RDP的误差可以通过选择showallevidences选项来观察不同方法检测到的重组事
件的breakpoints是否不同,如果不同的话就值得你人工去观察到底哪个是正确的。如果
你认为两个重组事件来源于一个祖代毒株,可以选择通过Mergeevents选项将其合并为
一个重组事件
tDisplay
双击这个区域的任何位置都会在上方的quencedisplaypanel显示出相应的序列。鼠标
tion8fordetailsonwhatisplotted.
Key
Plotdisplay
Presstoabortacheck
Presstolectmethod
P-valuecutoff
XandYcoordinates
ofthemoupointer
移动到任何位置都会显示出X轴和Y轴的数值。
5.5TheTreeDisplays
如果你按下“tree”按钮,一系列表示该重组毒株与其他毒株关系的树将会以两种不同的方式展示
如果单击屏幕顶部在命令面板的“tree”按钮两棵树将会并排显示。而如果你按下
recombinationinformationdisplay上方的“Tree”按钮则会在该区域显示一株进化树。
点击右上角的“cyclethroughtrees”按钮即可以用该序列的不同部分进行做树分析。包
括:(1)根据重组序列的不同部分分别作树(2)只有已确认的重组区域做树(即用minor
parent部分)(3)只用已确认的非重组区域做树(即majorparent部分)(4)忽略重组
的所有区域做树。
在同一个页面显示两棵树可以追踪一个序列在不同区域做树后的变化,左击
树上的某个序列可以标记这个序列在树上的位置。在树的部位右击会出现一系列
的选项,比如“清除颜色”“自动选择颜色”“自主选择颜色”等,可以把树上
的序列分别弄上不同的颜色。你还可以选择不同方法做树,包括:neighbour
joining,leastsquares,maximumlikelihood,andBayesiantrees.
“Mark[quencename]asalsohavingevidenceofthivent”和“Mark[quencename]as
nothavingevidenceofthivent.”选项可以使你在树上手动修改你认为RDP所犯的错误,
就是如果你认为这个序列不属于这个重组事件你可以把它从该事件中剔除,或这个序列
本应属于该重组事件,但RDP把他排除在外了,你可以认为把它加进去。
“Goto[quencename]”选项可以指引你在schematicquencedisplay板块看到这个序
列。
”Recheckplotwith[quencename]asrecombinant/minorparent/majorparent”选项可以
使你看到如果你替换了重组序列/次要母本/主要母本(即树中的红色、蓝色和绿色序列)
其中的一个序列后,进化树会变成什么样子。
TheMatrixDisplay
点击主面板上的Matrix选项,就会显示出矩阵图像,有好多种矩阵的显示方法供你选择。
右击鼠标或者点击主面板上的下拉三角都可以选择。
如果你确定一个重组事件真的发生了,这时你就要仔细检查RDP有没有准确判断出重组
发生的位点,和有没有夸大或过小分组的现象,你就要用其他RDP提供的附加应用进行
验证。
可使用的方法简介:
RDPmethod,GENECONV,Bootscanning,MaxChi,Cimaera,3SEQandSiScan.是7种基本验证
程序,LARD,PHYLPRO,distanceplotsandTOPAL.是四种附加验证程序。
RDP:
8.1GENECONV
Recordsignificantevidence
Moveaslidingwindowacross
Selectthreequences
Information-rich
Calculatesignificancewhere:
Repeatwiththenext
)(1-p)
Figure8.
ofrecombination
sub-quenceandcalculate
pairwiidentities
Multiplequencealignment
anddiscardall
non-informativesites
sub-quence
Checkforevidenceofrecombination
Gisthetotalnumberofofpossiblequencetriplets
ListheLengthofthequence
Nisthelengthoftheputativelyrecombinantregion
mistheproportionofnucleotidesincommonbetweentheputative
recombinantandparentalquencesintherecombiantregion
pistheproportionofnucleotidesincommonbetweentheputative
recombinantandparentalquencesintheentirequence.
threequences
(P=
N!
m!(N-m)!
pN
X
N-m
X
L
N
Σ
m=M
N
GX
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
GAGATGTTATC
GTCTACTCGAT
CTGAAGATGTT
A
23043
Positioninalignment
1.0
0.5
0.0
P
ai
r
wi
s
e
i
d
e
n
t
i
t
y
1.07X10-6
Positionsofinformativesites
Potentialrecombinantregion
Majorparent:recombinantplot
Minorparent:recombinantplot
Minorparent:majorparentplot
P-Value
mple
pairwiidentityplot.
B
lookforregionsinthepairwi
fromthepolymorphic
Selectthenext
scoresbypermutationtestingand/
Recordsignificant
Figure9.
Using“fragmentscores”
alignmentwherequences
haveunusuallyhighsimilarity
Multiplequencealignment
Discardmonomorphicsites
Select2quences
sitealignment
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
twoquences
GCAGATAGTTATCG
CCTGAAAGATGTTG
GCAGATAGTCGTTC
GTAGATACTCAATC
GCAGATGCTCATTG
GCTCTAACTCGATG
GCAGATAGTTATCG
CCTGAAAGATGTTG
Where:
Iisthenumberofidenticalsitesinafragment
Disthenumberonnon-identicalsitesinafragment
N
T
isthetotalnumberofpolymorphicsitesintheoriginalalignment
N
D
isTotalnumberofnon-identicalsitesinthequencepair
GistheG-scalevalue.
DxN
T
xG
N
D
Fragmentscore=I-
Calculatesignificanceoffragment
orcalculationofKarlin-Altshul
BLAST-likeP-values
fragments
Positioninalignment
Positioninalignment
Potentialrecombinantregion
Majorparent:recombinantHSAP
Minorparent:recombinantHSAP
Minorparent:majorparentHSAP
GlobalP-Valuecutoff
1763
3.3
1.6
0.0
-
L
o
g
(
K
A
P
-
V
al
u
e
)
LocalP-Valuecutoff
1763
3.7
1.8
0.0
-
L
o
g
(
K
A
P
-
V
al
u
e
)
Potentialrecombinantregion
GlobalP-Valuecutoff
LocalP-Valuecutoff
Highscoringalignedpair(HSAP)
exampleplotofhighscoringalignedpairs(HSAPsorfragments).CAn
exampleplotinwhichGENECONVisudtochecktheRDPderivedresult
inFig8B.
A
B
C
8.2Bootscanning
8.3
注意事项:RDP4只是一种检测手段,也会出现很多的错误,不能完全依赖RDP4来判断
重组。我们可以从以下几方面入手来减少RDP4发生错误的概率:
1、尽量多收集与你最感兴趣的序列同源性大于50%的序列,尽可能搜集全。
Recordsignificantevidence
centralpartitionacrossthepair-
fromthepolymorphic
recombinationbreakpoints
quencesorproceed
GAGATGTTATC
Whenallthreepairwiscansarecomplete
Repeatwiththenext
Figure11.
ofrecombination
Moveaslidingwindowwitha
wialignmentandcalculatea
2x22ofthedifferencebetween
theproportionsofsitesoccupied
bythesameanddifferentbas
oneithersideofthepartition
Multiplequencealignment
Select3quencesand
discardmonomorphicsites
Select2quences
sitealignment
Checkforevidenceof
Repeatwiththenext2
tothenextstep
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
GAGATGTTATC
GTCTACTCGAT
CTGAAGATGTT
CTGAAGATGTT
checksignificanceofpeaksusing2
P-valueand/orapermutationtestand
matchpeakstofindrecombinantregions
threequences
Positioninalignment
Positionsofinformativesites
Potentialrecombinantregion
Majorparent:recombinantplot
Minorparent:majorparentplot
UncorrectedP-Valuecutoff
MCcorrectedP-Valuecutoff
1763
6.9
3.4
0.0
-
L
o
g
(
P[
C
hi
2]
)
Minorparent:recombinantplot
23043
Positioninalignment
4.1
2.0
0.0
-
L
o
g
(
P[
C
hi
2
]
)
Potentialrecombinantregion
MCcorrectedP-Valuecutoff
UncorrectedP-Valuecutoff
ChisquareP-valueplot
A
B
C
alysisprocedurewhentheMaxChi
“scantriplets”e“scanentiredatatsimultaneously”
ttingisudtheanalysisprocedureisthesameexceptthatthereisonly
oneanalysiscyclewiththepolymorphicsitealignmentbeingproducedfrom
theentirealignment(insteadofitbeingproducedfromthecurrentlylected
triplet)BAnexampleofChisquaredP-valueplotsudtoconfirmtheRDP
mpleplotinwhichMaxChiisudtocheck
theGENECONVderivedresultinFig9B.
本文发布于:2023-03-09 14:10:25,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1678342225133132.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:重组分.doc
本文 PDF 下载地址:重组分.pdf
留言与评论(共有 0 条评论) |