RNAq标准化不同⽅式
Normalization
差异基因分析⼯作流程的第⼀步是计数归⼀化,这对于准确⽐较样品之间的基因表达是必需的。
01.png
RNA-Seq(RNA测序的缩写)是⼀种实验类型,可让我们测量基因表达。测序步骤产⽣⼤量(数千万个)cDNA ⽚段序列,称为reads,每个read代表样品中某些RNA分⼦的⼀部分.
然后,我们将每个read分配(“map”)到⼀个isoforms个,并计算每个isoforms(isoform:可以认为同⼀个基因的不同版本的蛋⽩)有多少个read。丑恶的拼音
蘑菇的英语
02.png
phoned在所有其他条件都相同的情况下,isoforms越丰富,则来⾃该异构体的⽚段越可能被测序。因此,我们可以将read计数代表isoforms的丰度。Normalization期间经常考虑的主要因素有:
1.测序深度 需要测序深度来⽐较样品之间的基因表达。在下⾯的⽰例中,每个基因在样品A中的表达
我喜欢的一种动物
似乎都⽐样品B增加了⼀倍,但这是样品A的测序深度增加了⼀倍的结果。如何留住人才
03.png
注意:在上图中,每个粉红⾊和绿⾊矩形代表与基因对齐的读段。⽤虚线连接的读段连接跨越内含⼦的读段。
2.基因长度 ⽐较相同样品中不同基因之间的表达,需要考虑基因长度。在该⽰例中,基因X和基因Y具有相似的表达⽔平,但是映射到基因X的读取次数将⽐映射到基因Y的读取次数多得多,因为基因X更长。18岁生日快乐
04.png
3.RNA组成 样品之间⼀些⾼度差异表达的基因,样品之间表达的基因数量不同或存在污染会影响某些类型的标准化⽅法。建议对RNA组成进⾏核算,以准确⽐较样品之间的表达,在进⾏差异表达分析时尤其重要
在此⽰例中,如果我们将每个样本除以计数总数进⾏归⼀化,则DE基因将⼤⼤扭曲计数,DE基因占据了样本A的⼤部分计数,但没有样本B的计数。样品A的⼤多数其他基因将被总数较⼤的数除,并且似乎⽐样品B中的那些相同基因的表达少。
绿茶制作工艺
电脑电源怎么看