寻找差异表达的基因

更新时间:2023-04-24 22:28:00 阅读: 评论:0


2023年4月24日发(作者:婚庆主持)

基因表达谱数据

基因表达谱可以用一个矩阵来表示,每一行代表一个基因,每一列代表

一个样本(如图1。所有基因的表达谱数据在gene_文件中存

储,第一列为基因的entrez geneid,第2~61列是疾病样本的表达,第

62~76列是正常样本的表达。

1 基因表达谱的矩阵表相近 示

寻找差异表达的基因:

原理介绍:

差异表达分析是目前比较常用的识别疾病相关miRNA以及基因的方

法,目前也有很多差异表达分析的方法,但比较简单也比较常用的是Fold

change方法。它的优点是计算简单直观,缺点是没有考虑到差异表达的统计

显著性;通常以2倍差异为阈值,判断基因是否差异表达。Fold change的计

算公式如下:

Fold_c

即用疾病样本的表达均值除以正常样本的表达均值。

差异表达分析的目的:识别两个条件下表达差异显著的基因,即一个基

因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义。

我们利用一种比较常见的T检验(T-test)方法来寻找差异表达的miRNA

T检验的主要原理为:对每一个miRNA计算一个T统计量来衡量疾病与正

常情况下miRNA表达的差异,然后根据t分布计算显著性p值来衡量这种

差异的显著性,T统计量计算公式如下:

x

Dia

x

normal

t

miRNA

xx

Dianormal

22

s/ns/n

Dianormal

对于得到的显著性p值,我们需要进行多重检验校正FDR比较常用的是BH

方法(Benjamini and Hochberg, 1995

Sa,Sa,,Sa

12N

1

Sa,Sa,,Sa

12N

2

t检验泰姬陵简介 (t -test)

G

1

G

2

判断基因在两种不同条件下的表

达差异是否具有显著性

G

M

aaabbb

11121N11121N

12

aaabbb

21222N21222N

12

aaabbb

M1M2MNM1M2MN

12

t

xx

cacontrl

22

s/Ns/N

ca1contrl2

NN

12

x

1,ca

a

1i

i1

N

1

N

1

22

i1i1竹子画图片大全

x

1,contrl

b

1i

i学习记录表 1

N

2

N

2

S(ax)S(bx)

1,ca1,i1,contrl1,i

1,ca1,contrl

t分布

vNN2

12

当自由度为∞时,t分布就是标准正态分布

程序实现:

基因表达谱数据--- gene_

Matlab软件实现mRNA差异表达分析:

MATLAB软件安装好之后,双击系统桌面的MATLAB图标,或在开始

菜单的程序选项中选择MATLAB快捷方式,即开始启动MATLAB。初次启

MATLAB后,将进入MATLAB默认设置的桌面平台。柏花草胶囊 桌面平台包括命令

窗口、历史窗口、当前目录窗口和工作间管理窗口等窗口(如图2

2 matlab窗口简介

工作空间主要包含了目前用户定义的一些变量,用户可以在命令窗口执

行一些特定的命令操作来完成特定的功能。我们首先将工作目录选择到我们

数据存放的硬盘目录下,然后导入要分析的基因表达谱数据,进行差异表达

分析。

在命令窗口输入main_MTDN_end.m程序中的1-21行命令(注意要将程

序中的目录改变到自己数据的存储目录下),即可得到差异表达的基因。这

段程序主要包含两个函数:mattestmafdr

mattest函数是进行t检验的,输入的数据为疾病和正常的表达谱数据,

返回每个miR大公鸡喔喔叫儿歌 NAT统计量和对应的p值。这个参数还可以利用„Permute‟

参数进行随机扰动,'Showhist'参数用来显示T统计量和p什么是多态 值的分布。

mafdr函数是用来计算FDR的函数,可以利用参数来选择计算FDR的方

法,这里我们利用“BHFDR”参数来选择BH方法对p值进行校正,利用

'showplot'参数来显示FDR的图示结果。

结果可以在工作空间窗口中通过双击变量进行查看。

结果展示:

T-统计量和p值的分布图以及FDR

3 T-scoreP-values以及FDR的分布

mRNAFDR<0.1 2fold c上善若水的下一句 hange

Fold_c>2 or <1/2 ,我们识别了11个下调的mRNA6个上调的

mRNA

差异表达基因的层次聚类分析

mRNA表达谱数据:差异表达17mRNA的表达数据

程序实现:

我们接下来利用差异表达mRNA的表达谱进行聚类分析,在命令窗口输

main_MTDN_end.m程序中的23-30行命令,结果会输出利用差异表达

mRNA聚类分析的结果。这部分主要是利用一个现有的函数clustergram进行

聚类分析,函数的输入数据是差异表达mRNA的表达谱。之后可以利用t

函数对行的符号和列的符号进行设定。

聚类分析结果展示:


本文发布于:2023-04-24 22:28:00,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/846338.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

下一篇:画树心理学
标签:xnormal
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图