cytoscape教程

更新时间:2023-06-22 22:14:59 阅读: 评论:0

Cytoscape基础教程笔记 
part one
昨天开始学用Cytoscape,其tutorial分为两个部分,基础的和高级的。基础教程又分成了四课:Getting StartedFilters & Editor20年后的家乡500字作文Fetching External DataExpression Analysis。为防忘记,做个摘记。
第一课 新手上路,地址见goo.gl/FJLxp
Cytoscape 可以本地安装,也可以web start。软件得用java,所以要装JRE。我在Ubuntu下装了OpenJDK,可以运行。因为以前一直没把jnlp文件和java关联起来,所以从没成功web start过,试了一下课文里给出的链接,似乎不太靠谱,总之是没法启动。
启动Cytoscape后,得下载两个样例文件。以sif为后缀名的是蛋白相互作用网络信息,里面的蛋白以数字形式区别,以na为后缀名的是各数字id的注释,似乎两者的文件名必须相同才能关联起来。
sif 文件的打开\导入有两种方式:File → Import → Network(Multiple File Types)或者直接Ctrol+Lna文件是File → Import → Node AttributesNetwork导入之后有多种显示风格,2.8版默认风格下,圆圈是各蛋白,称为节点(node),其间各线为edge,代表相互作用。点中圆圈就选中了一个节点,想要多选,可以采用同时按Shift的方法,也可以先在Select → Mou Drag Selects设置好选node还是选edge,然后鼠标拖放,一选一大片。
此外还可以有目的地选择。比如可以Select → Nodes → By Name,然后输入蛋白id,即可选中此节点。大海捞针即告完成。此操作的快捷键是Ctrl+F
果已经选中了节点,还可以Select → Nodes → First neighbors of lected nodes,可将所选蛋白的直接相互作用蛋白选中,再选File → New → Network → From lected nodes, all edges,即将相互作用网络的一个子网络剥离出来。
diy纸盒
Layout菜单的功能比较花哨,是关于相互作用网络图的组织原则的。可以乱试一通,一张一张放在ppt里唬人,呵呵。
一团乱麻般的相互作用网络图下是查看节点或连线所代表的信息的地方,称为data panel
Attributes按钮会弹出一个小窗口,可供选择需要列出的栏目的名字,比如id,或者对应的基因名,当然这个基因名信息是从na文件里导入的。
乱麻左边的窗口是有多个tab的控制面板。Network那个tab里可以在导入的 sif里切换。VizMapper tab里可以定制显示样式,比如圆圈变成方形,或者变大一些,或者换个底色,连线换个粗细和颜色等等。如果莫名找不到的话,Cytoscape的菜单栏下有几个快捷按钮,其中有一个可以打开VizMapper。各种样式设置好之后一定要点Apply,还可以新建或者另存,便于把所有的网络打上自创风格的烙印。
Cytoscapepharaoh还支持从网上直接导入相互作用网络,也是在File → Import → Network (Multiple File Types)一步,选择何为君子remote,然后输入url。从例题来看应该至少兼容SBML格式的。不过lin下代理我还是搞不定,这种奢侈的功能姐还是表痴心妄想了……
Part 2
第二课 筛选和编辑,地址见goo.gl/n2z6V
首先复习一下,还是以上一课那个sifna文件。依次导入、选择显示基因名。课文里说要
用到的插件不仅下载地址作废了,而且似乎并不需要。可能已经整合到基本的功能包里了。
现在开始玩玩筛选。首先用拖放选一大堆节点和连线(还是海选),然后Select → U Filters,控制面板里即出现Filters tab,在此tab中点Options,在弹出的下拉菜单中选Create new filter
害羞的含羞草 后开始定义筛选条件,比如连线的类型:在Filter Definition里选edge.interaction,然后点Add。此时指定了筛选依据,而具体条件还没指明。在Advanced里,输入 non_core或者core之类的连线类型,当然Y2H神马的也行啦。最后一定要按一下tab左下角的Apply
此时选中了相互作用类型为non_core的节点和连线。之后可以进行多种操作。比如Edit → Delete Selected Nodes/Edges,这样这些non_core的东西就统统删除了,剩下你认为更可信的蛋白及其相互作用。
可是还有一些和其他蛋白没有相互作用的蛋白,我们要把它们找出来、删除。很简单,如法炮制,仅仅把相互作用筛选条件换成“*”就行,选好后再利用New → Network → From
lected nodes, lected edges,调整一下layoutLayout → spring-embedded layout,这张图里只有有相互作用的蛋白。不过其实任务还剩个尾巴,有些蛋白可与自身相互作用,这部分蛋白还在这张图里。课文里说可以手动搞定,不过不晓得是否有批量处理的办法。
导入的文件也并不总是完美的,有时需要添加和删除某些节点和连线,此时需要用到控制 面板里的Editor tab。添加节点的话就在标有“Add a Node”的节点上点左键,然后把节点拖到右边的相互作用网络图里,在数据面板的Node Attribute Browr里可以看到新添的节点idnode0。在此窗口里点相应栏目,即可修改其属性,比如基因名之类的。
添加连线的话,在Editor tab里点“Directed Edge”,如法炮制,拖到右边图里某个节点上,确定相互作用的一方,然后把另一端拖到某个节点之上。连线属性在数据面板的Edge Attribute Browr里查看和修改。
删除:选中要删的东西,然后Edit → Delete Selected Nodes/Edges,此操作的快捷键是Del
Part 3
第三课 获取外部数据,地址见goo.gl/t5rQl
这一课要告诉我们:
a. 从外部服务(比如SGDBIND)下载Cytocape格式的数据;
b. cPath插件获取外部数据,其中cPath2.4版以后已经整合到Cytoscape核心包里了。
SGD 是酵母的库,Saccharomyces Genome Databa,提供physicalgenetic相互作用的信息,提供sif格式的下载,地址在:db.yeastgenome/cgi-bin/batchDownload。下载页面的说明挺简单,总之是指定想下的东西再重定向到另外一个页面,然后另存为就行了。
BIND Biomolecular Interaction Network Databa,主要提供蛋白相互作用信息,现在整合到BOND库里了。下载地址是 /,要注册,免费。登录后进入首页,搜索目标分子,搜到的相关信息分成五类:summaryquencesinteractions550分能上什么大学、complexespathways。打开interactions,在结果栏的右上角有导出功能,选择导出成sif格式即可。
另外还有 Pathway Commons库,地址是www.pathwaycommons/。课文也不知道啥时候编的,说建成后会超过BIND库,瞧瞧网站的意思,至少上线两年了,应该已经算建成了吧。目前已经整合的库包括:BioGRIDCancer Cell MapHPRDHumanCycIMIDIntActMINTNCI / Nature Pathway Interaction Databa,具体的说明见Pathguide。说起来Pathguide也是个奇网站,是个介绍全部325个途径和相互作用相关的数据库的概况的数据库,相当于目录或者提要。从这里你可以找到蛋白-蛋白相互作用、代谢途径、信号传导途径、表达途径、转录因子/基因调控网络、蛋白-复合物相互作用、 genetic相互作用网络、protein quence focud等等类型的数据库,查看其概况,然后决定去哪个库搜索信息。
最后是用cPath插件从CPpath数据库直接获取数据,后者从08开始就不更新了,而且建议用户使用Pathway commons
下载多个源的相互作用网络文件后,可以融合成一张图,需要用到Graph Merge插件。这个插件可能也整合进核心包了,疑似Plugins下的Advanced Network Merge
Part 4
第四课 表达分析,地址见goo.gl/Mu6aP
终于开始做正经事儿了,先唏嘘二点五秒钟~~
好了唏嘘完毕,开始学习。首先下载三个文件:galFiltered.sifgalExpData.pvalsa。接下来通过操作下载的示例文件来学习:
1. 导入galFiltered.sif,弹出数据面板和结果面板,最大化画布,用spring-embedded风格显示。
想去的地方2. 文本编辑器打开mrna文件,可以看到第一行是数据标签。对应于相互作用网络图,第一栏为节点名称,必须和sif文件里的节点名一模一样哟;第二栏是基因座名,Cytoscape里目前不显示;后面各栏是表达信息。各栏之间用whitespace隔开。这个mrna应该就是芯片直接导出的数据的格式吧?
3. 导入表达信息:Import → Attribute/,快捷键Ctrl+E。导入后,Node Attribute Browr里就能看到这个节点的表达量了。
基础工作就此结束,下面要玩花哨的活儿了。
4. 首先可以根据表达量高低给节点上不同的颜色。在VizMapper里先新建个显示风格,然后双击Node color,选择按照某类表达量分类,选蒹葭什么意思continuous mapping,然后点开下面那张颜色图设置阈值和颜色。别忘了按Apply哟。
下面是一些背景知识。Gal1Gal4Gal80都是酵母转录因子,在相互作用网络里分别对应YBR020WYPL248CYML051W。相互作用有两种类型:protein-protein (pp)protein-DNA (pd)。表达量信息分别是Gal1Gal4Gal80的表达异常情况下的值。现在我们要看这三个转录因子表达异常影响到的基因。

本文发布于:2023-06-22 22:14:59,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/1016491.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:蛋白   节点   连线   比如   信息   表达   数据   下载
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图