expaxy 上机练习

更新时间:2023-06-28 11:58:29 阅读: 评论:0

上机练习
1. 使用SRSSwiss-Prot进行查询。
搜索人的caveolin 蛋白,这是一类重要的膜蛋白,与转运,凋亡等多种生物功能相关。
进入Swiss-Prot站点,点击SRS, Start a new SRS ssion, 可以选择多个输入条件。默认为AllText即在数据库所有领域内搜索,也可选择特定领域如基因描述、组织特异性、序列长度等等。在第一个选择框Alltext中输入 caveolin ,“organism”输入 homo
点击 Do Query ”, 获得七条记录。 一定要点击“Do Query”,否则无结果返回。默认每页显示5条记录(图中红框位置,用户可自行调节)
选取第一条序列,紫苏田螺CAV1_HUMAN (人Caveolin 蛋白 1),点击进入察看。Reference部分为该序列相关的参考文献, Comments 为对该序列的一个综合描述,Cross-references 为其它数据库储存的与该序列相关的信息。推荐察看GeneCards(内中有详细的基因注释信息,如与表达谱相关的e-Northern), SOURCE (来自基因芯片试验的表达信息卡通猴) HOVERGEN (脊椎动物相似基因数据库,可以查找属于同一个家族的基因)博士专家推荐信DIP 蛋白相互作用数据库。每一个数据库都可以点击察看。Feature-table中记录了该序列不同区段的结构域与功能位点,突变位点等信息。
这里介绍一个数据库 DIP 数据库,点击对应链接,
显示DIP 数据库中对应记录编号为 DIP:5960N
点击该编号
记录的详细信息
点击右上角的“graph”连接,可以看到相互作用的蛋白图
红色蛋白(图中用椭圆框显示)为我们提交的蛋白,与之直接相连的蛋白为直接作用的蛋白,其它蛋白为间接作用,可点击每个点察看聚体信息。用户可以直接访问DIP网站dip.doe-mbi.ucla.edu/i ,可以采用多种方式查询,可以输入名称,可以提交自己的序列使用blast搜索DIP数据库中存储的与你的序列相似的蛋白序列,还可以输入你的序列中含有的PROSITE pattern ID进行查询。
翻刺床✧ 其它蛋白相互作用数据库可参看 ac.uk/GenomeWeb/prot-interaction.html
回到练习中
1. Caveolin 蛋白模式分析
回到上次Swiss-Prot查询结果, 页面最下方蛋白序列旁边,选择夏季防晒fasta 初中地理教学设计格式
得到蛋白序列
>sp|Q03135|CAV1_HUMAN Caveolin-1 - Homo sapiens (Human).
MSGGKYVDSEGHLYTVPIREQGNIYKPNNKAMADELSEKQVYDAHTKEIDLVNRDPKHLN
DDVVKIDFEDVIAEPEGTHSFDGIWKASFTTFTVTKYWFYRLLSALFGIPMALIWGIYFA
ILSFLHIWAVVPCIKSFLIEIQCISRVYSIYVHTVCDPLFEAVGKIFSNVRINLQKEI
把序列提交到ScanProsite 或是MotifScan )中,查
看结果。可能结果会较慢。
分析结果显示:
>PDOC00001 PS00001 ASN_GLYCOSYLATION N-glycosylation site [pattern] [Warning: pattern with a high probability of occurrence].
      35 - 38  NMSG
>PDOC00005 PS00005 PKC_PHOSPHO_SITE Protein kina C phosphorylation site [pattern] [Warning: pattern with a high probability of occurrence].
      72 - 74  SeK
>PDOC00006 PS00006 CK2_PHOSPHO_SITE Cain kina II phosphorylation site [pattern] [Warning: pattern with a high probability of occurrence].
    189 - 192  TvcD
>PDOC00008 PS00008 MYRISTYL N-myristoylation site [pattern] [Warning: pattern with a high probability of occurrence].
    118 - 123  GIwkAS
    143 - 148  GIpmAL
    151 - 156  GIyfAI
>PDOC00930 PS01210 CAVEOLIN Caveolins signature [pattern].
103 - 110  FEDVIAEP
显示该蛋白含有磷酸化位点和肉豆寇酰化位点,但是同时由于这些pattern较短所以给出警告酌金馔玉 with a high probability of occurrence”, 即在蛋白质中出现概率很高,要谨慎对待。最后一项给出caveolin 蛋白特有的模式,可靠性高。
用户也可以尝试自己把序列提交到InterPro (www.ebi.ac.uk/InterProScan/),  或是NCBI CD-SEARCH
3Caveolin 蛋白的一级序列性质分析
1) 使用ProtParam tool )计算Caveolin pI, Mw消光系数,氨基酸组成等数据
2) 使用PeptideCutter)查看Caveolin 的酶切位点
3) 使用ProtScale ( )查看caveolin各氨基酸的疏水性变化
4.使用TMHMM www.cbs.dtu.dk/rvices/TMHMM-2.0/ )进行跨膜预测
5.使用PSORT 作细胞内定位预测
k = 9/23
    39.1 %: mitochondrial
    30.4 %: cytoplasmic
      8.7 %: Golgi
      8.7 %: endoplasmic reticulum
      4.3 %: extracellular, including cell wall
      4.3 %: vesicles of cretory system
      4.3 %: nuclear
给出的预测结果仅供参考,在此例中与实际不太符合。
6.模拟构建caveolin pattern 汽车挂档的过程
首先查询caveolin 蛋白的模式,在PROSITE 主页面,查询caveolin
该模式pattern F-E-D-[LV]-I-A-[DE]-[PA]PROSITE 编号为PS01210,可以用此号去DIP
查询。
使用该Pattern 去查询Swiss-Prot 含有该Pattern 的蛋白。数据库选择Swiss-Prot
高级选项选择retrieve complete quences, 共得到14条蛋白。可以对这14条蛋白作多序列比对( www.ebi.ac.uk/clustalw ),找出保守位点,结果如下:
CLUSTAL W (1.82) multiple quence alignment
P79132          MSGGKYVDS--EGHLYTVPIREQGNIYKPNNKAMA-EEMNEKQVYDAHTKEIDLVNRDPK 57
P33724          MSGGKYVDS--EGHLYTVPIREQGNIYKPNNKAMA-EEMSEKQVYDAHTKEIDLVNRDPK 57
Q03135          MSGGKYVDS--EGHLYTVPIREQGNIYKPNNKAMA-DELSEKQVYDAHTKEIDLVNRDPK 57
P49817          MSGGKYVDS--EGHLYTVPIREQGNIYKPNNKAMA-DEVTEKQVYDAHTKEIDLVNRDPK 57
P41350          MSGGKYVDS--EGHLYTVPIREQGNIYKPNNKAMA-DEVNEKQVYDAHTKEIDLVNRDPK 57
P35431          MSGTKYVDS--EGFLYAAPVREQGNIYKPNNKMMA-DELSEKAVHDVDTKEIDLVNRDPK 57
Q9YGM8          MTGGLRDGEKEEEFLHSPFIRKQGNIYKPYNKDMDYDILNEKSMEDVHTKEIDLVNRDPT 60
P51637          ------------------MMTEEH------------TDLEARIIKDIHCKEIDLVNRDPK 30
P51638          ------------------MMTEEH------------TDLEARIIKDIHCKEIDLVNRDPK 30
P56539          ------------------MMAEEH------------TDLEAQIVKDIHCKEIDLVNRDPK 30
P51636          -----------------MGLETEKADVQLFMDDDSYSHHSGLEYADPEKFADSDQDRDPH 43
Q9WVC3          -----------------MGLETEKADVQLFMADDAYSHHSGVDYADPEKYVDSSHDRDPH 43
O46550          -----------------MGLETEKADVQLCMDDDAYSHHSAVDFGDLEQLADSGSDRDPR 43
Q9YGM9          -----------------MGLEKEKLECSIIMDEDEFNRSIEPILSKKARLYSSAPDRDPH 43

本文发布于:2023-06-28 11:58:29,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1058674.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   蛋白   数据库
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图