基于GEO和TCGA数据筛选和鉴定食管鳞状细胞癌关键枢纽基因

更新时间:2023-07-22 12:14:48 阅读: 评论:0

医学临床研究2021年5月第38卷第5期J Clin Res,May 2021,Vol 38. N〇5• 659 •
•论著•基于G E O和T C G A数据筛选和鉴定食管鳞状细胞癌关键枢纽基因
引用误差刘蓉】黄伟2王磊3*
(1.吉首大学生物资源与环境科学学院,湖南吉首416000;2.中南大学湘雅医院,湖南长沙410008;3.中南大学基础医学院,湖南长沙410008)
[摘要]【0的】基于G E O和T C G A数据库中的食管鳞状细胞癌的转录组数据,利用生物信息学方法筛选和鉴亲子社区
定食管鳞状细胞癌的关键枢纽基因。【方法】下栽G E O中食管鳞状细胞癌数据集GSE17351和T C G A中的食管
鳞状细胞癌RNA-s e q数据,利用R软件L im m a程序包筛选差异表达基因;利用C lu sterP ro filer程序包对差异基
因进行G O分析和K E G G信号通路富集;利用S T R IN G工具分析差异基因编码蛋白之间的相互作用网络并用
C ytoscape软件进行可视化展示;利用C ytoscape的C ytohubba插件分析关键枢纽基因;利用K-M p lo tte r分析关
键枢纽基因的预后价值。【结果】通过G E O和T C G A筛选共得到167个共同差异表达基因;差异基因主要与核
分裂、A T P a 活性和D N A解旋酶活性等G O过程相关,且显著富集于D N A细胞周期、D N A复制、错配修复、印
母细胞减数分裂、ECM-受体相互作用、p53及W n t等信号通路;一共筛选得到10个关键枢纽基因,其中BUB1、
MAD2L1、N U F2、K IF18A、C E N P K、C E N P N、C E N P Q和SPC25等8个基因与食管鳞状细胞癌患者的预后呈显著
负相关。【结论】本研究经筛选得到了10个食管鳞状细胞癌关键枢纽基因,其中8个与预后相关,为食管鳞状细
胞癌的分子机制研究和预后判断提供了潜在的靶点。
[关键词]癌,鳞状细胞;食管肿瘤;基因表达调控,肿瘤;遗传学技术
Screening and Identifying the Hub Genes in Esophageal Squamous Ceil Carcinoma Bad on GEO
and TCGA Data L I U R o n g,H U A N G Wei ♦W A N G Lei( College o f biology a n d envirom ental
science,Jishou U n iversity.J is h o u,H unan, 416000)
LAbstract]【Objective】T o screen and identify the key pivotal genes of ESCC by bioinformatics m ethods bad
on transcriptom e data of ESCC from geo and TCGA databas.【M ethods】GSE17351 datat and RNA-q data of
ESCC were downloaded from GEO and TCGA databas. Then Lim ma package of R softw are was applied to
screen differentially expresd genes;ClusterProfiler package was ud to perform GO analysis and KEGG P ath­
way enrichm ent;STRIN G tool was ud to analyze the interaction netw ork among proteins encoded by differential
genes and the interactom e was visualized by Cytoscape softw are;C ytoscapes Cytohubba plug-in was subjected to
analyze key hub genes among interactom e;The prognostic values of hub genes were analyzed by K-M plotter. {Re-
su ltsj A total of 167 differentially expresd genes were screened by GEO and T C G A;The differentially expresd
genes were mainly related to GO process such as mitosis* A TPa activity and DNA helica activity, and were significantly enriched in DNA cell cycle, DNA replication, mism atch repair, oocyte m eiosis, ECM receptor inter­
action, p53 and W nt signaling pathw ays;A total of 10 key genes were screened,including BUB1,M A D2L1,
ps笔刷怎么用NUF2 ,K IF18A,C E N PK X E N P N X E N P Q and SPC25, which were negatively correlated w ith the prognosis of pa-
tients with ESCC.【Conclusion】Ten key pivotal genes of ESCC were screened,and eight of them
were related to prognosis, which provided potential targets for molecular mechanism rearch and prognosis judgm ent of ESCC.
[Key words] C arcinom a,Squamous C ell;Esophageal N eoplasm s;Gene Expression Regulation, Neo­
plastic;Genetic Techniques
[中图分类号]R735.1 [文献标识码]  A [doi:10.3969/j.issrU671-7171.2021.05.006][文章编号]1671-7171 (2021 )05-0659~05通讯作者,E-mail:***************
• 660 •医学临床研究2021年5月第38卷第5期J Clin Res,May 2021, Vol 38, N〇5
食管癌(Esophageal cancers)是最常见消化道恶性肿瘤之一,死亡率位居所有肿瘤第六位,以中国为代表的东亚地区是高发区[K2]。食管鱗状细胞癌(Esophageal squamous cell carcinoma,ESCC)是最主要的食管癌类型,占全部食管癌的90%,其早期诊断率不高,确诊患者以伴随局部侵袭和远端转移的中晚期为主,且治疗抵抗率及复发率高,严重威胁人民健康安全[1’2]。因此深人研究E S C C的病理机制,开发新的诊断和治疗手段,提高E SC C的临床治疗水平具有重要意义。与其他恶性肿瘤一样,食管癌的发生和发展是一个外界致病因素与内部遗传信息相互作用的,多因素、多步骤过程。流行病
学研究已证实,酗酒、吸烟、不健康饮食及饮食习惯等与ESC C的发生密切相关,但是E SC C发生发展的分子机制,以及介导致病因素促成恶性转变的关键基因等遗传机制尚未阐明,亟待进一步全面和深人研究[13]。近年来,随着高通量测序技术的发展及数据存储、处理和可视化技术的发展,GECKGene Ex­pression Omnibus)和 TCGA(The Cancer Genome A tlas)等收集和储存多水平肿瘤遗传信息和配套临床治疗和预后信息的公共平台为研究肿瘤发生发展的分子机制提供了极大便利,大大推动和加快了肿瘤研究的步伐[46]。本研究基于G E O和T C G A数据库中收录的E SC C的转录组数据和配套临床资料数据,应用生物信息学分析方法,筛选和鉴定了在食管癌的发生和发展中发挥关键作用的枢纽基因(H ub genes),为揭示ESC C的分子机制提供了重要证据和支持。
1材料和方法
1.1 下载高通量的ESC C数据 GECKGene Ex­pression Om nibus,h ttp://bi.v/ geo)是美国国立生物技术信息中心(National Cen­ter for Biotechnology Information,NCBI)创建的基因表达数据库,其中包含世界各地研究机构提交的高通量基因表达数据m。本研究选择了GSE17351数据集,包含五例ESC C肿瘤组织样本及配对的癌旁正常样本。从 GDC(G enom icD ataCom m ons)数据门户网站(h ttp s://portal,gdc.cancer,gov/)下载TCGA(The Cancer Genome A tlas)中的 ESCC 及正常对照组的RNA-s e q数据及配套临床资料,一共包含160例肿瘤样本和11例正常组织样本。
1.2分析差异基因使用统计学计算和图形学软件RU ersion 4.0.5)进行数据处理和差异基因分析。其中G E O数据集用R软件A ffy包对芯片原始数据进行预处理和标准化,包括用K N N方法补充缺失值,中位数方法标准化表达谱数据等,而后使用L im m a包筛选肿瘤中异常表达的基因集合。从T C G A下载的ESCC RNA-s e q数据,同样Limma 包进行差异基因的筛选[8]。差异基因筛选条件为:“Adjusted P <0.05且 |(log2FC)丨> 1”。将 GEO 和T C G A筛选得到共同差异基因,作为最终差异基因进行后续分析。
1.3富集分析差异基因的功能利用基因本体论(Gene Ontology,GO)分析,对差异基因进行注释,包括分子功能(M F),生物途径(BP)和细胞成分(CC)等三个方向。利用K E G G通路富集分析差异基因的主要富集的相关信号通路,揭示其在ESCC 中的致癌作用。G O和K E G G分析均利用R软件的ClusterProfiler程序包实现w。
1.4 构建蛋白互作网络(Protein-Protein interac­tion,P P I)利用蛋白质相互作用预测数据库STRING(h ttp://string-db)分析差异基因(蛋白)之间的相互作用网络[1°],根据数据库计算得出的基因间的连接得分,筛选得到差有相互作用的基因对,保留链接得分>0.9的基因对信息,并使用Cytoscape(version:3.8)对相互作用网络进行可视化L11]。
1.5 枢纽基因的确定及预后分析C ytohubba插件是Cytoscape软件中的一个常见插件,主要用于发现复
杂网络的关键目标和子网络[12]。本研究利用Cytohubba插件,对ST R IN G分析得到的蛋白互作网络进行进一步分析,筛选在其中发挥关键作用的枢纽基因。随后笔者使用在线生存分析工具K-M Plotter(h ttp:///analysis/index. php),分析关键基因表达水平与ESC C患者总体生存率等预后的相关性。
2结果
2.1获取具有显著差异的基因基于G E O数据集GSE17351,利用R软件分析后一共筛选得到427个显著差异表达基因;基于T C G A来源的ESCC RNA- q数据一共筛选得到2395个显著差异表达基因;两种来源的差异基因的热图(图1A)。将两者取交集后,一共得到167共同差异表达基因(图1B )。
医学临床研究 2021年5月第38卷第5期 J Clin Res,May 2021, Vol 38, N q 5• 661 •
•7 «a
•• ■<
Cinoai
图5
关键枢纽基因的KEGG 信号通路分析
2.4 关键枢纽基因预后分析为了验证关键基因的临床意义,笔者利用K-M  P lo tte r 分别分析了上
图2 ESCC 差异基因的G O 分析和KEGG 信号通路分析(A :G O 分
析;B:KEGG 信号通路分析)
2.3蛋白互作网络(P P I )与关键枢纽基因鉴定
STR IN G 分析总共获得了 381对蛋白对的相互作用
网络,其结果利用C ytoscape 软件进行了可视化展 示(图3)。基于C tyoscape 软件Ctyohubba 插件,对
STR IN G 分析得到的互作网络中的节点基因进行率 M M C 得分,得分最高的10个基因被定义为关键枢 纽基因(图 4),分别为 CDC 20、BUB 1、MAD 2L 1、 NUF 2、KIF 18 A 、CEN PN 、SPC 25、CENPQ、CENPO
和CENPK ,上述10个基因显著富集于细胞周期和 细胞分裂等通路(图5),表明上述10个基因可能在
ESC C 的发生和恶性增殖中发挥关键作用。
A
TCGA GEO
图1
基于TCGA 及G EO 数据筛选ESCC 差异基因
2.2 差异基因G O 分析和K E G G 富集 G O 分析 结果显示差异基因主要在生物学过程(BP )上主要 富集于核分裂、染色体分离、D N A 构象改变等有丝 分裂相关事件;在细胞成分上(CC )主要富集于
染色 体、着丝粒、纺锤体等细胞分离相关成分;在分子功 能上(MP )主要富集于A T P a 活性、D N A 解旋酶 活性和微管运动活性等D N A 相关功能(图2A )。
K EG G 通路分析中,差异基因主要富集于细胞周期、 D N A 复制、错配修复、卵母细胞减数分裂、ECM -受
体相互作用、P 53及W rit 等信号通路(图2B )。
A B
图3
差异基因的P P I
作用图
• 662 •医学临床研究2021年5月第38卷第5期J Clin Res,May 2021,Vo丨38, N〇5
述关键基因与ESCC预后指标-总体生存时间的关系。如表1所示,上述关键基因的表达水平与患者的预后呈负相关,其中BUB1(P=0.038),MAD2L1 (P =0.035),NUF2 (P=0.015), KIF18A C P =0.0045),C
苦伶
ENPK(P =0.028),CEN-PN(P =0.0083),CENPQ(P =0.00042)和 SPC25 (P =0.0056)具有显著差异。因此,预后分析表明,上述关键基因与ESCC的发生和预后相关,筛选结果具有较强的可靠性。
3 讨论
目前,ESCC的发病机制.尤其是分子机制还有待阐明M。本研究利用G E O及TC G A中ESCC的高通量测序数据,利用R软件中的Umma,和Cluster-Profiler等程序和STRING及Cytoscape等工具,分析了在ESCC中异常表达基因,对异常表达基因参与的生物功能和信号通路等进行了富集,证实差异基因显著富集于细胞周期,D N A复制,错配修复,卵母细胞减数分裂,ECM-受体相互作用,P53及W nt等信号通路;同时还筛选和验证了差异基因中的关键枢纽基因,初步证实81^1,1\4八020,1^1^2,1<^18八,0£1''4-PK,CENPN,CENPQ和 SPC25 等基因在 ESCC中具有关键作用,与ESCC预后呈负相关。因此,我们的研究结果进一步补充了 ESCC发生发展的分子机制,为后续验证上述关键基因的功能提供了科学基础。
本研究筛选到了CDC20、BUB1、MAD2L1、NUF2、KIF18A、CENPN、SPC25、CENPQ、CENPO和CENPK等10个在ESCC中具有关键作用的候选枢纽基因,上述基因是细胞周期和细胞分裂过程中关键的结构蛋白或者活性调控蛋白,提示其表达异常在ESCC发生和恶性转变中发生了关键作用。并且BUB1、MAD2L1、NUF2、KIF18A、CENPK、CENPN、CENPQ和SPC25等8个关键基因的表达水
平升高与ESCC患者预后不良相关,进一步验证了上述基因在ESCC具有重要作用。这也得到了相关研究的验证。如:研究表明,BUB1在胃癌、肝癌、胰腺导管腺癌等肿瘤中表达上调且其高表达指示预后不良,具有促进肿瘤进展的作用[1316]。MAD2L1在乳腺癌和胃癌中表达上调,可以促进细胞的生长和增殖[17’18]。NUF2在乳腺癌[19_21]、胶质瘤™、胰腺癌[23]、肝癌[24]和肾癌[25]等众多肿瘤中高表达,且其高表达与患者预后不良相关。KIA18则在前列腺癌[26]、胃癌%、肺腺癌[28]、乳腺癌[29’3°]和结肠癌[31]中表达升高,同样与肿瘤分期、进展及预后不良相关[〜31]。因此,上述研究结果从侧
面验证了为筛选得到的ESCC关键枢纽基因的可靠性,为下一步探讨其在ESCC中的具体功能和机制提
供了有力的支撑,具有重要的理论价值。
[参考文献]
[1] REICHENBACH Z W, MURRAY M G, SAXENA R, et al .
Clinical and translational advances in esophageal squamous cell
carcmoms^y]. Adv Cancer Res %2019, 144:95-135.
[2] ABNET C C, ARNOLD M, WEI W Q. Epidemiology of esopha­
geal squamous cell carcinoma [J]. Gastroenterology,2018* 154
(2): 360-373.
[3] CODIPILLY D C, QIN Y, DAWSEY S M, ^ a/ . Screening for
esophageal squamous cell carcinoma :Recent advances [ J ].
Gastrointest Endosc j2018, 88(3) :413-426.
[4] DAS T. Integration of online omics-data resources for cancer re­
arch [J]. Front Genets2020, 11:578345.
[5]张卓.面向肿瘤精准医学的综合数据资源tcga及其相关在线分
析工具推荐[J].中华医学图书情报杂志,2018,27(3) :5-9.
[6] BLUM A, WANG P, ZENKLUSEN J C. Snapshot:Tcga-ana­
lyzed tumors[J]. Cell y2018, 173 (2):530.
[7] EDGAR R, DOMRACHEV M, LASH A E. Gene expression
omnibus:Ncbi gene expression and hybridization array data re-
pository[J]. Nucleic Acids Res,2002, 30 (1):207-210.
[8] RITCHIE M E, PHIPSON B, WU D, et al .Limma powers dif­
ferential expression analys for ma-quencing and microarray
studies[J]. Nucleic Acids Res,2015, 43 (7):e47.
[9] YU G, WANG L G, HAN Y, et al .Clusterprofiler:An r pack­
age for comparing biological themes among gene clusters [J].
OMICS,2012, 16 (5):284-287.
[10] SZKLARCZYK D,MORRIS J H,COOK H,衫a/ . The string
databa in 2017:Quality-controlled protein-protein association
networks, made broadly accessible [J]. Nucleic Acids Res , 2017,
45 (D l):D362-D368.
[11] SHANNON P, MARKIEL A, OZIER O, et al .Cytoscape:A
software environment for integrated mcxlels of biomolecular inter­
action networks [J]. Genome Res f2003» 13 (11):2498-2504. [12] CHIN C H, CHEN S H, WU H H, ^a/ .Cytohubba:Identif­
ying hub objects and sub-networks from complex interactome [J].
BMC Sjysi 极〇/,2014, 8 Suppl 4 Sll.
[13]李小燕,何杰,余觅,等.B ubl基因在胃癌组织中高表达:基于
oncomine数据库及生物信息学方法[J].南方医科大学学报,
2020, 40(5):81-90.
[14] YANG W X, PAN Y Y, YOU C G, Cdkl,ccnbl,cdc20, bubl,
m ad211 ,2,and rfc4 may be potential therapeu­
tic targets for hepatocellular carcinoma using integrated bioinfor-
matic analysis [J]. Biomed Res Int2019, 2019 : 1245072.
[15] ZHU L J, PAN Y, CHEN X Y.e t al .Bubl promotes prolifera­
tion of liver cancer cells by activating smad2 phosphorylation [J].
Oncol U tt, 2020,19(5) :3506-3512.
医学临床研究2021年5月第38卷第5期J Clin Res,May 2021, Vol 38, N q5• 663 •
[16] PI A O J, ZHU L» SUN ]•, et al .High expression of cdkl and
bubl predicts p cx>r prognosis of pancreatic ductal adenocarcinoma
[n.G ene,2019, 701: 15-22.
[17] ZHU X F, YI M, HE J, et al .Pathological significance of
m ad211 in breast cancer:An immunohistochemical study and meta
analysis [X\.lnt J Clin Exp Pa//io/,2017, 10 (9):9190-9201. [18] WANG Y, WANG F, HE J, et al .Mir-30a-3p targets mad2U
and regulates proliferation of gastric cancer cells [J], Onco
Targets Ther,2019, 12: 11313-11324.
对联制作[19] LV S» XU W, ZHANG \e t al .Nuf2 as an anticancer therapjeu-
tic target and prognostic factor in breast cancer[J]. Int J Oncol ^
2020, 57 (6):1358-1367.
[20] XU W, WANG Y, WANG et al .Screening of differentially
expresd genes and identification of nuf2 as a prognostic marker
in breast cancer [J]. Int J Mol Med j2019, 44 (2):390-404. [21] ZHAI X, YANG Z, LIU X, et a/ . Identification of nuf2 and
fam83d as potential biomarkers in triple-negative breast cancer
[J]. Peer] ,2020, 8:e9975.
[22]HUANG S K,QIAN J X, YUAN B Q, et al.Sima-mediated
knockdown against nuf2 suppress tumor growth and induces cell
apoptosis in human glioma cells [ J ]. Cell Mol Biol
(Noisy-le-grand) i2014, 60 (4):30-36.
[23] HU Pt CHEN X, SUN J, et al .Sima-mediated knockdown a-
gainst nuf2 suppress pancreatic cancer proliferation in vitro and
in vivo [J]. Biosci Rep-,2015» 35(1) :e00170.
[24] LIU Q, DAI S J, LI et al .Silencing of nuf2 inhibits tumor
growth and induces apoptosis in human hepatocellular carcinomas
(上接第658页)
[参考文献]
[1]孙芳燦.妊娠期高血压疾病不良结局预测模型的研究进展[J].
实用妇产科杂志,2019,35(9) :677-681.
[2] FAUVEL J P. Hypertension during pregnancy:Epidemiology,
definition[J]. Pres M ed, 2016,45(7-8 Pt 1):618-621.
每拼音
[3]菅莹莹,陈蕊娟,文舒婷,等.心脏丝氨酸蛋白酶及内皮生长因
子与妊娠期高血压疾病的相关性及预测价值[J].中华临床医师
杂志(电子版),2017,11(7): 1079-1085.
[4]王晓琴,车文静,田慧.妊娠期高血压疾病孕妇晚断脐带对新生
儿并发症、脐部愈合、血常规指标及血清hs-CRP、IL-6、TNF-a
水平的影响[J].中国妇幼保健,2019,34(1) :79-83.
[5]中华医学会妇产科学分会妊娠期高血压疾病学组.妊娠期高血
压疾病诊治指南(2015)[J].中华妇产科杂志,2015,50(10) :721. [6]王志强,赵波,邓耀,等.血液流变学及凝血指标对妊娠期高血
压患者围产结局的影响[J].西部医学,2019,31(11) :1715-1718. [7]康宁,江显春.妊娠期高血压患者血小板参数、凝血功能及血液
流变学相关指标检测及意义[J].中国卫生检验杂志,2019,29
(10)-1227-1229.
[8]刘杰,梁玉贞.妊娠期高血压患者血清微小RNA-210、一204-5p、
一376c与其血液流变学指标的相关性及其诊断价值研究[J].中
O']. Asian Pac J Cancer Prev,2014, 15 (20):8623-8629.
[25] XIE X* LIN J, FAN et al .Lncma cdkn2b-asl stabilized by属牛人今日财运
igf2bp3 drives the malignancy of renal clear cell carcinoma through
epigenetically activating nuf2 transcription [J]. Cell Death Dis y
2021, 12 (2): 201.
[26]ZHANG H,SHEN T, ZHANG et al .Expression of kifl8a is
associated with incread tumor stage and cell proliferation in
prostate cancer [J]. Med Sci Mon i t,2019, 25:6418-6428.
[27]王立,杨松,孙若川,等.驱动蛋白超家族18a在胃癌组织中的
表达及其与患者预后的关系[J].中华胃肠外科杂志,2016,
(19);585-589.
[28] ZHONG Y, JIANG L, LIN H, et al . Overexpression of kifl8a
promotes cell proliferation, inhibits apoptosis, and independently
predicts unfavorable prognosis in lung adenocarcinoma [J].
IUBMB Life,2019, 71 (7):942-955.
[29]ALFARSI L H, ELANSARI R,TOSS M S, et al .Kinesin fami­
ly member-18a (kifl8a) is a predictive biomarker of poor benefit
from endocrine therapy in early er+breast cancer, [J]. Breast
Cancer Res Treats2019, 173 (1):93-102.
[30]ZHANG C, ZHU C, CHEN H, et al .Kifl8a is involved in hu­
man breast carcinogenesis [J], Carcinogenesis^2010, 31 ( 9 ):
1676-1684.
[31] NAGAHARA M, NISHIDA N, IWATSUKI et al .Kinesin
18a expression:Clinical relevance to colorectal cancer progression
[J]. Int J Cancer,2011, 129 (11):2543-2552.
(本文编辑:詹道友)[收稿日期]2021-04-28
[9]邓飞涛,舒心,朱剑文,等.细胞因子IL-6及TNF-a在妊娠期高
血压风险预测价值中的研究[J].中国优生与遗传杂志,2019,27
(9):1085-1087.
[10] KONG D.Correlation between the expression of inflammatory cy­
tokines IL-6, TNF-a and hs-CRP and unfavorable fetal outcomes
in patients with pregnancy-induced hypertension [J]. Exp Ther
Med, 2018,16(3): 1982-1986.
[11] LAMARCA B, SPEED J, RAY LF» et al .Hypertension in re­
spon to IL-6 during pregnancy:role of AT 1-receptor activation
[J]. Int J Interferon Cytokine Mediat Res ^2011 ♦2011 ( 3) :65-
70.突发环境事件
[12]菅莹莹,王瑜,李姝汶,等.心脏丝氨酸蛋白酶、内皮因子在妊娠
期高血压疾病中作用的研究进展[J].中国计划生育学杂志,
2017,25(5):355-357.
[13]马艳.妊娠期高血压疾病孕妇围生期血小板活化和血液流变学
状态的变化观察[J].中国妇幼保健,2020,35(1) :33-35.
[14]冯艳.血液流变学指标检测在妊娠期高血压疾病产妇病情发展
及预后中的价值分析[J].中国妇幼保健,2015,30(18): 2917-
2919.
(本文编辑:邓丽萍)[收稿日期]2020-11-03华妇幼临床医学杂志(电子版),2019,15(5) :554-559.

本文发布于:2023-07-22 12:14:48,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/1110750.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   表达   分析   关键   研究
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图