基于生物信息学分析食管鳞癌差异基因和预后价值

更新时间:2023-06-24 19:54:44 阅读: 评论:0

第51卷第1期新礓医学Vol.51 No.l 2021 年1月XINJIANG MEDICAL JOURNAL January.2021在线英语英语
•专题研究•
基于生物信息学分析食管鳞癌差异基因和预后价值
李疆芬,周众,张亚静
(新疆医科大学附属中医医院,乌鲁木齐830000)
摘要:目的鉴定食管鳞癌发生发展过程中的核心基因,寻找新的分子靶标。方法GEO数据库筛选出食管鳞癌数据集GSE20347,GSE20344,GEO2R分析差异基因。利用STRING和Cytoscape建立并修饰蛋白与蛋白相互作用网络,G O功 能和KEGG通路富集分析。Cytohubba计算核心基因,TCGA数据验证核心基因的表达情况。Kaplan Meier-plotter數据库用于核心基因的生存分析。结果获得共同上调基因19个和下调基因39个。其主要参与细胞外基质组织,定位于细胞外区域部分,功能为丝氨酸肽酶活性,涉及蛋白质消化吸收相关通路。12个核心基因在TCGA数据集的表达基本一致。CDH11,VCAN 和SPP1表达与食管鳞癌预后显著相关。结论CDH11和VCAN的下调以及SP P1的过表达被确定为食管鱗癌不良预后因素,为食管鳞癌的诊断和预后提供了新的标志物。
关键词:生物信息学;食管鳞癌;差异基因;核心基因
sao paulo
中图分类号:R735.1 文献标识码:A 文章编号:1001—5183(2021)01—07—06
Analysis of diiTerential genes and prognostic value of esophageal squamous cell carcinoma bad on
bioinformatics
LI Jiangfen,ZHOU Zhong,ZHANG Yajing
(Hospital of Traditional Chine Medicine Affiliated to the Fourth Clinical Medical College of Xinjiang Medical University, Urumqi, 830000, China)
Abstract: Objective To identify the hub genes in the development of esophageal squamous cell carcinoma and find new molecular targets. Methods Data ts GSE20347, GSE20344 and GE02R of esophageal squamous cell carcinoma were screened from geo databa. The protein-protein interaction network was established and modified by STRING and Cytoscap>e, and the GO function and KEGG pathway enrichment were analyzed. Cytohubba was ud to calculate core genes, and TCGA data was ud to verify the expression of core genes. Kaplan Meier plotter databa was ud for survival analysis of core genes. Results 19 up—regulated genes and 39 down regulated ge
nes were obtained. It is mainly involved in extracellular matrix tissue, located in the extracellular region, and its function is rine peptida activity, involving in protein digestion and absorption related pathways. The expression of 12 core genes in TCGA data t was basically consistent. The expressions of CDH11, VCAN and SPP1 were significantly correlated with the prognosis of ESCC. Conclusions The down-regulation of CDH11 and VCAN and the overexpression of SPP1 are identified as poor prognostic factors of ESCC, which provide new markers for the diagnosis and prognosis of ESCC.
Key words: Bioinformatics; Esophageal Squamous Cell Carcinoma; Differential Gene; Core Gene
食管癌是最常见的消化道肿瘤之一,在世界范 围内食管癌的发病率位居第八位,死亡率位居第六 位W。中国更是食管癌的高发国家,发病率位居世 界首位,食管癌发病率远超过世界平均水平[2]。食 管癌主要分为鳞癌和腺癌,西方国家多以食管腺癌 为主,我国则主要以食管鱗癌为主[3,4]。中国是食管癌的高发国家,尤其是在新疆北部的游牧民族哈萨 克族,由于其独特的饮食习惯和遗传背景等原因,食管鳞癌的发病率远远高于其他种族,对当地人民 的生存质量和社会经济均造成了沉重的负担r a。此 外,食管鳞癌具有特殊的发病特征,早期症状隐匿,确诊多以中晚期患者为主,肿瘤易发生侵袭和转
基金项目:新疆维吾尔自治区研究生科研创新项目(项目编号:XJ2019G116)。
作者简介:李疆芬,女,硕士,住院医师,研究方向:食管癌。
通信作者:张亚静,女,硕士,主任医师,研究方向:肿瘤病理,E-mail:****************。
8新疆医学第51卷
移,因此食管鱗癌患者预后很差目前食管鱗癌的治疗仍缺乏有效的特异性的药物和手段,主要 以手术治疗为主,创伤大,并发症多,死亡率居高不 下[6]。因此,迫切的需要了解食管鱗癌启动和进展过 程中基因表达水平的变化,寻找新的有效生物标志 物以更准确地预测食管鱗癌患者预后。
本研究旨在鉴定食管鳞癌发生发展过程中异 常表达的核心基因。首先从GEO(Gene Expression Omnibus,G E O)数据库下载了两个原始基因表达谱 芯片(G S E20347,G S E20344)。根据以上两个数据集 筛选差异基因。随后,进行了综合的生物信息学分 析,包括 G O(Gene Ontology,G O)术语分析,K E G G (Kyoto Encyclopedia of Genes and Genomes,K E G G)途径富集分析,蛋白质一蛋白质相互作用的构建以 及中枢基因的鉴定。此外,进一步的验证T C G A数 据集中核心基因的表达情况。最后,分析了核心基 因表达对食管癌患者0S和R F S的影响,并确定具 有预后预测价值的基因。基于以上,其结果为食管 鳞癌分子机制的研究提供指导。
1材料和方法
1.1 R N A S e q数据和差异基因的筛选resume发音
在 G E O 数据库(w bi.v/ geo/)中搜索“Esophageal cancer”相关的关键字,获 得共1413个关于人食管癌的数据集。通过阅读摘 要,题目和原始文献后,确定了 G S E23400和 G S E20347进行后续的研究,共包括食管鳞癌组织 样本数据70个,正常食管黏膜样本数据70个。其 中,G S E23400 基于 Agilent G P L96 平台(Agilent- 014850全人类基因组微阵列4 x44K G4112F)。
为了获得食管鳞癌组织和正常食管黏膜之间 的差异基因。使用G E02R在线分析工具( w bi.v/geo/geo2r/)分析,根据组织的 类型进行分类,食管鳞癌组织为实验组,正常组织 为对照组,根据IlogFC |> 2和P< 0.05为条件,对 每个数据集进行统计分析,筛选出差异基因。使用维恩图 webtool(bioinformatics.psb.ugent.be/webtools/ Venn/)鉴定交叉部分,认为这些基因是食管鳞癌的 差异基因。
1.2 G O和K E G G途径富集分析
基因本体论(G0)被广泛用于功能注释和富集分析。生物过程,分子功能和细胞成分是基因功能 的三个主要成分。K E G G是一种数据库资源,用于 收集由高通量实验技术生成的有关分子水平信息,生物途径和化学物质的大量数据。使用String databa (string-db/)对差异基因进行了 G0注释分析和K E G G途径富集分析D P< 0.05被 认为具有统计学意义。
1.3蛋白质一蛋白质相互作用网络的构建和Hub 基因的鉴定
利用 STRING数据库(s tri ng-db.OTg/)构建 差异基因之间的蛋白质一蛋白质相互作用网络' 以medium confidence> 0.4为条件提取PPI对。通 过 Cytoscape 软件(w scape/)可视化蛋白 质_蛋白质相互作用网络。利用Cytoscape软件的 插件(Cytohubba)计算并筛选核心基因。选用三种 方法(M C C、D M N C和dgree)前15位的重叠的基因 为最终的核心基因。
乐趣 英文
1.4 T C G A数据验证基因表达
GEPIA(http:"gepia.cancer-pku/detail.php)是 一种在线生物学分析工具[8],数据来源广泛,包括来 自T C G A和G T E x数据库的9,736个肿瘤和8,587 个正常样品的R N A测序表达数据。所有的数据均 经过标准化处理用于后续分析,在本研究中,G E P I A数据库用于验证食管癌和正常组织之间的 核心基因的差异表达,P< 0.05被认为具有统计学 意义。
1.5核心基因的生存分析
食管鱗癌的核心基因的临床结果分析是通过 Kaplan Meier-plotter数据库(/ analysis/)进行分析' 该数据库的背景数据库是使 用基因表达数据和从G E0下载的1809例患者的生 存信息(Affymetrix H G U133A 和 H G U133 + 2 微阵 列)建立的。在其默认设置下单独分析了 12个中
枢 基因与食管鱗癌患者(n= 81)总生存率(O S,Overall Survival Rate)和无复发生存率(R F S,Relap-Free Survival Rate)的关系。P< 0.05被认为具有统计学 意义。
random org
2结果
2.1食管鳞癌中差异基因的鉴定
G E0是目前应用最广泛且样本来源极丰富的
第1期李疆芬,等;基于生物信息学分析食管鱗癌差异基因和预后价值9
综合生物信息学数据库,通过筛选最终将GSE20347 和GS E20344纳人了本研究。其中G S E20347数据 集中包括食管鱗癌样本17个和与之相匹配的正常 食管黏膜样本17个,G S E23400含有53个食管鳞 癌样本和53个正常食管黏膜样本。
美国的文化G E02R是G E O数据库所属的在线分析工具,被用于筛选和分析在食管鳞癌微阵列表达谱数据 集G S E20347和G S E20344中的异常表达的基因。根据P<0.05和|l〇gFC |&2的标准,共鉴定出差异 基因353个,包括91个基因上调,204个基因下 调。对于微阵列数据集G S E20347共鉴定出90个 高表达的基因,202个低表达的基因,来自微阵列 数据集G S E20344共鉴定出20个高表达的基因,41个低表达的基因。为了获得更高质量的差异基 因,使用在线软件维恩图对两个数据集重叠的部分 进行筛
选,最终确定共同上调的基因19个(图1A),共同下调的基因39个(图1B),这58个基因 被鉴定为食管鱗癌的差异基因。
图1韦恩图筛选G S E数据集(GSE20347和GSE20344)的差异基因
(A)上调的差异基因。(B>下调的差异基因。
2.2差异基因的功能富集分析
为了探究差异基因的主要分子功能以及所涉 及的通路,我们通过String分析了食管鱗癌中差异 基因的G O功能包括生物学过程,细胞成分和分子 功能,以及K E G G途径富集分析,以下主要展示了 最为显著的前5个术语。在生物学过程类别中,差 异基因主要参与“细胞外基质组织”、“皮肤发育”、“组织发育”、“表皮发育”及“角质化”等过程。对于 细胞成分类而言,差异基因主要“细胞外区域部 分”、“细胞外区域”、“纤维状胶原三聚体”、“细胞外 基质”和“细胞外空间”。对于分子功能类而言,上差 异基因主要富含“丝氨酸肽酶活性”、“血小板衍生 生长因子结合”、“丝氨酸型内肽酶活性”、“蛋白酶结合”和“细胞外基质结构成分”。对于K E G G途径 富集分析,差异基因富集的前五个重要K E G G途径 包括:“蛋白质消化吸收”、“阿米巴病”、“松弛素信 号通路”、“E C M-受体相互作用”及“糖鞘脂的生物 合成一乳酸和新乳酸脂系列”。
2.3建立蛋白一蛋白相互作用网络并确定核心基因
为了进一步了解这些差异基因蛋白分子之间 的相互作用,通过S T R I N G数据库构建P P I网络,并通过Cytoscape软件识别核心基因验证。P P I网络 图共包括43个节点,109条边缘连接线(图2 )。
图2差异表达基因构建的蛋白质一蛋白质相互作用网络
为寻找在食管癌发生过程中发挥核心作用的 基因,我们利用三种方法计算并筛选了核心基因。通过M C C法鉴定出前15位得分最高的核心基因为 P O S T N,C O L1A1,C O L3A1,C O L1A2,C O L5A2,V C A N,C D H11,M M P1,SP P1,S U L F1,C0L11A1,SNAI2,S C E L, F L G和K R T4(图3A)D同时D M N C法计算出前15位 的核心基因为 S U L F1,C0L11A1,C D H11,C0L5A2, V C A N,C0L1A2,SNAI2,C0L1A1,C0L3A1,S P P1 , P0S T N,M M P1,PP L,P T H L H 和 M M P12(图 3B)。此 外,根据差异基因的连接数即dgree法鉴定出的核 心基因为 P0S T N,C0L1A1,C0U A1,M M P1,C0L1A2, C O L5A2,V C A N,S P P1,S C E L,C D H11, F L G,S U L F1, K R T4,C0L11A1和SNAI2(图3C)。三种方法提取重 叠的部分,最终确定12中核心基因为:SPP1,C D H11, S U L F1,C0L1A1,C O L5A2,P O S T N,M M P l,C0L1A2, SNAI2,C0L3A1,V C A N 和 C0L11A1(图 3D)〇最终
确定的核心基因具体信息和得分见表1。
10新疆医学第51卷
图3中枢基因的筛选
(A)M C C法,(B>DM N C和(C)dgree前15位核心基因的相互
作用关系。(D)韦恩图筛选重合的核心基因。
表1核心基因及得分情况
基因英文名中文名MCC DMNC Dgree
SPPI creted phosphoprotein 1分泌性磷蛋白17330.5539921.817
CDH11cadherin 11O B-钙粘蛋白15600.6997721.67
SULF1sulfata 1正硫酸酯酶17210.7132421.699
COL1A1collagen type 1alpha 1
chain
I型胶原a丨链30300.6000321.99
COL5A2foLIagen type V alpha 2
chain
forinstanceV型胶原a222800.6921321.864
POSTN{wriosfin骨膜蛋白30320.5364721.991 MMP1matrix metallopeptiHa 1基质金属蛋白酶17550.501221.875
C0L1A2collagen type I alpha    2
chain
I型胶原cx228800.6783921.871
SNAI2snail family transcriptional
repressor 2
锌指转录因子21440.6181421.299
COL3A1collagen type III alpha 1
chain
HI型胶原c d链30300.6000322.005
VCAN versiran索多功能蛋白
聚糖
21600.6921321.848
COL11A1collagen type XI alpha 1
chain
XI型胶原a l7200.7132421.232
2.4在G E P I A数据库中验证核心基因表达
为了验证与正常食管组织相比在食管癌中12 个核心基因的表达状态,使用基于T C G A数据的 G E P I A来确认结果。发现在食管癌中12个中枢基 因除SNAI2外均有明显的差异表达(图4A-L)。相 比于正常食管粘膜组织,食管鱗癌组织中SPP1,C D H11,S U L F1,C0L1A1,C O L5A2,P O S T N,M M P l, C0L1A2,C0L3A1,V C A N 和 C O L11A1 均显著高表 达(P均<0.05)。而SNAI2在食管癌组织和正常粘 膜中的表达无显著差异(P>〇.〇5)。
A I—••B
kka
E
i
¥
W C A»〇
L'JT-l
I
U
no
A
H
K
1
^cT
1丄
^cT 图4通过GAPIA数据库验证食管鳞癌样本和正常组织样本中
核心基因的表达
(A )SPP1, (B) CDH11, (C )SULF1, (D )COL1A1, (E )COL5A2, (F )POSTN, (G )MMP1, (H )COL1A2, (I )SNAI2, (J )COL3A1,
(K)VCAN,(UCOL11A1〇
图5中枢基因(CDH11,VCAN)影响食管鱗癌患者的
总体生存率(O S)
(A)CDH11和(B)VCAN低表达预示着食管鳞癌的O S相对更短。
图6中枢基因(SPP1,CDH11,VCAN)影响食管鳞癌患者的
无复发生存率(RFS)
(A)SPP1高表达与食管鳞癌患者更差的RFS相关。
(B)CDH11和(C)VCAN低表达预示着食管鳞癌的RFS
cretary
相对更短。
第1期李疆芬,等;基于生物信息学分析食管鱗癌差异基因和预后价值11
2.5 C D H11,V C A N和SPP1可能是食管鳞癌潜在 预后预测生物标记
为了分析食管鳞癌的12个核心基因的预后价 值,检索了 Kaplan Meier-plotter数据库中81例食 管鱗癌数据。C D H11和V C A N的下调与更差的0S 显著相关(图5A-B,P均<0.05)。为进一步了解中 枢基因与复发的关系,进一步分析了 12中个核心 基因与食管鳞癌患者R F S的关系。发现高表达SPP1的食管鳞癌患者R F S显著更短(图6A,P<0.05)。此外,与之前分析结果一致,C D H11和V C A N的下 调与更差的R F S显著相关(图6B-C,/3均<0.05)。3讨论
nowornever尽管外科手术和药物治疗手段在不断进步,但 由于食管鳞癌特殊的临床病理特点,其预后仍然较 差1食管鱗癌死亡的原因主要是由于缺乏在早期 阶段特异性的检测指标,用于肿瘤早期诊断和预后 预测分析[3]。因此,探索食管鳞癌发生发展过程中 的分子机制,以实现食管鱗癌早诊早治,预后预测 和危险评估迫在眉睫。近年来,通过大数据全面综 合分析疾病发展过程中的全基因组基因的表达情 况,通过生物信息学的方法探索遗传变异,鉴定差 异基因用于肿瘤的诊断,治疗和预后预测是有效,方便且全面的方法[1()1。.
为了确定与食管鳞癌发生相关的潜在关键基 因,在本研究中进行了基因表达和蛋白质一蛋白质 相互作用分析。通过比较来自两个G E0数据集的 基因表达谱数据,发现食管鳞癌的58个差异表达 的基因。然后,对差异基因进行了 G O和K E G G通 路分析,差异基因主要位于细胞外区域部分中,参 与:“细胞外基质重塑”,涉及“丝氨酸肽酶活性”等 功能。Kang M i n等人的研究报道亦显示外泌体能够 参与食管鳞癌细胞相互作用,充当功能性介质,促 进肿瘤的化疗耐药[111。在食管鳞癌中基质金属蛋白 酶-9( matrix metalloproteina- 9,M M P-9)参与细 胞外基质的重塑,其在肿瘤组织高表达,与食管鳞 癌的发生和转移密切相关t121。K E G G富集分析后发 现了五个重要途径,“蛋白质消化吸收”,“阿米巴 病”“松弛素信号通路”,“E C M -受体相互作用”,“糖鞘脂的生物合成一乳酸和新乳酸酯系列”。之前的研究亦表明,代谢途径与食管鳞癌的发生和进展 密切相关1131。这些结果也为研究食管鱗癌进展中的 分子相互作用提供了重要线索。
通过构建了蛋白一蛋白相互作用网络以检测 差异基因之间的相互作用关系,并最终鉴定了 12 个核心基因,包括 SP P1,C D H11,S U L F1,C0L1A1,C0L5 A2,P0S T N,M M P1,C0L1A2,SNAI2,C0L3A1, V C A N和C0L11A1。并应用T C G A数据集的数据进 一步验证,发现这些基因的表达趋势基本一致。通 过进一步的预后分析发现可以将C D H11,V C A N和 SPP1视为食管鳞癌预后预测的标志物。尽管有研 究已经报道了这些核心基因与各种癌症的诊断,治 疗和预后有关%16],但尚未完全了解其在食管鱗癌 发生和进展的分子机制。
mobile japane xxx
钙粘附蛋白-llCCadherin- 11,C D H11)编码 来自钙粘蛋白超家族的II型经典钙粘蛋白,该膜 蛋白调节钙依赖性细胞之间的粘附和影响干细胞 分化間。C D H11在头颈癌中过表达,抑制肿瘤的 增殖和侵袭[18]。在本研究中发现C D H11在食管鳞 状细胞癌中高表达,C D H11的下调导致患者不良 预后。由此可见C D H11在不同肿瘤的发生过程中 具有不同的表达趋势,本研究首次报道了 C D H11 可以作为食管鳞癌预后的新型预测指标。
多能聚糖(Versican.V C A N)属于大型聚集硫酸 软骨素蛋白聚糖的家族,主要位于细胞外基质 (E C M)内[19]。在白血病中,核憐蛋白(nucleophosmin, N P M1)突变通过T G F-|3/c P M L/S m a d信号上调 V C A N,促进上皮一间叶转化,参与白血病细胞的迁 移和侵袭[20]。在之前的研究中发现,V C A N在胃癌 中高表达,V C A N高表达能够作为胃癌患者中总体 生存的独立危险因素[2\—些研究显示相反的结 果,在胰腺神经内分泌肿瘤中的研究显示V C A N蛋 白普遍阳性表达,与更长的无病生存期(D F S)显着 相关[221。本研究显示V C A N低表达预示着食管鳞癌 患者更差的0S和D F S。
分泌的憐蛋白 1(Secreted phosphoprotein1,SPP1)是一种分泌型糖蛋白,与参与多种肿瘤的增 殖,分化,迁移和化疗耐药防241。与我们的研究一 致,在食管鳞癌的研究中已证明SPP1可以作为有

本文发布于:2023-06-24 19:54:44,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/1031050.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:食管   基因   鳞癌   表达   分析   核心
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图