胃癌枢纽基因的筛选和预后分析

孙梦雨1,邱洁萍1,吴之涵1,张倩1,朱爽秋1,陈博2

(1. 安徽医科大学 第一临床医学院,安徽 合肥 230000;2. 安徽医科大学第一附属医院 胃肠外科,安徽 合肥 230000)

摘 要 目的: 运用生物信息学方法探讨胃癌的预测指标和治疗靶点,并分析其与预后的关系。

方法: 从基因表达综合(GEO)数据库下载3个微阵列数据集(GSE13911、GSE33651、GSE79973),运用GEO2R筛选出胃癌样本与正常组织样本间的差异表达基因,通过基因本体论(GO)富集分析和京都基因与基因组百科全书(KEGG)分析对差异基因进行功能和通路注释,同时使用STRING和Cytoscape构建蛋白互作网络(PPI),筛选出枢纽基因,结合Kaplan-Meier plotter数据库对筛选出的枢纽基因进行预后分析。

结果: 共筛选出135个差异表达基因,其中68个上调,67个下调。GO分析结果表明差异表达基因主要参与信号转导、钙离子结合、细胞外外泌体等生物学过程。KEGG分析显示差异基因主要富集的通路包括PI3K/Akt信号通路、ECM受体相互作用、黏着斑。经PPI分析筛选得出COL1A1、COL1A2、COL4A1、FN1、THBS1、CD44、COL2A1、COL4A2、CXCL8、COL5A1为枢纽基因,生存分析显示除THBS1的上调,其余基因的差异表达均影响胃癌患者的总体生存率。

结论: 所筛选的枢纽基因的异常表达可能参与胃癌的发生发展过程,与胃癌患者的预后密切相关,可以作为潜在的预测指标和治疗靶点为胃癌的进一步研究提供依据。

关键词 胃肿瘤;基因表达;预后;计算生物学

胃癌是最常见的胃肠道肿瘤之一,是一种全球性的健康问题。近来,胃癌患者的治疗在很大程度上取决于肿瘤病理分期,病理活检仍然在胃癌的诊断中发挥着重要作用[1]。然而,活检对于潜在胃癌患者没有显著作用,大多数具有特定不适症状的患者其实已发展至中晚期,因此全球胃癌患者的5年生存率仅为10%左右[2]。由于对胃癌进行了广泛筛查,在美国这一比率约为30.4%,而韩国的胃癌患者5年生存率超过65%[1]

研究表明,大量生化标志物参与肿瘤的发生发展过程并可用于早期筛查[3],但许多现有指标过于敏感,在不同种类的肿瘤发生中均有差异表达。因此,有必要进一步探究胃癌发生发展中新的、特异性高的诊断标志物和治疗靶点。目前,高通量测序已成为生命科学领域研究的重要工具,在癌症早期诊断、癌症分级和预后预测等研究中的使用愈发广泛[4],各种生物信息学数据库如GEO也为癌症基因表达谱的数据挖掘提供了平台[5]。本研究从GEO中下载原始数据,通过比较胃癌样本与正常组织样本的基因表达谱筛选出差异表达基因,对差异基因进行生物信息学分析并结合Kaplan-Meier plotter数据库进行预后分析,进而从分子水平研究胃癌的发生、发展机制,为胃癌的诊断、靶向药物研究及判断预后提供有价值的信息。

1 材料与方法

1.1 基因芯片数据

从美国国立生物技术信息中心(NCBI)的GEO数据库(https://www.ncbi.nlm.nih. gov/geo/)中筛选出3套胃癌数据集(GSE13911、GSE33651、GSE79973),其中数据集GSE13911和GSE79973基于GPL570平台([HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),数据集GSE33651基于GPL2895平台(GE Healthcare/Amersham Biosciences CodeLink Human Whole Genome Bioarray)。

1.2 差异表达基因的筛选

利用GEO数据库自带的在线分析工具GEO2R(https://www.ncbi.nlm. nih.gov/geo/geo2r/)处理原始数据,将数据分为胃癌组和正常组进行进一步分析。差异基因筛选标准:校正后P值<0.05,|logFC|≥1。对每个数据集进行统计分析,使用在线工具Venn diagram(bioinformatics.psb.ugent.be/webtools/Venn/)确定3组数据的相交部分。

1.3 差异表达基因的基因本体论(gene ontology,GO)分析和通路(KEGG)分析

GO分析是大规模功能富集研究的常用方法,基因功能被分成生物过程(biological process,BP)、分子功能(molecular function,MF)和细胞组分(cellular component,CC)3类。京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)是一个整合了大量关于基因组、疾病、化学物质和药物、生物途径和系统功能信息的数据库,可对基因功能进行系统分析。本研究使用David(https://david.ncifcrf.gov/)数据库进行GO分析和KEGG分析,P<0.05且基因数(gene count)≥10,可认为差异具有统计学意义。

1.4 蛋白互作网络的构建和枢纽基因的筛选

利用STRING(http://string-db.org/)数据库构建差异基因的蛋白互作网络(PPI),互作评分>0.4作为阈值条件。将PPI网络导入Cytoscape(www.cytoscape.org/)进行可视化,计算节点的边(degree),具有较高连接度的节点往往对维护整个网络的稳定更加重要,本研究选取前10位为枢纽基因。

1.5 枢纽基因的预后分析

使用Kaplan-Meier plotter(http://kmplot.com/analysis/)数据库来评估枢纽基因的预后价值。对于每个基因,根据mRNA表达值自动将癌症患者分为高表达和低表达两组进行比较,每个基因所用的探针ID显示在表3中,P<0.05认为差异有统计学意义。

2 结 果

2.1 差异表达基因的筛选

该研究选择了3组基因表达谱(GSE13911、GSE33651、GSE79973)。其中,GSE13911含38个胃癌样本和10个正常组织样本,GSE33651含40个胃癌样本和12个正常组织样本,GSE79973含10个胃癌样本和10个正常组织样本。根据调整后P<0.05和|logFC|≥1的标准,GSE13911中共鉴定出3 288个差异基因,包括1 001个上调基因和2 287个下调基因;GSE33651中共鉴定出2 178个差异基因,包括1 588个上调基因和590个下调基因;GSE79973共鉴定出1 405个差异基因,包括个486上调基因和919个下调基因。绘制韦恩图分析以得到3组数据集差异基因的交集,共135个基因在3组中均有差异表达,其中68个基因明显上调,67个明显下调(图1)。

图1 差异表达基因
Figure 1 Differentially expressed genes

A:上调基因;B:下调基因
A: Up-regulated genes; B:Down-regulated genes

2.2 差异表达基因的GO和KEGG分析

使用DAVID进行差异基因的GO和KEGG分析。GO分析显示差异基因主要富集的BP:信号转导,细胞外基质组织,细胞黏附,氧化还原过程;主要富集的MF:钙离子结合,相同蛋白结合;主要富集的CC:细胞外外泌体,细胞外空间,细胞外区域,细胞外基质,内质网,细胞表面,内质网腔。KEGG分析显示差异基因主要富集的通路包括:PI3K/Akt信号通路,ECM受体相互作用,黏着斑(表1)。

表1 胃癌差异基因的GO和KEGG分析结果
Table 1 Results of GO and KEGG analyses of the differentially expressed genes in gastric cancer

类型 基因功能 基因 基因数 P BP GO:0007165~信号转导 EDNRA,TNFAIP6,RASSF6,CAP2,PDPN,LGALS1,RTKN2,CXCL8,GNB4,LRP8,ARHGAP11A,SPARC,ANTXR1,ANGPT2,RIN3 15 0.029 BP GO:0030198~细胞外基质组织COL4A2,COL4A1,OLFML2B,COL2A1,SPARC,NID2,COL5A1,CD44,ITGA5,COL1A2,COL1A1,THBS1,COL8A1,FN1 14 9.63E-10 BP GO:0007155~细胞黏附 ATP4B,NID2,COL5A1,THY1,TNFAIP6,CD44,ITGA5,FAP,COL12A1, COL1A1, THBS1, COL8A1, FN1 13 7.92E-05 BP GO:0055114~氧化还原过程 RDH12,FMO5,ALDH6A1,CYP2C18,AKR1B10,CYP2S1,GPX3,AKR7A3,CYP4F12,CBR3,HPGD,ALDH3A1 12 9.023 MF GO:0005509~钙离子结合 ASPN,CAPN9,S100A10,ACTN1,SPARC,NID2,SULF2,CAPN13,SCIN,SULF1,SYTL2,LRP8,THBS1,SYTL1 14 9.29E-04 MF GO:0042802~相同蛋白结合 CAP2,COL2A1,NDC80,PBLD,INHBA,BAG2,COL1A2,AKR7A3,GALE,MSANTD3,COL1A1,THBS1,FN1,TRIP13 14 0.001 CC GO:0070062~细胞外外泌体 RARRES1,KIAA1324,APOC1,SELENBP1,SERPINH1,PBLD,PKM,CD44,GPX3,AKR7A3,COL12A1,GALE,RAB27B,COL8A1,THBS1,RAB27A,FN1,ALDH6A1,RNASE1,COL4A2,LGALS1,S100A10,ACTN1,NID2,ADGRG2,COL5A1,THY1,NAPEPLD,AKR1B10,SCIN,PLXDC2,COL1A2,GNB4,PLLP,ANTXR1,MUC5AC,SYTL1,HPGD 38 2.90E-05 CC GO:0005615~细胞外空间 CTHRC1,NRG4,CXCL8,COL2A1,PSAPL1,SELENBP1,SERPINH1,ALDH3A1,SOSTDC1,FAP,GPX3,COL12A1,THBS1,ANGPT2,FN1,LGALS1,ACTN1,SPARC,CBR3,TNFAIP6,CHGA,SULF2,SFRP4,SULF1,COL1A2,COL1A1,MUC5AC,CMTM3 28 2.44E-07 CC GO:0005576~细胞外区域 NRG4,APOC1,CXCL8,COL2A1,FNDC1,GPX3,COL12A1,COL8A1,THBS1,ANGPT2,FN1,COL4A2,COL4A1,OLFML2B,ACTN1,SPARC,NID2,COL5A1,INHBA,SFRP4,COL1A2,LRP8,MUC5AC,COL1A1,ADAMTS2 25 1.70E-04 CC GO:0031012~细胞外基质 ASPN,COL4A2,COL4A1,LGALS1,COL2A1,NID2,COL5A1,PKM,COL1A2,COL12A1,COL1A1,THBS1,COL8A1, FN1 14 1.05E-07 CC GO:0005783~内质网 FMO5,SULF2,ATP2A3,ITGA5,CYP2S1,SULF1,SMIM14,APOC1,MAL,THBS1,SERPINH1,ALDH3A1,THY1 13 0.010 CC GO:0009986~细胞表面 CD44,SULF2,ITGA5,LGALS1,FAP,SFRP4,SULF1,SPARC,ANTXR1,THBS1,ADGRG2 11 0.004 CC GO:0005788~内质网腔 COL4A2,COL4A1,COL1A2,COL12A1,COL2A1,COL1A1,THBS1,COL8A1,SERPINH1,COL5A1 10 6.21E-06通路 hsa04151:PI3K-Akt 信号通路 COL4A2,COL4A1,ITGA5,COL1A2,GNB4,COL2A1,COL1A1,THBS1,ANGPT2,COL5A1,FN1 11 2.82E-04通路 hsa04512:ECM受体相互作用 COL4A2,COL4A1,CD44,ITGA5,COL1A2,COL2A1,COL1A1,THBS1,COL5A1,FN1 10 1.75E-08通路 hsa04510:黏着斑 COL4A2,COL4A1,ITGA5,COL1A2,ACTN1,COL2A1,COL1A1,THBS1,COL5A1,FN1 10 2.59E-05

2.3 PPI网络构建和枢纽基因鉴定

利用STRING预测差异基因间的相互作用,将数据导入Cytoscape进行可视化,PPI网络共涉及个61节点和170条边(图2)。选取PPI网络中连通度(degree)排序前10的为枢纽基因(表2)。结果表明,最具代表性的基因为COL1A1,连通度为21,其次分别为COL1A2、COL4A1、FN1、THBS1、CD44、COL2A1、COL4A2、CXCL8、COL5A1。

图2 差异表达基因的PPI互作网络(红色:上调,绿色:下调)
Figure 2 PPI network of the differentially expressed genes (Red: up-regulated; Green: down-regulated)

表2 枢纽基因名称及连通度
Table 2 Names and degrees of the hub genes

基因 基因名 连通度COL1A1 collagen type I alpha 1 chain 21 COL1A2 collagen type I alpha 2 chain 20 COL4A1 collagen type IV alpha 1 chain 15 FN1 fibronectin 1 15 THBS1 thrombospondin 1 15 CD44 CD44 molecule 15 COL2A1 collagen type II alpha 1 chain 15 COL4A2 collagen type IV alpha 2 chain 14 CXCL8 C-X-C motif chemokine ligand 8 12 COL5A1 collagen type V alpha 1 chain 12

2.4 枢纽基因的预后分析

为研究10个枢纽基因的预后价值,本研究使用Kaplan-Meier plotter进行预后分析,共有876例胃癌患者的数据可用于分析总体存活率。其中,除THBS1的上调(HR=0.84,95% CI=0.7~1.01,P=0.065)对胃癌患者总体存活率无明显影响,其余基因的差异表达均影响胃癌患者的总体生存率,9个影响胃癌患者预后的枢纽基因的具体信息见图3。

图3 差异表达基因的预后分析
Figure 3 Prognostic analysis of differentially expressed genes

3 讨 论

本研究从GSE13911、GSE33651、GSE79973数据集中共筛选出135个差异表达基因,包括68个上调基因和67个下调基因。此外,GO分析结果表明差异基因主要参与信号转导、钙离子结合、细胞外外泌体等生物学过程。KEGG分析显示差异基因主要富集的通路包括:PI3K/Akt信号通路,ECM受体相互作用,黏着斑。本研究预测了胃癌相关的10个枢纽基因:COL1A1、COL1A2、COL4A1、FN1、THBS1、CD44、COL2A1、COL4A2、CXCL8、COL5A1。

PPI分析结果显示,有6个枢纽基因属于胶原蛋白(collagen,COL)家族,其中COL1A1、COL1A2、COL4A1是连通度排名前三的枢纽基因,这表明胶原蛋白基因与胃癌的侵袭和进展关系最为密切,可能是胃癌的潜在靶点。胃癌发展通常是多步骤的渐进过程,COL1A1在胃癌组织中显著过表达,但从癌前病变到肿瘤阶段其表达量无显著变化[6],这表明COL1A1可能在癌前病变的发生中发挥作用,COL1A1的高表达可能作为胃癌患者的早期诊断标志物,Wang等[7]证实miR-129-5p可以通过选择性降低COL1A1的表达来抑制胃癌细胞的增殖、侵袭和迁移。研究[8-9]表明COL1A2 在结直肠癌和髓母细胞瘤中表达上调,Li等[6]认为COL1A2 的表达与肿瘤大小和侵袭深度有关,其过表达提示不良预后,Ao等[10]证明COL1A2基因的沉默可抑制胃癌细胞的增殖侵袭,同时通过失活PI3k/Akt信号转导途径促进细胞凋亡。COL4A1的突变是多效的,可导致多种肿瘤进展,膀胱癌细胞中过表达的COL4A1通过诱导肿瘤出芽在肿瘤侵袭中起关键作用[11],Jin等[12]研究发现COL4A1高表达有助于乳腺癌细胞的增殖。COL4A1可作为肝内胆管癌预后的生物标志物之一[13],还可通过多种机制如细胞增殖和miRNA介导的转录后修饰驱动胃癌细胞发生曲妥珠单抗耐药[14],这表明靶向COL4A1可能是癌症治疗的潜在方法。COL2A1、COL4A2、COL5A1分子并非特异表达于胃癌,在胃癌研究中相对较少,可作为潜在的靶点进行进一步探索。

一些研究表明,PI3k/Akt途径的许多组分通过扩增、突变和易位比癌症发展中其他途径更易被靶向而导致途径激活[15],纤连蛋白1(FN1)主要参与该途径,在各种恶性肿瘤中表达。FN1参与细胞粘附和迁移过程,有研究[16]表明纤连蛋白的表达可促进胃癌细胞的运动和侵袭,与胃癌进展显著相关。

尽管THBS1在血管生成中的作用已得到充分证实,但其在肿瘤转移中的作用仍有待探索。一项研究[17]表明,THBS1的表达与乳头状甲状腺癌的侵袭程度呈负相关,而其他研究报道THBS1是前列腺癌、结肠癌和乳腺癌细胞迁移和侵袭的有效刺激因子,这表明THBS1在癌细胞侵袭和迁移中的作用产生了混合的结果。有研究[18]表明,与邻近的正常组织相比,THBS1在胃癌组织中显著过表达,Huang等 [19]认为肿瘤微环境中的THBS1有调节血管生成、粘附、增殖、侵袭、迁移和免疫的功能,THBS1的多效性取决于环境条件,其与不同受体结合可能对细胞行为和生物过程产生不同甚至相反的影响,THBS1对胃癌进展的影响仍需要进一步研究。

根据癌症干细胞(CSC)理论,癌症干细胞可以驱动肿瘤发生过程,包括癌症的发生、进展、转移和疾病复发[20]。CD44是一种CSC标志物,通过STAT3-cyclin D1途径调节癌症干细胞[21],可在多种肿瘤包括肺癌、结直肠癌、乳腺癌、肝细胞癌、头颈癌和下咽鳞状细胞癌中起预后标志物的作用[22],Wang等 [23]研究表明表达CD44的癌细胞易于伪装从而逃脱人体免疫系统的识别和攻击,使肿瘤更易转移。

趋化因子(CXC)在肿瘤生物学中起到重要作用。虽然一些CXC趋化因子通过将免疫细胞吸引到肿瘤组织中或通过抑制肿瘤新血管形成而具有抗肿瘤活性,但其它趋化因子可通过直接刺激生长、增强细胞运动或刺激血管生成来促进肿瘤生长、侵袭和转移[24-26]。已知CXCL8在许多恶性肿瘤中是强血管生成因子,有研究证明人胃癌细胞表达的CXCL8蛋白与肿瘤血管的数量相关,表明CXCL8确是胃癌的血管生成因子[27],可作为胃癌的分子靶标进行研究。

为验证生物信息学分析的结果,本研究使用Kaplan-Meier plotter 数据库检验枢纽基因的预后价值。除THBS1外,所有枢纽基因均与胃癌患者的总体生存率显著相关,此外,预后结果表现出与生物信息学分析基本相同的表达趋势,从而验证了本研究方法的准确性。本研究可为将来胃癌的分子机制、生物标志物及靶向药物的研究提供思路,今后仍需分子生物学实验进一步探讨差异基因在胃癌进展中的具体作用机制。

参考文献

[1]Sun C, Yuan Q, Wu D, et al. Identification of core genes and outcome in gastric cancer using bioinformatics analysis[J]. Oncotarget, 2017,8(41):70271-70280. doi:10.18632/oncotarget.20082.

[2]Orditura M, Galizia G, Sforza V, et al. Treatment of gastric cancer[J]. World J Gastroenterol, 2014, 20(7):1635-1649. doi:10.3748/wjg.v20.i7.1635.

[3]Blee TK, Gray NK, Brook M. Modulation of the cytoplasmic functions of mammalian post- transcriptional regulatory proteins by methylation and acetylation: a key layer of regulation waiting to be uncovered?[J]. Biochem Soc Trans, 2015, 43(6):1285-1295. doi:10.1042/BST20150172.

[4]罗磊, 龚宝成, 刘福囝. GSE74602芯片数据中直肠癌关键基因与治疗药物的生物信息学筛选[J]. 中国普通外科杂志, 2018, 27(4):457-467. doi:10.3978/j.issn.1005-6947.2018.04.011.Luo L, Gong BC, Liu FN. Bioinformatics screening for pivotal genes and therapeutic drugs of colorectal cancer in GSE74602 microarray data[J]. Chinese Journal of General Surgery, 2018, 27(4):457-467. doi:10.3978/j.issn.1005-6947.2018.04.011.

[5]余斌, 丁佑铭, 廖晓锋, 等. 基于生物信息学的肝细胞癌组织miR-1180表达与临床意义分析[J]. 中国普通外科杂志, 2018, 27(7):862-869. doi:10.3978/j.issn.1005-6947.2018.07.010.Yu B, Ding YM, Liao XF, et al. Analysis of miR-1180 expression in hepatocellular carcinoma tissue and its clinical significance based on bioinformatics[J]. Chinese Journal of General Surgery, 2018, 27(7):862-869. doi:10.3978/j.issn.1005-6947.2018.07.010.

[6]Li J, Ding Y, Li A. Identification of COL1A1 and COL1A2 as candidate prognostic factors in gastric cancer[J]. World J Surg Oncol, 2016, 14:297. doi:10.1186/s12957-016-1056-5.

[7]Wang Q, Yu J. MiR-129-5p suppresses gastric cancer cell invasion and proliferation by inhibiting COL1A1[J]. Biochem Cell Biol, 2018, 96(1):19-25. doi:10.1139/bcb-2016-0254.

[8]Zou X, Feng B, Dong T, et al. Up-regulation of type I collagen during tumorigenesis of colorectal cancer revealed by quantitative proteomic analysis[J]. J Proteomics, 2013, 94:473-485. doi: 10.1016/j.jprot.2013.10.020.

[9]Liang Y, Diehn M, Bollen AW, et al. Type I collagen is overexpressed in medulloblastoma as a component of tumor microenvironment[J]. J Neurooncol, 2008, 86(2):133-141. doi: 10.1007/s11060-007-9457-5.

[10]Ao R, Guan L, Wang Y, et al. Silencing of COL1A2, COL6A3, and THBS2 inhibits gastric cancer cell proliferation, migration, and invasion while promoting apoptosis through the PI3k-Akt signaling pathway[J]. J Cell Biochem, 2018, 119(6):4420-4434. doi: 10.1002/jcb.26524.

[11]Miyake M, Hori S, Morizawa Y, et al. Collagen type IV alpha 1 (COL4A1) and collagen type XIII alpha 1 (COL13A1) produced in cancer cells promote tumor budding at the invasion front in human urothelial carcinoma of the bladder[J]. Oncotarget, 2017, 8(22):36099-36114. doi: 10.18632/oncotarget.16432.

[12]Jin R, Shen J, Zhang T, et al. The highly expressed COL4A1 genes contributes to the proliferation and migration of the invasive ductal carcinomas[J]. Oncotarget, 2017, 8(35):58172-58183. doi: 10.18632/oncotarget.17345.

[13]Sulpice L, Rayar M, Desille M, et al. Molecular profiling of stroma identifies osteopontin as an independent predictor of poor prognosis in intrahepatic cholangiocarcinoma[J]. Hepatology, 2013, 58(6):1992-2000. doi: 10.1002/hep.26577.

[14]Huang R, Gu W, Sun B, et al. Identification of COL4A1 as a potential gene conferring trastuzumab resistance in gastric cancer based on bioinformatics analysis[J]. Mol Med Rep, 2018, 17(5):6387-6396. doi:10.3892/mmr.2018.8664.

[15]Xiang L, Xie G, Ou J, et al. The extra domain A of fibronectin increases VEGF-C expression in colorectal carcinoma involving the PI3K/AKT signaling pathway[J]. PLoS One, 2012, 7(4):e35378. doi: 10.1371/journal.pone.0035378.

[16]Song B, Du J, Deng N, et al. Comparative analysis of gene expression profiles of gastric cardia adenocarcinoma and gastric non-cardia adenocarcinoma[J]. Oncol Lett, 2016, 12(5):3866-3874. doi:10.3892/ol.2016.5161.

[17]Tanaka K, Sonoo H, Kurebayashi J, et al. Inhibition of infiltration and angiogenesis by thrombospondin-1 in papillary thyroid carcinoma[J]. Clin Cancer Res, 2002, 8(5):1125-1131.

[18]Lin XD, Chen SQ, Qi YL, et al. Overexpression of thrombospondin-1 in stromal myofibroblasts is associated with tumor growth and nodal metastasis in gastric carcinoma[J]. J Surg Oncol, 2012, 106(1):94-100. doi: 10.1002/jso.23037.

[19]Huang T, Wang L, Liu D, et al. FGF7/FGFR2 signal promotes invasion and migration in human gastric cancer through upregulation of thrombospondin-1[J]. Int J Oncol, 2017, 50(5):1501-1512. doi:10.3892/ijo.2017.3927.

[20]Nguyen LV, Vanner R, Dirks P, et al. Cancer stem cells: an evolving concept[J]. Nat Rev Cancer, 2012, 12(2):133-143. doi: 10.1038/nrc3184.

[21]Liu D, Sun J, Zhu J, et al. Expression and clinical significance of colorectal cancer stem cell marker EpCAMhigh/CD44+ in colorectal cancer[J]. Oncol Lett, 2014, 7(5):1544-1548. doi:10.3892/ol.2014.1907.

[22]Yan Y, Zuo OX, We D. Concise review: emerging role of CD44 in cancer stem cells: a promising biomarker and therapeutic target[J]. Stem Cells Transl Med, 2015, 4(9):1033-1043. doi: 10.5966/sctm.2015-0048.

[23]Wang T, Ong C, Shi J, et al. Sequential expression of putative stem cell markers in gastric car- cinogenesis[J]. Br J Cancer, 2011, 105(5):658-665. doi: 10.1038/bjc.2011.287.

[24]Lee HJ, Song IC, Yun HJ, et al. CXC chemokines and chemokine receptors in gastric cancer: From basic findings towards therapeutic targeting[J]. World J Gastroenterol, 2014, 20(7):1681-1693. doi:10.3748/wjg.v20.i7.1681.

[25]Zhu Q, Han X, Peng J, et al. The role of CXC chemokines and their receptors in the progression and treatment of tumors[J]. J Mol Histol, 2012, 43(6):699-713. doi: 10.1007/s10735-012-9435-x.

[26]Keeley EC, Mehrad B, Strieter RM. CXC Chemokines in Cancer Angiogenesis and Metastases[J]. Adv Cancer Res, 2010, 106:91-111. doi:10.1016/S0065-230X(10)06003-3.

[27]Eck M, Schmausser B, Scheller K, et al. Pleiotropic effects of CXC chemokines in gastric carcinoma: differences in CXCL8 and CXCL1 expression between diffuse and intestinal types of gastric carcinoma[J]. Clin Exp Immunol, 2003, 134(3):508-515.

Identification and prognostic analysis of hub genes in gastric cancer

SUN Mengyu1, QIU Jieping1, WU Zhihan1, ZHANG Qian1, ZHU Shuangqiu1, CHEN Bo2
(1. The First College of Clinical Science, Anhui Medical University, Hefei 230000, China; 2. Department of Gastrointestinal Surgery Center, the First Affiliated Hospital of Anhui Medical University, Hefei 230000, China)

Abstract Objective: To investigate the predictive indicators and therapeutic targets of gastric cancer using bioinformatics approach and analyze the relations of them with prognosis.

Methods: Three microarray datasets (GSE13911, GSE33651, GSE79973) were downloaded from Gene Expression Omnibus (GEO) database. The differentially expressed genes between gastric cancer samples and normal tissue samples were screened using GEO2R tools. The functional and pathway annotations of the differentially expressed genes were performed by Gene ontology (GO) and Kyoto Encyclopedia of Genes and Genomes (KEGG) analyses, Meanwhile, the protein-protein interaction network (PPI) was constructed using STRING and Cytoscape to pick up the hub genes, and the relations of the hub genes with prognosis were analyzed using the Kaplan-Meier plotter database.

Results: A total of 135 differentially expressed genes were screened, of which 68 were up-regulated and 67 were down-regulated. GO analysis showed that the differentially expressed genes were mainly enriched in biological processes such as signal transduction, calcium ion binding and extracellular exosomes. KEGG analysis revealed that the major enriched pathways of the differentially expressed genes included PI3K/Akt signaling pathways, ECM receptor interactions and focal adhesions. PPI analysis showed that COL1A1, COL1A2, COL4A1, FN1, THBS1, CD44, COL2A1, COL4A2, CXCL8, COL5A1 were the hub genes. Survival analysis showed that except the up-regulation of THBS1, the abnormal expressions of other hub genes were significantly associated with the overall survival of the gastric cancer patients.

Conclusion: The abnormal expressions of the screened hub genes may be involved in the development and progression of gastric cancer, and could be closely related to the prognosis of gastric cancer patients. These genes may serve as potential predictors and therapeutic targets for further research of gastric cancer.

Key words Stomach Neoplasms; Gene Expression; Prognosis; Computational Biology

中图分类号:R735.2

doi:10.7659/j.issn.1005-6947.2019.04.008

http://dx.doi.org/10.7659/j.issn.1005-6947.2019.04.008

Chinese Journal of General Surgery, 2019, 28(4):433-440.

基金项目:国家自然科学基金资助项目(81602425);安徽省省级大学生创新创业训练计划资助项目(1613010222);安徽医科大学高等学校省级质量工程资助项目(2016jyxm0529)。

收稿日期:2018-10-10;

修订日期:2019-03-19。

作者简介:孙梦雨,安徽医科大学第一临床医学院实习研究员,主要从事胃肠道肿瘤基础方面的研究。

通信作者:陈博, Email: chenbo831116@163.com

CLC number: R735.2

(本文编辑 姜晖)

本文引用格式:孙梦雨, 邱洁萍, 吴之涵, 等. 胃癌枢纽基因的筛选和预后分析[J]. 中国普通外科杂志, 2019, 28(4):433-440. doi:10.7659/j.issn.1005-6947.2019.04.008

Cite this article as: Sun MY, Qiu JP, Wu ZH, et al. Identification and prognostic analysis of hub genes in gastric cancer[J]. Chin J Gen Surg, 2019, 28(4):433-440. doi:10.7659/j.issn.1005-6947.2019.04.008