Novomics

Sofrware Information

1. 软件仅适用于单独注册的会员公司.

2. 只有在下一步网页上通过验证过程后,才能使用该软件.

3. 点击下面“认证确认”按钮,软件自动安装至PC上.

S/W Install请输入会员编号及验证编号
会员编号 验证编号

* 注册咨询/忘记会员编号/验证编号时咨询 : +82-2-2068-3700

Scientific
Background

开发划分预后预测算法(Single Patient Classifier(SPC))

为了决定患者个体针对治疗策略, nProfiler® 1的预后预测分类算法(Single Patient Classifier(SPC))的开发阶段如下。为了导出SPC作用的靶向基因,对进行过胃癌1~4期胃切除术的患者们的基因表现模式进行了分析。首先用多机关(GSE13861, GSE84437, GSE15459, TCGA, GSE62254)总共1259个样本的生物学特性为基础,划分出了5个分子压型。

Cohort N 测定平台 样本保管形态
GSE13861 64 微阵列
(Illumina)
冻结新鲜组织
GSE84437 433
GSE15459 200 微阵列
(Affymetrix)
GSE62254 300
TCGA 262 测序 (Illumina)

为了在胃癌中找到特异性基因的表现特征,使用胃癌的mRNA基因表现大数据, 活用人工智能进行了分析。特别在对应的研究开发中,使用过的分析技法有,属于人工智能范围的机器学习, Representation学习。这是用统计的结构和数学的框架学习了约2万个基因数据的表现特征(表现;feature),再用自动分类的规则而制成的。

在本研究中使用的Reprsentation学习和深度学习的方法有非负矩阵分解方法(NMF; non-negative matrix factorization),加权基因共表达网络分析(WGCNA; weighted gene co-expression network analysis),基因集富集分析(GSA; gene-set enrichment analysis),GOEA,聚类分析(Hierarchical Clustering) 等,通过这些方法实行了发掘胃癌代表基因表现特征,及预后和抗癌剂生存意义之间的关联分析,并开发了能提供胃癌的预后预测及抗癌剂符合性的技术。

  • 通过NMF检测5种特异性的胃癌分子亚型

    用胃癌手术患者的新鲜冻结组织在微点阵(microarray)平台上测定的结果数据来实践NMF Clustering,分类出5个胃癌分子压型(GC molecular subtype)并且用GESA(gene set enrichment analysis)根据各个压型特性的基因做了annotation。
    分类好的5个subtype是 i) 带有免疫性特性的群 Inflammatory subtype ,ii)肠上皮分化及细胞增殖有关的基因高表现群 Intestinal subtype, iii)胃粘膜特异性基因高表现群 Gastric subtype ,iv)带有异质性的(heterogeneous)转移-增幅(transit-amplifying)群 Mixed-stromal subtype, v)带有EMT和mesenchymal特征的群Mesenchymal subtype。 在这另外3个的独立性公共队列中(GSE15459, TCGA, GSE62254),也确认了有效性。



    ※ NMF:非负矩阵分解( Non-negative matrix factorization, NMF): 把基因表现数据分成2个列队进行分析的数学性算法。群集具有特性把基因表达数据分组化,可应用于寻找群集好的数据的代表性基因。

    Brunet JP, Tamayo P, Golub TR, Mesirov JP. Metagenes and molecular pattern discovery using matrix factorization. Proc Natl Acad Sci U S A. 2004 Mar 23;101(12):4164-9.
    Lei Z, et al., Identification of molecular subtypes of gastric cancer with different responses to PI3-kinase inhibitors and 5-fluorouracil. Gastroenterology. 2013 Sep;145(3):554-65. Cancer Genome Atlas Research Network. Comprehensive molecular characterization of gastric adenocarcinoma. Nature. 2014 Sep 11;513(7517):202-9.
    Cristescu R, et al., Molecular analysis of gastric cancer identifies subtypes associated with distinct clinical outcomes. Nat Med. 2015 May;21(5):449-56.

  • 通过WGCNA分析基因模块(gene-module)

    通过WGCNA分析,对基因之间进行了clustering。用此为基础,发掘了 结构化好的胃癌遗传体等级34个gene-modul(module; clusters of highly interconnected genes; M01부터 M34)。比较34个gene-moudule及5个subtype,分析相互关系(|ρ| > 0.3, ρ=相关参数),挑选了5个subtype及相关性高的21个module。



    ※ WGCNA(Weighted Gene Co-expression Network Analysis):用基因表现之间的相互关系为基础,把握基因之间网络的分析方法

    Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559.

  • 分析模块和5个分子亚型的相互关系

    之后,分析了这21个module之间的相关关系,对于带有胃癌主要特性的6个GC molecular feature进行了分组。
    用Spearman相关指数分析了胃癌的21个主要gene-module与5个subtype之间的相互关系,相互关系越高则越靠近红色,相互关系越低,则越靠近蓝色显示



    (i) immune (M06, M07, M15, M26, and M28), (ii) intestinal epithelial (M22), (iii) gastric epithelial (M18), (iv) proliferative (M04, M05, M12, M13, M16, M23, M27, M32, and M33), (v) stem-like (M08), and (vi) stromal (M01, M03, M17, and M25).

  • 带有3个核心的生物学性feature

    最终为了选定预后相关的靶向基因和开发区分算法,用事前有关胃癌subtyping区分的基准研究结果作为根据,使用了Supervised方法。把这样的研究结果为基础,选定了胃癌分类主要甄别的3个核心生物学性( Immune, Stem-Like, Epithelial feature)。3个核心feature的特征如下所示。

  • 最终选定主要靶向基因(4 Classifier genes)

    通过与Sampling method测定Platform之间的互换性检测,挑选基因:选出了代表IM,ST,EP feature的M26(Immune module:48基因),M08(Stem-like module:131个基因),M22(Intestinal epithelial module:60个基因)。为了在这些基因中选拔出最终预测试验候选基因,在本研究中正把患者的FFPE残余检体和qPCR基础测定平台使用作为了开发目标,因此,需要对发掘的候选基因进行sample preparation及测定platform之间的互换性分析。正因如此,分析了样品在新鲜冻结组织与石蜡包埋样本的差异,以及测定平台在微阵列与qPCR方法之间的互换性。通过胃癌患者样本,运用上述的样本采集方法及测定方法,用所得到的基因形式分析了相互关系,在基准(pearson的相关参数p>0.5)内,选定了符合稳定的候选基因。(12个候选classifier gene)

    最终,Dynamic range(基因表达量范围)最广泛的基因3个(GZMB,SFRP4,CDX1)和为了Immune high样本的高分辨力,在免疫关联的Classifier中,选定增加了一个感染关联的基因(WARS),最终定义成4个基因Classifier。最终选定了4个Classifier gene(GZMB,SFRP4,CDX1,WARS)

  • 参考基因的选定

    为了修正基因表达量,选定参考基因,通过有关胃癌具体运用的参考基因(reference gene)论文,实行了文献调查。又调查了在当前可使用的固体癌相关产品中,正利用的参考基因。
    用这些作为根据,把选定的基因当做临床样本的参考基因,在先行研究中,检查了是否够格,最终进行了敲定。
    把上述的根据作为基础,在第一次选定中一共选择了8个参考基因候选( ACTB, ATP5E, HPRT1, PGK1, GPX1, RPL29, UBB, and VDAC2),在日常剩余的FFPE检体中进行组合时,最终选定了变异度小的5个参考基因( ACTB / ATP5E / GPX1 / UBB / HPRT1)。