基于基因表达谱的统合分析方法筛选乳腺癌诊断分子标记

地区:上海市 宝山区

关键词:广西科技大学

成果类型:其它

成果领域:生物与新医药

成果编号:A2021061000003735

成果描述:

课题来源于广西青年科学基金项目。研究目的与意义:乳腺癌是女性最主要的恶性肿瘤,是威胁女性健康的主要杀手。统计数据显示,乳腺癌仍是发展中国家女性的首要癌症死亡病因,缺乏有效的早期检查是导致乳腺癌发病率和死亡率升高的主要原因。乳腺癌分级是主要是基于肿瘤大小、淋巴结情况和转移等病理特征,然而肿瘤病理学特征相同的病人也存在不同的临床过程,这是肿瘤的分子差异造成的,基因表达谱的不同使得乳腺癌具有不同的生物学特征,这样的异质性导致了病理分期相同的患者对临床治疗的反应及预后会有很大差别。肿瘤的发生早期往往只涉及少数几个基因的改变,这些改变都是作为早期诊断的潜在分子靶标,如果能检测这些变化,就能及时发现肿瘤,大大提高乳腺癌的治愈率。因此,为了提高早期检测的准确性和便捷性,提高乳腺癌的治愈率,迫切需要采用新的途径,发现可靠的分子标记对乳腺癌进行分子诊断,对延长乳腺癌病人的生命及降低死亡率有着极其重要的意义。主要成果:乳腺癌外周血中分子检测标记的筛选尽管很多乳腺癌患者临床诊断为早期,但依然有30-40%的病人在治疗后发生了远处转移。因此,有学者提出作为一种全身性疾病,乳腺癌在早期就可发生血行转移,说明乳腺癌病人血液中可能存在与健康人体血液不同的分子,这为乳腺癌的早期检测提供了新的思路。研究通过比对基因芯片数据,提取乳腺癌/正常血液样本的差异表达基因作为候选基因,运用复合变量预测、对角线线性判别分析和最邻近算法和支持向量机等4种不同的方法对验证集基因芯片样本进行分类预测,留一法交叉验证计算错误分类率,用ROC曲线评估预测结果。训练集中乳腺癌与正常血液样本的显著差异基因为61个,从中筛选出39个基因作为分类器用四种不同的方法对验证集进行分类预测,准确率都基本达到甚至超过80%,ROC 曲线下面积达到0.925,表明分类预测效果良好。乳腺癌复发相关基因预测疾病特异生存率根据乳腺癌是否复发的两组乳腺癌样本进行随机方差模型的两样本t检验,筛选得到29个基因的分类器,可以将乳腺癌样本明显分为高风险和低风险组。随时间变化的Cox 曲线的时间界标为7.05,曲线下面积为0.803,提示分类器的预测结果较为理想。用于预测分类器中的基因交叉验证准确率均高于96%,其中有20个基因的交叉验证准确率达到100%。对基因分类器中的基因进行相应的生物学功能注释和通路分析,表明这些基因中与细胞周期、细胞增殖、细胞运动和粘着、DNA修复、Ras蛋白信号的传导通路等生物学功能相关。这些结果充分说明筛选出来的基因具有明显的肿瘤特征,应该可以作为肿瘤筛选的标记。创新之处:大胆尝试利用基因芯片技术、生物信息学分析方法结合传统生物学实验等多学科交叉手段从系统生物学的角度来思考,主要从基因表达谱变化情况和通路变化等多个层面对乳腺癌分子标记进行筛选并预测分析,从全基因组的角度探讨乳腺癌的发病分子机制,为乳腺癌的临床诊断和治疗提供了新的思路。存在问题:对高通量基因芯片数据的分析获得乳腺癌外周血检测分子标记的相关候选基因,得到的基因数仍然较多会增加临床应用的成本,在乳腺癌早期检测中的预测价值也还需通过大量的临床病例验证。
需求匹配