1. 研究目的与意义
1.1 研究背景
1.1.1前列腺癌的背景及现状
前列腺癌(prostate cancer, pca)目前是全球范围内一个高发恶性肿瘤在多数国家,前列腺癌的病死率和确诊率依旧居高不下,病死率仅次于皮肤癌[1]。前列腺癌诊断和治疗的探索及研究日趋重要[2]。前列腺癌的确诊率跟年龄有很大的联系,其中在65岁以上的老年男性群体中发病率比其他年龄的男性群体高很多。全世界约有15%的患者存在阳性的癌症家族遗传史。全世界每年诊断出前列腺癌的人数有几百万人。
2. 研究内容和预期目标
本课题将从公共数据库TCGA和GEO进行数据挖掘,检索前列腺癌-正常样本对照的基因表达数据并进行差异表达分析,从中筛选获得表达水平和前列腺癌患者生存及预后显著相关基因,对其中参与调控EMT的相关基因进行表达水平分析,并据此进行单因素和多因素Cox回归,构建预后诊断模型并对模型的生存预测能力进行评价。此外,还将对EMT相关前列腺癌差异表达基因进行功能、通路分析和互作用网络构建,系统揭示其在前列腺癌调控中的分子机制。
3. 研究的方法与步骤
1、从tcga数据库下载前列腺癌rna测序(rna-seq)数据、从geo数据库下载前列腺癌及正常样本基因芯片数据与相关临床数据,利用limma按照log2fc绝对值大于2与fdr小于0.05的标准筛选出差异基因,取两个数据库的交集,得到在前列腺癌中差异表达的基因,绘制基因表达热图和火山图。
2、对候选基因进行单变量回cox回归,计算cox系数和风险值,缩小候选基因范围,并绘制森林图。
3、根据设定阈值筛选基因进行多变量cox回归,鉴定出与癌症患者的预后显著相关基因,并得到预后风险模型和风险值函数。
4. 参考文献
[1] daniyal m, siddiqui za, akram m,et al. epidemiology, etiology, diagnosis and treatment of prostate cancer. asian pac j cancer prev. 2014;15(22):9575-8.
[2] scott e. prostate cancer. scientificworldjournal. 2011 apr 5;11:749-50.
[3] wang g, zhao d, spring dj, depinho ra. genetics and biology of prostate cancer. genes dev. 2018 sep 1;32(17-18):1105-1140.
5. 计划与进度安排
1、第1周~第2周 接受任务,按照指导教师要求查阅资料,撰写开题报告。
2、第3周~第4周 进行数据收集,熟悉相关程序软件,数据的预处理等。
3、第5周~第8周 标准筛选出差异基因,并用tcga中的rna-seq数据验证差异表达,绘制基因表达热图和火山图。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。