6月14日下午,由首都经济贸易大学金融学院主办的论文研讨班第294期如期举行,师生通过线下形式参与本次研讨。本期论文研讨邀请到了中国人民大学统计学院副教授孙韬,他就“大数据背景下的健康风险预测研究:以阿尔茨海默病为例”这一会议主题,与学院师生进行了交流讨论。会议由宋佳馨老师主持,金融学院赵明等教师及多名硕博研究生参加。
这篇文章的重点是在大规模的遗传数据的基础上预测阿尔茨海默症(AD)的进展。AD是一种进行性多基因疾病,每年影响数已万人。鉴于迄今为止对AD的有效治疗方法很少,因此非常有必要开发一个准确的模型,根据个体的遗传特征预测完整的疾病进展概况,以便早期预防和临床管理。这篇文章使用了阿尔茨海默病神经成像倡议(ADNI)研究所有四个阶段的数据,其中包括1740名具有800万种遗传变异的个体。解决了这些数据中的一些挑战,这些挑战的特点是大规模遗传数据、由于间歇性评估而产生的间隔审查结果以及在一个研究阶段保留截断(ADNIGO)。具体而言,首先通过筛选方法,对区间校正和左截断的数据和估计参数建立了半参数变换模型。然后,提出了一个计算效率高的广义评分测试来识别与AD进展相关的变异。接下来,将在区间审查数据上实现一个新的神经网络(NN-IC),利用从全基因组测试中识别的顶级变异构建预测模型。综合仿真研究表明,NN-IC在预测精度方面优于现有的几种方法。最后,将NN-IC应用于完整的ADNI数据,并成功地识别出具有差异进展风险谱的子组。
在会议中,孙韬解释了什么是生存分析与预测,并指出已有的GWAS研究用的是截面数据,但是不能研究AD从无到有的过程。该文章首次对AD进行了研究适当地处理了时间间隔审查,并在完整的ADIN数据中充分利用了丰富的GWAS预测因子。并且该文的NN-IC是第一个使用灵活的班参数损失函数的区间删失数据的神经网络方式。
在交流环节,各位会师生与孙韬对关于诸多问题进行探讨分析。本期研讨班在热烈的讨论中圆满结束,与会师生各叙己见,会议氛围轻松热烈,为师生们未来的研究方向与研究方法提供了新的思路。
主讲人简介:
孙韬,中国人民大学统计学院副教授,博士毕业于匹兹堡大学生物统计系,主要研究方向为复杂生存数据模型,老年失能失智风险管理。主持国自然青年基金项目和国家统计局重点项目,学术论文发表于Biometrics, Biostatistics, Statistical Methods in Medical Research等期刊
撰稿人:杨蕊嘉