分享到:
11月1日,经济学院第225期高级经济学讲座在中心校区举行。山东财经大学统计学院何勇副教授为学院师生带来了题为“Rank-based Canonical Correlation and Its Application in Feature Screening for a Large Class of Semi-parametric Regression Models”的学术报告。
报告共分为引言、ECR模型、筛选方法、理论性质、模拟研究、基因表达数据分析以及结论与引申等部分。首先,报告介绍了范剑青提出的SIS思想,该思想致力于解决(超)高维变量的筛选问题,通过筛选边际皮尔森系数使维度降到合适范围,从而减少(超)高维变量问题中的计算负担。随后,报告介绍了椭球Copula回归模型,并提出椭球Copula回归模型下的变量选择以及变点检测问题。报告指出椭球Copula回归模型形式上较为灵活,回归函数形式完全可以由数据驱动选择,通过该模型下变量选择和变点检测的方法进行降维,即双重稳健降维方法。之后,报告指出双重稳健降维方法所适用的前提与理论,即通过设置临界值,所有可能性趋近于1的重要变量可以被筛选出,这为统计学提出了一种有效的变量筛选方法,并将该方法与先前提出的CCK、RRCS以及SIS三种降维方法分别利用eQTL实验中基因表达数据集进行对比研究。最后,报告引申部分利用数学公式与矩阵方法介绍了MTER模型的原理,并用推导的方法证明了维度可以通过变量选择的方法降到合适范围这一结论。
何勇,复旦大学博士,山东财经大学副教授,美国威斯康星麦迪逊大学统计系访问学者。其研究方向为高维数据统计推断、金融统计、生物统计、大范围假设检验。目前在国内外统计学权威期刊 Computational Statistics and Data Analysis, Bioinformatics, BMC Bioinformatics,中国科学:数学等发表学术论文十余篇,主持国家自然科学基金青年基金、全国统计科学研究项目等科研项目。
作者:魏新蓓 摄影:宫明霞