近日,由团队常晋源教授、博士生杜悦、何婧教授以及伦敦政治经济学院姚琦伟教授合作完成的论文“Testing Independence and Conditional Independence in High Dimensions via Coordinatewise Gaussianization”被统计学国际顶级学术期刊《Journal of the American Statistical Association》正式接收。
内容简介
针对高维数据,本文提出两类新型统计检验方法,分别用于检验两个随机向量的独立性,以及给定第三个随机向量时两者的条件独立性。与现有方法相比,本文所提方法的核心思路简洁且高效:首先借助边际经验分布,将各分量转换为标准正态分布;随后基于变换后的随机向量,构造L_∞型检验统计量,进而实现对独立性与条件独立性的检验。尽管所检验的是独立性(或条件独立性)的必要条件,但大规模模拟实验结果表明,本文所提的方法在整体性能上优于13种常用的检验方法。所提方法的优势主要体现在三个方面:(1)不依赖任何矩条件;(2)允许随机向量内部各分量之间存在任意相依结构;(3)允许随机向量维度随样本量以指数速度发散。进一步地,本文采用计算高效的乘子自助法(multiplier bootstrap)确定检验的临界值。理论分析表明,所提检验能够有效控制实际显著性水平,并在局部备择假设下具有一致性。
作者简介
常晋源,西南财经大学光华首席教授、数据科学与商业智能联合实验室执行主任、统计交叉创新研究院执行院长。主要从事复杂数据分析相关的研究。
杜悦,西南财经大学数据科学与商业智能联合实验室博士生。主要从事超高维数据假设检验和矩阵时间序列分析等领域的研究。
何婧,西南财经大学数据科学与商业智能联合实验室教授,主要从事高维数据分析和时空数据分析等领域的研究。
姚琦伟,英国伦敦政治经济学院讲席教授。主要从事时间序列分析、降维和因子建模、动态网络建模、时空建模、金融计量经济学和非参数回归等领域的研究。




