系列代表性工作一:超高维协变量筛选与数据降维的系列新方法

Chang, Tang & Wu (2013, AoS; 16, AoS)首次提出运用边际假设检验的方法对超高维协变量进行筛选,有效解决了已有方法存在的问题,显著减弱了其他方法对数据以及模型的要求和限制。首先,将经验似然比在 0 处的取值作为衡量每个协变量的边际贡献是否为零的检验统计量可以避免直接估计边际贡献时可能会遇到的不可识别的问题;其次,基于经验似然自学生化的特性,该检验统计量能够避免异方差的影响。 Chang, Guo & Yao (2015, JoE)提出了一种通过对某个正定矩阵进行谱分解来实现快速因子降维的方法,避免直接求解超高维优化问题,打破了传统方法面临的计算瓶颈。即使观测到的数据维度达到几千时,该方法在个人笔记本电脑上也仅需几十秒即可完成降维。 Chang, Guo & Yao (2018, AoS)提出了一种基于线性变换的降维方法。通过线性变换将观测数据转换为一组新的数据——新数据中的各分量可以分成不同的组,不同组之间不再具有相关性。有效避免了直接建模会遇到的“过度参数化”和“模型不可识别”两大问题。实践表明:即使这样的线性变换不存在,强行通过该方法降维以后再分组建模仍能显著提高预测精度。 Chang, He, Yang & Yao (2023, JRSSB)提出通过张量 CP 分解对复杂矩阵型时间序列进行降维,并给出了一种不需要迭代即可完成求解的快速算法,改进了文献中求解 CP 分解一定要通过迭代算法的思路。作者已将这些方法开发成 R 软件包 PCA4TS 免费供他人使用。

系列代表性工作二:超高维模型估计与推断的统一方法论体系

Chang, Chen & Chen (2015, JoE)给出了如何运用经验似然对r和p发散的估计方程进行估计和推断,并证明经验似然估计和广义矩方法等其他估计方法一样只有在r和p以很慢的速度发散时才能工作。Chang, Tang & Wu (2018, AoS)首次提出在经验似然的损失函数中同时对待估参数和拉格朗日乘子加惩罚的形式系统解决了r和p远远大于n时估计方程的参数估计问题,建立了求解超高维估计方程的统一方法论体系。Chang, Chen, Tang & Wu (21, BKA)首次通过对估计方程进行旋转得到了一种统一的、不依赖于偏差校正的统计推断方法,系统解决了超高维估计方程的推断问题,并首次给出了对超高 维估计方程的过度识别检验方法。Chang, Shi & Zhang (2022, JBES)系统研究了高维矩约束模型在可能含有错误识别矩条件情形下的参数估计与推断问题,提出了一种惩罚经验似然方法,建立了相应的矩条件识别准则。

系列代表性工作三:基于高斯逼近的统计推断新理论

Chang & Hall (2015, BKA)首次对该方法进行了系统研究,并给出了其在校正偏差与建立置信区间这两种情况下的理论性质。Chang, Yao & Zhou (2017, BKA)首次解决了超高维时间序列中的白噪声检验问题。Chang, Jiang & Shao (23, JoE)将Chang, Yao & Zhou (2017, BKA)的方法进行推广,并首次解决了更为一般的超高维鞅差检验。Chang, Zheng, Zhou & Zhou (2017, Biometrics)和Chang, Zhou, Zhou & Wang (2017, Biometrics)给出了在数据内部各分量间具有任意相关结构时均能工作的超高维均值检验方法和超高维协方差检验方法。Chang, Qiu, Yao & Zou (2018, JoE)给出了构建超高维精度矩阵(precision matrix)置信域的方法,并以此研究了 2008 年金融危机前后美国股市不同板块股票间连通性的变化。Chang, He, Kang & Wu (2024, JASA)通过参数 bootstrap 方法对大脑多模态图像数据中的相依性结构提出了一种快速推断的方法,所提方法不需要对大脑多模态图像数据中不同区域的相关性进行假设。运用该方法对 Human Connectome Project 中的多任务 fMRI 数据进行分析发现了一些脑科学研究中的新结论。