近日,由团队常晋源教授、博士生胡桥、加拿大麦吉尔大学Eric D. Kolaczyk教授、英国伦敦政治经济学院姚琦伟教授以及云南大学易凤婷老师合作完成的论文“Edge differentially private estimation in the β-model via jittering and method of moments”被统计学国际顶级学术期刊《Annals of Statistics》正式接收。
内容简介
在数据隐私保护领域,长期以来一直存在着一个挑战——即如何在保持隐私水平的同时提高统计推断的效率。本文考虑基于抖动机制(jittering)对服从β模型的网络数据进行加噪,然后再利用新得到的噪音数据对原有β模型中的参数进行估计和统计推断。与传统的通过最大似然方法来估计参数不同,我们提出了一种矩估计方法。该方法使得我们能够在更严格的隐私水平下对β模型中的参数进行估计,进而在实际应用中增强数据隐私。本文所提出的参数估计量具有相变(phase transition)特征——其收敛速度和渐近方差会根据隐私水平的差异,遵循三种不同的规律。考虑到在实践中确定数据隐私水平非常困难,我们提出了一种新颖的自适应自助法(bootstrap)用以在不同隐私水平下对参数进行统计推断。基于这种方法,我们能够对β模型中的所有参数(即网络中的节点个数)同时进行统计推断。数值实验表明:我们所提出的推断方法在有限样本下与最大似然方法具有相似的表现,并在计算速度和内存消耗方面具有显著优势。
作者简介
常晋源,西南财经大学数据科学与商业智能联合实验室执行主任、光华特聘教授、国家杰出青年科学基金获得者。主要从事超高维数据分析和高频金融数据分析两个领域的研究。胡桥,西南财经大学统计学院2021级统计学专业博士生,导师为常晋源教授。主要从事高维时间序列分析、经验似然以及网络数据分析等领域的研究。
Eric D. Kolaczyk,加拿大麦吉尔大学教授。主要从事动态网络建模、机器学习和人工智能等领域的研究。
姚琦伟,英国伦敦政治经济学院讲席教授。主要从事时间序列分析、降维和因子建模、动态网络建模、时空建模、金融计量经济学和非参数回归等领域研究。
易凤婷,云南大学讲师。主要从事纵向数据分析、生存数据分析、网络数据分析等领域的研究。