帮助 关于我们

返回检索结果

基于倾向值匹配的干扰数据检测方法
A New Method for Processing Interference Data Based on Propensity Score Matching

查看参考文献15篇

刘胜楠 1,2   刘文君 2   邹国华 2 *  
文摘 数据中掺杂干扰数据的现象十分常见,对于随机出现的干扰数据处理,目前已有很多方法可以借鉴,但对于人为的干扰数据,若继续使用传统方法,则可能不会达到很好的效果.倾向值可以用一维数值来描述多维数据的特征,且当数据具有相近的倾向值时,其本身常常也很相似,并可能来自同一总体.因此,文章提出一种应用倾向值匹配检测干扰数据的新方法,即用最佳比例匹配来检测干扰数据.文章设计了两个算法,其一用于估计真实数据在原始数据中所占的比例,同时计算真实数据的总体均值估计;另一用于提取拟真实数据并进行建模分析.模拟研究证实了所提出的算法的有效性.
其他语种文摘 It is very common that data are mixed with some interference data. For the easily recognized interference data, there are many methods of analysis in literature. However, if the interference data is difficult to identify, then the traditional methods will not be valid. Propensity scores can be used to characterize multidimensional data, and data with the same propensity values are similar and likely come from the same population. Therefore, by applying the propensity score matching, this paper proposes a new method to detect interference data. Two algorithms are developed for this purpose. One is used to obtain the proportion of real data in the original data, and estimate the population mean of real data. The second aims to extract the pseudo-real data and conduct modeling analysis. An extensive simulation study shows good performance of the proposed algorithms.
来源 系统科学与数学 ,2022,42(1):153-174 【核心库】
关键词 干扰数据 ; 倾向值匹配 ; 有效数据 ; 总体均值估计
地址

1. 中铝材料应用研究院有限公司, 北京, 102209  

2. 首都师范大学数学科学学院, 北京, 100048

语种 中文
文献类型 研究性论文
ISSN 1000-0577
学科 数学
基金 北京市自然科学基金重点研究专项 ;  首都师范大学科技创新服务能力建设-基本科研业务费(科研类)资助课题
文献收藏号 CSCD:7130546

参考文献 共 15 共1页

1.  韦博成. 统计诊断,2009 CSCD被引 23    
2.  Barnett V. Outliers in Statistical Data. 3rd Ed,1994 CSCD被引 5    
3.  罗涛. 数据测量中干扰数据的剔除与取代. 数据采集预处理,1991,6(3):6-9 CSCD被引 1    
4.  李桂成. 时变数据和谱数据测量中干扰数据的剔除与取代. 吉林工业大学学报,1995,25(2):24-28 CSCD被引 1    
5.  邓重一. 数据采集与处理系统中的干扰问题及解决方法. 电工技术杂志,2004(1):47-50 CSCD被引 2    
6.  陈原. 测量数据处理过程中干扰数据的剔除与取代. 计量与测试技术,2005,32(10):16-17 CSCD被引 4    
7.  张正秋. 一种简单的对大气探测中干扰数据的排除方法. 工程数学学报,2007,24(3):451-457 CSCD被引 1    
8.  王雷. 基于支持向量机的回归预测和异常数据检测. 中国电机工程学报,2009,29(8):92-96 CSCD被引 29    
9.  马新欣. 地电场观测典型干扰数据的修正方法. 地震地磁观测与研究,2012,33(3/4):159-163 CSCD被引 1    
10.  Rosenbaum P R. The central role of the propensity score in observational studies for causal effects. Biometrika,1983,70(1):41-55 CSCD被引 363    
11.  Rosenbaum P R. Observational Studies. 2nd Ed,2002 CSCD被引 2    
12.  Guo S. Propensity Score Analysis: Statistical Methods and Applications,2010 CSCD被引 3    
13.  Long J S. Regression Models for Categorical and Limited Dependent Variables,1997 CSCD被引 8    
14.  Wang H. Optimal subsampling for large sample logistic regression. Journal of the American Statistical Association,2017,113(2):829-844 CSCD被引 14    
15.  王俊. 网络便利样本的推断问题研究. 统计与决策,2018,34(18):10-15 CSCD被引 1    
引证文献 1

1 何俊勇 新三板精选层提高市场流动性和股价信息效率了吗? 系统科学与数学,2024,44(3):755-779
CSCD被引 0 次

显示所有1篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号