基于SMOTETomek-RFE-MLP算法的上市公司信用风险预测
Credit Risk Prediction of the Listed Companies Based on SMOTETomek-RFE-MLP Algorithm
查看参考文献28篇
文摘
|
准确把握上市公司的信用风险状态对监管者和银行等金融机构意义重大,融合财务指标与非财务指标构建信用风险预测指标集,文章提出了一种上市公司信用风险预测组合算法SMOTETomek-RFE-MLP.SMOTETomek混合采样算法以少数类样本过采样、多数类样本欠采样的方式解决样本分类不平衡问题;递归特征消除(Recursive feature elimination,RFE)算法将特征逐个加入模型,以分类精度为标准筛选出最优特征组合;多层感知机(Multi-layer perceptron,MLP)作为分类器实现上市公司信用风险预测.为验证算法的有效性,以2019年A股3797家上市公司的研究对象,设计基模型对比实验和消融实验进行算法测试.研究结果表明,SMOTETomek-RFE-MLP信用风险预测算法综合表现优于Adaboost等基线模型,解决了数据不平衡引起的分类紊乱和特征选择问题,对金融机构评估上市公司的违约风险具有一定的指导意义. |
其他语种文摘
|
It is of great significance for regulators,banks and other financial institutions to accurately grasp the credit risk status of listed companies.In this paper,financial indicators and non-financial indicators are integrated to construct a set of credit risk prediction indicators,meanwhile,a combination algorithm SMOTETomek-RFE-MLP is proposed for the credit risk prediction of listed companies.The hybrid sampling algorithm SMOTETomek solves the problem of unbalanced sample classification by over-sampling a few samples and under-sampling a majority of samples.Through adding features into the model one by one,recursive feature elimination (RFE) algorithm selects the optimal feature sets based on classification accuracy.Multi-layer Perceptron (MLP) is applied as the binary classifier to predict the credit risk of listed companies.To verify the effectiveness of the algorithm,the base model comparison experiment and ablation experiment are designed to test the algorithm with 3797 A-share listed companies in 2019 as the research object.The results show that SMOTETomek-RFE-MLP credit risk prediction algorithm outperforms the baseline models such as Adaboost,and solves the classification disorder and feature selection problems due to data imbalance,which has certain guiding significance for financial institutions to evaluate the default risk of listed companies. |
来源
|
系统科学与数学
,2022,42(10):2712-2726 【核心库】
|
DOI
|
10.12341/jssms22493KSS
|
关键词
|
企业信用风险
;
不平衡数据
;
递归特征消除
;
多层感知机
|
地址
|
1.
北京信息科技大学经济管理学院, 北京, 100192
2.
智能决策与大数据应用北京市国际科技合作基地, 智能决策与大数据应用北京市国际科技合作基地, 北京, 100192
3.
绿色发展大数据决策北京市重点实验室, 绿色发展大数据决策北京市重点实验室, 北京, 100192
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1000-0577 |
学科
|
社会科学总论;自动化技术、计算机技术 |
基金
|
国家重点研发计划课题
;
国家自然科学基金重点项目
|
文献收藏号
|
CSCD:7356065
|
参考文献 共
28
共2页
|
1.
Zamore S. Credit risk research: Review and agenda.
Emerging Markets Finance and Trade,2018,54(4):811-835
|
CSCD被引
1
次
|
|
|
|
2.
冷洁. 基于质量新闻的工业品质量风险分析.
系统科学与数学,2021,41(12):3405-3421
|
CSCD被引
1
次
|
|
|
|
3.
Du Y. Analysis of spatial variation of credit risk of China listed companies based on spatially varying coefficient logistic models.
MATEC Web of Conferences. EDP Sciences,2021,336:09013
|
CSCD被引
1
次
|
|
|
|
4.
迟国泰. 基于非平衡数据处理的上市公司ST预警混合模型.
管理评论,2020,32(3):3-20
|
CSCD被引
9
次
|
|
|
|
5.
张田华. 基于集成学习的上市公司高送转预测实证研究.
计算机工程与应用,2022:1-7
|
CSCD被引
1
次
|
|
|
|
6.
李艳霞. 不平衡数据分类方法综述.
控制与决策,2019,34(4):673-688
|
CSCD被引
72
次
|
|
|
|
7.
王乐. 不平衡数据集分类方法综述.
计算机工程与应用,2021,57(22):42-52
|
CSCD被引
12
次
|
|
|
|
8.
邱泽国. 机器学习算法下信用风险评估体系构建研究——基于中国银联数据的个人信用风险评价分析.
价格理论与实践,2021(10):89-92,194
|
CSCD被引
1
次
|
|
|
|
9.
Yao G. A novel ensemble feature selection method by integrating multiple ranking information combined with an SVM ensemble model for enterprise credit risk prediction in the supply chain.
Expert Systems with Applications,2022,200:117002
|
CSCD被引
2
次
|
|
|
|
10.
Rtayli N. Enhanced credit card fraud detection based on SVM-recursive feature elimination and hyper-parameters optimization.
Journal of Information Security and Applications,2020,55:102596
|
CSCD被引
1
次
|
|
|
|
11.
Zhou Y. Feature selection in credit risk modeling: An international evidence.
Economic Research-Ekonomska Istrazivanja,2020:1-31
|
CSCD被引
1
次
|
|
|
|
12.
Levy A. Credit risk assessment: A comparison of the performances of the linear discriminant analysis and the logistic regression.
International Journal of Entrepreneurship and Small Business,2021,42(1/2):169-186
|
CSCD被引
1
次
|
|
|
|
13.
杜梅慧. 基于两步子抽样算法的P2P信用风险预测研究.
系统科学与数学,2021,41(2):566-576
|
CSCD被引
4
次
|
|
|
|
14.
熊熊. 供应链金融模式下的信用风险评价.
南开管理评论,2009,12(4):92-98,106
|
CSCD被引
13
次
|
|
|
|
15.
蒋彧. 基于KMV模型的中国上市公司信用风险评估研究.
中央财经大学学报,2015,337(9):38-45
|
CSCD被引
2
次
|
|
|
|
16.
莫赞. 基于Bagging集成的个人信用风险评估方法研究.
系统工程,2019,37(1):143-151
|
CSCD被引
3
次
|
|
|
|
17.
胡海青. 基于支持向量机的供应链金融信用风险评估研究.
软科学,2011,25(5):26-30,36
|
CSCD被引
7
次
|
|
|
|
18.
王重仁. 基于超参数优化和集成学习的互联网信贷个人信用评估.
统计与决策,2019,35(1):87-91
|
CSCD被引
6
次
|
|
|
|
19.
郭文伟. 基于MLP神经网络构建小企业信用风险预警模型.
财会月刊,2013,658(6):22-26
|
CSCD被引
1
次
|
|
|
|
20.
陈学彬. 我国信用债个体违约风险测度与防范——基于LSTM深度学习模型.
复旦学报(社会科学版),2021,63(3):159-173
|
CSCD被引
3
次
|
|
|
|
|