基于强化学习的需求分布未知情境下酒店客房动态定价研究
Dynamic pricing of hotel rooms based on reinforcement learning with unknown demand distribution
查看参考文献37篇
文摘
|
传统酒店动态定价研究大多考虑改进需求预测方法或考虑需求环境已知,而现实生活中需求分布通常是未知的.本文考虑需求分布未知的情境,建立基于马尔可夫决策过程的酒店客房多周期动态定价模型,并利用强化学习方法,提出基于SARSA(λ)的改进算法对客房动态定价模型进行求解.为提升算法的求解能力和收敛速度,提出了基于改进ε-greedy策略的ε-SARSA(λ)算法和基于改进模拟退火策略的ISA-SARSA(λ)算法.通过数值实验对比SARSA(λ), ε-SARSA(λ), SA-SARSA(λ)和ISA-SARSA(λ)四种算法的收益优化结果,验证了改进算法的有效性,结果显示, ISA-SARSA(λ)算法求解性能最好. |
其他语种文摘
|
Traditional hotel dynamic pricing research always considers improving demand forecasting methods or considers that the demand environment is known, while the demand distribution in real life is usually unknown. In this paper, we established a multi-period dynamic pricing model for hotel rooms based on Markov decision process with unknown demand distribution, and used the reinforcement learning method to propose improved algorithms based on SARSA(λ)to solve the dynamic pricing model of rooms. In order to improve the solving ability and convergence speed of the algorithm, we proposed the ε-SARSA(λ)algorithm based on the improved ε-greedy strategy and the ISA-SARSA(λ)algorithm based on the improved simulated annealing strategy. Through numerical experiments, the revenue optimization results of the four algorithms, SARSA(λ), ε-SARSA(λ), SA-SARSA(λ)and ISA-SARSA(λ), were compared. The study results verify the effectiveness of improved algorithms and show that the ISA-SARSA(λ)algorithm has the best solution performance. |
来源
|
系统工程理论与实践
,2023,43(2):509-523 【核心库】
|
DOI
|
10.12011/SETP2022-1705
|
关键词
|
强化学习
;
动态定价
;
SARSA(λ)算法
;
收益管理
|
地址
|
东北财经大学管理科学与工程学院, 大连, 116025
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1000-6788 |
学科
|
社会科学总论;自动化技术、计算机技术 |
基金
|
国家自然科学基金面上项目
;
辽宁省自然科学基金
;
国家自然科学基金青年项目
;
国家自然科学基金重点项目
|
文献收藏号
|
CSCD:7435019
|
参考文献 共
37
共2页
|
1.
朱晗. O2O背景下的共享经济研究.
系统工程理论与实践,2021,41(2):411-420
|
CSCD被引
7
次
|
|
|
|
2.
周建红. 我国航空客运量需求预测模型:基于随机前沿预测模型和模型平均.
系统工程理论与实践,2020,40(11):2861-2871
|
CSCD被引
2
次
|
|
|
|
3.
孔祥维. 人工智能决策可解释性的研究综述.
系统工程理论与实践,2021,41(2):524-536
|
CSCD被引
23
次
|
|
|
|
4.
王欣. 基于强化学习的动态定价策略研究综述.
计算机应用与软件,2019,36(12):1-6
|
CSCD被引
3
次
|
|
|
|
5.
Littlewood K. Special issue papers: Forecasting and control of passenger bookings.
Journal of Revenue and Pricing Management,2005,4(2):111-123
|
CSCD被引
6
次
|
|
|
|
6.
Donaghy K. Yield management: An overview.
International Journal of Hospitality Management,1995,14(2):139-150
|
CSCD被引
6
次
|
|
|
|
7.
陈旭. 酒店收益管理的研究进展与前景.
管理科学学报,2003,6(6):72-78
|
CSCD被引
11
次
|
|
|
|
8.
陈武华. 基于顾客选择的酒店多房间类型联合定价研究.
管理科学学报,2013,16(7):23-33
|
CSCD被引
7
次
|
|
|
|
9.
Vives A. Dynamic pricing for online hotel demand: The case of resort hotels in Majorca.
Journal of Vacation Marketing,2020,26(2):268-283
|
CSCD被引
1
次
|
|
|
|
10.
李贺. 考虑战略消费者行为风险的动态定价策略.
管理科学学报,2012,15(10):11-25
|
CSCD被引
14
次
|
|
|
|
11.
Yang J. A nonatomic-game approach to dynamic pricing under competition.
Production and Operations Management,2013,22(1):88-103
|
CSCD被引
1
次
|
|
|
|
12.
祖长生.
饭店收益管理,2016:58-62
|
CSCD被引
1
次
|
|
|
|
13.
Petricek M. Model of price optimization as a part of hotel revenue management-Stochastic approach.
Mathematics,2021,9:1552
|
CSCD被引
1
次
|
|
|
|
14.
任武军. 基于互联网大数据的旅游需求分析——以北京怀柔为例.
系统工程理论与实践,2018,38(2):437-443
|
CSCD被引
7
次
|
|
|
|
15.
Ladany S P. Optimal market segmentation of hotel rooms-The non-linear case.
Omega,1996,24(1):29-36
|
CSCD被引
1
次
|
|
|
|
16.
Bandalouski A M. Dynamic pricing with demand disaggregation for hotel revenue management.
Journal of Heuristics,2021,27(5):869-885
|
CSCD被引
1
次
|
|
|
|
17.
Bernal A.
Pricing in network revenue management systems with reusable resources,2020
|
CSCD被引
1
次
|
|
|
|
18.
Weatherford L R. A comparison of forecasting methods for hotel revenue management.
International Journal of Forecasting,2003,19(3):401-415
|
CSCD被引
3
次
|
|
|
|
19.
Lin S J. A EMD-BP integrated model to forecast tourist number and applied to Jiuzhaigou.
Journal of Intelligent & Fuzzy Systems,2018,34(2):1045-1052
|
CSCD被引
3
次
|
|
|
|
20.
李晓炫. 基于网络搜索和CLSI-EMD-BP的旅游客流量预测研究.
系统工程理论与实践,2017,37(1):106-118
|
CSCD被引
11
次
|
|
|
|
|