西安明城墙景区客流预测系统的研究
西安明城墙景区客流预测系统的研究
摘要
西安明城墙作为中国现存规模最大、保存最完整的古代城垣建筑,是西安市最具代表性的旅游景区之一。随着文旅产业的快速发展,景区客流量呈现显著的季节性波动、节假日高峰与突发性增长特征,对景区的安全管理、资源配置和运营调度提出了严峻挑战。准确预测景区客流量是提升智慧化管理水平、保障游客体验与安全的核心技术手段。本研究基于随机森林回归模型,构建了西安明城墙景区客流预测系统,并扩展实现了单一决策树回归与多元线性回归两种对比模型。系统主要包括数据采集与预处理、特征工程、模型训练与评估、可视化分析等核心模块。在数据生成方面,本研究模拟生成了包含日期特征、气象特征、节假日特征和交通可达性特征在内的2019—2026年西安明城墙日客流量数据集,总样本量达2301条。在模型构建方面,分别实现了随机森林回归(Random Forest Regressor)、决策树回归(Decision Tree Regressor)和多元线性回归(Multiple Linear Regression)三种算法,通过交叉验证和网格搜索对随机森林模型进行了超参数优化,利用特征重要性分析评估了各特征对客流量的影响程度。在可视化方面,开发了预测值对比图、残差分布图、特征重要性排序图、模型评估雷达图及预测结果展示面板等多维度可视化功能。实验结果表明:随机森林回归模型在测试集上表现最优,R²达到0.942,RMSE为415.28,MAPE为7.86%;决策树回归模型R²为0.923,RMSE为479.41,MAPE为9.35%;多元线性回归模型R²为0.891,RMSE为571.39,MAPE为12.41%。随机森林模型相比单一决策树将R²提升了约2个百分点,相比多元线性回归提升了约
