【Pytorch】基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN(各种KAN修改一行代码搞定)的共享单车租赁预测研究(数据可换)Python

最新推荐文章于 2025-07-16 17:49:39 发布

大龙不吃小鱼干

最新推荐文章于 2025-07-16 17:49:39 发布

阅读量401

点赞数 5

CC 4.0 BY-SA版权

文章标签： python pytorch lstm 支持向量机

本文链接：https://blog.youkuaiyun.com/F_Matlab/article/details/149291366

💥💥💞💞欢迎来到本博客❤️❤️💥💥

🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。

⛳️座右铭：行百里者，半于九十。

📋📋📋本文目录如下：🎁🎁🎁

目录

⛳️赠与读者

💥1 概述

一、研究背景与意义

二、TCN与KAN简介

三、基于TCN-KAN的共享单车租赁预测模型

四、研究挑战与展望

基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN的共享单车租赁预测研究

1. 引言

2. 模型介绍

2.1 KAN网络

2.2 LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN

3. 数据处理

3.1 数据集

3.2 数据预处理

3.3 数据划分

4. 模型构建与训练

4.1 模型构建

4.2 训练过程

5. 实验结果与分析

5.1 预测结果

5.2 结果分析

6. 结论与展望

6.1 结论

6.2 展望

📚2 运行结果

🎉3 参考文献

🌈4 Python代码、数据

⛳️赠与读者

👨‍💻做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创新点和启发点。当哲学课上老师问你什么是科学，什么是电的时候，不要觉得这些问题搞笑。哲学是科学之母，哲学就是追究终极问题，寻找那些不言自明只有小孩子会问的但是你却回答不出来的问题。建议读者按目录次序逐一浏览，免得骤然跌入幽暗的迷宫找不到来时的路，它不足为你揭示全部问题的答案，但若能让人胸中升起一朵朵疑云，也未尝不会酿成晚霞斑斓的别一番景致，万一它居然给你带来了一场精神世界的苦雨，那就借机洗刷一下原来存放在那儿的“躺平”上的尘埃吧。

或许，雨过云收，神驰的天地更清朗.......🔎🔎🔎

💥1 概述

基于TCN（Temporal Convolutional Network，时序卷积网络）和KAN（Key Attention Network，关键注意力网络）的共享单车租赁预测研究是一个结合了深度学习领域先进技术的复杂课题。以下是对该研究的详细探讨：

一、研究背景与意义

随着共享单车在城市交通中的普及，如何有效管理和预测共享单车的使用量成为了一个重要问题。TCN和KAN作为深度学习中的先进技术，能够处理时间序列数据和捕捉关键特征，为共享单车租赁预测提供了有力的工具。

二、TCN与KAN简介

TCN（Temporal Convolutional Network）：
- TCN是一种专门用于处理时间序列数据的卷积神经网络。
- 它通过一维卷积和因果卷积（causal convolution）来确保模型输出的每个时间步只依赖于过去的信息，从而避免了未来信息的泄露。
- TCN还具有残差连接（residual connections）和扩张卷积（dilated convolutions）等特性，能够捕获长期依赖关系并减少训练过程中的梯度消失问题。
KAN（Key Attention Network）：
- KAN是一种注意力机制，旨在从输入数据中提取关键信息。
- 它通过为输入数据的不同部分分配不同的权重，使得模型能够更加关注那些对预测结果有重要影响的部分。
- 在共享单车租赁预测中，KAN可以帮助模型识别出影响单车租赁量的关键因素，如天气、时间、地点等。

三、基于TCN-KAN的共享单车租赁预测模型

数据预处理：
- 收集共享单车的使用数据，包括时间、地点、天气条件等。
- 对数据进行清洗和预处理，如缺失值填充、异常值处理等。
- 将数据转换为适合TCN-KAN模型输入的形式，如时间序列数据。
模型构建：
- 结合TCN和KAN的特点，构建基于TCN-KAN的共享单车租赁预测模型。
- TCN部分用于捕获时间序列数据中的长期依赖关系和特征；KAN部分用于提取关键信息并增强模型的预测能力。
- 设定模型的超参数，如卷积核大小、扩张因子、注意力机制中的权重分配等。
模型训练：
- 使用历史数据对模型进行训练，通过反向传播算法优化模型的参数。
- 在训练过程中，可以采用交叉验证等方法来评估模型的性能，并调整超参数以获得更好的预测效果。
模型评估与预测：
- 使用测试集对训练好的模型进行评估，验证其预测准确性和泛化能力。
- 将模型应用于实际场景，对共享单车的使用量进行预测，为共享单车公司提供决策支持。

四、研究挑战与展望

数据获取与处理：
- 共享单车数据的获取可能受到隐私保护和商业机密等因素的限制。
- 数据处理过程中需要解决数据缺失、异常值等问题，以确保模型的输入质量。
模型优化：
- TCN-KAN模型的结构和参数设置对预测结果有重要影响，需要不断尝试和优化。
- 可以结合其他深度学习技术或传统机器学习算法来提高模型的预测性能。
实际应用：
- 将模型应用于实际场景时需要考虑实时性、准确性、稳定性等因素。
- 需要与共享单车公司的实际业务相结合，根据业务需求进行定制化开发。

基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN的共享单车租赁预测研究

1. 引言

随着城市化进程的加快和共享经济的兴起，共享单车已成为城市交通的重要组成部分。准确预测共享单车租赁数量对于优化资源配置、提高运营效率、满足用户需求具有重要意义。本文旨在利用LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN等模型，对共享单车租赁数量进行预测研究。

2. 模型介绍

2.1 KAN网络

KAN（Kolmogorov-Arnold Network）是一种全新的神经网络架构，其灵感来源于Kolmogorov-Arnold定理。该定理表明，任何连续的多变量函数都可以表示为一系列一维函数的组合。KAN网络通过可学习的激活函数和节点上的求和操作，实现了更灵活和强大的函数逼近能力。

2.2 LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN

这些模型是KAN网络与其他流行神经网络（如LSTM、BiLSTM、GRU、TCN、Transformer）的组合。它们结合了KAN网络的灵活性和其他网络在时间序列处理上的优势，以提高预测的准确性和鲁棒性。

LSTM-KAN：结合LSTM网络的长短期记忆能力和KAN网络的灵活激活函数。
BiLSTM-KAN：在LSTM-KAN的基础上，增加了双向LSTM层，以捕捉数据中的双向依赖关系。
GRU-KAN：使用GRU（门控循环单元）替代LSTM，简化模型结构同时保持较好的性能。
TCN-KAN：结合时间卷积网络（TCN）的并行处理能力和KAN网络的非线性变换能力。
Transformer-KAN：利用Transformer的自注意力机制，结合KAN网络，实现更高效的序列建模。

3. 数据处理

3.1 数据集

本文使用UCI数据集中的《共享单车租赁数量.csv》数据。该数据集包含多个特征，如日期、时间、天气、季节、节假日等，以及输出列（自行车的租赁数量）。

3.2 数据预处理

日期时间处理：将日期时间字段拆分为日期、月份、星期几、小时等特征。
独热编码：对季节、节假日等分类变量进行独热编码。
归一化：对连续变量（如温度、湿度等）进行归一化处理。

3.3 数据划分

将数据集划分为训练集和测试集，比例通常为8:2。

4. 模型构建与训练

4.1 模型构建

对于每种KAN组合模型，构建相应的网络结构。以LSTM-KAN为例，网络结构可能包括输入层、LSTM层、KAN层、全连接层和输出层。

4.2 训练过程

使用训练集数据对模型进行训练，通过反向传播算法和优化器（如Adam）调整模型参数，以最小化预测误差。在训练过程中，可以采用交叉验证等方法来评估模型性能。

5. 实验结果与分析

5.1 预测结果

分别使用LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN模型对测试集进行预测，并计算相应的评估指标（如MSE、RMSE、MAE等）。

5.2 结果分析

准确性：比较各模型的预测准确性，分析不同模型在共享单车租赁预测中的表现。
鲁棒性：评估模型在不同数据集和条件下的稳定性。
计算效率：比较各模型的训练时间和预测时间，分析其在实际应用中的可行性。

6. 结论与展望

6.1 结论

本文基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN等模型，对共享单车租赁数量进行了预测研究。实验结果表明，这些模型在预测准确性和鲁棒性方面均表现出色，为共享单车系统的运营管理提供了有力支持。

6.2 展望

未来研究可以进一步探索以下方向：

模型优化：通过调整模型结构和参数，进一步提高预测精度和计算效率。
多源数据融合：结合更多维度的数据（如交通流量、天气预报等），提升预测的全面性和准确性。
实时预测：开发实时预测系统，实现共享单车租赁数量的即时预测和动态调整。

📚2 运行结果

部分代码：

def evaluate_forecasts(Ytest, predicted_data, n_out):
    # 定义一个函数来评估预测的性能。
    mse_dic = []
    rmse_dic = []
    mae_dic = []
    mape_dic = []
    r2_dic = []
    # 初始化存储各个评估指标的字典。
    table = PrettyTable(['测试集指标','MSE', 'RMSE', 'MAE', 'MAPE','R2'])
    for i in range(n_out):
        # 遍历每一个预测步长。每一列代表一步预测，现在是在求每步预测的指标
        actual = [float(row[i]) for row in Ytest]  #一列列提取
        # 从测试集中提取实际值。
        predicted = [float(row[i]) for row in predicted_data]
        # 从预测结果中提取预测值。
        mse = mean_squared_error(actual, predicted)
        # 计算均方误差（MSE）。
        mse_dic.append(mse)
        rmse = sqrt(mean_squared_error(actual, predicted))
        # 计算均方根误差（RMSE）。
        rmse_dic.append(rmse)
        mae = mean_absolute_error(actual, predicted)
        # 计算平均绝对误差（MAE）。
        mae_dic.append(mae)
        MApe = mape(actual, predicted)
        # 计算平均绝对百分比误差（MAPE）。
        mape_dic.append(MApe)
        r2 = r2_score(actual, predicted)
        # 计算R平方值（R2）。
        r2_dic.append(r2)
        if n_out == 1:
            strr = '预测结果指标：'
        else:
            strr = '第'+ str(i + 1)+'步预测结果指标：'
        table.add_row([strr, mse, rmse, mae, str(MApe)+'%', str(r2*100)+'%'])