使用线性回归预测pm2.5的浓度

本文介绍了如何运用线性回归分析预测北京PM2.5浓度。首先,将日期字符串转换为年、月、日、周几的特征,然后进行模型训练和预测。重点涉及了read_csv的参数设置、time.strptime函数的使用以及数据处理中的重置索引和保存数据到CSV文件的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天做了一个小任务,使用回归分析预测北京pm2.5的浓度。

import time
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression  # 用于线性回归 
from sklearn.model_selection import train_test_split 

df = pd.read_csv('D:\game\pm2.5\北京PM2.5浓度回归分析训练赛\pm25_train.csv', engine='python')



查看数据发现日期格式是字符串格式,例如:“2019-01-01”,首先第一步操作要把字符串类型的日期,拆分成年、月、日、周几,之后再把这4个特征添加到数据表中。

def data_format(dt):
    time_list = []
    t = time.strptime(dt, '%Y-%m-%d')
    time_list.append(t.tm_year)
    time_list.append(t.tm_mon)
    time_list.append(t.tm_mday)
    time_list.append(t.tm_wday)
    return time_list
date = df['date'].tolist()
jieguo = []
for dt in date:
    jieguo.append(data_format(dt=dt))

df_time = pd.DataFrame(jieguo)
df_time.columns=['year', 'mon', 'day','week']
df_data =
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值