本文介绍定量预测的相关知识
前言
提示:这里可以添加本文要记录的大概内容:
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。
提示:以下是本篇文章正文内容,下面案例可供参考
一、定量预测是什么?
定量预测,是使用历史数据或因素变量来预测需求的数学模型。概念解释如下:
- 因素变量:即自变量,或者称为解释变量
- 需求:可以理解为因变量,或者被解释变量
二、定量预测的分类
定量预测分为两类:
- 时序预测法。它是以一个指标历史数据的变化趋势,去寻找该指标的变化规律,从而将该变化规律作为预测的依据(把未来作为过去历史的延伸)。
*注:该变化规律是用数学表达式来表达的 - 因果分析法。它包括:
- 一元回归法
- 多元回归法
- 投入产出法
其中,回归预测法是因果分析法中很重要的一种。它从因变量与自变量的历史和现实变化的相互关系中,探索它们之间的规律性联系,作为预测未来的依据。(这句话来自百度百科,看的不太懂)
百度百科的另一个解释:
回归预测(regression forecasting)是回归方程的一项重要应用。所谓预测就是对给定的X值(解释变量),估计Y值(因变量)将落在什么范围(预测是有误差的)。
基于对以上两种定量预测方法的阐述,可以大致得出定量预测问题的处理思路:
- 已有待预测变量(即上文所说的“指标”)的历史数据:直接使用“时序预测法":对变量历史数据的变化趋势进行拟合,将拟合结果(即上文所说“变化规律”)作为预测的依据。
- 优点:不涉及其他变量;可选方法多
- 没有待预测变量的历史数据:无法使用“时序预测法",只能采取“回归分析法”:先得到解释变量 X i X_i Xi和因变量 Y Y Y的历史数据,然后拟合得到回归方程,最后根据解释变量的未来值,预测因变量的未来值。
- 优点:无需知道待预测变量的历史数据
- 缺点:必须得知与因变量处于同一时点的,解释变量的样本值
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。