时间序列 R 读书笔记 05 判断预测法 Judgmental forecasts

判断预测法详解
本文介绍了判断预测法的基本概念,包括其适用场景、局限性及注意事项,并详细阐述了几种主要的判断预测方法,如德尔菲法、类比法等。此外还讨论了新产品预测的具体方法及其在调整统计模型中的应用。

1 简介

判断预测法是指Forecasting using judgement,也就是用专业知识相关信息来进行预测,是一种主观预测方法
判断预测法主要用于一下情况
1. 没有历史数据,没有方法用统计方法
2. 有历史数据,同统计方法建模,用判断法来调整
3. 同时用统计方法和判断法建模,之后结合他们

2 局限性

主观判断往往因人而异,需要考虑尽量多的因素,客观的与目标相适应
R. Fildes and P. Goodwin (2007b). Good and bad judgment in forecasting: lessons from four companies. Foresight: The International Journal of Applied Forecasting 8, 5–10.

3 注意事项

这一小节没有忠于原文,原文地址
https://www.otexts.org/fpp/3/3
实施过程中要注意
1. 要系统、全面、客观、有针对性的看问题
2. 要尽力摆脱自身主管因素对评价的影响
3. 对所做工作及时的做好整理工作
4. 及时的与现实数据相比较,及时调整
5. 评价的专家人数要多样化
6. 预测者要与用户隔离,如果预测者也是用户或者和用户有关,会使预测信息有主观性

4 主要方法

  1. The Delphi method 主要是集中了多个专家的意见,这里不做详述
  2. 类比法,类比其他案例做预测
  3. 剧情法,考虑各种可能和影响因素,选择一种最合理的剧情来预测

5 新产品预测方法

除了以上方法,还有下面的方法
1. 销售者预测,由于他与购买者直接联系,可能会带有主观性
2. 决策者意见
3. 顾客意向调查

6 判断法的调整作用

注意事项
1. 谨慎使用判断法调整统计模型,因为一般统计模型精度要好些
2. 当判断法的作用显著时,如有很明显的信息与历史数据不同时使用效果显著,但是不要有如下错觉:在统计模型的基础上,调整一点点,很多时候这样做是起反作用的。

### 关于抽样方法及其应用 #### 抽样分布的重要性 在统计学中,抽样分布描述了从同一总体中抽取多个样本时某些样本统计量的分布特性。这些统计量通常包括样本均值、样本方差等,它们反映了总体的不同特征[^1]。因此,在实际数据分析过程中,理解并掌握抽样分布对于评估统计推断的有效性和可靠性至关重要。 #### 不同类型的抽样方法 以下是几种常见的抽样方法: - **定额抽样 (Quota Sampling)** 这种方法涉及将总体按照特定特征划分为若干组,并在每组内依据主观判断选择一定数量的个体作为样本。尽管这种方法能有效降低抽样成本和范围,但由于缺乏随机性,可能导致偏差增加。此外,设定合理的配额往往需要反复试验才能达到理想效果[^4]。 - **判断抽样 (Judgmental/Purposive Sampling)** 此类抽样依赖专家的知识来挑选最有可能提供所需信息的目标群体成员。虽然此法操作简便快捷,但同样存在较大程度的选择偏倚风险。 - **简单随机抽样 (Simple Random Sampling, SRS)** 所有个体被赋予相等的机会进入最终样本集合之中。这是最基本的概率抽样形式之一,理论上可最大程度减少人为干扰带来的误差。 - **分层抽样 (Stratified Sampling)** 首先根据某个或某几个变量把整个母群分成互不重叠的小子集即层次;接着分别独立地从各层内部实施SRS或其他适当方式选取单位构成总样本。相比单纯依靠运气决定归属的传统做法而言,这种方式更能确保所得结果具备代表性。 - **整群抽样 (Cluster Sampling)** 和 **系统抽样 (Systematic Sampling)** 等其他高级策略也各有千秋,在资源有限条件下尤为适用。 #### 数据科学中的抽样实践 当从事数据科学研究活动时,如果条件允许的话,则倾向于利用尽可能庞大的原始资料集来进行建模训练或是参数估算工作,而不是频繁更换新批次测试对象。然而现实中并非任何时候都能满足上述前提假设——比如面对海量非结构化文件存储场景下可能遇到性能瓶颈等问题——此时合理运用前述各类技巧就显得尤为重要起来。 另外值得注意的是,在机器学习领域里还衍生出了诸如交叉验证(Cross Validation)之类专门针对算法优化目的设计出来的特殊采样流程安排方案等等。 ```python import numpy as np from sklearn.model_selection import train_test_split # Example of splitting dataset into training and testing sets using random sampling. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) print("Training set size:", len(y_train)) print("Testing set size:", len(y_test)) ``` #### 显著性检验与p值解释 除了讨论具体的取样手段之外,还需要提及一下如何借助t统计量以及关联的p值完成单个回归系数重要性的检测过程。其中后者扮演着衡量证据强度的角色,用来判定所观测现象是否仅仅属于偶然事件范畴之内[^2]。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值