无系数模型的准回归系数解读
1. 引言
在营销领域,当提及“新型模型”时,统计普通最小二乘回归模型常被作为参考。模型构建者在评估替代建模技术时,会参考回归概念及其显著特征。这是因为普通回归范式是解决普遍预测问题的基础。营销人员在接受新技术之前,通常会依据对回归模型的了解来做判断。新的建模技术往往通过其产生的系数进行评估,如果新系数能提供与回归系数相当的信息,那么该技术就更容易被接受;反之,则可能被拒绝。然而,一些机器学习方法产生的模型没有系数,这就带来了难题。本文旨在介绍一种计算准回归系数的方法,为评估和使用无系数模型提供参考,同时,准回归系数也是回归系数的一种可靠且无需假设的替代方案,因为回归系数的可靠解释依赖于一个隐含且很少被检验的假设。
2. 线性回归系数
普通最小二乘线性回归系数(linear - RC(ord))在营销分析和建模中广泛应用。对于预测变量 X,linear - RC(ord) 定义为:X 每单位变化时,因变量 Y 的预测(期望)恒定变化。其数学表达式为:
[
\text{Linear - RC(ord)} = \frac{\text{Predicted - Change in Y}}{\text{Unit - Change in X}}
]
考虑基于样本点 $(X_i, Y_i)$ 的简单普通线性回归模型 $\text{pred}
Y = a + b
X$,各参数含义如下:
1.
简单
:仅使用一个预测变量 X。
2.
普通
:因变量 Y 是连续的。
3.
线性
:明确表示模型由加权预测变量 $b
X$ 和常数 $a$ 之和定义;隐含假设 Y 和 X 之间的真实关系是直线。
4.
X 的单位变化
:指按升序排列的两个 X 值 $X_r$ 和 $X
{r + 1}$ 的差值为 1,即 $X_{r + 1} - X_r = 1$。
5.
Y 的变化
:指对应于 $(X_r, \text{pred}
Yr)$ 和 $(X
{r + 1}, \text{pred}_Y{r + 1})$ 的预测 Y 值的差值,即 $\text{pred}_Y{r + 1} - \text{pred}_Yr$。
6.
Linear - RC(ord)
:表明 Y 的期望变化是恒定的,即 $b$。
2.1 简单普通回归模型示例
基于数据集 A 的 10 个观测值,对 Y 关于 X 进行简单普通(最小二乘)线性回归。Y 与 X 的散点图显示满足线性假设,两者呈正直线关系。X - Y 图和残差与预测 Y 的图都表明回归模型 $\text{Pred}_Y = 22.2256 + 0.7967*X$ 是可靠的。因此,估计的 linear - RC(ord) 值 0.7967 是 X 真实线性回归系数的可靠点估计。即在观测到的 X 值 19 到 78 之间,X 每单位变化,Y 的期望恒定变化为 0.7967。
数据集 A 如下:
| Y | X | pred_Y |
| — | — | — |
| 86 | 78 | 84.3688 |
| 74 | 62 | 71.6214 |
| 66 | 58 | 68.4346 |
| 65 | 53 | 64.4511 |
| 64 | 51 | 62.8576 |
| 62 | 49 | 61.2642 |
| 61 | 48 | 60.4675 |
| 53 | 47 | 59.6708 |
| 52 | 38 | 52.5004 |
| 40 | 19 | 37.3630 |
2.2 简单逻辑回归模型示例
基于数据集 B 的 10 个观测值,对响应变量 Y 关于 X 进行简单逻辑回归。逻辑回归模型(LRM)预测 logit Y,且与普通回归模型一样具有线性特征,即由加权预测变量加常数定义,并且假设 logit Y 和 X 之间的潜在关系是直线。因此,对于预测变量 X,简单逻辑线性回归系数(linear - RC(logit))定义为:X 每单位变化时,logit Y 的期望恒定变化。
logit Y 与 X 的平滑图由于观测值仅 10 个,无法明确判断线性关系,但残差与预测 logit Y 的图表明回归模型 $\text{Pred}_\text{Logit Y} = - 3.6920 + 0.1135*X$ 是可靠的。估计的 linear - RC(logit) 值 0.1135 是 X 真实线性逻辑回归系数的可靠点估计。即在观测到的 X 值 12 到 60 之间,X 每单位变化,logit Y 的期望恒定变化为 0.1135。
数据集 B 如下:
| Y | X | pred_lgt Y | pred_prb Y |
| — | — | — | — |
| 1 | 45 | 1.4163 | 0.8048 |
| 1 | 35 | 0.2811 | 0.5698 |
| 1 | 31 | - 0.1729 | 0.4569 |
| 1 | 32 | - 0.0594 | 0.4851 |
| 1 | 60 | 3.1191 | 0.9577 |
| 0 | 46 | 1.5298 | 0.8220 |
| 0 | 30 | - 0.2865 | 0.4289 |
| 0 | 23 | - 1.0811 | 0.2533 |
| 0 | 16 | - 1.8757 | 0.1329 |
| 0 | 12 | - 2.3298 | 0.0887 |
3. 简单回归模型的准回归系数
对于简单回归模型,准回归系数(quasi - RC)定义为:预测变量 X 每单位变化时,因变量 Y 的期望变化(不一定恒定)。准回归系数的特点是它是线性回归系数的推广,能够衡量因变量和预测变量之间的非线性关系。下面通过示例说明其计算方法。
3.1 简单普通回归模型的准回归系数示例
计算准回归系数(quasi - RC(ord))的步骤如下:
1. 对数据进行评分,得到预测 Y(pred_Y)。
2. 按 X 升序排列数据,形成对 $(X_r, X_{r + 1})$。
3. 计算 X 的变化:$X_{r + 1} - X_r$。
4. 计算预测 Y 的变化:$\text{pred}_Y{r + 1} - \text{pred}_Yr$。
5. 计算 X 的准回归系数:预测 Y 的变化除以 X 的变化。
计算结果如下表所示:
| X_r | X_r+1 | change_X | pred_Y_r | pred_Y_r+1 | change_Y | quasi - RC(ord) |
| — | — | — | — | — | — | — |
| 19 | 38 | 19 | 37.3630 | 52.5005 | 15.1374 | 0.7967 |
| 38 | 47 | 9 | 52.5005 | 59.6709 | 7.1704 | 0.7967 |
| 47 | 48 | 1 | 59.6709 | 60.4676 | 0.7967 | 0.7967 |
| 48 | 49 | 1 | 60.4676 | 61.2643 | 0.7967 | 0.7967 |
| 49 | 51 | 2 | 61.2643 | 62.8577 | 1.5934 | 0.7967 |
| 51 | 53 | 2 | 62.8577 | 64.4511 | 1.5934 | 0.7967 |
| 53 | 58 | 5 | 64.4511 | 68.4346 | 3.9835 | 0.7967 |
| 58 | 62 | 4 | 68.4346 | 71.6215 | 3.1868 | 0.7967 |
| 62 | 78 | 16 | 71.6215 | 84.3688 | 12.7473 | 0.7967 |
可以看出,quasi - RC(ord) 在九个 $(X_r, X_{r + 1})$ 区间内是恒定的,等于估计的 linear - RC(ord) 值 0.7967。这是因为预测来自线性模型。
3.2 简单逻辑回归模型的准回归系数示例
计算准回归系数(quasi - RC(logit))的步骤与上述类似,只是使用 logit 单位:
1. 对数据进行评分,得到预测 logit Y(pred_lgt Y)。
2. 按 X 升序排列数据,形成对 $(X_r, X_{r + 1})$。
3. 计算 X 的变化:$X_{r + 1} - X_r$。
4. 计算预测 logit Y 的变化:$\text{pred}
\text{lgt Y}{r + 1} - \text{pred}
\text{lgt Y}r$。
5. 计算 X 的准回归系数:预测 logit Y 的变化除以 X 的变化。
计算结果如下表所示:
| X_r | X_r+1 | change_X | pred_lgt_r | pred_lgt_r+1 | change_lgt | quasi - RC(logit) |
| — | — | — | — | — | — | — |
| 12 | 16 | 4 | - 2.3298 | - 1.8757 | 0.4541 | 0.1135 |
| 16 | 23 | 7 | - 1.8757 | - 1.0811 | 0.7946 | 0.1135 |
| 23 | 30 | 7 | - 1.0811 | - 0.2865 | 0.7946 | 0.1135 |
| 30 | 31 | 1 | - 0.2865 | - 0.1729 | 0.1135 | 0.1135 |
| 31 | 32 | 1 | - 0.1729 | - 0.0594 | 0.1135 | 0.1135 |
| 32 | 35 | 3 | - 0.0594 | 0.2811 | 0.3406 | 0.1135 |
| 35 | 45 | 10 | 0.2811 | 1.4163 | 1.1352 | 0.1135 |
| 45 | 46 | 1 | 1.4163 | 1.5298 | 0.1135 | 0.1135 |
| 46 | 60 | 14 | 1.5298 | 3.1191 | 1.5893 | 0.1135 |
同样,quasi - RC(logit) 在九个 $(X_r, X_{r + 1})$ 区间内是恒定的,等于估计的 linear - RC(logit) 值 0.1135。这是因为预测来自线性模型。
3.3 非线性预测的准回归系数示例
考虑非线性模型,如响应概率模型 $\text{Probability of response Y} = \frac{\exp(\text{logit Y})}{1+\exp(\text{logit Y})}$,该模型在预测变量 X 上是非线性的,即响应概率的期望变化随 X 的单位变化而变化。计算准回归系数(quasi - RC(prob))的步骤如下:
1. 对数据进行评分,得到预测 logit Y(pred_lgt Y)。
2. 将 pred_lgt Y 转换为预测概率 Y(pred_prb Y),转换公式为:$\text{Probability Y}=\frac{\exp(\text{logit Y})}{1 + \exp(\text{logit Y})}$。
3. 按 X 升序排列数据,形成对 $(X_r, X_{r + 1})$。
4. 计算 X 的变化:$X_{r + 1} - X_r$。
5. 计算概率 Y 的变化:$\text{prob}_Y{r + 1} - \text{prob}_Yr$。
6. 计算 X 的准回归系数:概率 Y 的变化除以 X 的变化。
计算结果如下表所示:
| X_r | X_r+1 | change_X | prob_Y_r | prob_Y_r+1 | change_prob | quasi - RC(prob) |
| — | — | — | — | — | — | — |
| 12 | 16 | 4 | 0.0887 | 0.1329 | 0.0442 | 0.0110 |
| 16 | 23 | 7 | 0.1329 | 0.2533 | 0.1204 | 0.0172 |
| 23 | 30 | 7 | 0.2533 | 0.4289 | 0.1756 | 0.0251 |
| 30 | 31 | 1 | 0.4289 | 0.4569 | 0.0280 | 0.0280 |
| 31 | 32 | 1 | 0.4569 | 0.4851 | 0.0283 | 0.0283 |
| 32 | 35 | 3 | 0.4851 | 0.5698 | 0.0847 | 0.0282 |
| 35 | 45 | 10 | 0.5698 | 0.8048 | 0.2349 | 0.0235 |
| 45 | 46 | 1 | 0.8048 | 0.8220 | 0.0172 | 0.0172 |
| 46 | 60 | 14 | 0.8220 | 0.9577 | 0.1357 | 0.0097 |
quasi - RC(prob) 在 X 从 12 到 60 的范围内是非线性变化的,这符合响应概率与预测变量之间理论上的非线性 S 形关系。
下面是计算准回归系数的流程 mermaid 图:
graph LR
A[获取数据] --> B[评分得到预测值]
B --> C[按 X 排序]
C --> D[计算 X 变化]
D --> E[计算预测值变化]
E --> F[计算准回归系数]
4. 通用模型的偏准回归系数
在多元回归模型中,回归系数通常被称为偏线性回归系数(partial linear - RC),其含义与简单回归模型中的回归系数基本相同。对于预测变量 X,偏线性回归系数表示在其他变量保持不变的情况下,X 每单位变化时,因变量 Y 的期望恒定变化。然而,偏线性回归系数的解读依赖于一个隐含假设,即统计调整能使因变量和预测变量之间呈现线性关系。但实际上,随着其他变量数量的增加,这种线性假设成立的可能性会降低,而且通常也不会对该假设的有效性进行检查,这可能使偏线性回归系数的可靠性受到质疑。
准回归系数方法提供了偏准回归系数作为一种可靠且无需假设的替代方案。偏准回归系数定义为:在其他变量保持不变的情况下,预测变量 X 每单位变化时,因变量 Y 的期望变化(不一定恒定)。该方法具有以下优点:
1. 验证线性趋势:对于线性回归模型,可验证因变量与预测变量之间的整体线性趋势,检验偏线性回归系数的线性假设。若出现非线性模式,可推断出需要对预测变量进行重新表达以使其与因变量呈线性关系。
2. 探索非线性模式:对于非线性回归模型,可作为探索性数据分析(EDA)方法,揭示因变量期望变化的潜在结构。
3. 处理无系数模型:为无系数模型提供类似系数的信息,促进“黑盒”机器学习方法的应用。
4.1 通用模型的偏准回归系数计算步骤
考虑基于四个预测变量 $X_1$、$X_2$、$X_3$ 和 $X_4$ 预测 Y 的通用模型,计算 $X_1$ 的偏准回归系数的步骤如下:
1.
确定其他变量的典型值区域
:考虑其他变量的 M - 散布公共区域的典型值。例如,M20 - 散布公共区域包含那些 $X_2$、$X_3$ 和 $X_4$ 的值分别处于各自中间 20% 的个体。初始的 M - 散布公共区域为 M20,若偏准回归系数值不可信,则以 5% 的增量增加公共区域,直到结果可靠。对于测量值较粗的变量,可能需要以 5% 的间隔减小其个体 M - 散布,直到偏准回归系数值可信。
2.
对公共区域内的数据进行评分
:获取公共 M - 散布区域内所有个体的预测 Y。
3.
按 $X_1$ 对数据进行排序
:将评分后的数据按 $X_1$ 升序排列。
4.
分割数据
:根据预期关系的线性或非线性情况,将数据按 $X_1$ 分割成等大小的切片。若预期关系为线性,从 5 个切片开始;若为非线性,从 10 个切片开始。切片数量需根据 M - 散布公共区域的大小和预测变量的测量情况进行调整。
5.
计算 $X_1$ 的统计量
:计算每个切片内 $X_1$ 的最小值、最大值和中位数,形成对 (中位数 $X_{slice i}$,中位数 $X_{slice i + 1}$),并计算 $X_1$ 的变化:中位数 $X_{slice i + 1}$ - 中位数 $X_{slice i}$。
6.
计算预测 Y 的统计量
:计算每个切片内预测 Y 的中位数,形成对 (中位数 pred_Y$
{slice i}$,中位数 pred_Y$
{slice i + 1}$),并计算预测 Y 的变化:中位数 pred_Y$
{slice i + 1}$ - 中位数 pred_Y$
{slice i}$。
7.
计算偏准回归系数
:预测 Y 的变化除以 $X_1$ 的变化。
4.2 多元逻辑回归模型示例
考虑一个基于四个预测变量构建的逻辑回归模型(LRM),用于预测响应变量 RESPONSE:
1. DOLLAR_2:过去 2 年内的消费金额
2. LSTORD_M:自上次订单以来的月数
3. RFM_CELL:最近购买频率/金额单元格(1 = 最佳,5 = 最差)
4. AGE_Y:是否知道客户年龄(1 = 知道,0 = 不知道)
模型方程为:$\text{Pred} \text{lgt RESPONSE} = - 3.004 + 0.00210 \text{DOLLAR}_2 - 0.1995 \text{RFM} \text{CELL} - 0.0798 \text{LSTORD}_M + 0.5337 \text{AGE}_Y$
4.2.1 DOLLAR_2 的偏准回归系数计算
计算 DOLLAR_2 的偏准回归系数(partial quasi - RC(logit))的步骤如下:
1. 对公共 M - 散布区域内的数据进行评分,得到 Pred_lgt RESPONSE。
2. 按 DOLLAR_2 升序排列数据,并将其分割成 5 个切片。
3. 计算每个切片内 DOLLAR_2 的最小值、最大值和中位数,形成对 (中位数 DOLLAR_2$
{slice i}$,中位数 DOLLAR_2$
{slice i + 1}$),并计算 DOLLAR_2 的变化。
4. 计算每个切片内 Pred_lgt RESPONSE 的中位数,形成对 (中位数 Pred_lgt RESPONSE$
{slice i}$,中位数 Pred_lgt RESPONSE$
{slice i + 1}$),并计算 Pred_lgt RESPONSE 的变化。
5. 计算 DOLLAR_2 的偏准回归系数:Pred_lgt RESPONSE 的变化除以 DOLLAR_2 的变化。
计算结果如下表所示:
| Slice | min_DOLLAR_2 | max_DOLLAR_2 | med_DOLLAR_2_r | med_DOLLAR_2_r+1 | change_DOLLAR_2 | med_lgt_r | med_lgt_r+1 | change_lgt | quasi - RC(logit) |
| — | — | — | — | — | — | — | — | — | — |
| 1 | 0 | 43 | | 40 | | - 3.5396 | | | |
| 2 | 43 | 66 | 40 | 50 | 10 | - 3.5396 | - 3.5276 | 0.0120 | 0.0012 |
| 3 | 66 | 99 | 50 | 80 | 30 | - 3.5276 | - 3.4810 | 0.0467 | 0.0016 |
| 4 | 99 | 165 | 80 | 126 | 46 | - 3.4810 | - 3.3960 | 0.0850 | 0.0018 |
| 5 | 165 | 1293 | 126 | 242 | 116 | - 3.3960 | - 3.2219 | 0.1740 | 0.0015 |
从结果来看,DOLLAR_2 的偏准回归系数在不同切片中有不同的值,但平滑预测 logit RESPONSE 与平滑 DOLLAR_2 的关系图表明,在 DOLLAR_2 的整个范围内,存在一个单一的期望恒定变化,这支持了偏线性回归系数的线性假设。同时,准回归系数方法还提供了一个无需假设的偏线性回归系数估计值,为数据分析师提供了多种选择。
4.2.2 LSTORD_M 的偏准回归系数计算
对于 LSTORD_M,使用 6 个切片进行计算。计算结果显示,平滑预测 logit RESPONSE 与平滑 LSTORD_M 的关系图呈现明显的非线性,这表明 LSTORD_M 的线性假设不成立,其偏线性回归系数所暗示的恒定期望变化并不存在。这种非线性模式暗示 LSTORD_M 的结构形式可能不正确,可考虑对其进行二次或三次重新表达以改进模型。
计算结果如下表所示:
| Slice | min_LSTORD_M | max_LSTORD_M | med_LSTORD_M_r | med_LSTORD_M_r+1 | change_LSTORD_M | med_lgt_r | med_lgt_r+1 | change_lgt | quasi - RC(logit) |
| — | — | — | — | — | — | — | — | — | — |
| 1 | 1 | 1 | | 1 | | - 3.2332 | | | |
| 2 | 1 | 3 | 1 | 2 | 1 | - 3.2332 | - 3.2364 | - 0.0032 | - 0.0032 |
| 3 | 3 | 3 | 2 | 3 | 1 | - 3.2364 | - 3.3982 | - 0.1618 | - 0.1618 |
| 4 | 3 | 4 | 3 | 4 | 1 | - 3.3982 | - 3.5049 | - 0.1067 | - 0.1067 |
| 5 | 4 | 5 | 4 | 5 | 1 | - 3.5049 | - 3.5727 | - 0.0678 | - 0.0678 |
| 6 | 5 | 12 | 5 | 6 | 1 | - 3.5727 | - 3.5552 | 0.0175 | 0.0175 |
有趣的是,偏准回归系数(partial quasi - RC(linear))的值与偏线性回归系数的值相近,这表明偏线性回归系数提供了 logit RESPONSE 在 LSTORD_M 整个取值范围内的平均恒定变化,而偏准回归系数则能更准确地反映在预切片区间内的变化情况。
对于 RFM_CELL 和 AGE_Y,偏准回归系数图支持了它们的偏线性回归系数的线性假设,偏准回归系数(partial quasi - RC(linear))和偏线性回归系数的值相等。
5. 无系数模型的准回归系数
传统的线性回归范式使得方程形式(加权预测变量之和)成为预测模型的标志,新的机器学习技术常通过其产生的系数进行评估。然而,一些机器学习方法提供了更好的预测效果却没有系数,这使得无系数模型的接受面临挑战。准回归系数方法为评估和使用无系数的机器学习模型提供了类似系数的信息,让数据分析师和营销人员更有信心地使用这些模型。
5.1 无系数模型示例:GenIQ 模型
考虑一个基于四个预测变量构建的 GenIQ 模型,用于预测响应变量 RESPONSE:
1. DOLLAR_2:过去 2 年内的消费金额
2. PROD_TYP:不同产品的数量
3. RFM_CELL:最近购买频率/金额单元格(1 = 最佳,5 = 最差)
4. AGE_Y:是否知道客户年龄(1 = 知道,0 = 不知道)
5.1.1 DOLLAR_2 的偏准回归系数
DOLLAR_2 的偏准回归系数计算结果如下表所示:
| Slice | min_DOLLAR_2 | max_DOLLAR_2 | med_DOLLAR_2_r | med_DOLLAR_2_r+1 | change_DOLLAR_2 | med_prb_r | med_prb_r+1 | change_prb | quasi - RC(prob) |
| — | — | — | — | — | — | — | — | — | — |
| 1 | 0 | 50 | | 40 | | 0.031114713 | | | |
| 2 | 50 | 59 | 40 | 50 | 10 | 0.031114713 | 0.031117817 | 0.000003103 | 0.000000310 |
| 3 | 59 | 73 | 50 | 67 | 17 | 0.031117817 | 0.031142469 | 0.000024652 | 0.000001450 |
| 4 | 73 | 83 | 67 | 79 | 12 | 0.031142469 | 0.031154883 | 0.000012414 | 0.000001034 |
| 5 | 83 | 94 | 79 | 89 | 10 | 0.031154883 | 0.031187925 | 0.000033043 | 0.000003304 |
| 6 | 94 | 110 | 89 | 102 | 13 | 0.031187925 | 0.031219393 | 0.000031468 | 0.000002421 |
| 7 | 110 | 131 | 102 | 119 | 17 | 0.031219393 | 0.031286803 | 0.000067410 | 0.000003965 |
| 8 | 131 | 159 | 119 | 144 | 25 | 0.031286803 | 0.031383536 | 0.000096733 | 0.000003869 |
| 9 | 159 | 209 | 144 | 182 | 38 | 0.031383536 | 0.031605964 | 0.000222428 | 0.000005853 |
| 10 | 209 | 480 | 182 | 253 | 71 | 0.031605964 | 0.032085916 | 0.000479952 | 0.000006760 |
平滑预测概率 RESPONSE 与平滑 DOLLAR_2 的关系图显示出明显的非线性,这与 GenIQ 模型的非线性性质相符。偏准回归系数可靠地反映了概率 RESPONSE 的期望变化,不同切片有不同的值。
5.1.2 PROD_TYP 的偏准回归系数
由于 PROD_TYP 有多个不同的值,使用 20 个切片进行计算。偏准回归系数图显示出两种模式:在 PROD_TYP 值介于 6 到 15 之间时,概率 RESPONSE 的单位变化可视为样本变化掩盖了一个期望恒定变化;在 PROD_TYP 值大于 15 时,概率 RESPONSE 的期望变化呈非线性增加。如果数据分析师认为偏准回归系数表或图中的细节是由样本变化引起的,可以使用偏准回归系数(partial quasi - RC(linear))估计值。
5.1.3 RFM_CELL 和 AGE_Y 的偏准回归系数
RFM_CELL 的偏准回归系数图显示概率 RESPONSE 的期望变化呈增加趋势,由于 RFM_CELL 是一个具有“反向”尺度的区间变量,其概率变化并非恒定。AGE_Y 的偏准回归系数图显示出一个简单的线性变化。
通过这个示例可以看出,准回归系数方法在处理非回归、非线性和无系数的模型时表现良好,为评估和使用这类模型提供了有价值的信息。
6. 总结
回归系数在营销分析和建模中被广泛使用,但它的可靠性依赖于线性统计调整的假设。当新的建模方法没有系数时,会给评估和使用带来困难。准回归系数(quasi - RC)为评估和使用无系数模型提供了类似系数的信息,同时也是回归系数在线性假设不成立时的可靠替代方案。
通过简单线性回归模型的示例,我们展示了准回归系数的计算方法,并验证了其与实际回归系数的一致性。对于通用模型,偏准回归系数方法提供了多种选择,让数据分析师可以根据具体情况决定接受偏准回归系数、偏线性回归系数或偏准回归系数(linear)估计值。最后,通过无系数的 GenIQ 模型示例,我们证明了准回归系数方法在处理复杂模型时的有效性,为数据分析师和营销人员提供了信心和便利。
下面是处理通用模型偏准回归系数的流程 mermaid 图:
graph LR
A[确定其他变量公共区域] --> B[对公共区域数据评分]
B --> C[按 X1 排序]
C --> D[分割数据]
D --> E[计算 X1 统计量]
E --> F[计算预测 Y 统计量]
F --> G[计算偏准回归系数]
超级会员免费看
4495

被折叠的 条评论
为什么被折叠?



