数据规律探索与风能采集系统建模的研究分析
1. 数据规律探索中的回归模型验证
在数据规律探索中,简单回归模型对数据的描述并不充分。从相关表格可知,简单回归对数据进行详尽描述的零假设的P值不超过0.026,这有力地表明简单回归不足以解释数据,更复杂的分段线性回归模型是必要的。例如,维生素D(vitD)仅在其浓度低于特定阈值时才与甲状旁腺激素(PTH)相关的假设在统计上是有效的。
1.1 基于最优划分的回归模型验证
-
最优划分方法 :最优有效划分(OVP)方法旨在探索二元变量 $Y \in {a, b}$ 与解释变量 $X_1, \cdots, X_n$ 之间的依赖关系。它通过标准形式的训练样本 $\hat{S} 0 = {(y_1, x_1), \cdots, (y_m, x_m)}$ 对自变量的一维区间或变量对的二维联合区域进行最佳划分,以实现二元变量 $Y$ 不同取值组的最佳分离。划分的质量由以下函数描述:
<
[Q(r, \hat{S}_0) = \frac{1}{n_0(1 - n_0)} \sum {i = 1}^{k} m_i(n_0 - n_i)^2]
其中,$n_0$ 是整个训练样本 $\hat{S} 0$ 中 $y_j = 1$ 的对象比例,$n_i$ 是区域 $q_i$ 内 $y_j = 1$ 的对象比例,$m_i$ 是区域 $q_i$ 内的对象数量。最优划分在四个划分族中搜索,最佳划分记为 $r_b$,并定义 $P {pv}(\hat{S}) = Q(r_b, \hat{S}) - Q(r_b, \hat{S}_0)$。
数据规律与风能系统建模分析
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



