符号回归技术全解析:从理论到应用
1. 符号回归基础:短期与长期预测
在符号回归中,一种有效的策略是从较小的窗口开始优化短期拟合,然后将得到的解作为起点,用于优化更大窗口的系数。通过这种方式,最终能够实现长期的最优预测。例如,在某些模型中,使用相同的模型,系数设为 a = 10,b = 28,c = 8/3,初始值 x(0) = y(0) = z(0) = 1,但由于求解器的细微差异,长期来看解会出现偏差。不过,在有限的预测范围内,我们仍然可以拟合模型。如果仅对短时间窗口进行模型拟合,就有可能通过符号回归找到洛伦兹模型方程。
2. 处理非数值数据
以往我们通常假设所有数据都是数值型的,这样才能用算术运算符和实值函数(如 exp(x) 或 sin(x))构建符号回归模型。但在一些应用中,可能需要处理非数值、定性或分类变量。
2.1 编码分类变量
- 有序变量 :对于有序尺度上的字符串值,如“极冷”“冷”“暖”“热”,或使用洛氏硬度标度的硬度值,可以按相同顺序将其映射为整数值。在这种情况下,依靠符号回归来识别潜在的非线性尺度。
- 无序变量 :对于无序尺度的值,可以通过独热编码处理,即为每个类别添加一个单独的二进制特征。例如,下面的表格展示了如何将有序和无序的分类变量转换为数值变量。
| 原始变量 | | 编码变量 | | | |
| — | — | — | — | — | — |
| 硬度 | 结构 | 硬度 | 立方 | 六方 | 正交 |
| B | 立方 | 2 | 1 | 0 | 0
超级会员免费看
订阅专栏 解锁全文
1681

被折叠的 条评论
为什么被折叠?



