1、模块完成后运行包装器会生成两个图,第一个图展示数据以及不同阶数D的多项式拟合结果,第二个图展示每种拟合对数据集的平均误分类数。讨论这两个图呈现的结果。具体而言,描述随着图中所示阶数D的增加,模型的平均误分类数与它对生成数据的现象的表征能力之间的关系。
模型阶数对数据拟合与分类的影响
随着多项式阶数 $ D $ 增加:
- 在离散化数据情况下:
- 增加基元素数量能够产生更好的拟合效果
- 平均误分类数可能降低
-
模型对数据的表征能力提升
-
在更现实的含噪声数据集中:
- 过高的阶数 $ D $ 会导致过拟合
- 虽然模型能够紧密拟合已有数据,平均误分类数可能较低
- 但会将真实边界外错误标记的点也纳入其中
- 无法很好地代表潜在的数据生成函数
-
即对生成数据的现象的表征能力变差
-
相比之下:
- 较低阶数的多项式可能产生与真实边界匹配较好的分类器
- 能更好地反映潜在的数据生成现象
2、将poly_features模块放入ova_fixed_basis包装器中,并使用可从特定网站下载的bullseye_data.csv数据集。安装模块后,运行包装器以实现特定的预期结果。
按照要求,先从特定网站下载 poly_features 模块和 bullseye_data.csv 数据集,把 poly_features 模块放入 ova_fixed_basis 包装器,安装模块后运行包装器,从而实现特定的预期结果。

最低0.47元/天 解锁文章
23

被折叠的 条评论
为什么被折叠?



