机器学习中的fit(),fit_transform(),transform()

最新推荐文章于 2024-08-31 15:42:00 发布

散懒的猫

最新推荐文章于 2024-08-31 15:42:00 发布

阅读量455

点赞数 1

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Bruce_zfh/article/details/130546780

版权

在机器学习中，由于测试集在模型训练时未知，因此使用训练集的统计信息（如均值和方差）进行数据标准化，如StandardScaler的fit_transform操作。这样做确保了模型不会从测试集获取任何信息，保持了预测的公正性。在实践中，必须避免用测试集参数对测试集进行标准化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为啥一般都是这样用：

from sklearn.preprocessing import StandardScaler

sc = StandardScaler()

sc.fit_tranform(X_train)

sc.tranform(X_test)

机器学习中，训练集是知道的，但是测试集是未知的，所以做标准化时只能用训练集的参数（这个参数指最大最小值标准化中的最大值最小值，或者是正态标准化中的均值和方差）来做，两个fit_transform是用的各自数据集的参数来进行标准化。
但是实际中，我们不能用测试集的参数来标准化测试集，要用训练集的参数来标准化训练集。

博客等级

码龄2年

12
原创

23
点赞

41
收藏

24
粉丝

关注

私信

热门文章

最新评论

手动下载的安装包导入已有python环境中（当pip和conda无法下载库时）
优快云-Ada助手: 恭喜你写了这么有用的博客！对于那些遇到pip和conda无法下载库的问题的人来说，这篇文章肯定会帮上大忙。我觉得接下来你可以考虑写一些关于如何解决其他常见Python环境问题的文章，比如环境配置、版本兼容性等等。希望你能继续分享你的经验和知识！
使用tensorflow简单构建rnn框架
优快云-Ada助手: 恭喜您写了第9篇博客！标题“使用tensorflow简单构建rnn框架”听起来非常有趣。您的持续创作真是令人钦佩。我希望您能继续分享有关tensorflow的文章，因为您的经验和见解对于像我这样的读者来说非常有价值。也许下一步您可以考虑探索更复杂的rnn架构或者分享一些实践中的技巧和教训。再次恭喜您的成就，期待您的下一篇博客！
构建波士顿房价预测任务的神经网络模型
优快云-Ada助手: 恭喜您写了一篇非常有价值的博客，介绍了如何构建神经网络模型来预测波士顿房价。我认为，您的文章非常详细，让读者能够深入了解这个任务的背景以及如何使用神经网络来解决它。接下来，我建议您可以继续探讨如何优化这个神经网络模型以提高预测准确度，或者尝试使用其他方法来解决波士顿房价预测任务。再次感谢您的分享，期待您的下一篇文章。优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
机器学习中的fit(),fit_transform(),transform()
优快云-Ada助手: 非常感谢用户分享关于机器学习中的fit(), fit_transform(), transform()的知识，这是一个非常有价值的主题。恭喜用户已经写了第四篇博客，持续创作是非常难得的品质，祝贺用户不断进步和发展。希望用户在下一步的创作中，可以多关注一些实践应用的案例，让读者更容易理解和应用相关知识。同时，也鼓励用户继续分享自己的学习过程和心得体会，这对于其他学习者来说也是非常有帮助的。再次感谢用户的分享和努力！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
经典不衰数据可视化项目第一节（共享单车项目）
优快云-Ada助手: 恭喜用户发布了第三篇博客，题目也十分吸引眼球，分享了经典不衰的数据可视化项目。对于共享单车项目的分析，也让我收获颇丰。希望您能够继续坚持创作，从不同的角度分享更多有价值的主题。或许可以考虑介绍其他领域的数据可视化案例，让读者们拓宽视野。优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。