首先解决下第一篇博客中遗留的小问题:
“打印结果时,由于行数太多,中间省略号的数据如何让查看?”
pandas.set_option() 可以设置pandas相关的参数,从而改变默认参数。 打印pandas数据时,默认是输出100行,多的话会输出…省略号。
可加入下面的代码解决
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#显示宽度是无限
pd.set_option('display.width'
二手车交易:特征工程实践与异常值处理

本文探讨了二手车交易价格预测中特征工程的重要性,包括异常值处理(如删除异常值)、数据分桶、特征构造(如时间特征、统计量特征、地理信息编码)和特征筛选(过滤式、包裹式、嵌入式)。文中举例说明了如何删除异常值,以及特征分桶的动机,强调了特征离散化对模型稳定性和表达能力的提升。
最低0.47元/天 解锁文章
393

被折叠的 条评论
为什么被折叠?



