- 博客(24)
- 收藏
- 关注
原创 机器学习入门:决策树的欠拟合与过拟合
本文介绍了如何优化决策树模型,避免欠拟合和过拟合问题。通过调整max_leaf_nodes参数控制模型复杂度,演示了从数据准备到模型评估的全过程。文章提供了两种参数搜索方法(显式循环和字典推导式),展示了不同参数下的性能比较,并解释了偏差-方差权衡原理。最终指导读者如何确定最佳参数、训练最终模型,并给出了其他可调参数的建议。
2025-07-01 11:26:02
489
原创 python 字符串
特点不可变序列Unicode 编码丰富的内置方法多种创建和格式化方式常见操作创建:使用引号(单引号、双引号、三引号)访问:通过索引和切片格式化:f-strings、str.format()、%运算符修改:通过方法创建新字符串(upper、lower、replace等)性能最佳实践使用join()而不是+=连接多个字符串适当时使用字符串方法而非正则表达式在必要时考虑字符串驻留高级应用正则表达式搜索和替换模板字符串多语言编码处理。
2025-03-12 09:13:38
1082
原创 python 列表
特点有序集合可变(可添加、修改、删除元素)可以包含不同类型的元素支持索引和切片操作允许重复元素常见用途存储和操作序列数据实现栈和队列作为缓存或临时存储数据处理和转换性能考虑列表适合频繁添加/删除末尾元素不适合频繁插入/删除中间元素不适合频繁成员检查(对于大型列表考虑使用集合)列表推导式通常比等效的for循环更高效。
2025-03-12 09:09:29
813
原创 XGBoost原理及其应用
XGBoost 作为一种强大的集成学习算法,在许多领域展现出卓越的性能。它通过梯度提升框架、正则化技术和计算优化,成功解决了各种复杂的预测问题。虽然 XGBoost 功能强大,但在实际应用中需要注意合理调参以避免过拟合,并根据具体问题和数据特点选择合适的模型配置。
2025-03-10 15:35:07
1234
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人