- 博客(15)
- 收藏
- 关注
原创 决策树CART算法理论基础及python实现
最近看完了李航老师的《统计学习方法》中第五章的决策树,结合书中理论和python代码实践,总结及积累一下知识。
2025-04-03 15:32:17
756
原创 python 数据清洗常用函数(一)
在进行数据分析时,首先需要对数据进行清洗、转换,涉及到对值的排序、替换、删除;数据表的合并等处理,以下整理我常用的12个函数,记录一下
2025-03-28 16:07:50
659
原创 python办公自动化:openpyxl 处理Excel
在批量处理数据时,能用Excel实现的一些表样式在python ,openpyxl处理Excel时最近也用到了,记录一下
2025-03-07 17:14:44
237
原创 python实现将数据存入、读取多个sheet
在Python中,使用pandas和openpyxl处理数据,涉及到写入多个sheet。在每个sheet且不会覆盖原有的sheet数据;读取一个Excel里多个sheet里的数据。总结一下踩过的坑。
2025-03-05 10:52:55
218
原创 《统计学习方法》之主成分分析PCA结合python实现
最近在学习李航老师的《统计学习方法》第16章-主成分分析(PCA),结合运用python代码实现,记录一下。
2025-01-03 16:01:28
687
原创 python实现SVM决策边界可视化、不同核方法及超参调优、模型性能评估和SHAP可解释性案例。
关于支持向量机,最近有看李航老师的《统计学习方法》,总结一下关于支持向量机相关算法知识以及代码。
2024-12-30 12:47:22
962
原创 机器学习模型的可解释性探索
怎么选择以及训练出一个另人满意的机器学习模型是一直被研究探索的问题,然后当越来越多的模型可以经训练最后做出较为精准的预测,我们的用户是否愿意相信这样的结果?或我们有什么方法可以去说服我们的用户对模型的结果产生信任。因此,就一个高精度的模型,建立信任和确保它按照预期行事至关重要。为了实现搭建用户信任与高精度模型之间内在联系这一目标,通过学习和参考其他优秀文章,本文也介绍并总结几种模型解释算法。
2024-11-21 18:18:36
839
原创 Python模型优化超参寻优过程
以Python自带数据集鸢尾花为例,记录一下在对模型进行超参训练时,如何清晰的记录每组超参数训练模型及其对应得分。
2024-08-06 15:34:22
719
原创 Python爬取生意社-氧化钙生石灰数据
目前爬的都是一些不需要代理或解密就可以爬到的,个人感觉难点就是提取解析文本信息,本次新使用到的是find_next_sibling,其他具体问题还得查找对应的解决方案。关于bs4如何提取文本信息可以参考这个解析库bs4及爬取实例,个人感觉比较好。总之,遇到问题不可怕,可怕的是不会主动去解决问题。
2024-06-07 09:48:56
454
原创 数值型变量的简单相关性分析python应用
相关性,是指两个变量的关联程度。一般地,从散点图上可以观察到两个变量有以下三种关系之一:两变量正相关、负相关、不相关。如果一个变量高的值对应于另一个变量高的值,相似地,低的值对应低的值,那么这两个变量正相关。在土壤中,孔隙率和渗透度就具有典型的正相关。反之,如果一个变量高的值对应于另一个变量低的值,那么这两个变量负相关。如果两个变量间没有关系,即一个变量的变化对另一变量没有明显影响,那么这两个变量不相关。https://baike.baidu.com/item/相关性/10097225?fr=ge_ala。
2024-03-13 19:56:04
1644
原创 python折线图实际应用
第一篇博客,以我的真实数据总结一下2020年!前言今年是很值得记录的一年,上半年在家大半年,由于自律运动锻炼体重下降到了史上最低值,自返校后,我就尽量每天晚上记录体重,年末,我就用体重值和自己的学的数据分析技能简单的做了份总结。一、数据解释真正开始有意识的坚持记录体重是从2020-9-22日开始,我记录的每天晚上上床前的体重,(个人觉得晚上因为体重最重,也最能让人有忧患保持的觉悟,哈哈哈),截止到2020-12-28日,应该共97个数据,实际记录85个,12.26-12.28的3个数据是自己先行预测
2020-12-26 20:30:13
199
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人