- 博客(5)
- 收藏
- 关注
原创 K近邻算法【python】【sklearn】
K近邻算法(K-Nearest Neighbors, KNN)是一种基于实例的监督学习算法,主要用于分类和回归任务。其核心思想是:在特征空间中,对于待预测的样本,找到与其距离最近的k个已知样本(“邻居”),根据这k个邻居的类别(分类任务)或属性值(回归任务)来决定该样本的预测结果,,常用欧氏距离公式:对于两个 n 维样本点xixi1xi2...xin和xjxj1xj2...xjndxixjk1∑nx。
2025-07-09 15:05:23
1156
原创 用sklearn处理一个未来设备是否会报警的问题【python】【sklearn】【预测】
摘要 针对工厂机台报警预测中的二分类数据不平衡问题,本文提出将其转化为回归问题,通过预测关键参数(如温度)并设置阈值判断是否报警。使用模拟数据生成30天的设备运行数据,包含温度、振动等参数。通过特征工程提取时间窗口特征、趋势特征等,构建GBDT回归模型预测未来30分钟的温度值。实验结果表明,该方法有效避免了报警数据稀缺导致的模型偏差问题,实现了对设备超温风险的准确预测。
2025-07-05 16:39:44
684
原创 解决pyecharts在jupyter notebook无法显示图表问题【jupyter notebook】【python】【pyecharts】
本文记录了解决pyecharts在Jupyter Notebook中无法显示图表的问题过程。尝试了升级Jupyter版本、切换国内JS地址和使用离线模式均未成功,最终通过生成内联HTML的方式解决了问题(使用render_embed()方法)。虽然该方法有效,但作者建议根据具体情况选择解决方案,并欢迎分享更多解决方法。问题表现为图表本地可显示但在Notebook中空白,解决方案代码示例已提供。(149字)
2025-07-03 22:13:51
1097
原创 线型回归【python】
线性回归是一种监督学习方法,用于建立自变量与因变量之间的线性关系模型。文章介绍了从一元到多元线性回归的实现方法,包括使用sklearn和statsmodels库进行建模、评估和可视化。一元线性回归涵盖了一次和多次回归的实现,多元回归则处理多维特征数据。模型评估重点介绍了R-Squared指标的计算方法,可通过statsmodels、sklearn或手动计算三种方式实现。文中还展示了如何获取模型系数和截距,以及如何通过可视化验证回归效果。完整的代码示例演示了从数据准备到模型评估的全流程。
2025-07-02 17:04:05
1244
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅