- 博客(9)
- 收藏
- 关注
原创 [机器学习]Kmeans聚类算法和性能指标
文章目录一、Kmeans算法及其优缺点1.简单介绍2.K-means的优点与缺点二、性能指标1.选择K值手肘法轮廓系数CH指标sklearn提供的方法2.其他性能指标资料整理一、Kmeans算法及其优缺点跳过算法原理1.简单介绍Kmeans算法是基于划分的聚类算法,其优化目标是同类的点尽量近,类间的点尽量远。需要做的是(1)给定聚类个数K(2)选择K个初始点,可以是随机值,也可以是随机的样本点(3)迭代至终止条件经典K-means算法具体流程,基于贪心策略(1)随机地选择k个初始点,每
2021-12-01 21:22:51
19315
原创 [Pandas]Dataframe赋值
在进行Titanic幸存者预测的过程中,数据预处理涉及到空值填充。我的想法是以Pclass分组,为Age的空值填充随机值x~U(mean-σ,mean+σ)文章目录一、warning二、1.取值赋值2. .loc()一、warning开始是参考其他文章的做法,但情况不一样,那篇文章并没有分组赋值,由于不涉及分组,所以对dataframe赋值时是一整列进行赋值的,而这是pandas官方建议的赋值方法之一import pandas as pdimport numpy as nptrain_d
2021-11-08 16:54:20
10585
原创 [错误合集]Anaconda3安装tensorflow错误
Anaconda3安装tensorflow错误提示版本Anaconda3-4.2.0,python3.5.2,安装tensorflow 1.7.0,依赖numpy 1.13.3错误提示如下Collecting numpy>=1.13.3 (from tensorflow==1.7.0) Using cached https://files.pythonhosted.org/packages/f3/1f/fe9459e39335e7d0e372b5e5dcd60f4381d3d1b42f0b9
2021-06-11 13:41:53
306
3
原创 机器学习——softmax回归多分类算法(Iris数据集)
机器学习——对数几率回归(Iris数据集)一、二、一、二、参考https://blog.youkuaiyun.com/qq_41398808/article/details/90294506https://www.ngui.cc/51cto/show-531289.html
2021-04-03 23:26:41
1825
原创 机器学习——模型评估、样本分组、性能度量(Iris数据集)
机器学习——Iris数据集一、样本分组1.留出法2.交叉验证法3.自助法二、性能度量1.错误率与精度2.查准率、查全率与F1总结第三周的理论课课后作业,对模型进行评估对Iris数据集,分别采用SVM算法的线性核、高斯核函数,数据集划分方法分别采用留出法、10折交叉验证法、自助法(可选),性能度量分别采用计算错误率、精度、第一类的查准率和查全率、F1、ROC绘制(可选)进行实验。以表格形式呈现结果,并适当进行分析讨论。(参考网址:https://www.cnblogs.com/luyaoblog/p/67
2021-03-29 00:53:54
2538
原创 机器学习——sigmoid函数溢出问题
RuntimeWarning: overflow encountered in expdef sigmoid(z):def sigmoid(z): return 1.0 / (1 + np.exp(-z)) 改为def sigmoid(z): #防止溢出 if z >= 0: return 1.0 / (1 + np.exp(-z)) else: return np.exp(z) / (1 + np.exp(z))...
2021-03-29 00:23:23
1055
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人