
数据分析与人工智能
文章平均质量分 76
你隔壁的小王
专注于数据分析,是要成为数据大咖的男人!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一文看懂阿里云端数据库配置+Navicat premium安装
这篇文章详细的介绍了如何配置阿里云云端数据库,大家感兴趣的可以查看,并且配了Navicat premium安装详解(需要软件也可以练习博主),博主也安装和配置了DataGrip,DataGrip只要试用30天,最主要的是配置起来超级麻烦,要改很多东西,大家如果有问题也可以问我原创 2022-01-12 23:04:55 · 811 阅读 · 0 评论 -
Python-机器学习(三)-KMeans聚类算法
算法原理K-means算法是最常用的一种聚类算法。算法的输入为一个样本集(或者称为点集),通过该算法可以将样本进行聚类,具有相似特征的样本聚为一类。针对每个点,计算这个点距离所有中心点最近的那个中心点,然后将这个点归为这个中心点代表的簇。一次迭代结束之后,针对每个簇类,重新计算中心点,然后针对每个点,重新寻找距离自己最近的中心点。如此循环,直到前后两次迭代的簇类没有变化。假设第一个图作为我们的原始数据集,设K=2,在图上随机选择两个K类所对应的类别质心,级途中的红色和蓝色的叉,计算样本中所有的点到这两原创 2022-01-10 20:01:48 · 10150 阅读 · 23 评论 -
Python-机器学习(一)-线性回归
线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量),线性回归通常可以应用在股价预测、营收预测、广告效果预测、销售业绩预测当中。如我们现在有10行2列数据,第一列是身高,第二列是体重,通常做法:将原始数据切分时,将原始数据的80%作为训练数据来训练模型,另外20%作为测试数据,通过测试数据直接判断模型的效果,在模型进入真实环境前不断改进模型原创 2022-01-09 14:54:13 · 2868 阅读 · 16 评论 -
Python-机器学习(二)-K近邻算法的原理与鸢尾花数据集实现详解
该算法的核心思想:不标记样本的类别,由距离其最近的K个邻居投票来决定,所以K值的选择比较关键该算法的原理:计算待标记的数据样本和数据集中每个样本的距离,取距离最近的k个样本。待标记的数据样本所属的类别,就由这k个距离最近的样本投票产生。但在实际运用中,我们应该如何判断K的取值那?原创 2022-01-09 18:58:58 · 3829 阅读 · 33 评论