自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 关于K-Means应知道的

1. 目标选择合适的质心,使得在每个簇内样本距质心的距离(欧式距离)尽可能小,即簇内样本具有较高的相似性,可以使用最小化簇内误差平方和SSE作为目标函数,也称为簇惯性。2. 过程①从样本中选择K个点作为初始质心;②计算每个样本到各个质心的距离,将样本划分到距离最近的质心所对应的簇中;③计算每个簇内所有样本的均值,并使用该均值更新簇的质心;④重复步骤2、3,直到质心位置变化小于指定阈值或达到最大迭代次数为止。3. 如何确定K值K值枚举过程:《K-means 算法中k 值优化问题研究》在查找最优k

2020-08-17 11:44:26 489

原创 学习总结-四个使用python数据分析案例练习 2020.3

1.流程明确分析目的->由数据源构建指标体系->数据清洗->数据处理及分析->结论2.明确分析目的–>分析问题产生的原因/分析业务现状/通过分析对业务进行指导……目的——是具体的、充满定语的、具有返回值的3.由数据源构建指标体系区分维度和指标:维度:对应数据的每一列,多个列组合也可以认为是一个维度指标:各种统计值在不同维度上得到各种指标根据不同数据...

2020-03-11 23:16:18 707

原创 Python数据分析-电商交易数据分析

#!/usr/bin/env python# coding: utf-8# 明确分析目的:了解2016年交易数据中的商品表现、城市分布、渠道信息、犹豫时间等# 订单总数、销售总额、总下单客户数# 销量在前十名和后十名的商品# 成交额在前十名和后十名的商品# 销量和销售额最后100个的交集# 成交额的区间分布;# 细分价格区间的成交额分布# 不同城市的成交额、销量 取前十名降序排列...

2020-03-11 23:15:08 1151

原创 Python数据分析-google play store的app数据分析

#!/usr/bin/env python# coding: utf-8# 明确分析目的:了解装机app中不同分类安装、评价等信息,为上线新app作指导# 软件分类中APP数量最多的前10个分组;# 安装量最高的前五个分类# 收费软件集中在哪些分类中,头部占比多少# 免费和收费软件各自的评论安装比是多少# 不同app分类下免费/收费软件的平均评分、装机数量级# 哪些分类下软件评论较...

2020-03-11 22:11:49 1100

原创 Python数据分析-北京房价分析

#!/usr/bin/env python# coding: utf-8# 明确分析⽬的:了解北京近年房价情况,为买房作出指导# 各区房源数目、平均面积、均价# 各区房屋总价均值-有/无地铁# 各区-有地铁-是否配有电梯 均价# 2017年 2室1厅1厨1卫户型房屋-有电梯/无电梯-有地铁/无地铁 各区均价# 均价日趋势-统计每⽇所有房源的平均单价# 2017年 总价200~40...

2020-03-11 22:10:16 1414 2

原创 Python数据分析-FIFA2018球员数据分析

#!/usr/bin/env python# coding: utf-8# TI=FIFA2018球员数据分析# 明确分析目的# 运动员数量前十名的国家,以及平均身价# 各大联赛运动员数量,以及球员平均身价# 各俱乐部的平均周薪# 英超联赛English Premier League各个俱乐部球员的平均周薪# 球员年龄分布情况,不同年龄段平均身价分布# 引入使用的库...

2020-03-11 22:09:12 1102

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除