
机器学习
趣谈数据分析
3年数据分析经验,现任上市公司高级数据分析师,公众号「趣谈数据分析」
展开
-
机器学习中常见的知识点
matplotlib1、plt.legend显示图例,loc设置图例显示位置,‘best’ : 0, (only implemented for axes legends)(自适应方式)‘upper right’ : 1,‘upper left’ : 2,‘lower left’ : 3,‘lower right’ : 4,‘right’ ...原创 2018-11-18 14:53:54 · 248 阅读 · 0 评论 -
K-NN(k近邻算法)基础
对于二维数据集,可以画出所有可能的测试点的预测结果,根据平面中每个点所属的类别,对平面进行着色,这样可以查看决策边界。即算法对类别0和类别1的分界线:用下面的代码分别将1、3、9个邻居三种情况的决策边界可视化:import mglearn.plotsimport mglearn.datasetsimport matplotlib.pyplot as pltfrom sklearn.m...原创 2018-12-02 19:32:53 · 340 阅读 · 0 评论 -
使用线性回归预测pm2.5的浓度
今天做了一个小任务,使用回归分析预测北京pm2.5的浓度。import timeimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegression # 用于线性回归 from sklearn.model_selecti...原创 2019-02-15 16:39:46 · 6318 阅读 · 2 评论 -
使用Python聚类算法,实现RFM客户分群,进行精准营销!
import pandas as pdimport numpy as npfrom sklearn.cluster import KMeansimport matplotlib.pyplot as pltdf = pd.read_csv(r'D:\project\RFM\rfm\kate_rfm.csv', encoding='gbk')column_list = list(df.co...原创 2019-04-12 11:27:36 · 3136 阅读 · 0 评论