数据挖掘
User_West
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用pandas sns绘图
链接:https://blog.youkuaiyun.com/sinat_29957455/article/details/79243377转载 2019-10-28 23:03:57 · 715 阅读 · 0 评论 -
K-means与K-means++
K-means++: 初始质心选取的基本思路就是,初始的聚类中心之间的相互距离要尽可能的远。很容易可以想到,虽然初始值的选取麻烦了点,但是收敛速度将会极大提高。...原创 2019-10-20 20:09:40 · 170 阅读 · 0 评论 -
anaconda & jupter
保姆式教程:https://blog.youkuaiyun.com/m0_37438418/article/details/80620190 https://blog.youkuaiyun.com/LaputaFallen/article/details/78918865(kaggle上面的中文翻译,非常全面)波士顿房价预测:https://blog.youkuaiyun.com/hu...原创 2019-10-18 21:56:37 · 244 阅读 · 0 评论 -
python找不到pandas.tools.plotting
改为:from pandas.plotting import scatter_matrix原创 2019-10-18 20:32:23 · 605 阅读 · 0 评论 -
K-Means聚类算法 K-D树原理
10.14日志聚类:事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。属于无监督学习。论文里的应用情况:K-means算法如何自动确定聚类数目K:这里师兄写的那个自循环找出K很迷啊kd树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。https://bl...原创 2019-10-14 22:29:20 · 1567 阅读 · 0 评论 -
PM2.5数据分析 matplotlib基础学习
10.12学习日志pandas里面的Periodndex方法,resample方法,matplotlib基础PeriodIndex:这个方法得到一个时间段,把分开的时间字符串通过这个方法转化为pandas的时间类型period=pd.PeriodIndex(year=df["year],month=df=["month"],day=df.[[day"])df.["datet...原创 2019-10-12 22:17:54 · 423 阅读 · 0 评论 -
PCA降维 学习日志
10.10 上午上完数据分析,只学到了PCA在学习PCA算法之前需要知道奇异值分解(SVD)SVD就是用来寻找到一个标准化正交基(orthonormalmatrix)P我们最终的目标是是Cy=1/n(YY转置)是一个对角阵(diag),达到冗余最小,方差最大目的example总结一下,PCA算法的基本思路是:PCA算法总结一下PCA的算法步骤:...原创 2019-10-10 11:21:54 · 342 阅读 · 0 评论 -
数据挖掘 学习日志
主要知道每一个函数的返回值是什么set是一个无序不重复的序列tolist列表里面套列表 temp_list = df["Genre"].str.split(",").tolist() #[[],[],[]]疑惑:这个循环不太懂genre_list = list(set([i for j in temp_list for i in j]))#用双重循环来获...原创 2019-10-10 22:01:39 · 364 阅读 · 0 评论
分享