- 博客(4)
- 收藏
- 关注
原创 数据处理的一些基础导包
1. sklearn.manifold1.1 TSNE降维算法from sklearn.manifold import TSNETSNE(random_state=0).fit_transform(data)2. sklearn.metrics2.1 计算轮廓系数 silhouette_scorefrom sklearn.metrics import silhouette_scorelabels = KMeans(n_clusters=2,random_state=0).fit_predi
2020-05-08 17:41:12
563
原创 K-means、K-means++、ISODATA
一、K-meansK-means算法最开始随机选取数据集中K个点作为聚类中心,即使相同的K值,分类结果会也受到初始点的选取而有所区别。人工指定比较合理的K值,通过多次随机初始化聚类中心选取比较满意的结果。二、K-means++K-means++按照如下的思想选取K个聚类中心:假设已经选取了n个初始聚类中心(0<n<K),则在选取第n+1个聚类中心时:距离当前n个聚类中心越远的...
2020-05-08 17:28:17
786
原创 时间轴处理的一些想法
第一种,转换时间戳,然后加减的# datetime对象转换成时间字符串datetime_str = datetime.strftime(datetime.now(), '%Y-%m-%d %H:%M:%S')print(datetime_str) # datetime对象转换成时间戳datetime_stamp = datetime.timestamp(datetime.now())...
2020-05-06 20:28:15
400
原创 使用sklearn进行数据挖掘
1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样...
2020-05-05 22:42:35
342
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人