自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据处理的一些基础导包

1. sklearn.manifold 1.1 TSNE降维算法 from sklearn.manifold import TSNE TSNE(random_state=0).fit_transform(data) 2. sklearn.metrics 2.1 计算轮廓系数 silhouette_score from sklearn.metrics import silhouette_score labels = KMeans(n_clusters=2,random_state=0).fit_predi

2020-05-08 17:41:12 571

原创 K-means、K-means++、ISODATA

一、K-means K-means算法最开始随机选取数据集中K个点作为聚类中心,即使相同的K值,分类结果会也受到初始点的选取而有所区别。人工指定比较合理的K值,通过多次随机初始化聚类中心选取比较满意的结果。 二、K-means++ K-means++按照如下的思想选取K个聚类中心: 假设已经选取了n个初始聚类中心(0<n<K),则在选取第n+1个聚类中心时:距离当前n个聚类中心越远的...

2020-05-08 17:28:17 811

原创 时间轴处理的一些想法

第一种,转换时间戳,然后加减的 # datetime对象转换成时间字符串 datetime_str = datetime.strftime(datetime.now(), '%Y-%m-%d %H:%M:%S') print(datetime_str) # datetime对象转换成时间戳 datetime_stamp = datetime.timestamp(datetime.now()) ...

2020-05-06 20:28:15 409

原创 使用sklearn进行数据挖掘

1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样...

2020-05-05 22:42:35 351

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除