
数据挖掘
或许快要下雪了吧
这个作者很懒,什么都没留下…
展开
-
使用sklearn做特征工程
使用sklearn做特征工程目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 3.1.2 相关系数法 3.1.3 卡方检验 3.1.4 互信息法 3.2 Wrapper原创 2020-07-15 04:19:43 · 288 阅读 · 0 评论 -
笔记整理 信用卡欺诈 干净数据简单操作
#没学会的东西都是沉没成本#不及时复习的后果就是浪费更多的时间1.查看数据特征,一般我们认为欺诈数目是少数import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata=pd.values_counts(data['Class'],sort=True).sort_index()# .sort_index...原创 2020-02-17 06:47:37 · 156 阅读 · 0 评论 -
surprise库使用 电影推荐系统实战
#先把代码放进来,笔记以后再整理#pip install surprise #可能需要c++的配置环境#老师说网上基本上没有什么资源,还是看官网from surprise import KNNBasic,SVDfrom surprise import DataSetfrom surprise import evaluate.print_perfdata= DataSet.loa...原创 2020-01-05 09:07:06 · 574 阅读 · 0 评论 -
音乐系统文件分类 双声道
课程学习来自北风网 个人笔记整理一、基础知识补充try的工作原理是:当开始一个try语句后,python就在当前程序的上下文中作标记,这样当异常出现时就可以回到这里,try子句先执行,接下来会发生什么依赖于执行时是否出现异常。假如在读一个文件的时候,希望在无论异常发生与否的情况下都关闭文件,该怎么做呢?这可以使用finally块来完成。注意,在一个try块下,可以同时使用except从...原创 2020-01-02 06:13:04 · 324 阅读 · 0 评论 -
【放假第7天】K-means 算法 随机中心点
import numpy as npdef loadDataSet(fileName): dataMat=[] fr=open(fileName) for line in fr.readlines(): curL原创 2019-12-20 23:34:37 · 298 阅读 · 0 评论 -
【放假第六天】KNN 文本分类 简单数字文字识别
#仅供自己学习笔记用主要是前面的img2vector是新的知识点,也许基础知识会,能理解,但是自己写真的能卸出来吗returnVect要先预设 然后往里面装 装的时候是分行读的,要怎么写? int有注意到吗import numpy as npimport osfrom com.bjsxt.knn.KNNDateOnHand import classify#就是封装好的包呗def ...原创 2019-12-20 13:26:56 · 194 阅读 · 0 评论 -
京东购买预测
学的就是这个,为存档https://blog.youkuaiyun.com/weixin_44513830/article/details/96511323#_1原创 2019-12-17 13:02:36 · 183 阅读 · 0 评论 -
KNN分类 KNN算法
一、简介https://blog.youkuaiyun.com/sinat_30353259/article/details/80901746#2-1-knn基本流程KNN算法步骤:1)对于未知类别的数据(对象,点),计算已知类别数据集中的点到该点的距离。2)按照距离由小到大排序3)选取与当前点距离最小的K个点4)确定前K个点所在类别出现的概率5)返回当前K个点出现频率最高的类别作为当前点预测分...原创 2019-12-05 01:16:36 · 246 阅读 · 0 评论 -
Matplotlib Kmeans聚类四种方式绘图 以及聚类算法测试数据生成
一、知识点补充1.make_blobs用来生成聚类算法的测试数据。根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可以用于聚类算法的测试效果。二、代码前三个是随机生成的,最后一个是input的数据import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfro...原创 2019-12-04 12:02:12 · 6147 阅读 · 0 评论