
数据挖掘学习笔记
lazy_wzyuan
一个想靠近大数据的小萌新。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python数据挖掘入门与实践学习笔记(一)
Python数据挖掘入门与实践学习笔记(一) 基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集合源码可以去图灵社区下载。 一、亲和性分析 1、数据集分析 1)首先,亲和性分析就是根据个体间的相似度,确定他们之间的亲密度。 2)原数据集的维度为(100,5),这五列分别代表了面包、牛奶、奶酪、苹果和香蕉。 行代表的是个体,列代表的是特征。用一段代码分析该数据集。 import nu...原创 2019-07-16 22:39:24 · 546 阅读 · 0 评论 -
Python数据挖掘入门与实践学习笔记(二)
第二章 用scikit-learn估计器分类 基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。 一、scikit-learn 估计器 scikit-learn把分类、聚类、回归分析等功能封装成估计器。 估计器主要包括以下两个函数: fit(): 训练算法,设置内部参数。主要接收训练集,及其类别两个参数。 predict(): 参数为测试集。预测测试集类别...原创 2019-07-17 16:28:58 · 384 阅读 · 0 评论 -
Python数据挖掘入门与实践(四)之Apriori算法推荐电影
第四章 用亲和性分析方法推荐电影 基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。 一、Apriori算法 数据挖掘十大算法之Apriori详解 Apriori算法是一种用于关联规则挖掘(Association rule mining)的代表性算法,关联规则挖掘是数据挖掘中的一个非常重要的研究方向,也是一个由来已久的话题,它的主要任务就是设法发现事物之间...原创 2019-07-19 20:31:40 · 4606 阅读 · 2 评论 -
Python数据挖掘入门与实践(三)之用决策树预测获胜球队
第3章:用决策树预测获胜球队 基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。 一、关于数据集 根据书中的事例,使用NBA2013-2014赛季的比赛数据。 https://www.basketball-reference.com/leagues/NBA_2014_games.html 按照书中的方式已经下载不到数据了,因为原网站已经做了改版。因此,本人...原创 2019-07-17 21:16:29 · 3225 阅读 · 1 评论