
数据挖掘
文章平均质量分 57
小k同学!
Don't make fake effort,time will give you the answer.
展开
-
吴恩达深度学习课程第二周编程作业
题目描述给出训练数据集(猫的图片)来让我们搭建一个简单的神经网络识别猫。数据集描述训练集中有209张图片,每张图片的形状为(64, 64,3)测试集中有50张图片,每张图片的形状为(64, 64,3)classes中保存的是以bytes类型保存的两个字符串数据,分别是[b’non-cat’, b’cat’]分类标签为{0,1}。0表示不是猫,1表示是猫数据集下载Github地址:仅供参考(内含完整代码和数据集资源)代码实现构造加载数据集函数再吴恩达的课程中已经给出加载数据集的代码im原创 2021-09-12 09:09:20 · 464 阅读 · 0 评论 -
python数据分析项目实战波士顿房价预测——手写梯度下降法
导入所需要的库import numpy as npimport pandas as pdfrom matplotlib import font_manager as fm, rcParamsimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_split # 用于分割数据集将sklearn中的data数据转换成csvimport pandas as pdfrom sklearn.datas原创 2021-09-06 09:49:06 · 2955 阅读 · 4 评论 -
python数据分析项目实战——波士顿房价预测
概述波士顿房价预测是机器学习、数据分析入门的经典案例。下面我们通过这个案例来一起学习相关内容。数据集描述此数据源于美国某经济学杂志上,分析研究波士顿房的数据集,共有506个样本数据,13个输入特征和1个输出特征。名称说明CRIM城镇人均犯罪率ZN住宅地所占的比例INDUS城镇非住宅地所占比例CHAS是否临近Charies RiverNOX一氧化氮浓度RM屋子的平均房间数AGE1940年之前建成的自住单位的比例DIS距离5个原创 2021-09-03 09:04:52 · 2501 阅读 · 0 评论 -
python数据分析项目实战波士顿房价预测——简单线性回归
前言本篇文章仅仅使用了sklearn中的linear_model来进行预测模型,作为学习机器学习和数据分析的开始。接下来我会更加深入学习,为大家带来更好的文章。导入所需要的库from sklearn.datasets import load_boston # 数据集import pandas as pdfrom pandas import Series, DataFrameimport numpy as npimport matplotlib.pyplot as plt加载数据集和查看数据原创 2021-09-03 09:03:29 · 12960 阅读 · 8 评论 -
用户行为分析的背景以及几种模型分析、实例分析——淘宝用户行为分析
1. 绪论1.1了解用户行为分析随近几年来,大数据不断发展,大数据成为了一个热门的行业,应用在各个领域。用户行为分析就是其中的一个应用方向。随着智能设备的快速发展,人们的生活已经离不开智能设备了。人们花费在智能设备的大部分时间在购物平台上面,而我们在购物平台上浏览信息会产生不同的信息来反应我们的行为。用户行为信息在电商平台十分重要,通过用户行为分析,能够了解用户的情况,比如:他们不同的生活习惯、文化背景、生活位置等等这些信息都会影响他们的行为。那么什么是用户行为分析?用户行为信息指的是在获得网站或原创 2021-08-11 18:02:37 · 10971 阅读 · 2 评论 -
数据预处理-独热编码
独热编码介绍优点举例说明介绍独热编码通常是用来处理稀疏而又散乱的分布空间的数值。其方法是使用N状态寄存器来对N个状态进行编码,每个状态都有独自的寄存器位,在任意时候只有一位有效,只有一位是1,其余的都为0。优点1.能够处理非连续型数值特征。2.在一定程度上也扩充了特征,比如:将性别这个特征经过独热编码后变为男、女这两个特征。举例说明在数字0-9中,6的独热编码为0000001000。也就是说对一个特征进行独热编码的时候,这个特征含有多少个数值,就将其映射到几维的空间里,如:教育等级:小学教育原创 2021-05-16 16:27:42 · 1096 阅读 · 0 评论