
数据分析课件代码
return_min
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
day08课件代码
01-案例:航空用户聚类案例.py"""目标: 对用户进行聚类 对聚类后的用户评估其价值 对不同价值的客户实行不同营销策略客户价值: 收入来源于20%的顶端客户 90%收入来自于现有客户 大量资金被投入拓展用户上面了解航空公司的现状 行业内存在竞争 行业间存在竞争 2012-03-31 ---2014-3-31...原创 2020-01-15 14:35:23 · 281 阅读 · 0 评论 -
day07课件代码(下)
04-sklearn算法实现聚类import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansdef build_data(): """ 加载数据 :return:data """ # 加载.txt文件 # python ---wi...原创 2020-01-15 14:32:38 · 234 阅读 · 0 评论 -
day07-means算法(上)
day07-k_means算法自实现01-数据转化import pandas as pdimport numpy as np# 将非数值型类别型数据转化为数值型# 哑变量转化---将数据转化为哑变量矩阵# 加载数据data = pd.read_excel('./meal_order_detail.xlsx')# print('data:\n',data)# print('da...原创 2020-01-14 16:18:27 · 351 阅读 · 0 评论 -
day06
01-合并数据import pandas as pd"""import numpy as npnumpy 合并数组np.hstack() # 水平合并np.vstack() # 垂直合并np.concatenate() # 行的方向 axis = 0np.concatenate() # 列的方向 axis = 1""" # # 获取df数据# df1 = pd.read...原创 2020-01-13 21:52:55 · 859 阅读 · 1 评论 -
day06-pandas高阶 课件代码下午
03-缺失值检测与处理import pandas as pdimport numpy as np# 加载数据data = pd.read_excel("./qs.xlsx")print('data:\n', data)print('data的列索引:\n', data.columns)# 检测缺失值# isnull + sumres_null = pd.isnull(d...原创 2020-01-13 19:19:30 · 172 阅读 · 0 评论 -
day06-pandas高阶 课件代码上午
01-数据合并import pandas as pd"""import numpy as npnumpy 合并数组np.hstack() # 水平合并np.vstack() # 垂直合并np.concatenate() # 行的方向 axis = 0np.concatenate() # 列的方向 axis = 1"""# # 获取df数据# df1 = pd.rea...原创 2020-01-13 11:31:11 · 209 阅读 · 0 评论 -
day05-pandas进阶 课件代码
01作业:多个箱线图绘制案例import matplotlib.pyplot as pltimport numpy as np# 构建数据def build_data(): """ 构建数据 :return: 数据 """ # 加载数据 --返回对象 res = np.load("./国民经济核算季度数据.npz", allow_pi...原创 2020-01-10 21:00:53 · 264 阅读 · 0 评论 -
dataframe的一些操作
09-dataframe的修改操作import pandas as pd# 加载数据data = pd.read_excel("./users.xlsx")print('data:\n', data)print('data 的列索引;\n', data.columns)# 将age 修改18岁# data.loc[:, 'age'] = 18# 将sex 为 男 全部...原创 2020-01-09 20:59:07 · 490 阅读 · 0 评论 -
pandas的认识与dataframe的认识 day04课件代码
01-作业:多个柱状图的绘制案例import matplotlib.pyplot as pltimport numpy as npdef build_data(): """ 构建数据 :return:数据 """ res = np.load("./国民经济核算季度数据.npz") columns = res["columns"] ...原创 2020-01-09 16:17:46 · 218 阅读 · 0 评论 -
day03课件代码(下午)
06-案例:国民生产总值折线图案例import numpy as npimport matplotlib.pyplot as pltdef build_data(): """ 加载数据 :return:columns, values """ res = np.load("./国民经济核算季度数据.npz") # for tmp in ...原创 2020-01-08 19:12:53 · 153 阅读 · 0 评论 -
基础笔记1 补充
认识数据认识数据1.数据1.1.数据对象1.2.数据集1.2.1.多个数据对象的集合1.2.2.行代表着不同的样本,列代表着不同特征1.3.数据的属性1.3.1.标称属性其值是一些符号或者事物的名称如头发的颜色,如人的姓名1.3.2.二元属性特殊的标称属性• 只有两种结果的标称属性对称的二元属性• 两种结果重要性一样• 如:男女非对称的二元属性• ...原创 2020-01-08 19:06:22 · 137 阅读 · 0 评论 -
day03课件代码(上午)
01-数组的重复与去重import numpy as np# 创建数组# arr = np.array([9, 9, 9, 8, 8, 7, 6, 5, 7, 6, 5, 1, 2, 1, 2])# 对数组进行去重# unique# 1、去重# 2、排序# 注意:unique排序效果 对中文数组不太适用# arr= np.unique(arr)# print("数组去重的...原创 2020-01-08 11:25:50 · 169 阅读 · 0 评论 -
数据分析课件代码 day2
01-数组的类型及形状import numpy as np# 创建一个数组# arr = np.array([1, 2, 3, 4], dtype=np.float32)# print("arr:\n", arr)# print("arr 的元素类型:\n", arr.dtype)# numpy里面数据类型# numpy里面的数据类型,其实就是封装了Python里面基础的数据...原创 2020-01-07 17:22:06 · 167 阅读 · 0 评论 -
课件代码 day1
01- numpy初识"""numpy ---科学计算库结构核心: ndarray对象: 存储多维数组 单一数据类型 内存是连续的 两种存储风格: C风格 ---C语言风格----按行优先存储 F风格 ---fortran语言风格 ----按列优先存储"""02-数组的属性impo...原创 2020-01-07 14:25:17 · 169 阅读 · 0 评论