
数据分析
一个非常正经的人
这个作者很懒,什么都没留下…
展开
-
数据分析(六)--聚合分组,交叉表,透视表,练习
练习import pandas as pddetail = pd.read_excel('detail.xlsx')print(detail.loc[:,['counts','amounts']].describe())# 按照菜品名分类detail['dishes_name'] = detail['dishes_name'].astype('category')print(de...原创 2019-11-21 22:01:07 · 1828 阅读 · 0 评论 -
数据分析(五)--pandas(文件读写,合成表,增删改查,数据清洗,时间数据处理,统计函数)
一、文件的读写xlsx–工作簿–文件夹sheet–表import pandas as pddetail = pd.read_excel('data/meal_order_detail.xlsx')print(detail.shape) # 默认读取的是sheet1如果想读别的sheet表,使用sheetname参数,指定想要读取的表的索引位置。detail_sheet2 =...原创 2019-11-20 21:58:00 · 1345 阅读 · 0 评论 -
数据分析(四)--项目(手写数字识别),pandas
一、手写数字识别一个手写数字,通过电脑程序做判断,这个数字是什么。技术点:numpy、KNN问题问题1为什么同一个数字要有多个样本?原因:手写数字存在不确定性,每次写的同一个数字都不完全一样,所以需要更多的样本,才能使匹配的结果更准确。问题2文件名的解读?_前为该样本代表的数字,_后为代表相同数字的样本序号。问题3假如每个文件生成一个32*32的矩阵,那么将生成很多个矩阵,后...原创 2019-11-19 20:38:22 · 795 阅读 · 0 评论 -
数据分析(三)--numpy,KNN算法
一、numpy(一)矩阵1.创建矩阵(1)mat()格式1:字符串A = np.mat('1 0 0 0;0 1 0 0;-1 2 1 0;1 1 0 1')print(A)格式2:列表B = np.mat([[1,0,0,0],[0,1,0,0],[-1,2,1,0],[1,1,0,1]])print(B)(2)matrix()同mat()# 格式1:字符串C = ...原创 2019-11-19 20:36:51 · 1177 阅读 · 0 评论 -
数据分析(二)--numpy
numpynumpy的主要对象是同种元素的多维数组。numpy底层是用C语言实现的。面试:数组和列表有什么区别?结构同样都是[元素1,元素2,元素3 … ]。在C语言、java中叫做数组;在python中叫做列表。python中的列表可以存储不同类型的对象;C语言中的数组只能存放相同类型的数据。导包import numpy as np一、numpy介绍numpy是用于数据科...原创 2019-11-19 20:35:48 · 1022 阅读 · 0 评论 -
数据分析(一)--准备
需要准备的学科概率论统计学线性代数高等数学一、统计学1.众数是数据的一种代表数,反映了一组数据的集中程度。往往反映了一种最普通的倾向。例:2,3,-1,2,1,3众数:2,3例:1,2,3,4,5众数:无注意众数可以不唯一,但也可以没有众数在高斯分布中,位于峰值众数也可以用于非数值类的数列当中例:鸡,鸭,鱼,鸡众数:鸡2.中位数就是中值,...原创 2019-11-19 20:32:39 · 644 阅读 · 0 评论