数据分析
文章平均质量分 67
学海无涯 保持热度
Stannis
小白
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
某服务器数据清洗和简单分析
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf = pd.read_csv('log.txt',sep='\t',header=None)df.head() 0 1 2 3 4 5 6 7 8 0 201原创 2022-03-01 15:31:45 · 418 阅读 · 0 评论 -
北京某平台二手房分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 解决中⽂显示问题# plt.rcParams['font.sans-serif'] = [u'SimHei']# plt.rcParams['axes.unicode_minus'] = Falsedf = pd.read_csv('二手房数据.csv',encoding='gb18030')df.head原创 2022-02-28 17:11:03 · 726 阅读 · 0 评论 -
tableau基本图形绘制--以自带超市数据为例
1、条形图将【发货日期】拖到筛选器,选择【年/月】,选择【2021年12月】,将【销售额】和【省/自治区】拖到行列,选择【升序】或者【降序】,并且可以选择【水平条形图】或者垂直条形图,然后将【类别】拖到颜色,并进行排序。2、直方图字段【年龄】创建数据桶,并设置数据桶名称和数据桶大小,将生成的新字段和【客户(计数)】拖到行列,生成图表,并更改坐标名称。3、饼图【标记】选择【饼图】,将【区域】拖到颜色,【销售额】拖到角度,【区域】、【销售额】拖到标签,并对销售额进行【快速表计算】原创 2022-01-05 17:56:15 · 5738 阅读 · 0 评论 -
Pandas实用小功能
Pandas实用小功能import pandas as pdimport numpy as np1、读取时抽样百分比data = pd.read_csv(r'..\test.csv',encoding='utf-8', skiprows = lambda x: x>0 and np.random.rand() > 0.5)data.head() PassengerId Pclass原创 2021-12-22 17:31:17 · 483 阅读 · 0 评论 -
数据看板--日报、周报、月报
一、数据预览二、效果图预览三、新增字段1、周数WEEKNUM(B2,2)2、月份MONTH(B2)备注:B2为日期列四、看板制作过程1、控件控件范围从1到364,用于控制每天的日期2、通过控件确定当前日期当天日期=基准数字+表单控件当前值星期几=TEXT(当天日期,“aaaa”)3、计算当天销售额和订单数SUMIFS(数据!$F:$F,数据!$B:$B,日报思路!$G$2)COUNTIF(数据!$B:$B,日报思路!$G$2)--$G$2代表当天日期4、计原创 2021-12-13 16:59:42 · 4588 阅读 · 0 评论 -
简易数据看板--直播订单统计分析
一、成果预览1、Excel效果2、tableau效果二、数据源预览三、具体步骤1、Excel数据验证,设置下拉选项内容按月份计算产品订单数量、产品销售金额,用到sumifs函数SUMIFS(直播订单明细表!$H:$H,直播订单明细表!$C:$C,日报看板!$B$7,直播订单明细表!$F:$F,G$1)按类别统计SUMIFS(直播订单明细表!$H:$H,直播订单明细表!$E:$E,$C23,直播订单明细表!$C:$C,日报看板!$B$7)根据计算结果生原创 2021-12-01 17:04:25 · 1546 阅读 · 0 评论 -
Excel用控件动态控制图表
一、表数据预览二、结果展示说明: 选择【年份】和【产品】,曲线图和表格数据进行相应的变化。三、具体步骤1、列出【产品】、【年份】列表2、插入控件【开发工具】–【表单控件】–【组合框】控件格式设置,选择年份列表作为数据区域,并选择任意空白单元格作为单元格连接同理处理产品列获取组合框选中的【产品】、【年份】,使用index()函数,如:=INDEX($O$7:$O$10,$N$7)$O$7:$O$10--待选数据区域$N$7--单元格链接取的单元格组原创 2021-11-23 15:15:01 · 3800 阅读 · 0 评论 -
Excel数据透视表、数据透视图
1、插入–>数据透视表,拖拽字段到行、列、值2、将数据源变为表格(CTRL+T),然后再插入透视数据表,这样透视表就可以随着数据源的改变而改变3、鼠标双击会直接生产明细sheet页4、分析-插入切片器 ,实现图表联动第九章...原创 2021-11-15 21:31:30 · 757 阅读 · 0 评论 -
Excel常见操作之根据表头自动更新数据表
一、数据部分预览二、结果三、执行步骤1、选择器设置数据–》数据验证2、计算–sumifs()函数=SUMIFS($H:$H,$D:$D,$K15,$E:$E,L$14,$G:$G,$K$14)3、结果原创 2021-11-15 14:31:29 · 1856 阅读 · 0 评论 -
KNN算法
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltx_data = np.array([[118,20],[20,56],[99,78],[56,34],[90,10],[88,45]])x_dataarray([[118, 20], [ 20, 56], [ 99, 78], [ 56, 34], [ 90, 10], [ 88原创 2021-10-26 21:46:51 · 199 阅读 · 0 评论 -
seaborn绘图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('E:/python/Python数据分析与挖掘从零开始到实战/数据分析篇/学习笔记/数据/air_data.csv')df.head() MEMBER_NO FFP_DATE FIRST_FLIGHT_DATE原创 2021-10-25 17:13:05 · 2181 阅读 · 0 评论 -
matplotlib绘图
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 解决中⽂显示问题plt.rcParams['font.sans-serif'] = [u'SimHei']plt.rcParams['axes.unicode_minus'] = False# 等差数列x = np.linspace(0,10,100)y1 = np.sin(x)y2 = np.cos(x)plt.plot(x,y,ls=,l原创 2021-10-22 17:43:47 · 679 阅读 · 0 评论 -
numpy笔记
import numpy as np一、创建数组data = np.array([1,2,3,4,5,6])dataarray([1, 2, 3, 4, 5, 6])type(data)numpy.ndarraydata = np.array([[1,2,3],[4,5,6],[7,8,9]])dataarray([[1, 2, 3], [4, 5, 6], [7, 8, 9]])data = np.arange(0,20,2)data原创 2021-10-21 15:40:31 · 335 阅读 · 0 评论 -
numpy常见操作汇总
numpy常见操作汇总本质是多维数组import numpy as np# numpy版本np.__version__'1.21.2'python listlist1 = list(range(10))list1[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]list1[5]='hello list'list1[0, 1, 2, 3, 4, 'hello list', 6, 7, 8, 9]arrayimport arrayarr1 = arra原创 2021-10-21 15:37:55 · 280 阅读 · 0 评论 -
数据分析之漏斗模型
很早之前就知道漏斗模型,但没有做更多的了解和运用,后来对漏斗模型的了解稍加深入之后,觉得它不仅仅是一个模型,更是一种可以普遍适用的方法论,或者说是一种思维方式。本文主要谈谈漏斗模型的本质、漏斗模型案例分析以及如何绘制漏斗模型。漏斗模型关于漏斗模型,我认为本质是分解和量化。为什么这么说,这里以营销漏斗模型举栗。百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化模型。营销漏斗模型的价值在于量化了营销过程各个环节的效率,帮助找到薄弱环节。也就是说营销的环节指的是从获取用户到转载 2021-02-25 17:01:57 · 1921 阅读 · 0 评论 -
matplotlib绘图基础
matplotlib基础绘图使用matplotlib绘制折线图、散点图、柱状图、饼图、直方图、箱线图、曲面图散点图arr1 = np.random.uniform(0.0,5.0,size=(100,2))arr2 = np.random.uniform(4.0,5.0,size=(100,2))plt.scatter(x[:,0],x[:,1])plt.scatter(y[:,0],y[:,1])plt.show()x = [1,2,3,4,5]y = [1,4,9,16,25]pl原创 2020-08-04 16:58:58 · 609 阅读 · 0 评论
分享