
数据分析项目练手
韩立 •
这个作者很懒,什么都没留下…
展开
-
数据透视表——pivot_table学习(特征工程)
比如:华山三个,数量4/3,价格6000/3,账号就不用说了,三个都一样,均值自然就是其中一个;快手两个,数量4/2,价格6000/2。2:index 指定单索引\n索引变成了[客户名称]这一列,values显示的只有数字,而且都处理成均值。补充:当 values,aggfunc,columns 的取值只有一个时,有无中括号效果略有不同。3:指定多索引 索引顺序能决定不同的视觉体验,虽然结果是一致的。如果不需要显示全部的数值列,可以用Values参数指定。数值类型的字段只有:账号,数量,价格。原创 2022-10-09 23:44:10 · 651 阅读 · 0 评论 -
朝阳药品数据分析案例
输入:timeColSer 销售时间这一列,Series数据类型,例‘2018-01-01 星期五’输出:分割后的时间,返回Series数据类型,例‘2018-01-01’转换日期过程中不符合日期格式的数值会被转换为空值。其中,商品编码就是商品名称 这两列数据重复。将'销售数量'这一列小于0的数据排除掉。以下可知购药时间和社保卡号存在缺失值。定义函数:分割销售日期,提取销售日期。销售时间转换后有23个null。数据类型转换:字符串转换为日期。删除含有NaT的空行。原创 2022-09-20 03:17:36 · 451 阅读 · 0 评论 -
泰坦尼克号数据之生还率分析
1 首先统计总的死亡人数和幸存人数对比 (柱状图和饼图) 2 船舱等级因素对幸存的影响a 首先获得各船舱人数 (船舱等级为1,2,3(数字越小,档次越高))原创 2022-06-20 21:46:12 · 1676 阅读 · 0 评论 -
python数据分析之药品数据分析
输入timeColSer销售时间这一列,Series数据类型,例‘2018-01-01星期五’输出分割后的时间,返回Series数据类型,例‘2018-01-01’统计月均消费次数(同一天一个人的所有消费算作一次消费)转换日期过程中不符合日期格式的数值会被转换为空值。其中,商品编码就是商品名称这两列数据重复。将'销售数量'这一列小于0的数据排除掉。以下可知购药时间和社保卡号存在缺失值。定义函数分割销售日期,提取销售日期。销售时间转换后有23个null。数据类型转换字符串转换为日期。......原创 2022-07-14 22:05:24 · 2263 阅读 · 0 评论 -
python数据分析案例之(MYSQL导入)餐饮数据分析
案例主要用来熟悉pandas库和与mysql的连接知识1首先建立连接 导入MySQL中的数据 代码如下 2将我们需要分析的列的数据 对列重命名改成中文名 打印结果(中文名字就是我们要分析的数据列) 计算收入打印结果如下 查看下单时间这一列结果 获取八月的天数量度和星期量度 打印结果 weekday_name为订单所处在星期几,0代表星期一,以此类推 计算最小销售额的日期为16日 最小销售额为4447 销售额随时间天数日期变化的可视化表原创 2022-07-07 11:22:17 · 777 阅读 · 0 评论