- 博客(12)
- 收藏
- 关注
原创 数据处理步骤
一 数据获取:数据库或数据仓库问卷数据 :csv(数据量比excel大) txt excel合作数据 (第三方购买数据):注意数据来源二 数据探索(EDA探索性数据分析)1.数据观测:形状() 数据类型(不合适的类型要转换或映射) 观测有无重复值(分情况选择 不管或 删除) 空缺值(空缺率过大选择删除,或填充:经验法----前后填充;统计法----均值 中位数 众数 最大值 最小值 其他分位数),挖掘法:分类 回归) 异常值(过大或过小,不符合现实。修改为99%数据,
2021-08-04 01:14:47
927
原创 numpy+pandas
1.jupyter的使用一. 安装与使用1.Jupyter Notebook是基于网页的用于交互计算的应用程序,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。运行 pip install jupyter命令即可安装Jupyter.在命令行中输入jupyter notebook即可启动Jupyter.jupyter启动以后,
2021-08-04 01:13:41
3100
原创 Python基础
编码一个字节byte 是8位bit字符是由字节构成的。utf8中:z=1byte=8bit=2`8二进制(0-255位)不同编码,一个字符所占的字节不一样ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间utf-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。终端命令盘符:重定向 即 转到其他位置:cd>文件名,把路径放进去rd 删除空目录rd
2021-08-04 01:10:44
3781
原创 数据的统计分析
数据的统计分析附原文三步搞定数据统计分析:统计+分析+可视化 | 人人都是产品经理 (woshipm.com)一、统计埋点 --> 数据 --> 五类(整体概况、用户获取、活跃与留存、事件转化)1.整体概况实时数据的意义:可以获取到每个小时的产品实时数据,帮助你了解产品目前的实时情况使用概况:产品整体的使用情况,包括用户量、访问情况、留存等,帮助你对产品整体指标有一个大致了解2.用户获取渠道访问意义:每个渠道的用户使用情况,包括渠道中新用户占比、留存等,帮助你了解产品
2021-08-04 00:38:42
365
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人