
Datawhale
文章平均质量分 82
jyyym
记录
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Datawhale动手学数据分析Task04
第二章:数据可视化1、matplot初见1.1 最基本的可视化图案有哪些?分别适用于那些场景?最基本的可视化图有折线图,柱状图,饼图,散点图,直方图等,折线图适用于观察某个值的走势,柱状图适用于观察不同条件的对比,饼图适用于分析组成成分或者比例;散点图用于描述数据的分布情况。1.2 Figure&Subplotmatplotlib的图像都位于Figure对象中,可以用plt.figure创建一个新的Figurefig = plt.figure()不能通过空Figure绘图,应原创 2021-07-19 12:06:20 · 313 阅读 · 1 评论 -
Datawhale动手学数据分析Task03
1. 第二章:数据重构1.1 数据的合并数据的合并任务主要通过pandas中的concat、merge方法或是DataFrame的join、append方法来完成。其中pandas.concat可以沿着一条轴将多个对象堆叠到一起,其参数设置如下:pandas.merge()方法是基于值的连接1.2 数据聚合与运算本节主要是对于Groupby机制的理解:分组运算主要包括三个阶段的操作:split-apply-combine。分组运算的第一个阶段,pandas对象(无论是Series、DataF原创 2021-07-17 10:39:43 · 240 阅读 · 0 评论 -
DataWhale动手学数据分析Task02
1. 第二章:数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。1.1 缺失值观察与处理1.1.1 任务一:缺失值观察对于数据缺失值的观察主要可以通过pandas中的两个函数来完成,分别是isnull和isna(两个函数没有区别),并且通过与sum的组合可以计算出每列中缺失值的总和、比原创 2021-07-15 10:56:42 · 231 阅读 · 0 评论 -
DataWhale动手学数据分析Task01
DataWhale动手学数据分析Task011.第一章:数据载入及初步观察1.1.1 载入数据1、两种数据格式的区分及读取方式:TSVCSVTab-Seperated ValuesComma-Seperated Values利用制表符作为字段值的分隔符利用半角逗号作为字段值的分隔符pd.read_table(‘path’)pd.read_csv(‘path’)2、pandas中用于读取数据的常用函数及参数:import pandas as pdpd.r原创 2021-07-13 17:08:54 · 383 阅读 · 0 评论