- 博客(10)
- 收藏
- 关注
原创 利用python进行数据分析之时间序列--小白笔记
rolling_apply函数使你能够在移动窗口上应用自己设计的数组函数。唯一要求的就是:该函数要能从数组的各个片段中产生单个值(即约简)<Axes: >
2023-09-15 16:37:06
2072
原创 利用python进行数据分析之绘图和可视化--小白笔记
plot.bar()和plot.barh()分别绘制水平和垂直的柱状图。默认情况下,matplotlib会在subplot外围留下一定的边距,并在subplot之间留下一。一个用过的subplot(如果没有则创建一个)上进行绘制,隐藏创建figure和subplot。matplotlib的plot函数接受一组X和Y坐标,还可以接受一个表示颜色和线型的字符串。wspace和hspace用于控制宽度和高度的百分比,可以用作subplot之间的间距。因此,如果你使用的是.pdf,就会得到一。
2023-09-08 15:05:59
1546
1
原创 利用python进行数据分析之数据聚合和分组运算--小白笔记
GroupBy机制split-apply-combine(拆分-应用-合并)import pandas as pd import numpy as np df=pd.DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','one'], 'data1':np.random.randn(5), 'data2':np.
2023-09-05 15:00:01
1902
原创 利用python进行数据分析之数据清洗与准备--小白笔记
对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据即将缺失值表示为NA,它表示不可用not available。在统计应用中,NA数据可能是不存在的数据或者虽然存在,但是没有观察到(例如,数据采集中发生了问题):根据各标签的之值中是否存在缺失数据对轴标签进行过滤,可通过与之调节对缺失值得容忍度:用指定值或插值方法(ffill或者bfill)填充数据:返回一个含有布尔值的对象,这些对象表示哪些值是缺失值NA,该对象的类型与原类型一样:isnull的否定式。
2023-08-15 14:32:15
459
2
hadoop全套配置详细步骤(基础环境搭建+hadoop集群搭建+hive搭建)
2023-08-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人