- 博客(6)
- 收藏
- 关注
原创 Python打卡Day6—Pandas表格样式&数据可视化
就是用背景高亮标记出空值,应用.highlight_null() 即可将空值高亮显示,同时用null_color参数可以指定该高亮的颜色。面积图是一种有效的数据可视化工具,用于展示数据的趋势、比较不同组之间的差异以及理解数据的部分与整体关系。Pandas 的样式是一个可视化的方法,像Excel一样对特定数据进行加粗、标红、背景标黄等,为了让数据更加清晰醒目,突出数据的逻辑和特征。将每个学生的分数,进行加总和计算平均数,并保留两位小数,把分数低于120的学生,用红色进行标记即可。
2025-02-25 22:39:03
1689
原创 Python打卡Day5—Pandas窗口数据&数据读写
Pandas 提供了窗口函数(Window Functions)用于在数据上执行滑动窗口操作,可以对数据进行滚动计算、滑动统计等操作。其中,custom_function是自定义的窗口函数,data是窗口中的数据,result是窗口函数的计算结果。其中,window=7表示窗口的大小为7,即计算每7个数据的最小值。其中,window=5表示窗口的大小为5,即计算每5个数据的标准差。其中,window=7表示窗口大小为7,即计算每7个数据的最大值。一、Pandas 窗口数据。二、Pandas 数据读写。
2025-02-25 19:08:35
472
原创 Python打卡Day4—Pandas文本数据&时间数据
在pandas中,时间序列(Times Series)是一种特殊的数据类型,用于处理时间相关的数据。(二十六)partition() 把字符串数组切割为DataFrame,注意切割只是切割成为三部分,分隔符前,分隔符,分隔符后。其中,start是起始时间,end是结束时间,frep是频率,这里设置为‘D’表示每天。(三十二)index() 查找给定字符串的位置,注意,如果不存在这个字符串,那么会报错。(十五)slice_replace() 使用给定的字符串,替换指定的位置的字符。
2025-02-22 20:07:51
1658
原创 Python打卡Day3—Pandas数据重塑
根据索引(index)、列(column)(values)值,对原有DataFrame(数据框)进行变形重塑,俗称长表转宽表。通俗的说,就是根据不同列的数据统计了频数。• df.stack/unstack 数据堆积。(三)数据透视pd.pivot_table()• df.pivot_table 数据透视表。(四)数据堆叠(Stack/Unstack)(五)数据交叉表(pd.crosstab)(一)数据变形 df.pivot()• df.cross 数据交叉表。(二)数据融合pd.melt()
2025-02-20 22:37:01
282
原创 Python打卡第二天——Pandas简介数据类型及数据处理
1、DataFrame:二维的表格型数据结构,可以理解为Series的容器,通俗地说,就是可以把Series放到DataFrame里面,它是一种二维表格型数据的结构,既有行索引,也有列索引。在 agg()函数里应用聚合函数计算结果,如 sum()、mean()、count()、max()、min()等,用于对每个分组进行聚合计算。Pandas作为Python数据分析的核心包,提供了大量的数据分析函数,可以用于数据处理、数据抽取、数据集成、数据计算等基本的数据分析手段。先分组:根据某列数据的值进行分组。
2025-02-19 21:37:31
1211
1
原创 Python打卡第一天——Anaconda安装及Python基础知识
如果是自定义安装位置的,也同样可以从“开始”---->点击文件夹“Anaconda3(64-bit)”--->右击下一级任意一个图标--->“更多”---->“打开文件位置”(这里如果看到的是快捷方式,需要在右击一下文件,打开文件位置)就可以文件的自定义安装位置直接复制粘贴即可。2、然后点击右侧“新建”,新建变量。1、打开“我的电脑”---->“属性”---->“高级系统设置”--->“环境变量”--->“系统变量”中的“Path”双击。一般步骤:定义函数--->调用函数---->输出结果。
2025-02-18 18:54:21
478
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人