
数据分析
文章平均质量分 81
数据分析
white.tie
一个从爬虫小白开始的进阶之路
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas中dataframe中元素替换操作
摘要:本文介绍了在Pandas中实现DataFrame替换操作的5种方法:1)使用replace()进行单值或多值替换;2)map()方法通过字典映射实现替换;3)applymap()对每个元素应用函数替换;4)apply()结合lambda表达式替换;5)使用loc/iloc定位后直接赋值替换。每种方法都配有代码示例和输出结果,适用于不同场景下的数据替换需求,包括单值替换、多值批量替换和条件替换等操作。原创 2025-06-10 11:59:48 · 237 阅读 · 0 评论 -
数据分析中的常用图
数据分析中常用的图表类型包括:折线图(展示趋势变化)、柱状图(分类数据对比)、直方图(数据分布统计)、散点图(变量相关性分析)、饼图(占比关系)和箱线图(数据离散特征)。每种图表适用于不同场景,如折线图适合时间序列数据,柱状图不宜超过12个分类。在Python中可通过Matplotlib库快速生成这些图表,通过简单代码即可自定义线条样式、颜色等属性。数据可视化时需根据数据类型和展示需求选择合适的图表类型,并注意各类图表的适用限制,如样本量要求(直方图不少于50个数据点),才能有效传达数据信息。原创 2025-06-05 14:31:04 · 853 阅读 · 0 评论 -
Pandas学习入门一
Pandas是Python中一个强大的数据分析工具库,基于NumPy构建。它提供了DataFrame和Series两种核心数据结构,能够高效处理结构化数据。DataFrame类似于电子表格或SQL表,支持行列索引、转置等操作,可通过数组、字典等多种方式创建。Series是一维标签数组,可通过列表、数组或字典生成。Pandas支持数据清洗功能,包括处理缺失值(fillna/dropna)和连接数据库(读取/写入MySQL)。它还提供数据转置、行列索引修改等基本操作,是数据分析和挖掘的重要工具。原创 2025-05-28 11:31:24 · 526 阅读 · 0 评论 -
Numpy简单学习入门
NumPy是Python中用于高效处理多维数组的库,广泛应用于数据分析和机器学习。其核心是ndarray对象,支持快速数值计算和并行运算,性能远超纯Python代码。NumPy数组与Python列表相比,具有更高的计算效率,且支持多维数据存储和向量化运算。通过np.array、np.arange、np.random等方法可以创建数组,并支持多种数据类型和形状操作。NumPy还提供了丰富的数组操作功能,如索引、切片、布尔索引等,便于数据筛选和处理。由于其底层使用C语言编写,NumPy在处理大规模数据时表现出色原创 2025-05-22 14:34:17 · 791 阅读 · 0 评论