
Pandas
文章平均质量分 69
ciky2011
这个作者很懒,什么都没留下…
展开
-
ValueError: Cannot mask with non-boolean array containing NA / NaN values
如果你遇到了这个错误,这意味着你试图用一个包含NA或NaN值的非布尔数组来过滤你的 DataFrame。这通常发生在.loc[]或布尔索引操作中,如果生成的掩码(mask)数组中含有缺失值,Pandas 就无法正确地应用这个掩码。要解决这个问题,你需要确保你的掩码数组是一个只包含True和False的布尔数组,并且不包含任何NA或NaN值。你可以通过填充缺失值或删除含有缺失值的行来解决这个问题。以下是一些可能的解决方案。原创 2024-04-01 14:46:59 · 3123 阅读 · 0 评论 -
Pandas apply transform agg 函数区别
【代码】Pandas apply transform agg 函数区别。apply 传入的为DataFrame,transform和agg传入的为Series。可通过打印传入的参数,进行本质比较,DF和Series可做的操作不同;如列相加只能DF。transform返回值其索引和列与原始DataFrame相同,agg必为聚会结果及组数,apply看具体应用函数的行为即可能为与原大小一样,也可能为聚合后的即只有组数。原创 2024-03-07 14:38:41 · 556 阅读 · 0 评论 -
Pandas isin()函数介绍
isin()函数是 Pandas 库中的一个非常实用的函数,主要用于筛选数据框(DataFrame)或序列(Series)中包含特定值的数据。这个函数可以接收一个列表、集合或其他可迭代对象作为参数,并返回一个布尔型的序列,其中每个元素表示原始序列中的对应元素是否出现在给定的集合中。原创 2024-03-06 10:58:48 · 976 阅读 · 0 评论 -
Pandas merge()函数介绍
merge()函数是 Pandas 库中一个非常强大的工具,用于根据一个或多个键将两个 DataFrame 合并起来。这是数据整合和清洗中经常使用的操作。merge()函数提供了多种合并方式,包括内连接(inner join)、左连接(left join)、右连接(right join)和外连接(outer join)。left:左侧 DataFrame。right:右侧 DataFrame。on:用于合并的列名。必须存在于两个 DataFrame 中。how:指定合并类型,可选值为 'left'原创 2024-03-01 10:16:11 · 2434 阅读 · 0 评论 -
Pandas agg()函数介绍及命名聚合
agg()函数是 Pandas 库中的一个非常强大的函数,用于执行聚合操作。在 Pandas 中,聚合通常指的是对一组值执行某种计算以返回一个单一的值,例如求和、平均值、最大值、最小值等。agg()函数可以应用于 Pandas 的Series、DataFrame或GroupBy对象。它允许你灵活地应用一个或多个聚合函数到数据上。命名聚合(Named Aggregation)是 Pandas 库中一种特殊的聚合方式,主要用于在 GroupBy 操作中更清晰、明确地指定聚合操作的输出列名以及对应的原创 2024-02-28 17:30:27 · 2044 阅读 · 0 评论 -
30 天 Pandas 挑战 Day16:reset_index()将结果从 Series转为DataFrame
reset_index() 方法是一个非常实用的工具,可以帮助你在进行数据聚合操作后,将结果从 Series 格式转化为更易于分析和使用的 DataFrame 格式。原创 2023-10-09 17:00:21 · 290 阅读 · 0 评论 -
pandas argmax 和max区别
函数用于返回数据集中最大(或最小)值的索引。如果数据集中有多个相同的最大(或最小)值,那么这个函数将返回第一个出现该最大(或最小)值的索引。是 Pandas 中的两个函数,它们在处理数据时发挥了不同的作用。输出结果为:2,因为第二个元素(索引为2)是最大的元素。函数返回的是数据集中最大(或最小)的值。输出结果为:9,因为9是数据集中最大的值。在 Pandas 中的区别。原创 2023-09-26 17:30:27 · 651 阅读 · 0 评论 -
30 天 Pandas 挑战
例如,假设我们有两个DataFrame,其中一个包含列名为"A"和"B",另一个也包含列名为"A"和"B",如果我们使用merge函数将它们合并在一起,则会自动生成一个新的列名,例如"A_x"和"B_x"来表示第一个DataFrame中的列,"A_y"和"B_y"来表示第二个DataFrame中的列。因此,count 表示该系列中 True 的数量,它对应于低工资的账号数量。可以看到,在合并后的DataFrame中,"A"和"B"列都存在,但每个列都有两个不同的值,同时自动生成了新的列名来避免重复。原创 2023-09-09 12:19:24 · 323 阅读 · 0 评论