自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 numpy(02 数据类型和数据类型转换)

下面的示例定义一个结构化数据类型 student,包含字符串字段 name,整数字段 age,及浮点字段 marks,并将这个 dtype 应用到 ndarray 对象。对象的一个属性,用于表示数组的维度(dimensions)和每个维度的大小(size)。它以元组的形式返回,元组的每个元素表示数组在相应维度上的大小。numpy 的数值类型实际上是 dtype 对象的实例,并对应唯一的字符,包括 np.bool_,np.int32,np.float32,等等。下表列举了常用 NumPy 基本类型。

2025-02-20 00:09:19 937

原创 numpy(01 入门)

ndarray 对象由计算机内存的连续一维部分组成,并结合索引模式,将每个元素映射到内存块中的一个位置。,最重要的一个特点是其 N 维数组对象 ndarray,该对象是一个快速而灵活的大数据集容器,描述相同数据类型的元素集合,以 0 下标为开始进行集合中元素的索引。使用 NumPy 的最佳方法是使用符合操作系统的可安装的二进制包,它包含完整的。对于许多用户,尤其是在 Windows 上,最简单的方法是下载以下的。发行版,它们包含了所有的关键包(包括 NumPy,SciPy,,标准的Python并没有包含。

2025-02-19 20:46:01 844

原创 pandas(13 Caveats & Gotchas和SQL比较)

不清楚应该得到什么结果。它应该是True,因为它不是零长度的吗?它应该是False,因为有False的值吗?不清楚,所以Pandas会引发。由于许多潜在的Pandas用户对SQL有一定的了解,所以本页面旨在提供使用pandas执行各种SQL操作的一些示例。在SQL中,使用逗号分隔的列列表进行选择(或使用*选择所有列)-Pandas遵循numpy的约定,当您尝试将某个对象转换为。作为从 Pandas 对象中选择数据的简洁方式−。返回一个布尔序列,这通常是所需的。此操作返回一个布尔系列,显示。

2025-02-17 00:08:15 874

原创 pandas(12 IO工具和稀松数据)

是一组顶级读取函数,可以像一样访问,通常返回一个Pandas对象。读取文本文件(或平面文件)的两个核心函数是和。它们都使用相同的解析代码,智能地将表格数据转换为对象 –

2025-02-17 00:07:05 924

原创 pandas(11 分类数据和数据可视化)

是一种特殊的数据类型,它通过将数据分为不同的类别来有效地减少内存使用并提高性能。它在处理具有有限数量的可能值(如性别、状态、等级等)的列时非常有用。参数用于在绘制多个图形时将每一列或每一行的图形绘制到不同的子图(subplot)中。分类数据通常用于具有有限、固定类别的数据,并且在处理时可以提高性能,特别是当类别数据具有某种顺序时。: 如果分类数据是无序的,不能进行大小比较,库中的一个功能强大的函数,用于将数据转换为。)时,能够进行基于顺序的比较,例如。方法,可以移除不需要的分类。类型的字符串相似的输出。

2025-02-13 15:44:58 972

原创 pandas(10 日期和Timedelta)

扩展时间序列,日期功能在金融数据分析中起着重要作用。

2025-02-11 20:11:54 770

原创 pandas(09 合并/连接和连接join)

如果某个键的组合在左表和右表中都不存在,那么合并表中对应的值将为 NA。这些的默认单位是纳秒(因为时间戳是以纳秒存储的)。对于具有MultiIndex(分层)的DataFrame,级数的数量必须与右侧DataFrame的连接键数量匹配。(如果两个 DataFrame 中要合并的列名相同,可以使用这个参数)。可以是列名称或与DataFrame长度相等的数组。− 从右侧DataFrame中用作键的列。可以是列名称或与DataFrame长度相等的数组。每个切分后的DataFrame的部分关联起来。

2025-02-11 18:58:01 1153

原创 pandas(08 缺失数据和分组)

许多时候,我们需要将一个通用值替换为某个特定的值。fillna函数可以用一些方式来“填充”NA值,我们在下面的部分中进行了解释。来计算一个或多个统计量(如求和、平均、最大值等),它支持同时对多个列进行聚合操作,还能对每个列应用不同的聚合函数。在许多情况下,我们将数据拆分为不同的组,并对每个子集应用一些功能。它允许对每个分组的数据进行元素级别的转换操作,并返回与原始数据框相同大小的结果。使用ReIndexing章节中讨论的填充概念,我们将填充缺失的值。过滤根据定义的条件筛选数据并返回数据的子集。

2025-02-05 10:15:00 648

原创 pandas(07 统计函数、窗口函数和聚合函数)

Series、DataFrames和Panel都具有函数。该函数将每个元素与其前面的元素进行比较,并计算出变化百分比。函数默认情况下,操作是基于列进行的;如果要逐行应用相同的操作,则使用参数。

2025-02-04 18:18:15 777

原创 pandas(06 API、索引和选择数据)

Pandas提供了API来定制其行为的一些方面,其中显示功能被广泛使用。该由五个相关函数组成。

2025-02-03 20:25:51 633

原创 pandas(05 处理文本数据)

Pandas提供了一组字符串函数,使得对字符串数据的操作变得很容易。最重要的是,这些函数会忽略(或排除)缺失/NaN值。我们将参数为空,观察例6.1发现这里多了一个‘,’进行拆分。我们发现并没有什么变化,这也验证了split不是单纯的替换。是将分类变量的每一个类别映射为一个新的列,如果我们将字符串里加‘,’会怎么样。创建一个Series。

2025-02-01 22:16:07 1024

原创 pandas(04 迭代与排序)

基本迭代Pandas对象的行为取决于类型。当迭代Series时,它被视为类似于数组的对象,基本迭代会产生值。其他的数据结构,比如DataFrame和Panel,会遵循以迭代对象的键为约定的“类似于字典”的方式。简而言之,基本迭代(for i in object)产生以下结果−- 项标签。

2025-01-13 21:52:50 966

原创 pandas(03 函数应用和重新索引)

要将自己或其他库的函数应用到Pandas对象上,您需要了解三个重要的方法。使用适当的方法取决于您的函数是希望对整个DataFrame还是逐行/逐列或逐个元素进行操作。方法沿着DataFrame或Panel的轴应用任意函数。该方法和描述性统计方法一样,可以接受一个可选的axis参数。默认情况下,该操作按列进行,将每一列视为类似数组的对象。方法允许你基于某个映射(字典或Series)或任意函数来重新标记一个轴。可以更改DataFrame的行标签和列标签。如果没有与之对应的数据,则自动补充缺失值。

2025-01-12 13:38:21 1157

原创 pandas(02 pandas基本功能和描述性统计)

我们将主要关注DataFrame对象,因为它在实时数据处理中非常重要,并讨论其他一些数据结构。现在让我们了解什么是DataFrame的基本功能。参数,与ndarray的sum、std等方法类似,但是axis可以通过名称或整数进行指定。这样的函数,在DataFrame包含字符或字符串数据时会抛出异常,因为不能执行此类操作。大量的方法可以集体计算DataFrame的描述统计和其它相关操作。是用于传递需要考虑进行摘要的列的必要信息的参数。现在让我们创建一个Series,并查看上面列出的所有属性操作。

2024-12-03 16:41:33 1304

原创 pandas(01 入门)

SeriesDataFramePanel这些数据结构建立在Numpy数组之上,意味着它们的运行速度很快。

2024-11-26 20:14:44 1084

原创 date_range() (时间切片详解)

freq(频率,默认值='D')('D',频率为“天”)start (开始,默认值=None)periods(周期,默认值=None)freq变成了None,请进行看例4。end(结束,默认值=None)很明显,自动补freq='D'

2024-11-02 15:48:38 319

原创 pandas多列分组(上)

agg()函数是聚合函数DataFrame@@@func : 实现某种统计功能的函数,如果要不同列用求不同统计量,则用字典 {‘行名/列名’ : ‘函数名’} 指定。例:{ '行1 ' : ['函数名1' , '函数名2' ] }# 创建示例数据data = {# 定义自定义聚合函数})# 使用多列进行分组并应用自定义聚合函数。

2024-10-30 00:29:01 1203

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除