
数据处理和分析
文章平均质量分 74
Humbunklung
这个作者很懒,什么都没留下…
展开
-
NumPy 数组计算:广播机制
我们在NumPy数组的计算:通用函数中看到,NumPy 的通用函数可以用于向量化操作,从而避免缓慢的 Python 循环。本章将讨论广播机制:这是一组规则,使得 NumPy 能够在不同大小和形状的数组之间应用二元操作(如加法、减法、乘法等)。原创 2025-05-31 11:17:03 · 1037 阅读 · 0 评论 -
NumPy 聚合:最小、最大值及此间一切
探索任何数据集的第一步通常是计算各种汇总统计量。也许最常见的汇总统计量是均值和标准差,它们能让你总结数据集中的"典型"值,但其他聚合函数同样有用(如求和、乘积、中位数、最小值和最大值、分位数等)。在处理数组方面,NumPy具有高效快速的内置聚合函数;我们将在这里讨论并尝试其中的一些函数。原创 2025-05-29 18:39:32 · 1239 阅读 · 0 评论 -
NumPy 数组计算:通用方法
迄今为止,我们已探讨了NumPy的基础知识。接下来的章节中,我们将深入解析NumPy在Python数据科学领域占据重要地位的根本原因:其通过提供简洁灵活的接口,可实现对数据数组的高效计算。NumPy数组的计算可能极其高效,也可能异常缓慢。实现高效计算的关键在于采用向量化操作,这些操作通常通过NumPy的*通用函数*(universal functions,简称ufuncs)来实现。本章将深入阐述NumPy通用函数的必要性——它们能显著提升对数组元素进行重复计算的效率,并系统介绍NumPy包中最常用且原创 2025-05-26 13:39:56 · 1320 阅读 · 0 评论 -
NumPy 数组的基本操作
Python 中的数据操作几乎等同于 NumPy 数组操作——即使是 Pandas 这类新工具,也是围绕 NumPy 数组构建的。本文将通过多个示例演示如何利用 NumPy 数组操作实现数据访问、子数组处理,以及数组的分割、重塑和连接。尽管这些操作看似有些枯燥且偏理论化,但它们构成了数据科学相关众多应用的基石,是在数据处理过程中值得掌握的知识与技能。本文包括一下NumPy数组相关的基本操作内容:数组属性确定数组的大小、形状、内存占用和数据类型数组索引获取及设置单个数组元素的值原创 2025-05-25 11:32:45 · 932 阅读 · 0 评论 -
NumPy 数组拼接与分割
NumPy 提供了多种方法用于数组拼接(Concatenation)和分割(Splitting),这些操作在数据预处理、特征工程和结果整合中至关重要。原创 2025-05-25 10:41:02 · 338 阅读 · 0 评论 -
NumPy 数组重塑
NumPy 允许通过 reshape 方法或 np.reshape 函数改变数组的维度结构,而无需修改底层数据。这种操作在数据预处理、矩阵运算和机器学习中极为常见。原创 2025-05-25 10:30:01 · 329 阅读 · 0 评论 -
NumPy数组切片
`NumPy` 的 **切片(Slicing)** 操作允许高效地访问和操作数组的子集,其语法与 `Python` 列表类似但更强大,支持 **多维切片** 和 **视图机制**(非副本)。以下是核心用法详解原创 2025-05-25 10:21:39 · 248 阅读 · 0 评论 -
NumPy 数组属性
属性名计算公式示例数组(shape=(2,3))size2×3=6nbytes6×4=24(int32类型)strides(12, 4) → 对shape(2,3)的int32数组。原创 2025-05-25 10:13:08 · 269 阅读 · 0 评论 -
IPython 常用魔法命令
IPython 的魔法命令(Magic Commands)是其交互式环境中的特殊指令,以 % 或 %% 开头,用于快速执行非 Python 标准功能的任务(如文件操作、性能分析、系统交互等)。它们大幅提升了代码编写和调试效率,尤其在 Jupyter Notebook 中广泛应用。IPython 的魔法命令是其核心特色功能,分为行魔法(% 前缀)和单元魔法(%% 前缀)。以下是常用魔法命令分类详解及代码示例。原创 2025-05-24 16:04:34 · 942 阅读 · 0 评论 -
记一个itertools排列组合和列表随机排序的例子
itertools朋友不知道哪里弄来了一长串单词列表,一定要搞个单词不重复的组合。那么这个时候我们就可以想到读书时所学的排列组合知识了,而这个在Python中可以怎么实现呢?原创 2024-12-28 16:53:10 · 368 阅读 · 0 评论 -
根据股票列表获取资金流入情况
通过网上的数据接口,获取大A数据,应用 tqdm 进度条。原创 2024-08-25 11:08:49 · 881 阅读 · 0 评论 -
调用股票网站接口读取大A数据——个股资金流入趋势
以某股票为例,调用自定义的一个类,读取数据。原创 2024-08-24 21:58:49 · 1097 阅读 · 0 评论 -
Pandas DataFrame 数据转换处理和多条件查询
工作中需要处理一个比较大的数据,且当中需要分析的日期类型字段为字符串型,需要进行转换,获得一个新的字段用于时间统计。我们应用函数进行转换。原创 2024-08-22 22:18:18 · 391 阅读 · 0 评论