
数据分析
文章平均质量分 61
风瑟
分享和总结是成长的必经之路
展开
-
08-pandas 入门-pandas的数据结构
要使用pandas,你首先就得熟悉它的两个主要数据结构:Series和DataFrame。虽然它们并不能解决所有问题,但它们为大多数应用提供了一种可靠的、易于使用的基础。原创 2023-08-24 23:36:14 · 492 阅读 · 0 评论 -
07-Numpy基础-伪随机数生成
np.abs(walk)>=10可以得到一个布尔型数组,它表示的是距离是否达到或超过10,而我们想要知道的是第一个10或-10的索引。不难看出,这其实就是随机漫步中各步的累计和,可以用一个数组运算来实现。我们说这些都是伪随机数,是因为它们都是通过算法基于随机数生成器种子,在确定性的条件下生成的。numpy.random模块对Python内置的random进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数。先来看一个简单的随机漫步的例子:从0开始,步长1和-1出现的概率相等。原创 2023-08-24 23:33:48 · 240 阅读 · 0 评论 -
06-Numpy基础-线性代数
numpy.linalg中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西。NumPy提供了一个用于矩阵乘法的dot函数(既是一个数组方法也是numpy命名空间中的一个函数)线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分。表达式X.T.dot(X)计算X和它的转置X.T的点积。x.dot(y)等价于np.dot(x, y)原创 2023-08-24 23:32:52 · 1506 阅读 · 0 评论 -
05-Numpy基础-用于数组的文件输入输出
np.save和np.load是读写磁盘数组数据的两个主要函数。如果文件路径末尾没有扩展名.npy,则该扩展名会被自动加上。原创 2023-08-24 23:32:07 · 255 阅读 · 0 评论 -
04-Numpy基础-利用数组进行数据处理
NumPy数组使你可以将许多种数据处理任务表述为简洁的数组表达式(否则需要编 写循环)。用数组表达式代替循环的做法,通常被称为矢量化。一般来说,矢量化 数组运算要比等价的纯Python方式快上一两个数量级(甚至更多),尤其是各种数值计算。作为简单的例子,假设我们想要在一组值(网格型)上计算函数 sqrt(x^2+y^2)。原创 2023-08-24 23:30:48 · 261 阅读 · 0 评论 -
03-Numpy基础-通用函数:快速的元素级数组函数
通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数。你可以将 其看做简单函数(接受一个或多个标量值,并产生一个或多个标量值)的矢量化包 装器。虽然并不常见,但有些ufunc的确可以返回多个数组。这里,numpy.maximum计算了x和y中元素级别最大的元素。表4-3和表4-4分别列出了一些一元和二元ufunc。原创 2023-08-24 23:28:49 · 191 阅读 · 0 评论 -
02-Numpy基础-ndarray
NumPy(Numerical Python的简称)是Python数值计算最重要的基础包。NumPy之于数值计算特别重要的原因之一,是因为它可以高效处理大数组的数据。基于NumPy的算法要比纯Python快10到100倍(甚至更快),并且使用的内存更少。原创 2023-08-24 23:27:09 · 289 阅读 · 0 评论 -
01-jupyter notebook的使用方法
在shell中输入表达式,按下Tab,会搜索已输入变量(对象、函数等等)的命名空间:除了补全命名、对象和模块属性,Tab还可以补全其它的。当输入看似文件路径时 (即使是Python字符串),按下Tab也可以补全电脑上对应的文件信息:另外,tab补全可以补全函数的关键词参数(包括等于号=)。原创 2023-08-24 23:22:10 · 1659 阅读 · 0 评论