
Python数据分析
文章平均质量分 90
Mark_Coder
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pandas时间序列
时间序列数据在很多领域都是重要的结构化数据形式,比如:金融,神经科学,生态学,物理学。在多个时间点观测的数据形成了时间序列。时间序列可以是固定频率的,也可以是不规则的。常见使用时间戳固定的时间区间时间间隔Pandas中的基础时间序列种类是由时间戳索引的Series,在Pandas外部通常表示为Python字符串或datetime对象。注意datetime对象可作为索引,时间序列DatetimeIndex<M8[ns]类型为纳秒级时间戳时间序列里面每个元素为Timestamp对象。原创 2025-04-11 10:00:00 · 369 阅读 · 0 评论 -
07-Pandas函数与运算
是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN。ix是以上二者的综合,既可以使用索引编号,又可以使用自定义索引,要视情况不同来使用,如果索引既有数字又有英文,那么这种方式是不建议使用的,容易导致定位的混乱。DataFrame索引操作,可将其看作ndarray的索引操作。loc是基于标签名的索引,也就是我们自定义的索引名。注意,按索引名切片操作时,是包含终止索引的。作用和loc一样,不过是基于索引编号来索引。标签的切片索引是包含末尾位置的。原创 2023-03-24 22:20:22 · 239 阅读 · 0 评论 -
06-Pandas高级数据结构
Pandas介绍为什么要学习pandas?那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?numpy能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等比如:我们通过爬虫获取到了存储在数据库中的数据所以,pandas出现了。什么是Pandas?Pandas的名称来自于面板数据(panel data)原创 2023-03-22 19:01:41 · 234 阅读 · 0 评论 -
05-Numpy函数应用
np.random为我们提供了许多获取随机数的函数。这里统一来学习一下。原创 2023-03-17 18:44:46 · 677 阅读 · 0 评论 -
04-Numpy数组对象
NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词--Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。在数据分析和机器学习领域被广泛使用。总而言之,他是一个非常高效的用于处理数值型运算的包。原创 2023-03-15 19:02:03 · 569 阅读 · 0 评论 -
03-Jupyter Notebook基础使用
Jupyter Notebook 是什么?Jupyter Notebook 是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。Jupyter Notebook特点基于web的在线编辑器可交互式.ipynb文件分享支持markdown。原创 2023-03-13 18:52:22 · 1056 阅读 · 0 评论 -
02-数据分析环境搭建
是一个捆绑了Pythonconda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Python的包。并且支持绝大部分操作系统(比如:Windows、Mac、Linux等)。根据自己的操作系统,下载相应的版本,因为Anaconda内置了许多的包,所以安装过程需要耗费相当长的时间,大家在安装的时候需要耐心等待。Spyder,以下分别做一些介绍。原创 2023-03-13 18:33:05 · 319 阅读 · 0 评论 -
01-数据分析介绍
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。现状分析:告诉你过去发生了什么。描述型数据分析原因分析:告诉你某一现状为什么发生。验证型数据分析预测分析:预测未来会发生什么。预测型数据分析。原创 2023-03-13 18:29:47 · 2705 阅读 · 0 评论 -
思维篇| 为什么数据分析思维比较重要?
结构化,就是将分析思维结构化建一座分析的金字塔,建一张问题分析的思维导图将论点归纳和整理;将论点递进和拆解;将论点完善和补充。公式化是在结构化的基础上,将思维导图上的节点数据化,转化成公式。比如:如何预估上海地区的共享单车投放量?根据对业务的了解,从四个维度来拆解问题。从城市流动人口,人口密度,城市交通数据,保有自行车四个维度来计算。找到公式。同时,因为单车是有损耗的,因公式要加入损耗。分析的业务化,目的在于将分析结果落地,使之有用并且可验证。原创 2023-03-13 18:26:20 · 395 阅读 · 0 评论