
Python数据分析
文章平均质量分 93
记录学习Python数据分析的历程
查尔斯-狩乃
大数据分析
展开
-
Python数据分析9-综合案例-网站日志分析
目录9.1数据来源9.1.1网站日志解析9.1.2日志数据清洗9.2日志数据分析9.2.1网站流量分析9.2.2状态码分析9.2.3IP地址分析网站的日志数据记录了所有Web对服务器的访问活动。本章主要讲解如何通过Python第三方库解析网站日志;如何利用pandas对网站日志数据进行预处理,并结合前面章节中的数据分析和数据可视化计数,对网站日志数据进行分析。9.1数据来源9.1.1网站日志解析注:该数据集可以从从网上资源下...原创 2021-10-03 17:17:01 · 1621 阅读 · 0 评论 -
Python数据分析8-时间序列
1原创 2021-10-02 20:49:29 · 1647 阅读 · 1 评论 -
Python数据分析7-seaborn可视化
seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得绘图更容易、更美观。本章首先讲解如何使用seaborn样式和分布图,并介绍如何使用seaborn绘制分类如;然后介绍回归图的绘制和网格计数。7.1样式与分布图...原创 2021-09-30 15:02:37 · 2144 阅读 · 0 评论 -
Python数据分析6-matplotlib可视化
数据可视化时数据分析中的一部分,可用于数据的探索和查找缺失值等,也是展现数据的重要手段。matplotlib是一个强大的工具箱,其完整的图标样式函数和个性化的自定义设置,可以满足几乎所有的2D和一些3D绘图的需求。本章节介绍了如何利用matplotlib绘制常用数据图表,如线形图、柱状图、散点图和直方图;还介绍了如何使用matplotlib的自定义设置绘制个性化图表;最后使用全球星巴克店铺的数据进行数据分析和可视化。 6.1线形图 线形图是最基本的图标类型...原创 2021-09-25 13:06:16 · 1519 阅读 · 0 评论 -
Python数据分析5-数据分组与聚合
数据的分组统计是数据分析工作中的重要环节。本节将讲解GroupBy的原理和使用方法;聚合函数的使用;富足运算中transform和apply方法的使用 ;通过pandas创建数据透视表的方法;最后通过一个综合示例。巩固数据分析统计的使用。5.1数据分组5.1.1GroupBy简介 GroupBy技术用于数据分组运算,类似于Excel的分类汇总(对于不同分类进行运算),其运算的核心模式为split-apply-combine,如下图所示,首先,数据及按照key(分组键...原创 2021-09-22 23:33:27 · 3890 阅读 · 0 评论 -
Python数据分析4-数据清洗与整理
有效的数据是进行数据分析的依据,因此在数据分析中,数据的处理往往需要花费70%的时间,可见数据处理的重要性。本章将讲解在pandas中如何进行多数据清洗和处理并介绍针对多元数据的合并和链接,以及数据的重塑等内容。4.1数据清洗 现实中通过各种方式收集到的数据都是“肮脏”的。本节将着重讲解数据清洗的工作,如缺失值的处理,重复数据的处理以及如何替代值等具体操作。4.1.1处理缺失值 有时由于设备原因(设备故障或无法存入数据等)或人为原因(没有录入或故意...原创 2021-09-19 15:18:02 · 3040 阅读 · 0 评论 -
Python数据分析3-外部数据的读取于存储
对于数据分析而言,数据大部分来源于外部数据,如常用的CSV文件、Excel文件和数据库文件等。本章讲解如何李彤pandas库将外部数据转换为DataFrame数据格式,再通过Python进行处理,将DataFrame数据存储到相应的外部数据文件中。3.1文本数据的读取于存储3.1.1CSV文件的读取 pandas库提供了将表格型数据读取为DataFrame数据结构的函数。在现实应用中,常用的有read_csv和read_table函数,具体差异如下表:字符 ...原创 2021-09-17 10:37:43 · 738 阅读 · 0 评论 -
Python数据分析2-pandas入门和实战
2.1pandans数据结构 pandas又两个基本得数据结构:Series和Dataframe2.1.1创建Series数据 Series数据结构类似于一维数组,但它是由一组数据(各种Numpy数据类型)和一组 对应得索引组成。通过一组列表数据即可产生最简单得Series数据,如图 Series数据:索引在左边,值在右边。可以看出,如果没有指定一组数据作为索引的话,Series数据会以0到N-1(N为数据的长度)作为索引,也可以通过指定索引的...原创 2021-09-14 10:44:57 · 2278 阅读 · 0 评论 -
Python数据分析1-NumPy入门和实战
Numpy库是用于科学计算的一个开源Python托充程序库,是其他数据分析包的基础包,他为Python提供了高性能数组与矩阵运算处理能力。本节将讲解多维数组的创建及其基本属性、数组的切片和索引方法、数组的运算与存取等内容。最后还有案例。1.1ndarry数组 Numpy库为Python带来了真正的ndarry多维数组功能。ndarray对象是一个快速而灵活的数据集容器。本节主要学习ndarray多维数组的创建方法、数组的属性和数组中的简单操作等内容。1.1.1创建n...原创 2021-09-06 17:49:25 · 1187 阅读 · 0 评论