- 博客(3)
- 收藏
- 关注
原创 Python大数据-matplotlib.pyplot初步使用
本文介绍了Matplotlib数据可视化库的基本使用方法。主要内容包括:1) 通过pyplot.plot()绘制基础图表;2) 常用API详解,包括设置图片大小(figure)、调整坐标轴刻度(xticks)、中文显示配置、添加图表描述信息等;3) 完整案例演示三天气温变化折线图的绘制过程,涵盖数据生成、图表样式设置、坐标轴调整、图例添加等关键步骤。文章提供了丰富的代码示例,帮助读者快速掌握Matplotlib的基本绘图功能,实现数据的直观可视化呈现。
2025-08-11 20:02:44
2045
原创 Python大数据-Spark入门
本文介绍了PySpark的基础知识与应用,主要包括:1)基础准备:构建Spark执行环境入口对象;2)数据输入:将Python容器和文件数据转换为RDD对象;3)数据计算:使用map、flatMap、reduceByKey等算子进行数据处理;4)数据输出:转换为Python对象或保存到文件系统;5)综合案例:实现热门搜索分析统计。通过具体代码示例展示了PySpark的核心功能和操作方法,为大规模数据处理提供了分布式计算解决方案。
2025-08-04 20:28:30
2031
原创 Python大数据-可视化数据
本文介绍了一个基于面向对象编程的数据可视化demo。程序通过封装CSV和JSON格式的数据文件,读取并处理销售记录数据。核心内容包括:定义Record类封装单条数据,编写FileReader类及其子类CsvFileReader、JsonFileReader实现不同格式文件的读取,最后使用Pyecharts库将处理后的销售数据(按日期汇总金额)可视化生成柱状图。该demo展示了从数据读取、封装到可视化的完整流程,体现了面向对象编程在数据处理中的应用。
2025-07-31 11:51:13
687
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅