自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Spark大数据分析:招聘数据爬取与分析全流程

本次实践的总体目标是搭建一个包含Hadoop、Spark两个分布式计算框架的大数据处理集群,通过该集群实现对大规模招聘数据的存储、处理与分析。

2025-06-24 01:04:12 2193

原创 Python GUI:手写数字识别画板开发

本项目实现了一个简单的手写数字识别画板,用户可以在画板上书写数字,系统会实时识别并显示识别结果。项目结合了Python的GUI编程和机器学习技术,适合初学者学习计算机视觉和GUI开发的入门项目。

2025-06-23 18:29:52 1070

原创 Python爬虫学习:掌上高考数据抓取与分析(2)

通过抓包分析,我们发现专业录取信息的接口就是图中圈出来的部分:因此,我们只需遍历学校 ID、年份、省份 ID,即可批量构造请求,获取完整的录取数据。学校ID,省份 ID上一章节已经介绍过了,因此这一章节实现起来就比较轻松了。我们进入响应结果查看下我们可能会获取到的信息:我们将这段响应复制到json解析网站上查看,这个是我在直接百度到的JSON格式化工具将保留转义勾掉之后,可以得到如下信息:字段名含义说明示例值 / 来源字段学校ID学校唯一标识school_id科类。

2025-06-19 01:27:41 3435 4

原创 Python爬虫学习:掌上高考数据抓取与分析(1)

随着2025年高考落幕,众多考生和家长即将进入志愿填报阶段。科学合理地选择高校和专业,需要依赖详实的招生数据,如各省高校名单、招生计划、录取分数线等。本次实践通过Python爬虫技术,利用公开的掌上高考API接口,按省份分页抓取高校信息及其ID,搭建一个可复用的数据抓取框架。文章重点介绍爬虫设计思路、关键代码实现及请求细节,帮助初学者快速掌握API数据爬取方法。本文仅记录个人,所用数据采集严格遵守网络安全法规,控制访问频率,保证爬取行为合规安全,适合作为爬虫学习与数据分析的技术参考。

2025-06-14 00:05:47 3094

原创 Python数据分析学习笔记:字符串统计

pandas中字符串统计记录

2025-06-10 16:55:51 439

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除