- 博客(4)
- 收藏
- 关注
原创 爬虫作业记录:航班数据爬取与可视化分析全流程解析
本文介绍了深圳机场航空物流数据的爬取与可视化分析全流程。通过分析目标网站接口,使用Python的requests库构建POST请求,获取2025年5月1日至10日的航班JSON数据,包括航班号、起降时间、地点、状态等关键信息。数据存储采用Pandas DataFrame和MongoDB结合的方式,通过pymongo库将结构化数据持久化到本地数据库。整个流程涵盖数据爬取、解析、存储等环节,为后续的航班数据可视化分析奠定了基础。所有数据均为网站公开信息,仅用于学术研究和技术探讨。
2025-08-17 20:49:02
1340
原创 使用Python解析Access数据库(.mdb/.accdb文件)
本文介绍使用Python解析Access数据库(.mdb/.accdb文件)的解决方案。针对未安装Access软件、需批量处理数据的情况,推荐使用pyodbc+pandas组合:通过pyodbc直接读取数据库文件,并转换为pandas DataFrame进行数据分析。实施步骤包括安装驱动(Microsoft Access Database Engine)、配置Python环境,需注意驱动位数与Python解释器匹配。该方法免安装完整Access软件,支持批量自动化处理,完美融入Python数据生态。示例代码
2025-08-12 10:34:47
1022
原创 全球内陆水域水文时间序列数据库
摘要 DAHITI水文数据库由德国慕尼黑工业大学开发,通过卫星测高数据(Jason-2/3、Sentinel-3等)提供全球内陆水域的水位时间序列、流量估算及趋势分析。该数据库覆盖湖泊、河流等水体,具有全球覆盖优势,但存在时间分辨率较低(数天至数周)和复杂地形精度受限等局限。数据可通过官网获取CSV格式及可视化图表,适用于缺测地区监测和气候变化研究。作者已开发爬取2022-2025年数据的自动化程序,并提供数据分析服务。获取限制主要为数据更新频率制约。(148字)
2025-08-11 15:21:57
355
原创 kickstarter数据采集
本文所讲的kickstarter数据是指国外知名众筹网站。Kickstarter 是一个全球知名的众筹平台,专注于帮助创作者、艺术家和创业者通过公众筹资实现创意项目。自 2009 年成立以来,该平台已成功支持了数百万个项目,涵盖艺术、科技、影视、音乐、设计等多个领域。本数据集几乎囊括了项目的所有数据。
2025-08-10 21:24:34
1663
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅