
python日常分享
文章平均质量分 74
一些日常使用的 Python 技巧分享
图说交通
深耕于交通规划领域,数据分析/gis/sql/python作为辅助分析手段。
展开
-
Python应用指南:一个库解决常见的国内坐标系转换需求
本文介绍了如何使用 coord-convert 库进行不同坐标系统的转换,包括 WGS84、GCJ-02(火星坐标系)和 BD-09(百度坐标系)。首先,通过 pip install coord-convert 安装库文件,并介绍其核心功能函数,如 wgs2gcj、gcj2wgs、gcj2bd 等。接着,通过具体场景展示了如何将高德地图和百度地图的坐标转换为 WGS84 坐标,以及如何进行混合转换。原创 2025-02-07 21:01:49 · 1845 阅读 · 0 评论 -
Python应用指南:高德交通态势数据(二)
本文探讨了通过生成多个相同大小的矩形区域来实现对更大范围道路交通态势的全面查询。针对城市交通网络复杂多变的特点,提出了一种多矩形查询的方法论,确保每个子矩形都符合高德地图API对于查询区域尺寸的要求,从而提高数据采集的准确性和完整性,通过获取多个矩形区域的交通数据,将所有数合并到一个文件中,基于name、direction和angle字段进行去重处理,最终输出一个包含去重后数据的SHP文件。这种方法不仅简化了数据处理流程,我们能够更好地理解城市交通动态。原创 2025-01-08 21:28:04 · 1096 阅读 · 0 评论 -
Python应用指南:高德交通态势数据(一)
本文通过高德地图推出的交通态势查询API,用于实时获取指定区域或道路的交通状况,旨在帮助优化出行规划和提升城市管理效率。文章详细介绍了如何利用矩形区域查询功能高效获取路况信息,并通过Python脚本自动化处理流程,包括生成矩形范围、调用API获取数据、坐标转换及导出SHP文件等步骤。整个过程不仅简化了数据处理,还确保了地理信息系统间的兼容性,为智能交通系统的发展提供了有力支持。原创 2025-01-07 21:21:18 · 3731 阅读 · 1 评论 -
利用高德API获取整个城市的公交路线并可视化(七)
本文详细解析了从高德获取的公交和地铁JSON文件的精细化处理过程,旨在提升数据质量和可用性,为后续交通规划、调度优化及用户服务提供坚实的数据支持。首先,通过两次遍历JSON文件,收集并确定每条线路的方向信息(dir字段),其中单方向线路设为'0',双方向线路根据编码值大小分别设为'0'和'1'。接着,利用自定义规则对原始数据进行清洗和转换,并通过GCJ02到WGS84的坐标转换确保地理坐标的准确性。处理后的数据被保存为CSV文件,包含线路类型、名称、经纬度(WGS84)、方向等信息。原创 2024-12-18 21:15:09 · 2300 阅读 · 0 评论 -
ArcGIS应用指南:在点处打断线图层要素
在地理信息系统(GIS)中,根据特定点要素(如公交站点)来分割线要素(如公交线路)是交通规划和城市设计中的常见需求。本文以厦门的公交线路为例,提出了一种通过Python脚本精准分割线要素的方法,确保每个站点仅匹配其所属线路,避免了基于单纯空间距离可能导致的误匹配问题。该方法首先读取线路和站点的Shapefile文件,并创建一个空GeoDataFrame用于存储处理后的数据。接着,遍历每条线路,找到与之对应的站点并计算它们到线路的最近点,然后根据相邻站点之间的最近点截断线路,生成新的线段。原创 2024-12-16 21:51:59 · 1489 阅读 · 0 评论 -
GoTrackIt应用指南:共享单车时空轨迹优化
本文基于 GoTrackIt 包探讨了轨迹数据清洗功能,旨在提高GPS轨迹数据的质量和分析效率。首先,通过Python脚本对原始共享单车数据进行预处理,确保每条记录的时间精度和唯一标识符(agent_id)。接着,利用 GoTrackIt 的链式操作进行了去重停留点、增密和卡尔曼滤波平滑等处理,优化了轨迹数据的连续性和准确性。具体步骤包括:读取并转换CSV文件格式,创建唯一ID,调整时间字段精度,去除重复定位点,并应用轨迹清洗算法。最终输出清洗后的CSV文件及HTML可视化结果。原创 2024-12-13 20:42:42 · 1443 阅读 · 0 评论 -
共享单车轨迹数据分析:以厦门市共享单车数据为例(十二)
本文依据中国城市规划设计研究院(CAUPD)自2020年至2024年发布的《中国主要城市共享单车/电单车骑行报告》中关于厦门市的各项指标描述和分类方法进行了数据清洗。通过参考报告中的数据结论和标准分类体系,我们优化了清洗过程,确保其标准化和可比性。具体而言,本文首先对齐了时间、地理、用户、车辆及骑行特征等信息颗粒度,并引入了严格的订单有效性限制条件,如最小骑行距离50米、最小持续时间1分钟、定位点间隔不超过1分钟且距离不超过100米、订单超时3分钟重新编号、最大骑行距离15公里及最大持续时间1小时等。原创 2024-12-09 23:09:11 · 2310 阅读 · 0 评论 -
GoTrackIt应用指南:共享单车时空轨迹可视化
本文介绍了 GoTrackIt 平台如何通过集成并封装 Kepler.gl 的部分功能,利用 KeplerVis 类显著简化地理空间数据的分析与可视化过程。借助 GoTrackIt,开发者和数据分析师无需深入掌握 Kepler.gl 的底层细节,便可在网页端快速实现复杂地理数据的动态可视化。该平台提供了一系列便捷的功能,包括数据加载、地图样式配置、交互元素添加及可视化组件生成,极大地提高了工作效率。原创 2024-12-05 22:18:44 · 1314 阅读 · 2 评论 -
Python应用指南:地铁两站之间最短路径查询
本文以厦门市地铁为例,通过Python脚本实现地铁两站之间最短路径的查询。具体步骤包括:从CSV文件中读取地铁站点和线路数据,使用NetworkX库构建地铁网络的图结构,利用Dijkstra算法计算最短路径,并使用Matplotlib库绘制地铁网络图,高亮显示最短路径。脚本还检查了图的连通性,确保图中的任意两个顶点都至少存在一条路径相连接。本文的方法同样适用于公交线路,只需增加公交线路字段来界定换乘线路。通过这一方法,乘客可以快速、准确地找到从起始站到目的站的最佳乘车线路。原创 2024-10-25 21:23:37 · 1538 阅读 · 0 评论 -
Python应用指南:利用高德地图API实现路径规划
本文介绍了如何使用高德地图API实现步行和驾车路径规划,并将结果保存为SHP和CSV文件。首先,通过高德地图API拾取坐标器获取起终点坐标。接着,构建请求参数并发送HTTP请求,解析返回的JSON数据,提取路径规划的详细信息,包括总距离、总时间、每一步的指令、距离、时间和路径。然后,使用Shapely库将路径坐标转换为WGS84坐标系,并创建LineString几何对象。最后,使用GeoPandas将路径数据保存为SHP文件,使用Pandas将详细步骤保存为CSV文件。原创 2024-10-23 21:18:01 · 4621 阅读 · 6 评论 -
Python应用指南:利用高德地图API获取公交可达圈
本文聚焦于通过公共交通(公交、地铁及组合)获取一定时间内可到达的范围。使用高德地图API的公交到达圈功能,对城市某一点的公交可达圈进行详细分析,旨在为城市规划、交通优化和个人出行提供数据支持。通过构建请求URL、坐标转换(GCJ-02 to WGS84)和点集转CSV等步骤,获取并可视化从虹桥火车站出发45分钟内可通过公交和地铁到达的区域。结果显示,向西最远可达徐泾新区,向东最远可达世纪大道,向北可达七宝老街,向南可达丰庄。原创 2024-10-14 21:05:42 · 2279 阅读 · 0 评论 -
Python应用指南:利用高德地图API获取POI数据
本文通过Python编程语言和高德地图API,实现对指定区域内的POI数据的高效获取和处理。首先,通过高德拾取坐标生成矩形区域,并打印坐标。接着,调用高德地图API获取POI数据,并使用多线程技术提高数据下载速度。数据保存为GeoJSON格式,便于后续的数据分析和可视化。最后,将多个GeoJSON文件转换为CSV格式,统一合并成一个文件。原创 2024-09-23 20:56:04 · 9649 阅读 · 3 评论 -
共享单车轨迹数据分析:以厦门市共享单车数据为例(五)
本文介绍了如何将电子围栏数据转换成可用的图层数据。通过解析包含坐标点的CSV文件,使用Python脚本将每个电子围栏的坐标点转换为多边形,并保存为Shapefile格式。这些多边形在ArcGIS中展示了电子围栏在路网和地铁站周边的分布情况。进一步,通过计算每个电子围栏区域的中心点并进行核密度分析,生成了共享单车在岛内不同区域的集中程度图。结合人口栅格数据和共享单车订单数据,发现三者在空间上高度重合,表明共享单车的投放策略与人口分布和使用需求紧密相关。原创 2024-09-20 20:46:14 · 3115 阅读 · 1 评论 -
Python应用指南:获取行政区最小外接矩形
本文介绍了如何通过计算行政区的最小外接矩形来解决基于行政区划数据裁剪时可能出现的数据匹配不上或丢失的问题。由于行政边界的不规则性,直接使用行政边界进行数据裁剪可能会导致边界附近的数据丢失。通过计算并使用最小外接矩形,可以在确保数据完整性的基础上,适度扩大裁剪范围,保留二次处理的空间。此外,对于需要获取行政区内部POI(兴趣点)数据的应用场景,建立外接矩形可以避免因行政区形状不规则而造成的数据缺失。原创 2024-09-10 20:50:08 · 1218 阅读 · 0 评论 -
利用高德API获取整个城市的公交路线并可视化(三)
本文介绍了如何使用Python从8684网站抓取公交线路信息,并通过高德地图API获取公交站点的经纬度信息,同时将坐标从高德坐标系(GCJ-02)转换为国际通用的WGS84坐标系,通过对比抓取到的数据与杭州市公共交通集团官方网站公布的数据,评估了数据的质量和准确性,发现了一定程度的偏差,这可能是由于第三方数据源更新滞后导致的。尽管如此,这样的数据仍然具有一定的分析价值,可用于研究城市公共交通的分布和其他相关指标。原创 2024-09-02 20:44:05 · 1774 阅读 · 0 评论 -
pip包管理指南:更新包、延时报错、版本冲突
本文介绍了使用pip工具在Python环境中下载和更新软件包时遇到的延迟问题及解决方案。由于默认使用的国外镜像服务器可能导致下载缓慢甚至超时,可以通过更换国内镜像源来加速下载过程。文中列举了几种常用的国内镜像源,如阿里云、中国科技大学、豆瓣等,并提供了具体的pip命令示例,如pip install --upgrade pip用于更新pip本身,以及如何设置超时时间来避免下载中断。原创 2024-07-03 20:59:16 · 1355 阅读 · 0 评论 -
OpenStreetMap 数据介绍与下载指南
本文介绍了OpenStreetMap(OSM)的数据特点及其下载方法。OSM是一个由全球志愿者维护的开源地图项目,其数据覆盖了道路、建筑、水体等多种地理要素,具有开放性、可编辑性和全球覆盖的特点。OSM数据可通过两种方式进行下载:一是通过框选范围下载特定区域的数据,二是直接下载整个国家或地区的全部数据。此外,还可以通过第三方平台如BBBike和Geofabrik等获取数据。OSM的数据标签丰富多样,特别是"fclass"字段提供了详细的27种道路分类,有助于进行精细化分析。原创 2024-07-14 11:14:15 · 7567 阅读 · 0 评论 -
Python本地安装whl文件详解与高级pip命令技巧
本文介绍了如何处理Python包安装过程中遇到的问题,特别是在网络不稳定或包不兼容的情况下,可以通过下载.whl文件来进行本地安装。.whl文件是一种预编译的二进制包格式,适用于不同的操作系统和架构。文中详细解释了不同后缀的.whl文件代表的意义,例如win32和win_amd64分别对应32位和64位Windows系统。此外,还提供了具体的安装命令示例,如使用pip install命令来安装特定版本的包或从本地路径安装.whl文件。对于卸载包,同样可以通过pip uninstall命令来移除不再需要的包原创 2024-07-21 09:03:04 · 24636 阅读 · 1 评论 -
OSMnx应用指南:计算路网最短路径并可视化(一)
本文通过Python编程语言和相关库如NetworkX、OSMnx以及matplotlib,展示了如何计算并可视化从指定起点到终点的最短路径。首先,使用OSMnx库获取了厦门市思明区的路网数据,并将路网中的节点ID进行了重新编号,便于后续处理。接着,选择了起始节点和目标节点,并利用NetworkX计算了这两点之间的最短路径,考虑了道路长度作为路径计算的权重。最后,利用matplotlib和OSMnx的绘图功能,将计算出的最短路径以红色高亮显示在路网图上,并保存为PNG格式的图像文件。原创 2024-07-22 19:23:27 · 2027 阅读 · 2 评论 -
OSMnx应用指南:计算路网最短路径并可视化(二)
本文通过Python编程语言和相关库如osmnx、networkx以及matplotlib,展示了如何计算和可视化多组起点与终点之间的最短路径。首先,通过osmnx库获取了厦门市思明区的路网数据,并利用igraph和networkx进行数据处理。接着,定义了几组起点和终点,并计算了它们之间的最短路径,考虑了通行时间作为路径计算的权重。利用matplotlib和osmnx的绘图功能,将计算出的最短路径以不同颜色高亮显示在路网图上,并计算了每条路径的距离和预计通行时间。原创 2024-07-23 19:38:33 · 1449 阅读 · 0 评论 -
OSMnx快速指南:路网下载、速度赋值、通行时间计算及可视化
本文展示了如何使用Python的osmnx库快速操作地理空间数据,以厦门市思明区为例。通过两行代码即可可视化展示该区域的路网结构。接着,使用三行代码下载并保存该区域的驾车路网为GeoPackage文件。为了进一步丰富路网数据,五行代码即可为路网中的每条路段分配速度信息和估算通行时间。最后,利用五行代码设置了详细的可视化参数,包括背景色、节点颜色与大小以及边的颜色与宽度等,实现了对路网图美观且清晰的展示。这些简洁高效的代码示例为地理空间数据分析提供了实用的参考。原创 2024-07-23 20:11:06 · 564 阅读 · 0 评论 -
基于python的百度迁徙迁入、迁出数据分析(三)
本文详细介绍了百度迁徙数据的定义及历史数据可追溯的时间区间。百度迁徙定义为:用户离开其常住地或停留超过一天的非常住地,并在非出发城市停留超过4小时视为到达新城市,以此排除途经地。文章明确了可获取的历史数据时间区间为2019年1月12日至3月9日、2023年1月4日至5月6日以及2024年1月23日至7月28日。通过Python脚本,可以自动获取这些时间段内的迁徙数据,并将其保存为CSV文件,便于后续分析使用。原创 2024-07-29 20:30:32 · 949 阅读 · 0 评论 -
地址转坐标:利用高德API进行批量地理编码
本文介绍了如何批量将地址数据转换为地理坐标的几种方法。首先,通过使用高德地图的地理编码API,可以直接在线批量转换地址为GCJ-02坐标系下的经纬度坐标。此方法适用于个人开发者,每日限额为5000条数据。对于无法自动转换的地址,可以手动使用高德坐标拾取器获取坐标。此外,还提供了Python脚本示例,用于自动化处理XLSX文件中的地址数据,将其转换为带有经纬度的坐标信息,并保存为新的Excel文件。对于需要转换坐标系的需求,可以利用在线工具将GCJ-02坐标转换为WGS84或BD09坐标系。原创 2024-08-05 20:04:15 · 7715 阅读 · 4 评论 -
基于python的百度迁徙迁入、迁出数据分析(七)
本文介绍了如何使用Python脚本获取百度迁徙指数数据,并分别提供了针对城市尺度、省份尺度和全国尺度的代码示例。通过这些代码,可以自动抓取百度迁徙数据库的历史数据,并将结果保存为Excel文件。数据范围覆盖了2019年初至2024年8月初的时间段。用户可以根据需求选择不同的尺度版本来获取迁入或迁出规模指数,便于进一步分析人口迁移模式。原创 2024-08-08 21:42:07 · 1108 阅读 · 0 评论 -
利用Python进行COVID-19全球疫情数据集可视化分析
本文介绍了如何使用Python脚本处理约翰斯·霍普金斯大学提供的全球COVID-19疫情数据,该数据集涵盖了2020年1月22日至2023年3月9日的时间范围。通过自动化处理每日CSV文件,汇总了全球各国的感染人数和死亡人数,并生成了全球汇总数据文件。此外,还特别分析了中国上海地区的COVID-19感染趋势,对比了湖北省的数据,展示了上海在经历封城等防控措施后疫情得到有效控制的过程。通过可视化手段,本文展示了中法美英德五国在同一时期的感染人数累计动态,揭示了各国疫情的发展情况及其防控措施的效果。原创 2024-08-17 11:29:42 · 1223 阅读 · 0 评论 -
基于python的百度迁徙迁入、迁出数据分析(四)
本文对百度迁徙数据的可获取时间区间进行了修正,通过开发者模式找到了包含更多数据的信息源,包括春运迁徙数据等。经过进一步挖掘,确认可以从2019年至2024年的春运期间获取迁徙数据,以及其他特定时间段的数据。文中还分享了2020年至2024年春运期间迁入上海市的40天数据完整度情况,数据存在一定的缺失,但可以通过等比例扩样来补全。这些发现为研究春运期间的人口流动提供了有价值的数据支持。原创 2024-07-30 19:58:24 · 616 阅读 · 0 评论 -
OSMnx应用指南:计算路网介数中心度(Betweenness Centrality)
本文通过介数中心度这个衡量网络中节点重要性的指标来反映了节点在网络中最短路径中的中介作用,Python中的networkx和osmnx库,以厦门市思明区为例,展示了如何计算街道网络中节点的介数中心度。首先,从地理位置信息构建了思明区的道路网络图,并计算了网络的基本统计信息。接着,通过计算介数中心度找出网络中重要的节点,即那些经常被作为最短路径上的“中介”节点。这些节点往往位于交通瓶颈处,对整个路网的运行效率有着显著影响。原创 2024-07-17 20:09:58 · 1184 阅读 · 0 评论 -
ipynb 文件转换指南:Markdown (.md) 和PDF (.pdf) 格式
本文介绍了如何将Jupyter Notebook (.ipynb) 文件转换为Markdown (.md) 和PDF (.pdf) 格式。对于转换为PDF,可以直接使用在线工具如 IPYNB 转换器 (onlineconvertfree.com) 实现,无需编写额外的脚本。而对于转换为Markdown格式,可以通过Python的nbconvert库实现自动化转换。具体步骤包括:安装nbconvert库,读取Jupyter Notebook文件,使用MarkdownExporter导出为Markdown格式。原创 2024-07-15 19:41:16 · 2065 阅读 · 0 评论 -
OSMnx应用指南:基于步行可达性绘制等时线地图
本文展示了如何使用OSMnx和NetworkX库来计算并可视化从一个指定起点出发,在不同时间阈值内可到达的区域(等时线)。首先,代码获取了中国福建省厦门市思明区的步行网络数据,并定义了一个特定的经纬度作为等时线的中心点。接着,通过计算步行速度下的旅行时间,为网络中的每条边分配了时间权重。利用NetworkX的最短路径算法,代码生成了一系列等时线多边形,代表了在不同时间限制下可到达的最大范围。最后,通过GeoPandas和Matplotlib将这些等时线可视化在地图上,并保存为PNG文件。原创 2024-07-20 17:36:45 · 736 阅读 · 0 评论 -
OSMnx应用指南:创建交互式地图
本文展示了如何使用OSMnx库创建一个交互式的地图,用于探索厦门市思明区的街道网络、建筑物、公园、公交站点及地铁站等城市元素。通过定义地点和地图样式,代码获取了所需的地理数据,并设置了不同图层的颜色、大小等可视化属性。最终,地图被保存为HTML文件,用户可以通过浏览器查看并交互,包括缩放和平移地图、点击以获取特定位置的信息等。这种方法便于直观理解城市布局和元素分布,适用于城市规划、地理研究等多个领域。原创 2024-07-19 20:00:45 · 539 阅读 · 0 评论 -
OSMnx应用指南:路网速度与通行时间推算及分析
本文介绍了如何使用OSMnx库对广州市的路网进行限速和通行时间的计算与分析。首先,通过graph_from_place函数下载广州市的街道网络图,并利用add_edge_speeds和add_edge_travel_times函数为图中的每条边添加速度和通行时间信息。接着,将图转换为GeoDataFrame,并按道路类型分组,计算每种类型的平均长度、速度和旅行时间。最后,将处理后的路网数据保存为GeoPackage文件,并导出速度和通行时间的统计结果到Excel文件。通过ArcGIS Pro展示路网速度,原创 2024-07-15 20:13:18 · 1055 阅读 · 0 评论 -
OSMnx应用指南:OpenStreetMap路网数据下载及可视化
本文介绍了使用GeoPackage (GPKG) 数据格式进行路网数据处理和可视化的流程。GeoPackage是一种基于SQLite的地理空间数据存储格式,相比传统的Shapefile (shp) 具有更多优势,如支持SQL查询、高效处理大规模数据等。使用Python的osmnx库可以从OpenStreetMap (OSM) 下载路网数据,并将其保存为GeoPackage格式。通过简单的Python脚本即可完成广州市路网数据的下载和保存。此外,文章还提供了批量下载多个地区路网数据的示例代码,并展示了如何将原创 2024-07-13 17:47:40 · 2217 阅读 · 3 评论 -
OSMnx应用指南:对路网节点进行简化
本文介绍了如何使用OSMnx库简化道路网络中的节点,以提高大型或复杂路网的分析效率。首先,从指定的地理坐标点构建了一个500米范围内的原始路网,并通过区分终端节点和其他节点的颜色来进行可视化。随后,通过调整consolidate_intersections函数中的tolerance参数至15米,实现了对节点的合并,从而减少了路网中的节点数量。此外,还展示了如何应用这一方法对整个城市的路网进行优化,以广州市为例,简化后的路网节点数量显著降低,有效提升了路网分析的效率和准确性。这种方法对于城市规划和交通管理等领原创 2024-07-16 20:38:50 · 1519 阅读 · 1 评论 -
基于python的百度迁徙迁入、迁出数据分析(二)
本文介绍了如何使用智图交互地图 (geoq.cn) 平台对获取的数据进行可视化展示的过程。首先,通过下载数据模板并按照模板格式修改数据后上传至平台。接着,设置了数据的渲染方式,包括分级字段、分级级数、透明度、线样式等选项,以达到美观的效果。本文展示了2024年5月1日至5月5日期间,上海节假日期间迁出热门城市的趋势,通过筛选迁徙规模指数最高的前20个城市,揭示了上海周边如杭州、苏州、南通等地成为热门目的地的事实。此外,还通过GIF动画形式展示了这一时间段内上海的人口迁入数据,直观反映了节假日人口流动的特点。原创 2024-06-25 20:57:00 · 710 阅读 · 0 评论 -
基于python的百度迁徙迁入、迁出数据分析(一)
本文介绍了一种使用Python编程语言来抓取和分析百度迁徙数据的方法。通过构建一个包含中国各城市编码的字典,程序能够自动获取指定时间段内特定城市(如上海市)与其他城市之间的迁入和迁出数据。此过程涉及发送HTTP请求到百度迁徙平台以获取JSON格式的数据,并将其解析后存储到Excel文件中。代码实现了自动遍历日期范围的功能,并为每一对城市创建迁徙规模指数记录,便于后续分析人口流动趋势。此外,还提供了将数据保存为.xlsx文件的方法,方便用户进一步处理和可视化这些数据。原创 2024-06-25 20:56:15 · 1042 阅读 · 0 评论 -
利用高德API获取整个城市的公交路线并可视化(一)
本文使用Python抓取和处理公交线路数据的方法,通过爬取8684公交网站上的公交线路名称,并将其保存为文本文件。接着,利用高德地图API,根据获取的线路名称抓取详细的公交线路信息,包括始发站、终点站、行车区间、全程长度、途径站点名称、坐标以及站点序号等。所获取的数据被整理成Pandas DataFrame格式,并最终保存为CSV文件,供后续的地理空间分析和可视化使用。这一过程涉及网络请求、网页解析、API调用以及数据处理等多个步骤。原创 2024-06-21 11:19:42 · 2609 阅读 · 2 评论 -
利用高德API获取整个城市的公交路线并可视化(二)
本文通过Python对数据进行预处理,然后读取包含公交线路信息的CSV文件,利用Pandas库对原始数据进行清洗和重组,提取出公交线路名称 (line_name)、站点名称 (station_name)、站点坐标 (station_coords) 和站点序列号 (station_sequence) 四个关键字段,并将这些信息整理成新的DataFrame。之后,将处理好的数据导出为Excel文件 (.xlsx),以便于在ArcGIS 10.8中进行进一步的地理空间原创 2024-06-21 17:32:19 · 1004 阅读 · 0 评论 -
DBF文件批量提取字段并合成excel
本文通过Python代码演示了如何从多个DBF文件中提取特定列的数据,并将这些数据汇总到一个Excel文件中。首先,代码设置了DBF文件所在的文件夹路径以及需要提取的列名列表。接着,利用openpyxl库创建了一个新的Excel工作簿,并添加了一个工作表,同时在第一行写入列标题。通过遍历指定文件夹下的所有DBF文件,使用dbfread库逐个读取文件,并针对每条记录提取指定列的数据,只有当这些数据都不为空时才将其写入Excel工作表。最后,将汇总的工作簿保存到预先设定的路径下。原创 2024-02-02 15:03:07 · 416 阅读 · 0 评论 -
GeoJSON数据处理:Python批量转换为CSV与Shapefile
本文介绍了如何使用Python脚本将GeoJSON文件转换为CSV和Shapefile两种格式。首先,通过一个简单的Python脚本将GeoJSON数据转换为CSV文件,便于数据预处理和初步分析。接着,利用geopandas库直接将GeoJSON文件转换为Shapefile格式,这是一种广泛应用于GIS领域的矢量数据格式。尽管在处理中文字符时可能会遇到一些挑战,如乱码和字符限制的问题,但这种方法仍然提供了便捷的数据转换途径。文章还提供了一个逐步调试的建议,即逐个字段打印数据以排查潜在的编码问题。原创 2024-06-05 17:57:21 · 938 阅读 · 0 评论 -
深圳市政府公开数据集获取:API接口自动化下载指南
本文介绍了如何通过注册深圳市政府公开数据平台账号并使用API接口来批量下载数据集。首先,需要注册并实名认证账号以获得更高的数据下载权限。接着,通过指定的API接口获取所需的数据,其中涉及到设置每页返回的记录数(ROWS)和总数据条数(DataSize),进而计算出总页数。使用Python的requests库发送HTTP请求,并利用pandas库处理返回的JSON数据,将其转换为DataFrame格式并保存为CSV文件。整个过程通过自动化脚本实现,极大地提高了数据下载和处理的效率。原创 2023-11-03 17:47:49 · 2594 阅读 · 0 评论