资源链接在文章末尾,包含文件:

1.需求说明
一个与行政区划边界数据相关的应用,行政区划数据从水经微图下载而来格式为kml,需要把这些数据导入到数据库 GreenPlum,并规范数据格式。源数据包含两类:
- _xx名称.txt(区域名称和中心点坐标)
- _xx边界.txt(区域名称和区域边界点坐标)
数据要转换成两类:
- 点
POINT(longitude,latitude) - 多边形
POLYGON( POINT, POINT, POINT, ... )
2.流程实例
将kml后缀批量修改为xml的脚本:
# 在文件所在文件夹下创建 .txt 文件写入以下内容后修改文件后缀为 .bat
ren *.kml *.xml
本文介绍了如何使用Kettle进行KML类型文件的处理,包括需求说明、流程实例、结果数据展示和技术总结。重点讨论了解析不同边界数据的难点,如标签路径不统一和数据格式转换,并提供了SQL转换示例以及数据入库的方法。资源链接包含所需SQL脚本和测试文件。
订阅专栏 解锁全文
1215





