XML 和 json 中提取

本文介绍了如何使用esProc SPL从XML和JSON数据中提取信息。通过解析XML和JSON字符串,形成多层结构数据,然后转换为目标二维表格。具体例子包括从XML文件中提取分类和明细,以及将多层JSON数据二维化并保存为CSV格式。
部署运行你感兴趣的模型镜像

1 思路

XML和json中提取:

读取字串,用xml和json函数解析成多层结构数据,再运算成需要的目标

2 举例

2.1 xml中提取

有xml文件xml.xml,数据如下所示:

从多层 xml 取出分类和明细,形成二维表,结果如下:

编写SPL脚本:

A
1=file("xml.xml").read().import@x()
2=A1.xml.li.(form).new(h3,p.select.option)
3=A2.news(option;h3:name,~:time)
4=file("result.txt").export@t(A3)

A1 把xml的数据读成串,串按xml解析成多层序表

A2 按多层级节点整理序表

A3 将序表A2中的多个option值展开,合并成新的序表

A4 结果导出到result.txt

2.2 json中提取

有json文件json.json,数据如下所示:

需要把这个多层json二维化,存为csv。identities字段里还有俩字段,拆到上级同级,结果如下:

编写SPL脚本:

A
1=file("json.json").read()
2=json(A1).users.new(displayName,givenName,surname,extension_user_type,identities.signInType:issuerType,identities.issuerAssignedId,extension_timezone,extension_locale,extension_tenant)
3=file("json.csv").export@tc(A2)

简要说明:

A1 把json文件中的数据读成串

A2 串按json格式解析成多层序表,用new函数将identities.signInType和identities.issuerAssignedId拆到上级

A3 结果导出到json.csv

您可能感兴趣的与本文相关的镜像

Langchain-Chatchat

Langchain-Chatchat

AI应用
Langchain

Langchain-Chatchat 是一个基于 ChatGLM 等大语言模型和 Langchain 应用框架实现的开源项目,旨在构建一个可以离线部署的本地知识库问答系统。它通过检索增强生成 (RAG) 的方法,让用户能够以自然语言与本地文件、数据库或搜索引擎进行交互,并支持多种大模型和向量数据库的集成,以及提供 WebUI 和 API 服务

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值