XML格式化

直接上代码:

// 格式化 XML 的函数
function formateXml(xmlStr) {
    let text = xmlStr;
    // 使用 replace 去除多余空格
    text = '\n' + text.replace(/(<\w+)(\s.*?>)/g, function ($0, name, props) {
        return name + ' ' + props.replace(/\s+(\w+=)/g, " $1");
    }).replace(/></g, ">\n<");

    // 处理注释
    text = text.replace(/\n/g, '\r').replace(/<!--(.+?)-->/g, function ($0, text) {
        var ret = '<!--' + escape(text) + '-->';
        return ret;
    }).replace(/\r/g, '\n');

    // 调整格式,以压栈方式递归调整缩进
    var rgx = /\n(<(([^\?]).+?)(?:\s|\s*?>|\s*?(\/)>)(?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?)/mg;
    var nodeStack = [];
    var output = text.replace(rgx, function ($0, all, name, isBegin, isCloseFull1, isCloseFull2, isFull1, isFull2) {
        var isClosed = (isCloseFull1 == '/') || (isCloseFull2 == '/') || (isFull1 == '/') || (isFull2 == '/');
        var prefix = '';
        if (isBegin == '!') { //!开头
            prefix = setPrefix(nodeStack.length);
        } else {
            if (isBegin != '/') { ///开头
                prefix = setPrefix(nodeStack.length);
                if (!isClosed) { // 非关闭标签
                    nodeStack.push(name);
                }
            } else {
                nodeStack.pop(); // 弹栈
                prefix = setPrefix(nodeStack.length);
            }
        }
        var ret = '\n' + prefix + all;
        return ret;
    });

    var prefixSpace = -1;
    var outputText = output.substring(1);
    // 处理数据为空的换行,将类似 <CostCurr3>\n    </CostCurr3> 转换为 <CostCurr3> </CostCurr3>
    // outputText = outputText.replace(/<([^>]+)>\s*<\/(\1)>/g, '<$1> </$1>');

    // 还原注释内容
    outputText = outputText.replace(/\n/g, '\r').replace(/(\s*)<!--(.+?)-->/g, function ($0, prefix, text) {
        if (prefix.charAt(0) == '\r')
            prefix = prefix.substring(1);
        text = unescape(text).replace(/\r/g, '\n');
        var ret = '\n' + prefix + '<!--' + text.replace(/^\s*/mg, prefix) + '-->';
        return ret;
    });
    outputText = outputText.replace(/\s+$/g, '').replace(/\r/g, '\r\n');
    return outputText;
}

// 计算缩进前缀的函数
function setPrefix(prefixIndex) {
    var result = '';
    var span = '    '; // 缩进长度
    var output = [];
    for (var i = 0; i < prefixIndex; ++i) {
        output.push(span);
    }
    result = output.join('');
    return result;
}

// 示例未格式化 XML
const unformattedXML = "<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"yes\"?><MsgText><code>0000</code><info>交易成功</info><GrpHdr><SysId>CNAPS</SysId><UId>0101a0c5-0075-4cd0-9aa4-5f5ed6d57adb</UId><TranCode>001030</TranCode><TranDate>2024-12-05</TranDate><TranTime>15:36:36</TranTime><Token>eyJhbGciOiJIUzUxMiJ9.eyJqdGkiOiJjODRkMjNmNC04OWY4LTRkOWQtOTM3MS1jODI3YzBjYTljY2UiLCJpYXQiOjE3MzMzODQxOTYsImV4cCI6MTczMzM5MTM5NiwidHJhblNyYyI6IkNOQVBTIn0.SjloHA9ztxn-ghC6SESp7BEvU15vPiEgp3nHipEXDeiDrJ3qRMG13RKqdQJAUT6hg--YvFN0LPwsqlzW3PDn0Q</Token></GrpHdr><BusiText><![CDATA[<?xml version=\"1.0\" encoding=\"UTF-8\"?><root><OHead><MSGTYPE>1</MSGTYPE><TRANASYNC>0</TRANASYNC><TRANCODE>123456</TRANCODE><ROUTETYPE>05</ROUTETYPE><APTRACENQ>050000024 </APTRACENQ><APRETCODE>990000000 </APRETCODE><PRQDUCTCQDE> </PRQDUCTCQDE><EXTENDFLC> </EXTENDFLC><EXTENDFLC2> </EXTENDFLC2><FILLER> </FILLER><DATALEN>0001121</DATALEN></OHead><BHead><InputCode>00</InputCode><MessageType>00</MessageType><MessageLength>0997</MessageLength><Cycle>000000</Cycle><MsgNo>000000</MsgNo><SemiAutoFlag>1</SemiAutoFlag><Type>0</Type><Flag1>4</Flag1><Flag2>2</Flag2><Flag3>C</Flag3><Flag4>X</Flag4><SubSysChannel> </SubSysChannel><SupervisorId>0000000</SupervisorId><OldAcctFlag>0</OldAcctFlag><UUID>143100000173 </UUID></BHead><comm><OutputCode>RF</OutputCode><OutFlag>>R</OutFlag><ErrorCode>0000</ErrorCode><AccountsNo>01</AccountsNo><BankCode>125</BankCode><Account>00100002500025714</Account><DepositsLoan>D</DepositsLoan><RfDate>20230325</RfDate><RfTime>07332872</RfTime><CustNo>00000006072009196</CustNo><Signatories>00</Signatories><TaxCurrent>    </TaxCurrent></comm></root>]]></BusiText></MsgText>";

// 调用格式化函数
const formattedXML = formateXml(unformattedXML);

// 输出格式化后的 XML
console.log(formattedXML);

在线演示:

Javascript在线运行代码,代码编辑器 - 图灵工具 在线工具系统

代码分析:

1. 处理标签属性间的多余空格

text = '\n' + text.replace(/(<\w+)(\s.*?>)/g, function ($0, name, props) { return name + ' ' + props.replace(/\s+(\w+=)/g, " $1"); }).replace(/></g, ">\n<");
正则解析:
  • (<\w+):匹配 XML 开始标签的名称(如
  • (\s.*?>):匹配该标签内的所有属性(包括 >),如 attr="value">。
  • props.replace(/\s+(\w+=)/g, " $1"):
    • 作用:去除属性前多余的空格。
    • \s+(\w+=):匹配 attr= 之前的多余空格(如 attr = ),替换成 attr=
📌 最终效果
  • <tag  attr = "value"> 变成 <tag  attr="value">
  • /></g, ">\n<" 作用是让相邻的标签换行,使 XML 结构清晰。

2. 处理 XML 注释

text = text.replace(/\n/g, '\r').replace(/<!--(.+?)-->/g, function ($0, text) { var ret = '<!--' + escape(text) + '-->'; return ret; }).replace(/\r/g, '\n');
正则解析:
  • <!--(.+?)-->
    • <!--开头, -->结尾,(.+?) 表示中间的注释内容。
    • .+? 是非贪婪匹配,确保匹配到 --> 之前的内容,而不会贪婪匹配到后面的注释。
📌 处理逻辑
  • escape(text):对注释内容进行编码,避免后续处理影响注释的原始内容。
  • 先将 \n 替换为 \r,处理完后再恢复。

3. 递归调整 XML 层级缩进

var rgx = /\n(<(([^\?]).+?)(?:\s|\s*?>|\s*?(\/)>)(?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?)/mg;
正则解析
  • (<(([^\?]).+?):
    • (<([^\?]).+?):匹配 XML 标签,确保不匹配 这种声明。
  • (?:\s|\s*?>|\s*?(\/)>)
    • 处理单标签<tag/>  和普通标签 <tag>。
  • (?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?
    • 识别<tag></tag> 或者<tag/> 的闭合方式。
📌 作用
  • 通过 nodeStack 栈结构来追踪 XML 的嵌套层级,并调整缩进。

4. 处理空数据的换行

// outputText = outputText.replace(/<([^>]+)>\s*<\/(\1)>/g, '<$1> </$1>');
正则解析
  • <([^>]+)>\s*<\/(\1)>
    • ([^>]+):匹配标签名称,如 CostCurr3。
    • \s*:匹配标签内的空格或换行,如 <CostCurr3>\n  </CostCurr3>。
    • <\/(\1)>:匹配相同的闭合标签。
📌 作用
  • 把 <CostCurr3>\n    </CostCurr3> 变为<CostCurr3> </CostCurr3> ,避免无意义的换行。
  • 根据自己需求来,我这里是要保留标签内的空格,所以注释掉了

5. 还原注释

outputText = outputText.replace(/\n/g, '\r').replace(/(\s*)<!--(.+?)-->/g, function ($0, prefix, text) { if (prefix.charAt(0) == '\r') prefix = prefix.substring(1); text = unescape(text).replace(/\r/g, '\n'); var ret = '\n' + prefix + '<!--' + text.replace(/^\s*/mg, prefix) + '-->'; return ret; });
📌 作用
  • 之前 escape 过的注释,这里 unescape 还原。
  • 还原时保持注释前的缩进,确保格式整齐。

6. 计算缩进

function setPrefix(prefixIndex) { var result = ''; var span = ' '; // 4 个空格 var output = []; for (var i = 0; i < prefixIndex; ++i) { output.push(span); } result = output.join(''); return result; }
📌 作用
  • 通过 prefixIndex 计算当前 XML 层级,并使用 4 个空格进行缩进。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值