直接上代码:
// 格式化 XML 的函数
function formateXml(xmlStr) {
let text = xmlStr;
// 使用 replace 去除多余空格
text = '\n' + text.replace(/(<\w+)(\s.*?>)/g, function ($0, name, props) {
return name + ' ' + props.replace(/\s+(\w+=)/g, " $1");
}).replace(/></g, ">\n<");
// 处理注释
text = text.replace(/\n/g, '\r').replace(/<!--(.+?)-->/g, function ($0, text) {
var ret = '<!--' + escape(text) + '-->';
return ret;
}).replace(/\r/g, '\n');
// 调整格式,以压栈方式递归调整缩进
var rgx = /\n(<(([^\?]).+?)(?:\s|\s*?>|\s*?(\/)>)(?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?)/mg;
var nodeStack = [];
var output = text.replace(rgx, function ($0, all, name, isBegin, isCloseFull1, isCloseFull2, isFull1, isFull2) {
var isClosed = (isCloseFull1 == '/') || (isCloseFull2 == '/') || (isFull1 == '/') || (isFull2 == '/');
var prefix = '';
if (isBegin == '!') { //!开头
prefix = setPrefix(nodeStack.length);
} else {
if (isBegin != '/') { ///开头
prefix = setPrefix(nodeStack.length);
if (!isClosed) { // 非关闭标签
nodeStack.push(name);
}
} else {
nodeStack.pop(); // 弹栈
prefix = setPrefix(nodeStack.length);
}
}
var ret = '\n' + prefix + all;
return ret;
});
var prefixSpace = -1;
var outputText = output.substring(1);
// 处理数据为空的换行,将类似 <CostCurr3>\n </CostCurr3> 转换为 <CostCurr3> </CostCurr3>
// outputText = outputText.replace(/<([^>]+)>\s*<\/(\1)>/g, '<$1> </$1>');
// 还原注释内容
outputText = outputText.replace(/\n/g, '\r').replace(/(\s*)<!--(.+?)-->/g, function ($0, prefix, text) {
if (prefix.charAt(0) == '\r')
prefix = prefix.substring(1);
text = unescape(text).replace(/\r/g, '\n');
var ret = '\n' + prefix + '<!--' + text.replace(/^\s*/mg, prefix) + '-->';
return ret;
});
outputText = outputText.replace(/\s+$/g, '').replace(/\r/g, '\r\n');
return outputText;
}
// 计算缩进前缀的函数
function setPrefix(prefixIndex) {
var result = '';
var span = ' '; // 缩进长度
var output = [];
for (var i = 0; i < prefixIndex; ++i) {
output.push(span);
}
result = output.join('');
return result;
}
// 示例未格式化 XML
const unformattedXML = "<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"yes\"?><MsgText><code>0000</code><info>交易成功</info><GrpHdr><SysId>CNAPS</SysId><UId>0101a0c5-0075-4cd0-9aa4-5f5ed6d57adb</UId><TranCode>001030</TranCode><TranDate>2024-12-05</TranDate><TranTime>15:36:36</TranTime><Token>eyJhbGciOiJIUzUxMiJ9.eyJqdGkiOiJjODRkMjNmNC04OWY4LTRkOWQtOTM3MS1jODI3YzBjYTljY2UiLCJpYXQiOjE3MzMzODQxOTYsImV4cCI6MTczMzM5MTM5NiwidHJhblNyYyI6IkNOQVBTIn0.SjloHA9ztxn-ghC6SESp7BEvU15vPiEgp3nHipEXDeiDrJ3qRMG13RKqdQJAUT6hg--YvFN0LPwsqlzW3PDn0Q</Token></GrpHdr><BusiText><![CDATA[<?xml version=\"1.0\" encoding=\"UTF-8\"?><root><OHead><MSGTYPE>1</MSGTYPE><TRANASYNC>0</TRANASYNC><TRANCODE>123456</TRANCODE><ROUTETYPE>05</ROUTETYPE><APTRACENQ>050000024 </APTRACENQ><APRETCODE>990000000 </APRETCODE><PRQDUCTCQDE> </PRQDUCTCQDE><EXTENDFLC> </EXTENDFLC><EXTENDFLC2> </EXTENDFLC2><FILLER> </FILLER><DATALEN>0001121</DATALEN></OHead><BHead><InputCode>00</InputCode><MessageType>00</MessageType><MessageLength>0997</MessageLength><Cycle>000000</Cycle><MsgNo>000000</MsgNo><SemiAutoFlag>1</SemiAutoFlag><Type>0</Type><Flag1>4</Flag1><Flag2>2</Flag2><Flag3>C</Flag3><Flag4>X</Flag4><SubSysChannel> </SubSysChannel><SupervisorId>0000000</SupervisorId><OldAcctFlag>0</OldAcctFlag><UUID>143100000173 </UUID></BHead><comm><OutputCode>RF</OutputCode><OutFlag>>R</OutFlag><ErrorCode>0000</ErrorCode><AccountsNo>01</AccountsNo><BankCode>125</BankCode><Account>00100002500025714</Account><DepositsLoan>D</DepositsLoan><RfDate>20230325</RfDate><RfTime>07332872</RfTime><CustNo>00000006072009196</CustNo><Signatories>00</Signatories><TaxCurrent> </TaxCurrent></comm></root>]]></BusiText></MsgText>";
// 调用格式化函数
const formattedXML = formateXml(unformattedXML);
// 输出格式化后的 XML
console.log(formattedXML);
在线演示:
Javascript在线运行代码,代码编辑器 - 图灵工具 在线工具系统
代码分析:
1. 处理标签属性间的多余空格
text = '\n' + text.replace(/(<\w+)(\s.*?>)/g, function ($0, name, props) { return name + ' ' + props.replace(/\s+(\w+=)/g, " $1"); }).replace(/></g, ">\n<");
正则解析:
- (<\w+):匹配 XML 开始标签的名称(如
- (\s.*?>):匹配该标签内的所有属性(包括 >),如 attr="value">。
- props.replace(/\s+(\w+=)/g, " $1"):
- 作用:去除属性前多余的空格。
- \s+(\w+=):匹配 attr= 之前的多余空格(如 attr = ),替换成 attr=
📌
最终效果
- <tag attr = "value"> 变成 <tag attr="value">
- /></g, ">\n<" 作用是让相邻的标签换行,使 XML 结构清晰。
2. 处理 XML 注释
text = text.replace(/\n/g, '\r').replace(/<!--(.+?)-->/g, function ($0, text) { var ret = '<!--' + escape(text) + '-->'; return ret; }).replace(/\r/g, '\n');
正则解析:
- <!--(.+?)-->
- <!--开头, -->结尾,(.+?) 表示中间的注释内容。
- .+? 是非贪婪匹配,确保匹配到 --> 之前的内容,而不会贪婪匹配到后面的注释。
📌
处理逻辑
- escape(text):对注释内容进行编码,避免后续处理影响注释的原始内容。
- 先将 \n 替换为 \r,处理完后再恢复。
3. 递归调整 XML 层级缩进
var rgx = /\n(<(([^\?]).+?)(?:\s|\s*?>|\s*?(\/)>)(?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?)/mg;
正则解析
- (<(([^\?]).+?):
- (<([^\?]).+?):匹配 XML 标签,确保不匹配 这种声明。
- (?:\s|\s*?>|\s*?(\/)>)
- 处理单标签<tag/> 和普通标签 <tag>。
- (?:.*?(?:(?:(\/)>)|(?:<(\/)\2>)))?
- 识别<tag></tag> 或者<tag/> 的闭合方式。
📌
作用
- 通过 nodeStack 栈结构来追踪 XML 的嵌套层级,并调整缩进。
4. 处理空数据的换行
// outputText = outputText.replace(/<([^>]+)>\s*<\/(\1)>/g, '<$1> </$1>');
正则解析
- <([^>]+)>\s*<\/(\1)>
- ([^>]+):匹配标签名称,如 CostCurr3。
- \s*:匹配标签内的空格或换行,如 <CostCurr3>\n </CostCurr3>。
- <\/(\1)>:匹配相同的闭合标签。
📌
作用
- 把 <CostCurr3>\n </CostCurr3> 变为<CostCurr3> </CostCurr3> ,避免无意义的换行。
- 根据自己需求来,我这里是要保留标签内的空格,所以注释掉了
5. 还原注释
outputText = outputText.replace(/\n/g, '\r').replace(/(\s*)<!--(.+?)-->/g, function ($0, prefix, text) { if (prefix.charAt(0) == '\r') prefix = prefix.substring(1); text = unescape(text).replace(/\r/g, '\n'); var ret = '\n' + prefix + '<!--' + text.replace(/^\s*/mg, prefix) + '-->'; return ret; });
📌
作用
- 之前 escape 过的注释,这里 unescape 还原。
- 还原时保持注释前的缩进,确保格式整齐。
6. 计算缩进
function setPrefix(prefixIndex) { var result = ''; var span = ' '; // 4 个空格 var output = []; for (var i = 0; i < prefixIndex; ++i) { output.push(span); } result = output.join(''); return result; }
📌
作用
- 通过 prefixIndex 计算当前 XML 层级,并使用 4 个空格进行缩进。