DOM解析XML遇到的子节点个数问题

在解析XML文件时,发现books元素的子节点个数为3,而非预期的1个。经过测试,发现除了1个Element节点(book)外,还有2个Text节点,即使它们的内容为空。当XML中存在空白字符时,这些空白字符会被解析为Text节点,导致子节点数量增加。通过对XML进行修改并打印节点类型,验证了这一现象。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

xml文件如下:

<?xml version="1.0" encoding="UTF-8"?>

<books>

    <book>book text</book>

</books>

个人以为books的子节点只有1个。

测试如下:

       try {

           DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

           DocumentBuilder builder = factory.newDocumentBuilder();

           Document document = builder.parse(new File("test.xml"));

           Element root = document.getDocumentElement();

           //System.out.println(root.getNodeName());

           NodeList nodeList = root.getChildNodes();

           System.out.println("length =" + nodeList.getLength());

          

       } catch (Exception e) {

           // TODO: handleexception

           e.printStackTrace();

       }

结果如下:

length =3

 

百思不得其解,后来终于测试出来子节点是1Element节点和2Text节点。

修改xml文件并打印测试如下:

<?xml version="1.0" encoding="UTF-8"?>

<books>

before

    <book>book text</book>

after

</books>

 

try {

           DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

           DocumentBuilder builder = factory.newDocumentBuilder();

           Document document = builder.parse(new File("test.xml"));

           Element root = document.getDocumentElement();

           //System.out.println(root.getNodeName());

           NodeList nodeList = root.getChildNodes();

           System.out.println("length =" + nodeList.getLength());

           for(int i = 0; i <nodeList.getLength(); ++i)

           {

              Node node = nodeList.item(i);

              if(node.getNodeType() == Node.TEXT_NODE)

                  System.out.println(node.getNodeValue());

              else if(node.getNodeType() == Node.ELEMENT_NODE)

                  System.out.println(node.getNodeName());

              //System.out.println(node.getNodeType());

           }

              } catch (Exception e) {

           // TODO: handleexception

           e.printStackTrace();

       }

结果如下:

length = 3

    before

       book

    after

原来每个子节点与父节点之间都有默认的Text节点,如果没有赋值的话,节点内容为空,但仍然作为一个空节点存在着。这就是为什么子节点个数为3而不是1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值