Java基础——解析XML信息

本文介绍如何使用Java读取XML文件,并通过示例代码详细解释了如何解析XML文档中的信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何用java读取XML文件信息

一、用Document类来储存XML文件的信息

        首先,我们创建一个DOM解析器的工厂。注意,DocumentBuilderFactory是抽象工厂,无法被实例化,因此我们要运用newInstance()方法。

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        接着,我们需要得到DOM解析器的对象,我们可以使用newDocumentBuilder()方法。

DocumentBuilder builder = factory.newDocumentBuilder();

         最后我们就可以利用Document类来储存XML文件信息。这里用到 DocumentBuilder类中的prase()方法。

Document document = builder.parse("src/main/java/ParseXML/收藏信息.xml");

         完整的代码内容如下:

        // 创建DOM解析器工厂的对象
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        try {
            //创建DOM解析器的对象
            DocumentBuilder builder = factory.newDocumentBuilder();
            //将解析的XML文件内容存入Document类的对象
            Document document = builder.parse("src/main/java/ParseXML/收藏信息.xml");
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        }

二、读取Doucument类的对象中存储的XML信息

       为了方便演示,这里将XML文件内的内容先贴出来

<?xml version="1.0" encoding="UTF-8"?>
<PhoneInfo>
    <Brand name="华为">
        <Type name="Mate30 Pro" price="2300"/>
        <Type name="P30 Pro" price="4500"/>
        <Type name="nova 6" price="1800"/>
    </Brand>
    <Brand name="苹果">
        <Type name="iPhone13 Pro" price="15000"/>
    </Brand>
</PhoneInfo>

        首先,我们需要获得doucment对象中根节点下面的子节点,即全部的Brand节点。

//获取对象中Brand节点
NodeList brands = document.getElementsByTagName("Brand");

        获得根节点下的所有Brand节点后,我们遍历每一个Brand节点。

        //遍历获取的Brand节点
        for (int i = 0; i < brands.getLength(); i++) {
            //获取一个节点
            Node node = brands.item(i);
            //将节点存储到Element中
            Element eleBrand = (Element) node;
            //读取Element中的name属性
            String brandName = eleBrand.getAttribute("name");
            System.out.println(brandName+":");
         }

        遍历每一个Brand节点后,我们也需要遍历Brand下的子节点,即Type节点。

            //获取Brand节点的子节点
            NodeList types = eleBrand.getChildNodes();
            //遍历子节点
            for (int j = 0; j < types.getLength(); j++) {
                //获取一个子节点
                Node typeNode = types.item(j);
                if (typeNode.getNodeType()==Node.ELEMENT_NODE){
                    //获得子节点,存入Element中
                    Element eleType = (Element) typeNode;
                    //输出 子节点中 name 属性值
                    System.out.println(eleType.getAttribute("name"));
                }
            }

        以下为获取并打印XML信息全部内容的代码

        //获取对象中Brand节点
        NodeList brands = document.getElementsByTagName("Brand");
        //遍历获取的Brand节点
        for (int i = 0; i < brands.getLength(); i++) {
            //获取一个节点
            Node node = brands.item(i);
            //将节点存储到Element中
            Element eleBrand = (Element) node;
            //读取Element中的name属性
            String brandName = eleBrand.getAttribute("name");
            System.out.println(brandName+":");
            //获取Brand节点的子节点
            NodeList types = eleBrand.getChildNodes();
            //遍历子节点
            for (int j = 0; j < types.getLength(); j++) {
                //获取一个子节点
                Node typeNode = types.item(j);
                if (typeNode.getNodeType()==Node.ELEMENT_NODE){
                    //获得子节点,存入Element中
                    Element eleType = (Element) typeNode;
                    System.out.println(eleType.getAttribute("name"));
                }
            }
        }

三、完整代码展示

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;
import java.io.IOException;

public class ParseXMLDemo {
    Document document = null;

    public void getDocument() {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        try {
            DocumentBuilder builder = factory.newDocumentBuilder();
            this.document = builder.parse("src/main/java/ParseXML/收藏信息.xml");


        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        }
    }

    public void showInfo() {
        //获取对象中Brand节点
        NodeList brands = document.getElementsByTagName("Brand");
        //遍历获取的Brand节点
        for (int i = 0; i < brands.getLength(); i++) {
            //获取一个节点
            Node node = brands.item(i);
            //将节点存储到Element中
            Element eleBrand = (Element) node;
            //读取Element中的name属性
            String brandName = eleBrand.getAttribute("name");
            System.out.println(brandName+":");
            //获取Brand节点的子节点
            NodeList types = eleBrand.getChildNodes();
            //遍历子节点
            for (int j = 0; j < types.getLength(); j++) {
                //获取一个子节点
                Node typeNode = types.item(j);
                if (typeNode.getNodeType()==Node.ELEMENT_NODE){
                    //获得子节点,存入Element中
                    Element eleType = (Element) typeNode;
                    System.out.println(eleType.getAttribute("name"));
                }
            }
        }
    }

    public static void main(String[] args) {
        ParseXMLDemo parseXMLDemo = new ParseXMLDemo();
        parseXMLDemo.getDocument();
        parseXMLDemo.showInfo();

    }
}

FastXml是一个简单、高性能、极少内存消耗的基于xml pull机制的java xml解析器。性能最好的xml解析器:性能是VTD-XMl的3倍,是XPP3/MXP1的2倍,详见性能测试数据和测试代码 几乎不消耗额外的内存:内存消耗比XPP3/MXP1还要少很多 没有jar包依赖 jar包大小为18k,非常适合在移动互联网领域使用 FastXml的API与XMLPULL类似,但是要更简单一些,易于使用 支持namespace,但不校验schema 为什么FastXml这么快尽可能少的解码字节:往往xml文档中的很多字节都是ASCII范围,它们可以直接强转成char,而不需要解码,比如:标签名、属性名,大部分时候只需要对属性值和文本块进行解码即可。 注释、文档声明、DOCTYPE、无用的换行和空白通常不是我们关注的内容,所以这些内容自动被FastXml跳过了,使用API时更人性化。 当需要把某个属性值或者文本块内容转换为int、short、long时,不需要先把byte数组转化成string,然后再转化成int、short、long。FastXml直接把byte数组转换成对应的类型。 如果xml文档中有些标签内容你并不需要时,你可以跳过这些标签,你跳过的这部分将减少了字节解码,这在一些场景下能很好的帮助你提升性能。 FastXml类似XMLPULL一样,不校验文档schema和DTD,对文档的格式也不进行非常严格的校验:通常xml文档的格式都是正确的,当我们追求xml解析的最高性能时,就不需要对格式等内容进行及其严格的校验了。FastXml并不是完全没有校验,为了追求更好的性能,FastXml只是在解析过程中,对那些必须校验的地方进行校验。通常大部分的格式错误都能被校验出来。许可证Apache Licence, Version 2.0 标签:FastXml
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值