URL与XML

本文介绍了XML解析的几种方式,包括SAX、DOM和DOM4J。重点讲解了DOM4J的使用,包括通过XPath解析XML的步骤,并给出了创建和解析XML的示例代码。此外,还提到了Java中生成XML的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

​                                                                  **HTTP协议**
HyperText Transfer Protocol超文本传输协议,是TCP/IP协议集中的协议,是一个简单的请求-响应协议,指
定了客户端发送给服务器的消息以及服务器的响应。所有的www文件都必须遵守这个标准。



​                                                                          **URL**

URL概念
URL是统一资源定位符(Uniform Resource Locator)的简称,它表示Internet 上某一资源的地址。 通过URL用
户可以访问各种网络资源,比如常见的WWW以及FTP站点。浏览器可以通过解析给定的URL在网络上查找相
应的文件或其他资源。
URL的语法格式如下所示。

protocol://resourceName

协议名(protocol) 指明获取资源所使用的传输协议,如HTTP、FTP和file 等,资源名(resourceName) 则
应该是资源的完整地址,包括主机名、端口号、文件名或文件内部的一一个引用。下面是一些简单的URL示例。
          http://www.sun.com/协议名: //主机名

​          http://localhost:8080/Test/admin/login.jsp.协议名://机器名:端口号/文件名



​                                                                  **URL类**
在java.net包中包含专门用来处理URL的类URL, 可以获得URL的相关信息,例如URL的协议名和主机名
等。
常用的创建URL的方式: (使用基本地址和相对 URL构造一一个 URL对象。)

#####              URL url= new URL(“地址”);

常用的URL中方法:

#####        public String getFile() : 获取该 URL的路径+文件名;

#####        public URLConnection openConnection() : 获取通信连接对象



​                                                      **URLConnection类**



完成了URL的定义,接下来就可以获得URL的通信连接。在java.net 包中,定义了专门的URLConnection 类
来表示与URL建立的通信连接,URLConnection 类的对象使用URL类的openConnection()方法获得。
常用方法:

1. ###### public void setDolnput(boolean input)

  URL连接可用于输入和/或输出。如果打算使用URL连接进行输入,则将Dolnput标志设置
  为true; 如果不打算使用,则设置为false。 默认值为true。

2. ###### public void setDoOutput(boolean output)

  URL连接可用于输入和/或输出。如果打算使用URL连接进行输出,则将DoOutput 标志设置
  为true; 如果不打算使用,则设置为false。 默认值为false。

3. ###### setRequestProperty (String key, String value)

  设置由键值对指定的常规请求属性。如果具有密钥的属性已存在,则旧值将被新值覆盖。

4. ###### public InputStream getInputStream() throws IOException

  返回URL的输入流,用于读取资源

5. ###### public OutputStream getOutputStream() throws l0Exception

  返回URL的输出流,用于写入资源。

6. ###### int getContentLength():

   返回头部content-length 字段值 

   

   ###### 7.getResponseCode () :

   返回服务器发送的HTTP状态码。

   

​                                       **HttpURLConnection类**
如果URL中使用的网络协议为HTTP协议或HTTPS协议,就可以将 URLConnection类型强制转换为
HttpURLConnection.
常用方法:

######             setRequestMethod (String method) : 

设置URL请求的方法,它是HTTP方法GET, POST, HEAD, OPTIONS, PUT, DELETE和TRACE
之一。默认方法是GET (注意:这里方法类型必须大写)。
      **关闭连接**
要关闭连接,需要使用从连接中获取的InputStream或OutputStream对象,在这两
个对象上调用close ()方法。这样做可以释放与URLConnection实例关联的网络资源。



**小技巧**
如何获取文件名称?

###### URL url= new URL("网址");

###### String name = url.getFile();

//获取文件路径+名称,并从最后- -个/开始截取,截取到结尾

###### name = name.substring(name.lastIndexf("/")+1,name.length();



### XML 与JSON



### XML

### 简介

可扩展标记语言(extensible Markup Language) 。
特性:

1. xml具有平台无关性, 是一门独立的标记语言。

2. xml具有自我描述性

  

  ### 为什么学习XML ?

  1.网络数据传输。
  2.数据存储

  3.配置文件

  ### XML文件

  .XML文件是保存XML数据的- -种方式。XML数据也可以以其他的方式存在( 如在内存中构建XML数据)。
  不要将XML语言狭隘的理解成XML文件。



### XML语法格式

1. XML文档声明
   <?xm1 version="1.0" encoding="UTF-8"?>



2. 标记(元素/标签/节点)
   XML文档,由一个个的标记组成.
     语法:
                开始标记(开放标记): <标记名称>
               结束标记(闭合标记): </标记名称>

 标记名称:
                   自定义名称,必须遵循以下命名规则:
                  1.名称可以含字母、数字以及其他的字符
                  2.名称不能以数字或者标点符号开始
                  3.名称不能以字符“xm1" (或者XML、 xm1)开始
                  4.名称不能包含空格,不能包含冒号(:)
                  5.名称区分大小写
标记内容:
             开始标记与结束标记之间, 是标记的内容.

例如,我们通过标记,描述一个人名:
<name>李伟杰</name>

3. 一个XML文档中,必须有且且仅允许有一个根标记。
   正例:
   <names>
   <name>张三</name>
   <name>李四</ name>
   </names>
   反例:
   <name>李四</name>
   <name>麻子</name>

4. 标记可以嵌套,但是不允许交叉。
   正例:

   ```xml
   <person>
      <name>李四</ name>
      <age>18</age>
   </person>
   反例:
   <person>
     <name>李四<age></ name>
       18</age>
   </person>
  1. 标记的层级称呼(子标记,父标记,兄弟标记,后代标记,祖先标记)
    例如:
<persons>
     <person>
         <name>李四</name>
         <length> 180cm</length>
     </ person>
     <person>
        <name>李四</ name>
        <length> 200cm</length>
      </ person>
</persons>

name是person的子标记.也是person的后代标记
name是persons的后代标记.

name是length的兄弟标记.
person是name的父标记.
persons是name的祖先标记.

6.标记名称 允许重复

7.标记除了开始和结束,还有属性。
标记中的属性,在标记开始时描述,由属性名和属性值组成.
格式:
在开始标记中,描述属性。
可以包含0-n个属性,每一个属性是-一个键值对!
属性名不允许重复,键与值之间使用等号连接,多个属性之间使用空格分割.
属性值必须被引号引住.
案例:

<persons>
         <person id=" 10001" groupid="1">
              <name>李四</name>
              <age>18</age>
         </ person>
         <person id="10002" groupid="1">
              <name>李四</name>
              <age>20</ age>
         </person>
</persons>

注释不能写在文档文档声明前
注释不能嵌套注释
格式:
注释开始:

name是person的子标记.也是person的后代标记
name是persons的后代标记.

案例:
描述一组图书books,至少包含3本书
图书book包含
图书名称name
图书简介info,
以及属性id

<?xm1 version="1.0" encoding="UTF-8"?> 语法进阶CDATA (了解) CDATA CDATA是不应该由XML解析器解析的文本数据。 像"<"和"&"字符在XML元素中都是非法的。 "<"会产生错误,因为解析器会把该字符解释为新元素的开始。 "&"会产生错误,因为解析器会把该字符解释为字符实体的开始。

某些文本,比如Javascript 代码,包含大量"<“或”&“字符。为了避免错误,可以将脚本代
码定义为CDATA。
CDATA部分中的所有内容都会被解析器忽略。
CDATA部分由”<![CDATA[" 开始,由"]]>" 结束:

Java解析XML掌握
面试题*
问: Java中有几种XML解析方式?分别是什么?有什么样的优缺点?
答:四种.

  1. SAX解析
    解析方式是事件驱动机制!
    SAX解析器,逐行读取XML文件解析,每当解析到一个标签的开始/结束/内容/属性时,触
    发事件。我们可以编写程序在这些事件发生时,进行相应的处理.
    优点:
    分析能够立即开始,而不是等待所有的数据被处理
    逐行加载,节省内存.有助于解析大于系统内存的文档
    有时不必解析整个文档,它可以在某个条件得到满足时停止解析.
    缺点:

​ 1、单向解析,无法定位文档层次,无法同时访问同一文档的不同部分数据(因为逐
​ 行解析,当解析第n行是,第n-1行已经被释放了,无法在进行操作了).

​ 2、无法得知事件发生时元素的层次,只能自己维护节点的父/子关系。

​ 3、只读解析方式,无法修改XML文档的内容.

  1. DOM解析
    是用与平台和语言无关的方式表示XML文档的官方W3C标准,分析该结构通常需要加载整个
    文档和内存中建立文档树模型.程序员可以通过操作文档树,来完成数据的获取修改删除等.
    优点:
    文档在内存中加载,允许对数据和结构做出更改.
    访问是双向的,可以在任何时候在树中双向解析数据。
    缺点:
    文档全部加载在内存中,消耗资源大.

  2. JDOM解 析
    目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。由于是第一
    个Java特定模型,JDOM 一直得到大力推广和促进。
    JDOM文档声明其目的是"“使用20% (或更少)的精力解决80% (或更多) Java/XML问题"
    (根据学习曲线假定为20%)
    优点:
    使用具体类而不是接口,简化了DOM的API.
    大量使用了Java集合类,方便了Java开发人员。
    缺点:

    没有较好的灵活性。
    性能不是那么优异。

    4、DOM4J解 析
    它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath
    支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项,
    DOM4J是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一
    个开放源代码的软件。如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML。
    目前许多开源项目中大量采用DOM4J,例如:Hi bernate

    DOM4]解析XML掌握

    步骤:
    1.引入jar文件 dom4j.jar

    1. 创建一个指向XML文件的输入流
      FileInputstream fis = new FileInputstream(“xm1 文件的地址”) ;
      3.创建一个XML读取 工具对象
      SAXReader sr = new SAXReaderO;
      4.使用读取工具对象, 读取XML文档的输入流,并得到文档对象
      Document doc = sr. read(fis);
      5.通过文档对象, 获取XML文档中的根元素对象
      Element root = doc . getRootE1 ement(O);

      文档对象Document

      指的是加载到内存的整个XML文档.
      常用方法:

      1. 通过文档对象,获取XML文档中的根元素对象
        Element root = doc . getRootE1 ement() ;
      2. 添加根节点
        Element root = doc. addElement(“根节点名称”);
      元素对象Element

      指的是XML文档中的单个节点。
      常用方法:
      1.获取节点名称
      String getName();
      2.获取节点内容
      String getText();

      1. 设置节点内容
        String setText();
        4.根据子节点的名称 ,获取匹配名称的第一个子节点对象。
        Element element(String 子节点名称);
        5.获取所有的子节点对 象
        List elements() ;
        6.获取节 点的属性值
        String attri butevalue(String属性名称);
        7.获取子节点的内容
        String elementText(String 子节点名称);
        8.添加子节点
        Element addElement(string 子节点名称);
      解析本地文件案例:

      //1.
      获取文件的输入流
      FileInputstream fis = new
      FileInputstream(“C:\code\35\code1\day03_ XML\src\books . xm1”);
      //2.创建XML读取工具对象
      SAXReader sr = new SAXReader();
      //3.
      通过读取工具,读取XML文档的输入流,并得到文档对 象
      Document doc = sr . read(fis);
      //4.
      通过文档对象,获取文档的根节点对象
      Element root = doc . getRootE1 ement();
      //5.通过根节点, 获取所有子节点
      List es = root. elements();
      //6.
      循环遍历三个book
      for (Element e : es) {
      //1.
      获取id属性值
      String id = e. attributevalue(“id”);
      //2.
      获取子节点name,并获取它的内容
      String name = e. element(“name”) . getText();
      //3.
      获取子节点info,并获取它的内容
      String info = e. elementC"info"). getText();
      System. out. print1n(“id=”+id+" ,name=" +name+" , info="+info);

    解析网络文件案例:

    String phone = “18516955565”;
    //1.
    获取到XML资源的输入流
    URL ur1 = new URL(“http://apis . juhe. cn/mobile/get?
    phone=” +phone+ “&dtype=xm1&key=9f3923e8f87f1ea50ed4ec8c39cc9253”);
    URLConnection conn = ur1. openConnectionO;
    Inputstream is = conn. getInputstream() ;
    //2.创建 一个XML读取对象
    SAXReader sr = new SAXReaderO);
    //3.
    通过读取对象读取XML数据,并返回文档对象
    Document doc = sr . read(is);
    //4.
    获取根节点
    Element root = doc . getRootE1 ement();
    //5.
    解析内容
    String code = root . e1 ementText(" resultcode");
    if(“200” . equals(code)){
    Element result = root . element(“resu1t”);
    string province = result. elementText(" province");
    string city = result. elementText(“city”);
    if(province . equals(city)){
    System. out. print1n("手机号码归属地为: "+city);
    }else{
    System. out. print1n("手机号码归属地为: “+province+” "+city) ;
    }else{
    System. out. print1n(“请输入正确的手机号码”);
    }

DOM4J - XPATH解析XML

路径表达式
通过路径快速的查找一个或一组元素
路径表达式:
1./:
从根节点开始查找
2.//:
从发起查找的节点位置查找后代节点

3…:
查找当前节点
4…:
查找父节点
5.@:
选择属性,*
属性使用方式:
[@属性名=‘值’]
[@属性名>‘值’]
[@属性名<‘值’]
[@属性名!=‘值’]
books:
路径: //book [@id=‘1’]//name
books
book id=1
name
info
book id=2
name
info

使用步骤

通过Node类的两个方法,来完成查找:
(Node是Document 与Element 的父接口)
方法1.
//根据路径表达式,查找匹配的单个节点
Element e = selectsingleNode(“路 径表达式”);
方法2.
List es = selectNodes(“路径表达式”);
案例:
String phone = “18313935565”;
//1.
获取到XML资源的输入流
URL ur1 = new URL(“http://apis . juhe. cn/mobi1e/get?
phone=”+phone+"&dtype=xml&key=9f3923e8f87f1ea50ed4ec8c39cc9253") ;
URLConnection conn = ur1. openConnection(;
Inputstream is = conn. getInputstream() ;
//2.创建 一个XML读取对象
SAXReader sr = new SAXReaderO);
//3.通过读取对象 读取XML数据,并返回文档对象
Document doc = sr . read(is);
Node node = doc. selectsing1 eNode ("//company");
System. out. print1n("运营商: "+node . getText());
is.close();

Java生成XML熟悉

步骤:
1.通过 文档帮助器(DoCumentHelper) ,创建空的文档对象
Document doc = DocumentHelper . createDocument();
2.通过 文档对象,向其中添加根节点
Element root = doc . addElement(“根节点名称”);

  1. 通过根节点对象root,丰富我们的子节点
    Element e = root . addElement(“元素名称”);
    4.创建一个文件输出流,用于存储XML文件
    Fileoutputstream fos = new Fileoutputstream(" 要存储的位置");
    5.将文件输出流, 转换为XML文档输出流
    XMLWriter xw = new XMLWriter(fos);
    6.写出文档
    xw.write(doc);
    7.释 放资源
    xw.close();

案例:
//1.
通过文档帮助器,创建空的文档对象
Document doc = DocumentHelper . createDocument( ;
//2.
向文档对象中,加入根节点对象
Element books = doc . addE1 ement(“books”);
//3.向根节点中 丰富子节点
for(int i=0;i<1000;i++) {
//向根节点中加入1000个book节点。
Element book = books . addElement(“book”);
//向book节点,加入id属性
book . addAttribute(“id”, 1+"");
//向book节点中加入name和info节点
Element name = book . addEl ement(" name");
Element info = book . addElement(“info”);
name . setText(“苹果”+i);
info. setText(“哈哈哈”+i);
}
//4.创建文件的输出流
Fileoutputstream fos = new Fileoutputstream(“c:\books . xm1”) ;
//5.将文件输出流 ,转换为XML文档输出流
XMLwriter xw = new XMLWriter(fos);
//6.
写出XML文档
xw. write(doc);
//7.释 放资源
xW. closeO;
System. out. print1n(“代码执行完毕”);

XStream的使用了解

快速的将Java中的对象,转换为XML字符串.
使用步骤:
1.创建XStream 对象
xStream x = new xStream() ;
[2].修改类生成的节点名称(默认节点名称为包名.类名)
x.alias(“节点名称”,类名.class);

  1. 传入对象,生成XML字符串
    String xml字符串= x. toXML(对象);
    案例:
    Person p = new Person(1001, "张三”,“不详”);
    XStream x = new XStream() ;
    x.alias (“haha”, Person.class);
    String xml = x.toXML§;
    System. out. println(xml) ;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值