Python爬虫教程-20-xml简介

本文简要介绍了XML在Python爬虫领域的使用方法,解释了XML的基本概念,如结点、元素和属性,并通过一个具体的XML文件示例,展示了如何理解和解析XML数据。此外,还提供了XML文档节点操作的链接资源,包括获取、改变、删除、替换、创建和添加节点值的方法。
                       

本篇简单介绍 xml 在python爬虫方面的使用,想要具体学习 xml 可以到 w3school 查看 xml 文档
xml 文档链接:http://www.w3school.com.cn/xmldom/xmldom_reference.asp

Python爬虫教程-20-xml简介

  • XML(Extensible Markup Language) 可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
  • 用途:它被设计用来 传输存储 数据
简单的概念:
结点
  • 结点:XML 文档中的每个成分都是一个节点
    • 整个文档是一个文档节点
    • 每个 XML 标签是一个元素节点
    • 包含在 XML 元素中的文本是文本节点
    • 每一个 XML 属性是一个属性节点
    • 注释属于注释节点
  • xml案例py28.xml文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py28.xml
<?xml version="1.0" encoding="UTF-8" ?><booksore>    <book category="cooking">        <title lang="en">Everyday Italian</title>        <auther>Gidada De</auther>        <year>2018</year>        <price>23</price>    </book>    <book category="education">        <title lang="en">Python is Python</title>        <auther>Food War</auther>        <year>2008</year>        <price>83</price>    </book>    <book category="sport">        <title lang="en">Running</title>        <auther>Klaus Kuka</auther>        <year>2010</year>        <price>43</price>    </book></booksore>
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 在上面的 XML 中,根节点是 。文档中的所有其他节点都被包含在  中
  • 根节点  有3个  节点:
  • 第一个  节点有4个节点:, ,  以及 ,其中每个节点都包含一个文本节点,”Everyday Italian”, “Gidada De”, “2018” 以及 “23”

其他就不介绍了,附上链接

XML文档
结点操作

自行查看文档就可以 http://www.w3school.com.cn/xmldom/dom_intro.asp

更多文章链接:Python 爬虫随笔


- 本笔记不允许任何个人和组织转载

           
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值