前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
使用XPath提取猫眼电影排行榜前100名。https://maoyan.com/board/4
XPath数据提取
XML介绍
XML称为可扩展标记语言,XML是互联网数据传输的重要工具,它可以跨越互联网任何的平台,不受编程语言和操作系统的限制,可以说它是一个拥有互联网最高级别通行证的数据携带者。非常类似HTML。
HTML 和 XML的区别在于HTML主要用来显示数据,XML是用来传输数据。
XML都是标签闭合的。例如: … 成对出现。
<?xml version="1.0" encoding="utf-8"?>
<bookstore>
<book category="奇幻">
<title lang="ch">冰与火之歌</title>
<author>乔治 马丁</author>
<year>2005</year>
<price>365.00</price>
</book>
<book category="童话">
<title lang="ch">哈利波特与死亡圣器</title>
<author>J K. 罗琳</author>
<year>2005</year>

本文介绍了如何使用Python的lxml库通过XPath从猫眼电影网站中提取排行榜前100名的数据。首先讲解了XML和XPath的基础知识,接着详细阐述了XPath的选择规则。最后,给出了使用lxml库进行数据提取的步骤和实例。
最低0.47元/天 解锁文章
999

被折叠的 条评论
为什么被折叠?



