Firebug工具的使用、正则表达式和Beautiful soup
4.1 初识Firebug
XPath和CSS查找路径表达式
4.2 正则表达式
多练习
4.3 强大的BeautifulSoup
从HTML或XML文件中提取数据的Python库
sudo apt-get install Python-bs4
BS支持Python标准库中的HTML解析器,还支持一些第三方的解析器,其中一个是lxml,效率高。
sudo apt-get install Python-lxml

本文介绍如何使用Firebug工具进行网页元素定位,并通过正则表达式和BeautifulSoup库从HTML或XML文件中高效地提取数据。此外,还介绍了安装和配置BeautifulSoup及lxml的方法。
Firebug工具的使用、正则表达式和Beautiful soup
XPath和CSS查找路径表达式
多练习
从HTML或XML文件中提取数据的Python库
sudo apt-get install Python-bs4
BS支持Python标准库中的HTML解析器,还支持一些第三方的解析器,其中一个是lxml,效率高。
sudo apt-get install Python-lxml


被折叠的 条评论
为什么被折叠?