最近的学习过程中需要用到旅游景点信息,于是找了个旅游网站准备爬取上面的信息。
采取的是urllib+正则表达式的方法。
遇到的问题是返回的指定项信息为空,原因出在正则表达式上面,粗暴地把整张网页的信息打印了出来,然后找到想要的信息处,直接复制下来后输入正则表达式的匹配处,成功。
python爬虫小记
最新推荐文章于 2025-01-08 09:30:28 发布
最近的学习过程中需要用到旅游景点信息,于是找了个旅游网站准备爬取上面的信息。
采取的是urllib+正则表达式的方法。
遇到的问题是返回的指定项信息为空,原因出在正则表达式上面,粗暴地把整张网页的信息打印了出来,然后找到想要的信息处,直接复制下来后输入正则表达式的匹配处,成功。