
beautifulsoup
文章平均质量分 68
、Lu
这个作者很懒,什么都没留下…
展开
-
利用requests库、beautifulsoup、pyecharts爬取中国天气网并且进行可视化
1.安装环境(1) requests库(负责数据爬取):pip install requests(2) beautifulsoup(负责数据解析):pip install bs4(3) pyecharts(负责数据可视化): pip install pyecharts【补充】pyecharts在github上的仓库地址为:https://github.com/pyecharts/pyecharts ,需要的可以自行去学习,很容易上手。以安装以上环境的可忽略2.爬虫代码# .原创 2020-07-01 18:09:48 · 8636 阅读 · 1 评论 -
BeautifulSoup的几种遍历方式
1.下行遍历(1).contents :子节点的列表,将所有儿子节点存入列表(2).children :子节点的迭代类型,与.contents类似,用于循环遍历儿子节点(3).descendants :子孙节点的迭代类型,包含所有子孙节点,用于循环遍历for child in soup.body.children: print(child) # 遍历儿子节点 for child in soup.body.descendants: print(child) # 遍历子孙节点2.上行遍历原创 2020-06-29 16:53:38 · 13102 阅读 · 0 评论 -
BeautifulSoup中contents、children以及descendants的区别
.contents 返回的是一个 (子节点)的列表,将<tag>所有儿子节点存入列表 。.children返回的是一个 遍历 (子节点)的迭代器,与.contents类似,用于循环遍历儿子节点。.descendants 返回的是一个 (子孙节点)的迭代器,包含所有子孙节点,用于循环遍历。...原创 2020-06-29 16:43:45 · 10501 阅读 · 1 评论 -
BeautifulSoup搜索节点的几种方法
1. find和find_all方法:搜索文档树,一般用得比较多的就是两个方法,一个是find,一个是find_all。find方法是找到第一个满足条件的标签后就立即返回,只返回一个元素。find_all方法是把所有满足条件的标签都选到,然后返回回去。使用这两个方法,最常用的用法是出入name以及attr参数找出符合要求的标签。soup.find_all("a",attrs={"id":"link2"})或者是直接传入属性的的名字作为关键字参数:soup.find_all("a",id原创 2020-06-29 15:45:56 · 17431 阅读 · 0 评论 -
BeautifulSoup如何解析获取标签内的文本信息
BeautifulSoup获取标签内的文本信息通常有以下几种方式:1. string:获取某个标签下的非标签字符串,返回的是一个字符串。2. strings:获取某个标签下的子孙非标签字符串,返回的是一个生成器。3. stripped_strings:获取某个标签下的子孙非标签字符串,会去掉空白字符,返回的是一个生成器。4. get_text:获取某个标签下的子孙非标签字符串,返回的是普通字符串。...原创 2020-06-28 21:31:26 · 22124 阅读 · 0 评论