BeautifulSoup库的安装及基本元素

本文介绍如何安装及使用BeautifulSoup库解析HTML文档,涵盖不同解析器的使用方法,并详细解释了BeautifulSoup类的基本元素。

一、BeautifulSoup的安装

1.安装beautifu soup

以管理员权限执行cmd,然后执行pip install beautifulsoup4 命令

 

 

 

2.Beautiful Soup库的安装小测

演示HTML页面地址http://python123.io/ws/demo.html

 

3.BeautifulSoup库解析HTML库

from bs4 import BeautifulSoup

soup=BeautifulSoup(‘<p>data</p>,’html.parser’’)

二、BeautifulSoup库的基本元素

1.Beautiful Soup库的引用

Beautiful Soup库,也叫beautifulsoup4或bs4   如:from bs4 import BeautifulSoup

 

2.Beautiful Soup解析器

解析器                      使用方法                     条件

bs4的HTML解析器     BeautifulSoup(mk,’html.parser’)  安装bs4库

lxml的HTML解析器    BeautifulSoup(mk,’lxml’)         pip install lxml

lxml的XML解析器     BeautifulSoup(mk,’xml’)         pip install lxml

html5lib的解析器     BeautifulSoup(mk,’html5lib’) pip install html5lib

 

 

3.Beautiful Soup类的基本元素

基本元素                说明

Tag            标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾

Name           标签的名字,<p>...</p>的名字是’p’,格式是:<tag>.name

Attributes     签的属性,字典形式组织,格式:<tag>.attrs

NavigableString 标签内非属性字符串,<>...</>中字符串,格式:<tag>.string

Comment         标签内字符串的注释部分,一种特殊的Comment类型


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mind_programmonkey

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值