python3 html 解析

本文介绍了如何使用Python的BeautifulSoup库解析HTML文件。首先,通过pip安装BeautifulSoup4库,然后更改工作目录并导入库。接着,创建BeautifulSoup对象处理HTML文件,注意指定解析器避免警告。通过打印head.contents可以查看文件内容,使用attrs获取特定标签的属性。例如,获取meta标签的name和content属性,以及title标签的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

来看一段来自糗百的网页文件,文件名为test.html。

<head><meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<meta content="chrome=1,IE=edge" http-equiv="X-UA-Compatible"/>
<meta content="webkit" name="renderer"/>
<meta content="pc" name="applicable-device"/>
<meta content="pmrgi33nmfuw4ir2ejyws5ltnbuweyljnnss4y3pnurcyithovuwiir2ejqwmyrtguzdgobsmezdgnbyheywcmzthbrdmmtemu4tamrqg5rtmirmej2gs3lfknqxmzjchiytkmrzgq4demjugaydcnd5" name="domain_verify"/>
<title>幽默笑话大全_爆笑笑话_笑破你的肚子的搞笑段子 - 糗事百科</title>
<meta content="幽默笑话,爆笑笑话,搞笑段子,笑话大全 爆笑" name="keywords"/>
<meta content="糗事百科官网提供幽默笑话大全,糗百网分享的各种爆笑笑话、搞笑段子,小心笑破你的肚子,精彩搞笑笑话就在糗事百科!" name="description"/>
<meta content="format=xhtml;url=//www.qiushibaike.com
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值