BeautifulSoup提取某个外层标签内的所有文本

我在提取解析的时候直接选用这段xpath,但是结果只有“选项D错误:”

我们可以看到HTML中,剩下的两句在<strong>标签里

<div data-v-1cf6f280="" class="analysis-content">
    选项D错误:
    <strong>在衡量通货膨胀时,</strong>
    <strong>消费者物价指数使用得最多、最普遍</strong>
    。
</div>

只要提取了<div>标签里的所有文本,再拼接,就得到我需要的答案解析了

from bs4 import BeautifulSoup

html = '''
<div data-v-1cf6f280="" class="analysis-content">
    选项D错误:
    <strong>在衡量通货膨胀时,</strong>
    <strong>消费者物价指数使用得最多、最普遍</strong>
    。
</div>
'''

# 使用 BeautifulSoup 解析 HTML 内容
soup = BeautifulSoup(html, 'html.parser')

# 提取所有文本并拼接
text = soup.div.get_text(separator='', strip=True)

# 打印提取的文本
print(text)

 separator = ""用于替换所有换行符和标签之间的分隔符为引号里的内容。strip=True,删除文本两侧多余空格。

运行结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值