>>>import re
>>> s='<p>按样品数</p><p><span>每一样品需要金额</span>: <span>200</span></p><p>每次使用的开机费用: <span>200</span></p>免费检测'
>>> re.sub('<p>|</p>|<span>|</span>','',s) #“|”表示"或",将字符串s中的标签替换为空值,即去掉
'按样品数每一样品需要金额: 200每次使用的开机费用: 200免费检测'
本文介绍如何使用正则表达式去除字符串中的HTML标签,包括<p>、</p>、<span>和</span>等,通过Python的re模块实现,使文本更易于阅读和进一步处理。
>>>import re
>>> s='<p>按样品数</p><p><span>每一样品需要金额</span>: <span>200</span></p><p>每次使用的开机费用: <span>200</span></p>免费检测'
>>> re.sub('<p>|</p>|<span>|</span>','',s) #“|”表示"或",将字符串s中的标签替换为空值,即去掉
'按样品数每一样品需要金额: 200每次使用的开机费用: 200免费检测'
1万+
750
338

被折叠的 条评论
为什么被折叠?