Python 字符串过滤

最新推荐文章于 2024-08-30 21:29:22 发布

转载最新推荐文章于 2024-08-30 21:29:22 发布 · 835 阅读

文章标签：

#python

需求：

str1 = "

"""<div class="m_wrap clearfix"><ul class="clearfix"><br/><br/><
br/><br/><br/><br/><br/><br/><br/><br/><br/><br/><b
r/><br/><br/><br/><br/><br/><li class="li_1 clearfix"><spa
n class="pt_title S_txt2">公司：</span><span class="pt_detail"><a href="h
ttp://s.weibo.com/user/&work=%E6%89%AC%E5%B7%9E%E6%8A%A5%E4%B8%9A%E9%9B%86%E5%9B%A2&from=inf&wvr=5&loc=infjob" target="_blank">扬州报业集团</a><br/> 
地区：江苏 ，扬州<br/> </span></li></ul></div></div></div></div>"""

想把这段字符串的标签全部都去掉，比如去掉 </li>, </ul>, </div>.。只保留不带<>的内容，但是要保留<br/>，

有什么好的办法吗？使用正则可以实现这个工作：

# coding:utf-8
import re
newline = """<div class="m_wrap clearfix"><ul class="clearfix"><br/><br/><br/><br/><br/><br/><br/><br/><br/><br/><br/><br/><br
　　/><br/><br/><br/><br/><br/><li class="li_1 clearfix"><span class="pt_title S_txt2">公司：</span><span class="pt_detail"><a
 　　href="http://s.weibo.com/user/&work=%E6%89%AC%E5%B7%9E%E6%8A%A5%E4%B8%9A%E9%9B%86%E5%9B%A2&from=inf&wvr=5&loc=infjob" target="_blank">
　　扬州报业集团</a><br/> 地区：江苏 ，扬州<br/> </span></li></ul></div></div></div></div>"""


newline= newline.replace('<br/>','!!!###')
re_comment = re.compile('<[^>]*>')
newlines = re_comment.sub('', newline)
newlines = newlines.replace('!!!###','<br/>').replace('<br/><br/>','<br/>').replace('<br/><br/>','<br/>')
print newlines

输出结果是：

C:\Python27\python.exe F:/squid_frame/ZYXT__weibo/test.py
<br/>公司：扬州报业集团<br/> 地区：江苏 ，扬州<br/> 

Process finished with exit code 0

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33968104

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

在Python中过滤字符串列表的方法

DevWizard的博客

09-25

932

无论是使用列表推导式、filter()函数还是lambda表达式，我们都可以根据特定的条件来过滤字符串列表，并获得满足条件的子集。过滤字符串列表意味着根据特定的条件或规则，从给定的字符串列表中提取出符合条件的子集。我们可以根据特定的条件编写一个表达式，并在一个新的列表中收集满足条件的字符串。如果条件比较简单，我们可以使用lambda表达式来定义过滤条件，而不需要编写独立的函数。我们可以定义一个自定义函数，该函数接受一个字符串参数，并根据特定的条件返回。的函数，该函数检查字符串中是否包含字母’a’。

17.python字符串处理：字符串切片、过滤、判断、比较的汇总

迷逝

04-07

1万+

注意不包含中间的空格。

参与评论您还未登录，请先登录后发表或查看评论

python关于字符串_「每日一练」巧用Python对字符串进行筛选

weixin_39707851的博客

11-25

543

原标题：「每日一练」巧用Python对字符串进行筛选无论是哪一门语言，都会经常用到正则表达式，无论是网络爬虫，还是数据处理等都经常会用到数据匹配，那么你会在Python中用正则表达式对字符串进行筛选吗？往下看，就是这么简单！案例a = "not 404 found 5.6 张三 99 深圳"，每个词中间是空格，用正则过滤掉英文和数字，最终输出"张三深圳"先上代码~ 运行效果题目详述第一行：im...

Python 字符过滤

zheng_ruiguo的专栏

11-20

318

''' Python 字符过滤 by 郑瑞国 'They are students.' 删除 'aeiou'中存在的字符 ''' myString = 'They are students.' subString = 'aeiou' for w in subString: temp = myString.replace(w,'') myString = temp print(myStrin...

Python正则表达式(持续更新，各种字符串筛选，总有一款适合您当前的功能)

最新发布

qq_48368964的博客

08-30

1833

Python 访问字符串中的值Python 字符串连接Python 转义字符Python字符串运算符Python 字符串格式化Python 三引号Unicode 字符串Python 的字符串内建函数字符串是 Python 中最常用的数据类型。我们可以使用引号 ( ' 或 " ) 来创建字符串。创建字符串很简单，只要为变量分配一个值即可。

【Python】python 过滤特殊字符

浪荡子爱自由的博客

01-27

4429

Python语言剔除除中英文及数字外的其他任何字符，可以通过正则表达式模块re把非中英文及数字的所有字符串删除，参考实现程序如下： import re # 通过re过滤除中英文及数字以外的其他字符 def filter_string(des_string, re_string=''): res = re.compile("[^\\u4e00-\\u9fa5^a-z^A-Z^0-9]") return res.sub(re_string, des_string) 参考资料【1】py

python 字符串 filter,Python学习十四：filter()

weixin_39710396的博客

03-25

304

Python 中内置了filter()函数用于过滤序列。用法： filter()接收一个函数和一个序列。filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。demo： 1、在一个list中，删掉偶数，只保留奇数：#filter odd number in the listdef is_odd(n):return n % 2 == 1...

【python】过滤特殊字符(emoji)

Janlyn的学习记录

05-18

1万+

前提背景：通过接口获取到的数据，要存入数据库，由于数据库的编码问题，一些特殊字符出现错误，无法进入数据库解决办法：过滤掉这些特殊字符，包含emoji表情等各种特殊字符剔除除中英文及数字外的其他任何字符 impoer re def filter_str(desstr,restr=''): #过滤除中英文及数字以外的其他字符 res = re.compile("[^\u4e00...

Python如何从一堆字符串中筛选中某一段的字符串

SN-Grotesque

01-02

5331

起因想搞某些api的二维码登录时，需要Key，然后从服务器获取的数据特别长，180多位的字符，但是我需要的字符串在这其中的一段里面，如何通过Python来实现筛选这段字符串就成了关键问题。解法你可以把字符串作为数组读取下标型输出，具体方法为 #这是一堆字符串 变量="{{123456789012345678901234567890}}" 我只想要从第三位开始到第十六位结束的字符怎么做？ #解法变量=变量[3:16] print(变量) 这样你就获得了以下数据 2345678901234 其他筛

如何在Python中过滤字符串列表

深蓝旭的博客

06-11

4704

Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时，它将存储数据，而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。使用另一个列表过滤字符串列表本示例说明了如何在不使用.

python 筛选提取输入中的数据、检索字符串内容

weixin_47481982的博客

03-01

1193

python 筛选提取输入中的内容

(方法总结)Python 3种方法实现从一串字符串中筛选出多个字符

Nick.Peng's Blogs

11-25

8054

方法1：random 模块的 sample 取样法 str = "abcdefghijklmn" random.sample(str, 3) # 一次取3个元素，返回一个指定元素数量的列表 # 结果：每次都是3个不同元素 ['i', 'g', 'h'] # 第一次执行 ['j', 'd', 'c'] # 第二次执行 ['f', 'j', 'n'] # 第三次执行方法2：ran...

python 字符串去除中文字符

weixin_40202333的博客

07-06

407

python 查找字符串

花生日记

04-09

1653

我们可以对比一下几种方法，第一种方法是使用数组来进行查找的，首先我们先看一下数组的定义，然后我们在看一下两种方法的定义：通过对比我们可以发现，第一种方法是按照字符串进行排序的，但是第二种方法是按照数组进行排序的。上面这个例子是比较简单的，那么如果说想要找出所有符合条件的单词的话，那么需要使用更多的方法了。最后我们来总结一下今天的内容，首先我们介绍了什么是字符串，接着我们用 python实现了一个查找字符串的代码，然后我们展示了一个搜索结果，最后我们分享了一个 python查找字符串的实例。

chatgpt赋能python：如何利用Python筛选字符串中的字母

laod112的博客

06-16

670

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。

用Python从多个文件中过滤某个字段的操作

chirendan6562的博客

07-24

409

请问一下我当前目录下有很多日志，命名格式为Connect.log.2013-07-01 一直到Connect.log.2013-07-24 我想从这些日志里面去过滤一个字段 '余额不足' 应该咋弄？ [北京]python(714369688) 10:59:49 过滤？是去掉‘余额...

python字符串过滤出数字

04-13

对于一个字符串，可以使用正则表达式来过滤出其中的数字。以下是示例代码： import re str = "hello123world456" result = re.findall(r'\d+', str) print(result) 输出结果为： ['123', '456']