正则表达式获取内容和图片

本文介绍如何在MVC架构下使用正则表达式从数据库中提取文本和图片资源,包括去除HTML标签及获取图片路径的具体方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

接触了MVC后,当我们想要把某个文件存放到数据库里面去的时候这时候我们想到的唯一方法就是利用正则表达式,将我们想要的文件名称和路径找出来,然后再利用正则表达式将我们想要的文件存放到数据库或者从数据库里面提取出来。
下面我就用我所知道的方法来获取数据库里面的我所存放的文字,并把标签去掉。如下是我们从数据库里面得到的数据。
在这里插入图片描述
首先我们要将P标签里面的样式都去掉和P标签自身,获取到里面的文字。
“<p(?<=<p).+?(?=>)>|

”将所有的p标签都获取到了,先用零宽后行断言的方法获取到“<p”
“.+?”表示获取到除换行符以外的任意字符且重复多次“?”表示懒惰“?=”表示零宽先行断言,“|”表示或者的意思。匹配的结果是所有的p标签以及里面的内容,再利用replace的方法将p标签给替换掉得到想要的结果:
在这里插入图片描述
再利用 “<span(?<=<span).+?(?=>)>|”的方法将 标签去掉,最后只剩下想要的内容或者图片如下图:
在这里插入图片描述
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190408090103766.pn获取到了内容和图片,接下来就是如何将img标签src属性里面的内容获取到,因为只有知道了src里面的内容才可以知道图片的路径从而将图片提取出来。
获取图片的路径使用的方法和上面差不多,先用零宽后行断言的方法再用零宽先行断言的方法这样就可以获取到src里面的内容了。
用“(?<=src=").+?(?=")”的方法得到以下内容:
在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值