【叶子函数分享一】去除字符串中的html标记及标记中的内容

最新推荐文章于 2025-11-14 09:16:36 发布

原创最新推荐文章于 2025-11-14 09:16:36 发布 · 8.6k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#html #function #action #input #百度 #测试

SQL函数分享系列同时被 2 个专栏收录

58 篇文章

订阅专栏

SQL Server 自定义函数专栏

58 篇文章

订阅专栏

本文介绍了一种SQL Server自定义函数，用于清除字符串中的HTML标签及其内容，并提供了一个增强版本来处理特定字符序列。

【叶子函数分享一】去除字符串中的html标记及标记中的内容

--1、创建函数

create function [dbo].[clearhtml] (@maco varchar(8000))

returns varchar(8000) as begin

declare @i int

while 1 = 1

begin

set @i=len(@maco)

set @maco=replace(@maco, substring(@maco,charindex('<',@maco),

charindex('>',@maco)-charindex('<',@maco)+1),space(0))

if @i=len( @maco )

break

end

set @maco=replace(@maco,' ','')

set @maco=replace(@maco,' ','')

set @maco=ltrim(rtrim(@maco))

set @maco=replace(@maco,char(9),'')

set @maco=replace(@maco,char(10),'')

set @maco=replace(@maco,char(13),'')

return (@maco)

end

--2、测试示例

declare @mark varchar(8000)

set @mark='<body><div id=u><a href=http://passport.baidu.com/?login&tpl=mn>登录</a></div><center><img src=http://www.baidu.com/img/baidu_logo.gif width=270 height=129 usemap="#mp" id=lg><br><br><br><br><table cellpadding=0 cellspacing=0 id=l><tr><td><div id=m><a onclick=s(this) href=http://news.baidu.com>新 闻</a><b>网 页</b><a onclick=s(this) href=http://tieba.baidu.com>贴 吧</a><a onclick=s(this) href=http://zhidao.baidu.com>知 道</a><a onclick=s(this) href=http://mp3.baidu.com>MP3</a><a onclick=s(this) href=http://image.baidu.com>图 片</a><a onclick=s(this) href=http://video.baidu.com>视 频</a></div></td></tr></table>

</body>'

select dbo.clearhtml (@mark)

--3、运行结果

new

---------------------------------------

登录新闻网页贴吧知道MP3图片视频帮助高级

但是上面的函数还存在问题，如果内容中有“《》”或是“<<>>”这样的标记，则不能达到我们的要求。

--加强版

create function [dbo].[clearhtml_V2] (@maco varchar(8000))

returns varchar(8000)

begin

declare @randchar_one nvarchar(200)

declare @randchar_two nvarchar(200)

if(charindex('<<',@maco)>0)

begin

set @randchar_one='D4678B36-B958-4274-B81E-BBA636CFB427';

set @randchar_two='49E374CC-9E1A-4850-897C-27074DE32E7F';

set @maco=replace(@maco,'<<',@randchar_one)

set @maco=replace(@maco,'>>',@randchar_two)

end

declare @i int

while 1 = 1

begin

set @i=len(@maco)

set @maco=replace(@maco, substring(@maco,charindex('<',@maco),

charindex('>',@maco)-charindex('<',@maco)+1),space(0))

if @i=len( @maco )

break

end

set @maco=replace(@maco,' ','')

set @maco=replace(@maco,' ','')

set @maco=ltrim(rtrim(@maco))

set @maco=replace(@maco,char(9),'')

set @maco=replace(@maco,char(10),'')

set @maco=replace(@maco,char(13),'')

if(charindex(@randchar_one,@maco)>0)

begin

set @maco=replace(@maco,'D4678B36-B958-4274-B81E-BBA636CFB427','<<')

set @maco=replace(@maco,'49E374CC-9E1A-4850-897C-27074DE32E7F','>>')

end

return (@maco)

end

select dbo.clearhtml_V2('<p>aaaa</p><<本草纲目>><a href="www.baidu.com" />')

--运行结果：

aaaa<<本草纲目>>

特别说明：

如果数据量比较大，尽量避免使用自定义函数，以免严重影响性能。

7 条评论

TiffanyBj 2012.07.25
[quote=can_88]内容的字符长度大于8000怎么班啊[/quote] nvarchar(max) 也会报错啊：消息 536，级别 16，状态 5，第 1 行传递到 SUBSTRING 函数的长度参数无效。语句已终止。
- 叶子回复TiffanyBj 2012.08.29
  [reply]zhxuefang[/reply] 把里面所有varchar/nvarchar类型的都改成varchar(max)/nvarchar(max). DECLARE @t VARCHAR(max) SET @t='A' SET @t=REPLICATE(@t,10000) SET @t='<p>'+@t+'</p>aaa<br/>' select dbo.clearhtml_V2(@t) --没有错误

omaga 2012.05.21
a>b<br>e 这样子就通不过了

can_88 2012.02.29
内容的字符长度大于8000怎么班啊
- 叶子回复can_88 2012.02.29
  [reply]can_88[/reply] SQL SERVER 2005/2008 可以用varchar(max)

DragonDreammer 2011.12.05
如果有大于号或者小于号还能截出来吗？
- pk_110回复叶子 2019.05.10
  [reply]maco_wang[/reply] 第二个是不可以的
- 叶子回复DragonDreammer 2011.12.05
  [reply]DragonDreammer[/reply] 可以的，用第二个实例就可以了。