去掉字符串不需要的HTML标记（正则表达式）

最新推荐文章于 2020-12-04 01:31:50 发布

转载最新推荐文章于 2020-12-04 01:31:50 发布 · 172 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/BeyondWJsel/archive/2012/08/22/2650500.html

本文介绍了一种使用C#编程语言去除HTML标签的方法，通过正则表达式精确匹配并保留特定HTML标签，如strong、em等，同时移除其他非保留标签，确保文本内容的准确呈现。

具体实现如下：

//除掉HTML保留格式外的其他格式
 string[] HoldTags = { "strong", "em", "u", "strike", "sub", "sup", "img", "b", "i", "div", "p", "center" };//保留的关键字
 string RegStr = string.Format(@"<(?!((/?\s?{0})))[^>]+>", string.Join(@"\b)|(/?\s?", HoldTags));
 System.Text.RegularExpressions.Regex Reg = new System.Text.RegularExpressions.Regex(RegStr, System.Text.RegularExpressions.RegexOptions.Compiled | System.Text.RegularExpressions.RegexOptions.Multiline | System.Text.RegularExpressions.RegexOptions.IgnoreCase);
 string QuestionAllContent="中国真的好强大<tes>!</tes>";//要进行去掉的字符串

QuestionAllContent = Reg.Replace(QuestionAllContent, "");

最后QuestionAllContent的内容为：“="中国真的好强大！”

转载于:https://www.cnblogs.com/BeyondWJsel/archive/2012/08/22/2650500.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dingba0214

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

不要用html语言标记,不要使用的HTML标签(WEB标准网页布局)

weixin_31482387的博客

05-30

270

WEB标准化CSS+DIV代码CSS+DIV是网站标准(或称“WEB标准”)中常用的术语之一，通常为了说明与HTML(标准通用标记语言的一个应用)网页设计语言中的表格(table)定位方式的区别，因为XHTML网站设计标准中，不再使用表格定位技术。html网页的标准文档流默认布局是块元素(block element)◎ address - 地址 ◎ blockquote - 块引用 ◎ div -...

网页忽视HTML标签标记

youyile的博客

06-22

240

网页的忽视HTML标签标记 <xmp>在HTML语言中加入<xmp>标签，可以令该标签后的HTML 标签失去其标示作用，而直接显示在网页页面中。如：宥亿<xmp>宥亿宥亿&am

参与评论您还未登录，请先登录后发表或查看评论

js中去除字符串中所有的html标签代码实例

10-16

主要介绍了js中去除字符串中所有的html标签代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

JavaScript正则表达式大全（过滤Emoji的最佳实践）

sunqian_happy的博客

05-28

1万+

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^\d{n}$ 3 至少n位的数字：^\d{n,}$ 4 m-n位的数字：^\d{m,n}$ 5 零和非零开头的数字：^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数：^(\-)?\d+(\

PHP 处理字符串 空格

大洋

08-02

2945

1、去除两边的空格　　trim($arr) 2、正则匹配去除所有的空格　　preg_replace('/ /','',$goodid) strip_tags 函数可以方便地去除 HTML 标签。

python3正则表达式匹配但不包括最后一个字符_正则表达式：后面不要包含指定的字符串内容...

weixin_39649611的博客

12-04

1360

以前只会//.exec("\n")，匹配到，这种简单的固定写法，但实际使用次数几乎趋近于0。很多场景不能写死abc，顺理成章的就写成了//.exec("\n")，咦？咋把前面的匹配到了！从入门到放弃。昨天(2019-04-07)随手写了一下//.exec("\n")，原来是对.+(?!排除的字符串)这个结构能起到的作用理解错了，怪不得达不到预期，(.(?!排除的字符串))+才是正解。留下一个未解的...

HTML语言标记详解

热门推荐

青梅煮酒

10-20

1万+

开发过Android的同学都知道，Android应用程序中的界面是由一个个控件组合而成的，比如说按钮控件，图片控件，文本输入框控件等。HTML语言的标记就可以理解成控件的标记，一个标记指定了一个控件，但是标记并不是控件本身，仅仅是那个控件的标记。HTML文件中的标记由浏览器来解析，产生相应的界面元素（控件），最终生成网页上可见的那些内容。标记可以有自己的属性和内容。标记的属性指...

正则表达式，js去掉html标记，去掉字符，截取字符

long5534的博客

11-06

260

1，得到网页上的链接地址： string matchString = @"]+href=\s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^>\s]+))\s*[^>]*>"; 2，得到网页的标题： string matchString = @"(?.*)"; 3，去掉网页中的所有的html标记：

（86页PPT）模特大赛某著名企业vipmodel公关传播方案.pptx

12-21

（86页PPT）模特大赛某著名企业vipmodel公关传播方案.pptx

STM32F103 HAL库标准模板与嵌入式物联网项目实战代码

12-21

本课程聚焦于嵌入式物联网单片机项目的实践开发环节，所提供示例程序均经过系统化设计与调试，具备良好的可读性与实用性。示例代码基于KEIL开发环境并采用HAL库架构实现，当前主要适配STM32F103系列芯片。若需应用于同系列其他型号芯片，仅需在KEIL环境中调整对应芯片型号及FLASH容量配置即可完成迁移。在程序下载阶段，请根据实际使用的调试工具（如J-Link或ST-Link）正确配置KEIL中的连接选项。如需扩展外部传感器，可参考本课程配套的其他技术文档。硬件连接方面，各模块与单片机的引脚对应关系已在代码中通过宏定义明确标注，使用时请逐一核对。请注意，示例程序基于标准硬件环境开发，若实际硬件存在差异，可能需要根据具体电路对代码进行相应调整。所有代码均附有详细注释，建议结合注释内容进行系统性分析与理解。资源来源于网络分享，仅用于学习交流使用，请勿用于商业，如有侵权请联系我删除！

学生考勤打卡的设计与实现--开题任务书.doc

最新发布

12-21

学生考勤打卡的设计与实现--开题任务书

该文章主要介绍使用贪心算法解决洛谷平台上的一个经典背包问题-在限定容量下选择物品以最大化总价值提供了一段C++代码实现，核心思想是按物品的单位重量价值（价值/重量）进行排序，并优先选取单位价值最高

12-21

内容概要：本文通过一段C++代码实现了一个贪心算法的经典问题——“装最大价值的宝藏”，即在给定容量的背包中尽可能装载单位价值最高的物品，以获得最大总价值。文章展示了如何利用goto语句和数组存储物品重量与价值，并通过计算单位价值（价值/重量）进行优先选择，逐步填充背包直至容量耗尽。代码逻辑清晰地体现了贪心策略的核心思想：每一步都选取当前最优解。同时，该示例也反映了在特定编程环境下对控制流的底层操控方式。; 适合人群：具备基本C++编程能力、正在学习算法设计与贪心策略的初学者或编程爱好者；适合有一定编程经验但希望理解经典算法实际代码实现的研发人员。; 使用场景及目标：①学习贪心算法的基本思路及其在背包问题中的应用；②理解单位价值排序与局部最优选择的实现方法；③掌握用基础语法结构（如goto、数组、条件判断）构建算法逻辑的能力；阅读建议：此资源以简洁代码呈现算法本质，建议读者结合输入样例手动模拟执行流程，深入理解变量变化与算法跳转逻辑，并尝试将其重构为现代结构化编程风格（如for循环、函数封装），以提升代码可读性与工程实践能力。

高校教学【蓝桥杯教学】BASIC-14时间转换.docx

12-21

内容概要：本文档是一道编程练习题，题目为“时间转换”，要求将给定的以秒为单位的时间t转换为“<H>:<M>:<S>”的格式输出，其中H表示小时，M表示分钟，S表示秒，均为整数且无前导零。题目给出了具体的输入输出格式，并提供了三个编程语言（C++、C、Java）的参考代码实现，展示了如何通过整除和取余运算分解总秒数为时、分、秒三个部分。; 适合人群：具备基本编程能力、正在学习算法或准备程序设计竞赛的初学者，尤其是对时间单位换算和基础输入输出操作感兴趣的开发者。; 使用场景及目标：①用于练习基础的数学运算与时间格式化输出；②帮助理解整除与取模在实际问题中的应用；③适用于编程入门者巩固语法基础并提升简单逻辑实现能力。; 阅读建议：建议读者先独立尝试解题后再对照提供的参考代码进行比对，注意不同语言在输入处理和类型转换上的差异，同时可通过修改输入边界值测试程序鲁棒性。