HTML中转义字符如何处理,常见的转义字符有哪些?

本文介绍了HTML页面中转义字符的处理方法,并提供了一个实用工具类实现从HTML到Java规范字符的转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HTML页面中,转义字符的处理问题。

首先说明一下转义字符,通常是这样来定义的:

所有的ASCII码都可以用“\”加数字(一般是8进制数字)来表示。而C中定义了一些字母前加"\"来表示常见的那些不能显示的ASCII字符,如\0,\t,\n等,就称为转义字符,因为后面的字符,都不是它

本来的ASCII字符意思了。

首先来看一下,下面这一行HTML源代码:


<span class="sourceLineNo">033</span> * <p><a name="line.33"></a>

&lt;是转义字符,这个在写入最终的java文件时,如果我们不处理,最后会显示成这样:

* &lt;p&gt;


再看下面的HTML源代码:

<span class="sourceLineNo">084</span>    private boolean hasChar() {<a name="line.84"></a>
<span class="sourceLineNo">085</span>        return this.pos < this.len;<a name="line.85"></a>
<span class="sourceLineNo">086</span>    }<a name="line.86"></a>


如果不对转义字符进行处理,得到的是下面的内容:

    private boolean hasChar() {
        return this.pos &lt; this.len;
    }


而我们需要的是这样的内容:


    private boolean hasChar() {
        return this.pos < this.len;
    }


这显然不是我们想要的结果,所以这些转义字符,必须要转化成符合java规范的字符


我们使用下面这个工具类,来完成转义字符的翻译:    

	/*
	 * HTML转义字符处理方法private String escapeCharacterUtil(String parseredLine)
	 * 
	 * HTML中的转义字符:
	 * 1,<   表示java中的小于号 < 
	 * 2,>   表示java中的大于号 >
	 * 3,&  表示java中的逻辑与 &
	 * 4," 表示java中的双引号 "
	 * 5,&copy; 表示java中的版权符号 ©
	 */
	private String escapeCharacterUtil(String parseredLine){
		
		//转义处理
		final_line = parseredLine.replaceAll("<", "<").replace(">", ">").replace("&", "&").replace(""", "\"");
		
		return final_line;
	}


上面列举的几个是HTML中常见的转义字符。还有常见的转义字符,后续还有研究


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值